İLKNUR KÖKSAL 075146034 Bilgi Yönetimi Ödev

advertisement
İLKNUR KÖKSAL
075146034
Bilgi Yönetimi Ödev Sunumu
Veri Tabanı Yönetimi
&
Veri Madenciliği
VERİTABANI NEDİR?




Birbirleri ile ilişkili verilerin tutulduğu,saklandığı,
depolandığı yerdir.
Veritabanı tablolardan, tablolar satır ve
sütunlardan oluşur.
Birçok veri saklama yazılımı mevcuttur.Önemli
nokta veriyi verimli ve hızlı bir şekilde yönetip
değişikliğe olanak sağlamasıdır.
Örneğin; Ms Access,Sql Server
Oracle,Postresql,mysql,DB2
Veri Nasıl Saklanır ?
Veritabanında girdiğimiz kayıtlar, disk
üzerinde saklanan ve veritabanı yazılımına
göre farklı formatta bulunan dosyalardır.
 Bu dosyalar oracle da .dbf ,sql server da
.mdf , access de .mdb uzantılı olarak
tutulmaktadır.
 En basit örneği excel dosyamız satır ve
sütunlardan oluşmaktadır ve .xls
uzantılıdır.

Veri Güvenliği





Verilere erişimdeki hız kadar güvenlikde önemlidir.
Yetkisi olmayan kişilerin eline izinsiz geçen şifreler
veritabanının silinmesine kadar gidebilir.
İşletmelerde her departmana göre yetkilendirme
yapmak, güvenlik açısından önem arzeden finans,
muhasebe, arge verisini korumak veritabanı
yöneticisinin görevidir.
Bu sebeple veriler fiziksel olarak saklanırken
mantıksal olarak da bir hiyerarşiye sahip olmalıdır.
Bu yetkilendirme veritabanı yöneticileri tarafından
yapılmaktadır.
Veritabanı Yöneticisinin Görevleri
Nelerdir ?



Veritabanının kurulumundan, gerekli
konfigürasyonunun yapılması, bakımı,
performansı ve güvenliğinden sorumlu olan
kişidir.
Bir veritabanı yöneticisi hergün düzenli olarak
database’ i izlemeli performans ölçümlerini
almalı datanın büyüme grafiğine göre disk
planını yapmalıdır.
Kullanıcı hataları ve sistem hatalarına karşı geri
dönüş için recovery,yedekleme için backup
metodlarını hazırlamalıdır.
Veritabanı Yönetim Sistemimizi
Seçerken Nelere Dikkat Etmeliyiz ?







Bu veritabanı ile neler yapacaksınız ?
Küçük bir şirket çalışanlarının özel
bilgileri mi tutulacak, yoksa büyük bir şirketin
milyarlarca bilgisi mi ?
Aynı anda kaç işlem yapılacak?
Verilerimin güvenliği ne ölçüde olmalı ?
Şu anda ne kadar verim var ? 1 yıl ,5 yıl, 10 yıl
sonra ne kadar olacak ?
Bütçeden bir vtys için ne kadar ayırabilirim ?
Kullandığım uygulama vtys ile uyumlu mu ?
Ms Access






Microsoft firmasının Office paketi içinden çıkan Access,
paralı veritabanları arasında ucuz olarak göze çarpar.
Küçük ölçekli uygulamalardaki gereksinimlerinizi
karşılayabilir.
Eğer bir web sitesinde veri miktarı ve aynı
anda yapılan işlem sayıları az ise, Access
kullanabilirsiniz.
Tek bir veri tablosunda 2 GB a kadar veri depolayabilir
ve aynı anda 255 bağlantıya izin verebilirsiniz.
Access, MS Windows sistemleri dışında
kullanılamamakta, bu da kullanım alanını daraltmaktadır.
“Transaction locking” özelliğine sahiptir, ancak “trigger”
ve “stored procedure” özelliklerine sahip değildir.
MySQL







MySQL, Access ile karşılaştırıldığında daha güvenlidir.
Windows’un yanı sıra Linux, OS/2, Solaris, AIX ve
birçok işletim sistemini desteklemesi nedeniyle çok
yaygındır.
Ev kullanıcıları tarafından, kolay kurulumu ve gelen
kurulum paketleri nedeniyle sıkça tercih edilmektedir.
Tablo başına 8 TB veri depolayabilmektedir.
MySQL’ in en büyük dezavantajlarından biri ücretsiz
olmasından kaynaklanan destek eksikliğidir
Özellikle web uygulamaları için cok hızlıdır.
Transaction’ ları desteklemediği için alabildiğine yalındır
ve transaction desteği olmadan gerçekleştirilebilecek
web uygulamaları için çok hızlı bir alternatiftir.
MS Sql Server






Yine Microsoft firmasının bir ürünü olan Microsoft SQL
Server (MSSQL), iyi bir performansa sahiptir.
En büyük dezavantajı, sadece Windows üzerinde
çalışabilmesidir.
Kullanım kolaylığı, güvenilirliği ve işlem gücüyle dikkat
çekmektedir.
Maliyeti diğer veritabanlarına göre yüksektir.
Tablo başına 4 TB veri depolayabilmektedir.
“Transaction locking”, “trigger” ve “stored
procedure” özelliklerine sahiptir.
DB2
IBM firmasının ürünü olan DB2, Access ve
MySQL e göre daha performanslı,
ancak küçük işletmelere göre daha yüksek
maliyete sahiptir.
 Windows ve *nix
sistemlerinde çalışabilir.
 “Transaction locking”, “trigger” ve “stored
procedure” özelliklerine sahiptir.

PostgreSQL





PostgreSQL, veritabanları için ilişkisel modeli
kullanan ve SQL standart sorgu dilini
destekleyen bir veritabanı yönetim sistemidir.
İyi performans veren, güvenli ve geniş özellikleri
olan bir DBMS’tir.
Tüm UNIX ya da Unix türevi (Linux, FreeBSD
gibi) işletim sistemlerinde ve NT tabanlı
Windows sistemlerde çalışır.
Ücretsiz ve açık kodludur.
PostgreSQL diğer ticari ya da açık kodlu
veritabanlarında bulabileceğiniz
özellikleri kapsar.
Oracle




Oracle, dünyanın en güçlü ve güvenilir
veritabanı olarak gösterilmektedir, ancak çok
yüksek maliyeti nedeniyle sadece büyük
kurumların tercih edebilecekleri bir veritabanıdır.
Windows,Unix,Linux,Solaris,RedHat sistemlerde
kullanılabilmektedir.
1 sn 1milyon transaction yapılabilmektedir.
Oracle, sınırsız sayıda tablo ve bir tablonun 32
TB a kadar tablo büyüklüğü destekler.
Neden Oracle ?






Teknik Desteğinin ve know-how bilgisinin sınırsız olması
Platformdan bağımsız çalışabilmesi
Hızı
Güvenlik (İşletim sistemindeki dosyalarınn
haklarından,tablodaki tek kayıdı hashing yöntemi ile
şifrelemeye kadar security kontrolleri yapılabilir.)
Text ve number dışında
video,audio,complex,spatial,uydu görüntüleri data
ilişkilendirebilir.
Enterprise Manager Console sayesinde yönetimi kolay,
Sorgulama dili (sql,pl/sql),Forms ve Reports ekranları ile
kullanımı kolay.
Kullanım Alanları






Bankacılıktan (Merkez Bankası,IMKB,Garanti
Bankası,İş Bankası,Yapı Kredi, Finansbank..)
Otomotiv Sanayisine (Ford, Tofaş,
Chrysler,Renault, Hyundai..)
Sağlık Bilgi Sistemlerinden(Acıbadem
Hastaneleri)
Şirket Yönetimine (ERP,SAP,CRM,EBusiness,Google-Earth)
Telekomünikasyon Sistemlerinden
(Turkcell,Avea,Vodafone,Telsim..)
Hava Taşımacılığına(THY,Pegasus ) kadar..
Veri Madenciliği





Veri Madenciliği şirketlerin çok büyük veri yığınlarından
kritik bilgileri elde etmelerini sağlar.
Şirketler normal şartlar altında uzun zaman süren
araştırmalarla doğruluğu kesin olmayacak şekilde elde
edecekleri bilgiyi Data Mining (Veri Madenciliği)
sayesinde kısa sürede ve kesin olarak elde ederler.
Elde ettikleri bu bilgiyi objektif değerlendirmeler yaparak
ya da şirketle ilgili stratejik kararlar almada kullanırlar.
Bu bilgiler kurumsal veri kaynaklarının iyi analiz
edilmesine ve iş dünyasındaki yaklaşımlara ilişkin
tahminlerde bulunulmasına yardımcı olur.
Data Mining sayesinde şirketler stratejik adımlar atarken
çok büyük veri yığınları arasından kendilerine yol
gösterecek kritik verileri ayıklayarak analiz edebilirler.
Veri Madenciliği Yöntemleri
Bağıntı Yöntemi
“Çocuk bezi alan müşterilerin %30’u bira da satın
alır.”
 Sepet analizinde (basket analysis) müşterilerin
beraber satın aldığı malların analizi yapılır.
Buradaki amaç mallar arasındaki pozitif veya
negatif korelâsyonları bulmaktır.
 Çocuk bezi alan müşterilerin mama da satın
alacağını veya bira satın alanların cips de
alacağını tahmin edebiliriz .
 Otomatik bir analiz bütün olasılıkları göz önüne
alır ve kolay düşünülemeyecek, örneğin çocuk
bezi ve bira arasındaki bağıntıları da bulur.
Sınıflandırma Yöntemi



“Genç kadınlar küçük araba satın alır, yaşlı,
zengin erkekler büyük, lüks araba satın alır.”
Amaç bir malın özellikleri ile müşteri özelliklerini
eşlemektir. Böylece bir müşteri için ideal ürün
veya bir ürün için ideal müşteri profili çıkarılabilir.
Örneğin bir otomobil satıcısı şirket geçmiş
müşteri hareketlerinin analizi ile yukarıdaki gibi
iki kural bulursa genç kadınların okuduğu bir
dergiye reklam verirken küçük modelinin
reklamını verir.
Regresyon Yöntemi


“Ev sahibi olan, evli, aynı iş yerinde beş yıldan
fazladır çalışan, geçmiş kredilerinde geç
ödemesi bir ayı geçmemiş bir erkeğin kredi
skoru 825’dir.”
Başvuru skorlamada (application scoring) bir
finans kurumuna kredi için başvuran kişi ile ilgili
finansal güvenilirliğini notlayan örneğin 0 ile
1000 arasında bir skor hesaplanır. Bu skor
kişinin özellikleri ve geçmiş kredi hareketlerine
dayanılarak hesaplanır.
Zaman İçinde Sıralı Örüntüler Yöntemi
“İlk üç taksitinden iki veya daha fazlasını
geç ödemiş olan müşteriler %60 olasılıkla
kanuni takibe gidiyor.”
 Davranış skoru (behavioral score),
başvuru skorundan farklı olarak kredi
almış ve taksitleri ödeyen bir kişinin
sonraki taksitlerini ödeme/geciktirme
davranışını notlamayı amaçlar.

Benzer Zaman Sıraları




“X şirketinin hisse fiyatları ile Y şirketinin hisse
fiyatları benzer hareket ediyor.”
Amaç zaman içindeki iki hareket serisi arasında
bağıntı kurmaktır.
Bunlar iki malın zaman içindeki satış miktarları
olabilir.
Örneğin dondurma satışları ile kola satışları
arasında pozitif, dondurma satışları ile salep
satışları arasında negatif bir bağıntı beklenebilir.
Fark Saptanması




“Normalden farklı davranış gösteren
müşterilerim var mı?”
Amaç önceki uygulamaların aksine kural
bulmak değil, kurala uymayan istisnai hareketleri
bulmaktır.
Olası sahtekârlıkların saptanmasını (fraud
detection) sağlar.
Örneğin Visa kredi kartı için yapılan CRIS
sisteminde bir yapay sinir ağı kredi kartı
hareketlerini takip ederek müşterinin normal
davranışına uymayan hareketler için müşterinin
bankası ile temasa geçerek müşteri onayı
istenmesini sağlar.
Döküman Madenciliği
“Arşivimde (veya internet üzerinde) bu
dokümana benzer hangi dokümanlar var?”
 Amaç dokümanlar arasında ayrıca elle bir
tasnif gerekmeden benzerlik
hesaplayabilmektir (text mining).
 Bu genelde otomatik olarak çıkarılan
anahtar sözcüklerin tekrar sayısı
sayesinde yapılır.

Veri Madenciliğinin Faydaları-1
Bir işletme kendi müşterisi iken rakibine
giden müşterilerle ilgili analizler yaparak
rakiplerini tercih eden müşterilerinin
özelliklerini elde edebilir.
 Bundan yola çıkarak gelecek dönemlerde
kaybetme olasılığı olan müşterilerin kimler
olabileceği yolunda tahminlerde
bulunabilir.
 Onları kaybetmemek, kaybettiklerini geri
kazanmak için strateji geliştirebilir.

Veri Madenciliğinin Faydaları-2



Ürün veya hizmette hangi özelliklerin ne
derecede müşteri memnuniyetini etkilediği,
hangi özelliklerinden dolayı müşterini bunları
tercih ettiği ortaya çıkarılabilir.
Müşterilerin kredi riskleri hesaplanarak hangi
müşterilerin kredi riskinin yüksek olduğu, hangi
müşterilerin geri ödemesini zamanında
yapamayabileceği kestirilebilir.
Kredi kartı ödemelerini aksatan, gecikmeli
olarak yapan veya hiç yapmayanların
özelliklerinden yola çıkılarak bundan sonra aynı
duruma düşebilecek muhtemel kişiler
saptanabilir.
Veri Madenciliğinin Faydaları-3




En karlı mevcut müşteriler saptanarak,
potansiyel müşteriler arasından en karlı
olabilecekler belirlenebilir.
Karlı müşteriler tesbit edilerek onlara özel
kampanyalar uygulanabilir.
En masraflı müşteriler daha masrafsız müşteri
haline dönüştürülebilir.
Örneğin en çok bankacılık işlemi yapanlar ortaya
çıkarılıp bunlar şube bankacılığı yerine daha
masrafsız Internet bankacılığına yönlendirilebilir.
Veri Madenciliğinin Faydaları-4

Bir ürün veya hizmetle ilgili bir kampanya
programı oluşturmak için hedef kitlenin
seçiminden başlayarak bunun hedef
kitleye hangi kanallardan sunulacağı
kararına kadar olan süreçte veri
madenciliği kullanılabilir.
Sonuç olarak saklanan verinin artması etkin
veri yönetimi ihtiyacını ve veri madenciliği
kavramını doğurmuştur.
Etkin veri yönetimi sayesinde daha iyi hizmet
verebilir iç ve dış müşterilerin memnuniyetlerini
arttırabiliriz.
Organizasyonun gelecek hedeflerinin tutarlı ve
erişilebilir olması için geçmişini doğru bir şekilde
farklı açılardan sorgulayabiliyor ve raporlayabiliyor
olması gereklidir.
Veri madenciliğinin geçmişe yönelik bilgilere
ulaşmada etkin kullanımı şirketlerin geleceklerine
yönelik karar süreçlerini kısaltarak doğru kararlar
almasını sağlayacaktır.
Bununda günümüz rekabet şartlarında büyük
avantajlar getireceği aşikardır.
Bu konuda ulu önderimizin bir söylemini çok
yerinde bulduğumdan kullanmak istedim ...
“Geçmişini bilmeyen geleceğine yön veremez.”
Atatürk
İLKNUR KÖKSAL
075146034
Bilgi Yönetimi Ödev Sunumu
Veri Tabanı Yönetimi &
Veri Madenciliği
Download