İLKNUR KÖKSAL 075146034 Bilgi Yönetimi Ödev Sunumu Veri Tabanı Yönetimi & Veri Madenciliği VERİTABANI NEDİR? Birbirleri ile ilişkili verilerin tutulduğu,saklandığı, depolandığı yerdir. Veritabanı tablolardan, tablolar satır ve sütunlardan oluşur. Birçok veri saklama yazılımı mevcuttur.Önemli nokta veriyi verimli ve hızlı bir şekilde yönetip değişikliğe olanak sağlamasıdır. Örneğin; Ms Access,Sql Server Oracle,Postresql,mysql,DB2 Veri Nasıl Saklanır ? Veritabanında girdiğimiz kayıtlar, disk üzerinde saklanan ve veritabanı yazılımına göre farklı formatta bulunan dosyalardır. Bu dosyalar oracle da .dbf ,sql server da .mdf , access de .mdb uzantılı olarak tutulmaktadır. En basit örneği excel dosyamız satır ve sütunlardan oluşmaktadır ve .xls uzantılıdır. Veri Güvenliği Verilere erişimdeki hız kadar güvenlikde önemlidir. Yetkisi olmayan kişilerin eline izinsiz geçen şifreler veritabanının silinmesine kadar gidebilir. İşletmelerde her departmana göre yetkilendirme yapmak, güvenlik açısından önem arzeden finans, muhasebe, arge verisini korumak veritabanı yöneticisinin görevidir. Bu sebeple veriler fiziksel olarak saklanırken mantıksal olarak da bir hiyerarşiye sahip olmalıdır. Bu yetkilendirme veritabanı yöneticileri tarafından yapılmaktadır. Veritabanı Yöneticisinin Görevleri Nelerdir ? Veritabanının kurulumundan, gerekli konfigürasyonunun yapılması, bakımı, performansı ve güvenliğinden sorumlu olan kişidir. Bir veritabanı yöneticisi hergün düzenli olarak database’ i izlemeli performans ölçümlerini almalı datanın büyüme grafiğine göre disk planını yapmalıdır. Kullanıcı hataları ve sistem hatalarına karşı geri dönüş için recovery,yedekleme için backup metodlarını hazırlamalıdır. Veritabanı Yönetim Sistemimizi Seçerken Nelere Dikkat Etmeliyiz ? Bu veritabanı ile neler yapacaksınız ? Küçük bir şirket çalışanlarının özel bilgileri mi tutulacak, yoksa büyük bir şirketin milyarlarca bilgisi mi ? Aynı anda kaç işlem yapılacak? Verilerimin güvenliği ne ölçüde olmalı ? Şu anda ne kadar verim var ? 1 yıl ,5 yıl, 10 yıl sonra ne kadar olacak ? Bütçeden bir vtys için ne kadar ayırabilirim ? Kullandığım uygulama vtys ile uyumlu mu ? Ms Access Microsoft firmasının Office paketi içinden çıkan Access, paralı veritabanları arasında ucuz olarak göze çarpar. Küçük ölçekli uygulamalardaki gereksinimlerinizi karşılayabilir. Eğer bir web sitesinde veri miktarı ve aynı anda yapılan işlem sayıları az ise, Access kullanabilirsiniz. Tek bir veri tablosunda 2 GB a kadar veri depolayabilir ve aynı anda 255 bağlantıya izin verebilirsiniz. Access, MS Windows sistemleri dışında kullanılamamakta, bu da kullanım alanını daraltmaktadır. “Transaction locking” özelliğine sahiptir, ancak “trigger” ve “stored procedure” özelliklerine sahip değildir. MySQL MySQL, Access ile karşılaştırıldığında daha güvenlidir. Windows’un yanı sıra Linux, OS/2, Solaris, AIX ve birçok işletim sistemini desteklemesi nedeniyle çok yaygındır. Ev kullanıcıları tarafından, kolay kurulumu ve gelen kurulum paketleri nedeniyle sıkça tercih edilmektedir. Tablo başına 8 TB veri depolayabilmektedir. MySQL’ in en büyük dezavantajlarından biri ücretsiz olmasından kaynaklanan destek eksikliğidir Özellikle web uygulamaları için cok hızlıdır. Transaction’ ları desteklemediği için alabildiğine yalındır ve transaction desteği olmadan gerçekleştirilebilecek web uygulamaları için çok hızlı bir alternatiftir. MS Sql Server Yine Microsoft firmasının bir ürünü olan Microsoft SQL Server (MSSQL), iyi bir performansa sahiptir. En büyük dezavantajı, sadece Windows üzerinde çalışabilmesidir. Kullanım kolaylığı, güvenilirliği ve işlem gücüyle dikkat çekmektedir. Maliyeti diğer veritabanlarına göre yüksektir. Tablo başına 4 TB veri depolayabilmektedir. “Transaction locking”, “trigger” ve “stored procedure” özelliklerine sahiptir. DB2 IBM firmasının ürünü olan DB2, Access ve MySQL e göre daha performanslı, ancak küçük işletmelere göre daha yüksek maliyete sahiptir. Windows ve *nix sistemlerinde çalışabilir. “Transaction locking”, “trigger” ve “stored procedure” özelliklerine sahiptir. PostgreSQL PostgreSQL, veritabanları için ilişkisel modeli kullanan ve SQL standart sorgu dilini destekleyen bir veritabanı yönetim sistemidir. İyi performans veren, güvenli ve geniş özellikleri olan bir DBMS’tir. Tüm UNIX ya da Unix türevi (Linux, FreeBSD gibi) işletim sistemlerinde ve NT tabanlı Windows sistemlerde çalışır. Ücretsiz ve açık kodludur. PostgreSQL diğer ticari ya da açık kodlu veritabanlarında bulabileceğiniz özellikleri kapsar. Oracle Oracle, dünyanın en güçlü ve güvenilir veritabanı olarak gösterilmektedir, ancak çok yüksek maliyeti nedeniyle sadece büyük kurumların tercih edebilecekleri bir veritabanıdır. Windows,Unix,Linux,Solaris,RedHat sistemlerde kullanılabilmektedir. 1 sn 1milyon transaction yapılabilmektedir. Oracle, sınırsız sayıda tablo ve bir tablonun 32 TB a kadar tablo büyüklüğü destekler. Neden Oracle ? Teknik Desteğinin ve know-how bilgisinin sınırsız olması Platformdan bağımsız çalışabilmesi Hızı Güvenlik (İşletim sistemindeki dosyalarınn haklarından,tablodaki tek kayıdı hashing yöntemi ile şifrelemeye kadar security kontrolleri yapılabilir.) Text ve number dışında video,audio,complex,spatial,uydu görüntüleri data ilişkilendirebilir. Enterprise Manager Console sayesinde yönetimi kolay, Sorgulama dili (sql,pl/sql),Forms ve Reports ekranları ile kullanımı kolay. Kullanım Alanları Bankacılıktan (Merkez Bankası,IMKB,Garanti Bankası,İş Bankası,Yapı Kredi, Finansbank..) Otomotiv Sanayisine (Ford, Tofaş, Chrysler,Renault, Hyundai..) Sağlık Bilgi Sistemlerinden(Acıbadem Hastaneleri) Şirket Yönetimine (ERP,SAP,CRM,EBusiness,Google-Earth) Telekomünikasyon Sistemlerinden (Turkcell,Avea,Vodafone,Telsim..) Hava Taşımacılığına(THY,Pegasus ) kadar.. Veri Madenciliği Veri Madenciliği şirketlerin çok büyük veri yığınlarından kritik bilgileri elde etmelerini sağlar. Şirketler normal şartlar altında uzun zaman süren araştırmalarla doğruluğu kesin olmayacak şekilde elde edecekleri bilgiyi Data Mining (Veri Madenciliği) sayesinde kısa sürede ve kesin olarak elde ederler. Elde ettikleri bu bilgiyi objektif değerlendirmeler yaparak ya da şirketle ilgili stratejik kararlar almada kullanırlar. Bu bilgiler kurumsal veri kaynaklarının iyi analiz edilmesine ve iş dünyasındaki yaklaşımlara ilişkin tahminlerde bulunulmasına yardımcı olur. Data Mining sayesinde şirketler stratejik adımlar atarken çok büyük veri yığınları arasından kendilerine yol gösterecek kritik verileri ayıklayarak analiz edebilirler. Veri Madenciliği Yöntemleri Bağıntı Yöntemi “Çocuk bezi alan müşterilerin %30’u bira da satın alır.” Sepet analizinde (basket analysis) müşterilerin beraber satın aldığı malların analizi yapılır. Buradaki amaç mallar arasındaki pozitif veya negatif korelâsyonları bulmaktır. Çocuk bezi alan müşterilerin mama da satın alacağını veya bira satın alanların cips de alacağını tahmin edebiliriz . Otomatik bir analiz bütün olasılıkları göz önüne alır ve kolay düşünülemeyecek, örneğin çocuk bezi ve bira arasındaki bağıntıları da bulur. Sınıflandırma Yöntemi “Genç kadınlar küçük araba satın alır, yaşlı, zengin erkekler büyük, lüks araba satın alır.” Amaç bir malın özellikleri ile müşteri özelliklerini eşlemektir. Böylece bir müşteri için ideal ürün veya bir ürün için ideal müşteri profili çıkarılabilir. Örneğin bir otomobil satıcısı şirket geçmiş müşteri hareketlerinin analizi ile yukarıdaki gibi iki kural bulursa genç kadınların okuduğu bir dergiye reklam verirken küçük modelinin reklamını verir. Regresyon Yöntemi “Ev sahibi olan, evli, aynı iş yerinde beş yıldan fazladır çalışan, geçmiş kredilerinde geç ödemesi bir ayı geçmemiş bir erkeğin kredi skoru 825’dir.” Başvuru skorlamada (application scoring) bir finans kurumuna kredi için başvuran kişi ile ilgili finansal güvenilirliğini notlayan örneğin 0 ile 1000 arasında bir skor hesaplanır. Bu skor kişinin özellikleri ve geçmiş kredi hareketlerine dayanılarak hesaplanır. Zaman İçinde Sıralı Örüntüler Yöntemi “İlk üç taksitinden iki veya daha fazlasını geç ödemiş olan müşteriler %60 olasılıkla kanuni takibe gidiyor.” Davranış skoru (behavioral score), başvuru skorundan farklı olarak kredi almış ve taksitleri ödeyen bir kişinin sonraki taksitlerini ödeme/geciktirme davranışını notlamayı amaçlar. Benzer Zaman Sıraları “X şirketinin hisse fiyatları ile Y şirketinin hisse fiyatları benzer hareket ediyor.” Amaç zaman içindeki iki hareket serisi arasında bağıntı kurmaktır. Bunlar iki malın zaman içindeki satış miktarları olabilir. Örneğin dondurma satışları ile kola satışları arasında pozitif, dondurma satışları ile salep satışları arasında negatif bir bağıntı beklenebilir. Fark Saptanması “Normalden farklı davranış gösteren müşterilerim var mı?” Amaç önceki uygulamaların aksine kural bulmak değil, kurala uymayan istisnai hareketleri bulmaktır. Olası sahtekârlıkların saptanmasını (fraud detection) sağlar. Örneğin Visa kredi kartı için yapılan CRIS sisteminde bir yapay sinir ağı kredi kartı hareketlerini takip ederek müşterinin normal davranışına uymayan hareketler için müşterinin bankası ile temasa geçerek müşteri onayı istenmesini sağlar. Döküman Madenciliği “Arşivimde (veya internet üzerinde) bu dokümana benzer hangi dokümanlar var?” Amaç dokümanlar arasında ayrıca elle bir tasnif gerekmeden benzerlik hesaplayabilmektir (text mining). Bu genelde otomatik olarak çıkarılan anahtar sözcüklerin tekrar sayısı sayesinde yapılır. Veri Madenciliğinin Faydaları-1 Bir işletme kendi müşterisi iken rakibine giden müşterilerle ilgili analizler yaparak rakiplerini tercih eden müşterilerinin özelliklerini elde edebilir. Bundan yola çıkarak gelecek dönemlerde kaybetme olasılığı olan müşterilerin kimler olabileceği yolunda tahminlerde bulunabilir. Onları kaybetmemek, kaybettiklerini geri kazanmak için strateji geliştirebilir. Veri Madenciliğinin Faydaları-2 Ürün veya hizmette hangi özelliklerin ne derecede müşteri memnuniyetini etkilediği, hangi özelliklerinden dolayı müşterini bunları tercih ettiği ortaya çıkarılabilir. Müşterilerin kredi riskleri hesaplanarak hangi müşterilerin kredi riskinin yüksek olduğu, hangi müşterilerin geri ödemesini zamanında yapamayabileceği kestirilebilir. Kredi kartı ödemelerini aksatan, gecikmeli olarak yapan veya hiç yapmayanların özelliklerinden yola çıkılarak bundan sonra aynı duruma düşebilecek muhtemel kişiler saptanabilir. Veri Madenciliğinin Faydaları-3 En karlı mevcut müşteriler saptanarak, potansiyel müşteriler arasından en karlı olabilecekler belirlenebilir. Karlı müşteriler tesbit edilerek onlara özel kampanyalar uygulanabilir. En masraflı müşteriler daha masrafsız müşteri haline dönüştürülebilir. Örneğin en çok bankacılık işlemi yapanlar ortaya çıkarılıp bunlar şube bankacılığı yerine daha masrafsız Internet bankacılığına yönlendirilebilir. Veri Madenciliğinin Faydaları-4 Bir ürün veya hizmetle ilgili bir kampanya programı oluşturmak için hedef kitlenin seçiminden başlayarak bunun hedef kitleye hangi kanallardan sunulacağı kararına kadar olan süreçte veri madenciliği kullanılabilir. Sonuç olarak saklanan verinin artması etkin veri yönetimi ihtiyacını ve veri madenciliği kavramını doğurmuştur. Etkin veri yönetimi sayesinde daha iyi hizmet verebilir iç ve dış müşterilerin memnuniyetlerini arttırabiliriz. Organizasyonun gelecek hedeflerinin tutarlı ve erişilebilir olması için geçmişini doğru bir şekilde farklı açılardan sorgulayabiliyor ve raporlayabiliyor olması gereklidir. Veri madenciliğinin geçmişe yönelik bilgilere ulaşmada etkin kullanımı şirketlerin geleceklerine yönelik karar süreçlerini kısaltarak doğru kararlar almasını sağlayacaktır. Bununda günümüz rekabet şartlarında büyük avantajlar getireceği aşikardır. Bu konuda ulu önderimizin bir söylemini çok yerinde bulduğumdan kullanmak istedim ... “Geçmişini bilmeyen geleceğine yön veremez.” Atatürk İLKNUR KÖKSAL 075146034 Bilgi Yönetimi Ödev Sunumu Veri Tabanı Yönetimi & Veri Madenciliği