i BANKA YATIRIM FONU MÜġTERĠ HAREKETLERĠNĠN BELĠRLENMESĠNE YÖNELĠK BĠR VERĠ MADENCĠLĠĞĠ UYGULAMASI Fatih ÇĠL YÜKSEK LĠSANS TEZĠ ENDÜSTRĠ MÜHENDĠSLĠĞĠ GAZĠ ÜNĠVERSĠTESĠ FEN BĠLĠMLERĠ ENSTĠTÜSÜ EYLÜL 2010 ANKARA ii FATĠH ÇĠL tarafından hazırlanan “BANKA YATIRIM FONU MÜġTERĠ HAREKETLERĠNĠN BELĠRLENMESĠNE YÖNELĠK BĠR VERĠ MADENCĠLĠĞĠ UYGULAMASI” adlı bu tezin Yüksek Lisans tezi olarak uygun olduğunu onaylarım. Prof. Dr. Hadi GÖKÇEN ………………………………. Tez DanıĢmanı, Endüstri Mühendisliği Anabilim Dalı Bu çalıĢma, jürimiz tarafından oy birliği ile Endüstri Mühendisliği Anabilim Dalında Yüksek Lisans tezi olarak kabul edilmiĢtir. ………………………………. Prof. Dr. Cevriye GENCER Endüstri Mühendisliği Anabilim Dalı, G. Ü. Prof. Dr. Hadi GÖKÇEN ………………………………. Endüstri Mühendisliği Anabilim Dalı, G. Ü. Doç. Dr. M. Ali AKÇAYOL ………………………………. Bilgisayar Mühendisliği Anabilim Dalı, G. Ü. Tarih: 29 / 09 / 2010 Bu tez ile G.Ü. Fen Bilimleri Enstitüsü Yönetim Kurulu Yüksek Lisans derecesini onamıĢtır. Prof. Dr. Bilal TOKLU Fen Bilimleri Enstitüsü Müdürü ………………………………. iii TEZ BĠLDĠRĠMĠ Tez içindeki bütün bilgilerin etik davranıĢ ve akademik kurallar çerçevesinde elde edilerek sunulduğunu, ayrıca tez yazım kurallarına uygun olarak hazırlanan bu çalıĢmada bana ait olmayan her türlü ifade ve bilginin kaynağına eksiksiz atıf yapıldığını bildiririm. Fatih ÇĠL iv BANKA YATIRIM FONU MÜġTERĠ HAREKETLERĠNĠN BELĠRLENMESĠNE YÖNELĠK BĠR VERĠ MADENCĠLĠĞĠ UYGULAMASI (Yüksek Lisans Tezi) Fatih ÇĠL GAZĠ ÜNĠVERSĠTESĠ FEN BĠLĠMLERĠ ENSTĠTÜSÜ Eylül 2010 ÖZET ĠletiĢim teknolojilerindeki geliĢme ile birlikte “mevcut bilgi”ye ulaĢmanın çok kolaylaĢtığı günümüzde, “bilginin çıkarımı” kavramı giderek önem kazanmaktadır. Çok büyük miktarlardaki verinin yararlı bilgilere dönüĢtürülmesine duyulan ihtiyaç veri madenciliğinin önemini ortaya koymaktadır. Veri madenciliğinin en yaygın kullanıldığı uygulama alanlarından biri de müĢteri kaybını öngörebilmektir. Sistemden çıkan müĢterilerin iĢlem hareketlerinin tespit edilerek öğrenilmesi, öğrenilen hareketleri sergilemeye baĢlayan müĢterilerin tespit edilerek çeĢitli pazarlama ve tutundurma faaliyetleri ile sistemde tutulmasının sağlanmasıdır. Yapılan çalıĢmada, bir bankada yatırım fonu hesabını kapatarak yatırım fonu müĢterisi olmaktan çıkan müĢteri hareketlerinin öğrenilmesi, bu hareketleri sergileyen müĢterilerin sosyo-demografik karakteristiklerinin belirlenmesi amaçlanmıĢtır. ÇalıĢma veri madenciliği yazılımlarından kullanılmıĢtır. WEKA’ da yapılmıĢ, J4.8 ve Id3 algoritmaları v Bilim Kodu : 906.1.071 Anahtar Kelimeler : Veri Madenciliği, sınıflandırma, müĢteri kaybetme, yatırım fonu Sayfa Adedi : 172 Tez Yöneticisi : Prof. Dr. Hadi GÖKÇEN vi DATA MINING APPLICATION FOR IDENTIFYING BANK CUSTOMERS’ INVESMENT FUND TRANSACTION HISTORIES (M. Sc. Thesis) Fatih ÇĠL GAZĠ UNIVERSITY INSTITUTE OF SCIENCE AND TECHNOLOGY September 2010 ABSTRACT With the improvement of communication technologies, reaching to “the existing information” becomes easier, and “knowledge discovery” concept becomes more important. The need of turning huge amounts of data into useful information indicates the importance of data mining. One of the most commonly used application areas of data mining is recognizing customer churn. Data mining is used to obtain behaviors of churned customers by analyzing their transactions and also to hold other customers by recognizing the customer’s behaving in the same manner as churned customers to hold them in the system by various marketing and customer retention activities. In this paper, it is aimed to recognize the churned customers of a bank who closed their saving accounts and determine common socio-demographic characteristics of these customers. In this study, WEKA Software and J4.8, Id3 algorithms are used. vii Science Code Key Words Page Number Adviser : 906.1.071 : Data mining, classification, customer churn, investment fund : 172 : Prof. Dr. Hadi GÖKÇEN viii TEġEKKÜR Bu tezin hazırlanması aĢamasında benden yardımlarını esirgemeyen ve çalıĢmamın her aĢamasında yol gösteren Hocam Prof. Dr. Hadi GÖKÇEN‟ e ve AraĢ. Gör. Dr. Tahsin ÇETĠNYOKUġ‟ a, tez konusunun seçiminde, geliĢtirme aĢamalarında beni destekleyen ve uygulanabilirliği konusunda yüreklendiren eĢim Sultan ÇĠL‟ e, uygulama aĢamasında tecrübelerinden yararlandığım arkadaĢım Hamdi BĠLEN‟ e, aileme ve çalıĢma arkadaĢlarıma teĢekkürü bir borç biliyorum. ix ĠÇĠNDEKĠLER Sayfa ÖZET ............................................................................................................. iv ABSTRACT .................................................................................................... vi TEġEKKÜR.................................................................................................. viii ĠÇĠNDEKĠLER ................................................................................................ ix ÇĠZELGELERĠN LĠSTESĠ ............................................................................. xiii ġEKĠLLERĠN LĠSTESĠ ................................................................................... xv RESĠMLERĠN LĠSTESĠ ................................................................................. xvi SĠMGELER VE KISALTMALAR .................................................................. xvii 1. GĠRĠġ ......................................................................................................... 1 2. VERĠ MADENCĠLĠĞĠNE GENEL BAKIġ ..................................................... 3 2.1. Veri Madenciliği Süreci ...................................................................... 8 2.1.1. Problemin tanımlanması ......................................................... 8 2.1.2. Verilerin hazırlanması (Veri ön iĢleme) ................................... 8 2.1.3. Modelin kurulması ve değerlendirilmesi ................................ 10 2.1.4. Modelin kullanılması ............................................................. 11 2.1.5. Modelin izlenmesi ................................................................. 12 2.2. Veri Madenciliğinin Uygulama Alanları ............................................ 12 2.3. Veri Madenciliği Örnek Uygulamaları .............................................. 14 2.4. Veri Madenciliğinde KarĢılaĢılan Problemler ................................... 15 2.4.1. Veri tabanı boyutu...................................................................16 2.4.2. Gürültülü veri ......................................................................... 17 2.4.3 Null değerler.......................................................................... 17 x Sayfa 2.4.4. Eksik veri............................................................................... 18 2.4.5. Artık veri. ............................................................................... 19 2.4.6. Dinamik veri .......................................................................... 19 3. VERĠ MADENCĠLĠĞĠ ALGORĠTMALARI .................................................. 21 3.1. Sınıflama ve Regresyon .................................................................. 22 3.1.1. Karar ağaçları ve karar ağacı algoritmaları ........................... 22 3.1.2. Doğrusal ve çoklu regresyon................................................. 28 3.1.3. Yapay sinir ağları .................................................................. 30 3.1.4. NaiveBayes sınıflaması......................................................... 32 3.1.5. K-Nearest neighbor algoritması ............................................ 32 3.1.6. Genetik algoritmalar .............................................................. 33 3.2. Kümeleme ....................................................................................... 34 3.2.1. Bölümleme yöntemleri........................................................... 35 3.2.2. HiyerarĢik metotlar ................................................................ 37 3.2.3. Model bazlı kümeleme metotları ........................................... 38 3.3. Birliktelik Kuralları ............................................................................ 39 3.3.1. Apriori algoritması ................................................................. 41 4. VERĠ MADENCĠLĠĞĠ YAZILIMLARI ......................................................... 42 4.1. Analysis Manager ............................................................................ 42 4.2. Darwin ............................................................................................. 42 4.3. Clementine ...................................................................................... 42 4.4. DBMiner .......................................................................................... 43 4.5. Data Logic/R ................................................................................... 44 xi Sayfa 4.6. INLEN.............................................................................................. 44 4.7. KDW (Knowledge Discowery Workbench) ...................................... 45 4.8. SKICAT (Sky Image Classification & Archiving Tool) ...................... 45 4.9. R-MINI ............................................................................................. 45 4.10. TASA (Telecommunication Network Alarm Sequence Analyzer) .... 46 4.11. GCLUTO (Graphical Clustering Toolkit) .......................................... 46 4.12. Enterprise Miner .............................................................................. 46 4.13. Weka ............................................................................................... 47 5. YATIRIM FONU VE VERĠ MADENCĠLĠĞĠ UYGULAMALARI ................... 49 5.1. Yatırım Fonu Nedir? ........................................................................ 49 5.2. Yatırım Fonu Fiyatının Hesaplanması ............................................. 50 5.3. Yatırım Fonunun Sağladığı Avantajlar............................................. 50 5.4. Yatırım Fonu ve MüĢteri Kaybetme Üzerine Veri Madenciliği ÇalıĢmaları ...................................................................................... 51 6. Banka Yatırım Fonu MüĢteri Hareketlerinin Belirlenmesine Yönelik Bir Veri Madenciliği Uygulaması ........................................................................... 55 6.1. Problemin Tanımlanması ve Amacın Belirlenmesi .......................... 56 6.2. Verilerin Toplanması ve Hazırlanması............................................. 57 6.2.1. Veri temizleme ...................................................................... 57 6.2.2. Veri ön iĢleme ....................................................................... 57 6.2.3. WEKA‟ da yatırım fonu alıĢ satıĢ iĢlem talimat verilerinin analizi .................................................................................... 70 6.2.4. WEKA‟ da yatırım fonu alıĢ satıĢ iĢlem talimat verilerinin analiz sonuçlarının karĢılaĢtırılması ................................................ 75 6.2.5. WEKA‟ da müĢteri sosyo-demografik verilerinin analizi ........ 79 xii Sayfa 6.2.6. WEKA‟ da müĢteri sosyo-demografik verilerinin analiz sonuçlarının karĢılaĢtırılması ................................................ 81 6.2.7. MüĢterinin yatırım hesabını kapatma iĢlem hareketleri ile sosyo-demografik karakteristiğinin birleĢtirilmesi .................. 82 6.2.8. Sonuçların yorumlanması ................................................... 160 7. SONUÇ VE DEĞERLENDĠRME ............................................................ 164 KAYNAKLAR ............................................................................................. 166 ÖZGEÇMĠġ ................................................................................................ 172 xiii ÇĠZELGELERĠN LĠSTESĠ Çizelge Sayfa Çizelge 6.1. K-ortalama algoritması azalıĢ yüzde değerleri hata kareleri toplamı .................................................................................. 60 Çizelge 6.2. MüĢterilerin yaĢadığı iller ve verilen kategorik değerler ............ 61 Çizelge 6.3. Örnek bir müĢteri için yatırım fonu alıĢ satıĢ talimat verisi ....... 65 Çizelge 6.4. 1490 müĢteri numaralı müĢterinin yatırım fonu alıĢ satıĢ talimat verisi ....................................................................................... 66 Çizelge 6.5. K-ortalama algoritması azalıĢ yüzde değerleri hata kareleri toplamı .................................................................................. 67 Çizelge 6.6. AzalıĢ yüzdelerinin kategorik sınıflandırılması ......................... 68 Çizelge 6.7. K-ortalama algoritması azalıĢ yüzde değerleri hata kareleri toplamı .................................................................................. 68 Çizelge 6.8. ArtıĢ yüzdelerinin kategorik sınıflandırılması ............................ 69 Çizelge 6.9. 1490 müĢteri numaralı müĢterinin yatırım fonu alıĢ satıĢ talimat verisi ....................................................................................... 69 Çizelge 6.10. J4.8 algoritması sonuç özeti ................................................... 71 Çizelge 6.11. PART algoritması sonuç özeti ................................................ 72 Çizelge 6.12. JRip algoritması sonuç özeti .................................................. 73 Çizelge 6.13. Naive Bayes algoritması sonuç özeti ..................................... 74 Çizelge 6.14. OneR algoritması sonuç özeti ................................................ 75 Çizelge 6.15. Yatırım fonu alıĢ satıĢ talimat verileri sınıflandırma sonuçları karĢılaĢtırma çizelgesi .......................................................... 77 Çizelge 6.16. Id3 algoritması sonuç özeti .................................................... 79 Çizelge 6.17. J4.8 algoritması sonuç özeti ................................................... 80 Çizelge 6.18. JRip algoritması sonuç özeti .................................................. 80 xiv Çizelge Sayfa Çizelge 6.19. PART algoritması sonuç özeti ................................................ 81 Çizelge 6.20. MüĢteri sosyo-demografik verileri sınıflandırma sonuçları karĢılaĢtırma çizelgesi ........................................................ 82 xv ġEKĠLLERĠN LĠSTESĠ ġekil Sayfa ġekil 2.1. Veri Madenciliği AĢamaları ............................................................. 5 ġekil 2.2. Tipik bir veri madenciliği sisteminin mimarisi .................................. 7 ġekil 3.1. Karar ağacı örneği ........................................................................ 24 ġekil 3.2. Yapay sinir ağlarının katmanları ................................................... 31 ġekil 3.3. Veri kümeleme örneği .................................................................. 35 ġekil 3.4. Veri kümeleme örneği .................................................................. 37 ġekil 3.5. BütünleĢtirici ve bölücü hiyerarĢik kümelemenin {a,b,c,d,e} veri nesneleri üzerinde gösterimi ....................................................... 38 ġekil 6.1. K-ortalama algoritması hata kareleri toplamı değiĢim grafiği ........ 67 ġekil 6.2. Kural 1‟e uygun iĢlem yaparak yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiğinden bir kesit ...... 103 ġekil 6.3. Kural 2‟ye uygun iĢlem yaparak yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiğinden bir kesit ...... 119 ġekil 6.4. Kural 3‟e uygun iĢlem yaparak yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiğinden bir kesit ...... 129 ġekil 6.5. Kural 4‟e uygun iĢlem yaparak yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiğinden bir kesit ...... 134 ġekil 6.6. Kural 5‟e uygun iĢlem yaparak yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiğinden bir kesit ...... 139 xvi RESĠMLERĠN LĠSTESĠ Resim Sayfa Resim 4.1. WEKA grafiksel kullanıcı arayüzü .............................................. 47 xvii SĠMGELER VE KISALTMALAR Bu çalıĢmada kullanılmıĢ bazı kısaltmalar, açıklamaları ile birlikte aĢağıda sunulmuĢtur. Kısaltmalar Açıklama VM Veri Madenciliği VT Veritabanı VTBK Veri Tabanı Bilgi KeĢfi YSA Yapay Sinir Ağları 1 1. GĠRĠġ Artan veri miktarı, müĢteri ve iĢlem çeĢitliliği ile sektörlerde kızıĢan rekabet sonrası müĢteriyi, müĢterinin satın alma ve servis kullanım karakteristiğini anlama çabasının artması ile firmalar bilgi elde etmek adına eldeki verileri etkin bir Ģekilde kullanmaya çalıĢmaktadırlar. Artan rekabet koĢulları ve geliĢen bilgisayar teknolojileri neticesinde firmalar için avantaj sağlayacak bilgiler önem kazanmaktadır. Gerek veri hacmindeki artıĢ gerekse biliĢim sektöründe giderek düĢen maliyetler veri madenciliğini çok daha önemli hale getirmektedir. Veritabanı sistemlerinin artan kullanımı ve hacimlerindeki bu olağanüstü artıĢ, iĢletmeleri toplanan bu verilerden nasıl faydalanılabileceği problemi ile karĢı karĢıya bırakmıĢtır. Geleneksel sorgu veya raporlama araçlarının veri yığınları karĢısında yetersiz kalması, veri madenciliği gibi yeni arayıĢlara neden olmaktadır [1]. Bu çalıĢmada bir bankanın mevcut fonlarını alıp satan ve belli bir iĢlem geçmiĢinden sonra bankadaki hesabını kapatarak banka yatırım fonu müĢterisi olmaktan çıkmıĢ müĢterilerin, iĢlem hareket detayının öğrenilmesi, bu iĢlem hareket detaylarını sergileyerek yatırım hesabını kapatmıĢ müĢterilerin sosyo-demografik karakteristiğinin çıkartılması ve bundan sonra hesabını kapatmaya meyilli müĢterilerin tespit edilerek kaybedilmesinin önlenmesi konusuna yoğunlaĢılmıĢtır. Tez çalıĢmasının ikinci bölümünde veri madenciliğine genel bir bakıĢ sunulmuĢ, veri madenciliğinin uygulama alanları, örnek uygulamalar ve veri madenciliği sürecinde karĢılaĢılan problemlerden bahsedilmiĢ, üçüncü bölümde sık kullanılan madencilik algoritmaları anlatılmıĢ, dördüncü bölümde sık kullanılan veri madenciliği yazılımlarından bahsedilmiĢ, beĢinci bölümde yatırım fonları ve müĢteri kaybı üzerine yapılmıĢ çalıĢmalar anlatılmıĢ, altıncı 2 bölümde ise uygulamaya yer verilmiĢtir. Son bölümde ise çalıĢmanın sonuçları yer almaktadır. 3 2. VERĠ MADENCĠLĠĞĠNE GENEL BAKIġ Veri madenciliği büyük veri yığınlarında gizli olan örüntüleri ve iliĢkileri ortaya çıkarmak için istatistik ve yapay zekâ kökenli çok sayıda ileri veri çözümleme yönteminin tercihen görsel bir programlama ara yüzü üzerinden kullanıldığı bir süreçtir. Veri madenciliği algoritmaları; istatistik kökenli algoritmalar, matematiksel algoritmalar ve yapay zekâ algoritmalarını bir arada içerir [2]. Veri madenciliği keĢif odaklıdır. Veri madenciliği, istatistik, karar ağaçları, genetik algoritma, sinir ağları ve görsel teknikler gibi çeĢitli teknikleri içermektedir. Pazarlama, finans, bankacılık, imalat, sağlık, müĢteri iliĢkileri yönetimi ve organizasyon öğrenmede sıklıkla uygulanmaktadır [3]. Veri madenciliği, bilgi teknolojilerindeki geliĢme ve küresel rekabet sayesinde gün geçtikçe büyüyen ve önemi daha da artan / bilinen bir alan olmaya baĢlamıĢtır. Bilimsel çevrelerde uzun yıllardır var olan ancak sektörel ilgiyi çok daha geç bulan bu alanda yapılan çalıĢmalar giderek çeĢitlilik kazanmaktadır [4]. Son yıllarda bilgi endüstrilerinde veri madenciliğinin büyük dikkat çekmesinin en büyük sebebi çok büyük miktarlardaki verinin elde edilebilirliği ve böyle verilerin yararlı bilgilere dönüĢtürülmesine duyulan ihtiyaçtır. Elde edilen bilgi iĢletme yönetimi, üretim kontrol ve pazar analizinden, mühendislik tasarımı ve bilimsel keĢiflere kadar değiĢen uygulamalar için kullanılabilir [1]. Dünyamızda çeĢitli noktalarda yapılan iĢlemler, alınan kararlar, uygulanan uygulamalar sonucunda ortaya çıkan verinin ne kadar hacimli ve kontrol edilmesi güç olduğu açıkça ortadadır. Verilerin ne kadar hızlı toplandığını ve iĢlemesinin imkânsız bir noktaya geldiğini en belirgin bir Ģekilde NASA kurumunda görmekteyiz [5]. NASA‟nın kullandığı uyduların sadece birinden, bir günde terabayt‟larca veri gelmektedir. Bu verilerin gözle ve elle analiz 4 edilemeyeceği, otomatik olarak analiz edilmesinin gerektiği ortadadır. Veri madenciliği burada devreye girer. Veri madenciliği büyük miktarda veri içinden gelecekle ilgili tahmin yapmamızı sağlayacak bağıntı ve kuralların bilgisayar programları kullanarak aranmasıdır. Geleceğin, en azından yakın geleceğin, geçmiĢten çok fazla farklı olmayacağını varsayarsak geçmiĢ veriden çıkarılmıĢ olan kurallar gelecekte de geçerli olacak ve ilerisi için doğru tahmin yapmamızı sağlayacaktır. Büyük miktarlarda verinin veritabanlarında (VT) tutulduğu bilindiğine göre bu verilerin VM teknikleriyle iĢlenmesine de veri tabanında bilgi keĢfi (VTBK) denir. Büyük hacimli olan ve genelde veri ambarlarında tutulan verilerin iĢlenmesi yeni kuĢak araç ve tekniklerle mümkün olabilmektedir. Bundan dolayı bu konularda yapılan çalıĢmalar güncelliğini korumaktadır. Bazı kaynaklara göre; VTBK daha geniĢ bir disiplin olarak görülmektedir ve VM terimi sadece bilgi keĢfi (BK) metotlarıyla uğraĢan VTBK sürecinde yer alan bir adımdır [5]. Prof. Dr. Usama Fayyad‟a göre VTBK sürecinde yer alan adımlar Ģu Ģekilde sıralanmaktadır [5]; 1. Veri Seçimi: Bu adım veri kümelerinden sorguya uygun verilerin seçilmesidir. Elde edilen verilere örneklem kümesi denmektedir. 2. Veri Temizleme ve Ön işleme: Örneklem kümesi elde edildikten sonra, örneklem kümesinde yer alan hatalı tutanakların çıkarıldığı ve eksik nitelik değerlerinin değiĢtirildiği aĢamadır. Bu aĢama seçilen veri madenciliği sorgusunun çalıĢma zamanını iyileĢtirir. 5 3. Veri Madenciliği: Veri temizleme ve ön iĢlemden geçen örneklem kümesine VM sorgusunun uygulanmasıdır. Örnek VM sorguları: kümeleme, sınıflandırma, iliĢkilendirme, vb. sorgulardır. 4. Yorumlama: VM sorgularından ortaya çıkan sonuçların yorumlanma kesimidir. Burada geçerlilik, yenilik, yararlılık ve basitlik açılarından üretilen sonuçlar yorumlanır. Bu basamaklar ġekil 2.1‟de ifade edilmiĢtir. ġekil 2.1. Veri Madenciliği AĢamaları [1, 6] Veri madenciliği için yapılan tanımlardan bazıları ise Ģunlardır: Veri madenciliği, büyük veri kümesi içinde saklı olan genel örüntülerin bulunmasıdır [6]. Veri madenciliği ham datanın tek baĢına sunamadığı bilgiyi çıkaran veri analizi sürecidir [7]. Fayyad ve arkadaĢları (1996), veri madenciliğini geçerli, yeni, potansiyel olarak faydalı ve açıklayıcı örüntülerin veriden keĢfedildiği karıĢık olmayan bir süreç olarak tanımlamıĢtır [5]. 6 Veri madenciliği istatistik, veritabanı teknolojisi, örüntü tanıma, makine öğrenme ile etkileĢimli yeni bir disiplin ve geniĢ veritabanlarında önceden tahmin edilemeyen iliĢkilerin ikincil analizidir [8]. Veri madenciliği, büyük miktarda veri içinden gelecekle ilgili tahmin yapılmasını sağlayacak bağıntı ve kuralların bilgisayar programları kullanarak aranmasıdır [9]. Yapılan tanımlardan da anlaĢılacağı gibi veri madenciliği ile büyük veri yığını içindeki verinin anlamlı ve fayda sağlayıcı bilgiye dönüĢümü sağlanmaktadır. Bu süreçte ise görsel programlama ara yüzleri kullanılmaktadır. Waikato Üniversitesi tarafından geliĢtirilmiĢ olan Weka‟ da bu tür çalıĢmaları tek bir arayüz üzerinden yapmak mümkündür [10]. WEKA baĢta Yeni Zelanda‟da tarımsal verinin iĢlenmesi amacıyla geliĢtirilmiĢtir. Bununla birlikte sahip olduğu öğrenen makine metotları ve veri mühendisliği kabiliyeti öyle hızlı ve köklü bir Ģekilde geliĢmiĢtir ki, Ģimdi veri madenciliği uygulamalarının tüm formlarında yaygın olarak kullanılmaktadır [11] . Veri Madenciliği adımı, kullanıcı veya bilgi tabanı ile iliĢki halindedir. Ġlgi çekici modeller kullanıcıya sunulur ve yeni bir bilgi olarak bilgi tabanında depolanabilir. Burada Ģuna dikkat edilmelidir ki; veri madenciliği, gizli modelleri değerlendirmek için ortaya çıkaran zorunlu bir adım olmasına rağmen, tüm proseste sadece bir adımdır [6, 1]. Bu bakıĢ açısıyla, tipik bir veri madenciliği sisteminin mimarisi ġekil 2.2‟ deki aĢağıdaki temel bölümlere sahip olmalıdır [1]: Veritabanı, veri ambarı veya diğer bilgi kaynakları Veritabanı veya veri ambarı sunucusu Bilgi tabanı Veri madenciliği motoru Model değerlendirme modülü Grafiksel kullanıcı arayüzü 7 Grafiksel Kullanıcı Arayüzü Model Değerlendirme Veri Madenciliği Motoru Bilgi Tabanı Veri Tabanı veya Veri Ambarı Sunucusu Veri Temizleme ve Veri Entegrasyonu Veri Tabanı Filtreleme Veri Ambarı ġekil 2.2. Tipik bir veri madenciliği sisteminin mimarisi [1] Veri madenciliği, veritabanı teknolojileri, istatistik, öğrenen makineler, yüksek performanslı iĢlemcilik, model tanıma, sinir ağları, veri görselleĢtirme, bilgi çıkarımı, görüntü ve sinyal iĢleme ve uzaysal veri analizi gibi çoklu disiplinlerin tekniklerinin bütünleĢmesinden oluĢmaktadır. Veri madenciliğinin uygulanmasıyla, veritabanlarından ilgi çekici bilgiler, kurallar veya üst seviye bilgiler elde edilebilir, görüntülenebilir veya farklı açılardan göz atılabilir. KeĢfedilen bilgi karar vermede, proses kontrolünde, bilgi yönetiminde veya sorgu iĢlemede uygulanılabilir. Bu yüzden veri madenciliği, veri tabanı sistemlerinde en önemli alanlardan biri ve bilgi endüstrisinde umut verici disiplinler arası geliĢmelerden birisi olarak değerlendirilmektedir. 8 2.1. Veri Madenciliği Süreci Veri madenciliği uygulamalarını kullanmaya baĢlarken atılacak ilk adım problemi tanımlamaktır. Sonrasında verilerin hazırlanması gelir. Verileri hazırladıktan sonra ise model kurulup değerlendirilir, izlenir ve son olarak model doğrulanır [12]. BaĢarılı bir veri madenciliği projelerinde izlenmesi gereken adımlar aĢağıdaki gibidir [16,17]: 1. Problemin tanımlanması, 2. Verilerin hazırlanması (veri ön iĢleme), 3. Modelin kurulması ve değerlendirilmesi, 4. Modelin kullanılması, 5. Modelin izlenmesi. 2.1.1. Problemin tanımlanması VM çalıĢmalarında baĢarılı olmanın öncelikli Ģartı, uygulamanın amacının açık bir Ģekilde belirtilmesidir. Amaç, problemin üzerine odaklanmıĢ ve açık bir dille ifade edilmiĢ olmalı, elde edilecek sonuçların basarı düzeylerinin nasıl ölçüleceği tanımlanmalıdır. 2.1.2. Verilerin hazırlanması (Veri ön iĢleme) Örneklem kümesi elde edildikten sonra, örneklem kümesinde yer alan hatalı kayıtların çıkarıldığı ve eksik nitelik değerlerinin değiĢtirildiği aĢamadır. Bu aĢama seçilen veri madenciliği sorgusunun çalıĢma zamanını iyileĢtirir. Veri madenciliğinin en önemli aĢamalarından biri olan verinin hazırlanması aĢaması, analistin toplam zaman ve enerjisinin %50 - %85 ini harcamasına neden olmaktadır [15]. Modelin kurulması aĢamasında ortaya çıkacak 9 sorunlar, bu aĢamaya sık sık geri dönülmesine ve verilerin yeniden düzenlenmesine neden olmaktadır. Hatalı veya analizin yanlıĢ yönlenmesine neden olabilecek veriler temizlenir. Veri farklı kaynaklardan toplanmıĢsa ve aralarında farklılıklar varsa gerekli dönüĢümler yapılarak bu farklılıklar ortadan kaldırılır. Eksik verilerin bulunduğu kayıtlar proje için fazla enformasyon taĢımıyor ise silinir ya da eksik veriler çeĢitli yöntemler kullanılarak tahmin edilmeye çalıĢılır. Veri temizleme: Gerçek dünya verileri eksik, yanlıĢ ve tutarsız olma eğilimindedir. Veri temizleme rutinleri verideki eksik değerleri doldurmaya, uç değerleri belirleyerek yanlıĢ değerleri düzeltmeye ve tutarsızlıkları düzeltmeye çalıĢır. Veri bütünleştirme: Bir veri analizi görevinde, farklı kaynaklardan gelen verilerin, tek bir veri ambarında birleĢtiren veri bütünleĢtirmeyi içermesi büyük olasılıktır. Bu kaynaklar birçok veritabanı, veri küpleri veya düz dosyaları içerebilir. Bu birçok kaynaktaki verilerin dikkatli bütünleĢtirilmesi, sonuç veri setinde gereksiz ve tutarsız verilerin azaltılmasına ve hatta sakınılmasına yardım edebilecektir. Bu da sonraki madencilik sürecinin hızını ve doğruluğunun geliĢmesine yardım edebilir. Veri dönüştürme: Veri dönüĢtürmede, veriler madencilik için uygun olan formlara dönüĢtürülür veya birleĢtirilir. Veri dönüĢtürme aĢağıdakileri içerebilir: 1. Düzleştirme: Veriden hatalı uç değerlerin silinmesi (atılması) için çalıĢır. 2. Bütünleştirme: Özetleme veya bütünleĢtirme iĢlemlerinin veriye uygulanmasıdır. 3. Genelleştirme: Verilerin genelleĢtirilmesinde alt seviye veri veya ham veri, kavram hiyerarĢilerinin kullanılmasıyla daha yüksek seviyelerle değiĢtirilir. 10 4. Normalizasyon: Bir özelliğe ait veri normalizasyonla küçük tanımlanmıĢ bir aralığa düĢecek Ģekilde ölçeklenir. 5. Alan Yapılandırma: Madencilik sürecine yardım etmek için verilen alanlar setinden yeni alanlar yapılandırılır ve eklenir. Veri İndirgeme: Büyük miktardaki veri üzerindeki karmaĢık veri analizi ve madenciliği, iĢlemleri uygulanamaz veya imkânsız kılacak kadar çok uzun zaman alabilir. Veri indirgeme teknikleri, hacimce daha küçük indirgenmiĢ veri setlerini elde etmek için uygulanır. Ama orijinal verinin bütünlüğü de korunmaktadır. Yani, indirgenmiĢ veri seti üzerindeki madencilik, aynı analitik sonucu üretecek kadar etkin olmalıdır. Kesiklileştirme: KesiklileĢtirme teknikleri, sürekli bir alan için, alanın değiĢken aralığını aralıklara bölerek değerlerin sayısını düĢürmek için kullanılır. Aralık etiketleri daha sonra gerçek veri değerlerini yerleĢtirmek için kullanılır. Bir alan için değerlerin sayısının düĢürülmesi, özellikle iĢlenmiĢ veriye sınıflama madenciliğinin karar ağacı tabanlı metotları uygulandığında yararlıdır. Bu metotlar genellikle, her adımda verinin sıralanmasına yüksek miktarda zaman harcanılan yinelemeli yapıdadırlar. Bu yüzden, sıralamak için az sayıda farklı değer olması, bu metotları daha hızlı yapmaktadır. 2.1.3. Modelin kurulması ve değerlendirilmesi Tanımlanan problem için en uygun modelin bulunabilmesi, olabildiğince çok sayıda modelin kurularak denenmesi ile mümkündür. Bu nedenle veri hazırlama ve model kurma aĢamaları, en iyi olduğu düĢünülen modele varılıncaya kadar yenilenen bir süreçtir. Bir veri madenciliği problemi için birden fazla teknik kullanılabilir, problem için uygun olan teknik veya tekniklerin bulunabilmesi için birçok teknik oluĢturulup bunların içinden en uygun olanlar seçilir. Model oluĢturulduktan sonra 11 kullanılan tekniğin gereksinimlerine uygun olarak veri hazırlanması aĢamasına tekrar dönülüp gerekli değiĢiklikler yapılabilir [15,19]. Bir modelin doğruluğunun test edilmesinde kullanılan en basit yöntem basit geçerlilik (simple validation) testidir. Bu yöntemde tipik olarak verilerin %5 ile %33 arasındaki bir kısmı test verileri olarak ayrılır ve kalan kısım üzerinde modelin öğrenimi gerçekleĢtirildikten sonra, bu veriler üzerinde test iĢlemi yapılır. Bir sınıflama modelinde yanlıĢ olarak sınıflanan olay sayısının, tüm olay sayısına bölünmesi ile hata oranı, doğru olarak sınıflanan olay sayısının tüm olay sayısına bölünmesi ile ise doğruluk oranı hesaplanır [14]. Doğruluk oranı = 1 - Hata oranı Değerlendirme aĢamasında, daha önce oluĢturulmuĢ olan model, uygulamaya koyulmadan önce son kez tüm yönleriyle değerlendirilir, kalitesi ve etkinliği ölçülür. Modelin ilk aĢamada oluĢturulan proje amacına ulaĢmada etkin olup olmadığı ve problemin tüm yönleri için bir çözüm sağlayıp sağlamadığı karara bağlanır [15, 19]. 2.1.4. Modelin kullanılması Model kurulup sonuçlar elde edildikten sonra VM sorgularından ortaya çıkan sonuçların yorumlanma kesimidir. Burada geçerlilik, yenilik, yararlılık ve basitlik açılarından üretilen sonuçlar yorumlanır. Kurulan modeller risk analizi, kredi değerlendirme, dolandırıcılık tespiti gibi iĢletme uygulamalarında doğrudan kullanılabileceği gibi, promosyon planlaması simülasyonuna entegre edilebilir veya tahmini envanter düzeyleri yeniden sipariĢ noktasının altına düĢtüğünde, otomatik olarak sipariĢ verilmesini sağlayacak bir uygulamanın içine gömülebilir [16]. 12 2.1.5. Modelin izlenmesi Zaman içerisinde bütün sistemlerin özelliklerinde ve dolayısıyla ürettikleri verilerde ortaya çıkan değiĢiklikler, kurulan modellerin sürekli olarak izlenmesini ve gerekiyorsa yeniden düzenlenmesini gerektirecektir. Tahmin edilen ve gözlenen değiĢkenler arasındaki farklılığı gösteren grafikler model sonuçlarının izlenmesinde kullanılan yararlı bir yöntemdir [16]. 2.2. Veri Madenciliğinin Uygulama Alanları Veri madenciliği verinin yoğun olarak üretildiği ve bunun sonucu olarak veritabanlarının oluĢtuğu hemen her ortamda uygulama kullanım alanı bulabilir. Bazı uygulama alanları aĢağıdaki gibi özetlenebilir. Bilimsel ve mühendislik verileri: Günümüzde laboratuar veya bilgisayar ortamında sistemlerin benzetimi ve analizi sürecinde yüksek miktarda bilimsel veri üretilmektedir. Elde edilen bu verilerin anlamlandırılması için veri madenciliği çok uygun bir platform sağlar. Sağlık verileri: Veri madenciliğinin en umut verici uygulama alanlarından bir tanesi de tıp ve sağlık alanıdır. Özellikle tarama testlerinden elde edilen verileri kullanarak çeĢitli kanserlerin ön tanısı, kalp verilerini kullanarak kalp krizi riskinin tespiti, acil servislerde hasta semptomlarına göre risk ve önceliklerin tespiti gibi çok geniĢ bir uygulama sahası söz konusudur [17]. İş verileri: ĠĢ süreçleri sırasında büyük miktarda veriler üretilir. Bu verileri karar verme mekanizmalarında kullanmak mümkündür. MüĢteri veri tabanlarının analizi ile reklam ve promosyon ile ilgili pek çok faydalı bilgiye ulaĢmak mümkündür. 13 Alışveriş verileri: Bu alanda en çok baĢvurulan veri madenciliği yaklaĢımı sepet analizidir. Sepet analizinde amaç alınan ürünler arasındaki iliĢkileri bulmaktır. Bu iliĢkilerin bilinmesi iĢletmenin kârını arttırmak için kullanılabilir. Bankacılık ve finans verileri: Bankacılık sektöründe kredi ve kredi kartı sahtekârlığı tahminlerinde, risk değerlendirmede, müĢteri eğilim analizlerinde, kar analizi gibi alanlarda veri madenciliği kullanılır. Eğitim sektörü verileri: Öğrenci iĢlerinde veriler analiz edilerek öğrencilerin baĢarı ve baĢarısızlık nedenleri, baĢarının arttırılması için hangi konulara ağırlık verilmesi gerektiği, üniversite giriĢ puanları ile okul baĢarısı arasında bir iliĢkinin var olup olmadığı gibi soruların cevabı bulunarak eğitim kalitesi ve performansı arttırılabilir. Internet (Web) verileri: Internet ve web üzerindeki veriler hem hacim hem de karmaĢıklık olarak hızla artmaktadır. Web madenciliği özetle internetten faydalı bilginin keĢfi olarak tanımlanabilir [18]. Doküman verileri: Doküman veri madenciliğinde (text mining) ana amaç dokümanlar arasında ayrıca elle bir tasnif gerekmeden benzerlik hesaplayabilmektir. Bu genelde otomatik olarak çıkarılan anahtar sözcüklerin tekrar sayısı sayesinde yapılır. Polis kayıtlarında mevcut rapora benzer kaç adet ve hangi raporlar var. Ürün tasarım dokümanları ve internet dokümanları arasında mevcut tasarım için kullanılabilecek ne tür dosyalar var gibi sorulara yanıt bulunabilir. Bunların dıĢında da veri madenciliğinin faydalı olabileceği ve kullanılabileceği alanlar arasında taĢımacılık ve ulaĢım, turizm ve otelcilik, haberleĢme, belediyeler sayılabilir. 14 2.3. Veri Madenciliği Örnek Uygulamaları Veri madenciliğiyle yapılabilecek uygulamalar Ģu Ģekilde sınıflandırılmıĢtır [19]: Bağıntı: “Çocuk bezi alan müĢterilerin %30‟u bira da satın alır.” Sepet analizinde müĢterilerin beraber satın aldığı malların analizi yapılır. Buradaki amaç mallar arasındaki pozitif veya negatif korelâsyonları bulmaktır. Çocuk bezi alan müĢterilerin mama da satın alacağını veya bira satın alanların cips de alacağını tahmin edebiliriz ama ancak otomatik bir analiz bütün olasılıkları göz önüne alır ve kolay düĢünülemeyecek, örneğin çocuk bezi ve bira arasındaki bağıntıları da bulur. Sınıflandırma: “Genç kadınlar küçük araba satın alır, yaĢlı, zengin erkekler büyük, lüks araba satın alır.” Amaç bir malın özellikleri ile müĢteri özelliklerini eĢlemektir. Böylece bir müĢteri için ideal ürün veya bir ürün için ideal müĢteri profili çıkarılabilir. Örneğin bir otomobil satıcısı Ģirket geçmiĢ müĢteri hareketlerinin analizi ile yukarıdaki gibi iki kural bulursa genç kadınların okuduğu bir dergiye reklam verirken küçük modelinin reklamını verir. Regresyon: “Ev sahibi olan, evli, aynı iĢ yerinde beĢ yıldan fazladır çalıĢan, geçmiĢ kredilerinde geç ödemesi bir ayı geçmemiĢ bir erkeğin kredi skoru 825‟dir.” BaĢvuru skorlamada bir finans kurumuna kredi için baĢvuran kiĢi ile ilgili finansal güvenilirliğini notlayan örneğin 0 ile 1000 arasında bir skor hesaplanır. Bu skor kiĢinin özellikleri ve geçmiĢ kredi hareketlerine dayanılarak hesaplanır. Zaman içinde sıralı örüntüler: “Ġlk üç taksitinden iki veya daha fazlasını geç ödemiĢ olan müĢteriler %60 olasılıkla kanuni takibe gidiyor.” DavranıĢ skoru (behavioral score), baĢvuru skorundan farklı olarak kredi almıĢ ve 15 taksitleri ödeyen bir kiĢinin sonraki taksitlerini ödeme/geciktirme davranıĢını notlamayı amaçlar. Benzer zaman sıraları: “X Ģirketinin hisse fiyatları ile Y Ģirketinin hisse fiyatları benzer hareket ediyor.” Amaç zaman içindeki iki hareket serisi arasında bağıntı kurmaktır. Bunlar örneğin iki malın zaman içindeki satıĢ miktarları olabilir. Örneğin, dondurma satıĢları ile kola satıĢları arasında pozitif, dondurma satıĢları ile salep satıĢları arasında negatif bir bağıntı beklenebilir. İstisnalar (Fark saptanması): “Normalden farklı davranıĢ gösteren müĢterilerim var mı?” Amaç önceki uygulamaların aksine kural bulmak değil, kurala uymayan istisnai hareketleri bulmaktır. Bu da örneğin olası sahtekârlıkların saptanmasını (fraud detection) sağlar. Örneğin, Visa kredi kartı için yapılan CRIS sisteminde bir yapay sinir ağı kredi kartı hareketlerini takip ederek müĢterinin normal davranıĢına uymayan hareketler için müĢterinin bankası ile temasa geçerek müĢteri onayı istenmesini sağlar. Doküman madenciliği: “ArĢivimde (veya internet üzerinde) bu dokümana benzer hangi dokümanlar var?” Amaç dokümanlar arasında ayrıca elle bir tasnif gerekmeden benzerlik hesaplayabilmektir (text mining). Bu genelde otomatik olarak çıkarılan anahtar sözcüklerin tekrar sayısı sayesinde yapılır. 2.4. Veri Madenciliğinde KarĢılaĢılan Problemler Makine öğrenimiyle VM arasındaki farklar sıralanırken Ģu önemli detay hemen söylenir; makine öğrenimi küçük deneysel verilerle uğraĢırken VM büyük hacimli gerçek dünya verileriyle uğraĢır. Bu fark VM‟ de büyük sorunlar oluĢturur. Bundan dolayı mesela küçük veri setleriyle ve yapay hazırlanmıĢ verilerle doğru çalıĢan sistemler büyük hacimli, eksik, gürültülü, NULL 16 değerli, artık, dinamik verilerle yanlıĢ çalıĢabilir. Bundan dolayı bu sorunların aĢılması gerekmektedir. 2.4.1. Veri tabanı boyutu Veri tabanı boyutu 2. bölümün baĢında verilen NASA örneğinde olduğu gibi veri hacmi büyük boyutlara ulaĢmaktadır [5]. VT‟ de tutulan verilerin boyutu iki boyutlu olarak geniĢlemektedir: Yatay boyut: nesnelerin özellik sayılarıyla geniĢlemektedir. Dikey boyut: nesnelerdeki kayıt sayısıyla geniĢlemektedir. GeliĢtirilen pek çok algoritma yüzler mertebesindeki verilerle uğraĢacak Ģekilde geliĢtirildiğinden aynı algoritmanın yüz binlerce kat daha fazla kayıtlarla çalıĢabilmesi için azami dikkat gerekmektedir. Veri hacminin büyüklüğünden kaynaklanan sorunun çözümü için uygulanacak alternatif çözümlerden bazıları: Örneklem kümesinin yatay ve dikey boyutta indirgenmesi, o Yatay indirgeme: Nitelik değerlerinin önceden belirlenmiĢ genelleme sıradüzenine göre, bir üst nitelik değeri ile değiĢtirilme iĢlemi yapıldıktan sonra aynı olan çokluların çıkarılma iĢlemidir. o Dikey indirgeme: Artık niteliklerin indirgenmesi iĢlemidir. VM yöntemleri sezgisel / buluĢsal bir yaklaĢımla arama uzayını taramalıdır, vb. Örneklem kümesinin geniĢ olması bulunacak örüntüleri ne kadar iyi tanımlıyorsa, bu büyük kümeyle uğraĢma zorluğu da o kadar artmaktadır. 17 2.4.2. Gürültülü veri Veri giriĢi veya veri toplanması esnasında oluĢan sistem dıĢı hatalara gürültü denir. Veri toplanması esnasında oluĢan hatalara ölçümden kaynaklanan hatalar da dahil olmaktadır. Bu hataların sonucu olarak VT‟ de birçok niteliğin değeri yanlıĢ olabilir. Günümüz ticari iliĢkisel veri tabanları bu tür hataların ele alınması için az bir destek sunmaktadır. Veri madenciliğinde kullanılan gerçek dünya verileri için bu sorun ciddi bir problemdir. Bu sebepten dolayı veri madenciliği tekniklerinin gürültülü verilere karĢı daha az duyarlı olması gerekir. Sistemin gürültülü veriye daha az duyarlı olmasından kasıt, gürültülü verilerin sistem tarafından tanınması ve ihmal edilmesidir. Chan ve Wong (1991), gürültünün etkisini azaltmak için istatistiksel yöntemler kullanmıĢtır. Sınıflama üzerine yaptığı çalıĢmalardan tanınan Quinlan‟nın gürültünün sınıflama üzerine etkileri konusunda yaptığı çalıĢmada; etiketli öğrenmede etiket üzerindeki gürültünün öğrenme algoritmasının performansını doğrudan etkileyerek düĢürdüğünü tespit etmiĢtir [24]. Tümevarımsal karar ağaçlarında uygulanan metotlar bağlamında gürültülü verinin yol açtığı problemler araĢtırılmıĢtır [24]. 2.4.3. Null değerler Eğer VT‟ de bir nitelik değeri NULL ise o nitelik bilinmeyen ve uygulanamaz bir değere sahiptir. VT‟ de birincil anahtar haricindeki herhangi bir niteliğin özelliği NOT NULL (NULL olamaz) Ģeklinde tanımlanmadığı sürece bu niteliğin değeri NULL olabilir. 18 Kurulacak bir iliĢkide kullanılacak verilerin aynı sayıda niteliğe ve NULL olsa bile aynı sayıda nitelik değerine sahip olması gerekir. Lee NULL değerini iliĢkisel veri tabanlarını geniĢletmek için aĢağıdaki üç gruba girecek Ģekilde ayırmıĢtır [25]: Bilinmeyen, Uygulanamaz, Bilinmeyen veya uygulanamaz. Bu ayrımda Ģu ana kadar sadece bilinmeyen değer üzerinde çalıĢmalar yapılmıĢtır [26, 27, 28]. Veri kümelerinde var olan NULL değerleri için çeĢitli çözümler söz konusudur [24]: NULL değerli kayıtlar tamamıyla ihmal edilebilir, NULL değerli kayıtlardaki NULL değerleri olası bir değerle günlenebilir. Bu günleme için çeĢitli yöntemler söz konusudur: NULL değeri yerine o nitelikteki en fazla frekansa sahip bir değer veya ortalama bir değer konulabilir, NULL değeri yerine varsayılan bir değer konulabilir, NULL değerinin bulunduğu kaydın diğer özelliklerine göre, NULL değerinin kendine en yakın değerle günlenmesi sağlanabilir, vb. 2.4.4. Eksik veri Veri madenciliğinde iliĢkilerin kurulabilmesi ve istenen problemin çözümüne ulaĢabilmek için gereken örneklem kümesindeki 2 boyutun eksik olmaması gerekir. Bu boyuttaki eksiklikler Ģu Ģekilde olabilir: 19 Yatay boyuttaki eksiklik, örneklem kümesinde olması gereken nitelik veya niteliklerin olmamasıdır. Örneğin: eğer insanların göz rengiyle alakalı bir hastalığın neye bağlı olduğu bulunmaya çalıĢılıyorsa, niteliklerden göz renginin örneklem kümesinde bulunması gerekir. Dikey boyuttaki eksiklik örneklem kümesindeki kayıtların eksik olmasıdır. Örneğin bir süper markette yaĢı 10 ve 25 yaĢındaki kiĢiler her yaptıkları alıĢveriĢte bir ürünü sürekli alıyorlarsa, bu örüntünün keĢfedilmesi için örneklem kümesinde yeterli sayıda 10-25 yaĢ aralığına giren kayıtların bulunması gerekir. Eğer örneklem kümesinde bu kayıtlar bulunmazsa gerçek hayatta var olan bir örüntü kaçırılmıĢ olur. 2.4.5. Artık veri Artık veri, problemde istenilen sonucu elde etmek için kullanılan örneklem kümesindeki gereksiz niteliklerdir. Artık nitelikleri elemek için geliĢtirilmiĢ algoritmalar, özellik seçimi olarak adlandırılır. Özellik seçimi arama uzayını küçültür ve sınıflama iĢleminin kalitesini de artırır [29, 30, 31, 32]. 2.4.6. Dinamik veri Ġçeriği sürekli değiĢen veri tabanlarıdır. Bunlara örnek kurumsal çevrim-içi veri tabanları gösterilebilir. Bir veri tabanındaki içeriğin sürekli değiĢmesi VM uygulamalarının uygulanabilmesini önemli ölçüde zorlaĢtırıcı sorunlar doğurmaktadır. Bu sorunlardan bazıları Ģunlardır: Ortaya çıkan veri madenciliği örüntülerinin sürekli değiĢim halinde olan verilerden hangisini ifade ettiğinin tespitinin zorluğu ve bu üretilen sonuçların zaman içinde eski üretilen sonuçlardan farkının tespiti ve gereken yerlerin günlenme zorluğu, 20 Veri madenciliği algoritmalarının çalıĢabilmesi için verilerin üzerine okuma kilidi konulması gerektiğinde, bu verilerin baĢka uygulamalar tarafından değiĢime açık olmaması, Veri madenciliği algoritmalarının ve çevrim-içi veritabanı uygulamalarının aynı anda uygulanmasından kaynaklanan ciddi performans düĢüĢlerinin olması, vb. 21 3. VERĠ MADENCĠLĠĞĠ ALGORĠTMALARI Veri madenciliği algoritmaları verilerde var olan bilgiyi anlaĢılabilecek kurallar olarak çıkartmaya yarayan metotlardır. Veri madenciliği algoritmaları genel olarak iki ana gruba ayrılır [33]: Doğrulamaya dayalı algoritmalar: Kullanıcı tarafından ispatlanmak istenen bir hipotez ortaya sürülür ve VM algoritmalarıyla bu hipotez ispatlanmaya çalıĢılır. Çok boyutlu analizlerde ve istatistiksel analizlerde tercih edilen metottur. Hipotez testi buna örnektir. Keşfe dayalı algoritmalar: Doğrulamaya dayalı algoritmaların tersine bu algoritmalarda ortada ispatlanması istenen hipotezler yoktur. Tam tersine bu algoritmalar otomatik keĢfe dayanmaktadır. KeĢfe dayalı algoritmaların birçok kullanım alanı vardır: istisnai durumların keĢfi, karar ağacı, kümeleme gibi algoritmalar bu yaklaĢıma göre kurulmuĢtur. Veri madenciliği modellerini gördükleri iĢlevlere göre: 1. Sınıflama (Classification) ve Regresyon (Regression) 2. Kümeleme (Clustering) 3. Birliktelik Kuralları (Association Rules) olmak üzere üç ana baĢlık altında incelemek mümkündür [20]. Daha önce de belirtildiği gibi sınıflama ve regresyon modelleri tahmin edici, kümeleme ve birliktelik kuralları modelleri tanımlayıcı modellerdir [14]. Kümeleme, veri setinin kümelere bölünerek küme içi özelliklerin maksimize edilmesi, küme dıĢı özelliklerin ise minimize edilmesi sürecidir. ĠliĢkilendirme, veri seti içindeki iliĢki kurallarının keĢfedilmesi iken, sınıflandırma; benzer özelliklerin kategorik sınıflarının tanımlanmasıdır. 22 3.1. Sınıflama ve Regresyon Sınıflama kategorik değerleri tahmin ederken, regresyon süreklilik gösteren değerlerin tahmin edilmesinde kullanılır. Sınıflama ve Regresyon modelleri arasındaki temel fark, tahmin edilen bağımlı değiĢkenin kategorik veya süreklilik gösteren bir değere sahip olmasıdır. Ancak bazı tekniklerde her iki model giderek birbirine yaklaĢmakta ve bunun bir sonucu olarak aynı tekniklerden yararlanılması mümkün olmaktadır [21]. Bu bölümde Ģu sınıflandırma algoritmalarından bahsedilecektir: Karar Ağaçları, Doğrusal ve çoklu regresyon modelleri, Yapay sinir ağları (YSA), Naive Bayes sınıflayısıcı, K-Nearest Neighbor algoritması, Genetik algoritmalar. 3.1.1. Karar ağaçları ve karar ağacı algoritmaları Karar ağacı analizi, genellikle seçenekler üzerinde yapılan bir analiz türüdür. Bu analizin veri madenciliğinde kullanılma sebepleri Ģunlardır [22]: Maliyeti azdır. AnlaĢılması ve yorumlanması kolaydır. Veri tabanına kolay entegre edilebilmektedir. Güvenirliliği yüksektir. Karar ağaçları kolaylıkla sınıflama kurallarına dönüĢtürülebilmektedir. Bunun için algoritmaya girdi olarak verilerin belirlenen belli nitelikleri, çıktı olarak da verilerin belli bir niteliği verilir ve algoritma bu çıktı niteliğindeki değerlere 23 ulaĢmak için hangi girdi nitelik değerlerinin olması gerektiğini ağaç veri yapıları kullanarak keĢfeder. Karar ağaçları genellikle yaprakları ve gövdesi ile ağaç yapısında sunulmaktadır. Gövdeler özelliklerin koĢullarını gösterirken yapraklar sınıflandırma sonuçlarını ortaya koyar. Özellikle karar ağaçlarına yönelik pek çok algoritma; CART, CHAID, ID3, C4.5 yer almaktadır [3]. Sınıflandırma ağaçları, Breiman ve arkadaĢları tarafından 1984 yılında önerilmiĢtir. Sınıflandırmada, bir veri seti mevcuttur ve her data noktası amaç değiĢkeni ile birlikte karakteristik değerlerden (özelliklerden) oluĢur ve genellikle ikilidir (binary). Amaç, farklı amaç çıktılarına göre özelliklerin kombinasyonunu oluĢturmaktır. Sınıflandırma, kredi skorlama ve pazarlama dıĢında pek çok alanda da kullanılmaktadır. Örneğin sağlık alanında Harper ve arkadaĢları (2003), CART algoritmasını Ģeker hastalarının tedavilerine karar vermede kullanmıĢlardır [23]. Sınıflandırma ağaçlarının gücü, sınıflandırılacak karakteristiklerin etkileĢimini incelemesidir. Sınıflandırma ağaçları, verideki en önemli karakteristikleri tanımlar ve amaç değiĢkenine ulaĢmak için en iyi tahmini sağlayan özelliklerin kombinasyonunu belirler. Ağacı yapılandırmak için, öncelikle popülasyon birbirinden mümkün olduğu kadar farklı 2 alt popülasyona ayrılır. Bunu yaparken, her bir karakteristiğe bakılır ve amaç değiĢkenin çıktılarının farklılaĢtıracak özelliklerin farklılaĢtırılması ile optimumu sağlayacak ayırım tanımlanır. Bu süreç, yavru popülasyonlara kadar tekrarlanır [23]. Karar ağaçları sınıflandırma ve tahmin için sıklıkla kullanılan bir veri madenciliği yaklaĢımıdır. Sorunla ilgili araĢtırma alanını alt gruplara ayırmak için kullanılır. Karar ağaçlarında kök ve her düğüm bir soruyla etiketlenir. Düğümlerden ayrılan dallar ise ilgili sorunun olası yanıtlarını belirtir. Her dal düğümü de söz konusu sorunun çözümüne yönelik bir tahmini temsil eder [24]. Sinir ağları gibi diğer metodolojilerin sınıflandırma için kullanılmasına 24 rağmen karar vericiler için kolay tefsir ve anlaĢılır olması karar ağaçlarının avantajlarıdır [3]. Karar ağaçları, her bir dalının birer kurala dönüĢtürülebilir olmasından dolayı kural çıkartım sürecinde etkili olarak kullanılırlar. Dalın kapsadığı örnek sayısının fazlalığı o kuralın güçlü olduğunu ifade eder [10]. Karar ağaçlarının en önemli avantajlarından biri EĞER-ĠSE (IF-THEN) yapısını kullanması ve bilgi kazanımı sunmada anlaĢılabilir olmasıdır [25]. Karar ağaçları, bir sınıf ya da değer oluĢturan bir dizi kuralı gösterme yöntemidir. Örneğin, borç uygulamalarını iyi ya da kötü kredi riskine göre sınıflandırmak isteyebilirsiniz. ġekil 3.1‟ de bu problemi çözen basit bir karar ağacı örneği gösterilmektedir, aynı zamanda bu Ģekil bir karar ağacının tüm basit bileĢenlerini de göstermektedir [26]. ġekil 3.1. Karar ağacı örneği [26] Burada; EĞER Gelir 40000 den küçük ve iĢ süresi 5 yıldan büyük ĠSE Ġyi kredi riskli, EĞER Gelir 40000 den küçük ve iĢ süresi 5 yıldan küçük ĠSE Kötü kredi riskli, EĞER Gelir 40000 den büyük ve yüksek borçlu ĠSE Kötü kredi riskli, EĞER Gelir 40000 den büyük ve yüksek borçlu değil ĠSE Ġyi kredi risklidir. 25 Bilgi kazancı ölçütü ağaçtaki her bir düğümde test alanını seçmek için kullanılır. Bu tür bir ölçüt alan seçim ölçütü olarak anılır. En yüksek bilgi kazancı değerine sahip alan ele alınan düğüm için test alanı olarak seçilir. Bu alan sonuç ayrımlarındaki önekleri sınıflamak için gerekli olan bilgiyi en aza indirir ve bu ayrımlarda en az rastsallığı yansıtmaktadır. Böyle bir teorik bilgi yaklaĢımı bir nesneyi sınıflamada ihtiyaç duyulan beklenen test sayısını minimize eder ve basit bir ağacın bulunacağını garantiler. S, s adet veri örneğini barındıran bir set olsun. Sınıf etiketi alanının m adet farklı Ci (i 1,2,..., m) sınıfı tanımlayan m farklı değere sahip olduğunu düĢünelim. s i , C i sınıfında S‟ nin örneklerinin sayısı olsun. Verilen örneği sınıflamak için ihtiyaç duyulacak beklenen bilgi EĢ. 3.1‟ de verilmiĢtir. m Beklenen bilgi: I ( s1 , s2 ,..., sm ) pi log 2 ( pi ) (3.1) i 1 Burada p i , keyfi bir örneğin C i sınıfına ait olması olasılığıdır ve si / s ile tahmin edilir. A alanı v farklı değere sahip olsun {a1 , a2 ,..., av } . A alanı, S‟ yi v alt sete {S1 , S 2 ,..., S v } ayrıĢtırmada kullanılabilir. Burada S j , A‟ nın a j değerine sahip S‟ deki örneklerini içermektedir. Eğer A test alanı olarak seçilirse, bu alt setler S setini barındıran düğümden geliĢecek dallara karĢılık gelecektir. s ij , bir S j alt setinde C i sınıfındaki örneklerin sayısı olsun. Etropi, ya da A‟ ya göre alt setlerin ayrıĢtırılmasına dayanan beklenen bilgi EĢ. 3.2 ‟ deki gibi hesaplanır: v Entropi: E ( A) j 1 s1 j ... s mj s I ( s1 j ,..., s mj ) (3.2) 26 Burada s1 j ... s mj terimi, J alt setinin ağırlığı olarak rol oynar ve alt setteki s örnek sayısının, S‟ deki toplam örnek sayısına bölümüdür. Daha küçük entropi değeri, alt set ayrımlarının saflığının daha büyük olması demektir. S j alt seti için EĢ. 3.3 geçerlidir. m I ( s1 j , s 2 j ,..., s mj ) (3.3) pij log 2 ( pij ) i 1 Burada pij sij |Sj | ‟ dir ve S j ‟deki bir örneğin C i sınıfına ait olma olasılığıdır. A‟ dan dallanmakla elde edilecek kodlanmıĢ bilgi (kazanç) EĢ. 3.4‟ de gösterilmiĢtir: Kazanç(A) I(s1 , s 2 ,..., s m ) - E(A) Diğer bir deyiĢle Kazanç(A), (3.4) A alanının değerini bilmekten kaynaklanan entropideki beklenen azalmadır. Algoritma her bir alanın bilgi kazancını hesaplar. En yüksek bilgi kazançlı alan verilen S seti için test alanı olarak seçilir. Bir düğüm yaratılır ve bu alanla etiketlenir. Alanın her bir değeri için dallar yaratılır ve buna göre örnekler ayrıĢtırılırlar. Yaygın olarak kullanılan karar ağacı algoritmaları Ģunlardır: CHAID (Chi-Squared Automatic Interaction Detector , Kass 1980), C&RT (Classification and Regression Trees, Breiman ve Friedman, 1984), ID3 (Induction of Decision Trees, Quinlan, 1986), C4.5 (Quinlan, 1993). 27 ID3 ve C4.5 Algoritmaları: Karar ağaçları olarak da adlandırılan ID3 ve C4.5 algoritmaları, sınıflandırma modellerini iĢlemek için Quinlan (1993) tarafından geliĢtirilmiĢtir. ID3 tahmin edicileri ve onların bölünüm değerlerini bölünümlerle sağlanan bilgi kazancına göre seçmektedir. Kazanç, bölünüm öncesi ve sonrasında doğru tahmin yapabilmek için ihtiyaç duyulan enformasyon miktarındaki farkı anlatmaktadır. Kazanç, orijinal segmentin entropisi ile sonuçta elde edilen bölünüm segmentlerinin toplam entropileri arasındaki farktır [27]. C4.5, ID3‟ün geliĢtirilmiĢ halidir. C4.5 eksik ve sürekli nitelik değerlerini ele alabilmekte, karar ağacının budanması ve kural çıkarımı gibi iĢlemleri yapabilmektedir. Karar ağacının kurulması için kullanılacak girdi olarak bir dizi kayıt verilirse bu kayıtlardan her biri aynı yapıda olan birtakım nitelik/değer çiftlerinden oluĢur. Bu niteliklerden biri kaydın hedefini belirtir. Problem, hedef-olmayan nitelikler kullanılarak hedef nitelik değerini doğru kestiren bir karar ağacı belirlemektir. Hedef nitelik çoğunlukla sadece {evet, hayır}, veya {baĢarılı, baĢarısız} gibi ikili değerler alır [9]. Karar ağacında, her bir düğüm hedef-olmayan bir niteliğe, düğümler arasındaki her yay (ark) ise niteliğin olası bir değerine karĢılık gelir. Ağacın bir yaprağı, bu yapraktan köke kadar ki yolda tanımlanan kayıtlar için hedef niteliklerin beklenen değerini belirler. Karar ağacında her bir düğüm kökten baĢlayarak yol üzerinde henüz dikkate alınmamıĢ olan nitelikler arasından en çok bilgi sağlayan hedef-olmayan nitelikle iliĢkilendirilebilir [9]. C&RT: Breiman ve Friedman tarafından 1984 yılında geliĢtirilmiĢtir. C&RT ağacını oluĢturmada tahmin ediciler, farklı tahminlerin kayıtları nasıl etkilediği temeline göre seçilmektedir. Örneğin verilmiĢ bir tahmin edici için verilmiĢ bir bölünüm noktasının diğerlerine göre daha iyi olup olmadığını tanımlayan ise entropi metriğidir [27]. 28 C&RT‟ın büyük avantajlarından birisi algoritmanın modelin geçerliliğini sınaması ve genel optimal modelin keĢfedilmesidir. C&RT çok karmaĢık bir ağaç oluĢturup ardından geriye doğru budayarak çapraz geçerlilik sınaması ve test kümesi sınaması sonuçlarını temel alan optimal genel ağaca ulaĢarak bunu baĢarmaktadır. Ağaç, test veri kümesi üzerinde ağacın pek çok budanmıĢ versiyonunun performansını temel alarak geriye doğru budanmaktadır. Ağaç, yeni ve görülmemiĢ veriyi, çapraz geçerlilik sınamasını kullanarak iyi biçimde seçer [27]. CHAID: CHAID, karar ağacı tekniği grupları oluĢturmak için Ki-Kare analizinden yararlanmaktadır. Bu algoritma esasen benzer verileri birleĢtirerek farklı olanlarla analize devam eder. Böylece ulaĢılmak istenen değerler kesin ve kolay bir Ģekilde elde edilir. Karar ağacının ilk dallarını oluĢturmak için en iyi tahmin edici değiĢkenler seçilir. Bu algoritmada değiĢkenler sürekli ise F-Testi değerleri, nominal ya da ordinal bir değiĢkense Ki-Kare test değerleri kullanılır [28]. CHAID karar ağacını oluĢturmada C&RT‟ a benzemektedir ancak bölünümleri seçmede farklı bir yol izlemektedir. Optimal bölünümün seçiminde Entropi veya Gini metriklerinin kullanımı yerine değerlerin tahmininde hangi kategorik tahmin edicinin bağımsızlıktan en uzak olduğunu tanımlamak için olasılık tablolarında Ki-Kare testi kullanımına dayanmaktadır. Özellikle CHAID kategorik verilerle çalıĢmak için tasarlanan ikili olmayan (non-binding) bir karar ağacıdır [3]. 3.1.2. Doğrusal ve çoklu regresyon Regresyon, değerleri bilinen değiĢkenleri kullanarak diğer değiĢkenleri tahmin etmek için kullanılır [26]. Regresyon terminolojisinde, tahmin edilecek olan değiĢken “bağımlı değiĢken”, bağımlı değiĢkeni tahmin etmek için 29 kullanılan değiĢken ya da değiĢkenler ise “bağımsız değiĢken” olarak adlandırılır. Doğrusal regresyonda, veri düz bir çizgi kullanılarak modellenir. Doğrusal regresyon, regresyonun en basit halidir. Ġki değiĢkenli doğrusal regresyon, rastgele değiĢken Y‟yi bir baĢka rastgele değiĢken X‟in bir doğrusal fonksiyonu olarak EĢ. 3.5‟ deki gibi modeller. Y X (3.5) Burada Y‟ nin varyansının sabit olduğu varsayılır ve ve sırasıyla doğrunun eksenini kestiği noktayı ve doğrunun eğimini tanımlayan regresyon katsayılarıdır. Bu katsayılar, gerçek veri ve doğrunun tahmini arasındaki hatayı en azaltan en küçük kareler metodu ile çözülebilir. Böylece EĢ. 3.6 ve EĢ. 3.7 elde edilir: s i 1 ( xi s ( xi 1 i y x )( yi y) x)2 x (3.6) (3.7) Burada x x1 , x2 ,..., xs ‟ lerin ortalaması iken, y y1 , y2 ,..., y s ‟lerin ortalamasıdır. Çoklu regresyon, doğrusal regresyonun birden fazla tahminci değiĢken içeren halidir. Y değiĢkeninin, çok boyutlu bir özellik vektörünün doğrusal bir fonksiyonu olarak modellenmesine olanak tanır. X 1 ve X 2 gibi iki tahminci değiĢkeni temel alan çoklu regresyon modelinin bir örneği de EĢ. 3.8‟ deki gibidir: Y 1 X1 2 X2 (3.8) 30 Doğrusal olmayan regresyon: Polinomyal regresyon, polinomyal terimleri temel doğrusal modele ekleyerek modellenebilir. DeğiĢkenlere dönüĢüm uygulanarak bu doğrusal olmayan modeller, en küçük kareler tekniği ile çözülebilecek doğrusal modellere dönüĢtürülebilir. Diğer regresyon modeller: Doğrusal regresyon sürekli değerli fonksiyonları modellemekte de kullanılır. GenelleĢtirilmiĢ doğrusal modeller, doğrusal regresyonun kategorik değiĢkenlerin modellemesinde uygulanabileceğinin teorik esaslarını sunmaktadır. GenelleĢtirilmiĢ doğrusal modellerde, Y değiĢkeninin varyansı, doğrusal regresyondaki sabit değerin tersine Y‟ nin ortalamasının bir fonksiyonudur. GenelleĢtirilmiĢ doğrusal modellerin en bilinen türleri, Lojistik Regresyon ve Poisson Regresyon‟dur. Lojistik regresyon tahminci değiĢkenler setinin bir doğrusal fonksiyonu olarak bazı olayların gerçekleĢme olasılıklarını modeller. Sayımlı veriler genellikle poisson dağılım sergiler ve poisson regresyon kullanılarak modellenir. Lojistik doğrusal modeller yaklaĢık olarak, kesikli çok boyutlu olasılık dağılımlarını takip eder. Veri küpü hücreleri ile iliĢkili olasılık değerlerinin tahmininde kullanılabilirler. 3.1.3. Yapay sinir ağları Sinir ağları, veri madenciliğinde tahmin ve sınıflandırma analizlerinde kullanılan bir yöntemdir. Yapay sinir ağlarında beynin sinir sisteminin çalıĢma prensipleri model olarak alınmıĢtır. Yapay sinir ağları, insanlığın doğayı araĢtırma ve taklit etme çabalarının en son ürünlerinden bir tanesi olan teknolojidir. 1980‟lerden itibaren yaygınlaĢan ve yapay sinir ağları adı verilen programlar, basit biyolojik sinir sisteminin çalıĢma Ģeklini canlandırmak için tasarlanmıĢlardır [29]. Biyolojik özelliği taĢıdığı için, yani insanın beynindeki sinir ağlarının modelini oluĢturabildiği 31 için yapay sinir ağları bir insanın düĢünme ve gözlemlemeye yönelik doğal yeteneklerini gerektiren problemlere çözüm üretebilmektedir [30]. Yapay sinir ağlarında amaç fonksiyon birbirine bağlı basit iĢlemci ünitelerinden oluĢan bir ağ üzerine dağıtılmıĢtır. Bu ünitelere “nöron” ismi verilmektedir. Yapay sinir ağlarında kullanılan öğrenme algoritmaları veriden üniteler arasındaki bağlantı ağırlıklarını hesaplar. Bu ağlar öğrenme, hafızaya alma ve veriler arasındaki iliĢkiyi ortaya çıkarma kapasitesine sahiptirler. YSA istatistiksel yöntemler gibi veri hakkında parametrik bir model varsaymaz yani uygulama alanı daha geniĢtir ve bellek tabanlı yöntemler kadar yüksek iĢlem ve bellek gerektirmez [14]. Bir yapay sinirin öğrenme yeteneği, kullanılan ağırlık oranıyla doğrudan alakalıdır.Süreçte kullanılan girdiler, dıĢarıdan elde edilen bilgilerdir.Toplama fonksiyonu bir hücreye gelen net girdi miktarı olarak tanımlanabilir. Aktivasyon fonksiyonu, bu fonksiyon öğrenilme sonucu oluĢan değerlerin ortaya çıkarılması için kullanılan bir fonksiyondur. Son olarak çıktı ise, aktivasyon fonksiyonundan elde edilen değer olarak tanımlanabilir [22]. Yapay sinir ağaçlarının katman olarak iĢleyiĢi ġekil 3.2‟ de gösterilmektedir. ġekil 3.2. Yapay sinir ağlarının katmanları 32 3.1.4. NaiveBayes sınıflaması Bayes sınıflayıcıları istatistiksel sınıflayıcılardır ve bir örneğin belli bir sınıfa ait olma olasılığı gibi sınıf üyelik olasılıklarını tahmin edebilirler. Bayes sınıflaması, bayes teoremine dayanmaktadır. Naive bayes algoritması sürekli veri ile çalıĢmadığından değiĢkenler kategorik hale getirilir. Naive bayes sınıflayıcıları, belli bir sınıf için alan değerlerinin etkisinin diğer alanların değerlerinden bağımsız olduklarını varsayar. Bu varsayım sınıfların Ģartlı bağımsızlığı olarak adlandırılır. Bu varsayım gereken iĢlemleri basitleĢtirmek için yapılmıĢtır ve bu mantıkla “saf” olarak değerlendirilir. Naive Bayes, modelin öğrenilmesi esnasında, her çıktının öğrenme kümesinde kaç kere meydana geldiğini hesaplar. Bulunan bu değer, öncelikli olasılık olarak adlandırılır. Naive Bayes aynı zamanda her bağımsız değiĢken / bağımlı değiĢken kombinasyonunun meydana gelme sıklığını bulur. Bu sıklıklar öncelikli olasılıklarla birleĢtirilmek suretiyle tahminde kullanılır [16]. 3.1.5. K-Nearest neighbor algoritması En Yakın komĢu sınıflayıcıları analoji ile öğrenmeyi temel alırlar. Eğitim örnekleri n boyutlu nümerik alanlar olarak tanımlanırlar. Her bir örnek n boyutlu uzayda bir noktaya karĢılık gelir. Bu yolla eğitim örneklerinin tamamı n boyutlu uzayda depolanmıĢ olur. Bilinmeyen bir örnek verildiği zaman, k en yakın komĢu sınıflayıcısı bu uzayda bilinmeyen örneğe en yakın k eğitim örneğini bulur. Bu k adet eğitim örnekleri, bilinmeyen örneğin “en yakın k komĢusu”dur. “Yakınlık” öklid uzaklığı olarak tanımlanır. Buna göre X ( x1 , x2 ,..., xn ) ve Y ( y1 , y 2 ,..., y n ) gibi iki nokta arasındaki öklid uzaklığı EĢ. 3.9‟ daki gibi hesaplanır: 33 n d ( X ,Y ) yi ) 2 ( xi (3.9) i 1 Bilinmeyen örnek, k en yakın komĢuları arasındaki en yaygın sınıfa atanır. k=1 olduğunda, bilinmeyen örnek uzayda kendisine en yakın eğitim örneğinin sınıfına atanır. 3.1.6. Genetik algoritmalar Genetik algoritmalar, çok değiĢkenli fonksiyonları optimize etmeyi amaçlayan sayısal bir araçtır. Bu algoritma parametre yerine onların kodlanmıĢ biçimlerini kullanarak en iyiye ulaĢmaya çalıĢır. Yapay zekânın bir uygulaması olan genetik algoritma, kısa sürede çözümleri ortaya çıkarması bakımından önemli bir tekniktir [31]. Genetik algoritmalar, doğal evrim fikrini içermektedir. Genel olarak genetik öğrenme Ģu Ģekilde baĢlar. Bir baĢlangıç popülâsyonu rastgele üretilmiĢ kuralları içerecek Ģekilde oluĢturulur. Her bir kural bitler katarı Ģeklinde sunulabilmektedir. En uygun olanının popülasyondan yaĢaması misyonuna uygun olarak, Ģimdiki en uygun olan kurallar ve bunların çocukları yeni popülasyonu oluĢturulur. Tipik olarak bir kuralın uygunluğu bir eğitim örnekleri seti üzerindeki sınıflama doğruluğu tarafından belirlenir. Çocuklar, çaprazlama ve mutasyon gibi genetik iĢlemler uygulanarak üretilirler. Çaprazlamada kural çiftlerinin alt katarları yeni kural çiftleri oluĢturmak için değiĢ-tokuĢ edilirler. Mutasyonda, bir kural katarından rastgele seçilmiĢ bitler ters çevrilirler. 34 Önceki kural popülâsyonundan yeni popülasyonların üretilmesi süreci bir p popülasyonundaki her bir kural önceden tanımlanmıĢ bir uygunluk eĢiğine sahip olana kadar geliĢtirilmeye devam eder. Genetik algoritmalar kolaylıkla paralelleĢtirilebilir ve diğer optimizasyon problemlerinde kullanıldığı gibi sınıflamada kullanılmıĢtır. Veri madenciliğinde diğer algoritmaların uygunluğunun değerlendirilmesinde kullanılabilir. 3.2. Kümeleme Kümeleme, veri tabanından ilginç örüntülerin keĢfedildiği bir madencilik tekniğidir. Kümelemenin genel düĢüncesi, veri tabanını çok sayıda kümeye ayırmak ve aynı kümeye ait verilerin mümkün olduğu kadar yakın iliĢkide olmalarının sağlanmasıdır [32]. Veri madenciliğinde kümeleme yaygın Ģekilde kullanılan, verileri sınıflar veya kümeler içinde gruplayan, bu sayede aynı küme içindeki verilerin diğer kümedekilere göre daha benzer olduğu bir tekniktir [1]. Kümeleme analizi, nesnelerin altdizinlere gruplanmasını yapan iĢleme denir. Böylece nesneler, örneklenen kitle özelliklerini iyi yansıtan etkili bir temsil gücüne sahip olmuĢ olur. Kümeleme, bir denetimsiz öğrenme yöntemidir. Kümeleme analizinin özellikleri aĢağıda kısaca özetlenmiĢtir: Denetimsiz (unsupervised) öğrenmedir. Önceden tanımlanan sınıf ve sınıf-etiketli çalıĢmamaktadır. Kümeleme veri dağılımını anlamada fayda sağlar. Bir veri madenciliği fonksiyonudur. öğrenme örnekleriyle 35 Basit bir kümeleme örneği ġekil 3.3‟ de verilmiĢtir. Bu örnekte soldaki grafikte yer alan veriler giriĢ olarak verilmiĢ ve kümeleme iĢlemi sonucunda ortaya çıkan 7 adet küme sağda gösterilmiĢtir. 6 7 5 2 3 1 4 ġekil 3.3. Veri kümeleme örneği Veri kümeleme güçlü bir geliĢme göstermektedir. Veri tabanlarında toplanan veri miktarının artmasıyla orantılı olarak, kümeleme analizi son zamanlarda veri madenciliği araĢtırmalarında aktif bir konu haline gelmiĢtir. Literatürde pek çok kümeleme algoritması bulunmaktadır. Kullanılacak olan kümeleme algoritmasının seçimi, veri tipine ve amaca bağlıdır. Genel olarak baĢlıca kümeleme yöntemleri Ģu Ģekilde sınıflandırılabilir: Bölümleme yöntemleri (Partitioning methods) HiyerarĢik yöntemler (Hierarchical methods) Model tabanlı yöntemler (Model-based methods). 3.2.1. Bölümleme yöntemleri Bölümleme yönteminde ilk önce örneklem kümesi içinden rastgele k tane merkez seçilir. Daha sonra her bir noktanın küme merkezlerine olan uzaklıkları hesaplanır ve bu uzaklığı minimum yapan yeni küme merkezleri bulunarak güncellenir. Küme merkezlerinde hiçbir değiĢim olmayıncaya 36 kadar, noktaların küme merkezlerine olan uzaklığının hesaplanması ve bu uzaklığı minimum yapan küme merkezlerinin bulunarak güncellenmesi iĢlemi tekrarlanır. K-ortalamalar (k-means) ve k-medoids birer bölümleme kümeleme algoritmasıdır. Veri madenciliğinde kümelemede kullanılan ve en çok bilinen uygulamalardan biri K-ortalama „dır. Öncelikle, K sayıda gözlem N gözlem içinden küme sayısına göre rastgele seçilir ve ilk kümelerin merkezi olur. Ġkinci olarak, kalan her bir N-K gözlem için öklid uzaklık cinsinden en yakın küme bulunur. Her gözlem en yakın kümelere atandıktan sonra, kümenin merkezi yeniden hesaplanır. Son olarak, tüm gözlemler dağıtıldıktan sonra, gözlemler ile kümenin merkezi arasındaki öklid uzaklık hesaplanarak en yakın kümeye atanıp atanmadığı tespit edilir. Kümelemede uygulanan Kortalama algoritması pek çok araĢtırmada kullanılmıĢtır [33]. K-ortalamalar algoritması bölümleme yöntemleri olarak adlandırılan algoritmalardan biridir. Bölümleme kümeleme problemi Ģöyle ifade edilmiĢtir: d boyutlu metrik uzayda verilen n nesnesinin, aynı kümelerdeki nesneler diğer kümelerdekine kıyasla daha benzer olacak Ģekilde k kümeye yerleĢtirerek bölümlenmesinin yapılmasıdır. K değeri probleme göre belirlenebilir veya belirlenmez. Hata kareler ölçütü (squared-error criterion) gibi bir kümeleme ölçütünün olması gerekir. Bu sorunun çözümü Ģöyledir: Bir kümeleme kriteri seçilir, sonra her bir veri nesnesi için bu kriterleri optimize edecek küme seçimi yapılır. K-ortalamalar algoritması k kümelerini, her bir kümeyi temsil edecek bir nesnenin keyfi seçimiyle baĢlatır. Kalan her nesne bir kümeye atanır ve kümeleme kriteri küme ortalamasını hesaplayabilmek için kullanılır. Bu ortalamalar yeni küme noktaları olarak kullanılır ve her bir nesne kendisine en benzer olan kümeye yeniden atanır. Bu kümeler yeniden hesaplanır ve kümelerde hiç bir değiĢim gözlenilmediği duruma ve değiĢim istenen düĢürülünceye kadar bu döngü devam ettirilir. hata düzeyinin altına 37 3.2.2. HiyerarĢik metotlar HiyerarĢik kümeleme nesnelerin yakınlık iliĢkisine göre oluĢturulan kümelerden bir ağaç inĢa eder. HiyerarĢik kümeleme aĢağıdaki özelliklere sahiptir: Bir veri tabanını bir kaç kümeye ayrıĢtırır. Bu ayrıĢtırma dendogram adı verilen bir ağaç sayesinde yapılır (Bkz. ġekil 3.4). Bu ağaç, yapraklardan gövdeye doğru veya gövdeden yapraklara doğru kurulabilir. Dendogram istenen seviyede kesilerek kümeler elde edilir. ġekil 3.4. Veri kümeleme örneği Bir hiyerarĢik kümeleme metodu veri nesnelerini bir küme ağacına gruplayarak çalıĢır. HiyerarĢik kümeleme yöntemleri, hiyerarĢik ayrıĢmanın yukarıdan-aĢağıya veya aĢağıdan-yukarıya oluĢturulmasına bağlı olarak bütünleĢtirici ve bölücü hiyerarĢik kümeleme olarak sınıflandırılabilir. Saf hiyerarĢik kümeleme yöntemlerinin kalitesi, bir kez birleĢtirme veya ayırma kararı iĢletildiğinde uyum gösterememesinden etkilemektedir. AĢağıdan yukarıya (AGglomerative NESting) ya da bir diğer ifadeyle bütünleĢtirici yaklaĢıma göre hiyerarĢik kümeleme Ģu Ģekildedir: Her bir nesne için farklı bir grup oluĢturarak baĢla, 38 Bazı kurallara göre grupları birleĢtir. Örneğin, merkezler arasındaki uzaklık,ortalama vb., Bir sonlandırma durumuna ulaĢılıncaya kadar devam et. Yani, bütün nesneler tek bir küme içinde kalana kadar ya da istenen sayıda küme elde edene kadar birleĢtirme iĢlemi devam eder. Yukarıdan aĢağıya (DIvisive ANAlysis) ya da bir diğer ifadeyle bölücü yaklaĢıma göre hiyerarĢik kümeleme Ģu Ģekildedir: Aynı kümedeki bütün nesnelerle baĢla, Bir kümeyi daha küçük kümelere böl, Bir sonlandırma durumuna ulaĢılıncaya kadar devam et. Yani, her nesne ayrı bir küme oluĢturana ya da istenilen küme sayısı elde edilene kadar ayrılma iĢlemi devam eder BütünleĢtirici Bölücü ġekil 3.5. BütünleĢtirici ve bölücü hiyerarĢik kümelemenin {a,b,c,d,e} veri nesneleri üzerinde gösterimi 3.2.3. Model bazlı kümeleme metotları Model tabanlı kümeleme metotları, verilen veri ile bazı matematiksel modellerin arasındaki uygunluğu optimize etmeye çalıĢır. Bu metotlar verinin 39 olasılık dağılımlarının bir karıĢımından elde edildiğini varsayar. Model tabanlı kümeleme metotları iki yaklaĢımdan oluĢur: İstatistiksel Yaklaşım: Kavramsal kümeleme iki adımlı bir iĢlemdir: ilk olarak kümeleme yapılır sonrasında bunu tanımlama takip eder. Kavramsal kümelemedeki birçok metot, kavram veya kümelerin belirlenmesinde olasılık ölçümlerini kullanan istatistiksel yaklaĢımı benimser. COBWEB, artımlı kavramsal kümelemede popüler ve basit bir metottur. Bu metotta girdi nesneleri kategorik alan değer çiftleri olarak tanımlanır. COBWEB sınıflama ağacı formunda bir hiyerarĢik kümeleme oluĢturur. Sınıflama ağacındaki her bir nokta bir kavrama karĢılık gelmektedir ve bu nokta altında sınıflama nesneleri özetleyen kavramın olasılıklı tanımlamasını içerir. Sinir Ağları Yaklaşımı: Sinir ağları yaklaĢımı ile kümeleme her bir kümeyi bir “temsilci” olarak sunma eğilimindedir. Bir temsilci, kümenin bir prototipi olarak rol oynar ve belli bir veri örneğine veya nesneye karĢılık gelmek zorunda değildir. Yeni nesneler, bazı uzaklık ölçütlerine bağlı olarak temsilcisi en benzer olan kümeye dağıtılabilirler. Bir kümeye atanan bir nesnenin alanları, kümenin temsilcisinin alanlarından tahmin edilebilir. 3.3. Birliktelik Kuralları Birliktelik kuralları, büyük veri kümeleri arasında birliktelik iliĢkileri bulurlar [34]. Toplanan ve depolanan verinin her geçen gün gittikçe büyümesi yüzünden, Ģirketler veritabanlarındaki birliktelik kurallarını ortaya çıkarmak istemektedirler. Birliktelik kurallarının kullanıldığı en tipik örnek market sepeti uygulamasıdır. Bu iĢlem, müĢterilerin yaptıkları alıĢveriĢlerdeki ürünler arasındaki 40 birliktelikleri bularak müĢterilerin satın alma alıĢkanlıklarını analiz eder. Bu tip birlikteliklerin keĢfedilmesi, müĢterilerin hangi ürünleri bir arada aldıkları bilgisini ortaya çıkarır ve market yöneticileri de bu bilgi ıĢığında daha etki satıĢ stratejileri geliĢtirebilirler [20]. Örneğin, bir alıĢveriĢ merkezinde, ekmek alan müĢterilerin 80%‟i süt de almaktadır. ĠliĢki kuralları algoritmasını uygulamanın asıl amacı rastsal verilerin analizi ile eĢ zamanlı iliĢkileri ortaya çıkarmak ve karar verirken referans olarak kullanmaktır [32]. Birliktelik kurallarının bulunmasında birçok yöntem vardır. Büyük veritabanlarında birliktelik kuralları bulmak için algoritma geliĢtirmek çok zor değildir, buradaki zorluk bu tür algoritmaların çok küçük değerli diğer birçok birliktelik kuralını da meydana çıkarmasıdır. Bulabileceğimiz olası birliktelik kuralları sayısı sonsuzdur. Birliktelik kurallarıyla ilgili problem, birliktelik kurallarını bulmada bir eĢik değeri bulmaktır. Önemsiz gürültüden değerli bilgiyi ayırabilmek ve bu eĢik değerini bulabilmek çok zordur. Bu yüzden ilginç birliktelik kurallarından ilginç olmayanları ayırt edebilmek için bazı ölçütlerin belirlenmesi gereklidir. Bu ölçütler destek ve güven değerleridir [2]. Buradaki destek ve güven ifadeleri, kuralın ilginçlik ölçüleridir. Sırasıyla, keĢfedilen kuralın kullanıĢlığını ve doğruluğunu gösterirler [35]. Birliktelik kurallarının amacı, kullanıcı tarafından belirlenen minimum destek ve güven değerlerini sağlayan kuralların bulunmasıdır. Anlamlılığı destek ve güven değerleri ile ölçülen birliktelik kuralları, "X nesnesini alan bir müĢterinin muhtemelen Y nesnesini de alması" tipindeki kuralların tanımlanmasını amaçlamaktadır [2]. 41 3.3.1. Apriori algoritması Birliktelik kuralı için en çok bilinen strateji Apriori‟ dir [50]. Apriori‟ de kullanıcı minimum destek eĢiğini verir ve algoritma bu eĢik değerinden büyük tüm veri kümesini arar. Ġkinci adımda, ilk adımda bulunan veri kümelerinden kurallar oluĢturulmaktadır. Algoritma her kural için güven değerini hesaplar ve kullanıcı tarafından tanımlanan güven eĢik değerini aĢan kuralları saklar. Uygulamada görülen en önemli problemlerden biri ise destek ve güven eĢiklerinin belirlenmesi olmuĢtur [36]. Apriori algoritması veri tabanındaki verileri tekrarlayarak kaydeder ve her kayıttan sonra geniĢ veri kümelerini oluĢturur. ĠĢlemleri indirgemek için aday veri kümeleri için sadece destek seviyeleri hesaplanır [50]. Apriori algoritmasında k öğeli sık geçen öğe küme adayları, (k-1) öğeli sık geçen öğe kümelerinden faydalanılarak bulunur. Ancak bu algoritma veri tabanının pek çok kere taranmasını gerektirmektedir. Takipteki taramalarda bir önceki taramada bulunan sık geçen öğe kümeleri aday kümeleri adı verilen yeni potansiyel sık geçen öğe kümelerini üretmek için kullanılır. Aday kümelerin destek değerleri tarama sırasında hesaplanır ve aday kümelerinden minimum destek metriğini sağlayan kümeler o geçiĢte üretilen sık geçen öğe kümeleri olur. Sık geçen öğe kümeleri bir sonraki geçiĢ için aday küme olurlar. Bu süreç yeni bir sık geçen öğe kümesine rastlanıncaya kadar devam eder. Bu algoritmadaki temel yaklaĢım eğer k-öğe kümesi minimum destek metriğini sağlıyorsa bu kümenin alt kümelerinin de minimum destek metriğini sağladığıdır [1]. 42 4. VERĠ MADENCĠLĠĞĠ YAZILIMLARI 4.1. Analysis Manager Analysis Manager Microsoft firmasının VM için üretmiĢ olduğu ürünüdür [52]. Kümeleme analizi ve karar ağaçları için hazırlanmıĢtır. Analysis Manager OLAP (çevrim içi analitik iĢlem) küp desteği sunmaktadır. Analysis Manager‟ın güçlü olduğu taraf kullanıcı-dostu (user friendly) bir ara yüze sahip olması ve uygulama kolaylığıdır. Aracın SQL SERVER 2000‟le bütünleĢik çalıĢabilmesi bu aracı etkin hale getirmektedir. Analysis Manager‟ın bir VM sorgusu için farklı algoritmaları desteklememesi en büyük eksikliğidir. Kaynak kodun açık olmaması uygulama geliĢtiriciler için büyük zorluklar oluĢturmaktadır. Kaynak kod yerine Microsoft kümeleme ve karar ağacı için COM1 desteği sunsa da bu destek bir çok gömülü sistem uygulamalarında geliĢtiriciler için eksik bir hizmet olarak görülmektedir. Analysis Manager üretilen sonuçları farklı bir çok gösterim Ģekliyle kullanıcıya sunabilmektedir. Mesela karar ağaçları için karar ağacını gösterebildiği gibi sonuçları kural tabloları Ģeklinde yorumlama imkanı vermektedir. 4.2. Darwin Darwin Oracle firmasının VM aracıdır [53]. Darwin regresyon ağaçları, karar ağaçları, kümeleme, yapay sinir ağları, Bayesian öğrenme, k-yakınlığında komĢuluk gibi birçok algoritmayı destekleyen bir VM aracıdır. Paralel sunucular için geliĢtirilmiĢ bir VM sistemidir. Darwin kullanımı kolay bir ara yüze sahiptir. Darwin VM algoritmalarından CART, StarTree, StarNet ve StarMatch‟i kullanır. 4.3. Clementine Clementine SPSS firmasının VM için geliĢtirmiĢ olduğu bir modüldür (ref:Integrated Solutions). SPSS istatistiksel bir araçtır. Clementine‟nin SPSS 43 içinde bir modül olarak kullanılması kullanıcıların SPSS‟in istatistiksel fonksiyonlarından faydalanmasına imkan verir. Yapay sinir ağları ve kural tümevarım yöntemlerini kullanır. Clementine müĢteri hizmetleri yönetimi, kimya sektöründe maddelerin aĢındırıcılık tahmininde ve bankacılık alanında kredi kartı dolandırıcılıkları gibi konularda kendine uygulama alanı bulmuĢtur. 4.4. DBMiner Kanada Simon Fraser Üniversitesi tarafından geliĢtirilen bir sistemdir [54]. DBMiner sınıflama, kümeleme, eĢleĢtirme ve sıra örüntüleri sorgularını yapabilecek VM algoritmalarını kullanır. DBMiner çevrimiçi analitik iĢleme özelliğiyle VM algoritmalarının bütünleĢik çalıĢabilme özelliği sayesinde ön plana çıkmaktadır. Bu özellik OLAM (Online Analytical Mining) olarak anılır. DBMiner OLAP ve VM yöntemlerini dinamik bir Ģekilde seçebilme imkânına sahiptir. Kullanıcının kolay kullanabileceği bir ara yüze sahiptir. Bu ara yüz sayesinde elde edilen sonuçlar çok yönlü bir soyutlama kullanılarak gösterilebilmektedir. DBMiner‟ın diğer sistemlere göre en büyük avantajı geliĢtirilen DMQL‟i (data mining query language) kullanmasıdır. DMQL SQL benzeri bir VM sorgu dilidir. DMQL sayesinde çevrimiçi sorgular OLAM veya OLAP modülüne yönlendirilerek iĢlenir. DBMiner‟ın VT ara yüzü çok boyutlu veri tabanına temizlenmiĢ, filtrelenmiĢ ve bütünleĢtirilmiĢ verileri aktarmaya yarar. Veri aktarımı için ODBC ve OLE DB(Object Linking and Embedding Database) gibi bağlantılar da kullanılabilmektedir. OLAP ve OLAM modülleri arasındaki iliĢkinin varlığı iki modülün birbirlerinin sonuçlarını kullanılabilmesine imkân tanır. 44 DBMiner ürettiği sonuçları farklı birçok Ģekilde gösterebilme imkanına sahiptir. Mesela karar ağaçları için karar ağacı Ģeklinde, kural tabloları Ģeklinde; eĢleĢtirme sorgusu için kural tablosu ve grafikleri üretebilmektedir. DBMiner ne kadar genel amaçlı bir sistemse de DBMiner‟ı kullanarak ortaya çıkarılan özel amaçlı sistemler de mevcuttur. Bunlar arasında MultiMediaMiner, GeoMiner ve WeblogMiner sayılabilir. 4.5. Data Logic/R DataLogic/R kümeleme ve sınıflama analizi için kullanılan ticari bir veri madenciliği aracıdır [37]. DataLogic/R artık nitelik ve verilerin temizlenmesi iĢlemlerini yapabilmektedir. Sistemin en güçlü olduğu taraf, üretilen kuralların öğrenme-test geçerliliği ve güvenlik gibi kriterlerde değerler üretmesidir. Bu değerler üretilen kuralların kalitesini belirlemek için kullanılabilmektedir. Bu araç, kimya ve ticaret sektöründeki çeĢitli uygulamalarda kullanılmaktadır. 4.6. INLEN ĠliĢkisel veritabanından aldığı verileri makine öğrenimi teknikleriyle iĢledikten sonra ortaya çıkan sonuçları veritabanına yazmaktadır. Üretilen bilgi kesimi basit ya da bileĢik olabilmektedir. INLEN aracında dört iĢleç vardır: 1. VT yönetim işleci: VT sorgularını yazmak için geliĢtirilen bir iĢleçtir. 2. Bilgi yönetim işleci: Üretilen bilgiyi yönetmek için kullanılır. 3. Bilgi üretim işleci: VT‟ den bilgi almak ve makine öğrenimi algoritmalarını çağırmak için kullanılır. 4. Makrolar: INLEN iĢleçlerini bir sırada tanımlamayı ve tek bir iĢleç gibi kullanabilmeyi sağlar. 45 4.7. KDW (Knowledge Discowery Workbench) KDW kümeleme, sınıflama, bağımlılık analizi algoritmalarını kullanan bir araçtır [56]. EtkileĢimli veri analizine imkân vermektedir. INLEN sistemiyle birçok ortak özelliği bulunmaktadır. 4.8. SKICAT (Sky Image Classification & Archiving Tool) Özel amaçlı bir VM sistemidir. ÖzelleĢtiği konu astronomidir [5]. Bu araç astronomik verileri indirgemek ve karar ağacı analizi için ID3, GID3, O-Btree algoritmalarını kullanmaktadır. Görüntü iĢleme, veri sınıflama ve VTYS metotlarını kullanır. SKICAT adından da anlaĢılabileceği gibi gökyüzü fotoğraflarındaki gök cisimlerini tanımlamak, bunları sınıflandırmak, kataloglamak için kullanılan bir araçtır. Sayısal gökyüzü fotoğraflarındaki gök cisimlerinin parlaklık, alan, çekirdek büyüklüğü gibi özelliklerini kullanarak sınıflandırma sorgusunu gerçekleĢtirmektedir. SKICAT‟ ın deneysel testlerle fotoğraftan cisimleri tanıma ve sınıflandırma performansı %94 olarak saptanmıĢtır. 4.9. R-MINI R-MINI [57], SKICAT gibi özel amaçlı bir VM sistemidir. Finansal konularda özelleĢen R-MINI sınıflama ve sapma tespiti yapmak için kullanılır. R-MINI VT‟ den çektiği gürültü içerikli verileri kullanarak tamlık ve tutarlılık kriterlerini sağlayan en küçük kural kümesini bulur. 46 4.10. TASA (Telecommunication Network Alarm Sequence Analyzer) TASA, telekomünikasyonda kullanılan özel amaçlı bir VM sistemidir. Telekomünikasyon hatlarında oluĢabilecek bir hatanın önceden tahmini için kullanılır. Zaman serileri arası bağımlılıklarda kullanılan VM algoritmaları, hata tahmini için kullanılmaktadır. Hatlarda olağandıĢı bir olay meydana geldiğinde bu sistem tetiklenir. Tetikleme sayısının, kontrol edilebilecek sayının çok üzerinde olması böyle bir sisteme ihtiyaç doğurur. 4.11. GCLUTO (Graphical Clustering Toolkit) GCLUTO Minnesota Üniversitesi tarafından gerçekleĢtirilmiĢ bir araçtır [58]. Bu araç kümeleme algoritmaları için geliĢtirilmiĢtir. Girdi kütüğünden aldığı verileri istenen kümeleme algoritmasına göre iĢleyip sonuçları çıktı kütüğüne yazmaktadır. Kolay kullanılabilir arayüze sahip olması ve görüntüleme problemlerinin iyi çözülmüĢ olması, üretilen sonuçların farklı gösterimleri ile GCLUTO kümeleme analizi için güçlü bir araçtır. 4.12. Enterprise Miner SAS firmasının VM aracıdır. Enterprise Miner karar ağaçları, yapay sinir ağları, regresyon analizi, 2-aĢama modelleri (two-stage models), kümeleme, zaman serileri, iliĢkilendirme, vb. VM sorgularını ele alabilmektedir. Grafiksel arayüzü sayesinde kullanım kolaylığı sağlar ve kullanıcılar uygulamanın karmaĢıklığından habersiz bir Ģekilde sadece girdi ve çıktılara yoğunlaĢabilirler. Ġstemci bilgisayardaki yazılım gereksinimi Windows 98, 2000 ve NT‟dir. Sunucu bilgisayardaki yazılım gereksinimi Windows 98, 2000 ve NT ile Linux‟dür. 47 4.13. Weka Weka, Yeni Zelanda‟daki Waikato Üniversitesi tarafından geliĢtirilmiĢ olup “Waikato Environment for Knowledge Analysis” kelimelerinin baĢ harflernin kısaltmasıdır. Ayrıca Weka, Yeni Zelenda‟daki uçamayan bir kuĢ cinsinin de ismidir [10]. Weka baĢta Yeni Zelanda‟da tarımsal verinin iĢlenmesi amacıyla geliĢtirilmiĢtir. Bununla birlikte sahip olduğu öğrenen makine metodları ve veri mühendisliği kabiliyeti öyle hızlı ve köklü bir Ģekilde geliĢmiĢtir ki, Ģimdi veri madenciliği uygulamalarının tüm formlarında yaygın olarak kullanılmaktadır [11]. Weka, bir öğrenen makineler algoritmaları koleksiyonu olduğu gibi yeni algoritmaların geliĢtirilmesi için de çok uygundur. GNU (General Public License) altında yayınlanmıĢ, Java dilinde kodlanmıĢ, açık kaynaklı bir yazılımdır [59]. Ayrıca WEKA, Windows, Linux ve Masintosh gibi farklı iĢletim sistemleri üzerinde çalıĢabilen bir programdır [10]. Weka Grafiksel Kullanıcı Arayüzü (Bkz. Resim 4.1), WEKA‟nın grafiksel çevresine eriĢim için kullanılmaktadır. Resim 4.1. WEKA grafiksel kullanıcı arayüzü 48 Pencerede dört adet seçenek bulunmaktadır: Explorer: Verinin WEKA ile keĢfi için bir arayüzdür. Experimenter: Deneylerin gerçekleĢtirilmesi ve öğrenme planları arasındaki istatistiksel testleri yürüten bir arayüzdür. Bir veri setine farklı teknikleri uygulayarak yada aynı tekniği farklı parametrelerle tekrarlayarak, tek seferde birden fazla deneyin gerçekleĢtirilmesine izin veren bir araçtır. Knowledge Flow: Weka veri madenciliği paketi ile sağlanan fonksiyonerliğin alternatif bir arayüzüdür. Bu arayüz temel olarak Explorer ile aynı iĢlevleri sürükle-bırak arayüzü ile yerine getirmektedir. Experimenter tarafından desteklenmeyen ek özellikleri ve experimenter de bulunan bazı eksik özellikleri ile geliĢmekte olan bir bölümdür. Simple CLI: WEKA komutlarının direkt olarak iĢlenmesine olanak sağlayan basit bir komut satırı arayüzü sağlar. 49 5. YATIRIM FONU VE VERĠ MADENCĠLĠĞĠ UYGULAMALARI 5.1. Yatırım Fonu Nedir? Yatırımcıların küçük ya da büyük her türlü birikiminin, profesyonel yöneticiler tarafından çeĢitli sermaye piyasası araçlarına dağıtılarak yönetildiği mal varlığıdır. Hazine bonosu, devlet tahvili, repo, hisse senedi ve diğer sermaye piyasası araçlarından oluĢturulan fon portföyleri, fon iç tüzüklerine uygun olarak profesyonel fon yöneticileri tarafından yönetilirler [47]. Yatırım fonlarının portföylerinin yönetimi, Sermaye Piyasası Mevzuatı gereği aracı kurum ve portföy yönetim Ģirketleri tarafından yapılmak zorundadır. [48] Yatırım fonları Sermaye Piyasası Kurulu ve Bağımsız dıĢ denetim firmalarınca düzenli olarak denetlenmektedir. Yatırım fonu satın almak isteyen kiĢiler, fon satıĢı yapan kurumlardan katılım belgesi satın alarak fona iĢtirak ederler. Birikimlerini profesyonel olarak yönetemeyen kiĢilerin, profesyonel olarak yönetilen yatırım fonlarından satın almaları, hem yönetim anlamında riskin ortadan kaldırılması hem de pek çok farklı seçenek ile yatırımlarının değerlendirilmesi Ģansına sahip olurlar. Yatırım fonları, A ve B tipi olmak üzere ikiye ayrılır. A tipi fon portföylerinin aylık ortalama bazda en az % 25‟i Türk Ģirketlerinin hisse senetlerinden oluĢmaktadır. B tipi fonlar için böyle bir portföy sınırlaması yoktur. B tipi fon portföyleri büyük ölçüde devlet tahvili, hazine bonosu ve ters repo ağırlıklı olmak üzere menkul kıymetlerden oluĢmaktadır. 50 5.2. Yatırım Fonu Fiyatının Hesaplanması Fona iĢtiraki sağlayan katılma belgesinin fiyatı fon kurucusu tarafından her iĢgünü itibariyle hesaplanmak ve izleyen gün müĢterilere yapılan alıĢ satıĢlarda bu fiyat uygulanmaktadır. Fon portföyünde bulunan varlıkların iĢlem gördükleri, alınıp satıldıkları borsalarda oluĢan fiyatlar dikkate alınarak fon portföy değeri hesaplanmakta ve fon toplam değeri, değerleme gününde tedavülde olan pay sayısına bölünerek birim katılma belgesi fiyatına (fon fiyatına) ulaĢılmaktadır [47]. Bu iĢlemlerin yapılması esnasında fonun portföyünde bulunan varlıklardan elde edilen faiz, temettü, alım satım kazancı ve günlük değer artıĢları aynı gün fona gelir olarak kaydedilmekte dolayısıyla katılma belgelerinin her gün için hesaplanan pay fiyatına yansıtılmaktadır. Bu surette belirli bir tarihte fondan ayrılan yatırımcı o güne kadar fonun kazancından (zararından) kendi payına düĢen miktarı almıĢ olmaktadır [48]. 5.3. Yatırım Fonunun Sağladığı Avantajlar Yatırım fonu katılımcıları, fona katıldıkları tasarruf ile fonun sermayesine katılmıĢ olmaktadırlar. Fonların profesyonel yöneticiler tarafından çeĢitli enstrümanlara yatırım yapılarak yönetilmesi ile fon katılımcıları yönetim riskini profesyonel yöneticilere devretmiĢ yani yönetim riskini minimum düzeye indirmiĢ olmaktadırlar. Yatırım Fonlarının içerisinde yer alan tüm menkul kıymetler Takasbank A.ġ.‟ deki hesaplarında saklanmaktadır. Yatırım fonlarının tüm iĢlemlerinin ĠMKB piyasalarında gerçekleĢtirilmesi zorunlu olduğundan yatırım fonları en güvenilir araçlardan birisi olarak kabul edilmektedir [48]. 51 Yatırım fonu portföyüne alınabilecek menkul kıymetlerin sabit getirili, dövize endeksli ve hisse senedi gibi araçlarla çeĢitlenmesi nedeniyle riskin en aza indirilmesi mümkün olabilmektedir. Menkul kıymetlerin değerlemesi ve kontrolü ile kupon, faiz ve temettü tahsili fon yönetimince yapıldığından fon katılımcısının vade takibi, tahsil etme gibi zaman ve kaynak kullanımını gerektiren iĢlemleri fon yönetimine devretmiĢ olmakta, zaman ve kaynak kullanımı ayırma gereksinimi ortadan kalkmaktadır. Yatırım fonuna katılım için minimum satın alma miktarı gibi bir gereklilik olmadığı için küçük tasarruflar ile büyük tasarrufların ulaĢabileceği potansiyel yüksek kazanç getirilerine ve büyük yatırımcıların sahip olduğu fiyat avantajı ile yatırım yapılmasına olanak sağlamaktadır. Fon portföyündeki değer artıĢlarının portföy değerine günlük olarak yansıtılması nedeniyle iĢlemiĢ olan gelir ile birlikte gerek ihtiyaç kadar gerekse tamamının istendiği anda ya da en fazla 3 gün içerisinde (fon türüne bağlı olarak değiĢmektedir) paraya çevrilmesi mümkündür. Piyasadaki bazı yatırım fonları, katılma belgesi üzerinden çek yazabilme imkânı da sağlamaktadır. Ayrıca yatırım fonlarının bireysel ve kurumsal yatırımcılar için çeĢitli vergi avantajları vardır. 5.4. Yatırım Fonu ve MüĢteri Kaybetme Üzerine Veri Madenciliği ÇalıĢmaları Günümüzde, iĢletmelerin karlılıklarını ve varlıklarını koruyabilmeleri müĢteri odaklı olmalarına ve müĢterileriyle uzun dönemli iliĢki kurmalarına bağlı hale gelmiĢtir. 1990‟lı küreselleĢme yıllardan sürecinin itibaren getirdiği geleneksel değiĢiklikler, pazarlama tüketicinin anlayıĢı, daha fazla 52 bilinçlenmesi ve teknolojik yenilikler gibi nedenlerle yerini modern pazarlama anlayıĢına bırakmıĢ, müĢterinin elde tutulması yani rakiplere kaptırılmaması için yapılması gereken faaliyetler artmıĢtır. Veri madenciliği pazarlama, finans, bankacılık, imalat, sağlık, müĢteri iliĢkileri yönetimi ve organizasyon öğrenmede sıklıkla uygulanmaktadır. MüĢteri kaybetme ve müĢterinin elde tutulması konusu üzerine de çeĢitli çalıĢmalar yapılmıĢtır. Kızılkaya Aydoğan, Gencer ve Akbulut (2008) [40], bir kozmetik firmasından ayrılma eğilimi gösteren müĢteri kesitinin belirlenmesi ve benzer özellikler gösteren müĢterilerin programlarının gruplandırılarak geliĢtirilmesini gruplara amaçlayan bir özel, çalıĢma pazarlama yapmıĢlardır. ÇalıĢmada, gruplama için kümeleme teknikleri, ayrılacak müĢteri kesitini belirlemek için sınıflama teknikleri kullanılmıĢtır. Ahn, Han ve Lee (2006) [41], Kore mobil telekomünikasyon endüstrisinde, müĢterilerin fatura ve iĢlem hareket bilgileri kullanılarak hizmet pazarında müĢteri kaybının nedenlerini belirlemeyi amaçlayan bir çalıĢma yapmıĢlardır. ÇalıĢmaya göre, çağrı kalitesi müĢterinin kaybedilme ihtimalini etkilediği fakat üyelik kartına sahip müĢterilerin kaybedilme ihtimalini daha çok olduğu ortaya çıkarılmıĢtır. Ayrıca çalıĢmaya göre sık kullanıcı müĢterilerin de kaybedilme ihtimalleri yüksektir. Masand, Datta, Mani ve Li (1999) [42], GTE Wireless firmasında, cep telefonu kullanan müĢterilerin davranıĢlarını geniĢ bir ölçekte modelleyen otomatikleĢmiĢ bir sistem geliĢtirmiĢlerdir. Bu sistem cep telefonu kullanan müĢterilerin tarihsel verilerini kullanarak birçok coğrafi bölge için müĢteri kaybı faktörlerini tanımlamakta ve modelleri yakın gelecekte hangi müĢterilerin kaybedileceğini belirleyebilecek Ģekilde güncellemektedir. Model 100 farklı cep telefonu ve 5 milyon müĢteri için müĢteri kaybedilme skoru 53 geliĢtirme kapasitesine sahiptir. ÇalıĢmada karar ağaçları ve yapay sinir ağları algoritmaları kullanılmıĢtır. Ruta, Nauck ve Azvine (2006) [43], telekom sektöründe yüksek kurulum ve pazarlama maliyetinden dolayı yeni bir müĢteri elde etmenin eldeki bir müĢteriyi tutmaktan 6 ila 10 kat arasında daha paha olduğu ve bu nedenle müĢteri kaybetmeye yol açan kriterleri irdelemek gerektiği amacı ile literatürde mevcut karar ağaçları algoritmalarına rakip geçici dizi füzyon tekniği ile birlikte yeni bir k-ortalama algoritması önerilmiĢtir. ÖnerilmiĢ metot, karar ağaçlarının müĢterinin kaybedilip kaybedilmeyeceği sınıflandırmasının yanında müĢterinin kaybedilme zamanını da göz önüne aldığı ve karar ağaçları algoritmalarından daha kesin sonuçlar verdiği belirlenmiĢtir. Huang, Kechadi ve Buckley (2009) [44], literatürde telekomünikasyon sektöründe çağrı merkezi verileri ile müĢteri kaybı tahmin yöntemlerinin yaygın olarak uygulandığı fakat broadband internet servisleri verileri ile tatmin edici çalıĢmanın mevcut olmadığı, broadband kullanımı, tuĢlama tipleri, dialup harcaması, hat bilgisi, fatura ve ödeme bilgisi, hesap bilgisi verileri ile müĢteri kaybı tahminleri için model oluĢturulabileceği fikri ile çalıĢma yapmıĢlardır. Bu çalıĢmada dört modelleme tekniğinden, Lojistik regresyon, karar ağaçları, yapay sinir ağları ve SVM yararlanılmıĢ, yeni özelliklerin geliĢimi ve tahmin edicilerin karĢılaĢtırmalı bir analizi broadband müĢteri kaybı tahminleri için yapılmıĢtır. Deneysel sonuçlar broadband servis alanında müĢteri kaybı tahminleri için bu dört modelleme tekniğiyle yeni özelliklerin etkin olduğunu göstermektedir. Gopal ve Meher (2008) [45], telekomünikasyon sektöründe müĢteri iliĢkileri yönetiminde, müĢteri kaybı konusu ana konulardan biri olarak düĢünülmektedir. Bu görüĢle çalıĢmada, müĢteri kaybının zamanı ve müĢteriyi elde tutma süresini tahmin edecek ordinal regresyon yöntemi irdelenmiĢtir. Ordinal regresyon modeli müĢteri kaybının modellenmesi konusunda ilk kez bu çalıĢmada kullanılmıĢtır. 54 Farquad, Ravi ve Raju (2009) [46], banka kredi kartı müĢteri kayıp oranlarını tahmin etmek üzere Support Vector Machine ve Naive Bayes yöntemlerinin bir arada kullanan hibrit bir yöntem önermektedirler. ÇalıĢmada %6.89‟unun kaybedilmiĢ müĢterilerden oluĢan bir veri seti kullanılmıĢtır. %68.52 oranla doğru sınıflandırılan kurallar elde edilmiĢtir. 55 6. Banka Yatırım Fonu MüĢteri Hareketlerinin Belirlenmesine Yönelik Bir Veri Madenciliği Uygulaması Bu çalıĢma kapsamında, Türkiye‟de faaliyet gösteren bir bankanın yatırım fonları veritabanından yararlanılmıĢtır. Banka yatırım fonu veritabanındaki müĢterilerin sosyo-demografik verileri ile Temmuz 2009 – Ocak 2010 dönemi yatırım fonu alıĢ satıĢ iĢlem talimat verileri kullanılmıĢtır. Banka yatırım fonu veritabanındaki müĢterilerin sosyo-demografik verileri içerisinden kullanılan değiĢkenler Ģunlardır; Müşteri Numarası: MüĢteriye ait özel bir numaradır ve veritabanında her bir müĢteriye ait tek bir müĢteri numarası bulunmaktadır. Cinsiyet: MüĢterinin cinsiyeti. Yaş: MüĢterinin yaĢı. Medeni Durum: MüĢterinin medeni durumu. Öğrenim Durumu: MüĢterinin öğrenim durumu. Yaşadığı İl: MüĢterinin yaĢadığı il. Oturduğu Ev: MüĢterinin oturduğu evin kime ait olduğu bilgisi. En Son İş Yerinde Çalışma Yılı: MüĢterinin en son çalıĢtığı iĢ yerinde çalıĢma yılı. Aylık Net Geliri: MüĢterinin aylık net geliri. Çalışma Şekli: MüĢterinin çalıĢma Ģekli. Mesleği: MüĢterinin mesleği. Eşi Çalışıyor Mu?: MüĢterinin eĢinin çalıĢıp çalıĢmadığı bilgisi. Otomobili Var Mı?: MüĢterinin arabasının olup olmadığı bilgisi. Anapara: MüĢterinin Temmuz 2009 ayı itibari ile toplam yatırım fonu miktarı. Aktif / Pasif: MüĢterinin Temmuz 2009 – ġubat 2010 tarihleri arasında yatırım hesabını pasif hale getirip getirmediği bilgisi. Pasif Tarihi: MüĢterinin hangi ay hesabını pasif hale getirdiği. 56 Banka yatırım fonu veritabanındaki müĢterilerin yatırım fonu alıĢ satıĢ iĢlem talimat verileri içerisinden kullanılan değiĢkenler Ģunlardır; Müşteri Numarası: Talimatı veren müĢterinin numarası. İşlem Tarihi: Talimatın gerçekleĢtiği tarih. İşlem Cinsi: Talimatı verilen iĢlemin cinsi. Miktar: Talimat miktarı. 6.1. Problemin Tanımlanması ve Amacın Belirlenmesi Artan rekabet koĢulları ve bankacılık sektöründe yeni aktörlerin piyasaya çıkmasının ardından bankaların müĢterilerini elde tutma ve onlardan maksimum düzeyde faydalanma çabası hız kazanmıĢtır. Banka için yeni müĢteri bulma çabası ve bu çaba için harcanan tanıtım, reklam ve promosyon maliyetleri ise gün geçtikçe artmaktadır. Bunun sonucu olarak mevcut müĢterinin kaybedilmesinin yeni bir müĢteri kazanma ile telafi edilebileceği düĢünülse de mevcut müĢteriyi kaybetmemek için yapılacak faaliyetlerin yeni müĢteri bulmak için yapılacak faaliyetlere oranla daha az maliyetli olduğu bilinmektedir. Tez kapsamında ülkemizde faaliyet gösteren bir bankanın yatırım fonlarını kullanan fakat belli iĢlem geçmiĢinden sonra yatırım hesabını kapatarak banka müĢterisi olmaktan çıkan (kaybedilen) müĢterilerin hangi iĢlem geçmiĢinden sonra kaybedildiği ve kaybedilen müĢterilerin sosyo-demografik özelliklerinin ne olduğunun belirlenmesi amaçlanmıĢtır. Belirlenen iĢlem geçmiĢi ve sosyo-demografik bilgiler ile kaybedilmeye meyilli müĢterilerin tespit edilmesi ve müĢterinin kaybedilmemesi için yapılması gerekli faaliyetlerin neler olduğu belirlenecektir. 57 6.2. Verilerin Toplanması ve Hazırlanması Veri madenciliği sürecinin en zaman alıcı adımlarından birisi veri temizleme ve ön iĢleme sürecidir. Tez kapsamında kullanılacak verilere karar verildikten sonra elde edilen veri üzerinde temizleme ve hazırlama süreci üzerinde durulmuĢtur. 6.2.1. Veri temizleme Veri temizleme sürecinde bilindiği gibi eksik, hatalı ya da boĢ verilerin ayıklanması gerekmektedir. Bu aĢamada veritabanında bulunan sosyodemografik verilerden hatalı veya eksik verilere sahip müĢteriler çıkarılmıĢtır. Hatalı veya eksik verilere sahip müĢterilerin çıkartılması ile çalıĢılacak tüm değiĢkenlere sahip müĢteriler seçilmiĢ, bu müĢterilerin yatırım fonu alıĢ satıĢ iĢlemi için vermiĢ oldukları talimat verileri kullanılmıĢtır. Yatırım fonu alıĢ satıĢ iĢlem talimat verileri ana bankacılık sistemi üzerinde düzgün tutulduğundan bu veriler için ayıklama yapılmamıĢtır. Hatalı veya eksik verilere sahip müĢterilerin çıkartılması ile veritabanından çekilen yaklaĢık 87 000 müĢteriden sadece 65 525 tanesi kullanılmıĢtır. Bu 65 525 müĢteriye ait yaklaĢık 4 000 000 yatırım fonu alıĢ satıĢ iĢlem talimat verileri kullanılmıĢtır. 6.2.2. Veri ön iĢleme Veri ön iĢleme sürecinde, seçilen veri madenciliği modelline göre kullanılacak verilerin hazırlanması gerekmektedir. Bu aĢamada veri ön iĢlemesi gerekli değiĢkenler belirlenmiĢ, gerekli ön iĢleme iĢlemleri gerçekleĢtirilmiĢtir. 58 Sosyo-demografik verilerin ön iĢlemesi Müşteri Numarası: Banka müĢteri bilgileri gizliliği prensibinin korunması amacıyla, veritabanından çekilen müĢteri numaraları nümerik hale getirilmiĢtir. Böylelikle çalıĢmada kullanılan müĢteri bilgilerinin hangi müĢteriye ait olduğunun bilinmesinin önüne geçilmiĢtir. MüĢteri numarası 1‟den baĢlatılmıĢ, sırası ile bir arttırılarak her bir müĢteriye verilmiĢtir. MüĢteri numarası değiĢkeni çalıĢmada nümerik değiĢken olarak kullanılmıĢtır. Cinsiyet: MüĢterinin cinsiyet bilgisi veri tabanından “Bay” ve “Bayan” olarak çekilmiĢtir. ÇalıĢmanın hızının arttırılması için bu veriler “Bay” olanlar için “1”, “Bayan” olanlar için ise “2” ile değiĢtirilmiĢtir. Cinsiyet değiĢkeni çalıĢmada kategorik değiĢken olarak kullanılmıĢtır. Yaş: MüĢterinin yaĢ bilgisi elde edilmek için veri tabanından müĢterinin doğum tarihi bilgisi çekilmiĢ, doğum tarihleri kullanılarak müĢterinin yaĢı belirlenmiĢ ve belirlenen yaĢlar anlamlı gruplarda kategorize edilmiĢtir. YaĢı “< 20” olan müĢteriler için “1”, “21 - 30” olan müĢteriler için “2”, “31 - 40” olan müĢteriler için “3”, “41 - 50” olan müĢteriler için “4”, “51 - 60” olan müĢteriler için “5” ve “60 >” olan müĢteriler için ise “6” değeri kullanılmıĢtır. 59 YaĢ değiĢkeni çalıĢmada kategorik değiĢken olarak kullanılmıĢtır. Medeni Durum: MüĢterinin medeni durumu bilgisi veri tabanından “Evli” ve “Bekâr” olarak çekilmiĢtir. ÇalıĢmanın hızının arttırılması için bu veriler “Evli” olanlar için “1”, “Bekâr” olanlar için ise “2” ile değiĢtirilmiĢtir. Medeni durum değiĢkeni çalıĢmada kategorik değiĢken olarak kullanılmıĢtır. Öğrenim Durumu: MüĢterinin öğrenim durumu bilgisi veri tabanından “Ġlk”, “Orta”, “Ġlköğretim”, “Lise”, “Yüksek Okul”, “Üniversite”, “Lisans Üstü” ve “Doktora” olarak çekilmiĢtir. ÇalıĢmanın hızının arttırılması için bu veriler “Ġlk” olanlar için “1”, “Orta” olanlar için “2”, “Ġlköğretim” olanlar için “3”, “Lise” olanlar için “4”, “Yüksek Okul” olanlar için “5”, “Üniversite” olanlar için “6”, “Lisans Üstü” olanlar için “7” ve “Doktora” olanlar için ise “8” ile değiĢtirilmiĢtir. Öğrenim durumu değiĢkeni çalıĢmada kategorik değiĢken olarak kullanılmıĢtır. Yaşadığı İl: MüĢterinin yaĢadığı il bilgisi veri tabanından il kodu ile çekilmiĢtir. Ġl kodlarını kategorik hale getirmek ve müĢterinin yaĢadığı ilin geliĢmiĢlik değerini de çalıĢmaya katabilmek için kiĢi baĢına düĢen Gayri Safi Yurtiçi Hâsıla1 verileri ile kümeleme çalıĢması yapılmıĢtır. 1 İllere göre kişi başına düşen Gayri Safi Yurtiçi Hasıla verileri TÜİK web sayfasından alınmıştır [39]. 60 Banka Yatırım Fonları uzmanlarının görüĢleri bu değiĢkenin en fazla 5 kategorik değer ile ifade edilmesi gerektiğidir. Bu süreçte Banka Yatırım Fonları uzman görüĢleri de dikkate alınarak kümelemede yaygın olarak kullanılan k-ortalama algoritması kullanılmıĢtır. K-ortalama algoritmasının “YaĢadığı Ġl” değiĢkenine uygulanması K-ortalama algoritması küme sayısı 2‟den 6‟ya kadar WEKA‟ da uygulanmıĢ ve Çizelge 6.1‟ deki hata kareleri elde edilmiĢtir. Çizelge 6.1. K-ortalama algoritması azalıĢ yüzde değerleri hata kareleri toplamı Küme Sayısı Hata Kareleri Toplamı 2 3 4 5 6 0,2569136 0,2568828 0,2568727 0,2568678 0,2568654 Tablo incelendiğinde hata kareleri toplamının sürekli düĢtüğü görülmektedir. Banka Yatırım Fonları uzmanlarının görüĢleri bu değiĢkenin en fazla 5 kategorik değer ile ifade edilmesi gerektiği yönünde olduğu için küme sayısı 5 olarak belirlenmiĢtir. Belirlenen küme sayısı ve küme aralık değerlerine göre müĢterilerin yaĢadığı iller ve verilen kategorik değerler Çizelge 6.2‟ de verilmiĢtir. YaĢadığı il değiĢkeni çalıĢmada kategorik değiĢken olarak kullanılmıĢtır. Oturduğu Ev: MüĢterinin oturduğu ev bilgisi veri tabanından “Kendi Evi”, “Kira”, “Lojman” ve “Aile Fertlerinden Birine Ait” olarak çekilmiĢtir. ÇalıĢmanın hızının arttırılması için bu veriler “Kendi Evi” olanlar için “1”, “Kira” olanlar için “2”, “Lojman” 61 olanlar için “3” ve “Aile Fertlerinden Birine Ait” olanlar için ise “4” ile değiĢtirilmiĢtir. Oturduğu ev değiĢkeni çalıĢmada kategorik değiĢken olarak kullanılmıĢtır. Çizelge 6.2. MüĢterilerin yaĢadığı iller ve verilen kategorik değerler ġehirler Kırklareli, Yalova, Muğla, Ġzmir, Ġstanbul, Zonguldak, Ankara, Kırıkkale, Bilecik, EskiĢehir, Bursa, Tekirdağ, Manisa, Ġçel, Edirne Çanakkale, Antalya, Artvin, Denizli, NevĢehir, Sakarya, Aydın, Karaman, Balıkesir, Burdur, Rize, Kilis Kayseri Kütahya Kastamonu Niğde Hatay Elazığ Samsun Çorum Gaziantep Karabük K.MaraĢ Tunceli Konya Isparta Trabzon KırĢehir Sinop Giresun Amasya UĢak Malatya Sivas Diyarbakır Afyon Batman Erzincan Osmaniye Düzce Çankırı Siirt GümüĢhane Ordu Erzurum Bartın Bayburt ġanlıurfa Mardin Aksaray Adıyaman Kars Van Iğdır Yozgat Ardahan Hakkâri Bingöl Bitlis ġırnak MuĢ Ağrı Tokat Kocaeli, Bolu KiĢi BaĢı GSYH Aralığı Kategorik Değer 2339 - 4214 TL 1 1817 - 2338 TL 2 920 - 1816 TL 3 ∞ - 919 TL 4 4215 - ∞ TL 5 En Son İş Yerinde Çalışma Yılı: MüĢterinin en son iĢ yerinde çalıĢma yılı bilgisi veri tabanından nümerik olarak çekilmiĢ, çekilen nümerik bilgiler anlamlı gruplarda kategorize edilmiĢtir. En son iĢ yerinde çalıĢma yılı “< 1” olan müĢteriler için “1”, “2 - 5” olan müĢteriler için “2”, “6 - 10” olan müĢteriler için “3”, “11 >” olan müĢteriler için ise “4” değeri kullanılmıĢtır. En son iĢ yerinde çalıĢma yılı değiĢkeni çalıĢmada kategorik değiĢken olarak kullanılmıĢtır. 62 Aylık Net Geliri: MüĢterinin aylık net geliri bilgisi veri tabanından “< 1000 TL”, “1001 – 1500 TL”, “1501 - 2500 TL”, “2501 - 4000 TL” ve “4001 TL >” olarak çekilmiĢtir. ÇalıĢmanın hızının arttırılması için bu veriler “< 1000 TL” olanlar için “1”, “1001 - 1500 TL” olanlar için “2”, “1501 - 2500 TL” olanlar için “3”, “2501 4000 TL” olanlar için “4” ve “4001 TL >” olanlar için ise “5” ile değiĢtirilmiĢtir. Aylık net gelir değiĢkeni çalıĢmada kategorik değiĢken olarak kullanılmıĢtır. Çalışma Şekli: MüĢterinin çalıĢma Ģekli bilgisi veri tabanından “Kamu”, “Özel Sektör”, “Serbest Meslek”, “Yan Gelir Sahibi”, “Emekli”, “Öğrenci”, “Ev Hanımı” ve “ÇalıĢmıyor” olarak çekilmiĢtir. ÇalıĢmanın hızının arttırılması için bu veriler “Kamu” olanlar için “1”, “Özel Sektör” olanlar için “2”, “Serbest Meslek” olanlar için “3”, “Yan Gelir Sahibi” olanlar için “4”, “Emekli” olanlar için “5”, “Öğrenci” olanlar için “6”, “Ev Hanımı” olanlar için “7” ve “ÇalıĢmıyor” olanlar için ise “8” ile değiĢtirilmiĢtir. ÇalıĢma Ģekli değiĢkeni çalıĢmada kategorik değiĢken olarak kullanılmıĢtır. Mesleği: MüĢterinin mesleği bilgisi veri tabanından “Akademisyen”, “Asker”, “Avukat”, “Bakan, Milletvekili, Bürokrat”, “Bankacı”, “Boyacı, Elektrikçi, Tesisatçı, Tamirci, Marangoz”, “Çiftçi, Besici, Ormancı, Balıkçı”, “DanıĢman, Mali MüĢavir”, “Doktor / DiĢ Hekimi / Eczacı”, “Ekonomist, Finans Uzmanı, Borsacı”, “Emlak Komisyoncu”, “Tüccar, Esnaf, Tacir”, “Garson, Komi, Hizmetli, Müstahdem”, “Gazeteci, Muhabir, Kameraman”, “Güvenlik Görevlisi”, “Hâkim / Savcı”, “ĠĢçi”, “Kuaför, Berber, Güzellik Uzmanı”, “Kuyumcu, Sarraf”, “Laborant, Biyalog, Radyolog”, “Memur, Kamu Görevlisi”, 63 “Menajer, Yapımcı, Yönetmen”, “Organizatör”, “Mimar”, “Mühendis”, “Müteahhit”, “Noter”, “Öğretmen”, “Pazarlamacı, Reprezant”, “Pilot, Kaptan”, “Polis”, “Programcı, Analist, Yazılımcı”, “Rehber, Tur Operatörü”, “Reklamcı”, “Sanatçı”, “Sekreter”, “Sigortacı”, “Sporcu, Antrenör”, “ġoför”, “Teknisyen”, “Veteriner” ve “Diğer” olarak çekilmiĢtir. ÇalıĢmanın hızının arttırılması için bu veriler “Akademisyen” olanlar için “1”, “Asker” olanlar için “2”, “Avukat” olanlar için “3”, “Bakan, Milletvekili, Bürokrat” olanlar için “4”, “Bankacı” olanlar için “5”, “Boyacı, Elektrikçi, Tesisatçı, Tamirci, Marangoz” olanlar için “6”, “Çiftçi, Besici, Ormancı, Balıkçı” olanlar için “7”, “DanıĢman, Mali MüĢavir” olanlar için “8”, “Doktor / DiĢ Hekimi / Eczacı” olanlar için “9”, “Ekonomist, Finans Uzmanı, Borsacı” olanlar için “10”, “Emlak Komisyoncu” olanlar için “11”, “Tüccar, Esnaf, Tacir” olanlar için “12”, “Garson, Komi, Hizmetli, Müstahdem” olanlar için “13”, “Gazeteci, Muhabir, Kameraman” olanlar için “14”, “Güvenlik Görevlisi” olanlar için “15”, “Hâkim / Savcı” olanlar için “16”, “ĠĢçi” olanlar için “17”, “Kuaför, Berber, Güzellik Uzmanı” olanlar için “18”, “Kuyumcu, Sarraf” olanlar için “19”, “Laborant, Biyalog, Radyolog” olanlar için “20”, “Memur, Kamu Görevlisi” olanlar için “21”, “Menajer, Yapımcı, Yönetmen” olanlar için “22”, “Organizatör” olanlar için “23”, “Mimar” olanlar için “24”, “Mühendis” olanlar için “25”, “Müteahhit” olanlar için “26”, “Noter” olanlar için “27”, “Öğretmen” olanlar için “28”, “Pazarlamacı, Reprezant” olanlar için “29”, “Pilot, Kaptan” olanlar için “30”, “Polis” olanlar için “31”, “Programcı, Analist, Yazılımcı” olanlar için “32”, “Rehber, Tur Operatörü” olanlar için “33”, “Reklamcı” olanlar için “34”, “Sanatçı” olanlar için “35”, “Sekreter” olanlar için “36”, “Sigortacı” olanlar için “37”, “Sporcu, Antrenör” olanlar için “38”, “ġoför” olanlar için “39”, “Teknisyen” olanlar için “40”, “Veteriner” olanlar için “41” ve “Diğer” olanlar için “42 ” ile değiĢtirilmiĢtir. Mesleği değiĢkeni çalıĢmada kategorik değiĢken olarak kullanılmıĢtır. 64 Eşi Çalışıyor Mu?: MüĢterinin eĢinin çalıĢıp çalıĢmadığı bilgisi veri tabanından “Evet” ve “Hayır” olarak çekilmiĢtir. ÇalıĢmanın hızının arttırılması için bu veriler “Evet” olanlar için “1”, “Hayır” olanlar için ise “2” ile değiĢtirilmiĢtir. EĢi ÇalıĢıyor Mu? değiĢkeni çalıĢmada kategorik değiĢken olarak kullanılmıĢtır. Otomobili Var Mı?: MüĢterinin otomobilinin olup olmadığı bilgisi veri tabanından “Evet” ve “Hayır” olarak çekilmiĢtir. ÇalıĢmanın hızının arttırılması için bu veriler “Evet” olanlar için “1”, “Hayır” olanlar için ise “2” ile değiĢtirilmiĢtir. Otomobili Var Mı? değiĢkeni çalıĢmada kategorik değiĢken olarak kullanılmıĢtır. Anapara: MüĢterinin Temmuz 2009 ayı itibari ile toplam yatırım fon miktarının ġubat 2010 ayı fiyatından TL olarak değeridir. Anapara değiĢkeni çalıĢmada nümerik değiĢken olarak kullanılmıĢtır. Aktif / Pasif: MüĢterinin Temmuz 2009 – ġubat 2010 tarihleri arasında yatırım hesabını kapatıp kapatmamıĢ olması bilgisidir. KapatılmıĢ hesaplar için kapatılmamıĢ hesaplar için ise “A” olarak veritabanından alınmıĢtır. Aktif / Pasif değiĢkeni çalıĢmada kategorik değiĢken olarak kullanılmıĢtır. “P”, 65 Pasif Tarihi: MüĢterinin yatırım hesabını pasif hale getirdiği ay veritabanından “07.09”, “08.09”, “09.09”, “10.09”, “11.09”, “12.09” ve “01.10” olarak çekilmiĢtir. Pasif tarihi değiĢkeni, yatırım fonu alıĢ satıĢ iĢlem tablosunun düzenlenmesi için kullanılmıĢtır. Sosyo-demografik verilerin yukarıda belirtilen Ģekilde ön iĢleme aĢamasından geçirilmesinin ardından 65525 müĢteri için 65525 x 15‟lük bir matris elde edilmiĢtir. Yatırım fonu alıĢ satıĢ iĢlem talimat verilerinin ön iĢlemesi YaklaĢık 4 000 000 yatırım fonu alıĢ satıĢ talimat verisi, seçilen müĢteriler için veritabanından süzdürülerek her bir müĢteri için iĢlemler tarih bazında listelenmiĢtir. Listelenen iĢlemler aylara göre toplanarak her bir müĢterinin o ay içerisinde yapmıĢ olduğu iĢlem miktarı belirlenmiĢ, iĢlem miktarlarının Temmuz 2009 ayı anapara üzerindeki değiĢim yüzdeleri hesaplanmıĢtır. Örnek bir müĢteri için yatırım fonu alıĢ satıĢ talimat verisi Çizelge 6.3‟ de verilmiĢtir. Çizelge 6.3. Örnek bir müĢteri için yatırım fonu alıĢ satıĢ talimat verisi MüĢteri Numarası 1 Anapara 18759,72 Temmuz Ağustos 2009 2009 -0,26 0 Eylül 2009 Ekim 2009 Kasım 2009 1,47 1,63 1,61 Aralık Ocak 2009 2010 1,76 2,26 MüĢterinin sosyo-demografik özellikleri içindeki değiĢkenlerden “Pasif Tarihi” değiĢkeni “t-1” ayı olarak değerlendirilerek her bir müĢterinin yatırım fonu alıĢ satıĢ iĢlem talimatı verileri yeniden düzenlenmiĢtir. 66 Örnek olarak 1490 müĢteri numaralı müĢteri Aralık 2009 tarihinde yatırım hesabını pasif hale getirmiĢ, “t-1” ayı Aralık 2009, “t-2” ayı Kasım 2009, “t-3” ayı Ekim 2009, “t-4” ayı Eylül 2009, “t-5” ayı Ağustos 2009 ve “t-6” ayı Temmuz 2009 olmuĢtur. “t-7” ayı hücresi ise sıfır (0) ile doldurulmuĢtur. 1490 müĢteri numaralı müĢterinin yatırım fonu alıĢ satıĢ talimat verisi Çizelge 6.4‟ de verilmiĢtir. Çizelge 6.4. 1490 müĢteri numaralı müĢterinin yatırım fonu alıĢ satıĢ talimat verisi MüĢteri Numarası 1490 Anapara t-7 t-6 t-5 t-4 t-3 t-2 t-1 2642,78 0 -0,23 -0,02 0,31 -0,01 0 -1 Düzenlenen yatırım fonu alıĢ satıĢ talimat verisi yüzde oranlarının kategorik hale getirilmesi bir dizi iĢlem yapılmıĢtır. Yüzde oranlarının kategorik hale getirilmesi: Artış veya azalış olmayan (sıfır) değerlerin kategorik hale getirilmesi: ArtıĢ veya azalıĢ olmayan (sıfır) değerlerin kategorik hale getirilmesi için sabit anlamına gelen “S” kodu verilmiĢtir. Azalış olan yüzde değerlerin kategorik hale getirilmesi: AzalıĢ olan yüzde değerleri kategorik hale getirilmek üzere kümeleme çalıĢması yapılmıĢtır. Kümeleme çalıĢmasında amaç azalıĢ değerlerinin kaç kümeye ayrılması gerektiğinin belirlenmesidir. Banka Yatırım Fonları uzmanlarının görüĢleri azalıĢ yüzde değerlerinin 7 ila 10 kümeye ayrılabileceği, 10 kümeden fazla olmaması gerektiğidir. Bu 67 süreçte Banka Yatırım Fonları uzman görüĢleri de dikkate alınarak kümelemede yaygın olarak kullanılan k-ortalama algoritması kullanılmıĢtır. K-ortalama algoritmasının azalıĢ yüzde değerlerine uygulanması K-ortalama algoritması küme sayısı 7‟den 10‟a kadar WEKA‟ da uygulanmıĢ ve Çizelge 6.5‟ deki hata kareleri elde edilmiĢtir. Çizelge 6.5. K-ortalama algoritması azalıĢ yüzde değerleri hata kareleri toplamı Küme Sayısı Hata Kareleri Toplamı 7 8 9 10 78,79 73,46 59,72 55,77 Hata kareleri toplamları incelendiğinde, küme sayısı 8 olduğu durum ile 9 olduğu durum arasında hata kareleri toplamları bakımından keskin bir düĢüĢ olduğu görülmektedir. (Bkz. ġekil 6.1) Bu yüzden küme sayısı 8 olarak belirlenmiĢtir. Belirlenen küme sayısı ve küme aralık değerlerine göre azalıĢ yüzde değerleri kategorik hale getirilmiĢtir. Kategorik hale getirme iĢlemi yüzde değerinin azalıĢ olduğunu belirten ve düĢüĢ anlamına gelen “D” harfi ile küme numarasının birleĢmesi sonucu oluĢturulmuĢtur. Hangi azalıĢ yüzdesinin hangi kategoriye ait olduğu Çizelge 6.6‟ da verilmiĢtir. ġekil 6.1. K-ortalama algoritması hata kareleri toplamı değiĢim grafiği 68 Çizelge 6.6. AzalıĢ yüzdelerinin kategorik sınıflandırılması AzalıĢ Yüzde Değer Aralığı (-1,00) - (-0,81) (-0,80) - (-0,54) (-0,53) - (-0,35) (-0,34) - (-0,21) (-0,20) - (-0,11) (-0,10) - (-0,05) (-0,04) - (-0,02) (-0,01) - (0) Kategorik Değer D8 D7 D6 D5 D4 D3 D2 D1 Değer Adedi 3409 (%5) 3318 (%5) 4781 (%7) 6717 (%10) 10045 (%15) 14133 (%21) 15794 (%24) 7818 (%12) Artış olan yüzde değerlerin kategorik hale getirilmesi ArtıĢ olan yüzde değerlerini de kategorik hale getirilmek üzere kümeleme çalıĢması yapılmıĢtır. Burada da amaç artıĢ değerlerinin kaç kümeye ayrılması gerektiğinin belirlenmesidir. Banka Yatırım Fonları uzmanlarının görüĢleri artıĢ yüzde değerlerinin en fazla 4 kümeye ayrılması gerektiğidir. Çünkü çalıĢma yatırım fon hesabını kapatan müĢteriler üzerinde yapıldığı için artıĢ yüzde değerlerinin hassas olarak takip edilmesinin analiz açısından bir faydası olmayacağı düĢünülmektedir. K-ortalama algoritmasının artıĢ yüzde değerlerine uygulanması K-ortalama algoritması küme sayısı 2‟den 4‟e kadar WEKA‟ da uygulanmıĢ ve Çizelge 6.7.‟deki hata kareleri elde edilmiĢtir. Çizelge 6.7. K-ortalama algoritması azalıĢ yüzde değerleri hata kareleri toplamı Küme Sayısı Hata Kareleri Toplamı 2 3 4 5 0,90 0,35 0,22 0,20 69 Tablo incelendiğinde hata kareleri toplamının sürekli düĢtüğü görülmektedir. Banka Yatırım Fonları uzmanlarının görüĢleri artıĢ yüzde değerlerinin en fazla 4 kümeye ayrılması gerektiği yönünde olduğu için küme sayısı 4 olarak belirlenmiĢtir. Belirlenen küme sayısı ve küme aralık değerlerine göre artıĢ yüzde değerleri kategorik hale getirilmiĢtir. Kategorik hale getirme iĢlemi yüzde değerinin artıĢ olduğunu belirten ve yükseliĢ anlamına gelen “Y” harfi ile küme numarasının birleĢmesi sonucu oluĢturulmuĢtur. Hangi artıĢ yüzdesinin hangi kategoriye ait olduğu Çizelge 6.8‟ de verilmiĢtir. Çizelge 6.8. ArtıĢ yüzdelerinin kategorik sınıflandırılması Kategorik Değer ArtıĢ Yüzde Değer Aralığı ∞ - (2,00) Y4 Y3 Y2 Y1 Değer Adedi 13086 (%4) 37448 (%11) 80658 (%25) 196452 (%60) (2,00) - (0,77) (0,76) - (0,26) (0,25) - (0) Kategorik hale getirilen yüzde oranları ile 1490 müĢteri numaralı müĢteri için oluĢan yatırım fonu alıĢ satıĢ talimat verisi Çizelge 6.9‟ da verilmiĢtir. Çizelge 6.9. 1490 müĢteri numaralı müĢterinin yatırım fonu alıĢ satıĢ talimat verisi MüĢteri Numarası 1490 Anapara t-7 t-6 t-5 t-4 t-3 t-2 t-1 2642,78 S D5 D2 Y2 D1 S D8 Ön iĢleme sonucu oluĢan sosyo-demografik veriler ile yatırım fonu alıĢ satıĢ talimat verileri birleĢtirilerek 65 525 x 9‟luk bir matris elde edilmiĢtir. 70 6.2.3. WEKA’ da yatırım fonu alıĢ satıĢ iĢlem talimat verilerinin analizi Bu sınıflandırma ile yatırım fonu iĢlemi yapmaktan vazgeçerek yatırım hesabını kapatan müĢterilerin (ayrılan müĢteriler) iĢlem hareket detayları analiz edilerek ayrılma sürecinde yapılan iĢlem hareketlerinin ortaya çıkarılması amaçlanmaktadır. MüĢteri yatırım fonu alıĢ satıĢ talimat verileri ile WEKA‟ da sınıflandırma teknikleri kullanılmıĢtır. Sınıflandırma tekniklerinde hedef değiĢken olarak müĢterinin yatırım hesabını pasif hale getirdiğini belirten “Aktif / Pasif” değiĢkeni kullanılmıĢtır. J4.8 algoritması sonuç özeti J4.8 algoritması, C4.5 karar ağacının WEKA tarafından javada kodlanan versiyonudur. Nümerik özellikler, kayıp değerler, gürültülü veri ile baĢa çıkabilmekte, kesikli ve sürekli veri üzerinde karar ağacı oluĢturabilmektedir. J4.8 algoritmasından alınan sonuç Çizelge 6.10‟ da verilmiĢtir. 71 Çizelge 6.10. J4.8 algoritması sonuç özeti Number of Leaves : Size of the tree : 135 123 === Stratified cross-validation === === Summary === Correctly Classified Instances 65384 99,7848 % Incorrectly Classified Instances 141 0,2152 % Kappa statistic 0,9517 Mean absolute error 0,0038 Root mean squared error 0,0438 Relative absolute error 8,6457 % Root relative squared error 29,4083 % Coverage of cases (0,95 level) 99,9466 % Mean rel. region size (0,95 level) 50,7539 % Total Number of Instances 65525 === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0,999 0,042 0,999 0,999 0,999 0,999 A 0,958 0,001 0,947 0,958 0,953 0,999 P W. Avg. 0,998 0,041 0,998 0,998 0,998 0,999 === Confusion Matrix === a b <-- classified as 63961 79 | a = A 62 1423 | b = P PART algoritması sonuç özeti PART algoritması da J4.8 algoritmasında olduğu gibi kullanıcı tarafından tanımlanan parametreleri kullanarak kısmi karar ağacından kurallar oluĢturur. PART algoritmasından alınan sonuç Çizelge 6.11‟ de verilmiĢtir. 72 Çizelge 6.11. PART algoritması sonuç özeti Number of Rules : 79 === Stratified cross-validation === === Summary === Correctly Classified Instances 65384 99,7848 % Incorrectly Classified Instances 141 0,2152 % Kappa statistic 0,9516 Mean absolute error 0,0039 Root mean squared error 0,0441 Relative absolute error 8,7813 % Root relative squared error 29,6379 % Coverage of cases (0,95 level) 99,9176 % Mean rel. region size (0,95 level) 50,5761 % Total Number of Instances 65525 === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0,999 0,044 0,999 0,999 0,999 0,999 A 0,956 0,001 0,949 0,956 0,953 0,999 P W. Avg. 0,998 0,043 0,998 0,998 0,998 0,999 === Confusion Matrix === a b <-- classified as 63964 76 | a = A 65 1420 | b = P JRip algoritması sonuç özeti JRip algoritması, RIPPER algoritmasının WEKA tarafından javada kodlanan versiyonudur. Kayıp değerler, gürültülü veri ile baĢa çıkabilmekte, kesikli ve sürekli veri üzerinde kurallar çıkartabilmektedir. JRip algoritmasından alınan sonuç Çizelge 6.12‟ de verilmiĢtir. 73 Çizelge 6.12. JRip algoritması sonuç özeti Number of Rules : 14 === Stratified cross-validation === === Summary === Correctly Classified Instances 65410 99,8245 % Incorrectly Classified Instances 115 0,1755 % Kappa statistic 0,9615 Mean absolute error 0,0031 Root mean squared error 0,0394 Relative absolute error 6,9969 % Root relative squared error 26,4558 % Coverage of cases (0,95 level) 99,9359 % Mean rel. region size (0,95 level) 50,4357 % Total Number of Instances 65525 === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0,998 0,008 1 0,998 0,999 0,996 A 0,992 0,002 0,935 0,992 0,962 0,996 P W. Avg. 0,998 0,008 0,998 0,998 0,998 0,996 === Confusion Matrix === a b <-- classified as 63937 103 | a = A 12 1473 | b = P Naive Bayes algoritması sonuç özeti Naive Bayes algoritması, Bayes teoremine dayanan standart olasılıklı sınıflandırma yöntemidir. Naive Bayes algoritmasından alınan sonuç Çizelge 6.13‟ de verilmiĢtir. 74 Çizelge 6.13. Naive Bayes algoritması sonuç özeti === Stratified cross-validation === === Summary === Correctly Classified Instances 64321 98,1625 % Incorrectly Classified Instances 1204 1,8375 % Kappa statistic 0,6778 Mean absolute error 0,0241 Root mean squared error 0,1229 Relative absolute error 54,2791 % Root relative squared error 82,5678 % Coverage of cases (0,95 level) 99,3285 % Mean rel. region size (0,95 level) 52,6723 % Total Number of Instances 65525 === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0,984 0,111 0,997 0,984 0,991 0,991 A 0,889 0,016 0,56 0,889 0,687 0,991 P W. Avg. 0,982 0,109 0,987 0,982 0,984 0,991 === Confusion Matrix === a b <-- classified as 63001 1039 | a = A 165 1320 | b = P OneR algoritması sonuç özeti OneR algoritması, basit sınıflandırma kuralları bulmamızı sağlayan, tek bir özellik üzerinde tek seviyeli karar ağacı oluĢturan bir algoritmadır. DeğiĢkenlerden baskın olanı seçilir ve o değiĢkene göre tek seviye dallar oluĢturulur. OneR algoritmasından alınan sonuç Çizelge 6.14‟ de verilmiĢtir. 75 Çizelge 6.14. OneR algoritması sonuç özeti Number of Leaves : 1 Size of the tree : 13 === Stratified cross-validation === === Summary === Correctly Classified Instances 64477 98,4006 % Incorrectly Classified Instances 1048 1,5994 % Kappa statistic 0,5144 Mean absolute error 0,016 Root mean squared error 0,1265 Relative absolute error 36,0931 % Root relative squared error 84,9758 % Coverage of cases (0,95 level) 98,4006 % Mean rel. region size (0,95 level) 50 % Total Number of Instances 65525 === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0,998 0,615 0,986 0,998 0,992 0,691 A 0,385 0,002 0,81 0,385 0,521 0,691 P W. Avg. 0,984 0,602 0,982 0,984 0,981 0,691 === Confusion Matrix === a b <-- classified as 63906 134 | a = A 914 571 | b = P 6.2.4. WEKA’ da yatırım fonu alıĢ satıĢ iĢlem talimat verilerinin analiz sonuçlarının karĢılaĢtırılması Yatırım fonu alıĢ satıĢ talimat verilerinin sınıflandırma algoritmaları ile analiz edilmesi sonucu oluĢan karar ağaçları incelenmiĢtir. PART, JRip ve OneR algoritmaları kural öğrenici algoritmalar olduklarından verdikleri sonuçlar da kural Ģeklindedir. Fakat J4.8 algoritması karar ağacı Ģeklinde sonuç verdiğinden J4.8 algoritma sonucu oluĢan karar ağacı kural haline dönüĢtürülmüĢtür. DönüĢtürme iĢlemi sonucu 31 adet kural elde edilmiĢtir. 76 Yatırım fonu alıĢ satıĢ talimat verilerinin sınıflandırma algoritmaları ile analiz edilmesinin sonunda oluĢan model çıktıları, aĢağıda bahsedilen değerlendirme kriterleri ile karĢılaĢtırılmıĢtır. Number of Rules / Number of Leaves: Sınıflandırma algoritması tarafından çıkartılan kural sayısı veya oluĢturulan karar ağacının boyutunu göstermektedir. True Positive Rate (TP Rate): Sınıflandırma algoritması tarafından herhangi bir sınıfa atanan kayıtlardan gerçekte o sınıfa ait olanların oranını yüzdesel olarak gösterir. False Positive Rate (FP): Sınıflandırma algoritması tarafından herhangi bir sınıfa atandığı halde gerçekte o sınıfa ait olmayan kayıtların oranını gösterir. Precision: Gerçekte herhangi bir sınıfa ait olan kayıtların hangi oranda sınıflandırma algoritması tarafından o sınıfa atandığı gösterir. Kappa İstatistiği: Tahmin doğruluğunun ölçüsüdür. Confusion Matrix: Doğru olarak sınıflandırılan örneklerin sayısı bu matrisin diyagonal elemanlarının toplamına eĢittir [38]. Doğru olarak sınıflandırılan kayıt yüzdesini kullanacağımız algoritmayı seçerken göz önüne alacağız. Sınıflandırma çalıĢması sonunda, kullanılan farklı sınıflandırma algoritmalarına göre karĢılaĢtırma tablosu oluĢturulmuĢtur. KarĢılaĢtırma tablosu Çizelge 6.15‟ de verilmiĢtir. 77 Çizelge 6.15. Yatırım fonu alıĢ satıĢ talimat verileri sınıflandırma sonuçları karĢılaĢtırma çizelgesi Kural Sayısı / Karar Ağacı Dal Sayısı Pasif MüĢteriler Ġçin Çıkartılan Kural Sayısı Pasif MüĢteriler için Doğru Sınıflandırıl an Kayıt Yüzdesi Pasif MüĢteriler Ġçin Hatalı Sınıflandırı lan Kayıt Yüzdesi Kappa Ġstatistiği YanlıĢ Sınıfland ırılan Pasif MüĢteri Sayısı J4.8 123 31 95,8 0,1 0,9517 62 PART 79 25 95,6 0,1 0,9516 65 JRip Naive Bayes OneR 14 14 99,2 0,2 0,9515 12 -- -- 88,9 1,6 0,6778 165 1 1 38,5 0,2 0,5144 914 Algoritma Sınıflandırma sonuçları incelendiğinde, doğru olarak sınıflandırılan kayıt yüzdesi ve çıkarılan kural sayısının en yüksek olduğu algoritmanın, %95,8 doğruluk oranı ve 31 kural sayısı ile J4.8 algoritması olduğu görülmektedir. J4.8 algoritması ile oluĢturulan kurallar, kurala uyan müĢteri sayısı ve yüzdesi Ģu Ģekildedir; Kural 1: Eğer (t-2 = D8) ve (t-1 = S) = P (492, % 33,13) Kural 2: Eğer (t-7 = S) ve (t-6 = S) ve (t-1 = D8) = P (354, % 23,84) Kural 3: Eğer (t-3 = D8) ve (t-2 = S) ve (t-1 = S) = P (212, % 14,28) Kural 4: Eğer (anapara > 85.95) ve (t-4 = D8) ve (t-3 = S) ve (t-2 = S) ve (t-1 = S) = P (88, % 5,93) Kural 5: Eğer (t-7 = S) ve (t-6 = Y2) ve (t-1 = D8) = P (71, % 4,78) Kural 6: Eğer (t-7 = D4) ve (t-2 = D8) ve (t-1 = D8) = P (8, % 0,54) Kural 7: Eğer (t-7 = D5) ve (t-2 = D8) ve (t-1 = D8) = P (9, % 0,61) Kural 8: Eğer (t-7 = D6) ve (t-5 = D6) ve (t-1 = D8) = P (2, % 0,13) Kural 9: Eğer (t-7 = D6) ve (t-5 = D7) ve (t-1 = D8) = P (1, % 0,07) Kural 10: Eğer (t-7 = D7) ve (t-1 = D8) = P (12, % 0,81) Kural 11: Eğer (t-7 = S) ve (t-6 = D1) ve (t-1 = D8) = P (4, % 0,27) 78 Kural 12: Eğer (t-7 = S) ve (t-6 = D2) ve (t-1 = D8) = P (3, % 0,20) Kural 13: Eğer (t-7 = S) ve (t-6 = D3) ve (t-1 = D8) = P (21, % 1,41) Kural 14: Eğer (t-7 = S) ve (t-6 = D4) ve (t-1 = D8) = P (31, % 2,09) Kural 15: Eğer (t-7 = S) ve (t-6 = D5) ve (t-1 = D8) = P (17, % 1,14) Kural 16: Eğer (t-7 = S) ve (t-6 = D6) ve (t-1 = D8) = P (12, % 0,81) Kural 17: Eğer (t-7 = S) ve (t-6 = D7) ve (t-1 = D8) = P (10, % 0,67) Kural 18: Eğer (t-7 = S) ve (t-6 = D8) ve (t-1 = D8) = P (8, % 0,54) Kural 19: Eğer (t-7 = S) ve (t-6 = Y1) ve (t-1 = D8) = P (9, % 0,61) Kural 20: Eğer (t-7 = S) ve (t-6 = Y3) ve (t-1 = D8) = P (9, % 0,61) Kural 21: Eğer (anapara > 25) ve (t-5 = D8) ve (t-4 = S) ve (t-3 = S) ve (t-2 = S) ve (t-1 = S) = P (50, % 3,37) Kural 22: Eğer (t-7 = D1) ve (t-1 = D8) = P (1, % 0,07) Kural 23: Eğer (t-7 = D2) ve (t-1 = D8) = P (3, % 0,20) Kural 24: Eğer (t-7 = D3) ve (t-1 = D8) = P (4, % 0,27) Kural 25: Eğer (t-7 = D8) ve (t-1 = D8) = P (2, % 0,13) Kural 26: Eğer (t-7 = Y1) ve (t-1 = D8) = P (12, % 0,81) Kural 27: Eğer (t-7 = Y2) ve (t-1 = D8) = P (15, % 1,01) Kural 28: Eğer (t-7 = Y3) ve (t-1 = D8) = P (2, % 0,13) Kural 29: Eğer (t-7 = S) ve (t-6 = Y4) ve (t-1 = D8) = P (5, % 0,34) Kural 30: Eğer (anapara <= 85.95) ve (t-4 = D8) ve (t-3 = S) ve (t-2 = S) ve (t-1 = S) = P (6, % 0,40) Kural 31: Eğer (t-5 = S) ve (t-4 = S) ve (t-3 = S) ve (t-2 = S) ve (t-1 = S) = P (12, % 0,81) OluĢturulan kurallar, yatırım hesabını kapatan müĢterilerin iĢlem yapma karakteristiğini yansıtmaktadır. Bu kurallar ileride yatırım hesabını kapatmak isteyen müĢterilerin yatırım hesabını kapatmadan tespit edilmesinde kullanılacaktır. Fakat hangi sosyo-demografik karakteristiğe sahip müĢterinin hangi kural ile yatırım hesabını kapatarak banka yatırım fonu müĢterisi olmaktan çıktığını ise yansıtmamaktadır. MüĢteri sosyo-demografik verileri ancak yeni bir analiz yapılarak kurallara dâhil edilebilecektir. Bunu gerçekleĢtirebilmek için ise kuralları sağlayan müĢteriler belirlenerek müĢteri 79 sosyo-demografik verileri yeniden düzenlenmiĢtir. Düzenlenen sosyo- demografik veriler ile sınıflama teknikleri kullanılarak tekrar analiz yapılmıĢtır. 6.2.5. WEKA’ da müĢteri sosyo-demografik verilerinin analizi Yatırım hesabını kapatarak banka yatırım fonu müĢterisi olmaktan çıkmıĢ müĢterilerin sosyo-demografik verileri ile WEKA‟da sınıflandırma teknikleri kullanılarak analiz yapılmıĢtır. Sınıflandırma tekniklerinde hedef değiĢken olarak müĢterinin yatırım hesabını pasif hale getirirken izlediği yolu belirten kural numarası değiĢken olarak kullanılmıĢtır. Id3 algoritması sonuç özeti Id3 algoritması ağaç bölünmesinde bilgi kazancı kriterini kullanana karar ağacı algoritmasıdır. Yalnızca kesikli veriler ile çalıĢır. Id3 algoritmasından alınan sonuç Çizelge 6.16‟da verilmiĢtir. Çizelge 6.16. Id3 algoritması sonuç özeti === Stratified cross-validation === === Summary === Correctly Classified Instances 1456 Incorrectly Classified Instances 29 Kappa statistic 0,9757 Mean absolute error 0,0013 Root mean squared error 0,0258 Relative absolute error 2,5627 % Root relative squared error 16,0408 % Coverage of cases (0,95 level) 100 % Mean rel. region size (0,95 level) 3,43 % Total Number of Instances 1485 98,0471 % 1,9529 % 80 J4.8 algoritması sonuç özeti J4.8 algoritmasından alınan sonuç Çizelge 6.17‟ de verilmiĢtir. Çizelge 6.17. J4.8 algoritması sonuç özeti === Stratified cross-validation === === Summary === Correctly Classified Instances 755 50,8418 % Incorrectly Classified Instances 730 49,1582 % Kappa statistic 0,3244 Mean absolute error 0,0397 Root mean squared error 0,141 Relative absolute error 76,2236 % Root relative squared error 87,4831 % Coverage of cases (0,95 level) 98,3165 % Mean rel. region size (0,95 level) 18,4925 % Total Number of Instances 1485 JRip algoritması sonuç özeti Jrip algoritmasından alınan sonuç Çizelge 6.18‟ de verilmiĢtir. Çizelge 6.18. JRip algoritması sonuç özeti === Stratified cross-validation === === Summary === Correctly Classified Instances 498 33,5354 % Incorrectly Classified Instances 987 66,4646 % Kappa statistic 0,008 Mean absolute error 0,0516 Root mean squared error 0,1606 Relative absolute error 98,9963 % Root relative squared error 99,6986 % Coverage of cases (0,95 level) 95,5556 % Mean rel. region size (0,95 level) 51,4174 % Total Number of Instances 1485 81 PART algoritması sonuç özeti PART algoritmasından alınan sonuç Çizelge 6.19‟ da verilmiĢtir. Çizelge 6.19. PART algoritması sonuç özeti === Stratified cross-validation === === Summary === Correctly Classified Instances 856 57,6431 % Incorrectly Classified Instances 629 42,3569 % Kappa statistic 0,4373 Mean absolute error 0,0354 Root mean squared error 0,133 Relative absolute error 67,8162 % Root relative squared error 82,5175 % Coverage of cases (0,95 level) 99,9327 % Mean rel. region size (0,95 level) 11,5238 % Total Number of Instances 1485 6.2.6. WEKA’ da müĢteri sosyo-demografik verilerinin analiz sonuçlarının karĢılaĢtırılması MüĢteri sosyo-demografik verilerinin sınıflandırma algoritmaları ile analiz edilmesinin sonunda oluĢan model çıktıları, Bölüm 6.2.4‟ de bahsedilen değerlendirme kriterleri ile karĢılaĢtırılmıĢtır. Sınıflandırma çalıĢması sonunda, kullanılan farklı sınıflandırma algoritmalarına göre karĢılaĢtırma tablosu oluĢturulmuĢtur. KarĢılaĢtırma tablosu Çizelge 6.20‟ de verilmiĢtir. 82 Çizelge 6.20. MüĢteri sosyo-demografik verileri sınıflandırma sonuçları karĢılaĢtırma çizelgesi Doğru Sınıflandırılan Kayıt Yüzdesi Hatalı Sınıflandırılan Kayıt Yüzdesi Kappa Ġstatistiği YanlıĢ Sınıflandırılan Kayıt Sayısı Id3 98,04 1,95 0,9757 29 J4.8 50,84 49,15 0,3244 730 PART 57,64 42,35 0,4373 629 JRip 33,53 66,46 0,008 987 Algoritma Sınıflandırma sonuçları incelendiğinde, doğru olarak sınıflandırılan kayıt yüzdesinin en yüksek olduğu algoritmanın, %98,04 doğruluk oranı ile Id3 algoritması olduğu görülmektedir. Bankada yatırım fonu iĢlemi yapan fakat belli bir iĢlem geçmiĢinden sonra yatırım hesabını pasif hale getirerek banka yatırım fonu müĢterisi olmaktan çıkmıĢ müĢterilerin yatırım fonu alıĢ satıĢ talimat verileri ile sosyo-demografik verilerinin sınıflandırılması sonucu iki aĢamalı bir karar ağacına ulaĢılmıĢtır. Yatırım fonu alıĢ satıĢ talimat verileri müĢterilerin hangi iĢlem hareketinden sonra yatırım hesabını kapattığı kurallarını içermektedir. Bu kuralları gerçekleĢtiren müĢterilerin sosyo-demografik verilerinin sınıflandırılmasından ise müĢterinin sosyo-demografik karakteristiği ortaya çıkartılmıĢtır. 6.2.7. MüĢterinin yatırım hesabını kapatma iĢlem hareketleri ile sosyodemografik karakteristiğinin birleĢtirilmesi MüĢterinin yatırım hesabını kapatma iĢlem hareketleri ile sosyo-demografik karakteristiği birleĢtirilmiĢ, iki aĢamalı bir karar ağacı oluĢturulmuĢtur. Ġki aĢamalı karar ağacı ile müĢterilerin sosyo-demografik özelliklerinin %81.91‟ini karĢılayan beĢ kuralın karar ağaçları aĢağıdaki Ģekilde verilmiĢtir. Diğer kuralları ise yine aĢağıda yer almaktadır. 83 Kural 1 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 1: Eğer (t-2 = D8) ve (t-1 = S) = P (492, % 33,13) Sosyo-demografik karakteristik; (Mesleği = 2) (Mesleği = 3) ve (YaĢı = 2) ve (En_son_çalıĢma_yılı = 2) ve (Cinsiyeti = 1) (Mesleği = 3) ve (YaĢı = 3) ve (Net_geliri = 3) ve (Öğrenim_durumu = 6) (Mesleği = 3) ve (YaĢı = 3) ve (Net_geliri = 3) ve (Öğrenim_durumu = 8) (Mesleği = 3) ve (YaĢı = 3) ve (Net_geliri = 5) ve (Medeni_durumu = 1) (Mesleği = 3) ve (YaĢı = 3) ve (Net_geliri = 5) ve (Medeni_durumu = 2) ve (Öğrenim_durumu = 5) (Mesleği = 3) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 1) ve (ÇalıĢma_Ģekli = 3) ve (Cinsiyeti = 1) (Mesleği = 3) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 1) (Mesleği = 3) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 4) ve (Cinsiyeti = 2) ve (ÇalıĢma_Ģekli = 3) (Mesleği = 3) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 1) ve (Oturduğu_ev = 1) (Mesleği = 3) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 1) ve (Oturduğu_ev = 2) (Mesleği = 3) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 3) ve (YaĢı = 6) ve (Öğrenim_durumu = 6) (Mesleği = 3) ve (YaĢı = 6) ve (Öğrenim_durumu = 7) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 3) ve (YaĢı = 6) ve (Öğrenim_durumu = 7) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 5) ve (YaĢı = 3) ve (Medeni_durumu = 1) (Mesleği = 5) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 1) ve (Medeni_durumu = 2) ve (Cinsiyeti = 2) 84 (Mesleği = 5) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 2) ve (Öğrenim_durumu = 5) ve (Cinsiyeti = 1) ve (Medeni_durumu = 1) (Mesleği = 5) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 2) ve (Öğrenim_durumu = 5) ve (Cinsiyeti = 2) (Mesleği = 5) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 5) ve (YaĢı = 5) ve (Öğrenim_durumu = 6) ve (YaĢadığı_il = 2) (Mesleği = 5) ve (YaĢı = 6) ve (YaĢadığı_il = 1) ve () ve (Medeni_durumu = 2) (Mesleği = 5) ve (YaĢı = 6) ve (YaĢadığı_il = 1) ve (Cinsiyeti = 2) (Mesleği = 7) ve (En_son_çalıĢma_yılı = 2) ve (ÇalıĢma_Ģekli = 1) (Mesleği = 7) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 7) ve (En_son_çalıĢma_yılı = 4) ve (Cinsiyeti = 1) (Mesleği = 8) ve (Öğrenim_durumu = 1) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 8) ve (Öğrenim_durumu = 2) ve (YaĢı = 2) ve (Net_geliri = 5) (Mesleği = 8) ve (Öğrenim_durumu = 4) ve (YaĢı = 2) ve (Medeni_durumu = 1) (Mesleği = 8) ve (Öğrenim_durumu = 4) ve (YaĢı = 4) ve (Cinsiyeti = 1) (Mesleği = 8) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 3) ve (Oturduğu_ev = 1) (Mesleği = 8) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 5) ve (Cinsiyeti = 1) (Mesleği = 8) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 2) ve (YaĢı = 6) (Mesleği = 8) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 3) ve (YaĢı = 4) (Mesleği = 8) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 3) ve (YaĢı = 6) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 1) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 2) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 3) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 3) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 3) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 4) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (En_son_çalıĢma_yılı = 1) ve (YaĢadığı_il = 1) 85 (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 3) ve (Oturduğu_ev = 1) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 4) ve (EĢi_çalıĢıyor_mu = 1) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (YaĢı = 2) ve (Cinsiyeti = 2) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (YaĢı = 3) ve (Cinsiyeti = 2) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (YaĢı = 3) ve (Cinsiyeti = 2) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (YaĢı = 4) ve (Oturduğu_ev = 1) ve (YaĢadığı_il = 2) ve (Cinsiyeti = 1) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (YaĢı = 4) ve (Oturduğu_ev = 3) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (YaĢı = 5) ve (Cinsiyeti = 1) ve (En_son_çalıĢma_yılı = 2) ve (YaĢadığı_il = 1) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (YaĢı = 5) ve (Cinsiyeti = 2) ve (Medeni_durumu = 1) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (YaĢı = 6) ve (Cinsiyeti = 2) (Mesleği = 9) ve (Öğrenim_durumu = 2) ve (Cinsiyeti = 1) ve (YaĢadığı_il = 2) (Mesleği = 9) ve (Öğrenim_durumu = 4) ve (YaĢı = 2) ve (Medeni_durumu = 2) ve (YaĢadığı_il = 2) (Mesleği = 9) ve (Öğrenim_durumu = 4) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 1) ve (Medeni_durumu = 2) (Mesleği = 9) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 4) (YaĢı = 3) ve 86 (Mesleği = 9) ve (Öğrenim_durumu = 4) ve (YaĢı = 4) ve (Net_geliri = 4) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 9) ve (Öğrenim_durumu = 4) ve (YaĢı = 5) ve (Medeni_durumu = 1) (Mesleği = 9) ve (Öğrenim_durumu = 5) ve (Oturduğu_ev = 1) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 4) (Mesleği = 9) ve (Öğrenim_durumu = 5) ve (Oturduğu_ev = 1) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 3) (Mesleği = 9) ve (Öğrenim_durumu = 5) ve (Oturduğu_ev = 1) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 4) ve (Cinsiyeti = 1) (Mesleği = 9) ve (Öğrenim_durumu = 5) ve (Oturduğu_ev = 1) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 5) (Mesleği = 9) ve (Öğrenim_durumu = 5) ve (Oturduğu_ev = 1) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 6) (Mesleği = 9) ve (Öğrenim_durumu = 5) ve (Oturduğu_ev = 1) ve (En_son_çalıĢma_yılı = 4) ve (YaĢadığı_il = 5) (Mesleği = 9) ve (Öğrenim_durumu = 6) ve (Net_geliri = 2) ve (En_son_çalıĢma_yılı = 2) ve (Medeni_durumu = 1) ve (YaĢadığı_il = 1) (Mesleği = 9) ve (Öğrenim_durumu = 6) ve (Net_geliri = 2) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 9) ve (Öğrenim_durumu = 6) ve (Net_geliri = 3) ve (YaĢadığı_il = 1) ve (YaĢı = 3) ve (Medeni_durumu = 2) (Mesleği = 9) ve (Öğrenim_durumu = 6) ve (Net_geliri = 3) ve (YaĢadığı_il = 1) ve (YaĢı = 4) ve (Medeni_durumu = 1) ve (Oturduğu_ev = 1) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 9) ve (Öğrenim_durumu = 6) ve (Net_geliri = 3) ve (YaĢadığı_il = 1) ve (YaĢı = 4) ve (Medeni_durumu = 1) ve (Oturduğu_ev = 2) (Mesleği = 9) ve (Öğrenim_durumu = 6) ve (Net_geliri = 3) ve (YaĢadığı_il = 3) ve (Cinsiyeti = 2) (Mesleği = 9) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) (Mesleği = 9) ve (Öğrenim_durumu = 6) ve (Net_geliri = 5) ve (En_son_çalıĢma_yılı = 4) ve (Cinsiyeti = 2) 87 (Mesleği = 9) ve (Öğrenim_durumu = 7) ve (En_son_çalıĢma_yılı = 3) ve (Net_geliri = 3) ve (EĢi_çalıĢıyor_mu = 1) (Mesleği = 9) ve (Öğrenim_durumu = 7) ve (En_son_çalıĢma_yılı = 3) ve (Net_geliri = 4) (Mesleği = 9) ve (Öğrenim_durumu = 8) ve (Cinsiyeti = 2) (Mesleği = 10) ve (Net_geliri = 1) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 10) ve (Net_geliri = 2) ve (YaĢı = 2) (Mesleği = 10) ve (Net_geliri = 2) ve (YaĢı = 3) ve (Öğrenim_durumu = 6) ve (Cinsiyeti = 2) (Mesleği = 10) ve (Net_geliri = 2) ve (YaĢı = 4) ve (Cinsiyeti = 1) (Mesleği = 10) ve (Net_geliri = 2) ve (YaĢı = 6) ve () ve () ve () ve (Mesleği = 10) ve (Net_geliri = 3) ve (YaĢı = 2) ve (YaĢadığı_il = 1) (Mesleği = 10) ve (Net_geliri = 3) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 10) ve (Net_geliri = 3) ve (YaĢı = 5) (Mesleği = 10) ve (Net_geliri = 3) ve (YaĢı = 6) ve (Cinsiyeti = 1) (Mesleği = 10) ve (Net_geliri = 4) ve (Öğrenim_durumu = 1) (Mesleği = 10) ve (Net_geliri = 4) ve (Öğrenim_durumu = 2) ve (YaĢadığı_il = 4) (Mesleği = 10) ve (Net_geliri = 4) ve (Öğrenim_durumu = 4) ve (YaĢı = 3) ve (Cinsiyeti = 1) (Mesleği = 10) ve (Net_geliri = 4) ve (Öğrenim_durumu = 5) ve (YaĢı = 3) ve (Cinsiyeti = 1) ve (Oturduğu_ev = 2) (Mesleği = 10) ve (Net_geliri = 4) ve (Öğrenim_durumu = 5) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 10) ve (Net_geliri = 4) ve (Öğrenim_durumu = 6) ve (YaĢı = 5) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 2) ve (Medeni_durumu = 2) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 1) ve (Öğrenim_durumu = 5) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 1) ve (Öğrenim_durumu = 6) ve (YaĢadığı_il = 1) 88 (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 4) ve (Medeni_durumu = 2) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 1) ve (Medeni_durumu = 2) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 2) ve (YaĢadığı_il = 1) ve (Cinsiyeti = 1) ve (ÇalıĢma_Ģekli = 3) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 2) ve (YaĢadığı_il = 1) ve (Cinsiyeti = 2) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 2) ve (YaĢadığı_il = 3) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 4) ve (Cinsiyeti = 1) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 5) ve (Öğrenim_durumu = 6) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 6) ve (YaĢadığı_il = 1) ve (Cinsiyeti = 2) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 6) ve (YaĢadığı_il = 2) (Mesleği = 11) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 1) ve (Öğrenim_durumu = 4) ve (Oturduğu_ev = 1) ve (Cinsiyeti = 1) (Mesleği = 11) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 1) ve (Öğrenim_durumu = 4) ve (Oturduğu_ev = 2) (Mesleği = 11) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 1) ve (Öğrenim_durumu = 6) (Mesleği = 11) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 2) ve (EĢi_çalıĢıyor_mu = 2) (Mesleği = 11) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 11) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 11) ve (YaĢı = 4) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 1) ve (Medeni_durumu = 2) (Mesleği = 11) ve (YaĢı = 4) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 2) ve (Cinsiyeti = 2) (Mesleği = 11) ve (YaĢı = 4) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 3) 89 (Mesleği = 11) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 3) ve (Öğrenim_durumu = 4) (Mesleği = 11) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 5) ve (Öğrenim_durumu = 1) (Mesleği = 11) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 5) ve (Öğrenim_durumu = 2) (Mesleği = 11) ve (YaĢı = 6) (Mesleği = 12) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 12) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 3) (Mesleği = 12) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 5) ve (Cinsiyeti = 1) (Mesleği = 12) ve (YaĢı = 4) ve (YaĢadığı_il = 3) (Mesleği = 12) ve (YaĢı = 4) ve (YaĢadığı_il = 4) (Mesleği = 12) ve (YaĢı = 5) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 12) ve (YaĢı = 6) ve (Medeni_durumu = 1) ve (Öğrenim_durumu = 2) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 12) ve (YaĢı = 6) ve (Medeni_durumu = 1) ve (Öğrenim_durumu = 6) (Mesleği = 12) ve (YaĢı = 6) ve (Medeni_durumu = 2) (Mesleği = 13) ve (Öğrenim_durumu = 2) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 13) ve (Öğrenim_durumu = 2) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 13) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 2) ve (EĢi_çalıĢıyor_mu = 2) (Mesleği = 13) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 3) (Mesleği = 13) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 2) ve (YaĢadığı_il = 1) ve (Medeni_durumu = 1) (Mesleği = 13) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 3) ve (YaĢı = 3) 90 (Mesleği = 13) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 4) ve (Medeni_durumu = 2) (Mesleği = 13) ve (Öğrenim_durumu = 5) ve (ÇalıĢma_Ģekli = 3) ve (Oturduğu_ev = 1) ve (Cinsiyeti = 1) (Mesleği = 13) ve (Öğrenim_durumu = 5) ve (ÇalıĢma_Ģekli = 3) ve (Oturduğu_ev = 1) ve (Cinsiyeti = 2) ve (YaĢı = 4) (Mesleği = 13) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 13) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 4) ve (Medeni_durumu = 2) (Mesleği = 13) ve (Öğrenim_durumu = 7) ve (YaĢadığı_il = 1) ve (Cinsiyeti = 2) (Mesleği = 13) ve (Öğrenim_durumu = 8) (Mesleği = 14) ve (Öğrenim_durumu = 2) (Mesleği = 14) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 3) (Mesleği = 14) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 14) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) (Mesleği = 14) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (Net_geliri = 2) (Mesleği = 14) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (Net_geliri = 4) (Mesleği = 14) ve (Öğrenim_durumu = 6) ve (YaĢı = 6) (Mesleği = 14) ve (Öğrenim_durumu = 8) ve (Cinsiyeti = 2) ve (YaĢadığı_il = 3) (Mesleği = 15) ve (Öğrenim_durumu = 4) ve (Oturduğu_ev = 2) ve (EĢi_çalıĢıyor_mu = 1) (Mesleği = 16) ve (YaĢı = 6) (Mesleği = 18) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 18) ve (Öğrenim_durumu = 5) ve (YaĢı = 3) ve (Medeni_durumu = 2) (Mesleği = 18) ve (Öğrenim_durumu = 6) ve (YaĢadığı_il = 2) ve (Cinsiyeti = 1) (Mesleği = 18) ve (Öğrenim_durumu = 7) ve (YaĢı = 5) (Mesleği = 18) ve (Öğrenim_durumu = 8) 91 (Mesleği = 19) ve (Öğrenim_durumu = 4) ve (YaĢı = 2) (Mesleği = 19) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 19) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 1) ve (Cinsiyeti = 2) (Mesleği = 19) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 2) ve (Medeni_durumu = 1) (Mesleği = 19) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 19) ve (Öğrenim_durumu = 7) (Mesleği = 20) ve (En_son_çalıĢma_yılı = 2) ve (Medeni_durumu = 2) (Mesleği = 20) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 21) ve (Öğrenim_durumu = 1) ve (Cinsiyeti = 1) (Mesleği = 21) ve (Öğrenim_durumu = 1) ve (Cinsiyeti = 2) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 21) ve (Öğrenim_durumu = 1) ve (Cinsiyeti = 2) ve (YaĢadığı_il = 3) (Mesleği = 21) ve (Öğrenim_durumu = 2) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 2) (Mesleği = 21) ve (Öğrenim_durumu = 2) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 4) (Mesleği = 21) ve (Öğrenim_durumu = 4) ve (Net_geliri = 1) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 3) (Mesleği = 21) ve (Öğrenim_durumu = 4) ve (Net_geliri = 1) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 4) ve (Cinsiyeti = 2) (Mesleği = 21) ve (Öğrenim_durumu = 4) ve (Net_geliri = 1) ve (En_son_çalıĢma_yılı = 2) ve (Medeni_durumu = 1) (Mesleği = 21) ve (Öğrenim_durumu = 4) ve (Net_geliri = 2) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 21) ve (Öğrenim_durumu = 4) ve (Net_geliri = 2) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 21) ve (Öğrenim_durumu = 4) ve (Net_geliri = 5) ve (En_son_çalıĢma_yılı = 2) 92 (Mesleği = 21) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 1) ve (Net_geliri = 1) ve (Cinsiyeti = 1) (Mesleği = 21) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 1) ve (Net_geliri = 2) (Mesleği = 21) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 1) ve (Net_geliri = 3) ve (Cinsiyeti = 2) (Mesleği = 21) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 1) ve (Net_geliri = 5) (Mesleği = 21) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 21) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 4) ve (Net_geliri = 2) (Mesleği = 21) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 4) ve (Net_geliri = 5) ve (Cinsiyeti = 2) (Mesleği = 21) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 1) ve (Oturduğu_ev = 2) (Mesleği = 21) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 2) (Mesleği = 21) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 3) ve (YaĢadığı_il = 1) (Mesleği = 21) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 4) ve (YaĢı = 3) ve (YaĢadığı_il = 1) (Mesleği = 21) ve (Öğrenim_durumu = 7) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 21) ve (Öğrenim_durumu = 7) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 22) ve (Öğrenim_durumu = 2) ve (YaĢadığı_il = 1) ve (YaĢı = 4) (Mesleği = 22) ve (Öğrenim_durumu = 4) ve (YaĢı = 3) ve (Oturduğu_ev = 1) (Mesleği = 22) ve (Öğrenim_durumu = 4) ve (YaĢı = 3) ve (Oturduğu_ev = 3) 93 (Mesleği = 22) ve (Öğrenim_durumu = 4) ve (YaĢı = 4) ve (YaĢadığı_il = 4) (Mesleği = 22) ve (Öğrenim_durumu = 4) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 1) ve (Cinsiyeti = 1) (Mesleği = 22) ve (Öğrenim_durumu = 4) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 22) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 4) ve (Cinsiyeti = 2) (Mesleği = 22) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 22) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 22) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (Cinsiyeti = 1) ve (Oturduğu_ev = 1) (Mesleği = 22) ve (Öğrenim_durumu = 6) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 22) ve (Öğrenim_durumu = 7) ve (YaĢı = 3) (Mesleği = 22) ve (Öğrenim_durumu = 7) ve (YaĢı = 4) (Mesleği = 22) ve (Öğrenim_durumu = 7) ve (YaĢı = 5) (Mesleği = 22) ve (Öğrenim_durumu = 8) (Mesleği = 23) ve (Öğrenim_durumu = 2) ve (YaĢı = 5) (Mesleği = 23) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 23) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 2) ve (Cinsiyeti = 2) ve (Medeni_durumu = 2) (Mesleği = 23) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 4) ve (Net_geliri = 3) (Mesleği = 23) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (Oturduğu_ev = 1) (Mesleği = 23) ve (Öğrenim_durumu = 6) ve (YaĢı = 6) (Mesleği = 23) ve (Öğrenim_durumu = 7) (Mesleği = 23) ve (Öğrenim_durumu = 8) (Mesleği = 24) ve (Öğrenim_durumu = 4) ve (ÇalıĢma_Ģekli = 1) 94 (Mesleği = 24) ve (Öğrenim_durumu = 4) ve (ÇalıĢma_Ģekli = 2) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 24) ve (Öğrenim_durumu = 4) ve (ÇalıĢma_Ģekli = 3) ve (YaĢı = 2) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 24) ve (Öğrenim_durumu = 4) ve (ÇalıĢma_Ģekli = 3) ve (YaĢı = 3) (Mesleği = 24) ve (Öğrenim_durumu = 5) ve (Net_geliri = 4) ve (YaĢı = 3) (Mesleği = 24) ve (Öğrenim_durumu = 5) ve (Net_geliri = 5) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 2) ve (Cinsiyeti = 1) ve (ÇalıĢma_Ģekli = 3) (Mesleği = 24) ve (Öğrenim_durumu = 5) ve (Net_geliri = 5) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 24) ve (Öğrenim_durumu = 5) ve (Net_geliri = 5) ve (YaĢı = 5) ve (Oturduğu_ev = 4) (Mesleği = 24) ve (Öğrenim_durumu = 5) ve (Net_geliri = 5) ve (YaĢı = 6) (Mesleği = 24) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (YaĢadığı_il = 2) ve (Cinsiyeti = 2) (Mesleği = 24) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (Medeni_durumu = 1) (Mesleği = 24) ve (Öğrenim_durumu = 6) ve (YaĢı = 5) ve (Oturduğu_ev = 1) ve (Cinsiyeti = 1) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 24) ve (Öğrenim_durumu = 6) ve (YaĢı = 5) ve (Oturduğu_ev = 2) ve (Cinsiyeti = 1) ve (Medeni_durumu = 1) (Mesleği = 24) ve (Öğrenim_durumu = 6) ve (YaĢı = 6) ve (Oturduğu_ev = 1) (Mesleği = 24) ve (Öğrenim_durumu = 6) ve (YaĢı = 6) ve (Oturduğu_ev = 2) (Mesleği = 24) ve (Öğrenim_durumu = 6) ve (YaĢı = 6) ve (Oturduğu_ev = 4) ve (Net_geliri = 5) (Mesleği = 24) ve (Öğrenim_durumu = 7) ve (Oturduğu_ev = 1) ve (Cinsiyeti = 2) (Mesleği = 25) ve (Öğrenim_durumu = 1) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 25) ve (Öğrenim_durumu = 2) 95 (Mesleği = 25) ve (Öğrenim_durumu = 4) ve (YaĢı = 5) ve (YaĢadığı_il = 1) (Mesleği = 25) ve (Öğrenim_durumu = 4) ve (YaĢı = 5) ve (YaĢadığı_il = 3) (Mesleği = 25) ve (Öğrenim_durumu = 4) ve (YaĢı = 6) ve (YaĢadığı_il = 1) (Mesleği = 25) ve (Öğrenim_durumu = 5) ve (YaĢı = 4) ve (Net_geliri = 4) (Mesleği = 25) ve (Öğrenim_durumu = 5) ve (YaĢı = 4) ve (Net_geliri = 5) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 1) ve (YaĢadığı_il = 1) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 2) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 2) ve (YaĢı = 6) ve (Medeni_durumu = 2) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 4) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 6) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (En_son_çalıĢma_yılı = 3) ve (Cinsiyeti = 2) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 5) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Cinsiyeti = 2) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 5) ve (YaĢı = 3) ve (YaĢadığı_il = 3) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 5) ve (YaĢı = 4) ve (YaĢadığı_il = 1) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 5) ve (YaĢı = 6) ve (Oturduğu_ev = 1) (Mesleği = 25) ve (Öğrenim_durumu = 7) ve (YaĢı = 6) (Mesleği = 25) ve (Öğrenim_durumu = 8) ve (Net_geliri = 1) ve (YaĢadığı_il = 3) 96 (Mesleği = 25) ve (Öğrenim_durumu = 8) ve (Net_geliri = 2) ve (YaĢadığı_il = 5) (Mesleği = 26) ve (Öğrenim_durumu = 2) ve (Net_geliri = 4) (Mesleği = 26) ve (Öğrenim_durumu = 2) ve (Net_geliri = 5) ve (YaĢı = 3) ve (Medeni_durumu = 1) (Mesleği = 26) ve (Öğrenim_durumu = 2) ve (Net_geliri = 5) ve (YaĢı = 6) (Mesleği = 26) ve (Öğrenim_durumu = 4) ve (YaĢı = 2) ve (Oturduğu_ev = 2) (Mesleği = 26) ve (Öğrenim_durumu = 4) ve (YaĢı = 3) ve (Medeni_durumu = 1) (Mesleği = 26) ve (Öğrenim_durumu = 4) ve (YaĢı = 4) (Mesleği = 26) ve (Öğrenim_durumu = 4) ve (YaĢı = 5) ve (Oturduğu_ev = 1) ve (Net_geliri = 5) (Mesleği = 26) ve (Öğrenim_durumu = 4) ve (YaĢı = 5) ve (Oturduğu_ev = 3) (Mesleği = 26) ve (Öğrenim_durumu = 5) ve (Net_geliri = 1) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 4) (Mesleği = 26) ve (Öğrenim_durumu = 5) ve (Net_geliri = 3) ve (YaĢadığı_il = 1) (Mesleği = 26) ve (Öğrenim_durumu = 5) ve (Net_geliri = 3) ve (YaĢadığı_il = 4) (Mesleği = 26) ve (Öğrenim_durumu = 5) ve (Net_geliri = 5) ve (YaĢı = 6) (Mesleği = 26) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 26) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 2) ve (Oturduğu_ev = 4) (Mesleği = 26) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 5) ve (YaĢı = 3) ve (Medeni_durumu = 1) (Mesleği = 26) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 3) ve (YaĢı = 6) (Mesleği = 26) ve (Öğrenim_durumu = 7) ve (YaĢı = 6) (Mesleği = 26) ve (Öğrenim_durumu = 8) ve (En_son_çalıĢma_yılı = 1) 97 (Mesleği = 26) ve (Öğrenim_durumu = 8) ve (En_son_çalıĢma_yılı = 2) ve (EĢi_çalıĢıyor_mu = 1) (Mesleği = 27) ve (Öğrenim_durumu = 4) ve (Cinsiyeti = 1) ve (YaĢı = 3) (Mesleği = 27) ve (Öğrenim_durumu = 5) ve (YaĢı = 4) (Mesleği = 27) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 4) ve (Medeni_durumu = 2) (Mesleği = 27) ve (Öğrenim_durumu = 7) ve (YaĢı = 6) (Mesleği = 27) ve (Öğrenim_durumu = 8) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 28) ve (Öğrenim_durumu = 4) ve (Oturduğu_ev = 1) ve (Net_geliri = 2) (Mesleği = 28) ve (Öğrenim_durumu = 4) ve (Oturduğu_ev = 1) ve (Net_geliri = 4) (Mesleği = 28) ve (Öğrenim_durumu = 4) ve (Oturduğu_ev = 2) ve (YaĢı = 5) (Mesleği = 28) ve (Öğrenim_durumu = 4) ve (Oturduğu_ev = 4) ve (Medeni_durumu = 1) (Mesleği = 28) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 3) ve (Medeni_durumu = 1) ve (YaĢadığı_il = 1) (Mesleği = 28) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 4) (Mesleği = 28) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 5) (Mesleği = 28) ve (Öğrenim_durumu = 6) ve (YaĢı = 2) (Mesleği = 28) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (Cinsiyeti = 1) ve (YaĢadığı_il = 3) (Mesleği = 28) ve (Öğrenim_durumu = 6) ve (YaĢı = 5) (Mesleği = 28) ve (Öğrenim_durumu = 6) ve (YaĢı = 6) ve (Medeni_durumu = 1) (Mesleği = 28) ve (Öğrenim_durumu = 7) ve (Cinsiyeti = 2) (Mesleği = 29) ve (ÇalıĢma_Ģekli (En_son_çalıĢma_yılı = 1) = 2) ve (YaĢı = 4) ve 98 (Mesleği = 29) ve (ÇalıĢma_Ģekli = 2) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 29) ve (ÇalıĢma_Ģekli = 3) ve (Medeni_durumu = 2) (Mesleği = 29) ve (ÇalıĢma_Ģekli = 6) ve (Öğrenim_durumu = 4) ve (YaĢadığı_il = 1) (Mesleği = 29) ve (ÇalıĢma_Ģekli = 6) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 5) (Mesleği = 30) ve (Öğrenim_durumu = 2) (Mesleği = 30) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 30) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 4) ve (Cinsiyeti = 2) (Mesleği = 30) ve (Öğrenim_durumu = 5) (Mesleği = 30) ve (Öğrenim_durumu = 6) ve (YaĢadığı_il = 1) ve (Medeni_durumu = 2) (Mesleği = 30) ve (Öğrenim_durumu = 6) ve (YaĢadığı_il = 5) (Mesleği = 30) ve (Öğrenim_durumu = 7) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 31) ve (En_son_çalıĢma_yılı = 1) ve (Cinsiyeti = 2) ve (YaĢadığı_il = 1) (Mesleği = 31) ve (En_son_çalıĢma_yılı = 2) ve (Medeni_durumu = 1) (Mesleği = 31) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 32) ve (Öğrenim_durumu = 2) ve (Cinsiyeti = 1) ve (Medeni_durumu = 1) (Mesleği = 32) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 32) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 2) ve (Cinsiyeti = 2) (Mesleği = 32) ve (Öğrenim_durumu = 6) ve (Medeni_durumu = 1) ve (Cinsiyeti = 1) (Mesleği = 33) ve (Öğrenim_durumu = 2) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 33) ve (Öğrenim_durumu = 2) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 3) (Mesleği = 33) ve (Öğrenim_durumu = 2) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 5) ve (Oturduğu_ev = 1) ve (YaĢı = 2) 99 (Mesleği = 33) ve (Öğrenim_durumu = 2) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 5) ve (Oturduğu_ev = 1) ve (YaĢı = 3) ve (Medeni_durumu = 1) (Mesleği = 33) ve (Öğrenim_durumu = 4) ve (ÇalıĢma_Ģekli = 2) ve (YaĢı = 2) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 33) ve (Öğrenim_durumu = 4) ve (ÇalıĢma_Ģekli = 2) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Cinsiyeti = 1) ve (Medeni_durumu = 1) (Mesleği = 33) ve (Öğrenim_durumu = 4) ve (ÇalıĢma_Ģekli = 6) ve (YaĢadığı_il = 1) ve (Oturduğu_ev = 2) (Mesleği = 33) ve (Öğrenim_durumu = 4) ve (ÇalıĢma_Ģekli = 6) ve (YaĢadığı_il = 2) (Mesleği = 33) ve (Öğrenim_durumu = 4) ve (ÇalıĢma_Ģekli = 6) ve (YaĢadığı_il = 4) (Mesleği = 33) ve (Öğrenim_durumu = 5) ve (ÇalıĢma_Ģekli = 2) ve (Cinsiyeti = 1) (Mesleği = 33) ve (Öğrenim_durumu = 5) ve (ÇalıĢma_Ģekli = 6) ve (YaĢadığı_il = 5) (Mesleği = 33) ve (Öğrenim_durumu = 6) ve (YaĢı = 1) ve (Oturduğu_ev = 2) (Mesleği = 33) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (Medeni_durumu = 1) (Mesleği = 33) ve (Öğrenim_durumu = 6) ve (YaĢı = 6) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 34) ve (Öğrenim_durumu = 1) (Mesleği = 34) ve (Öğrenim_durumu = 2) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 34) ve (Öğrenim_durumu = 2) ve (YaĢadığı_il = 2) (Mesleği = 34) ve (Öğrenim_durumu = 4) ve (YaĢadığı_il = 1) ve (YaĢı = 3) ve (Oturduğu_ev = 1) (Mesleği = 34) ve (Öğrenim_durumu = 4) ve (YaĢadığı_il = 1) ve (YaĢı = 3) ve (Oturduğu_ev = 4) 100 (Mesleği = 34) ve (Öğrenim_durumu = 4) ve (YaĢadığı_il = 1) ve (YaĢı = 5) ve (Medeni_durumu = 1) (Mesleği = 34) ve (Öğrenim_durumu = 4) ve (YaĢadığı_il = 1) ve (YaĢı = 5) ve (Medeni_durumu = 2) ve (EĢi_çalıĢıyor_mu = 2) (Mesleği = 34) ve (Öğrenim_durumu = 4) ve (YaĢadığı_il = 2) ve (Cinsiyeti = 2) (Mesleği = 34) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 1) (Mesleği = 34) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 2) (Mesleği = 35) ve (Öğrenim_durumu = 4) ve (YaĢı = 1) (Mesleği = 35) ve (Öğrenim_durumu = 4) ve (YaĢı = 2) ve (EĢi_çalıĢıyor_mu = 1) (Mesleği = 35) ve (Öğrenim_durumu = 4) ve (YaĢı = 3) ve (YaĢadığı_il = 3) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 35) ve (Öğrenim_durumu = 5) ve (YaĢı = 4) ve (YaĢadığı_il = 1) (Mesleği = 35) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (Medeni_durumu = 1) ve (Cinsiyeti = 1) (Mesleği = 35) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (Cinsiyeti = 1) ve (Oturduğu_ev = 1) (Mesleği = 35) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (Cinsiyeti = 2) ve (Net_geliri = 5) ve (YaĢadığı_il = 1) (Mesleği = 35) ve (Öğrenim_durumu = 6) ve (YaĢı = 6) (Mesleği = 35) ve (Öğrenim_durumu = 7) ve (YaĢı = 4) ve (YaĢadığı_il = 1) (Mesleği = 35) ve (Öğrenim_durumu = 8) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 36) ve (Öğrenim_durumu = 4) ve (Medeni_durumu = 2) (Mesleği = 36) ve (Öğrenim_durumu = 6) (Mesleği = 37) ve (YaĢı = 2) ve (YaĢadığı_il = 2) ve (Cinsiyeti = 1) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 2) ve (Medeni_durumu = 1) ve (Net_geliri = 5) 101 (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 4) ve (Medeni_durumu = 2) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 1) ve (Cinsiyeti = 1) ve (Medeni_durumu = 1) ve (EĢi_çalıĢıyor_mu = 1) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 1) ve (Cinsiyeti = 1) ve (Medeni_durumu = 2) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 4) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 2) ve (Öğrenim_durumu = 4) ve (Cinsiyeti = 1) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 2) ve (Öğrenim_durumu = 6) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 3) ve (Öğrenim_durumu = 5) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 4) ve (Medeni_durumu = 2) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 5) ve (Öğrenim_durumu = 8) (Mesleği = 37) ve (YaĢı = 4) ve (Net_geliri = 1) (Mesleği = 37) ve (YaĢı = 4) ve (Net_geliri = 3) ve (Öğrenim_durumu = 2) (Mesleği = 37) ve (YaĢı = 4) ve (Net_geliri = 3) ve (Öğrenim_durumu = 4) ve (YaĢadığı_il = 2) (Mesleği = 37) ve (YaĢı = 4) ve (Net_geliri = 3) ve (Öğrenim_durumu = 7) (Mesleği = 37) ve (YaĢı = 4) ve (Net_geliri = 5) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 37) ve (YaĢı = 5) ve (Öğrenim_durumu = 2) (Mesleği = 37) ve (YaĢı = 5) ve (Öğrenim_durumu = 4) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 37) ve (YaĢı = 5) ve (Öğrenim_durumu = 4) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 4) 102 (Mesleği = 37) ve (YaĢı = 5) ve (Öğrenim_durumu = 4) ve (YaĢadığı_il = 5) (Mesleği = 37) ve (YaĢı = 6) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 38) ve (YaĢı = 1) ve (YaĢadığı_il = 4) ve (Net_geliri = 3) (Mesleği = 38) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 1) ve (Medeni_durumu = 1) (Mesleği = 38) ve (YaĢı = 4) ve (Cinsiyeti = 2) (Mesleği = 38) ve (YaĢı = 5) ve (Öğrenim_durumu = 1) (Mesleği = 38) ve (YaĢı = 6) ve (YaĢadığı_il = 1) (Mesleği = 39) (Mesleği = 40) ve (YaĢı = 4) (Mesleği = 41) ve (YaĢı = 6) (Mesleği = 42) ve (YaĢı = 1) ve (Net_geliri = 1) ve (Oturduğu_ev = 1) (Mesleği = 42) ve (YaĢı = 1) ve (Net_geliri = 5) ve (YaĢadığı_il = 1) ve (Cinsiyeti = 1) (Mesleği = 42) ve (YaĢı = 2) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 4) ve (Cinsiyeti = 1) ve (Oturduğu_ev = 2) (Mesleği = 42) ve (YaĢı = 2) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 5) ve (Net_geliri = 1) (Mesleği = 42) ve (YaĢı = 2) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 6) ve (otovarmi = 1) (Mesleği = 42) ve (YaĢı = 2) ve (YaĢadığı_il = 2) ve (Öğrenim_durumu = 2) (Mesleği = 42) ve (YaĢı = 2) ve (YaĢadığı_il = 5) ve (Medeni_durumu = 1) (Mesleği = 42) ve (YaĢı = 2) ve (YaĢadığı_il = 5) ve (Medeni_durumu = 2) ve (Net_geliri = 3) (Mesleği = 42) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 1) ve (Oturduğu_ev = 3) (Mesleği = 42) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 1) ve (Oturduğu_ev = 4) (Mesleği = 42) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 2) ve (Öğrenim_durumu = 2) 103 (Mesleği = 42) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 4) ve (Cinsiyeti = 1) ve (Medeni_durumu = 1) (Mesleği = 42) ve (YaĢı = 4) ve (Öğrenim_durumu = 5) (Mesleği = 42) ve (YaĢı = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 1) ve (Net_geliri = 2) ve (EĢi_çalıĢıyor_mu = 2) (Mesleği = 42) ve (YaĢı = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 2) ve (Öğrenim_durumu = 2) (Mesleği = 42) ve (YaĢı = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 4) ve (Net_geliri = 2) (Mesleği = 42) ve (YaĢı = 5) ve (YaĢadığı_il = 3) (Mesleği = 42) ve (YaĢı = 6) ve (Öğrenim_durumu = 2) ve (Medeni_durumu = 2) Kural 1‟e uygun iĢlem yaparak yatırım hesabını kapatan müĢterilerin sosyodemografik karakteristiğinden bir kesit ġekil 6.2‟ de verilmiĢtir. ġekil 6.2. Kural 1‟e uygun iĢlem yaparak yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiğinden bir kesit 104 Kural 2 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 2: Eğer (t-7 = S) ve (t-6 = S) ve (t-1 = D8) = P (354, % 23,84) Sosyo-demografik karakteristik; (Mesleği = 3) ve (YaĢı = 3) ve (Net_geliri = 2) ve (Cinsiyeti = 1) (Mesleği = 3) ve (YaĢı = 3) ve (Net_geliri = 5) ve (Medeni_durumu = 2) ve (Öğrenim_durumu = 7) (Mesleği = 3) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 2) (Mesleği = 4) ve (Cinsiyeti = 1) (Mesleği = 5) ve (YaĢı = 2) (Mesleği = 5) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 2) ve (Öğrenim_durumu = 5) ve (Cinsiyeti = 1) ve (Medeni_durumu = 2) (Mesleği = 5) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 2) ve (Öğrenim_durumu = 6) ve (Oturduğu_ev = 3) (Mesleği = 5) ve (YaĢı = 5) ve (Öğrenim_durumu = 6) ve (YaĢadığı_il = 1) (Mesleği = 5) ve (YaĢı = 6) ve (YaĢadığı_il = 2) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 5) ve (YaĢı = 6) ve (YaĢadığı_il = 2) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 5) ve (YaĢı = 6) ve (YaĢadığı_il = 3) (Mesleği = 5) ve (YaĢı = 6) ve (YaĢadığı_il = 4) (Mesleği = 7) ve (En_son_çalıĢma_yılı = 1) ve (Cinsiyeti = 1) ve () (Mesleği = 7) ve (En_son_çalıĢma_yılı = 4) ve (Cinsiyeti = 2) ve () (Mesleği = 8) ve (Öğrenim_durumu = 1) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 8) ve (Öğrenim_durumu = 2) ve (YaĢı = 3) (Mesleği = 8) ve (Öğrenim_durumu = 4) ve (YaĢı = 2) ve (Medeni_durumu = 2) (Mesleği = 8) ve (Öğrenim_durumu = 4) ve (YaĢı = 4) ve (Cinsiyeti = 2) 105 (Mesleği = 8) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 5) ve (Cinsiyeti = 2) (Mesleği = 8) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 3) ve (Medeni_durumu = 2) (Mesleği = 8) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 2) ve (YaĢı = 4) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (En_son_çalıĢma_yılı = 1) ve (YaĢadığı_il = 2) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 3) ve (Oturduğu_ev = 2) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 4) ve (EĢi_çalıĢıyor_mu = 2) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 5) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (YaĢı = 3) ve (Cinsiyeti = 2) ve (En_son_çalıĢma_yılı = 2) ve ( Medeni_durumu = 1) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (YaĢı = 4) ve (Oturduğu_ev = 1) ve (YaĢadığı_il = 2) ve (Cinsiyeti = 2) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (YaĢı = 4) ve (Oturduğu_ev = 1) ve (YaĢadığı_il = 3) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (YaĢı = 4) ve (Oturduğu_ev = 2) (Mesleği = 8) ve (Öğrenim_durumu = 7) ve (YaĢı = 4) ve (Oturduğu_ev = 1) (Mesleği = 8) ve (Öğrenim_durumu = 7) ve (YaĢı = 6) ve (YaĢadığı_il = 1) (Mesleği = 9) ve (Öğrenim_durumu = 1) (Mesleği = 9) ve (Öğrenim_durumu = 2) ve (Cinsiyeti = 2) ve (Oturduğu_ev = 1) (Mesleği = 9) ve (Öğrenim_durumu = 4) ve (YaĢı = 2) ve (Medeni_durumu = 2) ve (YaĢadığı_il = 1) (Mesleği = 9) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 1) ve (Medeni_durumu = 1) (YaĢı = 3) ve 106 (Mesleği = 9) ve (Öğrenim_durumu = 4) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 2) ve (Medeni_durumu = 1) (Mesleği = 9) ve (Öğrenim_durumu = 5) ve (Oturduğu_ev = 1) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 6) (Mesleği = 9) ve (Öğrenim_durumu = 5) ve (Oturduğu_ev = 1) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 2) (Mesleği = 9) ve (Öğrenim_durumu = 6) ve (Net_geliri = 3) ve (YaĢadığı_il = 1) ve (YaĢı = 4) ve (Medeni_durumu = 2) ve (En_son_çalıĢma_yılı = 2) ve (Cinsiyeti = 1) (Mesleği = 9) ve (Öğrenim_durumu = 6) ve (Net_geliri = 3) ve (YaĢadığı_il = 2) (Mesleği = 9) ve (Öğrenim_durumu = 6) ve (Net_geliri = 3) ve (YaĢadığı_il = 3) ve (Cinsiyeti = 1) (Mesleği = 9) ve (Öğrenim_durumu = 6) ve (Net_geliri = 5) ve (En_son_çalıĢma_yılı = 1) ve (Oturduğu_ev = 2) (Mesleği = 9) ve (Öğrenim_durumu = 6) ve (Net_geliri = 5) ve (En_son_çalıĢma_yılı = 2) ve (Cinsiyeti = 2) (Mesleği = 9) ve (Öğrenim_durumu = 6) ve (Net_geliri = 5) ve (En_son_çalıĢma_yılı = 4) ve (Cinsiyeti = 1) (Mesleği = 9) ve (Öğrenim_durumu = 7) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 4) ve (Cinsiyeti = 1) (Mesleği = 9) ve (Öğrenim_durumu = 7) ve (En_son_çalıĢma_yılı = 2) ve (YaĢadığı_il = 3) (Mesleği = 9) ve (Öğrenim_durumu = 7) ve (En_son_çalıĢma_yılı = 3) ve (Net_geliri = 5) (Mesleği = 9) ve (Öğrenim_durumu = 8) ve (Cinsiyeti = 1) ve (YaĢadığı_il = 1) (Mesleği = 10) ve (Net_geliri = 1) ve (En_son_çalıĢma_yılı = 3) ve (Cinsiyeti = 2) (Mesleği = 10) ve (Net_geliri = 1) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 10) ve (Net_geliri = 2) ve (YaĢı = 3) ve (Öğrenim_durumu = 4) 107 (Mesleği = 10) ve (Net_geliri = 2) ve (YaĢı = 3) ve (Öğrenim_durumu = 6) ve (Cinsiyeti = 1) (Mesleği = 10) ve (Net_geliri = 2) ve (YaĢı = 4) ve (Cinsiyeti = 2) (Mesleği = 10) ve (Net_geliri = 3) ve (YaĢı = 3) ve (Medeni_durumu = 1) ve (Oturduğu_ev = 1) (Mesleği = 10) ve (Net_geliri = 3) ve (YaĢı = 3) ve (Medeni_durumu = 1) ve (Oturduğu_ev = 2) (Mesleği = 10) ve (Net_geliri = 3) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 10) ve (Net_geliri = 4) ve (Öğrenim_durumu = 4) ve (YaĢı = 3) ve (Cinsiyeti = 2) (Mesleği = 10) ve (Net_geliri = 4) ve (Öğrenim_durumu = 4) ve (YaĢı = 4) (Mesleği = 10) ve (Net_geliri = 4) ve (Öğrenim_durumu = 5) ve (YaĢı = 3) ve (Cinsiyeti = 1) ve (Oturduğu_ev = 1) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 1) ve (Öğrenim_durumu = 4) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 3) ve (EĢi_çalıĢıyor_mu = 1) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 4) ve (Cinsiyeti = 2) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 5) ve (Öğrenim_durumu = 8) (Mesleği = 11) ve (YaĢı = 1) ve (YaĢadığı_il = 2) (Mesleği = 11) ve (YaĢı = 2) ve (Net_geliri = 5) ve (Oturduğu_ev = 1) (Mesleği = 11) ve (YaĢı = 2) ve (Net_geliri = 5) ve (Oturduğu_ev = 2) ve (Cinsiyeti = 1) (Mesleği = 11) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 1) ve (Öğrenim_durumu = 4) ve (Oturduğu_ev = 3) (Mesleği = 11) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 1) ve (Öğrenim_durumu = 5) (Mesleği = 11) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 2) ve (EĢi_çalıĢıyor_mu = 1) (Mesleği = 11) ve (YaĢı = 4) ve (Öğrenim_durumu = 1) 108 (Mesleği = 11) ve (YaĢı = 4) ve (Öğrenim_durumu = 2) (Mesleği = 11) ve (YaĢı = 4) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 4) ve (Cinsiyeti = 1) (Mesleği = 11) ve (YaĢı = 4) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 1) ve (Cinsiyeti = 2) (Mesleği = 11) ve (YaĢı = 4) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 3) (Mesleği = 11) ve (YaĢı = 4) ve (Öğrenim_durumu = 6) ve (Oturduğu_ev = 1) ve (Net_geliri = 5) (Mesleği = 11) ve (YaĢı = 4) ve (Öğrenim_durumu = 7) (Mesleği = 11) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 1) ve (Öğrenim_durumu = 1) (Mesleği = 11) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 1) ve (Öğrenim_durumu = 4) (Mesleği = 11) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 3) ve (Öğrenim_durumu = 1) (Mesleği = 11) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 3) ve (Öğrenim_durumu = 2) (Mesleği = 11) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 12) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 2) ve (Oturduğu_ev = 2) (Mesleği = 12) ve (YaĢı = 4) ve (YaĢadığı_il = 1) ve (Cinsiyeti = 2) (Mesleği = 12) ve (YaĢı = 5) ve (Öğrenim_durumu = 2) ve (Cinsiyeti = 1) (Mesleği = 12) ve (YaĢı = 5) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 12) ve (YaĢı = 5) ve (Öğrenim_durumu = 8) ve (YaĢadığı_il = 1) (Mesleği = 13) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 4) (Mesleği = 13) ve (Öğrenim_durumu = 5) ve (ÇalıĢma_Ģekli = 2) (Mesleği = 13) ve (Öğrenim_durumu = 5) ve (ÇalıĢma_Ģekli = 8) (Mesleği = 13) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) 109 (Mesleği = 14) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 2) (Mesleği = 14) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 14) ve (Öğrenim_durumu = 5) ve (Net_geliri = 3) (Mesleği = 14) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (Net_geliri = 3) (Mesleği = 14) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (Net_geliri = 5) (Mesleği = 14) ve (Öğrenim_durumu = 6) ve (YaĢı = 5) (Mesleği = 14) ve (Öğrenim_durumu = 7) ve (Medeni_durumu = 2) (Mesleği = 14) ve (Öğrenim_durumu = 8) ve (Cinsiyeti = 1) (Mesleği = 15) ve (Öğrenim_durumu = 4) ve (Oturduğu_ev = 3) (Mesleği = 15) ve (Öğrenim_durumu = 5) ve (Oturduğu_ev = 1) (Mesleği = 15) ve (Öğrenim_durumu = 8) (Mesleği = 18) ve (Öğrenim_durumu = 6) ve (YaĢadığı_il = 5) (Mesleği = 18) ve (Öğrenim_durumu = 7) ve (YaĢı = 4) ve (Oturduğu_ev = 4) (Mesleği = 19) ve (Öğrenim_durumu = 2) ve (Oturduğu_ev = 1) (Mesleği = 19) ve (Öğrenim_durumu = 2) ve (Oturduğu_ev = 3) ve (Cinsiyeti = 1) (Mesleği = 19) ve (Öğrenim_durumu = 2) ve (Oturduğu_ev = 3) ve (Cinsiyeti = 2) ve (Medeni_durumu = 1) (Mesleği = 19) ve (Öğrenim_durumu = 4) ve (YaĢı = 3) ve (Medeni_durumu = 1) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 19) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 19) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 19) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 2) ve (Medeni_durumu = 2) (Mesleği = 19) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 19) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 19) ve (Öğrenim_durumu = 6) ve (YaĢı = 6) ve (YaĢadığı_il = 2) 110 (Mesleği = 19) ve (Öğrenim_durumu = 6) ve (YaĢı = 6) ve (YaĢadığı_il = 4) (Mesleği = 20) ve (En_son_çalıĢma_yılı = 1) ve (Medeni_durumu = 1) (Mesleği = 20) ve (En_son_çalıĢma_yılı = 2) ve (Medeni_durumu = 1) (Mesleği = 21) ve (Öğrenim_durumu = 2) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 3) ve (Cinsiyeti = 1) (Mesleği = 21) ve (Öğrenim_durumu = 2) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 21) ve (Öğrenim_durumu = 2) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 21) ve (Öğrenim_durumu = 4) ve (Net_geliri = 1) ve (En_son_çalıĢma_yılı = 2) ve (Medeni_durumu = 2) ve (YaĢadığı_il = 1) (Mesleği = 21) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 1) ve (Net_geliri = 1) (Mesleği = 21) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 1) ve (Net_geliri = 5) (Mesleği = 21) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 1) ve (Net_geliri = 1) ve (Cinsiyeti = 2) ve (YaĢı = 3) (Mesleği = 21) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 1) ve (Net_geliri = 3) ve (Cinsiyeti = 1) (Mesleği = 21) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 3) (Mesleği = 21) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 4) (Mesleği = 21) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 1) ve (YaĢadığı_il = 1) ve (YaĢı = 4) (Mesleği = 21) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 1) ve (Oturduğu_ev = 3) (Mesleği = 21) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 1) ve (Oturduğu_ev = 4) (Mesleği = 21) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 3) ve (Medeni_durumu = 2) (Mesleği = 21) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 5) ve (Cinsiyeti = 2) 111 (Mesleği = 21) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 4) ve (YaĢı = 4) (Mesleği = 21) ve (Öğrenim_durumu = 7) ve (YaĢadığı_il = 3) ve (Oturduğu_ev = 1) (Mesleği = 21) ve (Öğrenim_durumu = 7) ve (YaĢadığı_il = 5) (Mesleği = 22) ve (Öğrenim_durumu = 2) ve (YaĢadığı_il = 2) ve (EĢi_çalıĢıyor_mu = 1) (Mesleği = 22) ve (Öğrenim_durumu = 4) ve (YaĢı = 2) ve (Cinsiyeti = 1) (Mesleği = 22) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 1) ve (Cinsiyeti = 1) (Mesleği = 22) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 3) ve (Oturduğu_ev = 2) (Mesleği = 22) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 22) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 23) ve (Öğrenim_durumu = 2) ve (YaĢı = 3) (Mesleği = 23) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 2) ve (Cinsiyeti = 1) (Mesleği = 23) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 3) ve (Cinsiyeti = 2) (Mesleği = 23) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (Oturduğu_ev = 2) (Mesleği = 23) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (Oturduğu_ev = 3) (Mesleği = 23) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) (Mesleği = 24) ve (Öğrenim_durumu = 4) ve (ÇalıĢma_Ģekli = 2) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 24) ve (Öğrenim_durumu = 4) ve (ÇalıĢma_Ģekli = 5) (Mesleği = 24) ve (Öğrenim_durumu = 5) ve (Net_geliri = 1) (Mesleği = 24) ve (Öğrenim_durumu = 5) ve (Net_geliri = 2) 112 (Mesleği = 24) ve (Öğrenim_durumu = 5) ve (Net_geliri = 4) ve (YaĢı = 4) ve (YaĢadığı_il = 2) (Mesleği = 24) ve (Öğrenim_durumu = 5) ve (Net_geliri = 4) ve (YaĢı = 4) ve (YaĢadığı_il = 3) (Mesleği = 24) ve (Öğrenim_durumu = 5) ve (Net_geliri = 5) ve (YaĢı = 3) ve (Medeni_durumu = 1) (Mesleği = 24) ve (Öğrenim_durumu = 5) ve (Net_geliri = 5) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 2) ve (Cinsiyeti = 1) ve (ÇalıĢma_Ģekli = 1) (Mesleği = 24) ve (Öğrenim_durumu = 5) ve (Net_geliri = 5) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 2) ve (Cinsiyeti = 2) (Mesleği = 24) ve (Öğrenim_durumu = 5) ve (Net_geliri = 5) ve (YaĢı = 5) ve (Oturduğu_ev = 1) (Mesleği = 24) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Oturduğu_ev = 2) (Mesleği = 24) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (YaĢadığı_il = 5) (Mesleği = 24) ve (Öğrenim_durumu = 6) ve (YaĢı = 5) ve (Oturduğu_ev = 1) ve (Cinsiyeti = 1) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 24) ve (Öğrenim_durumu = 6) ve (YaĢı = 5) ve (Oturduğu_ev = 3) (Mesleği = 24) ve (Öğrenim_durumu = 6) ve (YaĢı = 6) ve (Oturduğu_ev = 3) (Mesleği = 24) ve (Öğrenim_durumu = 6) ve (YaĢı = 6) ve (Oturduğu_ev = 4) ve (Net_geliri = 1) (Mesleği = 24) ve (Öğrenim_durumu = 7) ve (Oturduğu_ev = 4) (Mesleği = 25) ve (Öğrenim_durumu = 1) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 25) ve (Öğrenim_durumu = 4) ve (YaĢı = 3) ve (Cinsiyeti = 2) (Mesleği = 25) ve (Öğrenim_durumu = 4) ve (YaĢı = 5) ve (YaĢadığı_il = 4) (Mesleği = 25) ve (Öğrenim_durumu = 5) ve (YaĢı = 3) ve (Cinsiyeti = 2) (Mesleği = 25) ve (Öğrenim_durumu = 5) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 4) 113 (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 1) ve (YaĢadığı_il = 3) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 2) ve (YaĢı = 4) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 3) ve (YaĢı = 5) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 5) ve (YaĢı = 2) ve (Oturduğu_ev = 1) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 5) ve (YaĢı = 3) ve (YaĢadığı_il = 2) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 5) ve (YaĢı = 5) ve (Oturduğu_ev = 3) (Mesleği = 25) ve (Öğrenim_durumu = 8) ve (Net_geliri = 1) ve (YaĢadığı_il = 5) (Mesleği = 25) ve (Öğrenim_durumu = 8) ve (Net_geliri = 4) (Mesleği = 26) ve (Öğrenim_durumu = 1) (Mesleği = 26) ve (Öğrenim_durumu = 2) ve (Net_geliri = 1) ve (YaĢı = 3) (Mesleği = 26) ve (Öğrenim_durumu = 2) ve (Net_geliri = 2) ve (Cinsiyeti = 2) (Mesleği = 26) ve (Öğrenim_durumu = 2) ve (Net_geliri = 5) ve (YaĢı = 3) ve (Medeni_durumu = 2) (Mesleği = 26) ve (Öğrenim_durumu = 4) ve (YaĢı = 3) ve (Medeni_durumu = 2) ve (YaĢadığı_il = 1) (Mesleği = 26) ve (Öğrenim_durumu = 4) ve (YaĢı = 5) ve (Oturduğu_ev = 1) ve (Net_geliri = 1) (Mesleği = 26) ve (Öğrenim_durumu = 4) ve (YaĢı = 5) ve (Oturduğu_ev = 1) ve (Net_geliri = 2) (Mesleği = 26) ve (Öğrenim_durumu = 4) ve (YaĢı = 5) ve (Oturduğu_ev = 2) (Mesleği = 26) ve (Öğrenim_durumu = 4) ve (YaĢı = 6) ve (Oturduğu_ev = 3) 114 (Mesleği = 26) ve (Öğrenim_durumu = 5) ve (Net_geliri = 1) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 26) ve (Öğrenim_durumu = 5) ve (Net_geliri = 2) ve (Medeni_durumu = 2) (Mesleği = 26) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 1) (Mesleği = 26) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 5) ve (YaĢı = 3) ve (Medeni_durumu = 2) (Mesleği = 26) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 26) ve (Öğrenim_durumu = 8) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 27) ve (Öğrenim_durumu = 4) ve (Cinsiyeti = 2) (Mesleği = 27) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 27) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 3) (Mesleği = 27) ve (Öğrenim_durumu = 7) ve (YaĢı = 5) (Mesleği = 28) ve (Öğrenim_durumu = 2) (Mesleği = 28) ve (Öğrenim_durumu = 4) ve (Oturduğu_ev = 2) ve (YaĢı = 2) (Mesleği = 28) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 3) ve (Medeni_durumu = 2) (Mesleği = 28) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 29) ve (ÇalıĢma_Ģekli = 1) (Mesleği = 29) ve (ÇalıĢma_Ģekli = 2) ve (YaĢı = 3) ve (YaĢadığı_il = 1) (Mesleği = 29) ve (ÇalıĢma_Ģekli = 2) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 29) ve (ÇalıĢma_Ģekli = 5) ve (YaĢadığı_il = 1) (Mesleği = 29) ve (ÇalıĢma_Ģekli = 5) ve (YaĢadığı_il = 4) (Mesleği = 29) ve (ÇalıĢma_Ģekli = 6) ve (Öğrenim_durumu = 4) ve (YaĢadığı_il = 4) (Mesleği = 29) ve (ÇalıĢma_Ģekli = 6) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 1) 115 (Mesleği = 30) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 2) ve (Cinsiyeti = 2) (Mesleği = 30) ve (Öğrenim_durumu = 6) ve (YaĢadığı_il = 2) (Mesleği = 31) ve (En_son_çalıĢma_yılı = 1) ve (Cinsiyeti = 1) (Mesleği = 31) ve (En_son_çalıĢma_yılı = 1) ve (Cinsiyeti = 2) ve (YaĢadığı_il = 2) (Mesleği = 32) ve (Öğrenim_durumu = 2) ve (Cinsiyeti = 1) ve (Medeni_durumu = 2) (Mesleği = 32) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 32) ve (Öğrenim_durumu = 6) ve (Medeni_durumu = 2) ve (YaĢadığı_il = 2) (Mesleği = 33) ve (Öğrenim_durumu = 1) ve (YaĢı = 4) (Mesleği = 33) ve (Öğrenim_durumu = 2) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 5) ve (Oturduğu_ev = 1) ve (YaĢı = 3) ve (Medeni_durumu = 2) (Mesleği = 33) ve (Öğrenim_durumu = 2) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 5) ve (Oturduğu_ev = 1) ve (YaĢı = 5) (Mesleği = 33) ve (Öğrenim_durumu = 2) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 5) ve (Oturduğu_ev = 2) (Mesleği = 33) ve (Öğrenim_durumu = 4) ve (ÇalıĢma_Ģekli = 2) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Cinsiyeti = 2) (Mesleği = 33) ve (Öğrenim_durumu = 4) ve (ÇalıĢma_Ģekli = 2) ve (YaĢı = 3) ve (YaĢadığı_il = 3) (Mesleği = 33) ve (Öğrenim_durumu = 4) ve (ÇalıĢma_Ģekli = 3) (Mesleği = 33) ve (Öğrenim_durumu = 4) ve (ÇalıĢma_Ģekli = 8) (Mesleği = 33) ve (Öğrenim_durumu = 5) ve (ÇalıĢma_Ģekli = 3) ve (Cinsiyeti = 1) ve (YaĢı = 3) (Mesleği = 33) ve (Öğrenim_durumu = 6) ve (YaĢı = 6) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 33) ve (Öğrenim_durumu = 7) ve (YaĢadığı_il = 5) (Mesleği = 34) ve (Öğrenim_durumu = 2) ve (YaĢadığı_il = 4) 116 (Mesleği = 34) ve (Öğrenim_durumu = 4) ve (YaĢadığı_il = 1) ve (YaĢı = 4) ve (Cinsiyeti = 1) (Mesleği = 34) ve (Öğrenim_durumu = 4) ve (YaĢadığı_il = 2) ve (Cinsiyeti = 1) (Mesleği = 34) ve (Öğrenim_durumu = 4) ve (YaĢadığı_il = 3) ve (Cinsiyeti = 2) (Mesleği = 34) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 6) (Mesleği = 34) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 3) (Mesleği = 34) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 4) ve (Oturduğu_ev = 2) (Mesleği = 34) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 4) ve (Oturduğu_ev = 4) (Mesleği = 35) ve (Öğrenim_durumu = 2) ve (YaĢı = 3) ve () ve (Mesleği = 35) ve (Öğrenim_durumu = 4) ve (YaĢı = 2) ve (EĢi_çalıĢıyor_mu = 2) (Mesleği = 35) ve (Öğrenim_durumu = 4) ve (YaĢı = 3) ve (YaĢadığı_il = 3) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 35) ve (Öğrenim_durumu = 4) ve (YaĢı = 4) ve (EĢi_çalıĢıyor_mu = 1) (Mesleği = 35) ve (Öğrenim_durumu = 5) ve (YaĢı = 5) ve (Cinsiyeti = 1) ve (Medeni_durumu = 1) (Mesleği = 35) ve (Öğrenim_durumu = 5) ve (YaĢı = 5) ve (Cinsiyeti = 1) ve (Medeni_durumu = 2) ve (YaĢadığı_il = 5) (Mesleği = 35) ve (Öğrenim_durumu = 6) ve (YaĢı = 1) (Mesleği = 35) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (Medeni_durumu = 2) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 35) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (Cinsiyeti = 2) ve (Net_geliri = 4) (Mesleği = 35) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (Cinsiyeti = 2) ve (Net_geliri = 5) ve (YaĢadığı_il = 2) 117 (Mesleği = 35) ve (Öğrenim_durumu = 7) ve (YaĢı = 4) ve (YaĢadığı_il = 3) (Mesleği = 36) ve (Öğrenim_durumu = 4) ve (Medeni_durumu = 1) (Mesleği = 37) ve (YaĢı = 2) ve (YaĢadığı_il = 4) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 2) ve (Medeni_durumu = 1) ve (Net_geliri = 3) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 4) ve (Medeni_durumu = 1) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 5) ve (Cinsiyeti = 2) ve (Medeni_durumu = 1) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 7) ve (Medeni_durumu = 1) (Mesleği = 37) ve (YaĢı = 4) ve (Net_geliri = 3) ve (Öğrenim_durumu = 1) (Mesleği = 37) ve (YaĢı = 4) ve (Net_geliri = 5) ve (En_son_çalıĢma_yılı = 2) ve (Öğrenim_durumu = 5) (Mesleği = 37) ve (YaĢı = 5) ve (Öğrenim_durumu = 4) ve (YaĢadığı_il = 4) (Mesleği = 37) ve (YaĢı = 5) ve (Öğrenim_durumu = 6) (Mesleği = 37) ve (YaĢı = 6) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 38) ve (YaĢı = 1) ve (YaĢadığı_il = 2) ve (Net_geliri = 1) (Mesleği = 38) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 1) ve (Medeni_durumu = 2) (Mesleği = 38) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 2) ve (YaĢadığı_il = 1) (Mesleği = 38) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 40) ve (YaĢı = 6) (Mesleği = 41) ve (YaĢı = 5) (Mesleği = 42) ve (YaĢı = 1) ve (Net_geliri = 1) ve (Oturduğu_ev = 3) (Mesleği = 42) ve (YaĢı = 1) ve (Net_geliri = 2) (Mesleği = 42) ve (YaĢı = 1) ve (Net_geliri = 3) ve (Oturduğu_ev = 1) ve (Cinsiyeti = 1) 118 (Mesleği = 42) ve (YaĢı = 1) ve (Net_geliri = 3) ve (Oturduğu_ev = 1) ve (Cinsiyeti = 2) (Mesleği = 42) ve (YaĢı = 1) ve (Net_geliri = 5) ve (YaĢadığı_il = 3) (Mesleği = 42) ve (YaĢı = 2) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 2) ve (Net_geliri = 2) (Mesleği = 42) ve (YaĢı = 2) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 4) ve (Cinsiyeti = 2) (Mesleği = 42) ve (YaĢı = 2) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 5) ve (Net_geliri = 2) (Mesleği = 42) ve (YaĢı = 2) ve (YaĢadığı_il = 5) ve (Medeni_durumu = 2) ve (Net_geliri = 2) (Mesleği = 42) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 2) ve (Öğrenim_durumu = 4) ve (Medeni_durumu = 1) ve (YaĢadığı_il = 1) (Mesleği = 42) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 2) ve (Öğrenim_durumu = 6) (Mesleği = 42) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 3) ve (Medeni_durumu = 1) ve (Cinsiyeti = 1) (Mesleği = 42) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 4) ve (Cinsiyeti = 1) ve (Medeni_durumu = 2) (Mesleği = 42) ve (YaĢı = 4) ve (Öğrenim_durumu = 4) ve () ve () ve (Mesleği = 42) ve (YaĢı = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 1) ve (Öğrenim_durumu = 2) ve (Net_geliri = 1) (Mesleği = 42) ve (YaĢı = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 1) ve (Net_geliri = 2) ve (EĢi_çalıĢıyor_mu = 1) (Mesleği = 42) ve (YaĢı = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 2) ve (Öğrenim_durumu = 6) (Mesleği = 42) ve (YaĢı = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 4) (Mesleği = 42) ve (YaĢı = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 3) ve (Medeni_durumu = 2) (Mesleği = 42) ve (YaĢı = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 4) ve (Net_geliri = 1) ve (Medeni_durumu = 2) ve (Oturduğu_ev = 1) 119 (Mesleği = 42) ve (YaĢı = 5) ve (YaĢadığı_il = 2) ve (Medeni_durumu = 2) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 42) ve (YaĢı = 5) ve (YaĢadığı_il = 5) ve (En_son_çalıĢma_yılı = 1) Mesleği = 42) ve (YaĢı = 6) ve (Öğrenim_durumu = 2) ve (Medeni_durumu = 1) (Mesleği = 42) ve (YaĢı = 6) ve (Öğrenim_durumu = 6) Kural 2‟ye uygun iĢlem yaparak yatırım hesabını kapatan müĢterilerin sosyodemografik karakteristiğinden bir kesit ġekil 6.3‟de verilmiĢtir. ġekil 6.3. Kural 2‟ye uygun iĢlem yaparak yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiğinden bir kesit Kural 3 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 3: Eğer (t-3 = D8) ve (t-2 = S) ve (t-1 = S) = P (212, % 14,28) Sosyo-demografik karakteristik; 120 (Mesleği = 3) ve (YaĢı = 2) ve (En_son_çalıĢma_yılı = 1) ve (YaĢadığı_il = 1) (Mesleği = 3) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 1) ve (ÇalıĢma_Ģekli = 2) ve (Cinsiyeti = 2) ve (Net_geliri = 3) (Mesleği = 3) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 3) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 4) ve (Cinsiyeti = 1) (Mesleği = 3) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 1) ve (Oturduğu_ev = 3) (Mesleği = 3) ve (YaĢı = 6) ve (Öğrenim_durumu = 7) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 5) ve (YaĢı = 3) ve (Medeni_durumu = 2) ve = 3) ve (Medeni_durumu = 2) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 5) ve (YaĢı (En_son_çalıĢma_yılı = 4) (Mesleği = 5) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 5) ve (YaĢı = 6) ve (YaĢadığı_il = 2) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 8) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 4) ve (Cinsiyeti = 1) (Mesleği = 8) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 5) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 3) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (YaĢı = 2) ve (Cinsiyeti = 1) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (YaĢı = 3) ve (Cinsiyeti = 1) ve (ÇalıĢma_Ģekli = 2) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (YaĢı = 5) ve (Cinsiyeti = 2) ve (Medeni_durumu = 2) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (YaĢı = 6) ve (Cinsiyeti = 1) (Mesleği = 8) ve (Öğrenim_durumu = 7) ve (YaĢı = 4) ve (Oturduğu_ev = 4) 121 (Mesleği = 9) ve (Öğrenim_durumu = 4) ve (YaĢı = 2) ve (Medeni_durumu = 1) (Mesleği = 9) ve (Öğrenim_durumu = 4) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 2) ve (Medeni_durumu = 2) (Mesleği = 9) ve (Öğrenim_durumu = 4) ve (YaĢı = 4) ve (Net_geliri = 3) ve (Medeni_durumu = 1) (Mesleği = 9) ve (Öğrenim_durumu = 4) ve (YaĢı = 6) (Mesleği = 9) ve (Öğrenim_durumu = 5) ve (Oturduğu_ev = 1) ve (En_son_çalıĢma_yılı = 4) ve (YaĢadığı_il = 1) (Mesleği = 9) ve (Öğrenim_durumu = 6) ve (Net_geliri = 3) ve (YaĢadığı_il = 1) ve (YaĢı = 3) ve (Medeni_durumu = 1) (Mesleği = 9) ve (Öğrenim_durumu = 6) ve (Net_geliri = 3) ve (YaĢadığı_il = 1) ve (YaĢı = 4) ve (Medeni_durumu = 1) ve (Oturduğu_ev = 1) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 9) ve (Öğrenim_durumu = 6) ve (Net_geliri = 3) ve (YaĢadığı_il = 1) ve (YaĢı = 4) ve (Medeni_durumu = 2) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 9) ve (Öğrenim_durumu = 6) ve (Net_geliri = 3) ve (YaĢadığı_il = 1) ve (YaĢı = 4) ve (Medeni_durumu = 2) ve (En_son_çalıĢma_yılı = 2) ve (Cinsiyeti = 2) (Mesleği = 9) ve (Öğrenim_durumu = 6) ve (Net_geliri = 5) ve (En_son_çalıĢma_yılı = 3) ve (YaĢı = 6) (Mesleği = 9) ve (Öğrenim_durumu = 7) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 3) (Mesleği = 9) ve (Öğrenim_durumu = 7) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 6) (Mesleği = 9) ve (Öğrenim_durumu = 7) ve (En_son_çalıĢma_yılı = 3) ve (Net_geliri = 3) ve (EĢi_çalıĢıyor_mu = 2) (Mesleği = 10) ve (Net_geliri = 2) ve (YaĢı = 5) (Mesleği = 10) ve (Net_geliri = 3) ve (YaĢı = 2) ve (YaĢadığı_il = 4) (Mesleği = 10) ve (Net_geliri = 3) ve (YaĢı = 3) ve (Medeni_durumu = 2) (Mesleği = 10) ve (Net_geliri = 4) ve (Öğrenim_durumu = 2) ve (YaĢadığı_il = 2) 122 (Mesleği = 10) ve (Net_geliri = 4) ve (Öğrenim_durumu = 6) ve (YaĢı = 2) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 2) ve (Medeni_durumu = 1) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 4) ve (Medeni_durumu = 1) ve (Cinsiyeti = 2) ve (ÇalıĢma_Ģekli = 3) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 1) ve (Medeni_durumu = 1) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 2) ve (YaĢadığı_il = 1) ve (Cinsiyeti = 1) ve (ÇalıĢma_Ģekli = 2) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 2) ve (YaĢadığı_il = 5) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 5) ve (Öğrenim_durumu = 5) ve (Cinsiyeti = 2) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 6) ve (YaĢadığı_il = 3) (Mesleği = 11) ve (YaĢı = 4) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 1) ve (Medeni_durumu = 1) (Mesleği = 11) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 1) ve (Öğrenim_durumu = 2) (Mesleği = 11) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 3) ve () ve (Mesleği = 12) ve (YaĢı = 2) ve (Cinsiyeti = 2) (Mesleği = 12) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 3) ve (Medeni_durumu = 2) (Mesleği = 12) ve (YaĢı = 5) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 12) ve (YaĢı = 5) ve (Öğrenim_durumu = 8) ve (YaĢadığı_il = 3) (Mesleği = 12) ve (YaĢı = 6) ve (Medeni_durumu = 1) ve (Öğrenim_durumu = 2) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 13) ve (Öğrenim_durumu = 2) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 13) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 2) ve (YaĢadığı_il = 1) ve (Medeni_durumu = 2) ve (YaĢı = 2) ve (otovarmi = 1) (Mesleği = 13) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 2) ve (YaĢadığı_il = 5) 123 (Mesleği = 13) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 4) ve (Medeni_durumu = 1) (Mesleği = 13) ve (Öğrenim_durumu = 5) ve (ÇalıĢma_Ģekli = 1) (Mesleği = 13) ve (Öğrenim_durumu = 5) ve (ÇalıĢma_Ģekli = 3) ve (Oturduğu_ev = 2) ve (Cinsiyeti = 2) (Mesleği = 13) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 13) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 4) ve (Medeni_durumu = 1) (Mesleği = 14) ve (Öğrenim_durumu = 5) ve (Net_geliri = 5) ve (YaĢı = 3) (Mesleği = 14) ve (Öğrenim_durumu = 7) ve (Medeni_durumu = 1) (Mesleği = 15) ve (Öğrenim_durumu = 5) ve (Oturduğu_ev = 4) (Mesleği = 15) ve (Öğrenim_durumu = 6) (Mesleği = 15) ve (Öğrenim_durumu = 7) ve (En_son_çalıĢma_yılı = 1) ve (Oturduğu_ev = 1) (Mesleği = 18) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 18) ve (Öğrenim_durumu = 6) ve (YaĢadığı_il = 1) ve (Cinsiyeti = 2) (Mesleği = 19) ve (Öğrenim_durumu = 2) ve (Oturduğu_ev = 3) ve (Cinsiyeti = 2) ve (Medeni_durumu = 2) (Mesleği = 19) ve (Öğrenim_durumu = 4) ve (YaĢı = 4) ve (Cinsiyeti = 2) (Mesleği = 19) ve (Öğrenim_durumu = 4) ve (YaĢı = 5) ve (Cinsiyeti = 1) (Mesleği = 19) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 19) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 21) ve (Öğrenim_durumu = 2) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 4) (Mesleği = 21) ve (Öğrenim_durumu = 4) ve (Net_geliri = 1) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 2) (Mesleği = 21) ve (Öğrenim_durumu = 4) ve (Net_geliri = 1) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 21) ve (Öğrenim_durumu = 4) ve (Net_geliri = 3) ve (Cinsiyeti = 1) 124 (Mesleği = 21) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 2) (Mesleği = 21) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 1) ve (YaĢadığı_il = 3) (Mesleği = 21) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 3) ve (Medeni_durumu = 1) (Mesleği = 21) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 5) ve (Cinsiyeti = 1) (Mesleği = 21) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 3) ve (YaĢadığı_il = 2) ve (YaĢı = 3) (Mesleği = 21) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 4) ve (YaĢı = 3) ve (YaĢadığı_il = 3) (Mesleği = 21) ve (Öğrenim_durumu = 8) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 5) (Mesleği = 21) ve (Öğrenim_durumu = 8) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 22) ve (Öğrenim_durumu = 1) ve (En_son_çalıĢma_yılı = 4) ve (Cinsiyeti = 2) (Mesleği = 22) ve (Öğrenim_durumu = 4) ve (YaĢı = 4) ve (YaĢadığı_il = 2) (Mesleği = 22) ve (Öğrenim_durumu = 4) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 22) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 22) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (Cinsiyeti = 1) ve (Oturduğu_ev = 2) (Mesleği = 23) ve (Öğrenim_durumu = 1) (Mesleği = 23) ve (Öğrenim_durumu = 2) ve (YaĢı = 2) (Mesleği = 23) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 3) ve (Cinsiyeti = 1) (Mesleği = 23) ve (Öğrenim_durumu = 5) (Mesleği = 24) ve (Öğrenim_durumu = 4) ve (ÇalıĢma_Ģekli = 2) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 24) ve (Öğrenim_durumu = 5) ve (Net_geliri = 3) 125 (Mesleği = 24) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Oturduğu_ev = 1) ve (Cinsiyeti = 1) (Mesleği = 24) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (Medeni_durumu = 2) (Mesleği = 24) ve (Öğrenim_durumu = 8) (Mesleği = 25) ve (Öğrenim_durumu = 4) ve (YaĢı = 2) (Mesleği = 25) ve (Öğrenim_durumu = 4) ve (YaĢı = 3) ve (Cinsiyeti = 1) (Mesleği = 25) ve (Öğrenim_durumu = 5) ve (YaĢı = 2) (Mesleği = 25) ve (Öğrenim_durumu = 5) ve (YaĢı = 3) ve (Cinsiyeti = 1) (Mesleği = 25) ve (Öğrenim_durumu = 5) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 25) ve (Öğrenim_durumu = 5) ve (YaĢı = 6) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 1) ve (YaĢadığı_il = 2) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 2) ve (YaĢı = 3) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 2) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 3) ve (YaĢı = 4) ve (Cinsiyeti = 1) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (En_son_çalıĢma_yılı = 1) ve (Cinsiyeti = 1) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 5) (Mesleği = 25) ve (Öğrenim_durumu = 8) ve (Net_geliri = 3) (Mesleği = 26) ve (Öğrenim_durumu = 2) ve (Net_geliri = 1) ve (YaĢı = 4) (Mesleği = 26) ve (Öğrenim_durumu = 2) ve (Net_geliri = 3) ve (Medeni_durumu = 1) (Mesleği = 26) ve (Öğrenim_durumu = 2) ve (Net_geliri = 5) ve (YaĢı = 5) (Mesleği = 26) ve (Öğrenim_durumu = 4) ve (YaĢı = 2) ve (Oturduğu_ev = 4) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 26) ve (Öğrenim_durumu = 4) ve (YaĢı = 5) ve (Oturduğu_ev = 4) 126 (Mesleği = 26) ve (Öğrenim_durumu = 4) ve (YaĢı = 6) ve (Oturduğu_ev = 1) (Mesleği = 26) ve (Öğrenim_durumu = 5) ve (Net_geliri = 1) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 5) (Mesleği = 26) ve (Öğrenim_durumu = 5) ve (Net_geliri = 1) ve (En_son_çalıĢma_yılı = 4) ve (Oturduğu_ev = 1) (Mesleği = 26) ve (Öğrenim_durumu = 5) ve (Net_geliri = 3) ve (YaĢadığı_il = 2) (Mesleği = 26) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 3) ve (YaĢı = 3) (Mesleği = 26) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 3) ve (YaĢı = 5) (Mesleği = 26) ve (Öğrenim_durumu = 7) ve (YaĢı = 4) (Mesleği = 26) ve (Öğrenim_durumu = 8) ve (En_son_çalıĢma_yılı = 2) ve (EĢi_çalıĢıyor_mu = 2) (Mesleği = 27) ve (Öğrenim_durumu = 2) ve (Cinsiyeti = 2) (Mesleği = 27) ve (Öğrenim_durumu = 4) ve (Cinsiyeti = 1) ve (YaĢı = 5) (Mesleği = 27) ve (Öğrenim_durumu = 5) ve (YaĢı = 5) ve (Medeni_durumu = 2) (Mesleği = 27) ve (Öğrenim_durumu = 5) ve (YaĢı = 6) (Mesleği = 27) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 4) ve (Medeni_durumu = 1) (Mesleği = 28) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (Cinsiyeti = 1) ve (YaĢadığı_il = 1) (Mesleği = 28) ve (Öğrenim_durumu = 7) ve (Cinsiyeti = 1) (Mesleği = 28) ve (Öğrenim_durumu = 8) (Mesleği = 29) ve (ÇalıĢma_Ģekli = 2) ve (YaĢı = 2) ve (Cinsiyeti = 2) ve (Medeni_durumu = 2) (Mesleği = 29) ve (ÇalıĢma_Ģekli = 3) ve (Medeni_durumu = 1) (Mesleği = 30) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 2) ve (Cinsiyeti = 1) 127 (Mesleği = 30) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 4) ve (Cinsiyeti = 1) (Mesleği = 30) ve (Öğrenim_durumu = 6) ve (YaĢadığı_il = 1) ve (Medeni_durumu = 1) ve (Cinsiyeti = 1) (Mesleği = 32) ve (Öğrenim_durumu = 6) ve (Medeni_durumu = 1) ve (Cinsiyeti = 2) (Mesleği = 32) ve (Öğrenim_durumu = 7) (Mesleği = 33) ve (Öğrenim_durumu = 4) ve (ÇalıĢma_Ģekli = 6) ve (YaĢadığı_il = 1) ve (Oturduğu_ev = 1) (Mesleği = 33) ve (Öğrenim_durumu = 5) ve (ÇalıĢma_Ģekli = 2) ve (Cinsiyeti = 2) (Mesleği = 33) ve (Öğrenim_durumu = 5) ve (ÇalıĢma_Ģekli = 3) ve (Cinsiyeti = 2) (Mesleği = 33) ve (Öğrenim_durumu = 5) ve (ÇalıĢma_Ģekli = 8) (Mesleği = 33) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (YaĢadığı_il = 1) (Mesleği = 34) ve (Öğrenim_durumu = 2) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 34) ve (Öğrenim_durumu = 4) ve (YaĢadığı_il = 1) ve (YaĢı = 5) ve (Medeni_durumu = 2) ve (EĢi_çalıĢıyor_mu = 1) (Mesleği = 34) ve (Öğrenim_durumu = 4) ve (YaĢadığı_il = 4) (Mesleği = 34) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 5) ve (Medeni_durumu = 1) (Mesleği = 34) ve (Öğrenim_durumu = 7) (Mesleği = 35) ve (Öğrenim_durumu = 2) ve (YaĢı = 4) (Mesleği = 35) ve (Öğrenim_durumu = 4) ve (YaĢı = 3) ve (YaĢadığı_il = 1) (Mesleği = 35) ve (Öğrenim_durumu = 4) ve (YaĢı = 3) ve (YaĢadığı_il = 5) (Mesleği = 35) ve (Öğrenim_durumu = 5) ve (YaĢı = 3) ve (YaĢadığı_il = 1) (Mesleği = 35) ve (Öğrenim_durumu = 5) ve (YaĢı = 3) ve (YaĢadığı_il = 5) 128 (Mesleği = 35) ve (Öğrenim_durumu = 6) ve (YaĢı = 2) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 35) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (Cinsiyeti = 2) ve (Net_geliri = 2) (Mesleği = 37) ve (YaĢı = 2) ve (YaĢadığı_il = 1) ve (Cinsiyeti = 1) (Mesleği = 37) ve (YaĢı = 2) ve (YaĢadığı_il = 3) ve (Cinsiyeti = 1) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 2) ve (Medeni_durumu = 2) ve (Oturduğu_ev = 1) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 5) ve (Cinsiyeti = 2) ve (Medeni_durumu = 2) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 1) ve (Cinsiyeti = 1) ve (Medeni_durumu = 1) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 1) ve (Cinsiyeti = 2) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 2) ve (Öğrenim_durumu = 5) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 4) ve (Medeni_durumu = 1) (Mesleği = 37) ve (YaĢı = 5) ve (Öğrenim_durumu = 4) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 37) ve (YaĢı = 5) ve (Öğrenim_durumu = 4) ve (YaĢadığı_il = 3) (Mesleği = 38) ve (YaĢı = 1) ve (YaĢadığı_il = 1) (Mesleği = 38) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 40) ve (YaĢı = 5) ve (Medeni_durumu = 1) (Mesleği = 42) ve (YaĢı = 1) ve (Net_geliri = 1) ve (Oturduğu_ev = 2) (Mesleği = 42) ve (YaĢı = 1) ve (Net_geliri = 4) (Mesleği = 42) ve (YaĢı = 2) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 4) ve (Cinsiyeti = 1) ve (Oturduğu_ev = 1) (Mesleği = 42) ve (YaĢı = 2) ve (YaĢadığı_il = 2) ve (Öğrenim_durumu = 4) (Mesleği = 42) ve (YaĢı = 2) ve (YaĢadığı_il = 3) 129 (Mesleği = 42) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 3) ve (Medeni_durumu = 1) ve (Cinsiyeti = 2) (Mesleği = 42) ve (YaĢı = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 1) ve (Öğrenim_durumu = 2) ve (Net_geliri = 3) (Mesleği = 42) ve (YaĢı = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 1) ve (Net_geliri = 1) (Mesleği = 42) ve (YaĢı = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 4) ve (Net_geliri = 1) ve (Medeni_durumu = 2) ve (Oturduğu_ev = 2) (Mesleği = 42) ve (YaĢı = 5) ve (YaĢadığı_il = 2) ve (Medeni_durumu = 2) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 42) ve (YaĢı = 6) ve (Öğrenim_durumu = 5) Kural 3‟e uygun iĢlem yaparak yatırım hesabını kapatan müĢterilerin sosyodemografik karakteristiğinden bir kesit ġekil 6.4‟de verilmiĢtir. ġekil 6.4. Kural 3‟e uygun iĢlem yaparak yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiğinden bir kesit 130 Kural 4 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 4: Eğer (anapara > 85.95) ve (t-4 = D8) ve (t-3 = S) ve (t-2 = S) ve (t-1 = S) = P (88, % 5,93) Sosyo-demografik karakteristik; (Mesleği = 3) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 3) (Mesleği = 4) ve (Cinsiyeti = 2) (Mesleği = 5) ve (YaĢı = 5) ve (Öğrenim_durumu = 7) (Mesleği = 8) ve (Öğrenim_durumu = 2) ve (YaĢı = 4) ve (Medeni_durumu = 2) (Mesleği = 8) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 3) ve (Oturduğu_ev = 2) (Mesleği = 8) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 3) ve (Medeni_durumu = 1) (Mesleği = 8) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 4) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 3) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 8) ve (Öğrenim_durumu = 7) ve (YaĢı = 3) (Mesleği = 8) ve (Öğrenim_durumu = 7) ve (YaĢı = 6) ve (YaĢadığı_il = 3) (Mesleği = 9) ve (Öğrenim_durumu = 5) ve (Oturduğu_ev = 1) ve (En_son_çalıĢma_yılı = 3) ve (YaĢı = 3) (Mesleği = 9) ve (Öğrenim_durumu = 5) ve (Oturduğu_ev = 1) ve (En_son_çalıĢma_yılı = 4) ve (YaĢadığı_il = 2) (Mesleği = 9) ve (Öğrenim_durumu = 5) ve (Oturduğu_ev = 1) ve (En_son_çalıĢma_yılı = 4) ve (YaĢadığı_il = 3) (Mesleği = 9) ve (Öğrenim_durumu = 5) ve (Oturduğu_ev = 4) (Mesleği = 9) ve (Öğrenim_durumu = 7) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 4) ve (Cinsiyeti = 2) 131 (Mesleği = 9) ve (Öğrenim_durumu = 8) ve (Cinsiyeti = 1) ve (YaĢadığı_il = 5) (Mesleği = 10) ve (Net_geliri = 4) ve (Öğrenim_durumu = 5) ve (YaĢı = 3) ve (Cinsiyeti = 2) (Mesleği = 10) ve (Net_geliri = 4) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 2) ve (Cinsiyeti = 1) (Mesleği = 10) ve (Net_geliri = 4) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (YaĢadığı_il = 1) ve (ÇalıĢma_Ģekli = 3) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 2) ve (Medeni_durumu = 2) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 4) ve (Medeni_durumu = 1) ve (Cinsiyeti = 1) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 4) ve (Medeni_durumu = 1) ve (Cinsiyeti = 2) ve (ÇalıĢma_Ģekli = 2) (Mesleği = 12) ve (YaĢı = 2) ve (Cinsiyeti = 1) ve (Net_geliri = 5) (Mesleği = 12) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 12) ve (YaĢı = 5) ve (Öğrenim_durumu = 1) (Mesleği = 13) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 2) ve (EĢi_çalıĢıyor_mu = 1) (Mesleği = 13) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 3) ve (YaĢı = 4) (Mesleği = 13) ve (Öğrenim_durumu = 7) ve (YaĢadığı_il = 3) (Mesleği = 13) ve (Öğrenim_durumu = 7) ve (YaĢadığı_il = 5) (Mesleği = 14) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 2) (Mesleği = 14) ve (Öğrenim_durumu = 8) ve (Cinsiyeti = 2) ve (YaĢadığı_il = 1) (Mesleği = 15) ve (Öğrenim_durumu = 4) ve (Oturduğu_ev = 1) (Mesleği = 15) ve (Öğrenim_durumu = 7) ve (En_son_çalıĢma_yılı = 1) ve (Oturduğu_ev = 2) (Mesleği = 17) 132 (Mesleği = 18) ve (Öğrenim_durumu = 6) ve (YaĢadığı_il = 2) ve (Cinsiyeti = 2) (Mesleği = 18) ve (Öğrenim_durumu = 7) ve (YaĢı = 4) ve (Oturduğu_ev = 1) (Mesleği = 19) ve (Öğrenim_durumu = 4) ve (YaĢı = 5) ve (Cinsiyeti = 2) (Mesleği = 21) ve (Öğrenim_durumu = 2) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 3) ve (Cinsiyeti = 2) (Mesleği = 21) ve (Öğrenim_durumu = 4) ve (Net_geliri = 1) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 4) ve (Cinsiyeti = 1) (Mesleği = 21) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 1) ve (Net_geliri = 3) (Mesleği = 21) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 1) ve (Net_geliri = 1) ve (Cinsiyeti = 2) ve (YaĢı = 4) (Mesleği = 21) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 1) ve (YaĢadığı_il = 2) (Mesleği = 22) ve (Öğrenim_durumu = 4) ve (YaĢı = 3) ve (Oturduğu_ev = 4) (Mesleği = 22) ve (Öğrenim_durumu = 4) ve (YaĢı = 4) ve (YaĢadığı_il = 1) (Mesleği = 22) ve (Öğrenim_durumu = 4) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 1) ve (Cinsiyeti = 2) (Mesleği = 22) ve (Öğrenim_durumu = 6) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 23) ve (Öğrenim_durumu = 2) ve (YaĢı = 6) ve (Oturduğu_ev = 2) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 3) ve (YaĢı = 4) ve (Cinsiyeti = 2) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 5) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Cinsiyeti = 1) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 5) ve (YaĢı = 6) ve (Oturduğu_ev = 3) 133 (Mesleği = 26) ve (Öğrenim_durumu = 2) ve (Net_geliri = 2) ve (Cinsiyeti = 1) (Mesleği = 26) ve (Öğrenim_durumu = 2) ve (Net_geliri = 3) ve (Medeni_durumu = 2) (Mesleği = 26) ve (Öğrenim_durumu = 4) ve (YaĢı = 3) ve (Medeni_durumu = 2) ve (YaĢadığı_il = 3) (Mesleği = 27) ve (Öğrenim_durumu = 8) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 28) ve (Öğrenim_durumu = 4) ve (Oturduğu_ev = 3) (Mesleği = 28) ve (Öğrenim_durumu = 6) ve (YaĢı = 6) ve (Medeni_durumu = 2) (Mesleği = 30) ve (Öğrenim_durumu = 6) ve (YaĢadığı_il = 3) (Mesleği = 30) ve (Öğrenim_durumu = 7) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 31) ve (En_son_çalıĢma_yılı = 2) ve (Medeni_durumu = 2) (Mesleği = 32) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 32) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 2) ve (Cinsiyeti = 1) (Mesleği = 33) ve (Öğrenim_durumu = 2) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 33) ve (Öğrenim_durumu = 6) ve (YaĢı = 1) ve (Oturduğu_ev = 3) (Mesleği = 33) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (Medeni_durumu = 2) (Mesleği = 34) ve (Öğrenim_durumu = 5) ve (Cinsiyeti = 2) (Mesleği = 35) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (Medeni_durumu = 1) ve (Cinsiyeti = 2) (Mesleği = 35) ve (Öğrenim_durumu = 7) ve (YaĢı = 3) ve (Cinsiyeti = 2) (Mesleği = 37) ve (YaĢı = 2) ve (YaĢadığı_il = 1) ve (Cinsiyeti = 2) ve (Oturduğu_ev = 1) (Mesleği = 37) ve (YaĢı = 2) ve (YaĢadığı_il = 3) ve (Cinsiyeti = 2) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 5) ve (Cinsiyeti = 1) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 4) 134 (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 2) ve (Öğrenim_durumu = 4) ve (Cinsiyeti = 2) (Mesleği = 38) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 2) ve (YaĢadığı_il = 5) (Mesleği = 42) ve (YaĢı = 2) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 2) ve (Net_geliri = 1) (Mesleği = 42) ve (YaĢı = 2) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 6) ve (otovarmi = 2) (Mesleği = 42) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 3) ve (Medeni_durumu = 2) (Mesleği = 42) ve (YaĢı = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 1) ve (Öğrenim_durumu = 6) (Mesleği = 42) ve (YaĢı = 5) ve (YaĢadığı_il = 4) Kural 4‟e uygun iĢlem yaparak yatırım hesabını kapatan müĢterilerin sosyodemografik karakteristiğinden bir kesit ġekil 6.5‟de verilmiĢtir. ġekil 6.5. Kural 4‟e uygun iĢlem yaparak yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiğinden bir kesit 135 Kural 5 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 5: Eğer (t-7 = S) ve (t-6 = Y2) ve (t-1 = D8) = P (71, % 4,78) Sosyo-demografik karakteristik; (Mesleği = 3) ve (YaĢı = 3) ve (Net_geliri = 2) ve (Cinsiyeti = 2) (Mesleği = 3) ve (YaĢı = 3) ve (Net_geliri = 3) ve (Öğrenim_durumu = 7) (Mesleği = 5) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 2) ve (Öğrenim_durumu = 6) ve (Oturduğu_ev = 1) (Mesleği = 8) ve (Öğrenim_durumu = 2) ve (YaĢı = 2) ve (Net_geliri = 4) (Mesleği = 8) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 4) ve (Cinsiyeti = 2) (Mesleği = 8) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 4) ve (YaĢı = 4) (Mesleği = 8) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 3) ve (YaĢı = 3) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (YaĢı = 4) ve (Oturduğu_ev = 1) ve (YaĢadığı_il = 1) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (YaĢı = 5) ve (Cinsiyeti = 1) ve (En_son_çalıĢma_yılı = 1) ve (Oturduğu_ev = 2) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (YaĢı = 5) ve (Cinsiyeti = 1) ve (En_son_çalıĢma_yılı = 2) ve ( YaĢadığı_il = 2) (Mesleği = 8) ve (Öğrenim_durumu = 7) ve (YaĢı = 5) (Mesleği = 9) ve (Öğrenim_durumu = 4) ve (YaĢı = 5) ve (Medeni_durumu = 2) (Mesleği = 9) ve (Öğrenim_durumu = 5) ve (Oturduğu_ev = 1) ve (En_son_çalıĢma_yılı = 3) ve (YaĢı = 4) (Mesleği = 9) ve (Öğrenim_durumu = 5) ve (Oturduğu_ev = 2) ve (YaĢı = 3) ve (Medeni_durumu = 1) (Mesleği = 9) ve (Öğrenim_durumu = 5) ve (Oturduğu_ev = 2) ve (YaĢı = 6) 136 (Mesleği = 9) ve (Öğrenim_durumu = 6) ve (Net_geliri = 2) ve (En_son_çalıĢma_yılı = 2) ve (Medeni_durumu = 2) (Mesleği = 9) ve (Öğrenim_durumu = 6) ve (Net_geliri = 5) ve (En_son_çalıĢma_yılı = 2) ve (Cinsiyeti = 1) (Mesleği = 9) ve (Öğrenim_durumu = 7) ve (En_son_çalıĢma_yılı = 2) ve (YaĢadığı_il = 1) (Mesleği = 10) ve (Net_geliri = 4) ve (Öğrenim_durumu = 5) ve (YaĢı = 4) (Mesleği = 10) ve (Net_geliri = 4) ve (Öğrenim_durumu = 5) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 10) ve (Net_geliri = 4) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (YaĢadığı_il = 3) (Mesleği = 10) ve (Net_geliri = 4) ve (Öğrenim_durumu = 7) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 5) ve (Öğrenim_durumu = 5) ve (Cinsiyeti = 1) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 6) ve (YaĢadığı_il = 5) (Mesleği = 11) ve (YaĢı = 4) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 4) ve (Cinsiyeti = 2) (Mesleği = 11) ve (YaĢı = 4) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 2) (Mesleği = 11) ve (YaĢı = 4) ve (Öğrenim_durumu = 6) ve (Oturduğu_ev = 3) (Mesleği = 12) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 5) ve (Cinsiyeti = 2) (Mesleği = 12) ve (YaĢı = 4) ve (YaĢadığı_il = 1) ve (Cinsiyeti = 1) v (Mesleği = 13) ve (Öğrenim_durumu = 5) ve (ÇalıĢma_Ģekli = 3) ve (Oturduğu_ev = 1) ve (Cinsiyeti = 2) ve (YaĢı = 3) (Mesleği = 19) ve (Öğrenim_durumu = 6) ve (YaĢı = 6) ve (YaĢadığı_il = 1) (Mesleği = 20) ve (En_son_çalıĢma_yılı = 1) ve (Medeni_durumu = 2) (Mesleği = 21) ve (Öğrenim_durumu = 2) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 3) 137 (Mesleği = 21) ve (Öğrenim_durumu = 7) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 22) ve (Öğrenim_durumu = 1) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 22) ve (Öğrenim_durumu = 1) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 22) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 4) ve (Cinsiyeti = 1) (Mesleği = 22) ve (Öğrenim_durumu = 6) ve (YaĢı = 6) (Mesleği = 23) ve (Öğrenim_durumu = 2) ve (YaĢı = 6) ve (Oturduğu_ev = 1) (Mesleği = 24) ve (Öğrenim_durumu = 6) ve (YaĢı = 5) ve (Oturduğu_ev = 2) ve (Cinsiyeti = 1) ve (Medeni_durumu = 2) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 3) ve (YaĢı = 6) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 5) ve (YaĢı = 2) ve (Oturduğu_ev = 4) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 5) ve (YaĢı = 4) ve (YaĢadığı_il = 4) (Mesleği = 26) ve (Öğrenim_durumu = 4) ve (YaĢı = 2) ve (Oturduğu_ev = 4) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 27) ve (Öğrenim_durumu = 5) ve (YaĢı = 5) ve (Medeni_durumu = 1) (Mesleği = 28) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 1) ve (YaĢadığı_il = 4) (Mesleği = 28) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 29) ve (ÇalıĢma_Ģekli = 2) ve (YaĢı = 2) ve (Cinsiyeti = 2) ve (Medeni_durumu = 1) (Mesleği = 29) ve (ÇalıĢma_Ģekli = 2) ve (YaĢı = 3) ve (YaĢadığı_il = 3) (Mesleği = 30) ve (Öğrenim_durumu = 6) ve (YaĢadığı_il = 1) ve (Medeni_durumu = 1) ve (Cinsiyeti = 2) (Mesleği = 32) ve (Öğrenim_durumu = 6) ve (Medeni_durumu = 2) ve (YaĢadığı_il = 1) 138 (Mesleği = 33) ve (Öğrenim_durumu = 4) ve (ÇalıĢma_Ģekli = 2) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Cinsiyeti = 1) ve (Medeni_durumu = 2) (Mesleği = 34) ve (Öğrenim_durumu = 4) ve (YaĢadığı_il = 1) ve (YaĢı = 4) ve (Cinsiyeti = 2) (Mesleği = 34) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 5) ve (Medeni_durumu = 2) (Mesleği = 35) ve (Öğrenim_durumu = 5) ve (YaĢı = 4) ve (YaĢadığı_il = 3) (Mesleği = 35) ve (Öğrenim_durumu = 6) ve (YaĢı = 2) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 35) ve (Öğrenim_durumu = 8) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 2) ve (Medeni_durumu = 2) ve (Oturduğu_ev = 2) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 1) ve (Cinsiyeti = 1) ve (Medeni_durumu = 2) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 7) ve (Medeni_durumu = 2) (Mesleği = 37) ve (YaĢı = 4) ve (Net_geliri = 5) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 37) ve (YaĢı = 4) ve (Net_geliri = 5) ve (En_son_çalıĢma_yılı = 2) ve (Öğrenim_durumu = 4) (Mesleği = 38) ve (YaĢı = 4) ve (Cinsiyeti = 1) (Mesleği = 38) ve (YaĢı = 6) ve (YaĢadığı_il = 2) (Mesleği = 42) ve (YaĢı = 1) ve (Net_geliri = 5) ve (YaĢadığı_il = 1) ve (Cinsiyeti = 2) ve (Oturduğu_ev = 3) Kural 5‟e uygun iĢlem yaparak yatırım hesabını kapatan müĢterilerin sosyodemografik karakteristiğinden bir kesit ġekil 6.6‟da verilmiĢtir. 139 ġekil 6.6. Kural 5‟e uygun iĢlem yaparak yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiğinden bir kesit Kural 6 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 6: Eğer (t-7 = D4) ve (t-2 = D8) ve (t-1 = D8) = P (8, % 0,54) Sosyo-demografik karakteristik; (Mesleği = 18) ve (Öğrenim_durumu = 7) ve (YaĢı = 3) (Mesleği = 21) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 4) ve (Net_geliri = 1) (Mesleği = 21) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 3) ve (YaĢadığı_il = 2) ve (YaĢı = 4) (Mesleği = 22) ve (Öğrenim_durumu = 7) ve (YaĢı = 6) ve (YaĢadığı_il = 5) 140 (Mesleği = 24) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (YaĢadığı_il = 2) ve (cinsiyet = 1) (Mesleği = 36) ve (Öğrenim_durumu = 2) ve (YaĢı = 2) (Mesleği = 37) ve (YaĢı = 5) ve (Öğrenim_durumu = 1) (Mesleği = 38) ve (YaĢı = 5) ve (Öğrenim_durumu = 4) Kural 7 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 7: Eğer (t-7 = D5) ve (t-2 = D8) ve (t-1 = D8) = P (9, % 0,61) Sosyo-demografik karakteristik; (Mesleği = 10) ve (Net_geliri = 3) ve (YaĢı = 6) ve (Cinsiyeti = 2) (Mesleği = 11) ve (YaĢı = 4) ve (Öğrenim_durumu = 6) ve (Oturduğu_ev = 1) ve (Net_geliri = 2) (Mesleği = 11) ve (YaĢı = 4) ve (Öğrenim_durumu = 6) ve (Oturduğu_ev = 4) (Mesleği = 22) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (Cinsiyeti = 2) ve (Medeni_durumu = 1) (Mesleği = 26) ve (Öğrenim_durumu = 5) ve (Net_geliri = 2) ve (Medeni_durumu = 1) (Mesleği = 34) ve (Öğrenim_durumu = 4) ve (YaĢadığı_il = 1) ve (YaĢı = 3) ve (Oturduğu_ev = 2) (Mesleği = 34) ve (Öğrenim_durumu = 4) ve (YaĢadığı_il = 3) ve (Cinsiyeti = 1) (Mesleği = 36) ve (Öğrenim_durumu = 2) ve (YaĢı = 3) (Mesleği = 42) ve (YaĢı = 4) ve (Öğrenim_durumu = 6) 141 Kural 8 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 8: Eğer (t-7 = D6) ve (t-5 = D6) ve (t-1 = D8) = P (2, % 0,13) Sosyo-demografik karakteristik; (Mesleği = 35) ve (Öğrenim_durumu = 7) ve (YaĢı = 3) ve (Cinsiyeti = 1) (Mesleği = 42) ve (YaĢı = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 3) ve (Medeni_durumu = 1) Kural 9 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 9: Eğer (t-7 = D6) ve (t-5 = D7) ve (t-1 = D8) = P (1, % 0,07) Sosyo-demografik karakteristik; (Mesleği = 14) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 3) Kural 10 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 10: Eğer (t-7 = D7) ve (t-1 = D8) = P (12, % 0,81) Sosyo-demografik karakteristik; (Mesleği = 9) ve (Öğrenim_durumu = 6) ve (Net_geliri = 2) ve (En_son_çalıĢma_yılı = 2) ve (Medeni_durumu = 1) ve (YaĢadığı_il = 5) (Mesleği = 9) ve (Öğrenim_durumu = 6) ve (Net_geliri = 5) ve (En_son_çalıĢma_yılı = 3) ve (YaĢı = 5) (Mesleği = 10) ve (Net_geliri = 1) ve (En_son_çalıĢma_yılı = 3) ve (Cinsiyeti = 1) 142 (Mesleği = 12) ve (YaĢı = 5) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 15) ve (Öğrenim_durumu = 7) ve (En_son_çalıĢma_yılı = 2) ve (Cinsiyeti = 1) (Mesleği = 18) ve (Öğrenim_durumu = 5) ve (YaĢı = 3) ve (Medeni_durumu = 1) (Mesleği = 18) ve (Öğrenim_durumu = 6) ve (YaĢadığı_il = 1) ve (Cinsiyeti = 1) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 5) ve (YaĢı = 5) ve (Oturduğu_ev = 1) (Mesleği = 35) ve (Öğrenim_durumu = 5) ve (YaĢı = 3) ve (YaĢadığı_il = 2) (Mesleği = 3) ve (YaĢı = 4) ve (Net_geliri = 2) (Mesleği = 42) ve (YaĢı = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 1) ve (Öğrenim_durumu = 4) (Mesleği = 42) ve (YaĢı = 5) ve (YaĢadığı_il = 5) ve (En_son_çalıĢma_yılı = 3) Kural 11 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 11: Eğer (t-7 = S) ve (t-6 = D1) ve (t-1 = D8) = P (4, % 0,27) Sosyo-demografik karakteristik; (Mesleği = 19) ve (Öğrenim_durumu = 1) (Mesleği = 22) ve (Öğrenim_durumu = 2) ve (YaĢadığı_il = 1) ve (YaĢı = 3) (Mesleği = 24) ve (Öğrenim_durumu = 6) ve (YaĢı = 5) ve (Oturduğu_ev = 2) ve (Cinsiyeti = 2) (Mesleği = 37) ve (YaĢı = 2) ve (YaĢadığı_il = 2) ve (Cinsiyeti = 2) ve (Medeni_durumu = 1) 143 Kural 12 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 12: Eğer (t-7 = S) ve (t-6 = D2) ve (t-1 = D8) = P (3, % 0,20) Sosyo-demografik karakteristik; (Mesleği = 10) ve (Net_geliri = 2) ve (YaĢı = 3) ve (Öğrenim_durumu = 7) (Mesleği = 21) ve (Öğrenim_durumu = 8) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 33) ve (Öğrenim_durumu = 4) ve (ÇalıĢma_Ģekli = 2) ve (YaĢı = 2) ve (En_son_çalıĢma_yılı = 2) Kural 13 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 13: Eğer (t-7 = S) ve (t-6 = D3) ve (t-1 = D8) = P (21, % 1,41) Sosyo-demografik karakteristik; (Mesleği = 3) ve (YaĢı = 3) ve (Net_geliri = 5) ve (Medeni_durumu = 2) ve (Öğrenim_durumu = 6) (Mesleği = 9) ve (Öğrenim_durumu = 5) ve (Oturduğu_ev = 1) ve (En_son_çalıĢma_yılı = 3) ve (YaĢı = 5) (Mesleği = 9) ve (Öğrenim_durumu = 5) ve (Oturduğu_ev = 3) ve (Cinsiyeti = 2) (Mesleği = 10) ve (Net_geliri = 4) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 10) ve (Net_geliri = 4) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (YaĢadığı_il = 2) (Mesleği = 19) ve (Öğrenim_durumu = 8) (Mesleği = 21) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 4) ve (Net_geliri = 5) ve (Cinsiyeti = 1) (Mesleği = 21) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 1) ve (Oturduğu_ev = 1) 144 (Mesleği = 22) ve (Öğrenim_durumu = 1) ve (En_son_çalıĢma_yılı = 4) ve (Cinsiyeti = 1) (Mesleği = 22) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı =3) ve (Oturduğu_ev = 3) (Mesleği = 24) ve (Öğrenim_durumu = 4) ve (ÇalıĢma_Ģekli = 3) ve (YaĢı = 4) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 2) ve (YaĢı = 6) ve (Medeni_durumu = 1) (Mesleği = 27) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 28) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 32) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 1) ve (Medeni_durumu = 2) (Mesleği = 33) ve (Öğrenim_durumu = 4) ve (ÇalıĢma_Ģekli = 2) ve (YaĢı = 4) (Mesleği = 34) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 1) ve (Cinsiyeti = 1) ve (Medeni_durumu = 1) ve (EĢi_çalıĢıyor_mu = 2) (Mesleği = 37) ve (YaĢı = 4) ve (Net_geliri = 3) ve (Öğrenim_durumu = 4) ve (YaĢadığı_il = 1) (Mesleği = 37) ve (YaĢı = 4) ve (Net_geliri = 3) ve (Öğrenim_durumu = 6) (Mesleği = 42) ve (YaĢı = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 4) ve (Net_geliri = 3) Kural 14 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 14: Eğer (t-7 = S) ve (t-6 = D4) ve (t-1 = D8) = P (31, % 2,09) Sosyo-demografik karakteristik; 145 (Mesleği = 3) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 4) ve (Cinsiyeti = 2) ve (ÇalıĢma_Ģekli = 2) (Mesleği = 3) ve (YaĢı = 6) ve (Öğrenim_durumu = 5) (Mesleği = 5) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 1) ve (Medeni_durumu = 2) ve (Cinsiyeti = 1) (Mesleği = 5) ve (YaĢı = 6) ve (YaĢadığı_il = 1) ve (Cinsiyeti = 1) ve (Medeni_durumu = 1) (Mesleği = 8) ve (Öğrenim_durumu = 4) ve (YaĢı = 3) ve (Cinsiyeti = 2) (Mesleği = 8) ve (Öğrenim_durumu = 4) ve (YaĢı = 5) (Mesleği = 8) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (YaĢı = 3) ve (Cinsiyeti = 1) ve (ÇalıĢma_Ģekli = 3) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (YaĢı = 5) ve (Cinsiyeti = 1) ve (En_son_çalıĢma_yılı = 1) ve (Oturduğu_ev = 1) (Mesleği = 9) ve (Öğrenim_durumu = 5) ve (Oturduğu_ev = 1) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 4) ve (Cinsiyeti = 2) (Mesleği = 11) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 1) (Mesleği = 15) ve (Öğrenim_durumu = 4) ve (Oturduğu_ev = 2) ve (EĢi_çalıĢıyor_mu = 2) (Mesleği = 15) ve (Öğrenim_durumu = 7) ve (En_son_çalıĢma_yılı = 2) ve (Cinsiyeti = 2) (Mesleği = 16) ve (YaĢı = 5) (Mesleği = 19) ve (Öğrenim_durumu = 4) ve (YaĢı = 3) ve (Medeni_durumu = 2) (Mesleği = 19) ve (Öğrenim_durumu = 4) ve (YaĢı = 4) ve (Cinsiyeti = 1) (Mesleği = 21) ve (Öğrenim_durumu = 4) ve (Net_geliri = 5) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 5) (Mesleği = 23) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 2) ve (Cinsiyeti = 2) ve (Medeni_durumu = 1) 146 (Mesleği = 24) ve (Öğrenim_durumu = 5) ve (Net_geliri = 5) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 24) ve (Öğrenim_durumu = 7) ve (Oturduğu_ev = 1) ve (Cinsiyeti = 1) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (En_son_çalıĢma_yılı = 1) ve (Cinsiyeti = 2) (Mesleği = 26) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 5) ve (YaĢı = 5) (Mesleği = 29) ve (ÇalıĢma_Ģekli = 2) ve (YaĢı = 2) ve (Cinsiyeti = 1) (Mesleği = 32) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 1) ve (Medeni_durumu = 1) (Mesleği = 33) ve (Öğrenim_durumu = 5) ve (ÇalıĢma_Ģekli = 6) ve (YaĢadığı_il = 3) (Mesleği = 33) ve (Öğrenim_durumu = 6) ve (YaĢı = 5) (Mesleği = 35) ve (Öğrenim_durumu = 5) ve (YaĢı = 5) ve (Cinsiyeti = 1) ve (Medeni_durumu = 2) ve (YaĢadığı_il = 1) (Mesleği = 35) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (Cinsiyeti = 1) ve (Oturduğu_ev = 2) (Mesleği = 37) ve (YaĢı = 2) ve (YaĢadığı_il = 1) ve (Cinsiyeti = 2) ve (Oturduğu_ev = 4) (Mesleği = 42) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 1) ve (Oturduğu_ev = 1) ve (Cinsiyeti = 2) (Mesleği = 42) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 4) ve (Cinsiyeti = 2) Kural 15 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 15: Eğer (t-7 = S) ve (t-6 = D5) ve (t-1 = D8) = P (17, % 1,14) Sosyo-demografik karakteristik; 147 (Mesleği = 3) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 5) (Mesleği = 5) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 1) ve (Medeni_durumu = 1) (Mesleği = 8) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 2) ve (YaĢı = 3) (Mesleği = 9) ve (Öğrenim_durumu = 2) ve (Cinsiyeti = 2) ve (Oturduğu_ev = 2) (Mesleği = 9) ve (Öğrenim_durumu = 4) ve (YaĢı = 4) ve (Net_geliri = 4) ve (En_son_çalıĢma_yılı = 1 (Mesleği = 9) ve (Öğrenim_durumu = 5) ve (Oturduğu_ev = 2) ve (YaĢı = 3) ve (Medeni_durumu = 2) (Mesleği = 10) ve (Net_geliri = 1) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 10) ve (Net_geliri = 4) ve (Öğrenim_durumu = 2) ve (YaĢadığı_il = 1) (Mesleği = 10) ve (Net_geliri = 4) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 2) ve (Cinsiyeti = 2) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 1) ve (Öğrenim_durumu = 6) ve (YaĢadığı_il = 2) (Mesleği = 13) ve (Öğrenim_durumu = 5) ve (ÇalıĢma_Ģekli = 7) (Mesleği = 21) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 1) ve (YaĢadığı_il = 1) ve (YaĢı = 3) ve (Medeni_durumu = 1) (Mesleği = 21) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 1) ve (YaĢadığı_il = 1) ve (YaĢı = 5) (Mesleği = 22) ve (Öğrenim_durumu = 2) ve (YaĢadığı_il = 2) ve (EĢi_çalıĢıyor_mu = 2) (Mesleği = 24) ve (Öğrenim_durumu = 2) ve (Cinsiyeti = 2) (Mesleği = 28) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 2) (Mesleği = 35) ve (Öğrenim_durumu = 4) ve (YaĢı = 4) ve (EĢi_çalıĢıyor_mu = 2) 148 Kural 16 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 16: Eğer (t-7 = S) ve (t-6 = D6) ve (t-1 = D8) = P (12, % 0,81) Sosyo-demografik karakteristik; (Mesleği = 3) ve (YaĢı = 2) ve (En_son_çalıĢma_yılı = 1) ve (YaĢadığı_il = 2) (Mesleği = 7) ve (En_son_çalıĢma_yılı = 1) ve (Cinsiyeti = 2) (Mesleği = 11) ve (YaĢı = 2) ve (Net_geliri = 2) ve (Medeni_durumu = 1) (Mesleği = 12) ve (YaĢı = 5) ve (Öğrenim_durumu = 2) ve (Cinsiyeti = 2) (Mesleği = 22) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (Cinsiyeti = 2) ve (Medeni_durumu = 2) (Mesleği = 23) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 4) ve (Net_geliri = 5) (Mesleği = 24) ve (Öğrenim_durumu = 6) ve (YaĢı = 5) ve (Oturduğu_ev = 1) ve (Cinsiyeti = 2) (Mesleği = 29) ve (ÇalıĢma_Ģekli = 5) ve (YaĢadığı_il = 2) (Mesleği = 29) ve (ÇalıĢma_Ģekli = 6) ve (Öğrenim_durumu = 6) ve (Oturduğu_ev = 1) (Mesleği = 29) ve (ÇalıĢma_Ģekli = 6) ve (Öğrenim_durumu = 6) ve (Oturduğu_ev = 2) (Mesleği = 37) ve (YaĢı = 6) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 42) ve (YaĢı = 5) ve (YaĢadığı_il = 5) ve (En_son_çalıĢma_yılı = 2) Kural 17 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 17: Eğer (t-7 = S) ve (t-6 = D7) ve (t-1 = D8) = P (10, % 0,67) Sosyo-demografik karakteristik; 149 (Mesleği = 3) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 1) ve (Cinsiyeti = 1) (Mesleği = 5) ve (YaĢı = 5) ve (Öğrenim_durumu = 8) (Mesleği = 8) ve (Öğrenim_durumu = 2) ve (YaĢı = 4) ve (Medeni_durumu = 1) (Mesleği = 8) ve (Öğrenim_durumu = 8) (Mesleği = 9) ve (Öğrenim_durumu = 6) ve (Net_geliri = 3) ve (YaĢadığı_il = 1) ve (YaĢı = 6) (Mesleği = 11) ve (YaĢı = 1) ve (YaĢadığı_il = 1) (Mesleği = 12) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 2) ve (Oturduğu_ev = 1) (Mesleği = 24) ve (Öğrenim_durumu = 7) ve (Oturduğu_ev = 2) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 1) ve (Cinsiyeti = 2) (Mesleği = 42) ve (YaĢı = 1) ve (Net_geliri = 5) ve (YaĢadığı_il = 4) Kural 18 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 18: Eğer (t-7 = S) ve (t-6 = D8) ve (t-1 = D8) = P (8, % 0,54) Sosyo-demografik karakteristik; (Mesleği = 3) ve (YaĢı = 2) ve (En_son_çalıĢma_yılı = 2) ve (Cinsiyeti = 2) (Mesleği = 3) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 1) ve (ÇalıĢma_Ģekli = 3) ve (Cinsiyeti = 2) (Mesleği = 9) ve (Öğrenim_durumu = 5) ve (Oturduğu_ev = 3) ve (Cinsiyeti = 1) (Mesleği = 19) ve (Öğrenim_durumu = 4) ve (YaĢı = 3) ve (Medeni_durumu = 1) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 21) ve (Öğrenim_durumu = 4) ve (Net_geliri = 5) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 2) 150 (Mesleği = 24) ve (Öğrenim_durumu = 4) ve (ÇalıĢma_Ģekli = 3) ve (YaĢı = 2) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 25) ve (Öğrenim_durumu = 4) ve (YaĢı = 4) (Mesleği = 38) ve (YaĢı = 5) ve (Öğrenim_durumu = 6) Kural 19 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 19: Eğer (t-7 = S) ve (t-6 = Y1) ve (t-1 = D8) = P (9, % 0,61) Sosyo-demografik karakteristik; (Mesleği = 3) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 1) ve (ÇalıĢma_Ģekli = 2) ve (Cinsiyeti = 2) ve (Net_geliri = 5) (Mesleği = 11) ve (YaĢı = 4) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 1) ve (Cinsiyeti = 1) (Mesleği = 12) ve (YaĢı = 5) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 19) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 25) ve (Öğrenim_durumu = 4) ve (YaĢı = 6) ve (YaĢadığı_il = 2) (Mesleği = 35) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (Medeni_durumu = 2) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 35) ve (Öğrenim_durumu = 7) ve (YaĢı = 6) (Mesleği = 37) ve (YaĢı = 2) ve (YaĢadığı_il = 2) ve (Cinsiyeti = 2) ve (Medeni_durumu = 2) (Mesleği = 42) ve (YaĢı = 6) ve (Öğrenim_durumu = 7) 151 Kural 20 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 20: Eğer (t-7 = S) ve (t-6 = Y3) ve (t-1 = D8) = P (9, % 0,61) Sosyo-demografik karakteristik; (Mesleği = 3) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 2) ve (Medeni_durumu = 1) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 6) ve (YaĢadığı_il = 1) ve (Cinsiyeti = 1) (Mesleği = 25) ve (Öğrenim_durumu = 1) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (En_son_çalıĢma_yılı = 3) ve (Cinsiyeti = 1) (Mesleği = 25) ve (Öğrenim_durumu = 6) ve (Net_geliri = 5) ve (YaĢı = 6) ve (Oturduğu_ev = 2) (Mesleği = 33) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (YaĢadığı_il = 3) (Mesleği = 34) ve (Öğrenim_durumu = 5) ve (Cinsiyeti = 1) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 5) ve (Öğrenim_durumu = 4) ve (Cinsiyeti = 2) Kural 21 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 21: Eğer (anapara > 25) ve (t-5 = D8) ve (t-4 = S) ve (t-3 = S) ve (t-2 = S) ve (t-1 = S) = P (50, % 3,37) Sosyo-demografik karakteristik; (Mesleği = 5) ve (YaĢı = 3) ve (Medeni_durumu = 2) (En_son_çalıĢma_yılı = 1) (Mesleği = 8) ve (Öğrenim_durumu = 4) ve (YaĢı = 3) ve (Cinsiyeti = 1) ve 152 (Mesleği = 8) ve (Öğrenim_durumu = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 4) ve (YaĢı = 3) (Mesleği = 9) ve (Öğrenim_durumu = 2) ve (Cinsiyeti = 1) ve (YaĢadığı_il = 1) (Mesleği = 9) ve (Öğrenim_durumu = 6) ve (Net_geliri = 2) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 10) ve (Net_geliri = 4) ve (Öğrenim_durumu = 4) ve (YaĢı = 2) (Mesleği = 10) ve (Net_geliri = 4) ve (Öğrenim_durumu = 5) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 10) ve (Net_geliri = 4) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 10) ve (Net_geliri = 4) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (YaĢadığı_il = 1) ve (ÇalıĢma_Ģekli = 2) (Mesleği = 10) ve (Net_geliri = 5) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 3) ve (EĢi_çalıĢıyor_mu = 2) (Mesleği = 11) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 1) ve (Öğrenim_durumu = 4) ve (Oturduğu_ev = 1) ve (Cinsiyeti = 2) (Mesleği = 11) ve (YaĢı = 4) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 2) ve (Cinsiyeti = 1) ve (Medeni_durumu = 2) (Mesleği = 12) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 3) ve (Medeni_durumu = 1) (Mesleği = 12) ve (YaĢı = 5) ve (Öğrenim_durumu = 7) (Mesleği = 13) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 2) ve (YaĢadığı_il = 1) ve (Medeni_durumu = 2) ve (YaĢı = 2) ve (otovarmi = 2) (Mesleği = 13) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 2) ve (YaĢadığı_il = 1) ve (Medeni_durumu = 2) ve (YaĢı = 4) (Mesleği = 13) ve (Öğrenim_durumu = 7) ve (YaĢadığı_il = 1) ve (Cinsiyeti = 1) (Mesleği = 14) ve (Öğrenim_durumu = 5) ve (Net_geliri = 2) (Mesleği = 14) ve (Öğrenim_durumu = 6) ve (YaĢı = 2) (Mesleği = 18) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 18) ve (Öğrenim_durumu = 5) ve (YaĢı = 4) 153 (Mesleği = 19) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 1) ve (Cinsiyeti = 1) (Mesleği = 21) ve (Öğrenim_durumu = 1) ve (Cinsiyeti = 2) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 21) ve (Öğrenim_durumu = 4) ve (Net_geliri = 1) ve (En_son_çalıĢma_yılı = 2) ve (Medeni_durumu = 2) ve (YaĢadığı_il = 2) (Mesleği = 21) ve (Öğrenim_durumu = 8) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 1) (Mesleği = 22) ve (Öğrenim_durumu = 7) ve (YaĢı = 6) ve (YaĢadığı_il = 3) (Mesleği = 24) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Oturduğu_ev = 1) ve (Cinsiyeti = 2) (Mesleği = 24) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (YaĢadığı_il = 4) (Mesleği = 26) ve (Öğrenim_durumu = 5) ve (Net_geliri = 1) ve (En_son_çalıĢma_yılı = 4) ve (Oturduğu_ev = 2) (Mesleği = 26) ve (Öğrenim_durumu = 5) ve (Net_geliri = 5) ve (YaĢı = 3) ve (YaĢadığı_il = 2) (Mesleği = 26) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 2) ve (Oturduğu_ev = 1) (Mesleği = 26) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 2) ve (Oturduğu_ev = 2) (Mesleği = 27) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 5) (Mesleği = 28) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 1) ve (YaĢadığı_il = 1) (Mesleği = 28) ve (Öğrenim_durumu = 6) ve (YaĢı = 3) ve (Cinsiyeti = 2) (Mesleği = 33) ve (Öğrenim_durumu = 2) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 1) (Mesleği = 33) ve (Öğrenim_durumu = 5) ve (ÇalıĢma_Ģekli = 3) ve (Cinsiyeti = 1) ve (YaĢı = 4) 154 (Mesleği = 33) ve (Öğrenim_durumu = 6) ve (YaĢı = 4) ve (YaĢadığı_il = 2) (Mesleği = 33) ve (Öğrenim_durumu = 7) ve (YaĢadığı_il = 1) (Mesleği = 34) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 1) ve (YaĢı = 2) (Mesleği = 36) ve (Öğrenim_durumu = 5) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 3) ve (Öğrenim_durumu = 6) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 5) ve (Öğrenim_durumu = 4) ve (Cinsiyeti = 1) (Mesleği = 38) ve (YaĢı = 1) ve (YaĢadığı_il = 4) ve (Net_geliri = 1) (Mesleği = 40) ve (YaĢı = 5) ve (Medeni_durumu = 2) (Mesleği = 42) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 2) ve (Öğrenim_durumu = 4) ve (Medeni_durumu = 1) ve (YaĢadığı_il = 2) (Mesleği = 42) ve (YaĢı = 5) ve (YaĢadığı_il = 1) ve (En_son_çalıĢma_yılı = 4) ve (Net_geliri = 1) ve (Medeni_durumu = 1) Kural 22 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 22: Eğer (t-7 = D1) ve (t-1 = D8) = P (1, % 0,07) Sosyo-demografik karakteristik; (Mesleği = 11) ve (YaĢı = 2) ve (Net_geliri = 5) ve (Oturduğu_ev = 2) ve (Cinsiyeti = 2) Kural 23 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 23: Eğer (t-7 = D2) ve (t-1 = D8) = P (3, % 0,20) Sosyo-demografik karakteristik; 155 (Mesleği = 8) ve (Öğrenim_durumu = 1) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 10) ve (Net_geliri = 3) ve (YaĢı = 3) ve (Medeni_durumu = 1) ve (Oturduğu_ev = 4) (Mesleği = 32) ve (Öğrenim_durumu = 2) ve (Cinsiyeti = 2) Kural 24 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 24: Eğer (t-7 = D3) ve (t-1 = D8) = P (4, % 0,27) Sosyo-demografik karakteristik; (Mesleği = 7) ve (En_son_çalıĢma_yılı = 2) ve (ÇalıĢma_Ģekli = 2) (Mesleği = 21) ve (Öğrenim_durumu = 4) ve (Net_geliri = 2) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 34) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 4) ve (Oturduğu_ev = 1) (Mesleği = 42) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 2) ve (Öğrenim_durumu = 4) ve (Medeni_durumu = 2) Kural 25 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 25: Eğer (t-7 = D8) ve (t-1 = D8) = P (2, % 0,13) Sosyo-demografik karakteristik; (Mesleği = 21) ve (Öğrenim_durumu = 4) ve (Net_geliri = 3) ve (Cinsiyeti = 2) (Mesleği = 30) ve (Öğrenim_durumu = 8) 156 Kural 26 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 26: Eğer (t-7 = Y1) ve (t-1 = D8) = P (12, % 0,81) Sosyo-demografik karakteristik; (Mesleği = 9) ve (Öğrenim_durumu = 4) ve (YaĢı = 4) ve (Net_geliri = 3) ve (Medeni_durumu = 2) (Mesleği = 14) ve (Öğrenim_durumu = 5) ve (Net_geliri = 4) (Mesleği = 14) ve (Öğrenim_durumu = 5) ve (Net_geliri = 5) ve (YaĢı = 4) (Mesleği = 21) ve (Öğrenim_durumu = 7) ve (YaĢadığı_il = 3) ve (Oturduğu_ev = 2) (Mesleği = 22) ve (Öğrenim_durumu = 4) ve (YaĢı = 2) ve (Cinsiyeti = 2) (Mesleği = 22) ve (Öğrenim_durumu = 6) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 26) ve (Öğrenim_durumu = 5) ve (Net_geliri = 5) ve (YaĢı = 3) ve (YaĢadığı_il = 1) (Mesleği = 28) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 2) ve (YaĢı = 3) ve (Medeni_durumu = 1) ve (YaĢadığı_il = 4) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 1) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 2) ve (Oturduğu_ev = 3) (Mesleği = 38) ve (YaĢı = 1) ve (YaĢadığı_il = 2) ve (Net_geliri = 3) (Mesleği = 42) ve (YaĢı = 2) ve (YaĢadığı_il = 4) (Mesleği = 42) ve (YaĢı = 3) ve (En_son_çalıĢma_yılı = 1) ve (Oturduğu_ev = 1) ve (Cinsiyeti = 1) Kural 27 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 27: Eğer (t-7 = Y2) ve (t-1 = D8) = P (15, % 1,01) 157 Sosyo-demografik karakteristik; (Mesleği = 3) ve (YaĢı = 4) ve (En_son_çalıĢma_yılı = 1) ve (ÇalıĢma_Ģekli = 2) ve (Cinsiyeti = 1) (Mesleği = 11) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 2) ve (Net_geliri = 5) ve (Öğrenim_durumu = 4) (Mesleği = 12) ve (YaĢı = 2) ve (Cinsiyeti = 1) ve (Net_geliri = 3) (Mesleği = 21) ve (Öğrenim_durumu = 6) ve (En_son_çalıĢma_yılı = 1) ve (YaĢadığı_il = 1) ve (YaĢı = 3) ve (Medeni_durumu = 2) (Mesleği = 24) ve (Öğrenim_durumu = 2) ve (Cinsiyeti = 1) (Mesleği = 25) ve (Öğrenim_durumu = 5) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 1) (Mesleği = 25) ve (Öğrenim_durumu = 7) ve (YaĢı = 4) (Mesleği = 27) ve (Öğrenim_durumu = 2) ve (Cinsiyeti = 1) (Mesleği = 27) ve (Öğrenim_durumu = 8) ve (En_son_çalıĢma_yılı = 4) (Mesleği = 28) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 35) ve (Öğrenim_durumu = 8) ve (En_son_çalıĢma_yılı = 2) (Mesleği = 37) ve (YaĢı = 3) ve (YaĢadığı_il = 3) ve (Öğrenim_durumu = 4) (Mesleği = 38) ve (YaĢı = 5) ve (Öğrenim_durumu = 2) (Mesleği = 42) ve (YaĢı = 1) ve (Net_geliri = 3) ve (Oturduğu_ev = 3) (Mesleği = 42) ve (YaĢı = 1) ve (Net_geliri = 5) ve (YaĢadığı_il = 1) ve (Cinsiyeti = 2) ve (Oturduğu_ev = 1) Kural 28 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 28: Eğer (t-7 = Y3) ve (t-1 = D8) = P (2, % 0,13) Sosyo-demografik karakteristik; (Mesleği = 11) ve (YaĢı = 4) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 2) ve (Cinsiyeti = 1) ve (Medeni_durumu = 1) 158 (Mesleği = 33) ve (Öğrenim_durumu = 4) ve (ÇalıĢma_Ģekli = 2) ve (YaĢı = 3) ve (YaĢadığı_il = 2) Kural 29 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 29: Eğer (t-7 = S) ve (t-6 = Y4) ve (t-1 = D8) = P (5, % 0,34) Sosyo-demografik karakteristik; (Mesleği = 24) ve (Öğrenim_durumu = 5) ve (Net_geliri = 4) ve (YaĢı = 4) ve (YaĢadığı_il = 1) (Mesleği = 24) ve (Öğrenim_durumu = 5) ve (Net_geliri = 5) ve (YaĢı = 3) ve (Medeni_durumu = 2) (Mesleği = 28) ve (Öğrenim_durumu = 4) ve (Oturduğu_ev = 1) ve (Net_geliri = 5) (Mesleği = 28) ve (Öğrenim_durumu = 4) ve (Oturduğu_ev = 4) ve (Medeni_durumu = 2) (Mesleği = 33) ve (Öğrenim_durumu = 1) ve (YaĢı = 5) Kural 30 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 30: Eğer (anapara <= 85.95) ve (t-4 = D8) ve (t-3 = S) ve (t-2 = S) ve (t1 = S) = P (6, % 0,40) Sosyo-demografik karakteristik; (Mesleği = 3) ve (YaĢı = 5) ve (En_son_çalıĢma_yılı = 1) ve (Cinsiyeti = 2) (Mesleği = 11) ve (YaĢı = 2) ve (Net_geliri = 2) ve (Medeni_durumu = 2) (Mesleği = 13) ve (Öğrenim_durumu = 4) ve (En_son_çalıĢma_yılı = 2) ve (YaĢadığı_il = 2) 159 (Mesleği = 19) ve (Öğrenim_durumu = 6) ve (YaĢı = 6) ve (YaĢadığı_il = 3) (Mesleği = 25) ve (Öğrenim_durumu = 5) ve (YaĢı = 4) ve (Net_geliri = 2) Kural 31 ve bu kuralı gerçekleĢtirerek yatırım hesabını kapatan müĢterilerin sosyo-demografik karakteristiği Kural 31: Eğer (t-5 = S) ve (t-4 = S) ve (t-3 = S) ve (t-2 = S) ve (t-1 = S) = P (12, % 0,81) Sosyo-demografik karakteristik; (Mesleği = 8) ve (Öğrenim_durumu = 2) ve (YaĢı = 6) (Mesleği = 8) ve (Öğrenim_durumu = 6) ve (Net_geliri = 4) ve (YaĢı = 3) ve (Cinsiyeti = 2) ve (En_son_çalıĢma_yılı = 2) ve (Medeni_durumu = 2) (Mesleği = 9) ve (Öğrenim_durumu = 5) ve (Oturduğu_ev = 2) ve (YaĢı = 4) (Mesleği = 9) ve (Öğrenim_durumu = 6) ve (Net_geliri = 5) ve (En_son_çalıĢma_yılı = 1) ve (Oturduğu_ev = 1) (Mesleği = 13) ve (Öğrenim_durumu = 2) ve (En_son_çalıĢma_yılı = 3) (Mesleği = 13) ve (Öğrenim_durumu = 5) ve (ÇalıĢma_Ģekli = 3) ve (Oturduğu_ev = 2) ve (Cinsiyeti = 1) (Mesleği = 18) ve (Öğrenim_durumu = 5) ve (YaĢı = 5) (Mesleği = 22) ve (Öğrenim_durumu = 5) ve (En_son_çalıĢma_yılı = 1) ve (Cinsiyeti = 2) (Mesleği = 25) ve (Öğrenim_durumu = 8) ve (Net_geliri = 2) ve (YaĢadığı_il = 1) (Mesleği = 35) ve (Öğrenim_durumu = 5) ve (YaĢı = 5) ve (Cinsiyeti = 2) (Mesleği = 42) ve (YaĢı = 5) ve (YaĢadığı_il = 2) ve (Medeni_durumu = 1) 160 6.2.8. Sonuçların yorumlanması J4.8 algoritması ile yatırım hesabını kapatan müĢterilerin hangi iĢlem detayı ile hesabını kapattığı bilgisine ulaĢılmıĢ ve ulaĢılan iĢlem detay bilgisi yatırım hesabını kapatan müĢterilerin hesap kapatma kuralı olarak kabul edilmiĢtir. Kabul edilen kuralları gerçekleĢtiren müĢterilerin sosyo-demografik verilerini Id3 algoritması ile analiz ederek yatırım hesabını belirlenen kurala göre kapatan müĢterinin sosyo-demografik karakteristiği ortaya çıkartılmıĢtır. En çok karĢılaĢılan yatırım hesabını kapatma kuralı 1. kuraldır. Bu kuralı takip ederek yatırım hesabını kapatan müĢteri oranı %33.13‟dür. Kurala göre t-2 ayında hesabında D8 değerine göre iĢlem yapan ve t-1 ayında hiç iĢlem yapmayan yani hesabında bulunan yatırım fonlarının en az %80‟ini t-2 ayında satarak t-1 ayında hiç iĢlem yapmamıĢ olan kiĢi t ayında hesabını kapatarak banka yatırım fonu müĢterisi olmaktan çıkmaktadır. Bu kiĢiler t-1 ayında hiç iĢlem yapmamıĢ ve t ayında yatırım hesabını kapatmıĢ iseler aslında t-2 ayında hesaplarında bulunan yatırım fonlarının tamamını satmıĢlardır. MüĢterilerin yatırım hesabındaki fonları satmakta hızlı hareket ettiği ve yatırım hesabını kapatmak için yalnızca bir ay bekledikleri görülmektedir. Bu grup müĢterilerin yatırım hesaplarını kapatmamaları için irtibata geçerek ikna etmek için bankanın fazla zamanı yoktur. Özel ilgilenilmesi gereken bir grup olduğu açıktır. Bu kuralı gerçekleĢtirerek yatırım fonu hesabını kapatan müĢterilerin sosyo-demografik verilerine baktığımızda; çok değiĢik mesleklerden, çeĢitli çalıĢma Ģekillerine sahip, değiĢik yaĢ gruplarında kiĢiler oldukları görülmektedir. Ġlginç özelliklerden biri, mesleği 2 yani asker ve 39 yani Ģoför olan müĢterilerin tamamı bu kurala göre hareket etmektedir. Yine çok karĢılaĢılan yatırım hesabını kapatma kuralı 2. kuraldır. Bu kuralı takip ederek yatırım hesabını kapatan müĢteri oranı ise %23.84‟dür. Kurala göre t-7 ve t-6 aylarında iĢlem yapmayarak t-1 ayında hesabında D8 değerine göre iĢlem yapan ve t ayında hesabını kapatarak banka yatırım fonu müĢterisi olmaktan çıkmaktadır. Bu kurala göre yatırım hesabını 161 kapatan müĢterilerin 1. kurala göre yatırım hesabını kapatan müĢterilere göre daha hızlı hareket ettiği, hesabını kapatmak için hiç vakit kaybetmedikleri görünmektedir. 1. kuralda olduğu gibi yine bu grup müĢterilerin yatırım hesaplarını kapatmamaları için irtibata geçerek ikna etmek için bankanın fazla zamanı yoktur. Özel ilgilenilmesi gereken bir gruptur. Bu kuralı gerçekleĢtirerek yatırım fonu hesabını kapatan müĢterilerin sosyo-demografik verilerine baktığımızda; çok değiĢik mesleklerden, çeĢitli çalıĢma Ģekillerine sahip, değiĢik yaĢ gruplarında kiĢiler oldukları görülmektedir. Mesleği 4 yani Bakan, Milletvekili, Bürokrat olan müĢterilerden bay olanlar bu kurala göre hareket etmektedir. Çok karĢılaĢılan yatırım hesabını kapatma kurallarından biri de %14.28‟lik oran ile 3. kuraldır. Kurala göre t-3 ayında hesabında D8 değerine göre iĢlem yapan, t-2 ve t-1 ayında hiç iĢlem yapmayan, t ayında ise hesabını kapatarak banka yatırım fonu müĢterisi olmaktan çıkmaktadır. 1. ve 2. kurala göre yatırım hesabını kapatmak için bir ay daha fazla bekleyen bu grup müĢterilerin de özel ilgilenilmesi gereken müĢteriler oldukları söylenebilir. 4. kurala göre yatırım hesabını kapatan müĢteriler ise 1., 2. ve 3. kurala göre kapatan müĢterilere nazaran yatırım hesabın kapatmak için daha yavaĢ davranmakta, t-4 ayında D8 değerine göre iĢlem yaparak t-3, t-2 ve t-1 aylarında iĢlem yapmadan ve hesapların kapatmadan beklemektedirler. Mesleği 17 yani iĢçi olan müĢterilerin tamamı ve mesleği 4 yani Bakan, Milletvekili, Bürokrat olan müĢterilerden bayan olanlar bu kurala göre hareket etmektedir. 13., 14., 15., 16., 17. ve 18. kurala göre yatırım hesabını kapatan müĢteriler t-1 ayında D8 değerine göre iĢlem yaparak yatırım hesaplarını kapatmalarına rağmen t-6 ayında D3, D4, D5, D6 ve D7 değerine göre iĢlem yaparak yatırım hesaplarını kapatacaklarının sinyallerini vermiĢler fakat D8 değerine göre iĢlem yaptıktan hemen sonra yatırım hesaplarını kapatmıĢlardır. 162 Hesapları üzerinde yüklü miktarda satıĢ yaparak yatırım hesapları kapatan müĢterilerin aksine 19., 20. ve 29. kuralları gerçekleĢtiren müĢteriler t-1 ayında D8 değerine göre iĢlem yapmıĢ olmalarına rağmen t-6 ayında Y1, Y2 ve hatta Y4 değerine göre iĢlem yaparak yatırım fonu hesapları arttırmıĢlardır. Yine bu grup müĢterilerin yatırım hesabını kapatmak için acele eden müĢteriler arasında yer aldıkları söylenebilir. Yatırım hesabını kapatma yani hesabında bulunan tüm fonun satılması iĢleminin satıĢ ağırlıklı olduğu yani D8 iĢleminde yoğunlaĢtığı ortadadır. MüĢterinin yüksek miktarda satıĢ iĢlemi (özellikle D7 ve D8) yapmadan fark edilmesi, proaktif davranılarak hesabını kapatmadan bankada kalması için ikna edilmesi, ise sınıflandırılması yapılan sosyo-demografik karakteristiklerinin takip edilmesi ile mümkün olacaktır. Bunun en çarpıcı örneği ve kanıtı, mesleği asker veya Ģoför olan tüm müĢterilerin 2. kurala göre ve mesleği 17 yani iĢçi olan müĢterilerin ise 4. kurala göre iĢlem yaptıklarının saptanması olmuĢtur. Parasının değer kaybetmemesi ve kazancından arta kalan paranın tasarruf araçlarında değerlenmesini isteyen müĢteriler belli yatırım araçlarından paralarını değerlendirdikten sonra ihtiyaçları olduğu zaman yatırım araçlarındaki (vadeli mevduat, yatırım fonu, hisse senedi, devlet iç borçlanma senetleri vb.) tasarruflarını bozdurarak çeĢitli ihtiyaçlarını gidermek isterler. Bu yüzden yatırım hesabını kapatarak tüm portföyünü boĢaltan müĢterilerin her zaman kaybedildiği düĢünülmemelidir. Bu müĢterilerin yatırım hesaplarını kapatarak her zamana baĢka bankaya taĢıdıklarını düĢünmek yanlıĢ olur. Yatırım hesabındaki parayı tamamen çeken müĢterinin menkul veya gayrimenkule yatırım yaptığı olasılığı da düĢünülmelidir. Bu durumda müĢterisinin yatırım hesabını kapatmasını istemeyen banka yönetimi hesabını kapatmaya meyilli olan ve yaptığımız çalıĢmada ortaya çıkan iĢlem hareketlerini gösteren müĢterileri önceden tespit etmeli, hesaplarını kapatmamaları için çeĢitli tutundurma faaliyetleri yapmaları gerekmektedir. Örneğin müĢteri, konut veya otomobil almak için yatırım hesabındaki parayı 163 tamamen çekmiĢ ve yatırım hesabını kapatmıĢ olabilir. Bu durumun önceden tespit edilmeli ve bankanın mevcut kredi alternatifleri ile müĢteriye kredi önerisinde bulunulmalı, yatırım hesabını kapatmadan müĢteriye kredi kullandırılmaya çalıĢılmalıdır. Bu durumda müĢteri bankanın hem yatırım fonu müĢterisi hem de kredi müĢterisi olmuĢ olacaktır ki bu durumda banka müĢteriye hem çapraz satıĢ yapmıĢ hem de müĢterisini kaybetmemiĢ olacaktır. 164 7. SONUÇ VE DEĞERLENDĠRME Bilginin, bilgiye ulaĢmanın, rekabet etmek için farkında olmanın öneminin arttığı günümüz teknolojisinde firmaların veri madenciliği gibi bir bilim ile öne çıkmak için çalıĢma yapmaları doğal bir gerekliliktir. MüĢterilerinin ihtiyaçlarını bilen, onları elde tutmak için çalıĢmalar yapan, onlara hangi ürünleri hangi zamanlama ve hizmet Ģekli ile sunması gerektiğini planlayan firmaların rakiplerine göre daha rekabetçi olmaları, pazardan daha fazla pay almaları ise doğaldır. Firmaları pazarda daha rekabetçi kılan unsurlardan biri de Ģüphesiz sadık müĢteri portföyüdür. Sadık müĢteri yapma faaliyeti firmalar için zorlu bir süreçtir. Bir müĢterinin kazanılması için harcanan reklam ve tutundurma faaliyetleri giderleri firmanın giderlerinin önemli bir kısmını tutmaktadır. Bu yüzden firmalar portföyüne kazandırdıkları müĢterileri asla kaybetmek istemezler. Bu çalıĢma, kaybedilen yatırım fonu müĢterilerinin kaybedilme sürecinde göstermiĢ oldukları iĢlem hareket detayının kural haline dönüĢtürülmesi, kural haline dönüĢtürülen iĢlem hareket detaylarını sergileyerek yatırım hesabını kapatmıĢ müĢterilerin sosyo-demografik karakteristiğinin çıkartılması ve bundan sonra hesabını kapatmaya meyilli müĢterilerin tespit edilerek kaybedilmesinin önlenmesi üzerine yoğunlaĢmıĢtır. Bu çalıĢmada, belli bir iĢlem geçmiĢinden sonra yatırım hesabını kapatarak banka müĢterisi olmaktan çıkan müĢterilerin yatırım fonu alıĢ satıĢ talimat verileri sınıflandırma yöntemleri kullanılarak analiz edilmiĢ, analiz sonuçları kural haline dönüĢtürülmüĢ, kuralları takip ederek yatırım hesabını kapatan müĢterilerin sosyo-demografik özellikleri ile tekrar sınıflandırma yapılmıĢtır. Ġki sınıflandırma yöntemi çıktıları birleĢtirilerek yatırım hesabını kapatma kuralı ve kuralı gerçekleĢtiren müĢteri sosyo-demografik özellikleri oluĢturulmuĢtur. WEKA‟ da gerçekleĢtirilen madencilik uygulamasında J4.8, 165 Id3, PART, OneR, JRip ve Naive Bayes gibi algoritmalar sınanarak içlerinden en uygun olanları seçilmiĢtir. MüĢterinin yatırım fonu alıĢ satıĢ talimat verilerinin sınıflandırılması için J4.8 algoritması, sosyo-demografik verilerinin sınıflandırılması için ise Id3 algoritması kullanılmıĢtır. MüĢterinin yatırım fonu alıĢ satıĢ talimat verilerinin sınıflandırılması incelendiğinde, herhangi bir t anında D8 değerine göre iĢlem yapmıĢ olma özelliğinin baskın olarak yatırım hesabını kapatma iĢlemi ile örtüĢtüğü görülmektedir. MüĢterinin bu iĢlemi yapmadan tespit edilmesine olanak sağlayan bilgi ise sosyo-demografik verilerin sınıflandırılması sonuçlarında saklıdır. Birbirinden bağımsız olarak kullanılamayacak bu sınıflandırmalar beraber kullanıldığında hangi özelliklere sahip müĢterinin hangi iĢlem davranıĢı ile yatırım hesabını kapatacağı öngörülebilmektedir. Bu öngörü, bankanın müĢteri kaybetmemek için alacağı önlemlere ıĢıt tutacaktır. Yapılan çalıĢma ile yatırım hesabını kapatarak banka müĢterisi olmaktan çıkmıĢ müĢterilerin hangi iĢlem hareket ile hareket ederek yatırım hesabını kapattığı, bu hareketi gösteren müĢterilerin karakteristiğinin ne olduğu belirlenmiĢtir. sosyo-demografik Belirlenen sosyo-demografik karakteristiğe göre yatırım hesabını kapatmamıĢ müĢterilerin hangi iĢlem hareketi ile yatırım hesabını kapatabileceği öngörülebilmektedir. Hesabını kapatmaya yönelik iĢlem yapmaya baĢlayan müĢterilerin ise kolayca tespit edilmesi ve hesaplarını kapatmadan müdahale edilerek bankada tekrar kazandırılması mümkündür. Sonuç olarak, tespit edilen sosyo-demografik ve yatırım fonu iĢlemi yapma özellikleri ile bankada hesabını kapatmaya yönelen müĢteriler tespit edilebilecek, çeĢitli tutundurma faaliyetleri ile proaktif davranılarak müĢteri kaybının yaĢanması engellenebilecektir. 166 KAYNAKLAR 1. Han, J., Kamber, M., “Data Mining: Concepts and Techniques 1st ed.”, Morgan Kaufmann, USA, 3-16, (2001). 2. Dolgun, M.Ö., “Büyük AlıĢveriĢ Merkezleri Ġçin Veri Madenciliği Uygulamaları”, Yüksek Lisans Tezi, Hacettepe Üniversitesi Fen Bilimleri Enstitüsü, Ankara, 18-33 (2006) 3. Chien, C F., Chen, L.F., “Data mining to improve personnel selection and enhance human capital: A case study in high-technology industry”, Expert Systems with Applications, 34(1): 280-290 (2008). 4. Giudici, P., “Applied Data Mining: Statistical Methods for Business and Industry 1st ed.”, John Wiley & Sons, England, 1-15, 85-110, (2003). 5. Fayyad, U., Piatetsky-Shapiro G., Smyth P., “From Data Mining to Knowledge Discovery in Databases,” American Association for Artificial Intelligence, 3(17): 37-54 (1996). 6. Holsheimer, M., Siebes, A., “Data mining: The search for knowledge in databases.”, Technical Report , CWI, Netherlands, 12 (1994). 7. Jacobs, P., ”Data Mining: What general managers need to know”, Harvard Management Update, 4 (10): 8-9 (1999). 8. Hand, D.J., “Data mining: statistics and more ?”, The American Statistician, 52: 112-118 (1998). 9. Aydoğan, F., “E-ticarette veri madenciliği yaklaĢımlarıyla müĢteriye hizmet sunan akıllı modüllerin tasarımı ve gerçekleĢtirimi”, Yüksek Lisans Tezi, Hacettepe Üniversitesi Fen Bilimleri Enstitüsü, Ankara, 10-18, 66-74, 88-95 (2003). 167 10. Witten, I.H., Frank, E., “Data Mining: Practical Machine Learning Tools and Techniques 2nd ed.”, Morgan Kaufmann, USA, 62-415 (2005). 11. Frank, E., Hall, M., Holmes, G., Kirkby, R., Pfahringer, B., Witten, I. H., “WEKA: A Machine Learning Workbench for Data Mining”, University of Waikato, New Zealand, 7-10 (2004). 12. Kolay, G., “ĠĢletmelerde Bilgi Sistemleri Verimliliğini Arttırmada Veri Madenciliği Yöntemi: Bir Simülasyon ÇalıĢması”, Yüksek Lisans Tezi, Zonguldak Karaelmas Üniversitesi Sosyal Bilimler Enstitüsü, Zonguldak, 32-52 (2006). 13. Shearer, C., “The Crisp-DM model: The new blueprint for data mining”, Journal of Data Warehousing, 5 (4): 13-23 (2000). 14. Akpınar, H., “Veritabanlarında bilgi keĢfi ve veri madenciliği”, İstanbul Üniversitesi İşletme Fakültesi Dergisi, 29: 1-22 (2000). 15. Piramuthu, S., “Evaluating feature selection methods for learning in data mining applications”, Thirty-First Annual Hawai International Conference on System Sciences, 5: 294 (1998). 16. Akbulut, S., “Veri madenciliği teknikleri ile bir kozmetik markanın ayrılan müĢteri analizi ve müĢteri segmentasyonu”, Yüksek Lisans Tezi, Gazi Üniversitesi Fen Bilimleri Enstitüsü, Ankara, 7-25 (2005). 17. Dalkılıç, G., Türkmen, F., “Karınca Kolonisi Optimizasyonu”, Yüksek Performanslı Bilişim Sempozyumu, Kocaeli, (2002). 18. Dorigo, M., Maniezzo, V., Colorni, A., “The Ant System : Optimization by a colony of cooperating agents”, IEEE Transactions on Systems, Man, and Cybernetics-Part B, 26 (1) : 1 - 13 (1996). 168 19. Ġnternet: Boğaziçi Üniversitesi “Zeki veri madenciliği: Ham veriden altın bilgiye ulaĢma yöntemleri”, www.cmpe.boun.edu.tr/~ethem/files/papers/ veri-maden_2k-notlar.doc (1999). 20. Özekes, S., “Veri Madenciliği Modelleri ve Uygulama Alanları”, İstanbul Ticaret Üniversitesi Dergisi, 2003: 65-82 (2001). 21. Kalıkov, A., “Veri madenciliği ve bir e-ticaret uygulaması”, Yüksek Lisans Tezi, Gazi Üniversitesi Fen Bilimleri Enstitüsü, Ankara, 22-38 (2006). 22. Chu, W., Lin, T.Y., “Foundations and Advances in Data Mining 1st ed.”, Springer Publisherss, USA, 25, 100 (2005). 23. Seow, H.V., Thomas, L.C., “To ask or not to ask, that is the question”, European Journal of Operational Reserch, 183: 1513 – 1520 (2007). 24. AltıntaĢ, T., “Veri madenciliği metotlarından algoritmalarının uygulamalı etkinlik analizi”, olan kümeleme Yüksek Lisans Tezi, Sakarya Üniversitesi Fen Bilimleri Enstitüsü, Sakarya, 14 - 16 (2006). 25. Kirkos, E., Spathis, C., Manolopoulos, Y., “Data Mining techniques for detection of fraudulent financial statements”, Expert Systems with Applications, 32 : 995 – 1003 (2007). 26. Ġnternet: Two Crows Corporation “Introduction to Data Mining and Knowledge Discovery,”, http://www.twocrows.com/intro-dm.pdf (2005). 27. Koyuncugil, A.S., “Bulanık Veri Madenciliği ve Sermaye Piyasalarına Uygulanması”, Doktora Tezi, Ankara Üniversitesi Fen Bilimleri Enstitüsü, Ankara, 70 - 80 (2006). 28. Kasap, E., “Sigortacılık Sektöründe MüĢteri ĠliĢkileri Yönetimi YaklaĢımıyla Veri Madenciliği Teknikleri ve Bir Uygulama”, Yüksek 169 Lisans Tezi, Marmara Üniversitesi Bankacılık ve Sigortacılık Enstitüsü, Ġstanbul, 50 - 52 (2007). 29. Yılmaz, L., “A Decision Support System Using Data Mining”, Yüksek Lisans Tezi, Yeditepe Üniversitesi Fen Bilimleri Enstitüsü, Ġstanbul, 16 - 22 (2002). 30. Yurtoğlu, H., “Yapay Sinir Ağları Metodolojisi ile Öngörü Modellemesi: Bazı Makroekonomik DeğiĢkenler için Türkiye Örneği”, Ekonomik Modeller Ve Stratejik Araştırmalar Genel Müdürlüğü, 12 - 32 (2005). 31. Kantardzic, M., “Data Mining: Concepts, Models, Methods, and Algorithms”, IEEE Press & John Wiley, USA, 1 - 18, 154 - 155 (2002). 32. Hsu, M.H., “A personalized English learning recommender system for ESL students”, Expert Systems with Applications, 34 : 683 - 688 (2008). 33. Liao, S.H., Wen, C.H., “Artificial neural networks classification and clustring of methologies and applications - literature analysis from 1995 to 2005”, Expert Systems With Applications, 32 : 1 - 11 (2007). 34. Han, J., Fu, Y., “Mining Multiple-Level Association Rules in Large Databases”, IEEE Transactions on Knowledge and Data Engineering, 11 (5) : 798 - 805 (1999). 35. Zaki, M.J., “Parallel and Distributed Association Mining: A Survey”, IEEE Concurrency Special issue on Parallel Mechanisms for Data Mining, 7 (5) : 14 - 25 (1999). 36. Plasse, M., Niang, N., Saporta, G., Villeminot, A., Leblond, L., “Combined use of association rules mining and clustring methods to find relevant links between binary rare attributes in a large data set” , Computationel Statistics & Data Analysis, 52 : 596 - 613 (2007). 170 37. Frank, E., Hall, M., Holmes, G., Kirkby, R., Pfahringer, B., Witten, I., H., “WEKA: A Machine Learning Workbench for Data Mining”, University of Waikato, New Zealand, 7 - 10 (2004). 38. Bilen, H., “Veri Madenciliği Ġle Bankacılık Sektörü ÇalıĢanlarını Değerlendirmeye Yönelik Bir Uygulama”, Yüksek Lisans Tezi, Gazi Üniversitesi Fen Bilimleri Enstitüsü, Ankara, 10 - 12, 45 - 47, 68 - 71 (2008). 39. Ġnternet: Türkiye Ġstatistik Kurumu “Ġllere göre kiĢi baĢına düĢen Gayri Safi Yurtiçi Hasıla verileri” http://www.tuik.gov.tr/ (2010). 40. Aydoğan, E., Gencer, C., Akbulut, S., “Churn Analysis and Customer Segmentation of a Cosmetics Brand Using Data Mining Techniques”, Journal of Engineering anh Natural Sciences, Sigma, 26 (2008). 41. Ahn,, J.H., Han, S.P., Lee, Y.S., “Customer Churn Analysis: Churn Determinants and Madiation Effects of Partial Defection in the Korean Mobile Telecommunications Service Industry”, ScienceDirect, Telecommunications Policy, 30 : 552 - 568 (2006). 42. Masand, B., Datta, P., Mani, D.R., Li, B., “CHAMP: A Prototype for Automated Cellular Churn Prediction”, Data Mining and Knowledge Discovery 3, Netherlands, 219 - 225 (1999). 43. Ruta, D., Nauck, D., Azvine, B., “K Nearest Squence Method and Its Application to Churn Prediction”, Springer-Verlag, Berlin Heidelberg, 207 - 215 (2006). 44. Huang, B. Q., Kechadi, M. T., Buckley, B., “Customer Churn Prediction for Broadband Internet Services”, Springer-Verlag, Berlin Heidelberg, 229 - 243 (2009). 171 45. Gopal, R. K., Meher, S. K., “Customer Churn Time Prediction in Mobile Telecominication Industry Using Ordinal Regression”, Springer-Verlag, Berlin Heidelberg, 884 - 889 (2008). 46. Farquad, M.A.H., Ravi, V., Raju, S.B., “Data Mining Using Rules Extracted from SVM: An Application to Churn Prediction in Bank Credit Cards”, Springer-Verlag, Berlin Heidelberg, 390 - 397 (2009). 47. Ġnternet: Türkiye Ziraat Bankası A.ġ. “Yatırım Fonları” Bankası T.A.O. “Yatırım Fonları” http://www.ziraat.com.tr (2010). 48. Ġnternet: Türkiye Vakıflar http://www.vakifbank.com.tr (2010). 172 ÖZGEÇMĠġ KiĢisel Bilgiler Soyadı, adı : ÇĠL, Fatih Uyruğu : T.C. Doğum tarihi ve yeri : 24.09.1983 Ankara Medeni hali : Evli Telefon : 0 (312) 591 20 61 e-mail : fatihcil2003@gmail.com Eğitim Derece Eğitim Birimi Mezuniyet tarihi Lisans Gazi Üniversitesi / Endüstri Mühendisliği 2006 Lise Ankara Bahçelievler Deneme Lisesi 2001 Yıl Yer Görev 2007 – Özel bir banka Programcı ĠĢ Deneyimi 2006 – 2007 Özel Ģirket Yabancı Dil Ġngilizce, Almanca DanıĢman