Akademik Sosyal Araştırmalar Dergisi, Yıl: 4, Sayı: 22, Mart2016, s. 385-394 Yüksel YURTAY1 Oğuz YAVUZYILMAZ2 Nihal Zuhal BACINOĞLU3 Gülşah AK4 MOBİLYA PERAKENDE SATIŞ SEKTÖRÜNDE VERİ MADENCİLİĞİ UYGULAMASI Özet Günümüzde bilgisayar sistemlerinin hızlı bir şekilde gelişmesinden dolayı veriler doğrudan sayısal olarak toplanıp saklanabilmektedir. Verilerin yığınla artması ve anlamlı çıkarımlar elde etme ihtiyacı arttıkça veri madenciliği kavramı ortaya çıkmıştır. Veri madenciliğinin temel amacı, veriler arasında bulunan ilişkiler, örüntüler, değişiklikler, sapma ve eğilimler, belirli yapılar gibi bilgilerin matematiksel teoriler ve bilgisayar algoritmaları kombinasyonları ile ortaya çıkartılması ve bunların yorumlanarak değerli bilgilerin elde edilmesidir. Veri madenciliği sınıflama, kategorize etme, tahmin etme ve görüntüleme dört ana başlıktan oluşmaktadır. Veri madenciliği yöntemleriyle çok büyük verilerden, anlamlı sonuçlar elde edilmektedir. Bu anlamlı sonuçların ortaya çıkarılmasında kullanılan yöntemlerden biri de birliktelik analizidir. Bu çalışmada bir mobilya firmasının bölge bayiliğinden alınan 10762 satış verisi gerekli dönüşüm ve ayrıştırmalar yapılarak, veri madenciliğinde birliktelik analizi çıkarım algoritmalarından biri olan, apriori algoritması için uygun hale getirilmiş ve sonuçlar irdelenmiştir. Anahtar Kelimeler: Veri Madenciliği, Apriori Algoritması, Birliktelik Analizi, Perakende Satış 1 Sakarya Üniversitesi, Bilgisayar ve Bilişim Bi.Fak. Bilgisayar Müh. Böl.,Sakarya, yyurtay@sakarya.edu.tr 2 Öğr. Gör., Kocaeli Üniversitesi, Gazanfer Bilge MYO, İşletme Yönetimi Bölümü, ,Kocaeli oguz.yavuzyilmaz@kocaeli.edu.tr 3 Sakarya Üniversitesi, Bilgisayar ve Bilişim Bi.Fak. Bilgisayar Müh. Böl. 4 Sakarya Üniversitesi, Bilgisayar ve Bilişim Bi.Fak. Bilgisayar Müh. Böl. Oğuz Yavuzyılmaz - Yüksel Yurtay - Nihal Zuhal Bacınoğlu - Gülşah Ak 386 A DATA MINING PRACTICE ON the RETAIL FURNITURE INDUSTRY Abstract Today, due to the rapid development of computer systems, the data can be stored and collected directly as numeric. Increases of needs abaout data and meaningful inferences has emerged the concept of data mining. The main purpose of Data Mining is that; the relationships patterns between data, changes, deviations and trends, specific structures, such as with a combination of computer algorithms and the mathematical theory of informations. And also interpreting them to obtain valuable information by bringing it to light. Data mining consists of four major titles as classification, categorizing, and estimating and imaging. In recent years, data from very large data mining methods with began to discover meaningful patterns. Association analysis is a method used in the discovery of this meaningful patterns. This study was made in a furniture company data received from the sale of franchises 10762 of the necessary transformation and separation are performed in the Data Mining algorithms suitable for apriori inference algorithm, which is one of the association analysis and the results were analyzed. Keywords: Data Mining, Apriori Algorithm, Association Analysis, Retail Trade GİRİŞ Veri madenciliği tanımı itibariyle büyük ölçekli veriler arasından “değeri olan” bilgiyi elde etme tekniğidir. Veri ambarlarındaki gizlenmiş, potansiyel olarak faydalı bilgileri ortaya çıkarma; daha sonra bu bilgileri karar verme ve uygulama aşamasında kullanma sürecidir. Bu teknik sayesinde ileriye yönelik kestirimlerde bulunmak mümkündür. Başka bir ifade ile veri madenciliği, bir kurumda üretilen tüm verilerin belirli yöntemler kullanarak var olan; ya da gelecekte ortaya çıkabilecek gizli bilgiyi su yüzüne çıkarma süreci olarak değerlendirilir (Özkan,2008). Veri madenciliği teknikleri, tanımlayıcı ve tahmin edici teknikler olmak üzere ikiye ayrılır: Tanımlayıcı teknikler, karar vermeye yardım edecek verilerin tanımlanmasını sağlar. Birliktelik kuralları (associationrules) ve kümeleme (clustering) tanımlayıcı tekniklere örnek olarak verilebilir. Bunlar tahmin edici teknikler ise sonuçları bilinen verileri kullanarak sonuçları bilinmeyen veri kümelerinin sonuçlarının tahmin edilmesini sağlar (Küçüksille,2009). Literatürde birliktelik analizi ile ilgili birçok çalışma yapılmıştır. Koç ve diğerleri (2011), bilgisayar öğretmenliği bölümü öğrencilerinin sosyal ağları kullanma seviyeleri incelenmiş ve sosyal ağların öğrencileri ne derecede etkilediği tespit edebilmek amacıyla öğrencilere bir anket formu yöneltip elde edilen verilere birliktelik kurallarını uygulamıştır. Yurtay ve diğerleri(2013) tarafından yapılan çalışmada bilgisayar mühendisliği bölümü öğrencilerinin teknik seçmeli ders seçimlerindeki nedenlerin belirlenmesi amaçlanmıştır. Perakendecilik, üretici ve tüketici arasında malların naklini sağlayan aracılık hizmetleridir. Başka bir deyişle mal ve hizmetlerin ticari bir amaçla kullanma ve tekrar satmama, kişisel gereksinimleri için kullanma koşuluyla, doğrudan doğruya son tüketiciye pazarlanmasıyla ilgili faaliyetlerin bütünüdür (Öztürk, 2006:69). TheJournal of AcademicSocialScienceYıl: 4, Sayı: 22, Mart 2016, s. 385-394 387 Mobilya Perakende Satış Sektöründe Veri Madenciliği Uygulaması Perakende sektörü son tüketiciye yönelik olduğu için çok fazla sayıda kişiye hitap etmektedir. Her bireyin mevcut ya da potansiyel bir son tüketici olduğu düşünüldüğünde ; sektörün hedef kitlesinin dünya nüfusu ile orantılı olduğu görülmektedir. Özellikle 21. Yüzyılda gelişen teknolojiler ve satış teknikleri ile perakendecilikte mevcut müşteri sayısı milyarlar ile ifade edilmektedir. Bu büyüklükteki bir sektörde; satışları, müşterileri, müşteri bilgilerini v.b. verileri analiz etmek klasik yöntemler ile pek mümkün değildir. Bu sebeple çok fazla sayıda bilgi ve veri yığınlarından anlamlı bir sonuç elde etmek için kullanılan veri madenciliği ; perakende sektöründe elde bulunan veriye uygun olarak belirlenecek algoritmalar ile geniş bir uygulama alanına sahiptir. Bu çalışmada mobilya perakende satış sektörü satış verileri analizi için; gerçek veriler üzerinden tanımlayıcı tekniklerden biri olan birliktelik kuralı çıkarım algoritmalarından Apriori algoritması üzerinde durulmuştur. Apriori algoritması incelenmiş ve uygulama detayları verilmiştir. Metot Birliktelik kuralları analizi, yaygın olarak kullanılan veri madenciliği yöntemlerinden birisidir. Veriler arasındaki birlikteliklerin, ilişkilerin ve bağıntıların kurallar halinde bulunması işlemidir. Veri nesneleri arasındaki ilginç ilişkiler ve eş zamanlı gerçekleşen durumlar araştırılır. Bir birliktelik kuralına örnek olarak “X ve Y ürününü satın alan müşterilerin %80 olasılıkla C ürününü de satın alması” verilebilir. Bu tür birliktelik kuralları, söz konusu nesneler ile ilgili durumun sıklıkla tekrarlanması durumunda anlamlıdır. Birliktelik kuralları analizi; ticaret, finans, mühendislik, fen ve sağlık sektörlerinin birçok alanlarında kullanılmaktadır. Örneğin, pazar sepet analizlerinde sıklıkla birlikte satılan ürünleri tespit etmek, web sayfalarında ziyaretçilerin hangi sayfaları birlikte tıkladığını araştırmak, bağıntılı olarak geçirilen hastalıkları belirlemek için kullanılabilmektedir (Birand,2010). Özellikle işletme alanındaki uygulamalarda, satış analizleri uygulamalarında; mevcut satışlar üzerinden veri madenciliği tekniği ile satışları analiz edip, yeni satış stratejileri oluşturmak oldukça fayda sağlamaktadır. Bu çalışmada da Mobilya Perakende sektörü satış verileri analizi için birliktelik kuralları analizi gerçekleştirilmiştir. Birliktelik kuralının matematiksel modeli Agrawal, Imielinski ve Swami tarafından1993 yılında sunulmuştur (Agrawal vd., 1993) Birliktelik kuralı çıkarım algoritmaları içerisinde Apriori, en fazla bilinen algoritmadır. Bu algoritmada sık geçen öğe kümelerini bulmak için birçok kez veritabanını taramak gerekir. İlk taramada bir elemanlı minimum destek metriğini sağlayan sık geçen öğe kümeleri bulunur. İzleyen taramalarda bir önceki taramada bulunan sık geçen öğe kümeleri aday kümeler adı verilen; yeni potansiyel sık geçen öğe kümelerini üretmek için kullanılır. Aday kümelerin destek değerleri tarama sırasında hesaplanır ve aday kümelerinden minimum destek metriğini sağlayan kümeler o geçişte üretilen sık geçen öğe kümeleri olur. Sık geçen öğe kümeleri bir sonraki geçiş için aday küme olurlar. Bu süreç yeni bir sık geçen öğe kümesi bulunmayana kadar devam eder (Alataş,2003). Örnek Veri ve Verinin Hazırlanması Çalışmada, Marmara bölgesinde faaliyet gösteren bir mobilya perakende satış firmasının verileri incelenerek, 15 aylık satış verileri üzerindeki birliktelik kuralları araştırıldı. Veriler üzerinde çalışmanın yapılabilmesi için, öncelikle verilerdeki hata, eksik ve bozuk kayıtlar temizlenerek, işlenebilir hale getirilmiştir. TheJournal of AcademicSocialScienceYıl: 4, Sayı: 22, Mart 2016, s. 385-394 Oğuz Yavuzyılmaz - Yüksel Yurtay - Nihal Zuhal Bacınoğlu - Gülşah Ak 388 1.Verinin Tanıtılması Bölge Bayiliğinden alınan kayıtlar “Sipariş Tarihi”,“Sipariş No”,”Teslim Tarihi”, “Cadde”, “Sokak”, “İlçe”, “Bölge kodu”, “Tel no”,“Stok kodu”,“Stok ismi”,“Depo”, “Miktar”, “Birim fiyat”,“Net fiyat”,“Tutar”, “Kdv’li Tutar”,“Sorumluluk merk.adı”,“İrsaliye no”,”Fatura tarihi” olmak üzere 19 sütundan oluşmaktadır. 2.Verinin Temizlenmesi 15 aylık toplam verilere bakıldığında eksik, gereksiz ve ortak olmayan sütunlar çıkarılmış ve uygulamaya alınmamıştır. Ortak sütun adları belirlenerek apriori uygulamasında kullanılabilecek 7 sütuna indirgenmiştir. Bu sütunlar “Ürün Adı”,”Ay”,”İl”,”Depo”,”Miktar”,”Bölge” ve ”Kdv' li Tutar” ‘dır. 3.Verinin Dönüştürülmesi Daha anlamlı bir çalışma ortaya çıkarabilmek adına “Ürünler” sütununa göre veri seti iki bölüme ayrılmıştır. İlk bölüm ve ikinci bölümde yer alan ürünler aşağıdaki tabloda gösterildiği gibidir. İlk Bölüm Alez Alez, Uyku Pedi, Yatak Pedi, Yastık Koruyucu Banyo Ürünleri Havlu, Bornoz Beyaz Ev Tekstili Yastık, Yorgan Ev Dekorasyon Ürünü Koltuk Örtüsü, Kırlent, Minder, Lamba Ev Tekstil Ürünü Döşemelik Kumaş, Battaniye, Nevresim Takımı, Yatak Örtüsü, Çarşaf, Uyku Seti İkinci Bölüm Başlık Baza/Karyola Bebek Seti Büfe Dolap Kanepe/Koltuk Komidin/Konsol/Şifonyer Köşe Takımı/Oturma Grubu/Modül TheJournal of AcademicSocialScienceYıl: 4, Sayı: 22, Mart 2016, s. 385-394 389 Masa Mobilya Perakende Satış Sektöründe Veri Madenciliği Uygulaması (Yemek Masası, Çalışma Masası) Sandalye/Puf Tamamlayıcılar (Sehpa, Kitaplık, TV Ünitesi) Yatak “İl” : Veriler içerisinde bulunan cadde, mahalle ve ilçe sütunları birleştirilerek il sütununa dönüştürülmüştür. 1. Ankara 2. Antalya 3. Bilecik 4. Bingöl 5. Bolu 6. Bursa 7. Çanakkale 8. Düzce 9. İstanbul 10. İzmir 11. Kayseri 12. Kocaeli 13. Konya 14. Kütahya 15. Sakarya 16. Yalova 17. Zonguldak “Depo”: TheJournal of AcademicSocialScienceYıl: 4, Sayı: 22, Mart 2016, s. 385-394 Oğuz Yavuzyılmaz - Yüksel Yurtay - Nihal Zuhal Bacınoğlu - Gülşah Ak 390 1. Adapazarı 2. Bölge 3. Düzce 4. Ereğli 5. Karakamış 6. Outlet 7. Plaza 8. Satış Sonrası “Miktar”: 1 olanlar Tekli Satışlar ve 1’den fazla olanlar Toplu Satışlar olmak üzere 2 sütuna ayrılmıştır. 1. Tekli Satışlar 2. Toplu Satışlar “Bölge” 1. Adapazarı 2. Bölge 3. Düzce 4. Ereğli 5. Merkez 6. Plaza 7. Satış Sonrası “KDV’li Tutar”: 0 ile 43.300 arasındaki değerler ilk veri seti için 50’lik, ikinci veri seti için 250’lik şekilde gruplandırılmıştır. Uygulama-1 Toplam 4845 kayıt içerisinde %15 Destek değeri ile 726 alt sınır olarak belirlenmiştir. Güven değeri ise %60 belirlenerek algoritma uygulanmıştır. TheJournal of AcademicSocialScienceYıl: 4, Sayı: 22, Mart 2016, s. 385-394 391 Mobilya Perakende Satış Sektöründe Veri Madenciliği Uygulaması Tablo 1: Birinci uygulamada elde edilen birliktelik kuralları ORTAYA ÇIKAN KURALLAR “kdv_tutar” değeri 100, “depo” değeri ADAPAZARI, “il” değeri SAKARYA “bolge”=ADAPAZARI % 99,593 “depo”=ADAPAZARI % 89,077 “bolge”=ADAPAZARI % 99,796 “depo” değeri ADAPAZARI “urun_adi” değeri Beyaz Ev Tekstili “bolge” değeri ADAPAZARI “il”=SAKARYA % 99,491 “kdv_tutar” değeri 100, “depo” değeri ADAPAZARI, “bolge” değeri ADAPAZARI “il”=SAKARYA % 99,324 “kdv_tutar” değeri 50, “bolge” değeri ADAPAZARI , “il” değeri SAKARYA “depo”= SAKARYA % 81,369 “depo”=ADAPAZARI % 76,466 “depo”= ADAPAZARI % 65,391 “urun_adi”= Beyaz Ev Tekstili % 61,597 “urun_adi” değeri Ev Tekstil Ürünü “bolge” değeri ADAPAZARI “il” değeri SAKARYA “depo” değeri ADAPAZARI “urun_adi” değeri Beyaz Ev Tekstili “il” değeri SAKARYA “urun_adi” değeri Beyaz Ev Tekstili, “bolge” değeri ADAPAZARI “il” değeri SAKARYA “kdv_tutar” değeri 100, “bolge” değeri ADAPAZARI , “il” değeri SAKARYA “kdv_tutar” değeri 50, “bolge” değeri ADAPAZARI , “il” değeri SAKARYA Uygulama-2 Toplam 5917 kayıt içerisinde %5 Destek değeri ile 296alt sınır olarak belirlenmiştir. Güven değeri ise %70 belirlenerek algoritma uygulanmıştır. TheJournal of AcademicSocialScienceYıl: 4, Sayı: 22, Mart 2016, s. 385-394 392 Oğuz Yavuzyılmaz - Yüksel Yurtay - Nihal Zuhal Bacınoğlu - Gülşah Ak Tablo 2: İkinci uygulamada elde edilen birliktelik kuralları ORTAYA ÇIKAN KURALLAR “urun_adi” değeri Yatak “bolge” değeri ADAPAZARI “depo” değeri BÖLGE “il”=SAKARYA % 95,512 “kdv_tutar” değeri 500 “bolge” değeri ADAPAZARI “depo” değeri BÖLGE “il”=SAKARYA % 94,686 “urun_adi” değeri Baza “bolge” değeri ADAPAZARI “depo” değeri BÖLGE “il”=SAKARYA % 92,92 “kdv_tutar” değeri 750 “bolge” değeri ADAPAZARI “depo” değeri BÖLGE “il”=SAKARYA % 92,371 “kdv_tutar” değeri 1000 “bolge” değeri ADAPAZARI “depo” değeri BÖLGE “il”=SAKARYA % 92,241 “urun_adi” değeri Koltuk “bolge” değeri ADAPAZARI “depo” değeri BÖLGE “il”=SAKARYA % 91,327 “bolge” değeri PLAZA “urun_adi” değeri Yatak “depo” değeri BÖLGE “il”=SAKARYA % 90,439 “ay” değeri Ocak “depo” değeri BÖLGE “İl” değeri SAKARYA “bolge”=ADAPAZARI % 75,145 “kdv_tutar” değeri 1250 “depo” değeri BÖLGE “İl” değeri SAKARYA “bolge”=ADAPAZARI % 71,768 “ay” değeri Aralık “depo” değeri BÖLGE “İl” değeri SAKARYA “bolge”=ADAPAZARI % 70 Elde edilen birliktelik kurallarında, örnek olarak ürün adı, bölge ve depo açısında değerlendirildiğinde, aktivitenin ürün açısından o bölgedeki depo üzerinde optimize edilebilmesi açısından fikir vermektedir. Kuralların tümü incelendiğinde tahmin edilen birliktelikler olmasının yanında, farkına varılamayan birlikteliklerin de görülmesi ve ortaya çıkarılması önemlidir. Bu çalışmada da ortaya çıkan kurallar ilgili taraflar ile değerlendirilmiştir. TheJournal of AcademicSocialScienceYıl: 4, Sayı: 22, Mart 2016, s. 385-394 393 Mobilya Perakende Satış Sektöründe Veri Madenciliği Uygulaması Ürün Grupları 120 100 % 80 60 40 20 0 1 2 3 4 5 6 7 8 9 UYGULAMA 1 99,593 89,077 99,796 99,491 99,324 81,369 76,466 65,391 61,597 UYGULAMA 2 95,512 94,686 92,92 92,371 92,241 91,327 90,439 75,145 71,768 Grafik: Ürün Grupları (Uygulama-1 ve Uygulama-2) arasındaki değişim Ürün gruplarının seçiminde, veriler arasındaki özelliklerin doğru seçimi birliktelik kuralları arasındaki oranı etkilemektedir. Sonuç Bu çalışmada, birliktelik kuralı çıkarım algoritmalarından Apriori algoritmasının kullanılmasına ilişkin bir uygulama gerçekleştirilmiştir. Apriori algoritması uygulaması, firmanın veri seti üzerinde uygulandığında farklı zaman dilimlerinde ürünler arasında birlikte satın alınma bağıntıları ortaya çıkarılıp, bayilerde satılan ürünlerin miktarı ve tutarı, satıldığı ay, satışın gerçekleştirildiği il, depo ve bölge niteliklerinin birbirleriyle ilişkileri incelenmiştir ve güven değerinin üzerinde çıkan birliktelikler kabul edilmiştir. Çalışma sadece belirli bir bölge bayiliğinden alının verilerde yer alan ürünler ile gerçekleştirilmiştir. Elde edilen sonuçlar bölge satışlarına göre müşterilerin ihtiyacı olan ürünlerin değişiklik gösterebilmesinden dolayı araştırmanın yapıldığı zaman aralığına göre de farklılık gösterebilir. Yapılan çalışma sonuçları bölge bazında yapılacak ürün satışlarında verimlilik elde edilmesine yardımcı olacaktır. Aynı zamanda analiz sonucunda elde edilen birliktelik bilgileri satış stratejilerinde kullanılabilir. Bu verilere göre birlikte satış yoğunluğu olan ürün grupları belirlenip; bunlara yönelik olarak kampanya ve tutundurma faaliyetleri gerçekleştirmek; başarılı satış sonuçları ortaya çıkarabilecektir. Gelecekte yapılacak çalışmalarda, daha fazla satış verileri ve müşteri profilleri arasındaki ilişkinin kullanılması, daha net sonuçların ortaya çıkacağı değerlendirmelerine de sebep olmuştur. TheJournal of AcademicSocialScienceYıl: 4, Sayı: 22, Mart 2016, s. 385-394 Oğuz Yavuzyılmaz - Yüksel Yurtay - Nihal Zuhal Bacınoğlu - Gülşah Ak 394 KAYNAKLAR AGRAWAL, R.,IMİELİNSKİ, T. ve SWAMİ, A., (1993), “Mining Association Rules Between Sets of Items in Large Databases”, In Proceedings of the ACM SIGMOD International Conference on Management of Data ACMSIGMOD ’93), 207-216,Washington, USA, 207-216. ALATAŞB,(2003) “Nicel Birliktelik Kurallarının Keşfinde Bulanık Mantık ve Genetik Algoritma Yaklaşımı” Fırat Ünv. Fen Bilimleri Enstitüsü Yüksek Lisans Tezi, Elazığ, BİRANT, D., Kut, A., VENTURA, M., ALTINOK, H., ALTINOK, B., ALTINOK, E., &IHLAMUR, M. İş Zekası Çözümleri için Çok Boyutlu Birliktelik Kuralları Analizi. Akademik Bilişim’10, 256. GÜNGÖR, E.,YALÇIN, N., &YURTAY, N. (2013). Apriori Algoritması ile Teknik Seçmeli Ders Seçim Analizi. Akademik Bilişim KOÇ, M.,&KARABATAK, M. (2011). Sosyal Ağların Öğrenciler Üzerindeki Etkisinin Veri Madenciliği Kullanılarak İncelenmesi INVESTIGATION OF THE EFFECT OF SOCIAL NETWORKS ON STUDENTS BY USING DATA MINING KÜÇÜKSİLLE, E.(2009), Veri Madenciliği Süreci Kullanılarak Portföy Performansının Değerlendirilmesi ve IMKB Hisse Senetleri Piyasasında Bir Uygulama, Süleyman Demirel Üniversitesi Sosyal Bilimler Enstitüsü, Doktora Tezi, Isparta ÖZTÜRK, İlknur (2006), “Türkiye’de Perakende Sektörü”, Çağ Üniversitesi Sosyal Bilimler Dergisi, Cilt:3, Sayı.1, Haziran 2006. YALÇIN Ö.(2008). Veri Madenciliği Yöntemleri, Papatya Yayıncılık. TheJournal of AcademicSocialScienceYıl: 4, Sayı: 22, Mart 2016, s. 385-394