Yüksel YURTAY1 Oğuz YAVUZYILMAZ2 Nihal Zuhal BACINOĞLU3

advertisement
Akademik Sosyal Araştırmalar Dergisi, Yıl: 4, Sayı: 22, Mart2016, s. 385-394
Yüksel YURTAY1
Oğuz YAVUZYILMAZ2
Nihal Zuhal BACINOĞLU3
Gülşah AK4
MOBİLYA PERAKENDE SATIŞ SEKTÖRÜNDE VERİ
MADENCİLİĞİ UYGULAMASI
Özet
Günümüzde bilgisayar sistemlerinin hızlı bir şekilde gelişmesinden dolayı veriler
doğrudan sayısal olarak toplanıp saklanabilmektedir. Verilerin yığınla artması ve
anlamlı çıkarımlar elde etme ihtiyacı arttıkça veri madenciliği kavramı ortaya
çıkmıştır. Veri madenciliğinin temel amacı, veriler arasında bulunan ilişkiler,
örüntüler, değişiklikler, sapma ve eğilimler, belirli yapılar gibi bilgilerin
matematiksel teoriler ve bilgisayar algoritmaları kombinasyonları ile ortaya
çıkartılması ve bunların yorumlanarak değerli bilgilerin elde edilmesidir. Veri
madenciliği sınıflama, kategorize etme, tahmin etme ve görüntüleme dört ana
başlıktan oluşmaktadır.
Veri madenciliği yöntemleriyle çok büyük verilerden, anlamlı sonuçlar elde
edilmektedir. Bu anlamlı sonuçların ortaya çıkarılmasında kullanılan yöntemlerden
biri de birliktelik analizidir. Bu çalışmada bir mobilya firmasının bölge
bayiliğinden alınan 10762 satış verisi gerekli dönüşüm ve ayrıştırmalar yapılarak,
veri madenciliğinde birliktelik analizi çıkarım algoritmalarından biri olan, apriori
algoritması için uygun hale getirilmiş ve sonuçlar irdelenmiştir.
Anahtar Kelimeler: Veri Madenciliği, Apriori Algoritması, Birliktelik Analizi,
Perakende Satış
1
Sakarya Üniversitesi, Bilgisayar ve Bilişim Bi.Fak. Bilgisayar Müh. Böl.,Sakarya,
yyurtay@sakarya.edu.tr
2
Öğr. Gör., Kocaeli Üniversitesi, Gazanfer Bilge MYO, İşletme Yönetimi Bölümü, ,Kocaeli
oguz.yavuzyilmaz@kocaeli.edu.tr
3
Sakarya Üniversitesi, Bilgisayar ve Bilişim Bi.Fak. Bilgisayar Müh. Böl.
4
Sakarya Üniversitesi, Bilgisayar ve Bilişim Bi.Fak. Bilgisayar Müh. Böl.
Oğuz Yavuzyılmaz - Yüksel Yurtay - Nihal Zuhal Bacınoğlu - Gülşah Ak
386
A DATA MINING PRACTICE ON the RETAIL FURNITURE INDUSTRY
Abstract
Today, due to the rapid development of computer systems, the data can be stored
and collected directly as numeric. Increases of needs abaout data and meaningful
inferences has emerged the concept of data mining. The main purpose of Data
Mining is that; the relationships patterns between data, changes, deviations and
trends, specific structures, such as with a combination of computer algorithms and
the mathematical theory of informations. And also interpreting them to obtain
valuable information by bringing it to light. Data mining consists of four major
titles as classification, categorizing, and estimating and imaging.
In recent years, data from very large data mining methods with began to discover
meaningful patterns. Association analysis is a method used in the discovery of this
meaningful patterns. This study was made in a furniture company data received
from the sale of franchises 10762 of the necessary transformation and separation
are performed in the Data Mining algorithms suitable for apriori inference
algorithm, which is one of the association analysis and the results were analyzed.
Keywords: Data Mining, Apriori Algorithm, Association Analysis, Retail Trade
GİRİŞ
Veri madenciliği tanımı itibariyle büyük ölçekli veriler arasından “değeri olan” bilgiyi
elde etme tekniğidir. Veri ambarlarındaki gizlenmiş, potansiyel olarak faydalı bilgileri ortaya
çıkarma; daha sonra bu bilgileri karar verme ve uygulama aşamasında kullanma sürecidir. Bu
teknik sayesinde ileriye yönelik kestirimlerde bulunmak mümkündür. Başka bir ifade ile veri
madenciliği, bir kurumda üretilen tüm verilerin belirli yöntemler kullanarak var olan; ya da
gelecekte ortaya çıkabilecek gizli bilgiyi su yüzüne çıkarma süreci olarak değerlendirilir
(Özkan,2008). Veri madenciliği teknikleri, tanımlayıcı ve tahmin edici teknikler olmak üzere
ikiye ayrılır: Tanımlayıcı teknikler, karar vermeye yardım edecek verilerin tanımlanmasını
sağlar. Birliktelik kuralları (associationrules) ve kümeleme (clustering) tanımlayıcı tekniklere
örnek olarak verilebilir. Bunlar tahmin edici teknikler ise sonuçları bilinen verileri kullanarak
sonuçları bilinmeyen veri kümelerinin sonuçlarının tahmin edilmesini sağlar (Küçüksille,2009).
Literatürde birliktelik analizi ile ilgili birçok çalışma yapılmıştır. Koç ve diğerleri (2011),
bilgisayar öğretmenliği bölümü öğrencilerinin sosyal ağları kullanma seviyeleri incelenmiş ve
sosyal ağların öğrencileri ne derecede etkilediği tespit edebilmek amacıyla öğrencilere bir anket
formu yöneltip elde edilen verilere birliktelik kurallarını uygulamıştır. Yurtay ve diğerleri(2013)
tarafından yapılan çalışmada bilgisayar mühendisliği bölümü öğrencilerinin teknik seçmeli ders
seçimlerindeki nedenlerin belirlenmesi amaçlanmıştır.
Perakendecilik, üretici ve tüketici arasında malların naklini sağlayan aracılık
hizmetleridir. Başka bir deyişle mal ve hizmetlerin ticari bir amaçla kullanma ve tekrar
satmama, kişisel gereksinimleri için kullanma koşuluyla, doğrudan doğruya son tüketiciye
pazarlanmasıyla ilgili faaliyetlerin bütünüdür (Öztürk, 2006:69).
TheJournal of AcademicSocialScienceYıl: 4, Sayı: 22, Mart 2016, s. 385-394
387
Mobilya Perakende Satış Sektöründe Veri Madenciliği Uygulaması
Perakende sektörü son tüketiciye yönelik olduğu için çok fazla sayıda kişiye hitap
etmektedir. Her bireyin mevcut ya da potansiyel bir son tüketici olduğu düşünüldüğünde ;
sektörün hedef kitlesinin dünya nüfusu ile orantılı olduğu görülmektedir. Özellikle 21. Yüzyılda
gelişen teknolojiler ve satış teknikleri ile perakendecilikte mevcut müşteri sayısı milyarlar ile
ifade edilmektedir. Bu büyüklükteki bir sektörde; satışları, müşterileri, müşteri bilgilerini v.b.
verileri analiz etmek klasik yöntemler ile pek mümkün değildir. Bu sebeple çok fazla sayıda
bilgi ve veri yığınlarından anlamlı bir sonuç elde etmek için kullanılan veri madenciliği ;
perakende sektöründe elde bulunan veriye uygun olarak belirlenecek algoritmalar ile geniş bir
uygulama alanına sahiptir.
Bu çalışmada mobilya perakende satış sektörü satış verileri analizi için; gerçek veriler
üzerinden tanımlayıcı tekniklerden biri olan birliktelik kuralı çıkarım algoritmalarından Apriori
algoritması üzerinde durulmuştur. Apriori algoritması incelenmiş ve uygulama detayları
verilmiştir.
Metot
Birliktelik kuralları analizi, yaygın olarak kullanılan veri madenciliği yöntemlerinden
birisidir. Veriler arasındaki birlikteliklerin, ilişkilerin ve bağıntıların kurallar halinde bulunması
işlemidir. Veri nesneleri arasındaki ilginç ilişkiler ve eş zamanlı gerçekleşen durumlar araştırılır.
Bir birliktelik kuralına örnek olarak “X ve Y ürününü satın alan müşterilerin %80 olasılıkla C
ürününü de satın alması” verilebilir. Bu tür birliktelik kuralları, söz konusu nesneler ile ilgili
durumun sıklıkla tekrarlanması durumunda anlamlıdır. Birliktelik kuralları analizi; ticaret,
finans, mühendislik, fen ve sağlık sektörlerinin birçok alanlarında kullanılmaktadır. Örneğin,
pazar sepet analizlerinde sıklıkla birlikte satılan ürünleri tespit etmek, web sayfalarında
ziyaretçilerin hangi sayfaları birlikte tıkladığını araştırmak, bağıntılı olarak geçirilen hastalıkları
belirlemek için kullanılabilmektedir (Birand,2010).
Özellikle işletme alanındaki uygulamalarda, satış analizleri uygulamalarında; mevcut
satışlar üzerinden veri madenciliği tekniği ile satışları analiz edip, yeni satış stratejileri
oluşturmak oldukça fayda sağlamaktadır. Bu çalışmada da Mobilya Perakende sektörü satış
verileri analizi için birliktelik kuralları analizi gerçekleştirilmiştir.
Birliktelik kuralının matematiksel modeli Agrawal, Imielinski ve Swami tarafından1993
yılında sunulmuştur (Agrawal vd., 1993) Birliktelik kuralı çıkarım algoritmaları içerisinde
Apriori, en fazla bilinen algoritmadır. Bu algoritmada sık geçen öğe kümelerini bulmak için
birçok kez veritabanını taramak gerekir. İlk taramada bir elemanlı minimum destek metriğini
sağlayan sık geçen öğe kümeleri bulunur. İzleyen taramalarda bir önceki taramada bulunan sık
geçen öğe kümeleri aday kümeler adı verilen; yeni potansiyel sık geçen öğe kümelerini üretmek
için kullanılır. Aday kümelerin destek değerleri tarama sırasında hesaplanır ve aday
kümelerinden minimum destek metriğini sağlayan kümeler o geçişte üretilen sık geçen öğe
kümeleri olur. Sık geçen öğe kümeleri bir sonraki geçiş için aday küme olurlar. Bu süreç yeni
bir sık geçen öğe kümesi bulunmayana kadar devam eder (Alataş,2003).
Örnek Veri ve Verinin Hazırlanması
Çalışmada, Marmara bölgesinde faaliyet gösteren bir mobilya perakende satış
firmasının verileri incelenerek, 15 aylık satış verileri üzerindeki birliktelik kuralları araştırıldı.
Veriler üzerinde çalışmanın yapılabilmesi için, öncelikle verilerdeki hata, eksik ve bozuk
kayıtlar temizlenerek, işlenebilir hale getirilmiştir.
TheJournal of AcademicSocialScienceYıl: 4, Sayı: 22, Mart 2016, s. 385-394
Oğuz Yavuzyılmaz - Yüksel Yurtay - Nihal Zuhal Bacınoğlu - Gülşah Ak
388
1.Verinin Tanıtılması
Bölge Bayiliğinden alınan kayıtlar “Sipariş Tarihi”,“Sipariş No”,”Teslim Tarihi”,
“Cadde”, “Sokak”, “İlçe”, “Bölge kodu”, “Tel no”,“Stok kodu”,“Stok ismi”,“Depo”, “Miktar”,
“Birim fiyat”,“Net fiyat”,“Tutar”, “Kdv’li Tutar”,“Sorumluluk merk.adı”,“İrsaliye no”,”Fatura
tarihi” olmak üzere 19 sütundan oluşmaktadır.
2.Verinin Temizlenmesi
15 aylık toplam verilere bakıldığında eksik, gereksiz ve ortak olmayan sütunlar
çıkarılmış ve uygulamaya alınmamıştır. Ortak sütun adları belirlenerek apriori uygulamasında
kullanılabilecek
7
sütuna
indirgenmiştir.
Bu
sütunlar
“Ürün
Adı”,”Ay”,”İl”,”Depo”,”Miktar”,”Bölge” ve ”Kdv' li Tutar” ‘dır.
3.Verinin Dönüştürülmesi
Daha anlamlı bir çalışma ortaya çıkarabilmek adına “Ürünler” sütununa göre veri seti
iki bölüme ayrılmıştır.
İlk bölüm ve ikinci bölümde yer alan ürünler aşağıdaki tabloda gösterildiği gibidir.
İlk Bölüm
Alez
Alez, Uyku Pedi, Yatak Pedi, Yastık Koruyucu
Banyo Ürünleri
Havlu, Bornoz
Beyaz Ev Tekstili
Yastık, Yorgan
Ev Dekorasyon Ürünü
Koltuk Örtüsü, Kırlent, Minder, Lamba
Ev Tekstil Ürünü
Döşemelik Kumaş, Battaniye, Nevresim Takımı, Yatak Örtüsü,
Çarşaf, Uyku Seti
İkinci Bölüm
Başlık
Baza/Karyola
Bebek Seti
Büfe
Dolap
Kanepe/Koltuk
Komidin/Konsol/Şifonyer
Köşe Takımı/Oturma Grubu/Modül
TheJournal of AcademicSocialScienceYıl: 4, Sayı: 22, Mart 2016, s. 385-394
389
Masa
Mobilya Perakende Satış Sektöründe Veri Madenciliği Uygulaması
(Yemek Masası, Çalışma Masası)
Sandalye/Puf
Tamamlayıcılar
(Sehpa, Kitaplık, TV Ünitesi)
Yatak
“İl” : Veriler içerisinde bulunan cadde, mahalle ve ilçe sütunları birleştirilerek il sütununa
dönüştürülmüştür.
1. Ankara
2. Antalya
3. Bilecik
4. Bingöl
5. Bolu
6. Bursa
7. Çanakkale
8. Düzce
9. İstanbul
10. İzmir
11. Kayseri
12. Kocaeli
13. Konya
14. Kütahya
15. Sakarya
16. Yalova
17. Zonguldak
“Depo”:
TheJournal of AcademicSocialScienceYıl: 4, Sayı: 22, Mart 2016, s. 385-394
Oğuz Yavuzyılmaz - Yüksel Yurtay - Nihal Zuhal Bacınoğlu - Gülşah Ak
390
1. Adapazarı
2. Bölge
3. Düzce
4. Ereğli
5. Karakamış
6. Outlet
7. Plaza
8. Satış Sonrası
“Miktar”: 1 olanlar Tekli Satışlar ve 1’den fazla olanlar Toplu Satışlar olmak üzere 2 sütuna
ayrılmıştır.
1. Tekli Satışlar
2. Toplu Satışlar
“Bölge”
1. Adapazarı
2. Bölge
3. Düzce
4. Ereğli
5. Merkez
6. Plaza
7. Satış Sonrası
“KDV’li Tutar”: 0 ile 43.300 arasındaki değerler ilk veri seti için 50’lik, ikinci veri seti için
250’lik şekilde gruplandırılmıştır.
Uygulama-1
Toplam 4845 kayıt içerisinde %15 Destek değeri ile 726 alt sınır olarak belirlenmiştir. Güven
değeri ise %60 belirlenerek algoritma uygulanmıştır.
TheJournal of AcademicSocialScienceYıl: 4, Sayı: 22, Mart 2016, s. 385-394
391
Mobilya Perakende Satış Sektöründe Veri Madenciliği Uygulaması
Tablo 1: Birinci uygulamada elde edilen birliktelik kuralları
ORTAYA ÇIKAN KURALLAR
“kdv_tutar” değeri 100,
“depo” değeri ADAPAZARI,
“il” değeri SAKARYA
“bolge”=ADAPAZARI
% 99,593
“depo”=ADAPAZARI
% 89,077
“bolge”=ADAPAZARI
% 99,796
“depo” değeri ADAPAZARI
“urun_adi” değeri Beyaz Ev Tekstili
“bolge” değeri ADAPAZARI
“il”=SAKARYA
% 99,491
“kdv_tutar” değeri 100,
“depo” değeri ADAPAZARI,
“bolge” değeri ADAPAZARI
“il”=SAKARYA
% 99,324
“kdv_tutar” değeri 50,
“bolge” değeri ADAPAZARI ,
“il” değeri SAKARYA
“depo”= SAKARYA
% 81,369
“depo”=ADAPAZARI
% 76,466
“depo”= ADAPAZARI
% 65,391
“urun_adi”= Beyaz Ev
Tekstili
% 61,597
“urun_adi” değeri Ev Tekstil Ürünü
“bolge” değeri ADAPAZARI
“il” değeri SAKARYA
“depo” değeri ADAPAZARI
“urun_adi” değeri Beyaz Ev
Tekstili
“il” değeri SAKARYA
“urun_adi” değeri Beyaz Ev
Tekstili,
“bolge” değeri ADAPAZARI
“il” değeri SAKARYA
“kdv_tutar” değeri 100,
“bolge” değeri ADAPAZARI ,
“il” değeri SAKARYA
“kdv_tutar” değeri 50,
“bolge” değeri ADAPAZARI ,
“il” değeri SAKARYA
Uygulama-2
Toplam 5917 kayıt içerisinde %5 Destek değeri ile 296alt sınır olarak belirlenmiştir. Güven
değeri ise %70 belirlenerek algoritma uygulanmıştır.
TheJournal of AcademicSocialScienceYıl: 4, Sayı: 22, Mart 2016, s. 385-394
392
Oğuz Yavuzyılmaz - Yüksel Yurtay - Nihal Zuhal Bacınoğlu - Gülşah Ak
Tablo 2: İkinci uygulamada elde edilen birliktelik kuralları
ORTAYA ÇIKAN KURALLAR
“urun_adi” değeri Yatak
“bolge” değeri ADAPAZARI
“depo” değeri BÖLGE
“il”=SAKARYA
% 95,512
“kdv_tutar” değeri 500
“bolge” değeri ADAPAZARI
“depo” değeri BÖLGE
“il”=SAKARYA
% 94,686
“urun_adi” değeri Baza
“bolge” değeri ADAPAZARI
“depo” değeri BÖLGE
“il”=SAKARYA
% 92,92
“kdv_tutar” değeri 750
“bolge” değeri ADAPAZARI
“depo” değeri BÖLGE
“il”=SAKARYA
% 92,371
“kdv_tutar” değeri 1000
“bolge” değeri ADAPAZARI
“depo” değeri BÖLGE
“il”=SAKARYA
% 92,241
“urun_adi” değeri Koltuk
“bolge” değeri ADAPAZARI
“depo” değeri BÖLGE
“il”=SAKARYA
% 91,327
“bolge” değeri PLAZA
“urun_adi” değeri Yatak
“depo” değeri BÖLGE
“il”=SAKARYA
% 90,439
“ay” değeri Ocak
“depo” değeri BÖLGE
“İl” değeri SAKARYA
“bolge”=ADAPAZARI
% 75,145
“kdv_tutar” değeri 1250
“depo” değeri BÖLGE
“İl” değeri SAKARYA
“bolge”=ADAPAZARI
% 71,768
“ay” değeri Aralık
“depo” değeri BÖLGE
“İl” değeri SAKARYA
“bolge”=ADAPAZARI
% 70
Elde edilen birliktelik kurallarında, örnek olarak ürün adı, bölge ve depo açısında
değerlendirildiğinde, aktivitenin ürün açısından o bölgedeki depo üzerinde optimize
edilebilmesi açısından fikir vermektedir.
Kuralların tümü incelendiğinde tahmin edilen birliktelikler olmasının yanında, farkına
varılamayan birlikteliklerin de görülmesi ve ortaya çıkarılması önemlidir. Bu çalışmada da
ortaya çıkan kurallar ilgili taraflar ile değerlendirilmiştir.
TheJournal of AcademicSocialScienceYıl: 4, Sayı: 22, Mart 2016, s. 385-394
393
Mobilya Perakende Satış Sektöründe Veri Madenciliği Uygulaması
Ürün Grupları
120
100
%
80
60
40
20
0
1
2
3
4
5
6
7
8
9
UYGULAMA 1 99,593 89,077 99,796 99,491 99,324 81,369 76,466 65,391 61,597
UYGULAMA 2 95,512 94,686 92,92 92,371 92,241 91,327 90,439 75,145 71,768
Grafik: Ürün Grupları (Uygulama-1 ve Uygulama-2) arasındaki değişim
Ürün gruplarının seçiminde, veriler arasındaki özelliklerin doğru seçimi birliktelik kuralları
arasındaki oranı etkilemektedir.
Sonuç
Bu çalışmada, birliktelik kuralı çıkarım algoritmalarından Apriori algoritmasının
kullanılmasına ilişkin bir uygulama gerçekleştirilmiştir. Apriori algoritması uygulaması,
firmanın veri seti üzerinde uygulandığında farklı zaman dilimlerinde ürünler arasında birlikte
satın alınma bağıntıları ortaya çıkarılıp, bayilerde satılan ürünlerin miktarı ve tutarı, satıldığı ay,
satışın gerçekleştirildiği il, depo ve bölge niteliklerinin birbirleriyle ilişkileri incelenmiştir ve
güven değerinin üzerinde çıkan birliktelikler kabul edilmiştir.
Çalışma sadece belirli bir bölge bayiliğinden alının verilerde yer alan ürünler ile
gerçekleştirilmiştir. Elde edilen sonuçlar bölge satışlarına göre müşterilerin ihtiyacı olan
ürünlerin değişiklik gösterebilmesinden dolayı araştırmanın yapıldığı zaman aralığına göre de
farklılık gösterebilir. Yapılan çalışma sonuçları bölge bazında yapılacak ürün satışlarında
verimlilik elde edilmesine yardımcı olacaktır. Aynı zamanda analiz sonucunda elde edilen
birliktelik bilgileri satış stratejilerinde kullanılabilir. Bu verilere göre birlikte satış yoğunluğu
olan ürün grupları belirlenip; bunlara yönelik olarak kampanya ve tutundurma faaliyetleri
gerçekleştirmek; başarılı satış sonuçları ortaya çıkarabilecektir.
Gelecekte yapılacak çalışmalarda, daha fazla satış verileri ve müşteri profilleri
arasındaki ilişkinin kullanılması, daha net sonuçların ortaya çıkacağı değerlendirmelerine de
sebep olmuştur.
TheJournal of AcademicSocialScienceYıl: 4, Sayı: 22, Mart 2016, s. 385-394
Oğuz Yavuzyılmaz - Yüksel Yurtay - Nihal Zuhal Bacınoğlu - Gülşah Ak
394
KAYNAKLAR
AGRAWAL, R.,IMİELİNSKİ, T. ve SWAMİ, A., (1993), “Mining Association Rules
Between Sets of Items in Large Databases”, In Proceedings of the ACM
SIGMOD International Conference on Management of Data ACMSIGMOD
’93), 207-216,Washington, USA, 207-216.
ALATAŞB,(2003) “Nicel Birliktelik Kurallarının Keşfinde Bulanık Mantık ve Genetik
Algoritma Yaklaşımı” Fırat Ünv. Fen Bilimleri Enstitüsü Yüksek Lisans Tezi,
Elazığ,
BİRANT, D., Kut, A., VENTURA, M., ALTINOK, H., ALTINOK, B., ALTINOK, E.,
&IHLAMUR, M. İş Zekası Çözümleri için Çok Boyutlu Birliktelik Kuralları
Analizi. Akademik Bilişim’10, 256.
GÜNGÖR, E.,YALÇIN, N., &YURTAY, N. (2013). Apriori Algoritması ile Teknik
Seçmeli Ders Seçim Analizi. Akademik Bilişim
KOÇ, M.,&KARABATAK, M. (2011). Sosyal Ağların Öğrenciler Üzerindeki Etkisinin
Veri Madenciliği Kullanılarak İncelenmesi INVESTIGATION OF THE EFFECT
OF SOCIAL NETWORKS ON STUDENTS BY USING DATA MINING
KÜÇÜKSİLLE, E.(2009), Veri Madenciliği Süreci Kullanılarak Portföy Performansının
Değerlendirilmesi ve IMKB Hisse Senetleri Piyasasında Bir Uygulama,
Süleyman Demirel Üniversitesi Sosyal Bilimler Enstitüsü, Doktora Tezi, Isparta
ÖZTÜRK, İlknur (2006), “Türkiye’de Perakende Sektörü”, Çağ Üniversitesi Sosyal
Bilimler Dergisi, Cilt:3, Sayı.1, Haziran 2006.
YALÇIN Ö.(2008). Veri Madenciliği Yöntemleri, Papatya Yayıncılık.
TheJournal of AcademicSocialScienceYıl: 4, Sayı: 22, Mart 2016, s. 385-394
Download