ÜNAK 2009 Bildiriler Kitabı

advertisement
ÜNAK 2009
Bilgi Çağında Varoluş: “Fırsatlar ve Tehditler” Sempozyumu
01-02 Ekim 2009 - Yeditepe Üniversitesi, İstanbul
Bildiriler Kitabı
Editörler
Aytaç YILDIZELİ
Doç.Dr. Aykut ARIKAN
İstanbul, 2011
Arş.Gör. Tolga ÇAKMAK
ÜNAK 2009 Bilgi Çağında Varoluş: “Fırsatlar ve Tehditler” Sempozyumu,
01 - 02 Ekim 2009, Yeditepe Üniversitesi, İstanbul - TÜRKİYE, Bildiriler Kitabı.
http://www.unak.org.tr/unak099/
Yayıncı: Yeditepe Üniversitesi
© ÜNAK, Yeditepe Üniversitesi ve Yazarlar, 2011. Her hakkı saklıdır.
Kapak ve Afiş Tasarım: Ersel Yavuz
Sayfa Mizanpajı: BULUŞ Tasarım ve Matbaacılık Hizmetleri / ANKARA, Kaan KÖKSAL
ISBN: 978-975-307-059-1
ÜNAK 2009 Bilgi Çağında Varoluş:”fırsatlar ve tehditler” Sempozyumu (9.:2009: İstanbul)
Bildiriler kitabı / ÜNAK 2009 Bilgi Çağında Varoluş:”Fırsatlar ve Tehditler” Sempozyumu,
01-02 Ekim 2009, Yeditepe Üniversitesi, İstanbul; Ed. Aytaç Yıldızeli, Aykut Arıkan [ve]
Tolga Çakmak . – İstanbul: Yeditepe Üniversitesi, 2010.
s.; cm.
Kaynakça bölüm sonlarında.
Konu ve Yazar dizini var.
1. KÜTÜPHANE BİLİMİ - TÜRKİYE - KONGRELER. I. Yıldızeli, Aytaç. II. Arıkan, Aykut.
III. Çakmak, Tolga.
Z672.5 Un13 2010
II
020 Un13 2010
ÜNAK ‘09
Toplantı Düzenleme ve Program Komitesi
Filiz Çermen, Yeditepe Üniversitesi Bilgi Merkezi
Aytaç Yıldızeli, ÜNAK
Mehmet Boz, ÜNAK
İlhan Akçal, ÜNAK
Fidan Yavuz, ÜNAK
Havva Alkış, ÜNAK
Emine Türkoğlu, ÜNAK
Erol Gökduman, ÜNAK
Bildiri Değerlendirme ve Yayın Kurulu
Aykut Arıkan, Yeditepe Üniversitesi
Filiz Çermen, Yeditepe Üniversitesi Bilgi Merkezi
Aytaç Yıldızeli, ÜNAK
Hasan Işın Dener, Çankaya Üniversitesi
Berin U. Yurdadoğ, Hacettepe Üniversitesi
Nilüfer Tuncer, Hacettepe Üniversitesi
Fatoş Subaşıoğlu, Ankara Üniversitesi
Bengü Çapar, Başkent Üniversitesi
Oya Gürdal Tamdoğan, Ankara Üniversitesi
Sacit Arslantekin, Ankara Üniversitesi
Mustafa Sağsan, Yakın Doğu Üniversitesi
Nilay Alüftekin, Çankaya Üniversitesi
Türksel Kaya Bengshir, TODAİE
Meral Alakuş, IKM Kanada
İlhan Akçal, ÜNAK
Mehmet Boz, ÜNAK
Hatice Kübra Bahşişoğlu, Muğla Üniversitesi
Tolga Çakmak, Hacettepe Üniversitesi
III
ÜNAK ‘09
İş Süreçlerinin Değişiminde Bilgi Yönetiminin Sihirli Gücü
Sevinç GÜLSEÇEN, Necati DÖNMEZ ve Çiğdem EROL ............................................. 82
Toplam Kalite Yönetimi Bilgi Yönetimini Nasıl Tamamlar ve Destekler?
Meriç M. AKYOL ve Sevinç GÜLSEÇEN .................................................................... 96
Türkiye’ nin Bilimsel Yayın Performansının Dünya ile Karşılıştırmalı Değerlendirilmesi
Elif Aytek GÜRSES ve Serpil YETGİN ..................................................................... 105
Türkiye’ de Elektronik Belge Yönetimine Dönük Koşulların Değerlendirilmesi: 17 Kurumda
Gerçekleştirilen Analiz Sonuçları
Özgür KÜLCÜ ve Tolga ÇAKMAK .......................................................................... 113
Web Teknolojisinde Yeni Bilgi Fırtınası: Web 3.0
Yalçın YAĞCI ........................................................................................................ 138
Organizasyonlarda Bilgi Yönetimi Sürecinde Veri Madenciliği Yaklaşımı
Süreyya ÇANKIRI, Elif KARTAL Kemal YILDIRIM ve Sevinç GÜLSEÇEN ................... 148
Kullanıcı Hakları ve Sorumlulukları
Erol YILMAZ .......................................................................................................... 168
Bilgi Profesyonelleri İçin Avrupa Fırsatı: ERASMUS
Ülkü Sevil YILMAZ ve Elif İŞEL ............................................................................... 188
Ulusal Bellek ve Elektronik Derleme
Selçuk SÜZMETAŞ ve Kadriye SÜZMETAŞ .............................................................. 192
Federe Arama Motorları: Federe Arama Motorlarının Söyledikleri ve Gerçekleri
Yusuf YALÇIN ve Halil İbrahim GENÇBÜYÜR ......................................................... 203
Suna Kıraç Kütüphanesi Danışma Hizmetlerinde Bir WEB 2.0 Uygulaması LIBGUIDES
Mithat ZENCİR ve Ayla GÜNEL .............................................................................. 210
Kişisel Bilgi Güvenliğinin Sağlanmasında Steganografi Biliminin Kullanılması
Yıldıray YALMAN ve İsmail ERTÜRK ...................................................................... 215
Üniversite Kütüphaneleri WEB Sayfalarının Gösterge Bilimsel Açıdan Görsel-İçerik
Çözümlemeleri
Yücel TEKİN .......................................................................................................... 227
Yazar Dizini ................................................................................................................. 243
Konu Dizini ................................................................................................................. 244
VI
ÜNAK ‘09
Organizasyonlarda Bilgi Yönetimi Sürecinde Veri Madenciliği Yaklaşımı
Süreyya ÇANKIRI*, Elif KARTAL**, Kemal YILDIRIM*** ve Sevinç GÜLSEÇEN****
Öz
Bilgi, birçok alanda olduğu gibi yönetim alanında da ağırlıklı bir role sahiptir. Bilgi ve iletişim
teknolojilerindeki hızlı değişim ve ilerleme sürecinde organizasyonlar, ancak ellerindeki bilgiyi
doğru yönetirse hizmet ve ürünlerinde verimliliğe ulaşabilir, rakipleri arasında devamlılığını
sürdürebilir. Günümüzde bilginin artış ve yayılma hızı tarihin hiçbir döneminde görülmediği
kadar artmıştır. Bilgiye erişim süreci de bu hıza bağlı olarak kısalmaktadır. Sorun, bilgi yığınları
arasından geçerli / yararlı / istediğimiz bilgiye erişmekte yaşanan zorluklardır. Veri madenciliği,
geniş bilgi yığınları arasından istediğimiz bilgiye erişme sürecimizi kısaltan bir yaklaşımdır.
Organizasyonlar bilgi yönetiminin her aşamasında bilgiyi kullanır ve bilgi üretirler. Çağdaş
iş üretim ve süreçlerinde başarı için verilere en kısa sürede erişmek, erişilen verileri kayıt
altına almak, işleyerek bilgiye dönüştürmek ve verimli biçimde kullanmak gerekmektedir. Veri
madenciliği kullanılarak bilgi yönetimi süreçlerinde bilgiye erişim hızı artırılabilir. Bu durum,
organizasyonlar için, ürün / hizmet üretiminde verimlilik ve rekabet koşulları açısından avantaj
sağlayacaktır. Bu bildirinin amacı, veri madenciliğinin organizasyonlarda bilgi yönetimi
sürecine olası etkilerini ve katkısını ortaya koymaktır.
Giriş
Klasik sistem teorisi, canlıların karmaşık sistemler bütünü olduğunu kabul etmekle birlikte,
onların bir araya gelerek daha karmaşık sistemler oluşturduğunu ifade etmektedir. Canlıların
yaşayabilmek için sistem dışından veri ve bilgi almaları gerektiği açıktır. Enerjinin canlı
yaşamı üzerindeki önemi nasıl tartışılmaz boyutta ise, bu enerjinin kullanımı için gereksinim
duyulan bilginin önemi de tartışmaya açık bir konu olarak görülmektedir. Bilgi, canlı
yaşamının en önemli özelliğidir. Bir canlı için, enerjinin hangi kaynaklardan elde edileceği
ve nasıl kullanılacağına ilişkin bilgi yaşamsal öneme sahiptir (İlter, 2003, s.7). Ne şekilde
olursa olsun bilgi, insanlık tarihi süresince, tüm zamanlarda toplumların, organizasyonların
ve insanların gelişmesinde, onların düşünce ve davranışlarının şekillenmesinde en önemli
unsur olmuştur (Uçak, 2000, s.145).
Bilgi yönetimi, “geleneksel anlamda düşünüldüğünde, yüzyıllardır bilinen ve uygulanan
bir süreçtir. Eski çağların bilge kişileri, bilgiyi aktarmak için hikâyeleri kullanıyorlardı.
Üniversiteler 12. yüzyıldan bu yana varlıklarını sürdürmektedir. Eski uygarlıkların çoğunda
önemli olaylar kayıtlara geçirilmiş, kitaplar yazılmış ve kütüphaneler oluşturulmuştur. Bu
herkesin uyguladığı “olağan bilgi yönetimi”dir. “Olağanüstü bilgi yönetimi” ise ancak
iletişime ve birlikte çalışmaya büyük kolaylık getiren yeni teknolojilerin geliştirilmesiyle son
yıllarda gündeme gelmiştir. Bu teknoloji, eğer iletişime, paylaşmaya, güvene, işbirliğine ve
* İstanbul Üniversitesi Enformatik Bölümü.İstanbul
** Arş. Gör.; İstanbul Üniversitesi Enformatik Bölümü. İstanbul (elifk@istanbul.edu.tr)
*** İstanbul Üniversitesi Enformatik Bölümü. İstanbul
148
**** Doç. Dr.;İstanbul Üniversitesi Enformatik Bölümü, İstanbul (gulsecen@istanbul.edu.tr)
Süreyya ÇANKIRI, Elif KARTAL, Kemal YILDIRIM ve Sevinç GÜLSEÇEN
Geçmişte bilgi depolarının büyük bölümü organizasyonların dışında yer alıyordu ve
bilgi depolarından rekabet gücünü arttırmaya yönelik, pazara ilişkin ya da organizasyon
dışı teknik, yasal ya da ticari bilgi elde etmek için yararlanılıyordu. Ancak şimdi pek çok
organizasyon iç kaynaklı biçimsel bilgi depoları oluşturmaktadır. Organizasyonlarda, ürün
bilgisi, pazarlama bilgisi, müşteri bilgisi ya da diğer bilgi türleri için depolar hazırlanmaktadır.
Veri madenciliği, özellikle bağlantılar ve dizinlerin belirlenmesinde çok işe yaramaktadır.
İnsanlar, ellerinde fazla sayıda değişken bulunması durumunda zorlanırken veri madenciliği
araçları aynı anda binlerce farklı değişkenle başa çıkabilir, pek çok insanın isteyerek kabul
edeceği yeni bilgileri keşfedebilir (Davenport, 1997, s.184; Skyrme, 1999, s.79; Ağır, 2005,
s.132).
Veri Madenciliği (Data Mining)
İlk bilgisayarın hayatımıza girmesinden itibaren bilgisayarlar her geçen gün biraz daha
gelişmiş ve değişmiştir. Kullanıcı gereksinimleri doğrultusunda değerli verilerin depolanması
isteği ile veri tabanları ortaya çıkmıştır. Günümüzde hemen hemen bütün organizasyonlar
bilgisayar teknolojisi ve internetin de etkisi ile kayıtlarını elektronik veri tabanlarına
taşımışlardır. Bu veri tabanlarının boyutları ‘terabayt’larla ifade edilmektedir. Zamanla
veri tabanlarında gizli, stratejik ve politik değere sahip olabilecek, işe yarar örüntüler ve
şablonlar elde etmenin mümkün olacağı düşüncesi yayılmıştır.
Veri Madenciliği, 60’lı yıllarda veri analizi sorunlarının bilgisayar ile çözülmeye başlanması
ile ortaya çıkmış olup, ‘Veri Madenciliği’ ismi 90’lı yıllarda bilgisayar mühendisleri tarafından
ortaya atılmıştır (Öğüt, 2009, ss.1-9).
Veri Madenciliği’ni veri dağları altındaki elmasları, altınları, külçeleri özel yazılımlar ile
keşfetmek olarak tanımlamak mümkündür (Özdamar, 2002, ss.1-3). Literatürde yer alan
bazı veri madenciliği tanımları ise aşağıda verilmiştir:
¾ Veriden örüntü elde etmek için belirli algoritmaların uygulamasıdır (Fayyad, Shapiro
ve Smyth, 1996, s.39).
¾ İstatistiksel modelleri, matematiksel algoritmaları ve makine öğrenmesi (machine
learning) modellerini de içeren veri analizi araçlarının kullanımını içermektedir
(Surajit, Surajit, Bernhardt ve Fayyad, 2000, s.719).
¾ Daha önceden bilinmeyen örüntüleri ve anlaşılabilir bilgileri geniş veri tabanlarından
seçmeyi, keşfetmeyi ve bu bilgileri modellemeyi içerir (Show, Subramaniam, Tan ve
Welge, 2001, s.128).
¾ Organizasyonların veri ambarlarındaki çok önemli bilgilere yoğunlaşmasına yardımcı
olan, çok büyük veri tabanlarında saklı, akıllı bilgiyi ortaya çıkaran yeni bir teknolojidir
(Thealing, 2009).
¾ Veri tabanı, yapay zekâ ve istatistik dünyasını birbirine bağlayan son zamanlarda
çıkmış bir alandır (Lindell, Israel ve Pinkas, 2000, s.1).
149
ÜNAK ‘09
ortak sahiplenmeye değer veren bir kültürle birleştirilebilirse mucize gerçekleşmektedir. Bilgi
yönetiminin özünü bu şekilde anlayan ve uygulayan organizasyonların elde ettiği sonuçlar
ise şaşırtıcı derecede beklentilerin üstündedir” (Barutçugil, 2002, s.49).
Organizasyonlarda Bilgi Yönetimi Sürecinde Veri Madenciliği Yaklaşımı
ÜNAK ‘09
¾ Verinin karar almak için kullanılan bilgiye dönüşümü- Bilgi Keşfi’nin (Knowledge
Discovery) tetikleyicisidir (Müller ve Lemke, 2000, s.1).
¾ Veri kümeleri içinde akıllı örüntüler keşfetmek için algoritmalar kullanan bir süreçtir
(DeRosa, 2004, s.5).
Bu tanımlarda da görüldüğü gibi veri madenciliği çok disiplinli bir çalışma alanıdır.
Veri tabanı teknolojisi, istatistik, yapay zekâ, matematik, yönetim bilişim sistemleri veri
madenciliğinde birlikte çalışmaktadır.
Veri madenciliğinin uygulanabilmesi için verilerin birtakım ölçütlere uyması
gerekmektedir: tüm verilerin elde edilebilir olması, verilerin hatasız olması, istenilen
miktarda verinin bulunması bu ölçütlerden birkaç tanesidir (Oğuzlar, 2003, ss.68-70).
Veri madenciliği finans, tıp, borsa, bankacılık, sigortacılık başta olmak üzere birçok
alanda kullanılmaktadır. Organizasyonlar ise müşteri hizmetleri, risk yönetimi gibi önem
taşıyan alanlarda veri madenciliği tekniklerinden yararlanmaktadır. Veri madenciliğinde
uygulanan teknikler aşağıda verilmiştir.
Tablo 1: Veri Madenciliği Teknikleri (Artinyan, 2009)
Veri Madenciliği; yöneticilere karar verme konusunda önemli ölçüde yardımcı olurken,
analiz edilmesi, raporlanması gereken verilere erişim kolaylığı da büyük önem taşımaktadır.
Bunu, veri ambarları olanaklı kılmıştır.
Veri Ambarları (Data Warehouses)
Günümüzde veri tabanları farklı farklı yerlerde bulunurken ve üstelik bunların taşıdıkları
verilerin büyüklüleri ‘terabayt’lar ile ifade edilirken gerek duyulan verilerin bir araya
toplanması analiz edilmesi ve raporlanması veri ambarları sayesinde gerçekleşmektedir. Veri
ambarları, veri tabanları ile diğer bilgi kaynakları arasındaki verilerin entegrasyonunu da
sağlamaktadır.
150
Süreyya ÇANKIRI, Elif KARTAL, Kemal YILDIRIM ve Sevinç GÜLSEÇEN
¾ Veri ambarı, yönetimin karar verme süreci desteğinde, konu tabanlı, zamanla
değişen ve kalıcı veri koleksiyonudur*****.
¾ Veri ambarı, şirket ile birlikte tüm sınırlı veri içeriğine ve kitleye hitap eden veri
ambarı****** kümelerinin yığınıdır*******.
Bir veri ambarı sistemini modelleme, inşa etme ve yönetme işlemlerine ise veri ambarcılığı
denmektedir. Veri ambarcılığının literatürdeki bazı tanımları aşağıda verilmiştir:
¾ Verileri yaygın bir formatta, birçok faklı kaynaktan, anahtarlar ve alanlar için uygun
tanımlamalar ile toplamaktır (Berry ve Linoff, 2004, s.7).
¾ Verileri, bilgi olarak şekillendirmek ve uygulamadan çok, konu tabanlı olarak bu
bilgileri depolamaktır (Shahzad, 2009).
Bilgi Yönetimi
Bilgi yönetimi; bilginin edinilmesi, üretilmesi, düzenlenmesi, geliştirilmesi, korunması,
paylaşılması gibi süreç ve yöntemleri içermektedir. Bu süreç çerçevesinde bilgi ve iletişim
teknolojilerinin kullanılması - bulunması kaçınılmazdır. Günümüz koşullarının en önemli değer
yaratma güçlerinden biri olan bilginin, başarıyla yönetilmesi ve doğru yönlendirilebilmesi
için bilgi yönetimine büyük gereksinim duyulmaktadır. Bu nedenle de organizasyonun tüm
bilgisinin bir düzen - sistem içerisinde yönetimi büyük önem taşımaktadır.
Bilgi yönetimi, en yalın şekilde, “bilgi yaratmak, elde tutmak, paylaşmak ve geliştirmek
için kullanılacak yeni radikal yollar olarak tanımlanmaktadır. Bu nedenle, bilginin
saklanmasını ve bilinçli bir şekilde gelecek kuşaklara aktarılmasını ifade eden olağan bilgi
yönetimini değil, şimdi elimizde olan tüm ileri enformasyon teknolojilerini bilgi yaratmak,
elde tutmak, paylaşmak ve geliştirmek için kullanan tümüyle yeni ve radikal yolları ele almak
gerekir” (Barutçugil, 2002, s.49).
Bilgi yönetimi, “organizasyonel amaçların daha iyi bir şekilde elde edilebilmesi için
bireylere, takımlara ve bütün organizasyona bilginin kolektif ve sistematik olarak yaratılması,
paylaşılması ve uygulanması için olanak sağlayan yeni bir disiplindir. Bilgi yönetimi, bireyler,
takımlar ve organizasyonun bütünü için geçerlidir. Bilginin sistematik olarak yaratılması,
paylaşılması ve uygulanmasıdır. Organizasyon çapında bütün düzeylerde bilginin yaratılması
önemlidir. Daha sonra olabildiğince çabuk ve uygun ölçüde geniş kapsamlı bir şekilde bu
bilginin paylaşılması ve organizasyonun yararına kullanılmasının sağlanması gerekir. Bu,
bilginin müşterilerin istediği ürün ve hizmetlere dönüştürülmesiyle gerçekleşir” (Barutçugil,
2002, s.50).
*****
http://www.1keydata.com/datawarehousing/inmon-kimball.html Erişim Tarihi: [ 13.07.2009]
****** Buradaki “veri ambarı” terimi aslında dar anlamda kullanılmaktadır. Yani Kimball, “data warehouse”ı
tanımlarken, bunun içerik ve hitap edilen kitle açısından daha dar anlamlısı olan “data mart”ı kullanmıştır.
******* http://www.1keydata.com/datawarehousing/inmon-kimball.html Erişim Tarihi: [ 13.07.2009]
151
ÜNAK ‘09
Veri ambarı ile ilgili literatürde iki önemli tanım bulunmakla birlikte, veri ambarları ve
veri ambarcılığı ile ilgili yapılan diğer tartışmalar bu tanımlar etrafında şekillenmektedir. Bu
önemli tanımlardan ilki veri ambarcılığının babası sayılan Bill Inmon tarafından, ikincisi ise
Ralph Kimball tarafından yapılmıştır:
Organizasyonlarda Bilgi Yönetimi Sürecinde Veri Madenciliği Yaklaşımı
ÜNAK ‘09
Dolayısıyla birer canlı sistem olan organizasyonlarda bilgi yönetimi; yalnızca belgelerde,
depolarda değil çalışmalarda, süreçlerde, uygulamalarda ve normlarda da görülebilmektedir.
Bundan ötürü organizasyonların sahip olduğu bilgi kaynaklarını belirlemek, değerlendirmek,
analiz etmek, bilginin nerede, nasıl, hangi durumda bulunduğunu yine bilginin özelliklerini,
değerini, kullanımını ve kapsamını belirlemek, bilgi yönetimi çalışmasının en geçerli işlevi
olmaktadır.
Bilgi Yönetimi Bağlamında Veri Madenciliğinin Uygulama Alanları
Veri madenciliği astronomi, biyoloji, finans, pazarlama, sigorta, tıp ve birçok başka
dalda uygulanmaktadır. Günümüzde veri madenciliği teknikleri özellikle organizasyonlarda
çeşitli alanlarda başarı ile kullanılmaktadır. Bu uygulamaların başlıcaları ilgili alanlara göre
aşağıda özetlenmiştir.
Pazarlama
Müşteri segmentasyonunda,
Müşterilerin demografik özellikleri arasındaki bağlantıların kurulmasında,
Çeşitli pazarlama kampanyalarında,
Mevcut müşterilerin elde tutulması için geliştirilecek pazarlama stratejilerinin
oluşturulmasında,
¾ Pazar sepeti analizinde,
¾ Müşteri ilişkileri yönetiminde,
¾ Satış tahminlerinde,
¾
¾
¾
¾
Bankacılık
¾
¾
¾
¾
¾
¾
Farklı finansal göstergeler arasındaki gizli korelâsyonların bulunmasında,
Kredi kartı dolandırıcılıklarının tespitinde,
Kredi taleplerinin değerlendirilmesinde,
Usulsüzlük tespiti,
Risk analizleri,
Risk yönetimi,
Sigortacılık
¾ Yeni poliçe talep edecek müşterilerin tahmin edilmesinde,
¾ Sigorta dolandırıcılıklarının tespitinde,
¾ Riskli müşteri tipinin belirlenmesinde.
Perakendecilik
¾ Satış noktası veri analizleri,
¾ Alış-veriş sepeti analizleri,
¾ Tedarik ve mağaza yerleşim optimizasyonu,
152
Süreyya ÇANKIRI, Elif KARTAL, Kemal YILDIRIM ve Sevinç GÜLSEÇEN
ÜNAK ‘09
Borsa
¾ Hisse senedi fiyat tahmini,
¾ Genel piyasa analizleri,
¾ Alım-satım stratejilerinin optimizasyonu.
Telekomünikasyon
¾ Kalite ve iyileştirme analizlerinde,
¾ Hisse tespitlerinde,
¾ Hatların yoğunluk tahminlerinde,
Sağlık ve İlaç
¾
¾
¾
¾
Test sonuçlarının tahmini,
Ürün geliştirme,
Tıbbi teşhis
Tedavi sürecinin belirlenmesinde
Endüstri
¾ Kalite kontrol analizlerinde
¾ Lojistik,
¾ Üretim süreçlerinin optimizasyonunda,
Bilim ve Mühendislik
¾ Ampirik veriler üzerinde modeller kurarak bilimsel ve teknik problemlerin
çözümlenmesi
Veri Madenciliği Metodolojisi ve Kullanılan Teknikler
Metodoloji
Bir veri madenciliği çalışmasında kullanılan metodoloji Şekil 1’de verilmiştir. Standart
form içinde verilen veri, öğrenme ve deneme olmak üzere ikiye ayrılır. Her uygulamada
kullanılabilecek birden çok teknik vardır ve önceden hangisinin en başarılı olacağını
kestirmek olası değildir. Bu yüzden öğrenme kümesi üzerinde L değişik teknik kullanılarak L
tane model oluşturulur. Sonra bu L model deneme kümesi üzerinde denenerek en başarılı
olanı, yani deneme kümesi üzerindeki tahmin başarısı en yüksek olanı seçilir.
153
ÜNAK ‘09
Organizasyonlarda Bilgi Yönetimi Sürecinde Veri Madenciliği Yaklaşımı
Şekil 1: Veri Madenciliği Çalışmasında Kullanılan Metodoloji
Eğer bu en iyi model yeterince başarılıysa kullanılır, aksi takdirde başa dönerek çalışma
tekrarlanır. Tekrar sırasında başarısız olan örnekler incelenerek bunlar üzerindeki başarının
nasıl arttırılabileceği araştırılır. Örneğin, standart forma yeni alanlar ekleyerek programa
verilen bilgi arttırılabilir veya olan bilgi değişik bir şekilde kodlanabilir; veya amaç daha
değişik bir şekilde tanımlanabilir.
Kullanılan Teknikler
¾ İstatistiksel Yöntemler: Veri madenciliği çalışması esas olarak bir istatistik
uygulamasıdır. Verilen bir örnek kümesine bir kestirici oturtmayı amaçlar. İstatistik
literatüründe son elli yılda bu amaç için değişik teknikler önerilmiştir. Bu teknikler
istatistik literatüründe çok boyutlu analiz (multivariate analysis) başlığı altında
toplanır ve genelde verinin parametrik bir modelden (çoğunlukla çok boyutlu
bir Gauss dağılımından) geldiğini varsayar. Bu varsayım altında sınıflandırma
(classification; discriminant analysis), regresyon, öbekleme (clustering), boyut
azaltma (dimensionality reduction), hipotez testi, varyans analizi, bağıntı (association;
dependency) kurma için teknikler istatistikte uzun yıllardır kullanılmaktadır (Rencher,
1995).
¾ Bellek Tabanlı Yöntemler: Bellek tabanlı veya örnek tabanlı (memory-based,
instance-based methods; case-based reasoning) bu yöntemler istatistikte
1950’li yıllarda önerilmiş olmasına rağmen o yıllarda gerektirdiği hesaplama ve
bellek yüzünden kullanılamamış ama günümüzde bilgisayarların ucuzlaması ve
kapasitelerinin artmasıyla, özellikle de çok işlemcili sistemlerin yaygınlaşmasıyla,
kullanılabilir olmuştur. Bu yöntemlere en iyi örnek en yakın k komşu algoritmasıdır
(k-nearest neighbor) (Mitchell, 1997).
¾ Yapay Sinir Ağları: 1980’lerden sonra yaygınlaşan yapay sinir ağlarında (artificial
neural networks) amaç fonksiyon birbirine bağlı basit işlemci ünitelerinden
154
Süreyya ÇANKIRI, Elif KARTAL, Kemal YILDIRIM ve Sevinç GÜLSEÇEN
¾ Karar Ağaçları: İstatistiksel yöntemlerde veya yapay sinir ağlarında veriden bir
fonksiyon öğrenildikten sonra bu fonksiyonun insanlar tarafından anlaşılabilecek bir
kural olarak yorumlanması zordur. Karar ağaçları ise veriden oluşturulduktan sonra
kökten yaprağa doğru inilerek kurallar (IF-THEN rules) yazılabilir (Mitchell, 1997).
Bu şekilde kural çıkarma (rule extraction), veri madenciliği çalışmasının sonucunun
geçerlenmesini sağlar. Bu kurallar uygulama konusunda uzman bir kişiye gösterilerek
sonucun anlamlı olup olmadığı denetlenebilir. Sonradan başka bir teknik kullanılacak
bile olsa karar ağacı ile önce bir kısa çalışma yapmak, önemli değişkenler ve yaklaşık
kurallar konusunda bize bilgi verir ve önerilir.
Veri Madenciliği Modelleri
Veri madenciliğinde kullanılan modeller, tahmin edici (Predictive) ve tanımlayıcı (Descriptive)
olmak üzere iki ana başlık altında incelenmektedir (Zhong ve Zhou, 1999, ss.1-3).
Tahmin edici modellerde, sonuçları bilinen verilerden hareket edilerek bir model
geliştirilmesi ve kurulan bu modelden yararlanılarak sonuçları bilinmeyen veri kümeleri için
sonuç değerlerin tahmin edilmesi amaçlanmaktadır. Örneğin, bir banka önceki dönemlerde
vermiş olduğu kredilere ilişkin gerekli tüm verilere sahip olabilir. Bu verilerde bağımsız
değişkenler kredi alan müşterinin özellikleri, bağımlı değişken değeri ise kredinin geri ödenip
ödenmediğidir. Bu verilere uygun olarak kurulan model, daha sonraki kredi taleplerinde
müşteri özelliklerine göre verilecek olan kredinin geri ödenip ödenmeyeceğinin tahmininde
kullanılmaktadır.
Tanımlayıcı modellerde ise karar vermeye rehberlik etmede kullanılabilecek mevcut
verilerdeki örüntülerin tanımlanması sağlanmaktadır. 25 yaş altı bekâr kişiler ile 25 yaş
üstü evli kişiler üzerinde yapılan ve ödeme performanslarını gösteren bir analiz, tanımlayıcı
modellere örnek olarak verilebilir.
Veri madenciliği modellerini gördükleri işlevlere göre üç ana başlık altında incelemek
mümkündür (Akpınar, 2000, ss.1-22);
¾ Sınıflama (Classification) ve Regresyon (Regression) Modelleri
¾ Kümeleme (Clustering) Modelleri
¾ Birliktelik Kuralları (Association Rules) ve Ardışık Zamanlı Örüntüler (Sequential
Patterns). Sınıflama ve regresyon modelleri tahmin edici, kümeleme, birliktelik
kuralları ve ardışık zamanlı örüntü modelleri tanımlayıcı modellerdir.
Sınıflama ve Regresyon
Sınıflama ve regresyon, önemli veri sınıflarını ortaya koyan veya gelecek veri eğilimlerini
tahmin eden modelleri kurabilen iki veri analiz yöntemidir. Sınıflama kategorik değerleri
tahmin ederken, regresyon süreklilik gösteren değerlerin tahmin edilmesinde kullanılır.
155
ÜNAK ‘09
oluşan bir ağ üzerine dağıtılmıştır (Bishop, 1996). Yapay sinir ağlarında kullanılan
öğrenme algoritmaları veriden üniteler arasındaki bağlantı ağırlıklarını hesaplar.
YSA istatistiksel yöntemler gibi veri hakkında parametrik bir model varsaymaz yani
uygulama alanı daha geniştir ve bellek tabanlı yöntemler kadar yüksek işlem ve
bellek gerektirmez.
Organizasyonlarda Bilgi Yönetimi Sürecinde Veri Madenciliği Yaklaşımı
ÜNAK ‘09
Örneğin, bir sınıflama modeli banka kredi uygulamalarının güvenli veya riskli olmalarını
kategorize etmek amacıyla kurulurken, regresyon modeli geliri ve mesleği verilen potansiyel
müşterilerin bilgisayar ürünleri alırken yapacakları harcamaları tahmin etmek için kurulabilir
(Han ve Kamber, 2000, ss.31-35).
Sınıflama ve regresyon modellerinde kullanılan başlıca teknikler şunlardır (Akpınar, 2000,
ss.1-22):
1.
2.
3.
4.
5.
6.
Karar Ağaçları (Decision Trees)
Yapay Sinir Ağları (Artificial Neural Networks)
Genetik Algoritmalar (Genetic Algorithms)
K-En Yakın Komşu (K-Nearest Neighbor)
Bellek Temelli Nedenleme (Memory Based Reasoning)
Naive-Bayes
Karar ağaçları, veri madenciliğinde kuruluşlarının ucuz olması, yorumlanmalarının kolay
olması, veri tabanı sistemleri ile kolayca entegre edilebilmeleri ve güvenilirliklerinin iyi olması
nedenleri ile sınıflama modelleri içerisinde en yaygın kullanıma sahip tekniktir.
Karar ağacı, adından da anlaşılacağı gibi bir ağaç görünümünde, tahmin edici bir
tekniktir (Berry ve Linoff, 1999). Ağaç yapısı ile kolay anlaşılabilen kurallar yaratabilen, bilgi
teknolojileri işlemleri ile kolay entegre olabilen en popüler sınıflama tekniğidir.
Karar ağacı karar düğümleri, dallar ve yapraklardan oluşur (Han ve Kamber, 2000).
Karar düğümü, gerçekleştirilecek testi belirtir. Bu testin sonucu ağacın veri kaybetmeden
dallara ayrılmasına neden olur. Her düğümde test ve dallara ayrılma işlemleri ardışık
olarak gerçekleşir ve bu ayrılma işlemi üst seviyedeki ayrımlara bağımlıdır. Ağacın her
bir dalı sınıflama işlemini tamamlamaya adaydır. Eğer bir dalın ucunda sınıflama işlemi
gerçekleşemiyorsa, o dalın sonucunda bir karar düğümü oluşur. Ancak dalın sonunda belirli
bir sınıf oluşuyorsa, o dalın sonunda yaprak vardır. Bu yaprak, veri üzerinde belirlenmek
istenen sınıflardan biridir. Karar ağacı işlemi kök düğümünden başlar ve yukarıdan aşağıya
doğru yaprağa ulaşana dek ardışık düğümleri takip ederek gerçekleşir.
Şekil 2: Bir Kredi Kartı Kampanyasında Yeni Bir Örneğin Sınıflandırılması
156
Süreyya ÇANKIRI, Elif KARTAL, Kemal YILDIRIM ve Sevinç GÜLSEÇEN
ÜNAK ‘09
Bir kredi kartı kampanyasına hangi özellikteki müşterilerin yanıt verip vermeyeceğini
karar ağacı modeli kullanarak bulmaya çalışan yukarıdaki örneği inceleyelim. Şekil 2’ de
görüldüğü üzere yüksek geliri olan ‘Bayan X’ kampanyaya yanıt vermemiştir. Bu durumda
aşağıdaki (1.1) gibi bir sınıflama kuralı çıkartılabilir:
IF Gelir=Yüksek AND Cinsiyet=Bayan THEN Kampanya=Yanıtlamaz (1.1)
Kümeleme
Kümeleme, veriyi sınıflara veya kümelere ayırma işlemidir (Karypis, Han ve Kumar, 1999,
ss. 68-75). Aynı kümedeki elemanlar birbirleriyle benzerlik gösterirlerken, başka kümelerin
elemanlarından farklıdırlar. Kümeleme veri madenciliği, istatistik, biyoloji ve makine öğrenimi
gibi pek çok alanda kullanılır. Kümeleme modelinde, sınıflama modelinde olan veri sınıfları
yoktur (Ramkumar ve Swami, 1998, ss.9-14). Verilerin herhangi bir sınıfı bulunmamaktadır.
Sınıflama modelinde, verilerin sınıfları bilinmekte ve yeni bir veri geldiğinde bu verinin hangi
sınıftan olabileceği tahmin edilmektedir. Oysa kümeleme modelinde, sınıfları bulunmayan
veriler gruplar halinde kümelere ayrılırlar. Bazı uygulamalarda kümeleme modeli, sınıflama
modelinin bir önişlemi gibi görev alabilmektedir (Ramkumar ve Swami, 1998, ss.9-14).
Marketlerde farklı müşteri gruplarının keşfedilmesi ve bu grupların alışveriş örüntülerinin
ortaya konması, biyolojide bitki ve hayvan sınıflandırmaları ve işlevlerine göre benzer
genlerin sınıflandırılması, şehir planlanmasında evlerin tiplerine, değerlerine ve coğrafik
konumlarına göre gruplara ayrılması gibi uygulamalar tipik kümeleme uygulamalarıdır.
Kümeleme aynı zamanda web üzerinde bilgi keşfi için dokümanların sınıflanması amacıyla
da kullanılabilir (Seidman, 2001).
Veri kümeleme güçlü bir gelişme göstermektedir. Veri tabanlarında toplanan veri
miktarının artmasıyla orantılı olarak, kümeleme analizi son zamanlarda veri madenciliği
araştırmalarında aktif bir konu haline gelmiştir.
Literatürde pek çok kümeleme algoritması bulunmaktadır. Kullanılacak olan kümeleme
algoritmasının seçimi, veri tipine ve amaca bağlıdır. Genel olarak başlıca kümeleme
yöntemleri şu şekilde sınıflandırılabilir (Han ve Kamber, 2000, ss.31-35):
1- Bölme yöntemleri (Partitioning methods)
2- Hiyerarşik yöntemler (Hierarchical methods)
3- Yoğunluk tabanlı yöntemler (Density-based methods)
4- Izgara tabanlı yöntemler (Grid-based methods)
5- Model tabanlı yöntemler (Model-based methods)
Bölme yöntemlerinde, n veri tabanındaki nesne sayısı ve k oluşturulacak küme sayısı
olarak kabul edilir. Bölme algoritması n adet nesneyi, k adet kümeye böler (k ≤ n). Kümeler
tarafsız bölme kriteri olarak nitelendirilen bir kritere uygun oluşturulduğu için aynı kümedeki
nesneler birbirlerine benzerken, farklı kümedeki nesnelerden farklıdırlar (Han ve Kamber,
2000, ss. 3-35).
157
ÜNAK ‘09
Organizasyonlarda Bilgi Yönetimi Sürecinde Veri Madenciliği Yaklaşımı
Şekil 3: K-Means Yöntemiyle Kümeleme Örneği
En iyi bilinen ve en çok kullanılan bölme yöntemleri k-means yöntemi, k-medoids
yöntemi ve bunların varyasyonlarıdır (Fayyad, 1998, ss.41-48).
K-means yöntemi, ilk önce n adet nesneden rastgele k adet nesne seçer ve bu nesnelerin
her biri, bir kümenin merkezini veya orta noktasını temsil eder. Geriye kalan nesnelerden her
biri kendisine en yakın olan küme merkezine göre kümelere dağılırlar. Yani bir nesne hangi
kümenin merkezine daha yakın ise o kümeye yerleşir. Ardından her küme için ortalama
hesaplanır ve hesaplanan bu değer o kümenin yeni merkezi olur. Bu işlem tüm nesneler
kümelere yerleşinceye kadar devam eder (Han ve Kamber, 2000, ss.31-35).
Birliktelik Kuralları ve Ardışık Zamanlı Örüntüler
Birliktelik kuralları, büyük veri kümeleri arasında birliktelik ilişkileri bulurlar (Han ve Fu, 1999).
Toplanan ve depolanan verinin her geçen gün gittikçe büyümesi yüzünden, organizasyonlar
veri tabanlarındaki birliktelik kurallarını ortaya çıkarmak istemektedirler. Büyük miktardaki
mesleki işlem kayıtlarından ilginç birliktelik ilişkilerini keşfetmek, organizasyonların karar
alma işlemlerini daha verimli hale getirmektedir.
Birliktelik kurallarının kullanıldığı en tipik örnek market sepeti uygulamasıdır (Market
Basket Analysis). Bu işlem, müşterilerin yaptıkları alışverişlerdeki ürünler arasındaki
birliktelikleri bularak müşterilerin satın alma alışkanlıklarını analiz eder. Bu tip birlikteliklerin
keşfedilmesi, müşterilerin hangi ürünleri bir arada aldıkları bilgisini ortaya çıkarır ve market
yöneticileri de bu bilgi ışığında daha etkili satış stratejileri geliştirebilirler.
Örneğin bir marketin müşterilerinin süt ile birlikte ekmek satın alma oranı yüksekse,
market yöneticileri süt ile ekmek raflarını yan yana koyarak ekmek satışlarını arttırabilirler.
158
Süreyya ÇANKIRI, Elif KARTAL, Kemal YILDIRIM ve Sevinç GÜLSEÇEN
A => B [destek = %2, güven = %60] (2.1)
Buradaki destek ve güven ifadeleri, kuralın ilginçlik ölçüleridir. Sırasıyla, keşfedilen kuralın
kullanışlığını ve doğruluğunu gösterirler. (2.1)’deki Birliktelik Kuralı için %2 oranındaki
bir destek değeri, analiz edilen tüm alışverişlerden %2’sinde A ile B ürünlerinin birlikte
satıldığını belirtir. %60 oranındaki güven değeri ise A ürününü satın alan müşterilerinin
%60’ının aynı alışverişte B ürününü de satın aldığını ortaya koyar (Zaki, 1999, ss.14-25).
Kullanıcı tarafından minimum destek eşik değeri ve minimum güven eşik değeri belirlenir ve
bu değerleri aşan birliktelik kuralları dikkate alınır.
Birliktelik Kuralları ile Ardışık Zamanlı Örüntü modelleri arasındaki fark aşağıda birkaç
örnek ile belirtilmiştir (Akpınar, 2000, ss. 1-22).
Birliktelik kuralları aşağıda sunulan örneklerde görüldüğü gibi eş zamanlı olarak
gerçekleşen ilişkilerin tanımlanmasında kullanılır.
¾ Müşteriler bira satın aldığında, % 75 olasılıkla patates cipsi de alırlar,
¾ Düşük yağlı peynir ve yağsız yoğurt alan müşteriler, %85 olasılıkla diyet süt de satın
alırlar.
Ardışık zamanlı örüntüler ise aşağıda sunulan örneklerde görüldüğü gibi birbirleri ile
ilişkisi olan ancak birbirini izleyen dönemlerde gerçekleşen ilişkilerin tanımlanmasında
kullanılır.
¾ X ameliyatı yapıldığında, 15 gün içinde % 45 olasılıkla Y enfeksiyonu oluşacaktır,
¾ İMKB endeksi düşerken A hisse senedinin değeri % 15’den daha fazla artacak olursa,
üç iş günü içerisinde B hisse senedinin değeri % 60 olasılıkla artacaktır,
¾ Çekiç satın alan bir müşteri, ilk üç ay içerisinde % 15, bu dönemi izleyen üç ay
içerisinde % 10 olasılıkla çivi satın alacaktır.
Organizasyonel Bilgi Yönetiminin Önemi ve Bütünleşme Değeri
Bilgi yönetimi, rekabetin şiddetlendiği, sürekli değişimin yaşandığı ve belirsizliğin arttığı
bir ortamda organizasyonların ayakta kalmak, içinde bulundukları ortama uyum sağlamak
ve verimlilik güçlerini artırmak için, potansiyellerinin eşgüdümünü amaçlayan süreçler
bütünüdür. Bilgi yönetimi, “organizasyon ortamında sürekli olarak çoğalan bilgi kuvvetini
güncelleyen, oluşan bilgileri erişilebilir kılan, gerekli bilgiye erişmek içinse çeşitli uğraşlar
sonucunda gereksinim duyulan bilginin organizasyon çalışanlarıyla paylaşılmasını sağlayan
bir disiplin alanıdır” (Harrison ve Kessels, 2004, s.39).
Bilgi yönetimi kavramının sınırları iş değeri yaratma ve bir verimlilik değeri doğuracak
organizasyon bilgisinin yönetilmesine kadar genişletilebilir. Bilgi yönetimi; iletişime ve
verime, iş hedeflerinin gerçekleştirilmesine hizmet edecek her tür bilginin uygulamaya
konmasına olanak sağlar. Bir başka ifadeyle bilgi yönetimi çekirdek iş yeteneğinden değer
yaratma ve daha çok değeri elinde tutma erkidir (Tiwana, 2003, s.18). Bilgi yönetimi,
organizasyonel sistemin paylaşım / dağılım alanları içerisinde bilgi akımı ve dolaşımını
159
ÜNAK ‘09
Bir A ürününü satın alan müşteriler aynı zamanda B ürününü da satın alıyorlarsa, bu
durum (2.1)’ deki Birliktelik Kuralı ile gösterilir (Zaki, 1999, ss.14-25):
Organizasyonlarda Bilgi Yönetimi Sürecinde Veri Madenciliği Yaklaşımı
ÜNAK ‘09
olanaklı kılan paylaşımlar sonucu ortaya çıkan bir modeldir. Bilgi yönetimindeki amaç ise,
organizasyonel aktiviteler için süreç içerisinde gerekli olanı (bilgiyi) elde etmek ve bu bilginin
paylaşılarak kullanımına olanak sağlamaktır. Organizasyonlar için bilgi yönetiminin gücü
mükemmelleşme açısından en önemli avantajlardan biridir.
Bilgi yönetimi; organizasyonlar açısından olmazsa olmaz derecesinde bir öneme sahiptir.
Özellikle organizasyonlar, ürün merkezli olmaktan çıkıp bilgi merkezli olmaya başlayınca
kritik bir varlığa dönüşen bilginin çeşitli açılardan desteklenmesi kaçınılmaz olmuştur. İşte
bilgi yönetimi de bilgiye bu desteği sağlayabilmektedir. Bilgi yönetiminin gittikçe neden
bu kadar önemli olduğunu Tiwana (2003, ss.18-22) Drucker’dan da yararlanarak aşağıdaki
dokuz madde altında toplamaktadır:
¾ Organizasyonlar gün geçtikçe sermaye yoğun değil, bilgi yoğun hale gelmektedir.
Bilgi, ekonomik kaynakların özü olarak; hızla maddi sermaye, doğal kaynaklar ve emek
gücünün yerini almaktadır. Bilgi, organizasyonun köklü değişimlerle başa çıkabilmesine ve
cevaplarını keşfetmeden önce, doğru soruları sormasına olanak tanıyan tek girdidir. Bilgi
yönetimi, bu bilgiye ulaşmanın ve zamanında kullanmanın tek yoludur.
¾ Kararsız piyasalar ‘organizasyonlu teslimiyet’ gerektirmektedir. Koşullar,
organizasyonu yanlış zaman ve yanlış yerde, yanlış ürünle/ hizmetle bir felakete
sürükleyebilmektedir. Bu yöntemle, ürün ve hizmetleri yeniden oluşturmaya,
çalışmanın verimini düşürecek projelerden ve istenmeyen hatalardan yararlanarak
büyüme potansiyelini en üst seviyeye çıkaracak başka projelere yönelmeye olanak
tanınmaktadır.
¾ Bilgi yönetimi, değişim sizi yönetmeden, sizin değişimi yönetmenizi sağlamaktadır.
Artık hizmet odaklı iş dalları dışındaki organizasyonlar da bilgi yönetimine gereksinim
duymaktadır.
¾ Kalıcı olan yalnızca bilgidir. Bilgiye dayalı ekonomide ‘en dayanıklı organizasyon
hayatta kalır’ düşüncesinin artık geçerliliği kalmamıştır. Organizasyon açısından
hayatta kalmanın en önemli koşulu; eski ve yeni bilginin organizasyon bütünlüğünün
içerisinde tutulmasıdır. Bilginin, apaçık var olması yerine, ancak bir farklılık yaratacak
şekilde kullanılmasının önemli olduğu vurgulanmaktadır. Bilgi yönetimi ile bu
durum, bir gerçeklik haline gelir.
¾ Günümüz iş dünyası ve çalışma sistemleri açısından en önde gelen karmaşıklık,
kararsızlık ve belirsizlik vb. konular, işin niteliği ya da türü ne olursa olsun, bilgi
yönetimi uygulamasıyla bir avantaja dönüşebilmektedir.
¾ Hiçbir şey bilgi kadar karar oluşturucu değildir. Özellikle geçmiş projeler, girişimler,
deneyimler, başarılar ya da başarısızlıklar erişilebilir bilginin yardımıyla karar
oluşturmada katkı sağlamaktadır. İşbirliği ve bilgi paylaşımını aktif olarak destekleyen
bilgi yönetimi, çözümlerin ve daha iyi kararlar almanın organizasyon açısından
ekonomik değerler yaratacak biçimde yürütülmesini sağlamaktadır.
¾ Bilgi; üretimi, paylaşımı ve kullanımı gerektirmektedir. Bu nedenle, bilişim
teknolojisinin bu alandaki katkısı yükseltilmeye çalışılmalıdır.
160
Süreyya ÇANKIRI, Elif KARTAL, Kemal YILDIRIM ve Sevinç GÜLSEÇEN
¾ Her geçen gün küreselleşmenin biraz daha yaygınlaşmasıyla başa baş yarışmak ve
tehditler ya da fırsatları izleyerek sonuç almak zor ve zaman kaybı olduğundan
bilgi yönetimi teknolojisi, doğru kaynaklarla beslenirse, gereksinim duyulan bilgi
zamanında sağlanabilir.
Özetle, bilgi yönetimi bir paradoks yönetimi olmaktan çıkarılıp, bütün taşların yerli yerine
oturduğu bir organizasyonel bütünleşmeye dönüştürülmelidir. Organizasyonlar, ‘şimdi’nin
en sağlıklı biçimde yaşanır kılınması için bilgileri en üst düzeyde kullanırken, ‘yarın’ için var
olmanın ve büyümenin garantisi olacak bilgileri oluşturma, koruma, yönetme ve geliştirmeyi
bir uyum içerisinde sağlayabilecek bir niteliğe kavuşturulmalıdır. Organizasyonların başarısı
ya da başarısızlığı buna bağlıdır. Bir başka deyişle herhangi bir organizasyon, mekanik
örgüt anlayışından kurtulup farklı kaynaklı bilgiyi / ‘kaynak temelli metaforları’ yakalayabilir,
çalışma süreçlerine yayabilir ve doğru yönetebilirse sonsuz kazanımlar elde edebilmektedir.
Organizasyonel Bilgi Yönetiminin Yapı Taşları
Bir organizasyonun bilgi yönetimi uygulamasını başlatmak ve sürdürmek için
gerçekleştireceği bir dizi aktivite bulunmaktadır. Bunlardan bazıları eş zamanlı, bazıları
birbirini izleyecek şekilde yerine getirilir. Dönemsel olarak tekrarlananlar olduğu gibi bir kez
yapılan aktiviteler de vardır. Durumun gereklerine göre bir aktivitenin farklı uygulamaları
ya da tümüyle yeni aktiveler yaratılabilir. Yaklaşımlar esnek olmalı ve organizasyonun
önceliklerine, sınırlamalarına, kapasitesine göre değişebilmelidir. Yani, içinde bulunulan
duruma ve zamana göre gerekli ve uygun olan yapılmalıdır. İnsanlar, iş ortamı, yönetim
anlayışı, organizasyonun ihtiyaçları, müşterileri, tedarikçileri ve diğer paydaşları değiştikçe
bilgi yönetimi uygulaması da değişebilmektedir. Sonuç olarak uygulama çözümlerinin
niteliği, yönü ve hızı sektörün ve organizasyonun özel durumuna uyarlanacaktır (Barutçugil,
2002, s.134).
Bilgi yönetiminin uygulamasındaki adımları üst üste ya da yan yana sırayla konulacak
yapı taşlarına benzetebiliriz. Bunlar aşağıda kısaca açıklanmaktadır. Bu yapı taşlarının
birlikte uyumlu ve kapsamlı bir bilgi yönetimi uygulamasını oluşturduğu söylenebilir. Ancak
bunların organizasyonun karşılaştığı belirli bir durum için uygun yaklaşımı oluşturacak
seçilmiş yapı taşları olduğu unutulmamalıdır:
¾ Yönetimin benimsenmesini, inanmasını, kararlı bir şekilde adanmasını sağlamak.
Bilgi yönetimi çabalarının başarısı için bu çok önemlidir. Her çalışanın –ve
organizasyonun- eyleme geçebilmesi için bilginin birincil ve en önemli itici güç
olduğunun anlaşılması.
¾ Bilgi genel tablosunu incelemek ve ortaya koymak. Organizasyonun bilgi varlıklarının,
uygulamalarının ve genel durumunun, organizasyonun stratejisi, operasyonları ve
pazar koşulları altında güçlü ve zayıf yönlerini, fırsat ve tehlikelerini ortaya koymak
(SWOT analizi).
¾ Bilgi stratejisini planlamak. Bilgi yönetiminin organizasyonun veya iş biriminin
stratejisini nasıl destekleyeceğini belirlemek ve öncelikleri ortaya koyan bir ön taslak
doküman hazırlamak.
161
ÜNAK ‘09
¾ Söze dökülmeyen (örtük) bilgi gezicidir. Bilgi yönetimi, organizasyonun kritik yetenek
ve kapasitelerinin/ örtük bilgilerinin yitirilmesini de önlemektedir.
Organizasyonlarda Bilgi Yönetimi Sürecinde Veri Madenciliği Yaklaşımı
ÜNAK ‘09
¾ Bilgi ile bağlantılı alternatifleri ve potansiyel girişimleri tanımlamak. Gelirin
iyileşmesini, yeni ürün ve hizmetlerin yaratılmasını, bilgi darboğazlarının giderilmesini
sağlayacak gelişme fırsatlarını tanımlamak.
¾ Temel bilgi yönetimi girişimlerinden fayda beklentilerini göz önüne sererek öncelikleri
belirlemeyi, uygulamayı, yönetmeyi ve çabaların etkinliğini izlemeyi bu beklentilere
göre yapmak.
¾ Organizasyonun ve bilgi yönetiminin stratejisine, net fayda beklentilerine, ihtiyaçlara
ve kapasitenin varlığına göre öncelikleri belirlemek.
¾ Temel bilgi ihtiyaçlarını belirlemek. Temel, karmaşık ve kritik bilgi fonksiyonlarında
kaliteli iş yapabilmek için gerekli bilgiyi daha ayrıntılı bir biçimde tanımlamak.
¾ Temel bilgiyi elde etmek. Alınan dersler sistemi, işten ayrılanlardan bilgiyi geri alma
ve kritik bilgi fonksiyonları için gereken uzman bilgisini geliştirme gibi yöntemler
kullanmak.
¾ Bütünleşmiş bilgi transfer programları yaratarak bilgiyi kullanmak.
¾ Bilgi varlıklarının dönüştürülmesini, dağıtılmasını ve uygulanmasını sağlamak.
¾ Bilgi yönetimi alt yapısını kurmak ve güncelleştirmek. Farklı amaçlara uygun
olabilecek kapasiteler kurmak ve bunları sürdürmek.
¾ Bilgi varlıklarını yukarıdan aşağı perspektifle yönetmek.
¾ Özendirici programlar oluşturmak. Çalışanları, akıllı davranmaları için motive etmek
yani yaratıcı, yenilikçi, işbirlikçi, bilgi paylaşan, bilgi elde etmek için çaba harcayan,
zor durumlarda yardım isteyen kişiler olmaları için özendirmek.
¾ Bilgi yönetimi aktivitelerini ve fonksiyonlarını organizasyon çapında koordine etmek.
¾ Bilgi odaklı yönetimi kolaylaştırmak.
¾ Bilgi yönetimi uygulamalarını izlemek. Programların ve aktivitelerin performansları
ve gelişmeleri hakkında geribildirim sağlamaktır (Barutçugil, 2002, ss.134-137).
Organizasyonlar Açısından Bilgi Yönetiminin İlkeleri
Her bir organizasyonda bilginin niteliği; ürünler, hizmetler, politikalar, süreçler, teknolojiler,
roller ve ilişkiler çerçevesinde değişmektedir. Herhangi bir organizasyon ise, bilgi yönetimi
ile ilgili olarak temel ilkeleri kararlaştırdıktan sonra ayrıntılı yaklaşımları ve planları bu
ilkelere dayalı olarak yaratabilir. Dolayısıyla bilgi yönetiminin organizasyonlar açısından
yararlı olabilmesi için aşağıdaki ilkelerin dikkate alınması gerekmektedir.
Bilgi yönetimi ilkeleri ise şunlardır (Davenport ve Prusak, 2001, s.50; Grey, 1999, ss.1-2;
Barutçugil, 2002, ss.84-89; Özgener, 2002, s.486):
¾ Bilgi insanların zekâlarında ortaya çıkar ve orada yaşar.
¾ Bilgi yalnızca kullanıldığı zaman değerlidir.
¾ Bilgi değişimi elde tutmaktadır.
162
Süreyya ÇANKIRI, Elif KARTAL, Kemal YILDIRIM ve Sevinç GÜLSEÇEN
Bilgi dil yoluyla seyahat eder.
Bilgi dinamik bir sosyal süreçtir.
Bilgi paylaşımı güven gerektirir.
Bilgi paylaşımı desteklenmeli ve ödüllendirilmelidir.
Bilgi karmaşıktır.
Yönetimin desteği ve kaynak sağlanması şarttır.
Teknoloji yeni bilgi davranışlarının gelişimini kolaylaştırır.
Bilgi girişimleri bir pilot program ile başlatılmalıdır.
Girişimi değerlendirmek için niteliksel ve niceliksel ölçümler yapılması gerekir.
Bilgi yaratıcıdır ve beklenmedik yönlerde gelişmesi desteklenmelidir.
Bilgi kendi kendisini organize edebilmektedir.
Bilgi yönetimi pahalıdır.
Etkili bilgi yönetimi insan ve teknolojinin ortak çözümlerini gerektirir.
Bilgi yönetimi ileri derecede politiktir.
Bilgi yönetimi bilgi yöneticileri gerektirir.
Bilgiyi paylaşmak ve kullanmak genellikle doğal olmayan eylemlerdir.
Bilgiye ulaşma yalnızca bir başlangıçtır.
Bilgi yönetimi süreklidir, asla bitmez.
ÜNAK ‘09
¾
¾
¾
¾
¾
¾
¾
¾
¾
¾
¾
¾
¾
¾
¾
¾
¾
¾
Organizasyonlarda Bilgi Yönetimi Sürecinde Veri Madenciliği
Yapılan tahminlere göre dünyadaki bilgi miktarı her 20 ayda bir ikiye katlanmaktadır. (Awad
ve Ghaziri, 2004, s. 325). Veri madenciliği, işte bu devasa miktardaki bilgi yığınları arasında
işe yarayacak bilgileri keşfetmeyi hedef edinmiştir. Önceki bölümlerde de anlatıldığı gibi
bunu çeşitli yöntem ve teknikler kullanarak yapmaktadır.
Veri madenciliği ve bilgi yönetimi birbirinden bağımsız olarak geliştirilmiş olmasına
rağmen, belirli bazı hedeflerinin aynı noktalarda kesişmesinden dolayı; bilgi yönetimi, veri
madenciliğini kullanmaktadır.
Bu durumu, Şekil 4’de yer alan bilgi yönetimi sisteminin yedi katmanlı yapısında
görebiliriz
163
ÜNAK ‘09
Organizasyonlarda Bilgi Yönetimi Sürecinde Veri Madenciliği Yaklaşımı
Şekil 4: Bilgi Yönetim Sistemi’nin 7 Katmanlı Yapısı (Awad ve Ghaziri, 2004, s.102)
Bilgi yönetimi sürecini başarıya götüren özelliklerden birisi, devasa bilgi yığınları
arasından, karar verme eylemine ve iş süreç yönetimine ‘zekâ’ katabilecek işlevsel veriyi /
bilgiyi bulup kullanabilmektir. Bilgi yönetimi konusundaki çalışmalar ve gelişmeler bugünün
yeni kavramlarından birisi olan İş Zekâsı (Business Intelligence) kavramının ortaya çıkmasına
ve gelişmesine katkı sağlamıştır. Bilgi yönetimi ile veri madenciliğinin kesiştiği bir diğer
nokta da burasıdır: Veri madenciliği, İş Zekâsı’nın bir bileşeni olarak kabul edilir (Awad ve
Ghaziri, 2004, s. 328) (Şekil 5).
Şekil 5: Veri Madenciliği ve İş Zekâsı
164
Süreyya ÇANKIRI, Elif KARTAL, Kemal YILDIRIM ve Sevinç GÜLSEÇEN
ÜNAK ‘09
Sonuç
Bilindiği gibi veri madenciliği; eldeki bağlantısız-ilişkisiz-anlamsız kısacası yapısız veriden,
anlamlı ve kullanışlı bilgiyi çıkarmaya yarayacak tümevarım çalışmalarını yapmaya ve
uygulamaya yönelik olan çalışmaların bütünlüğünü içermektedir. Özetle denilebilir ki, veri
madenciliğinde amaç; çok büyük miktardaki ham veriden değerli bilginin çıkarılmasıdır.
Bilgi yönetimi ise, var olan bilgi ile bilgi kaynaklarının tanımlanması ve birbirleriyle
bağlantısını sağlayan bir süreç olarak her zaman için önem taşımaktadır. Bilgi yönetiminin
temel işlevi; bilgi ve bilgi kaynaklarının tanımlanmasının, düzenlenmesinin ve erişiminin
sağlanmasıdır. Organizasyonlarda bilgi yönetiminin üst seviyelere çıkartılması ve kazanım
sağlayacak şekilde devam ettirilebilmesi için veri madenciliği ile arasında bağlantının
kurulması gerekmektedir. Organizasyonlarda eğer böyle bir yaklaşım hayat bulabilirse
organizasyonun bilgi varlığı-hazinesi büyütülebilir.
Sonuç olarak organizasyonların gerekli bilgiye hızla ulaşabilmeleri, amaca uygun bir
biçimde hareket yeteneği kazanabilmeleri, veri ambarlarında tutulan çok çeşitli verilere
dayanarak daha önce keşfedilmemiş bilgileri ortaya çıkararak hedefleri için kullanabilmelerine
bağlıdır. Bu nedenle, bilgi yönetimi sürecinde veri madenciliği yaklaşımının benimsenmesi
büyük önem taşımaktadır.
Kaynakça
Ağır, A. (2005). Bilgi yönetimi sistemleri ve eğitimde bilgi yönetimi sistemi uygulaması. Yayımlanmamış
Doktora Tezi. İstanbul: Marmara Üniversitesi Sosyal Bilimler Enstitüsü,
Akpınar, H. (2000). Veri tabanlarında bilgi keşfi ve veri madenciliği. İstanbul Üniversitesi İşletme
Fakültesi Dergisi, 29(1).
Artinyan, E. N. (2009). Veri analizi- veri kalitesi ve bütünlüğü. 13 Temmuz 2009 tarihinde http://www.
denetimnet.net/UserFiles/Documents/Makaleler/BT%20Denetim/Veri_Analizi_Veri_Kalitesi_ve_B%
C3%BCt%C3%BCnl%C3%BC%C4%9F%C3%BC.pdf adresinden erişildi.
Awad, E.M ve Ghaziri, H.M. (2004). Knowledge management. Upper Saddle River, NJ: Prentice Hall.
Barutçugil, İ. (2002). Bilgi yönetimi. (2.bs.) İstanbul: Kariyer Yayıncılık.
Berry, M.J. ve Linoff, G. (2004). Data mining techniques. Indianapolis: Wiley Pub.
Berry, M.J.A. ve Linoff, G.S. (1999). Mastering data mining: The Art and Science of Customer
Relationship Management. John Wiley & Sons.
Bishop, C. (1996). Neural Networks for Pattern Recognition. Oxford University Press.
Davenport, T. (1997). Information Ecology: Mastering the Information and Knowledge Environmnet.
Oxford University Press.
Davenport, T.H. ve Prusak, L. (2001). İş dünyasında bilgi yönetimi: kuruluşlar ellerindeki bilgiyi nasıl
yönetirler. (G. Günay, Çev.). İstanbul: Rota Yayınları.
DeRosa, M. (2004). Data mining and data analysis for counterterrorism. Center for Strategic
and International Studies (CSIS). 13 Temmuz 2009 tarihinde http://csis.org/files/media/csis/
pubs/040301_data_mining_report.pdf adresinden erişildi.
Fayyad, U. (1998). Mining databases: towards algorithms for knowledge discovery. Bulletin of the
IEEE Computer Society Technical Committee on Data Engineering, 21(1), 41-48.
165
Organizasyonlarda Bilgi Yönetimi Sürecinde Veri Madenciliği Yaklaşımı
ÜNAK ‘09
Fayyad, U.M., Shapiro, G.P. ve Smyth, P. (1996). From data mining to knowledge discovery in
databases. AI Magazine 17(3), 37-54. 13 Temmuz 2009 tarihinde http://www.daedalus.es/
fileadmin/daedalus/doc/MineriaDeDatos/fayyad96.pdf adresinden erişildi.
Grey, D. (1999). Knowledge management principles. Haskoli Islands: Denham Grey.
Han, J. ve Fu, Y. (1999). Mining multiple-level association rules in large databases. IEEE Transactions
on Knowledge and Data Engineering, 11(5).
Han, J. ve Kamber, M. (2000). Data mining concepts and techniques. San Francisco: Morgan Kaufmann
Publishers.
Harrison, R. ve Kessels, J. (2004). Human resource development in a knowledge economy. New York:
Palgrave Macmillan Pub.
İlter, H.K. (2003). Bilgi üzerine notlar. Pivolka, 2 (9), 7-8.
Karypis G., Han, E. ve Kumar, V. (1999). Chameleon: hierarchical clustering using dynamic modeling.
IEEE Computer, 32(8), 68-75.
Lindell, Y., Israel, R. ve Pinkas, B. (2000). Privacy preserving data mining. Journal of Cryptology. 13
Temmuz 2009 tarihinde http://www.aladdin.cs.cmu.edu/workshops/privacy/slides/pdf/linell_
pinkas.pdf adresinden erişildi.
Zhong, N. ve Zhou, L. (ed.). (1999). Methodologies for knowledge discovery and data mining.
Third Pacific-Asia Conference, Pakdd-99, Beijing, China, April 26-28, 1999 : Proceedings içinde.
Almanya:Springer Verlag.
Mitchell, T. (1997). Machine learning. McGraw-Hill.
Müller, J.A. ve Lemke, F. (2000). Self-Organising data mining. Libri Books on Demand. http://www.
knowledgeminer.com/pdf/sodm.pdf adresinden 13.07.2009 tarihinde erişildi.
Oğuzlar, A. (2003). Veri önişleme. Erciyes Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi, 21,
67-76.
Öğüt, S. (2009). Veri madenciliği kavramı ve erişim süreci. http://www.sertacogut.com/papers/Sertac_
Ogut_-_Veri_Madenciligi_Kavrami_ve_Gelisim_Sureci.pdf adresinden 13.07.2009 tarihinde
erişildi.
Özdamar, E.Ö. (2002). Veri madenciliğinde kullanılan teknikler ve bir uygulama. Yayımlanmamış
Yüksek Lisans Tezi. İstanbul: Mimar Sinan Üniversitesi Fen Bilimleri Enstitüsü İstatistik Anabilim
Dalı.
Özgener, Ş. (2002). Global ölçekte değer yaratan bilgi yönetimi stratejileri. İ.G. Yumuşak ve M.A.
Dönmez (Yay. Haz.). I. Ulusal Bilgi, Ekonomi ve Yönetim Kongresi: 10-11 Mayıs 2002 içinde
(ss.483-496). İzmit: Kocaeli Üniversitesi İ.İ.B.F. İktisat ve İşletme Bölümleri.
Ramkumar, G.D. ve Swami, A. (1998). Clustering data without distance functions. Bulletin of the IEEE
Computer Society Technical Committee on Data Engineering, 21(1), 9-14.
Rencher, A.C. (1995). Methods of multivariate analysis. Wiley.
Seidman, C. (2001). Data mining with Microsoft SQL Server 2000. Washington: Microsoft Press.
Shahzad, M.A. (2009). Datawarehousing with Oracle. http://www.oracular.com/white_paper_pdfs/
DataWarehousingwithOracle.pdf adresinden 13.07.2009 tarihinde erişildi.
Show, M.J., Subramaniam, C., Tan, G.W. ve Welge, M.E. (2001). Knowledge management and data
mining for marketing. Decision support systems, 31, 127-137.
Skyrme, J.D. (1999). Knowledge networking: creating the collabrative enterprise. Butterworth
Heinemann.
166
Süreyya ÇANKIRI, Elif KARTAL, Kemal YILDIRIM ve Sevinç GÜLSEÇEN
ÜNAK ‘09
Surajit, A.N., Surajit, C., Bernhardt, J. ve Fayyad, U. (2000). Integration of data mining and relational
databases, Proceeding of the 26th Conference on Very Large Databases, http://www.tcs-trddc.
com/tecs/integration-of-data-mining.pdf adresinden 13.07.2009 tarihinde erişildi.
Thealing, K. (2009). Data mining and analytic technologies. 13Temmuz 2009 tarihinde http://www.
thearling.com/index.htm adresinden tarihinde erişildi.
Tiwana, A. (2003). Bilginin yönetimi. E. Özsayar (Çev.). İstanbul: Dışbank Kitapları.
Uçak, N.Ö. (2000). Bilgi üzerine kuramsal bir yaklaşım. Bilgi Dünyası, 1(1), 143-159.
Zaki, M.J. (1999). Parallel and distributed association mining: a survey. IEEE Concurrency, Special Issue
on Parallel Mechanisms for Data Mining, 7(5), 14-25.
167
Download