Sayfa 16- -17 .indd - İstanbul Kültür Üniversitesi

advertisement
www.iku.edu.tr
BİLİM KÜLTÜR VE EĞİTİM
D
ev veri
erin öğrenme-2
Yrd. Doç. Dr. Bahar İlgen
İstanbul Kültür Üniversitesi Mühendislik Fakültesi
Bilgisayar Mühendisliği Öğretim Üyesi
G
ünümüzde dev verinin kullanıma hazır olması ve sağladığı avantajlar yanında, sözü edilen
boyutta verinin işlenmesi ve yönetilebilmesi
için disiplinler arası çalışmaların yürütülmesi önemlidir.
Dev verinin analizinde kullanılan ve yapay zekanın bir
alt alanı olan Makine Öğrenimi (Machine Learning) algoritmalarının odak
noktası,
sisteme
giren verinin temsili ve henüz gözlenmemiş olan veri
üzerinde öğrenilmiş
olan
örüntülerin
kullanımıdır. Verinin
ne derece iyi temsil edildiğinin performans üzerindeki
etkisi büyüktür. Veri temsili yetersiz olduğunda en iyi ve
karmaşık yapıdaki bir öğreticiye rağmen performans
düşük gözlenecektir. Öte yandan, iyi temsil edilmiş bir
veri daha basit bir öğretici ile yüksek performanslı bir
sonuç ortaya koyabilmektedir. Makine öğrenimi kapsamındaki “özellik mühendisliği” (Feature Engineering)
işlenmemiş veri için özelliklerin çıkarılması ve verinin
temsil biçimi ile ilgilenmektedir ki bu da verinin ele alınma biçiminin önemini ortaya koymaktadır.
Derin öğrenme ise makine öğrenimi ve örüntü tanıma alanlarında oldukça ilgi çeken bir araştırma konusu
olarak, ses tanıma, bilgisayarla görü ve doğal dil işleme gibi çok geniş uygulama alanlarında başarılı sonuçlar elde edilmesine olanak sağlamıştır. Günümüzde
büyük verinin kullanılabilir olması büyük artılar sağlarken beraberinde bazı zorlukları getirmektedir. Bilinen
ve yüzeysel yapıda öğrenme mimarilerine sahip pek
çok öğrenme yönteminin aksine derin öğrenme ile yapılan sınıflandırmada derin mimarideki katmanlı yapı
otomatik olarak öğrenilmektedir.
Dev boyuttaki veriden kullanılacak özelliklerin otomatik olarak öğrenilmesi de yöntemin artılarından bir
tanesidir. Derin öğrenme ile yakından ilgilenen akademik çevrelerin yanında Google, Apple ve Facebook
gibi firmalar da derin öğrenme projeleri ile çok yakından ilgilenmektedir. Örneğin Apple, iPhone’un sanal kişisel asistanı Siri ile hava durumundan, spora, kullanıcı
soruları ve hatırlatıcı gibi
pek çok konuda Apple
tarafından toplanan veri
üzerinden derin öğrenme
yöntemlerini kullanarak
cevap oluşturmaktadır.
Derin öğrenme algoritmaları ile dev boyutlu, işlenmemiş ya da yapısal olmayan veri üzerinde
daha karmaşık yapılar öğrenilebilmekte ve temsil edilebilmektedir. Yöntem dahilinde ele alınan algoritmalar, özellikle yapay zeka alanında kullanılan ve insan
beyninin gözlem, analiz, karar verme, zor problemleri
çözebilme gibi yetilerini bilgisayarlara kazandırmayı
hedefleyen algoritmalardır. Bu algoritmalar insan beyninin katmanlı öğrenme yapısını esas almaktadır. Derin
öğrenme yanında “yüzeysel öğrenme” sağlayan diğer
yöntemler, karmaşık yapıdan tüm bilginin çıkarılması
ve yapı içindeki ilişkilerin kurulmasında yetersiz kalabilmektedir. Bu yönüyle derin öğrenme yapay zeka
alanında büyük bir gelişme olarak görülmektedir; veriden sadece karmaşık yapıdaki bilgi temsilini çıkarmakla kalmayıp aynı zamanda bunu insan müdahalesi
olmadan yerine getirmektedir.
Veri derin
öğrenme
ile
daha kusursuz
olarak soyutlanabilmekte,
elde
edilen
bilgi
verinin
başlangıç durumundaki değişikliklerden
çok daha az
etkilenmektedir. Bir örnek
vermek gerekirse, bir “yüz
tanıma” çalışmasında, yüzün konumu ile ilgili özellikler, nihai sonucu -beklendiği gibi- etkilememelidir.
Sağlanan öğrenme işlevi, birbirine çıktı oluşturan çok
katmanlı bir yapı ile sağlanmaktadır. Veri katmanlar
arasında doğrusal olmayan dönüşümlerden geçerek,
girdi verisi için bir fonksiyon elde edilmektedir. Sözü
edilen doğrusal olmayan dönüşümlerin gerçekleştirilmesi, verideki açıklayıcı unsurların çıkarılması açısından önemlidir. Örnek vermek gerekirse, derin öğrenme ile gerçekleştirilen bir yüz tanıma çalışmasında, ilk
katmanda yüzün farklı açılardaki duruşu öğrenilebilir.
İkinci katmanda bu bilginin dudaklar, burun ve ağız
gibi yüzün farklı bölümleri ile birleştirilmesi mümkün
olacaktır. Üçüncü katmanda ise bu bilgiler farklı kişilere ait farklı yüz şekilleri gibi daha üst düzey bir bilginin
öğrenilmesinde kullanılabilmektedir.
Derin öğrenmenin, dev veriye katkısı; çok büyük boyuttaki veriden karmaşık örüntülerin çıkarılması,
anlamsal indeksleme, veri etiketleme, hızlı bilgi erişimi
ve ayrıştırma işlevlerinin basitleştirilmesi gibi noktalarda ortaya çıkmaktadır. Anlamsal indeksleme ve bilgiye
erişim konusunda, verinin bit dizileri yerine anlamsal
indeksleme ile tutulması arama motorlarının çok daha
etkin kullanımını sağlamaktadır. Gerçekleştirilen üst
düzey veri soyutlaması ile birbirine benzerlik gösteren
veri belirlenmekte ve vektörler olarak temsil edilmekte,
bu da bilgiye erişimin hızlı ve etkin olmasını sağlamaktadır.
Derin öğrenmenin dev verideki bir diğer kullanımı
ise ayrıştırma ve etiketleme çalışmalarıdır. Buna örnek
olarak görsel veriler üzerinde yapılan arama işlemlerini
ele alabiliriz. Google görsel veri üzerinde arama yapmayı olanaklı kılan sistemler geliştirmiş ve kullanıma
almıştır. Derin öğrenme ile bu türdeki verinin soyutlamalar ile temsil edilerek, işaretlenmesi sağlanmış,
bu da görsellerin indekslenmesi ve erişiminde katkı
sağlamıştır. Google tarafından yapılan deneylerde yüz
tanıma gibi çok üst düzey özelliklerin öğrenildiği gözlenmiştir. Yapılan deneyde internet üzerinden rastgele
olarak seçilmiş 200x200’lük 10 milyon görsel kullanılarak 9 katmanlı bir sistem üzerinde eğitim yapılmıştır. Sistemde 1 milyar bağlantı olup, eğitim aşaması 3
gün sürmüştür. Çalışma sonunda yüz tanıyıcı,
insan vücudu tanıyıcı gibi işlev gören nöronlar
elde edilmiş ve bu alanda yapılan en başarılı
çalışmayı geride bırakarak ImageNet veri kümesindeki 22,000 nesne tanımlanabilmiştir. Elde
edilen sonuç yöntemin ilk defa karşılaşılan veri
üzerindeki başarımını ortaya koymaktadır.
Yapılan tüm çalışmalar ve kaydedilen gelişmeler göz önünde bulundurulduğunda, dev veri
alanında etkin bir saklama ve erişim çözümü
bulunmasının, sosyal ağlar, güvenlik, alışveriş
ve pazarlama, savunma sistemleri, bankacılık ve
farklı alanlardaki sahtekarlıkların tespiti, internet
trafiğinin takibi gibi konularda ne denli önemli
olduğunu ortaya koymaktadır. Farklı kaynaklardan gelen metin, görsel, video ve ses verileri, sosyal
medyanın kullanımı ve sayısal verideki baş döndüren
artışın, yakın gelecekte derin öğrenme gibi insan zihinsel düşünme ve çıkarsama süreçlerini kusursuza yakın
şekilde gerçekleştiren yöntem ve yaklaşımların kullanımını çok daha yaygın ve önemli bir noktaya taşıması
beklenmektedir. Bu noktada dev verinin geleceğe ışık
tutan değerli bir kaynak olduğu, derin öğrenmenin ise
pek çok farklı alanda olduğu gibi dev veri üzerinde
elde edilen sonuçlarda da önemli katkısı olduğu gözlenmektedir.
Kaynaklar:
[1] Najafabadi, Maryam M., et al. “Deep learning applications
and challenges in big data analytics.” Journal of Big Data 2.1 (2015):
1.
[2] Chen, Xue-Wen, and Xiaotong Lin. “Big data deep learning:
challenges and perspectives.” IEEE Access 2 (2014): 514-525.
[3] http://devveri.com/
Download