www.iku.edu.tr BİLİM KÜLTÜR VE EĞİTİM D ev veri erin öğrenme-2 Yrd. Doç. Dr. Bahar İlgen İstanbul Kültür Üniversitesi Mühendislik Fakültesi Bilgisayar Mühendisliği Öğretim Üyesi G ünümüzde dev verinin kullanıma hazır olması ve sağladığı avantajlar yanında, sözü edilen boyutta verinin işlenmesi ve yönetilebilmesi için disiplinler arası çalışmaların yürütülmesi önemlidir. Dev verinin analizinde kullanılan ve yapay zekanın bir alt alanı olan Makine Öğrenimi (Machine Learning) algoritmalarının odak noktası, sisteme giren verinin temsili ve henüz gözlenmemiş olan veri üzerinde öğrenilmiş olan örüntülerin kullanımıdır. Verinin ne derece iyi temsil edildiğinin performans üzerindeki etkisi büyüktür. Veri temsili yetersiz olduğunda en iyi ve karmaşık yapıdaki bir öğreticiye rağmen performans düşük gözlenecektir. Öte yandan, iyi temsil edilmiş bir veri daha basit bir öğretici ile yüksek performanslı bir sonuç ortaya koyabilmektedir. Makine öğrenimi kapsamındaki “özellik mühendisliği” (Feature Engineering) işlenmemiş veri için özelliklerin çıkarılması ve verinin temsil biçimi ile ilgilenmektedir ki bu da verinin ele alınma biçiminin önemini ortaya koymaktadır. Derin öğrenme ise makine öğrenimi ve örüntü tanıma alanlarında oldukça ilgi çeken bir araştırma konusu olarak, ses tanıma, bilgisayarla görü ve doğal dil işleme gibi çok geniş uygulama alanlarında başarılı sonuçlar elde edilmesine olanak sağlamıştır. Günümüzde büyük verinin kullanılabilir olması büyük artılar sağlarken beraberinde bazı zorlukları getirmektedir. Bilinen ve yüzeysel yapıda öğrenme mimarilerine sahip pek çok öğrenme yönteminin aksine derin öğrenme ile yapılan sınıflandırmada derin mimarideki katmanlı yapı otomatik olarak öğrenilmektedir. Dev boyuttaki veriden kullanılacak özelliklerin otomatik olarak öğrenilmesi de yöntemin artılarından bir tanesidir. Derin öğrenme ile yakından ilgilenen akademik çevrelerin yanında Google, Apple ve Facebook gibi firmalar da derin öğrenme projeleri ile çok yakından ilgilenmektedir. Örneğin Apple, iPhone’un sanal kişisel asistanı Siri ile hava durumundan, spora, kullanıcı soruları ve hatırlatıcı gibi pek çok konuda Apple tarafından toplanan veri üzerinden derin öğrenme yöntemlerini kullanarak cevap oluşturmaktadır. Derin öğrenme algoritmaları ile dev boyutlu, işlenmemiş ya da yapısal olmayan veri üzerinde daha karmaşık yapılar öğrenilebilmekte ve temsil edilebilmektedir. Yöntem dahilinde ele alınan algoritmalar, özellikle yapay zeka alanında kullanılan ve insan beyninin gözlem, analiz, karar verme, zor problemleri çözebilme gibi yetilerini bilgisayarlara kazandırmayı hedefleyen algoritmalardır. Bu algoritmalar insan beyninin katmanlı öğrenme yapısını esas almaktadır. Derin öğrenme yanında “yüzeysel öğrenme” sağlayan diğer yöntemler, karmaşık yapıdan tüm bilginin çıkarılması ve yapı içindeki ilişkilerin kurulmasında yetersiz kalabilmektedir. Bu yönüyle derin öğrenme yapay zeka alanında büyük bir gelişme olarak görülmektedir; veriden sadece karmaşık yapıdaki bilgi temsilini çıkarmakla kalmayıp aynı zamanda bunu insan müdahalesi olmadan yerine getirmektedir. Veri derin öğrenme ile daha kusursuz olarak soyutlanabilmekte, elde edilen bilgi verinin başlangıç durumundaki değişikliklerden çok daha az etkilenmektedir. Bir örnek vermek gerekirse, bir “yüz tanıma” çalışmasında, yüzün konumu ile ilgili özellikler, nihai sonucu -beklendiği gibi- etkilememelidir. Sağlanan öğrenme işlevi, birbirine çıktı oluşturan çok katmanlı bir yapı ile sağlanmaktadır. Veri katmanlar arasında doğrusal olmayan dönüşümlerden geçerek, girdi verisi için bir fonksiyon elde edilmektedir. Sözü edilen doğrusal olmayan dönüşümlerin gerçekleştirilmesi, verideki açıklayıcı unsurların çıkarılması açısından önemlidir. Örnek vermek gerekirse, derin öğrenme ile gerçekleştirilen bir yüz tanıma çalışmasında, ilk katmanda yüzün farklı açılardaki duruşu öğrenilebilir. İkinci katmanda bu bilginin dudaklar, burun ve ağız gibi yüzün farklı bölümleri ile birleştirilmesi mümkün olacaktır. Üçüncü katmanda ise bu bilgiler farklı kişilere ait farklı yüz şekilleri gibi daha üst düzey bir bilginin öğrenilmesinde kullanılabilmektedir. Derin öğrenmenin, dev veriye katkısı; çok büyük boyuttaki veriden karmaşık örüntülerin çıkarılması, anlamsal indeksleme, veri etiketleme, hızlı bilgi erişimi ve ayrıştırma işlevlerinin basitleştirilmesi gibi noktalarda ortaya çıkmaktadır. Anlamsal indeksleme ve bilgiye erişim konusunda, verinin bit dizileri yerine anlamsal indeksleme ile tutulması arama motorlarının çok daha etkin kullanımını sağlamaktadır. Gerçekleştirilen üst düzey veri soyutlaması ile birbirine benzerlik gösteren veri belirlenmekte ve vektörler olarak temsil edilmekte, bu da bilgiye erişimin hızlı ve etkin olmasını sağlamaktadır. Derin öğrenmenin dev verideki bir diğer kullanımı ise ayrıştırma ve etiketleme çalışmalarıdır. Buna örnek olarak görsel veriler üzerinde yapılan arama işlemlerini ele alabiliriz. Google görsel veri üzerinde arama yapmayı olanaklı kılan sistemler geliştirmiş ve kullanıma almıştır. Derin öğrenme ile bu türdeki verinin soyutlamalar ile temsil edilerek, işaretlenmesi sağlanmış, bu da görsellerin indekslenmesi ve erişiminde katkı sağlamıştır. Google tarafından yapılan deneylerde yüz tanıma gibi çok üst düzey özelliklerin öğrenildiği gözlenmiştir. Yapılan deneyde internet üzerinden rastgele olarak seçilmiş 200x200’lük 10 milyon görsel kullanılarak 9 katmanlı bir sistem üzerinde eğitim yapılmıştır. Sistemde 1 milyar bağlantı olup, eğitim aşaması 3 gün sürmüştür. Çalışma sonunda yüz tanıyıcı, insan vücudu tanıyıcı gibi işlev gören nöronlar elde edilmiş ve bu alanda yapılan en başarılı çalışmayı geride bırakarak ImageNet veri kümesindeki 22,000 nesne tanımlanabilmiştir. Elde edilen sonuç yöntemin ilk defa karşılaşılan veri üzerindeki başarımını ortaya koymaktadır. Yapılan tüm çalışmalar ve kaydedilen gelişmeler göz önünde bulundurulduğunda, dev veri alanında etkin bir saklama ve erişim çözümü bulunmasının, sosyal ağlar, güvenlik, alışveriş ve pazarlama, savunma sistemleri, bankacılık ve farklı alanlardaki sahtekarlıkların tespiti, internet trafiğinin takibi gibi konularda ne denli önemli olduğunu ortaya koymaktadır. Farklı kaynaklardan gelen metin, görsel, video ve ses verileri, sosyal medyanın kullanımı ve sayısal verideki baş döndüren artışın, yakın gelecekte derin öğrenme gibi insan zihinsel düşünme ve çıkarsama süreçlerini kusursuza yakın şekilde gerçekleştiren yöntem ve yaklaşımların kullanımını çok daha yaygın ve önemli bir noktaya taşıması beklenmektedir. Bu noktada dev verinin geleceğe ışık tutan değerli bir kaynak olduğu, derin öğrenmenin ise pek çok farklı alanda olduğu gibi dev veri üzerinde elde edilen sonuçlarda da önemli katkısı olduğu gözlenmektedir. Kaynaklar: [1] Najafabadi, Maryam M., et al. “Deep learning applications and challenges in big data analytics.” Journal of Big Data 2.1 (2015): 1. [2] Chen, Xue-Wen, and Xiaotong Lin. “Big data deep learning: challenges and perspectives.” IEEE Access 2 (2014): 514-525. [3] http://devveri.com/