KARAKTER TANIMA Utku Cevre Barış Özkan ÜÇ CÜMLEDE OCR Nedir? Tarihçe Yazılı bir metnin (el yazısı, yazıcı çıktısı, nota kağıdı) görüntüsünün, bilgisayarla düzenlenebilir hale tercüme edilmesi için tasarlanan yazılımlardır. 1950’de Amerika’da AFSA için çalışan bir kriptanalist olan David Shepard’ın geliştirdiği Gismo ilk OCR örneğidir. Kullanım Alanları En çok tarayıcılarda kullanılmakla birlikte, arkeoloji ve eski yazı çözümlemede değer kazanmıştır. HEDEF: OCR OCR (Optical Character Recognition) uygulamalarında iki temel unsurdan söz edilebilir: Girdi: Metnin taranmış görüntüsü Çıktı: Girdi içeriğinin bilgisayar tarafından okunabilir hali. ADIMLAR OCR’ı gerçekleştirmek için üç aşamalı bir yol izlenebilir. Segmentation: Verilen girdi görüntüsündeki bağımsız parçalar belirlenip ayrıştırılır. Feature Extraction: Her bir bağımsız parça için yapay sinir ağına girdi olarak verilebilecek öznitelikler belirlenir. Classification: Yapay sinir ağı çalıştırılarak eğitilir. Yeni verilen karakterler sınıflandırılır. SEGMENTATION Sürecin iki aşamasında önem taşır: Eğitim verisi elde etme Eğitimden sonra yeni görüntüyü tanıma FEATURE EXTRACTION: NEDEN? Bölümlenmiş parçalar çok sayıda pikselden oluşan görüntü matrisleridir. Yapay sinir ağı ise girdi olarak daha az sayıda pikselden oluşan öznitelik vektörlerini kullanmalıdır. Bu öznitelik vektörünü oluşturmanın yolu feature extraction (öznitelik belirleme)’dır. FEATURE EXTRACTION: NASIL? Öznitelikleri seçmek için belirgin bir yöntem yoktur. Örneğin görüntüdeki düzenli parabolik eğriler öznitelik olarak kabul edilebilir. FEATURE EXTRACTION: ADIM 1 Görüntünün sınırlarının elde edilmesi: Görüntü matrisinde, en az bir tane foreground komşusu olan background pikseller sınır noktası olarak işaretlenir. FEATURE EXTRACTION: ADIM 2 Her bir sınır noktasının dolaşılarak, yerel olarak sınıra uyan, noktadan geçen en iyi parabolün tespit edilmesi: Bir noktanın komşularından geçen noktalardan geçen bir doğru çizilerek, sınırın yönelimi belirlenir. Görüntü, bu doğruyu yatay hale getirecek şekilde belli bir açıyla döndürülür. Önceden belirlenen komşu noktalara bir quadratic regresyon doğrusu uygulanır. FEATURE EXTRACTION: ADIM 2 Sınır üzerinde, bu quadratic eğriye yakın olan noktalar belirlenir. Quadratic eğri, belirlenen tüm noktalar kullanılarak günlenir. Günleme işlemi yakın noktalar kullanılarak birkaç kez daha tekrarlanabilir. Tanımlanan eğrinin sınırın bu noktadaki eğriliğine yakınsaması umulur. FEATURE EXTRACTION: ADIM 3 & 4 En iyi eğrinin belirlenmesi: En iyi üç eğri, kaç noktanın bu eğrilere yakın olduğuna bakılarak belirlenir. Son olarak parçanın aspect ratio’su (genişlik / uzunluk) bir diğer öznitelik olarak eklenir. CLASSIFICATION Öznitelikler belirlendikten sonra, yapay sinir ağı gerçek sınıflarını bildiğimiz eğitim verisi ile eğitilir. Eğitimden sonra yeni taranmış bir görüntüyü tanımak için: Görüntüyü okuma, Görüntüyü satırlara ayırma, Satırları parçalara ayırma, Her bir parçayı öznitelikleri doğrultusunda sınıflandırma işlemleri gerçekleştirilir. KAYNAKÇA Deepayan Sarkar, Optical Character Recognition using Neural Networks, 2003 http://en.wikipedia.org Computational Intelligence Dersi Notları, Graz Teknik Üniversitesi