KARAKTER TANIMA

advertisement
KARAKTER TANIMA
Utku Cevre
Barış Özkan
ÜÇ CÜMLEDE OCR

Nedir?


Tarihçe


Yazılı bir metnin (el yazısı, yazıcı çıktısı, nota kağıdı)
görüntüsünün, bilgisayarla düzenlenebilir hale tercüme
edilmesi için tasarlanan yazılımlardır.
1950’de Amerika’da AFSA için çalışan bir kriptanalist
olan David Shepard’ın geliştirdiği Gismo ilk OCR
örneğidir.
Kullanım Alanları

En çok tarayıcılarda kullanılmakla birlikte, arkeoloji ve
eski yazı çözümlemede değer kazanmıştır.
HEDEF: OCR

OCR (Optical Character Recognition)
uygulamalarında iki temel unsurdan söz
edilebilir:


Girdi: Metnin taranmış görüntüsü
Çıktı: Girdi içeriğinin bilgisayar tarafından
okunabilir hali.
ADIMLAR

OCR’ı gerçekleştirmek için üç aşamalı bir yol
izlenebilir.



Segmentation: Verilen girdi görüntüsündeki
bağımsız parçalar belirlenip ayrıştırılır.
Feature Extraction: Her bir bağımsız parça için
yapay sinir ağına girdi olarak verilebilecek
öznitelikler belirlenir.
Classification: Yapay sinir ağı çalıştırılarak eğitilir.
Yeni verilen karakterler sınıflandırılır.
SEGMENTATION

Sürecin iki aşamasında önem taşır:


Eğitim verisi elde etme
Eğitimden sonra yeni görüntüyü tanıma
FEATURE EXTRACTION: NEDEN?



Bölümlenmiş parçalar çok sayıda pikselden
oluşan görüntü matrisleridir.
Yapay sinir ağı ise girdi olarak daha az sayıda
pikselden oluşan öznitelik vektörlerini
kullanmalıdır.
Bu öznitelik vektörünü oluşturmanın yolu
feature extraction (öznitelik belirleme)’dır.
FEATURE EXTRACTION: NASIL?


Öznitelikleri seçmek için belirgin bir yöntem
yoktur.
Örneğin görüntüdeki düzenli parabolik eğriler
öznitelik olarak kabul edilebilir.
FEATURE EXTRACTION: ADIM 1

Görüntünün sınırlarının elde edilmesi:

Görüntü matrisinde, en az bir tane
foreground komşusu olan background
pikseller sınır noktası olarak işaretlenir.
FEATURE EXTRACTION: ADIM 2

Her bir sınır noktasının dolaşılarak, yerel
olarak sınıra uyan, noktadan geçen en iyi
parabolün tespit edilmesi:


Bir noktanın komşularından geçen noktalardan
geçen bir doğru çizilerek, sınırın yönelimi belirlenir.
Görüntü, bu doğruyu yatay hale getirecek şekilde
belli bir açıyla döndürülür. Önceden belirlenen
komşu noktalara bir quadratic regresyon doğrusu
uygulanır.
FEATURE EXTRACTION: ADIM 2




Sınır üzerinde, bu quadratic eğriye yakın olan
noktalar belirlenir.
Quadratic eğri, belirlenen tüm noktalar
kullanılarak günlenir.
Günleme işlemi yakın noktalar kullanılarak
birkaç kez daha tekrarlanabilir.
Tanımlanan eğrinin sınırın bu noktadaki
eğriliğine yakınsaması umulur.
FEATURE EXTRACTION: ADIM 3 & 4

En iyi eğrinin belirlenmesi:


En iyi üç eğri, kaç noktanın bu eğrilere
yakın olduğuna bakılarak belirlenir.
Son olarak parçanın aspect ratio’su
(genişlik / uzunluk) bir diğer öznitelik
olarak eklenir.
CLASSIFICATION


Öznitelikler belirlendikten sonra, yapay sinir
ağı gerçek sınıflarını bildiğimiz eğitim verisi ile
eğitilir.
Eğitimden sonra yeni taranmış bir görüntüyü
tanımak için:




Görüntüyü okuma,
Görüntüyü satırlara ayırma,
Satırları parçalara ayırma,
Her bir parçayı öznitelikleri doğrultusunda
sınıflandırma işlemleri gerçekleştirilir.
KAYNAKÇA



Deepayan Sarkar, Optical Character Recognition using
Neural Networks, 2003
http://en.wikipedia.org
Computational Intelligence Dersi Notları, Graz Teknik
Üniversitesi
Download