Kontrolsüz sınıflandırma

advertisement
Görüntü Sınıflandırma
Chapter 12
https://www.google.com.tr/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&uact=8&ved=0
CBwQFjAA&url=http%3A%2F%2Ffaculty.une.edu%2Fcas%2Fszeeman%2Frs%2Flect%2FCh%2
52012%2520Image%2520Classification.ppt&ei=0IA7Vd36GYX4Uu2UhNgP&usg=AFQjCNE2wG
21x1FvF9XPCbStx_tj_rcFUQ&sig2=H0frftLhKwBj-iOz0cTQBw&bvm=bv.91665533,d.d24
https://www.google.com.tr/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&uact=8&ved=0
CBwQFjAA&url=http%3A%2F%2Fwww.crssa.rutgers.edu%2Fcourses%2Fremsens%2Fremsens_
ugrad_ppt%2Fremsensing8_files%2Fremsensing8.ppt&ei=SRQ8VevxD8j4UprgdAM&usg=AFQjCNHb2FHS3qixJ1DDmHKCC5C1f7tWiw&sig2=_a4VEPgNzFVhJWz5QTXdw&bvm=bv.91665533,d.d24
Giriş
Görüntü sınıflandırma piksellerin ilgili
sınıflara atanmasıdır.
Böylelikle homojen piksel grupları
oluşturulur.
N bantlı görüntü
Piksel
Yansıma
değerleri
Belirlenen
sınıflar
Sınıflandırma
sonucu
Bantlar
karşılaştırma
sınıflandırma
Sınıflandırma kontrollü ve kontrolsüz
sınıflandırma olmak üzere iki ana gruba
ayrılır
 Kontrollü sınıflandırmada sınıflar kullanıcı
tarafından bilinir.
 Kontrolsüz sınıflandırmada seçilen algoritma
ve sınıf sayısına bağlı olarak pikseller
gruplandırılır.
 Hibrid sınıflandırıcılar kontrollü ve kontrolsüz
sınıflandırma yöntemlerinin her ikisini de
kullanır.
Kontrollü
Kontrol alanlarının
seçimi
Düzeltilmesi/de
ğerlendirilmesi
sınıflandırma
Sınıflandırmanın
doğruluk analizi
kontrolsüz
Kümeleme
algoritması
Sınıfların
belirlenmsi
Düzeltilmesi/değe
rlendirilmesi
Sınıflandırmanın
doğruluk analizi
Kontrollü sınıflandırma
A=Su
B=Tarım alanı
C=Kayalık alan
Kontrolsüz sınıflandırma



Görüntüye ilişkin öncül bilgi mevcut değildir.
Pikseller spektral olarak ayrılır.
Kullanıcı:




Sınıf sayısını
İterasyon sayısını
Yakınsama eşik değerini belirler
En yaygın olarak: Isodata and k-means
yöntemleri kullanılır.
Unsupervised classification
Yansıma değerleri
Algoritma
Spektral sınıflar
Sınıflar
A=Su
B=Tarım alanı
C=Kayalık alan
Varyans

Varyans:


Ortalamadan olan farkların karesi olarak
tanımlanır.
Diğer bir deyişle standart sapmanın karesidir
σ2
Omuz yükseklikleri: 600mm, 470mm, 170mm, 430mm and 300mm.
600 + 470 + 170 + 430 + 300
Ort. =
1970
=
5
= 394
5
Ortalamadan farklar
varyans
2062 + 762 + (-224)2 + 362 + (-94)2
Variance: σ2 =
108,520
=
5
= 21,704
5
Standart sapma: σ = √21,704 = 4.7
Böylelikle standart sapma kullanılarak normalin, çok uzun ve çok kısanın belirlenmesine
yönelik bir ölçüt elde edilmiş olur.
Buna göre Rottweillers uzun köpekler. And Dachsunds biraz kısa ... Gibi….
Normal Dağılım
Ortalamaların farkları

Basit bir tahmin için iki sınıfın ortalamalarının farkları
alınabilir.

En doğru yöntem normalleştirilmiş farklara
bakmaktır.
| xa  xb |
ND 
sa  sb
NDWI

Normalleştirilmiş fark bitki indeksi
Kontrolsüz sınıflandırma


Uzaktan algılama görüntüleri genellikle farklı
spektral sınıfları içerirler
Kontrolsüz sınıflandırma öncül olarak söz
konusu sınıfların tanımlanması,
işaretlenmesi, vb. işlemler için kullanılır.
Kontrolsüz sınıflandırma

Avantajları




Bölgeye ilişkin öncül bilgiye gereksinim yoktur
İnsan hatası minimize edilmiştir
Her bir sınıf farklı bir kümede toplanır
Sakıncaları



Sınıflar gerçek anlamda doğadaki karşılıkları ile
eşleşmeyebilir
Sınıflar ve özellikleri kontrol edilemez
Sınıfların spektral özellikleri zaman içinde
değişebilir
Kontrolsüz sınıflandırma


Mesafe ölçümleri yansıma değerlerinin
gruplandırılmasında kullanılır.
Bu amaçla yakınlık ölçütünü elde etmek için
Öklid mesafesi kullanılır.
Öklid uzaklığı

uzaklık
Öklid uzaklığı

Çok bantlı görüntüler için gösterim (bands)
Pixel A
Pixel B
Fark
(Dif)2


1
34
26
8
64
Σ (dif)2 = 1,637
√1637 = 40.5
2
28
16
12
144
3
22
52
-30
900
4
6
29
-23
529
Spektral plot
• Görüntünün iki bandı.
• Her bir pikselin 2 band için
dağılımı
Band 2
• Gözle pikseller kolaylıkla
gruplandırılabilir
• Bazı piksellerin hiçbir
kümeye atanamadığı durum
söz konusu olabilir
Band 1
K-means (kontrolsüz)
1.
2.
3.
4.
Her bir kümeye ait öncül merkezler
belirlenir.
Pikseller kendilerine en yakın kümeye
atanır
Her bir kümeye ait ortalama konum
yeniden hesaplanır
Bu sınıf merkezleri sabit oluncaya kadar
iteratif olarak tekrarlanır.
Band 1
1. Birinci irerasyon.
Sınıf merkezleri
rastgele belirlenir.
Pikseller en yakın
sınıfa atanır.
Band 2
Band 2
Band 2
Örnek, k-means
Band 1
2. İkinci iterasyon
sınıf merkezleri
sınıftaki piksellerin
merkezine göre
yeniden hesaplanır.
Band 1
3. N. İterasyon sınıf
merkezleri sabit
kalır.
Sonuç olarak:

Kontrolsüz sınıflandırmada uygulanacak
yöntem için;



Uzaklık ölçümü
Sınıf merkezlerinin belirlenmesi
Sınıfların ayrılabilirliğinin testi
Önemlidir.
Karar sınırları



Tüm sınıflandırma yazılımları sınıflar
arasındaki sınırın belirlenmesi temeline
dayanır. Böylelikle sınıflar arasında kesişim
oluşmaz.
Ortalamaya olan en kısa mesafe
En yakın komşuluk
Karar sınırı belirlenmesine yönelik kullanılan
ölçütlerden bazılarıdır.
Karar sınırı
Karar sınırı
Ortalamaya en küçük mesafe
En yakın komşuluk
Kontrollü sınıflandırma





Sınıflara ilişkin ön bilgi gerekir.
Sınıflar belirlenir
Her bir sınıf için kontrol alanı seçilir
Kontrol alanlarının testi için yer gerçekliği
kullanılır.
Birçok yöntem söz konusudur:


Parallelepiped
Maximum likelihood …….
Kontrollü sınıflandırma

Avantajları



Analist sınıflandırmayı kontrol edebilir
Her bir sınıfa ilişkin bilgi söz konusudur
Denetim alanları yardımı ile yanlış sınıflandırma
sonuçları denetlenebilir
Kontrollü sınıflandırma

Zayıf yönleri




Sınıflandırmayı analist belirler
Kontrol alanları genellikle spektral özelliklere göre
değil bilgiye dayalı olarak ölçülür
Kontrol alanlarının temsil etme özelliği yetersiz
olabilir
Kontrol alanlarının seçimi zor ve zaman alıcı
olabilir
Kontrollü sınıflandırma

Kontrol alanlarının önemli karakteristikleri

Piksel sayısı



Bir sınıf için birden fazla kontrol alanı ölçülebilir
Kontrol alanına örneklem pikseller sınıfı istatistiksel
olarak temsil edebilecek sayıda olmalıdır
Sayı dsınıf sayısına, çeşitliliğe ve kaynağa
bağlıdır


Parallelepiped
Minimum Distance sınıflandırıcı
Maximum likelihood (kontrollü)





Her bir sınıf için seçilen kontrol alanlarına ilişkin
varyans ve co-varyans hesaplabır
Sınıf istatistiksel olarak ortalama vektörü ve kovaryans matrisi ile modellenir
Sınıfın normal dağılımlı olduğu kabülü söz
konusudur
Tanımlanmayan pikseller verilen bir olasılık
dahilinde bir sınıfa atanırlar
Bir pikselin bir sınıfa atanması için o pikselin o
sınıfa ait olma olasılığının en yüksek olması
gerekir ya da tüm sınıflara ait olma olasılığı
düşükse sınıflandırılmayan olarak belirlenir
Maximum likelihood (kontrollü)
Olasılık yoğunluk fonksiyonu : iki değişkenli
N
I
R
R
e
f
l
e
c
t
a
n
c
e
Spektral özellik uzayı
Maximum likelihood
Grass
Trees
Impervious
Surface &
Bare Soil
water
Red Reflectance
N
I
R
R
e
f
l
e
c
t
a
n
c
e
Spektral özellik uzayı
Grass
Mix: grass/trees
Broadleaf
Trees
Conifer
Impervious
Surface &
Bare Soil
water
Red Reflectance
Maximum likelihood örnek
• Her bir eğitim sınıfına ilişkin
normal olasılık dağılımları
• Çizgiler eşit olasılıklara sahip
bölgeleri gösterir
• 1 nolu noktanın mavi sınıfa ait
olma olasılığı en yüksektir
• 2 nolu noktanın tüm sınıflara
ait olma olasılığı düşük olduğu
için sınıflandırılmamış olarak
işaretlenir
1
Equiprobability
contours
2
ISODATA (hibrid)


k-means ın genişletilmiş durumudur Kümeler için
standart sapma hesaplanır.
Her bir sınıf için ortalama konum yeniden
hesaplandıktan sonra :






Merkezleri yakın olan sınıflar birleştirilir
Büyük standart sapmaya sahip sınıflar ayrılır
Çok küçük sınıflar silinir
Sınıflandırma yenilenir.
Maksimum iterasyon tamamlandığında ya da
yakınsama limitine ulaştığında sonlanır
Pikseller sınıflara atanır.
Band 1
1. Kümeleme
yapılmıştır fakat
mavi sınıf 1. bandda
çok esnemiştir.
Band 2
Band 2
Band 2
Örnek ISODATA
Band 1
2.Cyan ve yeşil
sınıflar sadece 2 ya
da daha az piksele
sahiptir. Silinirler
Band 1
3. Outlier lar ya en
yakın sınıfa atanır
ya da
sınıflandırılmamış
olarak işaretlenirler.
Bayes’s Sınıflandırma


Bayesian sınıflandırma bir pikselin bir sınıfa ait olma
olasılığının hesaplanmasına dayanır
Bunu basit olarak 2 farklı zar çifti örneğinde
açıklamak mümkündür




1. çift normal olsun
2. çiftte her yüzde fazladan bir nokta daha olsun
1. oyuncu herhangi birini seçer, atar ve sonucu
söyler
2. oyuncu hangi zar çiftinin kullanıldığını söyler
Bayes’s sınıflandırma

Karar sınırının belirlenmesi için tüm olası
sonuçların listelenmesi ve hangilerinin en çok
benzediğinin belirlenmesi gerekir



Normal zarlar için 2-12
Diğer zarlar için 6- 16
Bunlar nasıl benzer olabilir?


2 nin elde edilebilmesi için yalnız bir durum söz
konusudur
3 için, 2 durum (1 ve 2, veya 2 ve1)
Bayes’s sınıflandırma

Histogramlar ayırd edici fonksiyon niteliğini
kazanır ve karar sınırı verilen bir durum için
en yüksek olasılık olarak set edilir


Çıktı 7 ise, bunun standart zara ait olması
muhtemeldir
Çıktı 4 ise, bu kesinlikle standart zara aittir
Bayes’s sınıflandırma


Arazi örtüsünü belirlemeye çalışılırken
Olasılıklar kontrol alanları yardımı ile
belirlenebilir


Her bir sınıfın histogramları yardımı ile olasılık
fonksiyonu hesaplanabilir
Bu olasılıklar da pikselleri gruplamak için
kullanılır
K-En Yakın Komşuluk
k Nearest
Neighbor 3 durumu gerektirir:





?
Görüntü
Sınıflar arasındaki uzaklığı
hesaplama için bir uzaklık ölçütü
k, elde edilebilen en yakın komşu
sayısı
Bilinmeyen bir pikseli
sınıflandırmak için:



Diğer kontrol alanlarına olan
uzaklıklar hesaplanır
k belirlenir
Bilinmeyen pikselin bir sınıfa
atanması için en yakındaki
komşulara ait sınıflar belirlenir
k
Nearest Neighbor

İki nokta arasındaki mesafe:



Euclidean uzaklığı
d(p,q) = √∑(pi – qi)2
Hamming uzaklığı (overlap metric)
En yakın komşu listesinden sınıfı
belirlemek


K-en yakın komşularda en çok tekrarlanan
sınıf
Ağırlık faktörü
w = 1/d2
k
Nearest Neighbor

k = 1:


?
k = 3:




Üçgen sınıfına ait
k = 7:

 Choosing
Kare sınıfına ait
Kare sınıfına ait
the value of k:
Eğer k çok küçükse gürültüye duyarlıdır
Eğer k çok büyükse komşuluk diğer sınıflara ait
noktaları içerebilir
Bulanık (Fuzzy) Kümeleme

Geleneksel yöntemlerde bir pikselin herhangi
bir sınıfa üyelik derecesi ya 0 dır ya da 1 dir.



Bu durum bir çok uygulamada karışık sınıf
sorununu meydana getirmektedir.
Pikseller yanlış sınıflara atanabilmektedir.
Bulanık mantıkta ise bir pikselin birden fazla
sınıfa farklı derecelerde üyeliği söz
konusudur

Örneğin bir pikselin su sınıfna 0.7, orman sınıfına
da 0.3 üyeliği söz konusu olabilir.
Yapay sinir ağları
(Neural Networks)

Yapay sinir ağları (YSA) beyni simüle eden
yaklaşımdır.


Girdi ve çıktı arasındaki bağlantılar oluşturularak
güçlendirilir.
Genel olarak 3 bileşenden oluşur



Girdi katman
Gizli katmanlar
Çıktı katmanlar-sınıflar
Basit bir yapay sinir ağı
Girdi
katman
Gizli
katman
Çıkı
katmanı
Download