MEH535 Örüntü Tanıma Olasılık

advertisement
13.03.2014
MEH535 Örüntü Tanıma
1.A. Olasılık ve Rassal Değişkenler
Doç.Dr. M. Kemal GÜLLÜ
Elektronik ve Haberleşme Mühendisliği Bölümü
web: http://akademikpersonel.kocaeli.edu.tr/kemalg/
E-posta: kemalg@kocaeli.edu.tr
Olasılık - Temel Kavramlar
• Olasılık (Probability): Bir rassal deney (random
experiment) gerçekleştiğinde (örn; para atma) oluşan
olayın (yazı/tura) ne sıklıkla gerçekleştiğinin ifadesi
• Örnek Uzayı (Sample Space): Bir rassal deneyin olası
çıktı kümesi (yazı ve tura)
2
1
13.03.2014
Olasılık - Temel Kavramlar
• Aksiyomlar:
1.
2.
3.
S
Ak
Ai
Aj
3
Olasılık - Temel Kavramlar
• Özellikler:
1.
2.
3.
4.
5.
6.
7.
4
2
13.03.2014
Olasılık - Temel Kavramlar
• Koşullu Olasılık (Conditional Prob.): B olayının oluşması
biliniyorken, A olayının olasılığıdır:
• “B koşuluna bağlı A olasılığı” ya da “verilen B için A’nın olma
olasılığı” olarak ifade edilebilir
5
Olasılık - Temel Kavramlar
• Toplam Olasılık Teoremi (Total Prob. Theorem): B1, B2,…, BN S
örnek uzayında birbirini dışlayan (mutually exclusive) olaylar
olsun
6
3
13.03.2014
Olasılık - Temel Kavramlar
• Bayes Teoremi: B1, B2,…, BN S örnek uzayının birer parçası
olsun
• Koşullu olasılık tanımı ve toplam olasılık teoremini kullanarak:
Olabilirlik (likelihood)
Önsel (prior)
Evidence (delil)
• İstatistiksel örüntü tanımanın temelini oluşturur
• Bayes Kuralı (Bayes Rule) olarak da bilinir
7
Olasılık - Temel Kavramlar
• Örnek: Hasta kişinin ilaç kullanma olasılığı
– İlaç kullanma olasılığı: P(ilaç)=0.005 (P(tedavi yok)=0.095)
– İlaç alanların hasta olma olasılığı: P(hasta|ilaç)=0.99
(P(hasta|tedavi yok)=0.01)
• Amaç: hasta olup da ilaç kullanma sonsal olasılığını bulmak:
P(ilaç|hasta) = P(hasta|ilaç)P(ilaç)/P(hasta) = ?
P(hasta) = P(hasta|ilaç)P(ilaç) + P(hasta|tedavi yok)P(tedavi yok)
= 0.99x0.005 + 0.01x0.095 = 0.0149
P(ilaç|hasta) = 0.99x0.005/0.0149 = 0.3322
8
4
13.03.2014
Olasılık - Temel Kavramlar
• Bayesçi Çıkarım:
9
Olasılık - Temel Kavramlar
• Bayes Teoremi ve Örüntü Tanıma:
ωj: j. sınıf, x: öznitelik vektörü
• Sınıflandırmada karar kuralı “P[ωj |x] olasılık değeri en yüksek
ωj sınıfını seç” şeklindedir
: ωj sınıfının önsel olasılığı (prior prob.)
: x gözlemine bağlı ωj sınıfının sonsal olasılığı (posterior prob.)
: ωj sınıfı için x gözleminin koşullu olasılığı (likelihood)
: normalizasyon sabiti (evidence), kararı etkilemez!
10
5
13.03.2014
Rassal Değişkenler - Temel Kavramlar
• Rassal Değişkenler (Random Variables): Rassal deney ile
çalışırken, deneyin çıktılarının ölçümü ya da sayısal özellikleri
ile ilgilenilir. Örn;
– Bir sınıftaki öğrencilerin boyları ya da kiloları
– Doktor sırası bekleyen hastaların bekleme süreleri
– 1 saat içerisinde bir mağazaya giren kişi sayısı
• Rassal değişken X ile gösterilir ve bir rassal deneyin örnek
uzayıdaki çıktısını (ζ), X(ζ) ile reel sayıya atayan fonksiyondur
11
Rassal Değişkenler - Temel Kavramlar
• Rassal değişkenler ayrık ve sürekli olarak iki sınıfa
ayrılmaktadır
– Ayrık: X(ζ) sonucu tamsayı:
• Para atma deneyinde art arda yapılan 5 atışta tura gelme sayısı
• 1 saat içerisinde bir mağazaya giren kişi sayısı
– Sürekli: X(ζ) sonucu sürekli aralıkta:
• Bir sınıftaki öğrencilerin boyları ya da kiloları
• Atılan topun çıkabildiği yükseklik
12
6
13.03.2014
Rassal Değişkenler - Temel Kavramlar
• Birikimli Dağılım Fonksiyonu (Cumulative Distribution Func.):
X rassal değişkeninin cdf’i FX (x) ile gösterilir:
• Özellikler:
13
Rassal Değişkenler - Temel Kavramlar
• Olasılık Yoğunluk Fonksiyonu (Probability Density Func.):
X sürekli rassal değişkeninin pdf’i fX (x) ile gösterilir:
• Ayrık rassal değişkenler için pdf’in eşdeğeri olasılık kütle
fonksiyonu (probability mass function) dur ve pmf:
14
7
13.03.2014
Rassal Değişkenler - Temel Kavramlar
• Özellikler:
15
Rassal Değişkenler - Temel Kavramlar
• pdf ve olasılık:
Bir kişinin ağırlığının 200 lb olma olasılığı 0.62
Bir kişinin ağırlığının 124.8 lb olma olasılığı 0.43
• Olasılık tek bir noktada sıfır ya da sıfıra çok yakın olmalıyd
– pdf olasılık yoğunluğunu tanımlar, olasılığı değil!
– pdf’den olasılığı hesaplamak için belli bir aralıkta integral alınmalı.
– Dolayısıyla olasılık için şu soruyu sormalıyız: bir kişinin ağırlığının
124.8 ± 2 lb aralığında olma olasılığı nedir?
16
8
13.03.2014
Rassal Değişkenler - Temel Kavramlar
• Rassal Değişkenlerin İstatistiksel Karakterizasyonu:
cdf ve pdf’in yanında rassal değişkenler aşağıdaki ölçütler ile
de karakterize edilirler:
• Beklendik değer (expectation):
• Değişinti (variance):
• N. moment:
17
Özel Rassal Değişkenler
• Bernoulli Dağılımı:
–
–
–
–
Çıktısının “başarılı” ya da “başarısız” olduğu denemedir.
Örn; para atma deneyi, hastalık bulaşma, sınav geçme olasılığı…
X rassal değişkeni başarılı/başarısız durumları için 0/1 değerini gösterir
p, denemenin başarılı olma olasılığıdır
– Eğer X Bernoulli dağılımlı ise beklendik değer ve değişinti:
18
9
13.03.2014
Özel Rassal Değişkenler
• İki Terimli (Binomial) Dağılım:
– N eşdeğer ve bağımsız Bernoulli denemesi yapıldığı
taktirde başarılı olma sayısı, iki terimli dağılıma sahip X
rassal değişkenidir
– N denemede i adet başarı olma olasılığı:
– Örn; N=10 kez para atma deneyinde 3 yazı gelme olasılığı
– Eğer X iki terimli dağılımlı ise beklendik değer ve değişinti:
19
Özel Rassal Değişkenler
• N=3 için:
P(F2|F1)
P(F1)=1-p
F3
P(FFF)=(1-p)3
P(S3|F2,F1)
S3
P(FFS)=p(1-p)2
P(F3|S2,F1)
F3
P(FSF)=p(1-p)2
F2
F1
P(S2|F1)
P(F3|F2,F1)
P{X=0} = (1-p)3
S2
P(S3|S2,F1)
P(F3|F2,S1)
P(F2|S1)
P(S1)=p
P(FSS)=p2(1-p)
F3
P(SFF)=p(1-p)2
F2
S1
P(S2|S1)
S3
P{X=1} = 3p(1-p)2
P{X=2} = 3p2(1-p)
P{X=3} = p3
P(S3|F2,S1)
S3
P(SFS)= p2(1-p)
P(F3|S2,S1)
F3
P(SSF)= p2(1-p)
P(S3|S2,S1)
S3
P(SSS)= p3
S2
20
10
13.03.2014
Özel Rassal Değişkenler
• p=0.3 alındığında dağılım:
P{X=0} = (1-p)3
P{X=1} = 3p(1-p)2
P{X=2} = 3p2(1-p)
0.5
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
P{X=3} = p3
0.441
0.343
0.189
0.027
0
1
2
3
İki terimli dağılım p = 0.3
21
Özel Rassal Değişkenler
• Çok Terimli (Multinomial) Dağılım:
– K adet birbirini dışlayan çıktıya sahip deneyin N eşdeğer ve
bağımsız denemesi yapıldığı taktirde:
– N deneme sonucundaki olası durumların dağılımıdır
– Her denemede başarı K olası çıktıdan biridir
– Farklı çıktılara ait sayıların toplamı
– X1’in N1 kez,…, Xk’nın Nk kez gelme ortak dağılımı:
– Örn; art arda N=10 kez zar atma (6 ayrı çıktı) deneyinde
P(1,2,1,1,1,4) olasılığı
22
11
13.03.2014
Özel Rassal Değişkenler
• Örnek: Bir şehirdeki üç başkan adayından A %20, B %30 ve C
%50 oy almaktadır.
• Seçilen 6 seçmenin A’ya 1, B’ye 2, C’ye 3 oy atma olasılığı
nedir?
Pr(A=1,B=2,C=3) = 6!(0.2)1(0.3)2(0.5)3/1!2!3!
= 0.135
23
Özel Rassal Değişkenler
• Poisson Dağılımı:
– X rassal değişkeni, belli bir aralıktaki olay sayısı
– λ: ortalama olay sayısı
X=r olma olasılığı Poisson dağılımı ile gösterilir:
24
12
13.03.2014
Özel Rassal Değişkenler
• Örnek: Bir otoyolda bir noktadan saatte ortalama 180 araç
geçiş yapmaktadır.
– Trafik yoğunlaştığında dakikada 5 veya daha fazla araç
geçme olasılığı?
X: dakikada geçen araç sayısı
λ=3: dakikada geçen ortalama araç sayısı
25
Özel Rassal Değişkenler
• Düzgün (Uniform) Dağılım:
– X rassal değişkeni [a,b] aralığında düzgün dağılımlıdır
– Dağılımın ortalama ve değişintisi:
26
13
13.03.2014
Özel Rassal Değişkenler
• Normal Dağılım (Gaussian Distribution):
– N(µ,σ2) ile gösterilir
– Ortalama (µ) ve değişinti (σ2) parametreleri tanımı için
yeterlidir
– N(0,1) durumunda dağılım birim normal olarak adlandırılır
– Normalizasyon:
27
Rassal Değişkenler - Temel Kavramlar
• Rassal Vektör: Rassal değişkenin genişletilmiş şeklidir.
• S örnek uzayındaki her ζ çıktısına bir gerçek vektör atayan
fonksiyon X vektör rassal değişkenidir.
• cdf ve pdf kavramları artık ortak cdf ve ortak pdf olarak ifade
edilir.
28
14
13.03.2014
Rassal Değişkenler - Temel Kavramlar
• Bir rassal vektör ortak cdf ve ortak pdf ile tamamen
karakterize edilebilirken, alternatif olarak aşağıdaki ölçütler ile
de tanımlanabilir:
• Ortalama vektörü:
• Ortak değişinti (Kovaryans) matrisi:
29
Rassal Değişkenler - Temel Kavramlar
• Ortak değişinti matrisi her bir öznitelik çiftinin birlikte değişim
eğilimini vermektedir.
• Özellikler:
–
–
–
–
–
–
Eğer xi ve xk benzer artış eğiliminde ise cik>0 dır
xk artarken xi azalış eğiliminde ise cik<0 dır
xi ve xk ilintisiz ise cik=0 dır
σi, xi nin standart sapması ise, |cij|≤ σi σj dir
cii = σi2 = Var(xi)
cik = ρikσi σk , ρik: ilinti katsayısı
30
15
13.03.2014
Rassal Değişkenler - Temel Kavramlar
• Ortak değişinti matrisi:
S: özilinti matrisi (autocorrelation matrix)
• Alternatif gösterim:
• Γ özniteliklerin ölçek bilgilerini, R ise öznitelikler arasındaki
ilintiyi barındırmaktadır (ilinti matrisi – correlation matrix).
31
Rassal Değişkenler - Temel Kavramlar
• İlintisiz ve Bağımsız (Uncorrelated vs Independent) RD’ler:
– xi ve xk rassal değişkenleri eğer E[xixk]=E[xi]E[xk] ise ilintisizdir
– Bağımsızlık için P[xixk]=P[xi]P[xk] şartı aranmalıdır
– Sonuçta iki rassal değişken bağımsız iken aynı zamanda ilintisiz olurken
(bağımsız→ilintisiz); ilintisiz iken bağımlı (ilintisiz→bağımsız/bağımlı)
olabilmektedir
bağımsız
X-> N(0, σ2)
Y-> X2
Y, X’e bağımlı üretilmiştir
Ancak;
Cov(X,Y) = E(XY) – E(X)E(Y)
= E[X3] – 0
= 0
Yani X ve Y ilintisizdir
İlintisiz fakat bağımlı!
32
16
13.03.2014
Rassal Değişkenler - Temel Kavramlar
• Çok Boyutlu Gauss Dağılımı:
– Tek Boyutta – N(µ,σ2):
– Çok boyutta N(µ,Σ):
– Örn; d=2 boyutta:
33
Rassal Değişkenler - Temel Kavramlar
• Gauss dağılımı neden popüler?
–
–
–
–
Dağılımı karakterize etmek için (µ,Σ) parametreleri yeterli
xi ve xk ilintisiz ise (cik=0) aynı zamanda bağımsızdır
Marjinal ve koşullu yoğunluklar da Gauss tipindedir
X = [X1, X2, …, XN] ortak Gauss tipinde ve A NxN boyutlu
tersi alınabilir bir matris ise Y = AX de Gauss tipindedir
(doğrusal dönüşüm)
– Merkezi limit teoremi
34
17
13.03.2014
Rassal Değişkenler - Temel Kavramlar
• Merkezi limit teoremi:
– µ ortalama ve σ2 değişintili dağılım kullanılarak elde edilen
örnek dağılımların ortalama ve değişintisi N örnek sayısı
arttıkça µ ve σ2 değerlerine yakınsar
– Dağılımın tipi ne olursa olsun örnek dağılımı N büyüdükçe
Gauss Dağılımına yaklaşır!
– Örn; her bir örnekte 500 deney varken N=1,4,7,10 örnek
sayısı için:
35
18
Download