Olasılık, Olasılık

advertisement
OLASILIK ve OLASILIK DAĞILIMLARI
Olasılık
Sonlu sayıda yinelenebilen bir denemede, olası
sonuçların herhangi birinin ortaya çıkma (elde edilme)
şansı ilgili sonucun OLASILIĞI olarak adlandırılır
Olasılık P( ) simgesi ile gösterilir.
( ) içinde olasılığın hangi sonuca ait olduğu belirtilir.
P ( x1 ), P ( A), P ( x  1)
gibi
Olasılık
Olasılık, ilgilenilen sonucun oransal sıklığıdır.
Bir A denemesine ilişkin olası sonuçlar,
x , x , ......, x
1
2
k
Her sonuca ilişkin tekrar sayıları
m , m , ......, m
1
olduğunda
2
k
Olasılık
P ( x1 ) 
m1
k
m
i
i 1
P ( x2 ) 
k
 P( x
m2
k
m
i
i
)1
i 1
i 1
...........................
P ( xk ) 
0  P ( xi )  1
mk
k
m
i 1
i
Olasılık
Örnek 1:
Bir onkoloji kliniğine başvuran göğüs kanseri tanısı
konulmuş 120 hastanın evrelere göre dağılımı aşağıdadır.
Sayı
75 (m1)
Evre
E1 (X1)
E2 (X2)
E3 (X3)
E4 (X4)
%
62,5
25 (m2)
15 (m3)
5 (m 4 )
20,8
12,5
4,2
120
100
Toplam
Kliniğe yeni başvuran bir hastanın 1. evrede olması olasılığı
P ( x1 ) 
m1
75

 0 ,625
120
4
m
i 1
i
Olasılık
Örneklem Uzayı
Bir olayın olası tüm sonuçlarının bulunduğu kümeye
denir.
Bir Sonucun Tümleyeni
Kendisi dışındaki diğer sonuçların tümüne, ilgili
sonucun tümleyeni denir.
P(A )  1 P(A)
P(A) P(A )  1
Olasılık
Yığılımlı Olasılık:
P(x  A)
n
Olasılıklarına yığılımlı olasılık denir.
k
m
i
olmak üzere
i 1
P ( x  x1)  m 1 / n
P(x  x2)  m 2 /n
P (x  x3)  m 3 / n
...........................
P (x  xk)  m k / n
P ( x  x1)  m 1 / n
ise P ( x  x 2 )  ( m 1  m 2 ) / n
P ( x  x3)  (m 1  m 2  m 3) / n
...........................
P (x  xk)  1
Olasılık
Olasılık
Yığılımlı Olasılık:
Örnek 1(devam):
Evre
E1 (X1)
E2 (X2)
E3 (X3)
E4 (X4)
Sayı
75 (m1)
%
62,5
120
20,8
12,5
4,2
100
25 (m2)
15 (m3)
5 (m 4 )
Toplam
Kliniğe yeni başvuran bir hastanın en çok 2. evrede olması olasılığı
P ( x  x2 ) 
m1  m 2
4
m
i 1
i
75  25

 0 ,833
120
Olasılık
Ayrık Olaylar
Aynı anda ortaya çıkması olası olmayan olaylara denir.
A
B
P( A  B)  0
P( A  B)  P( A)  P( B)
Olasılık
Kesişim
İki ya da daha fazla ayrık olmayan olayın bir arada
ortaya çıkması olayına denir.
A
B
P( A  B)
Olasılık
Örnek 2:
Bir toplumdan rasgele seçilen 50 yaş üstü 100 kişide
diyabet ve hipertansiyon dağılımı aşağıda verilmiştir.
H+
HT
D+
20
15
35
D- T
20 40
45 60
65 100
H+
D+
P( H   D  )
20
P( H  D ) 
100


Olasılık
Birleşim
İki ya da daha fazla olayın herhangi birinin ortaya
çıkması olayına denir.
Ayrık Olmayan Olaylarda
A
B
P( A  B)
P ( A  B )  P ( A)  P ( B )  P ( A  B )
Ayrık Olaylarda
A
B
P ( A  B )  P ( A)  P ( B )
Olasılık
Bağımlı ve Bağımsız Olaylar
Bağımsız Olaylar: Birinin ortaya çıkma olasılığının diğerine
bağlı olmadığı olaylara bağımsız olaylar denir.
Bağımlı Olaylar: Birinin ortaya çıkma olasılığının diğerine
bağlı olduğu olaylara bağımlı olaylar denir.
P ( A  B )  P ( A) P ( B )
ise
A ve B olayları bağımsızdır.
P ( A  B )  P ( A) P ( B )
A ve B olayları bağımlıdır.
ise
Olasılık
Koşullu Olasılık
Aynı anda ortaya çıkması olası, ayrık olmayan olaylardan
birinin ortaya çıkması, diğerinin ortaya çıkma olasılığını
değiştirir.
B olayının gerçekleşmiş olması durumunda, A olayının
olasılığına, A olayının B ye bağlı koşullu olasılığı denir ve
P(A \ B) ile gösterilir.
P( A  B)
P( A \ B) 
P( B)
Olasılık
Koşullu Olasılık
Örnek 3:
Bir toplumdan rasgele seçilen 50 yaş üstü 100 kişide
diyabet ve hipertansiyon dağılımı aşağıda verildiğine göre
bu toplumda 50 yaş üstü hipertansiyonu olan bir kişide
diyabet görülmesi olasılığı nedir?
H+
HT
D+
20
15
35
D- T
20 40
45 60
65 100
P( H  ) 
40
 0,40
100
P( D  ) 


P
(
D

H
)
P( D  | H  ) 
P( H  )
35
 0,35
100
P( D   H  ) 
20
 0,20
100
=0,5
OLASILIK DAĞILIMLARI
İstatistiksel çözümlemelerde; değişkenlerin dağılma
özellikleri,
çözümleme
yönteminin
seçimi
ve
sonuçlarının yorumlanmasında önemlidir.
Dağılma özelliklerine OLASILIK DAĞILIMI adı
verilir.
İstatistiksel çözümlemeler belirli bir olasılık
dağılımına dayandırıldığından çözümlemede kullanılan
değişken(ler)in bu olasılık dağılımına uyması gerekir.
OLASILIK DAĞILIMLARI
Herhangi olasılık dağılımı , y = f(x) biçiminde
tanımlanan matematiksel bir fonksiyondur.
 y, x değerlerinin ortaya çıkma sıklığını gösterir.
 f(x), yoğunluk fonksiyonu olarak da
adlandırılır.
OLASILIK DAĞILIMLARI
f(x), x değişkeninin sürekli olması durumunda aşağıdaki
özellikleri taşır.
f(x), x değişkeninin kesikli olması durumunda
aşağıdaki özellikleri taşır.
OLASILIK DAĞILIMLARI
Çok sayıda olasılık dağılımı bulunmaktadır. Bunlar
arasından en sık kullanılanları:
Normal dağılım
Binom dağılımı
Poisson dağılımı
OLASILIK DAĞILIMLARI
Normal (Gauss) Dağılım
İstatistik çözümlemelerde en çok yararlanılan
olasılık dağılımıdır.
µ, kitle ortalamasını ve 2 kitle varyansını
göstermek üzere dağılım (yoğunluk) fonksiyonu,
P( x ) 
1
e
2 
1 x µ 
 

2  
2
OLASILIK DAĞILIMLARI
Normal (Gauss) Dağılım
Dağılım grafiği, aşağıdaki gibidir.

OLASILIK DAĞILIMLARI
Normal (Gauss) Dağılım
• Dağılım ortalamaya göre simetriktir.
• Alanın % 50’si ortalamadan
geçen dikey çizginin sağına,
% 50’si soluna düşer.

• Eğri altında kalan toplam alan bir birim karedir.



f ( x )dx  1
• Aritmetik ortalama, ortanca ve tepe değeri birbirine
eşittir.
OLASILIK DAĞILIMLARI
Normal (Gauss) Dağılım
%68,26
 

 
P (     x     )  0 .6 8 2 6
OLASILIK DAĞILIMLARI
Normal (Gauss) Dağılım
%95,44
  2

  2
P (   2   x    2  )  0 .9 5 4 4
OLASILIK DAĞILIMLARI
Normal (Gauss) Dağılım
%99,74
  3

  3
P (   3   x    3  )  0 .9 9 7 4
OLASILIK DAĞILIMLARI
Normal (Gauss) Dağılım
Ortalamaları farklı, standart sapmaları aynı olan
NORMAL dağılımlar
40
50
60
OLASILIK DAĞILIMLARI
Normal (Gauss) Dağılım
Ortalamaları aynı, standart sapmaları farklı olan
NORMAL dağılımlar
35
40
45
50
55
60
65
70
75
OLASILIK DAĞILIMLARI
Normal (Gauss) Dağılım
Normal dağılımda yığılımlı olasılıklar,
b
P( x  b ) 

f ( x )dx
işlemi ile,

herhangi [a b] aralığına ilişkin olasılık
b
P(a  x  b ) 

f ( x )dx
işlemi ile bulunabilir.
a
Yukarıdaki hesaplamaları yapmak kolay olmadığından ; bu
hesaplamalar için standart normal dağılım yaklaşımından
yararlanılır.
OLASILIK DAĞILIMLARI
Normal (Gauss) Dağılım
Standart Normal Dağılım:
Normal Dağılımın özel bir biçimidir. Normal dağılıma
dayalı hesaplamalarda kullanıcılara kolaylık sağlar.
µ=0 ve =1 dir.
Yoğunluk fonksiyonu aşağıdaki gibidir.
1
P( z ) 
e
2
1 2
 z
2
OLASILIK DAĞILIMLARI
Normal (Gauss) Dağılım
Eğer bir x değişkeninin normal dağıldığı biliniyorsa
z
x

eşitliği ile elde edilen z değerleri
ortalaması 0 ve varyansı 1 olan standart
normal dağılıma uyar.
Dağılımın grafiği aşağıdadır.
  0
OLASILIK DAĞILIMLARI
Normal (Gauss) Dağılım
• Bu özellik, ortalama ve standart sapmanın değerine bağlı
değildir.
• Ortalama ve standart sapma ne olursa olsun x
değişkeninin normal dağılması bu özelliğin geçerliği
için yeterlidir.
• Çeşitli z değerleri için 0 ile z arasında kalan alanı
gösteren z tablosu geliştirilmiştir. Bu tablodan
yararlanarak normal dağılıma dayalı hesaplamalar
yapılabilir.
Standart Normal Dağılım Tablosu
z
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0
0.000
0.004
0.008
0.012
0.016
0.020
0.024
0.028
0.032
0.036
0.1
0.040
0.044
0.048
0.052
0.056
0.060
0.064
0.067
0.071
0.075
0.2
0.079
0.083
0.087
0.091
0.095
0.099
0.103
0.106
0.110
0.114
0.3
0.118
0.122
0.126
0.129
0.133
0.137
0.141
0.144
0.148
0.152
0.4
0.155
0.159
0.163
0.166
0.170
0.174
0.177
0.181
0.184
0.188
0.5
0.191
0.195
0.198
0.202
0.205
0.209
0.212
0.216
0.219
0.222
0.6
0.226
0.229
0.232
0.236
0.239
0.242
0.245
0.249
0.252
0.255
0.7
0.258
0.261
0.264
0.267
0.270
0.273
0.276
0.279
0.282
0.285
0.8
0.288
0.291
0.294
0.297
0.300
0.302
0.305
0.308
0.311
0.313
0.9
0.316
0.319
0.321
0.324
0.326
0.329
0.331
0.334
0.336
0.339
1
0.341
0.344
0.346
0.348
0.351
0.353
0.355
0.358
0.360
0.362
1.1
0.364
0.367
0.369
0.371
0.373
0.375
0.377
0.379
0.381
0.383
1.2
0.385
0.387
0.389
0.391
0.393
0.394
0.396
0.398
0.400
0.401
1.3
0.403
0.405
0.407
0.408
0.410
0.411
0.413
0.415
0.416
0.418
1.4
0.419
0.421
0.422
0.424
0.425
0.426
0.428
0.429
0.431
0.432
1.5
0.433
0.434
0.436
0.437
0.438
0.439
0.441
0.442
0.443
0.444
1.6
0.445
0.446
0.447
0.448
0.449
0.451
0.452
0.453
0.454
0.454
1.7
0.455
0.456
0.457
0.458
0.459
0.460
0.461
0.462
0.462
0.463
1.8
0.464
0.465
0.466
0.466
0.467
0.468
0.469
0.469
0.470
0.471
1.9
0.471
0.472
0.473
0.473
0.474
0.474
0.475
0.476
0.476
0.477
2
0.477
0.478
0.478
0.479
0.479
0.480
0.480
0.481
0.481
0.482
OLASILIK DAĞILIMLARI
Normal (Gauss) Dağılım
Örnek 5:
10000 yetişkin üzerinde yapılan kolesterol tarama testi
sonucunda kolesterol değerlerinin 190 ortalama ve 50 standart
sapma ile normal dağıldığı görülmüştür. Kolesterol normal
sınırlarının 150-200 olduğu bilindiğine göre kaç kişinin
kolesterolü yüksektir?
?
190
200
OLASILIK DAĞILIMLARI
Normal (Gauss) Dağılım
x
Standart Normal Dağılım yaklaşımını ve z 

200  190
 0 . 2 bulunur.
eşitliğini kullanarak z 2 0 0 
50
?
0
0,2
OLASILIK DAĞILIMLARI
Normal (Gauss) Dağılım
Standart Normal Dağılım Tablosu kullanarak z=0,2 değerine
karşılık gelen olasılık değeri:
z
0.0
0,2
1,6
...
1,9
...
0.00
...
0,01
...
0,02
...
0,07932 0,0832 0,0871
0,4452
...
0,4713
...
0,4461
...
0,4719
...
0,4474
...
0,4726
...
0,03
...
0,04
...
0,05
...
0,06
...
0,07
...
0,08
...
0,09
...
...
...
...
...
...
...
...
0,4484
...
0,4732
...
0,4495
...
0,4738
...
0,4505
...
0,4744
...
0,4515
...
0.4750
...
0,4525
...
0,4756
...
0,4535
...
0,4761
...
0,4545
...
0,4747
...
OLASILIK DAĞILIMLARI
0,07932
?
0
0,2
P ( x  200)  P ( z  0 .2 )  0,5  0,07932  0, 42068
Yetişkinlerin %42’sinin kolesterolü yüksektir. Çalışma
10000 kişi üzerinde yapıldığından 0,42068 * 10000 = 4207
kişinin kolesterolü yüksektir.
Download