OLASILIK ve OLASILIK DAĞILIMLARI Olasılık Sonlu sayıda yinelenebilen bir denemede, olası sonuçların herhangi birinin ortaya çıkma (elde edilme) şansı ilgili sonucun OLASILIĞI olarak adlandırılır Olasılık P( ) simgesi ile gösterilir. ( ) içinde olasılığın hangi sonuca ait olduğu belirtilir. P ( x1 ), P ( A), P ( x 1) gibi Olasılık Olasılık, ilgilenilen sonucun oransal sıklığıdır. Bir A denemesine ilişkin olası sonuçlar, x , x , ......, x 1 2 k Her sonuca ilişkin tekrar sayıları m , m , ......, m 1 olduğunda 2 k Olasılık P ( x1 ) m1 k m i i 1 P ( x2 ) k P( x m2 k m i i )1 i 1 i 1 ........................... P ( xk ) 0 P ( xi ) 1 mk k m i 1 i Olasılık Örnek 1: Bir onkoloji kliniğine başvuran göğüs kanseri tanısı konulmuş 120 hastanın evrelere göre dağılımı aşağıdadır. Sayı 75 (m1) Evre E1 (X1) E2 (X2) E3 (X3) E4 (X4) % 62,5 25 (m2) 15 (m3) 5 (m 4 ) 20,8 12,5 4,2 120 100 Toplam Kliniğe yeni başvuran bir hastanın 1. evrede olması olasılığı P ( x1 ) m1 75 0 ,625 120 4 m i 1 i Olasılık Örneklem Uzayı Bir olayın olası tüm sonuçlarının bulunduğu kümeye denir. Bir Sonucun Tümleyeni Kendisi dışındaki diğer sonuçların tümüne, ilgili sonucun tümleyeni denir. P(A ) 1 P(A) P(A) P(A ) 1 Olasılık Yığılımlı Olasılık: P(x A) n Olasılıklarına yığılımlı olasılık denir. k m i olmak üzere i 1 P ( x x1) m 1 / n P(x x2) m 2 /n P (x x3) m 3 / n ........................... P (x xk) m k / n P ( x x1) m 1 / n ise P ( x x 2 ) ( m 1 m 2 ) / n P ( x x3) (m 1 m 2 m 3) / n ........................... P (x xk) 1 Olasılık Olasılık Yığılımlı Olasılık: Örnek 1(devam): Evre E1 (X1) E2 (X2) E3 (X3) E4 (X4) Sayı 75 (m1) % 62,5 120 20,8 12,5 4,2 100 25 (m2) 15 (m3) 5 (m 4 ) Toplam Kliniğe yeni başvuran bir hastanın en çok 2. evrede olması olasılığı P ( x x2 ) m1 m 2 4 m i 1 i 75 25 0 ,833 120 Olasılık Ayrık Olaylar Aynı anda ortaya çıkması olası olmayan olaylara denir. A B P( A B) 0 P( A B) P( A) P( B) Olasılık Kesişim İki ya da daha fazla ayrık olmayan olayın bir arada ortaya çıkması olayına denir. A B P( A B) Olasılık Örnek 2: Bir toplumdan rasgele seçilen 50 yaş üstü 100 kişide diyabet ve hipertansiyon dağılımı aşağıda verilmiştir. H+ HT D+ 20 15 35 D- T 20 40 45 60 65 100 H+ D+ P( H D ) 20 P( H D ) 100 Olasılık Birleşim İki ya da daha fazla olayın herhangi birinin ortaya çıkması olayına denir. Ayrık Olmayan Olaylarda A B P( A B) P ( A B ) P ( A) P ( B ) P ( A B ) Ayrık Olaylarda A B P ( A B ) P ( A) P ( B ) Olasılık Bağımlı ve Bağımsız Olaylar Bağımsız Olaylar: Birinin ortaya çıkma olasılığının diğerine bağlı olmadığı olaylara bağımsız olaylar denir. Bağımlı Olaylar: Birinin ortaya çıkma olasılığının diğerine bağlı olduğu olaylara bağımlı olaylar denir. P ( A B ) P ( A) P ( B ) ise A ve B olayları bağımsızdır. P ( A B ) P ( A) P ( B ) A ve B olayları bağımlıdır. ise Olasılık Koşullu Olasılık Aynı anda ortaya çıkması olası, ayrık olmayan olaylardan birinin ortaya çıkması, diğerinin ortaya çıkma olasılığını değiştirir. B olayının gerçekleşmiş olması durumunda, A olayının olasılığına, A olayının B ye bağlı koşullu olasılığı denir ve P(A \ B) ile gösterilir. P( A B) P( A \ B) P( B) Olasılık Koşullu Olasılık Örnek 3: Bir toplumdan rasgele seçilen 50 yaş üstü 100 kişide diyabet ve hipertansiyon dağılımı aşağıda verildiğine göre bu toplumda 50 yaş üstü hipertansiyonu olan bir kişide diyabet görülmesi olasılığı nedir? H+ HT D+ 20 15 35 D- T 20 40 45 60 65 100 P( H ) 40 0,40 100 P( D ) P ( D H ) P( D | H ) P( H ) 35 0,35 100 P( D H ) 20 0,20 100 =0,5 OLASILIK DAĞILIMLARI İstatistiksel çözümlemelerde; değişkenlerin dağılma özellikleri, çözümleme yönteminin seçimi ve sonuçlarının yorumlanmasında önemlidir. Dağılma özelliklerine OLASILIK DAĞILIMI adı verilir. İstatistiksel çözümlemeler belirli bir olasılık dağılımına dayandırıldığından çözümlemede kullanılan değişken(ler)in bu olasılık dağılımına uyması gerekir. OLASILIK DAĞILIMLARI Herhangi olasılık dağılımı , y = f(x) biçiminde tanımlanan matematiksel bir fonksiyondur. y, x değerlerinin ortaya çıkma sıklığını gösterir. f(x), yoğunluk fonksiyonu olarak da adlandırılır. OLASILIK DAĞILIMLARI f(x), x değişkeninin sürekli olması durumunda aşağıdaki özellikleri taşır. f(x), x değişkeninin kesikli olması durumunda aşağıdaki özellikleri taşır. OLASILIK DAĞILIMLARI Çok sayıda olasılık dağılımı bulunmaktadır. Bunlar arasından en sık kullanılanları: Normal dağılım Binom dağılımı Poisson dağılımı OLASILIK DAĞILIMLARI Normal (Gauss) Dağılım İstatistik çözümlemelerde en çok yararlanılan olasılık dağılımıdır. µ, kitle ortalamasını ve 2 kitle varyansını göstermek üzere dağılım (yoğunluk) fonksiyonu, P( x ) 1 e 2 1 x µ 2 2 OLASILIK DAĞILIMLARI Normal (Gauss) Dağılım Dağılım grafiği, aşağıdaki gibidir. OLASILIK DAĞILIMLARI Normal (Gauss) Dağılım • Dağılım ortalamaya göre simetriktir. • Alanın % 50’si ortalamadan geçen dikey çizginin sağına, % 50’si soluna düşer. • Eğri altında kalan toplam alan bir birim karedir. f ( x )dx 1 • Aritmetik ortalama, ortanca ve tepe değeri birbirine eşittir. OLASILIK DAĞILIMLARI Normal (Gauss) Dağılım %68,26 P ( x ) 0 .6 8 2 6 OLASILIK DAĞILIMLARI Normal (Gauss) Dağılım %95,44 2 2 P ( 2 x 2 ) 0 .9 5 4 4 OLASILIK DAĞILIMLARI Normal (Gauss) Dağılım %99,74 3 3 P ( 3 x 3 ) 0 .9 9 7 4 OLASILIK DAĞILIMLARI Normal (Gauss) Dağılım Ortalamaları farklı, standart sapmaları aynı olan NORMAL dağılımlar 40 50 60 OLASILIK DAĞILIMLARI Normal (Gauss) Dağılım Ortalamaları aynı, standart sapmaları farklı olan NORMAL dağılımlar 35 40 45 50 55 60 65 70 75 OLASILIK DAĞILIMLARI Normal (Gauss) Dağılım Normal dağılımda yığılımlı olasılıklar, b P( x b ) f ( x )dx işlemi ile, herhangi [a b] aralığına ilişkin olasılık b P(a x b ) f ( x )dx işlemi ile bulunabilir. a Yukarıdaki hesaplamaları yapmak kolay olmadığından ; bu hesaplamalar için standart normal dağılım yaklaşımından yararlanılır. OLASILIK DAĞILIMLARI Normal (Gauss) Dağılım Standart Normal Dağılım: Normal Dağılımın özel bir biçimidir. Normal dağılıma dayalı hesaplamalarda kullanıcılara kolaylık sağlar. µ=0 ve =1 dir. Yoğunluk fonksiyonu aşağıdaki gibidir. 1 P( z ) e 2 1 2 z 2 OLASILIK DAĞILIMLARI Normal (Gauss) Dağılım Eğer bir x değişkeninin normal dağıldığı biliniyorsa z x eşitliği ile elde edilen z değerleri ortalaması 0 ve varyansı 1 olan standart normal dağılıma uyar. Dağılımın grafiği aşağıdadır. 0 OLASILIK DAĞILIMLARI Normal (Gauss) Dağılım • Bu özellik, ortalama ve standart sapmanın değerine bağlı değildir. • Ortalama ve standart sapma ne olursa olsun x değişkeninin normal dağılması bu özelliğin geçerliği için yeterlidir. • Çeşitli z değerleri için 0 ile z arasında kalan alanı gösteren z tablosu geliştirilmiştir. Bu tablodan yararlanarak normal dağılıma dayalı hesaplamalar yapılabilir. Standart Normal Dağılım Tablosu z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0 0.000 0.004 0.008 0.012 0.016 0.020 0.024 0.028 0.032 0.036 0.1 0.040 0.044 0.048 0.052 0.056 0.060 0.064 0.067 0.071 0.075 0.2 0.079 0.083 0.087 0.091 0.095 0.099 0.103 0.106 0.110 0.114 0.3 0.118 0.122 0.126 0.129 0.133 0.137 0.141 0.144 0.148 0.152 0.4 0.155 0.159 0.163 0.166 0.170 0.174 0.177 0.181 0.184 0.188 0.5 0.191 0.195 0.198 0.202 0.205 0.209 0.212 0.216 0.219 0.222 0.6 0.226 0.229 0.232 0.236 0.239 0.242 0.245 0.249 0.252 0.255 0.7 0.258 0.261 0.264 0.267 0.270 0.273 0.276 0.279 0.282 0.285 0.8 0.288 0.291 0.294 0.297 0.300 0.302 0.305 0.308 0.311 0.313 0.9 0.316 0.319 0.321 0.324 0.326 0.329 0.331 0.334 0.336 0.339 1 0.341 0.344 0.346 0.348 0.351 0.353 0.355 0.358 0.360 0.362 1.1 0.364 0.367 0.369 0.371 0.373 0.375 0.377 0.379 0.381 0.383 1.2 0.385 0.387 0.389 0.391 0.393 0.394 0.396 0.398 0.400 0.401 1.3 0.403 0.405 0.407 0.408 0.410 0.411 0.413 0.415 0.416 0.418 1.4 0.419 0.421 0.422 0.424 0.425 0.426 0.428 0.429 0.431 0.432 1.5 0.433 0.434 0.436 0.437 0.438 0.439 0.441 0.442 0.443 0.444 1.6 0.445 0.446 0.447 0.448 0.449 0.451 0.452 0.453 0.454 0.454 1.7 0.455 0.456 0.457 0.458 0.459 0.460 0.461 0.462 0.462 0.463 1.8 0.464 0.465 0.466 0.466 0.467 0.468 0.469 0.469 0.470 0.471 1.9 0.471 0.472 0.473 0.473 0.474 0.474 0.475 0.476 0.476 0.477 2 0.477 0.478 0.478 0.479 0.479 0.480 0.480 0.481 0.481 0.482 OLASILIK DAĞILIMLARI Normal (Gauss) Dağılım Örnek 5: 10000 yetişkin üzerinde yapılan kolesterol tarama testi sonucunda kolesterol değerlerinin 190 ortalama ve 50 standart sapma ile normal dağıldığı görülmüştür. Kolesterol normal sınırlarının 150-200 olduğu bilindiğine göre kaç kişinin kolesterolü yüksektir? ? 190 200 OLASILIK DAĞILIMLARI Normal (Gauss) Dağılım x Standart Normal Dağılım yaklaşımını ve z 200 190 0 . 2 bulunur. eşitliğini kullanarak z 2 0 0 50 ? 0 0,2 OLASILIK DAĞILIMLARI Normal (Gauss) Dağılım Standart Normal Dağılım Tablosu kullanarak z=0,2 değerine karşılık gelen olasılık değeri: z 0.0 0,2 1,6 ... 1,9 ... 0.00 ... 0,01 ... 0,02 ... 0,07932 0,0832 0,0871 0,4452 ... 0,4713 ... 0,4461 ... 0,4719 ... 0,4474 ... 0,4726 ... 0,03 ... 0,04 ... 0,05 ... 0,06 ... 0,07 ... 0,08 ... 0,09 ... ... ... ... ... ... ... ... 0,4484 ... 0,4732 ... 0,4495 ... 0,4738 ... 0,4505 ... 0,4744 ... 0,4515 ... 0.4750 ... 0,4525 ... 0,4756 ... 0,4535 ... 0,4761 ... 0,4545 ... 0,4747 ... OLASILIK DAĞILIMLARI 0,07932 ? 0 0,2 P ( x 200) P ( z 0 .2 ) 0,5 0,07932 0, 42068 Yetişkinlerin %42’sinin kolesterolü yüksektir. Çalışma 10000 kişi üzerinde yapıldığından 0,42068 * 10000 = 4207 kişinin kolesterolü yüksektir.