HACETTEPE ÜNİVERSİTESİ TIP FAKÜLTESİ Dönem 1 Biyoistatistik Uygulama 2 15.05.2017 Olasılık Dağılımları y = f(x) şeklinde tanımlanan matematiksel fonksiyondur f(x) Y yoğunluk fonksiyonu x değerlerinin ortaya çıkma sıklığını gösterir. f(x) Fonksiyonunun Özellikleri x değişkeni sürekli ise x değişkeni kesikli ise 0 f ( x) 1 0 f ( x) 1 x a xb f ( x) dx 1 b f ( x) 1 a Normal (Gauss) Dağılım µ, kitle ortalaması σ2, kitle varyansı olmak üzere dağılım (yoğunluk) fonksiyonu 1 P( x) e 2 μ 1 x µ 2 2 Normal Dağılımın Özellikleri • Dağılım ortalamaya göre simetriktir. • Eğri altında kalan toplam alan bir birim karedir. f ( x)dx 1 • Alanın %50’si ortalamadan geçen dikey çizginin sağına, %50’si soluna düşer. • Aritmetik ortalama, ortanca ve tepe değeri birbirine eşittir. Normal Dağılım %34.13 %68.26 μ-σ μ μ+σ P( x ) 0.6826 Normal Dağılım %47.72 %95.44 μ-2σ μ μ+2σ P( 2 x 2 ) 0.9544 Normal Dağılım %49.87 %99.74 μ-3σ μ μ+3σ P( 3 x 3 ) 0.9974 Normal Dağılım Ortalamaları farklı standart sapmaları aynı olan normal dağılımlar 50 60 Normal Dağılım Ortalamaları aynı, standart sapmaları farklı olan normal dağılımlar 35 40 45 50 55 60 65 70 75 Normal Dağılım • Herhangi [a b] aralığına ilişkin olasılık b P(a x b) f ( x)dx a • Bu hesaplamaları yapmak kolay olmadığından; bu hesaplamalar için standart normal dağılım yaklaşımından yararlanılır. Standart Normal Dağılım µ=0 σ=1 olan normal dağılıma standart normal • Yoğunluk fonksiyonu 1 P( z ) e 2 1 2 z 2 Standartlaştırma Eğer bir x değişkeninin normal dağıldığı biliniyorsa aşağıdaki eşitlik ile elde edilen z değerleri ortalaması 0 ve varyansı 1 olan standart normal dağılıma uyar. z x μ=0 Örnek: • 10.000 yetişkin üzerinde yapılan kolesterol tarama testi sonucunda kolesterol değerlerinin 190 ortalama ve 50 standart sapma ile normal dağıldığı görülmüştür. • Kolesterol normal sınırlarının 150 – 200 olduğu bilindiğine göre kaç kişinin kolesterolü yüksektir? ? μ=190 z x 200 200 190 0.2 50 ? μ=0 0.2 z0.2 0.0793 0.0793 ? μ=0 0.2 z0.2 0.0793 0.0793 ? μ=0 0.2 P( x 200) P( z 0.2) 0,5 0, 07932 0, 42068 Yetişkinlerin %42’sinin kolesterolü yüksektir. 0,42068 * 10000 = 4207 kişinin kolesterolü yüksektir. Örnek: Bir grup hastanın BKİ’nin 22 ortalama ve 16 varyans ile normal dağıldığı bilindiğine göre • Ne kadarının BKİ 30’un üzerindedir? • Ne kadarının BKİ 18’in altındadır? P( x 30) ? x z 0 z=2 30 22 P( x 30) P( z ) P( z 2) 4 0.0228 P(x < 18) = ? x z 18 22 P( x 18) P( z ) P( z 1) 4 0,5 0,3413 0,1587 Örnek: • Bir doğum kliniğinde son bir yıl içerisinde doğan 1000 bebeğin ağırlıkları, 3100 gr ortalama ve 300 gr standart sapma ile normal dağılım göstermektedir. • Doğum ağırlığı 2500 gr’ın altında olan bebek sayısı nedir? • Doğum ağrılığı 2500-3500gr arasında olan bebek sayısı nedir P(x2500)=? P(x2500) P(z ? ) 2500 z x P(z -2 )=? 3100 (µ) 2500 3100 2 300 P(x2500)=P(z-2)=? Standart Normal Dağılım Tablosu kullanarak: P(2 z 0) 0,4772 0,4772 -2 0 P(z 2) 0,5 0,4772 0,0228 Son bir yıl içerisinden doğan bir bebeğin kilosunun 2500 gr’ın altında olması olasılığı % 2,28’dir. Doğum ağırlığı 2500 gr’ın altında olan bebek sayısı: 1000 x 0,0228 23 bebek z P(2500 x3500)=? x 3500 3100 1,33 300 P( -2 z 1,33) 0,4082 0,4772 -2 0 1,33 P( -2 z 1,33)=0,4477+0,4082=0,8854 Bebeklerin %88,54’ünün ağırlığı 2500 gr ile 3500 gr arasında değişmektedir. Doğum ağırlığı 2500 gr ile 3500 gr arasında olan bebek sayısı: 1000 x 0,8854 885 bebek. Örnek: Türk toplumunun %25’inin obez olduğu bilinmektedir Türk toplumunda BKİ’nin 23 ortalama ve 5 standart sapma ile normal dağıldığı bilindiğine göre Bir kişiye obez diyebilmek için BKİ en az kaç olmalıdır? P( Z z ) 0,25 z 0,68 z x x 23 0,68 5 x 23 0,68 * 5 26,4 Poisson Dağılımı e x P( x) x! ; x 0,1,... Örnek: Bir bölgedeki acil servis çağrı merkezine gelen çağrıların günde ortalama 3 çağrı ile poisson dağılımı gösterdiği bilinmektedir. • Günde en çok 3 çağrı gelmesi olasılığı nedir? • Günde 2’den fazla çağrı gelmesi olasılığı nedir? • Hiç çağrı gelmemesi olasılığı nedir? En çok 3 çağrı gelmesi olasılığı nedir? P(x Ј 3) = P(x = 0) + P(x = 1) + P(x = 2) + P(x = 3) e- l l x e- 3 3 x P( x ) = = x! x! e- 3 30 P(x = 0) = = 0.0498 0! e- 3 31 P(x = 1) = = 0.1494 1! e- 3 32 P(x = 2) = = 0.224 2! e- 3 33 P(x = 3) = = 0.224 3! P(x Ј 3) = 0.0498 + 0.1494 + 0.224 + 0.224 = 0.6472 Günde 2’den fazla çağrı gelmesi olasılığı nedir? e x P( x) x! ; x 0,1,... P( x 2) P(3) P(4) ... e 3 3x P( x 2) 1 P( x 2) x! x 3 P(x > 2) = 1 - (0.0498 + 0.1494 + 0.224) = 0.5768 Hiç çağrı gelmemesi olasılığı nedir? e- l l x e- 3 3 x P( x ) = = x! x! e- 3 30 P(x = 0) = = 0.0498 0! Örnek: Yapılan bir araştırmaya göre bir kliniğe başvuran hastaların %70'inin doktorlarını görmek için en az 15 dakika beklemek zorunda kaldığını göstermektedir. Bu klinikte 10 hasta olması durumunda, • 3 hastanın 15 dakikadır doktorunu bekleme olasılığı nedir? • 8’den çok hastanın 15 dakikadır doktorunu bekleme olasılığı nedir? 3 hastanın 15 dakikadır doktorunu bekleme olasılığı жnц x n- x ч P(X) = зз ч p (1 p ) ч зиx ш ч ж10ч ц x 10- x з P(X) = з ч 0.70 (1 0.70) ч зиx ч ш ж10ц 3 10- 3 ч P(X=3) = зз ч 0.70 (1 0.70) = 0.009 зи3 ч ч ш 8’den fazla hastanın 15 dakikadır doktorunu bekleme olasılığı P(X>8) = P(X=9)+P(X=10) ж10ц ж10ц 9 1 10 0 ч з зз ч ч = з ч 0,70 (1 0,70) + 0,70 (1 0,70) ч ч зи9 ш з10ш ч ч и = 0,121 + 0,028 = 0,149 Örneklem Dağılışları P e r c e n t n=10 n=25 n=100 P e r c e n t n=10 n=25 n=100 Örnek: Miyokard enfaktüs tanısı konmuş erkeklerde kolesterol düzeyinin ortalaması 240 mg/dl standart sapması 40 mg/dl olan bir normal dağılıma uyduğu biliniyorsa, bu kitleden çekilecek 100 erkeğin kolesterol değerlerinin ortalamasının 250 mg/dl’den büyük olması olasılığı nedir? P ( x 250) ? x 250 240 z 2,5 / n 40 / 100 P ( z 2,5) 0.5 0, 4938 0, 0062 100 genişliğindeki bir örneklemin ortalamasının 250 mg/dl’den daha büyük olması olasılığı %0,62’dir. Örneklem genişliği 16 olsaydı: P ( x 250) ? x 250 240 z 1 / n 40 / 16 P ( z 1) 0.5 0,3413 0,1587 16 genişliğindeki bir örneklem ortalamasının 250 mg/dl’den daha büyük olması olasılığı yaklaşık olarak %16’dır. Yani 100 genişliğindeki bir örneklemden böyle bir sonucun elde edilmesinden daha olası bir durumdur. Örnek: Bir araştırmacı sağlıklı erkeklerin ortalama serum kolesterol düzeyini tahmin etmek istiyor. Rastgele seçilen 100 erkeğin serum kolesterol düzeyi ortalaması 160 ve standart sapması 30 mg/dl'dir. Buna göre %95 güven aralığı, s s xi t( n1; ) xi t( n1; ) n n 30 30 160 - 1.98 Ј mЈ 160 + 1.98 100 100 154.06 165.94 100 yerine 36 erkek olsaydı Buna göre %95 güven aralığı, s s xi t( n1; ) xi t( n1; ) n n 30 30 160 - 1.98 Ј mЈ 160 + 1.98 36 36 150.1 169.9 Buna göre %95 güven aralığı, 30 30 160 - 1.66 Ј mЈ 160 + 1.66 36 36 152.7 168.3 Örnek: Bir araştırmacı elli yaşın üzerindeki kadınlarda osteoporoz prevalansını tahmin etmek istiyor. Rasgele olarak seçilen 100 kadından 15’i osteoporoz tanısı aldığına göre kadınlarda osteoporoz oranı için %95 güven aralığı nedir? 15 p 0.15 100 Sp p(1 p) 0.15x0.85 0.036 n 100 %95 güven aralığı p t ( n1; ) S p P p t ( n1; )S p 0.15 1.98 0.036 P 0.15 1.98 0.036 0.08 P 0.22 %90 güven aralığı 0.15 1.66 0.036 P 0.15 1.66 0.036 0.09 P 0.21