Olas*l*k Da**l*mlar* ve Kuramsal Da**l**lar

advertisement
HACETTEPE ÜNİVERSİTESİ
TIP FAKÜLTESİ
Dönem 1 Biyoistatistik Uygulama 2
15.05.2017
Olasılık Dağılımları
y = f(x) şeklinde tanımlanan matematiksel fonksiyondur
f(x)
Y
 yoğunluk fonksiyonu
 x değerlerinin ortaya çıkma sıklığını gösterir.
f(x) Fonksiyonunun Özellikleri
x değişkeni sürekli ise
x değişkeni kesikli ise
0  f ( x)  1
0  f ( x)  1
  x  
a xb



f ( x) dx  1
b
 f ( x)  1
a
Normal (Gauss) Dağılım
µ, kitle ortalaması
σ2, kitle varyansı olmak üzere
dağılım (yoğunluk) fonksiyonu
1
P( x) 
e
2
μ
1  x  µ 2
 

2  
Normal Dağılımın Özellikleri
• Dağılım ortalamaya göre simetriktir.
• Eğri altında kalan toplam alan bir birim karedir.


f ( x)dx  1

• Alanın %50’si ortalamadan geçen dikey çizginin
sağına, %50’si soluna düşer.
• Aritmetik ortalama, ortanca ve tepe değeri birbirine
eşittir.
Normal Dağılım
%34.13
%68.26
μ-σ μ μ+σ
P(     x     )  0.6826
Normal Dağılım
%47.72
%95.44
μ-2σ
μ
μ+2σ
P(   2  x    2 )  0.9544
Normal Dağılım
%49.87
%99.74
μ-3σ
μ
μ+3σ
P(   3  x    3 )  0.9974
Normal Dağılım
Ortalamaları farklı standart sapmaları aynı olan
normal dağılımlar
50
60
Normal Dağılım
Ortalamaları aynı, standart sapmaları farklı olan
normal dağılımlar
35
40
45
50
55
60
65
70
75
Normal Dağılım
• Herhangi [a b] aralığına ilişkin olasılık
b
P(a  x  b)   f ( x)dx
a
• Bu hesaplamaları yapmak kolay olmadığından; bu
hesaplamalar için standart normal dağılım
yaklaşımından yararlanılır.
Standart Normal Dağılım
µ=0
σ=1
olan normal dağılıma standart normal
• Yoğunluk fonksiyonu
1 
P( z ) 
e
2
1 2
z
2
Standartlaştırma
Eğer bir x değişkeninin normal dağıldığı biliniyorsa
aşağıdaki eşitlik ile elde edilen z değerleri ortalaması
0 ve varyansı 1 olan standart normal dağılıma uyar.
z
x

μ=0
Örnek:
• 10.000 yetişkin üzerinde yapılan kolesterol tarama
testi sonucunda kolesterol değerlerinin 190
ortalama ve 50 standart sapma ile normal dağıldığı
görülmüştür.
• Kolesterol normal sınırlarının 150 – 200 olduğu
bilindiğine göre kaç kişinin kolesterolü yüksektir?
?
μ=190
z
x

200
200  190

 0.2
50
?
μ=0
0.2
z0.2  0.0793
0.0793
?
μ=0
0.2
z0.2  0.0793
0.0793
?
μ=0
0.2
P( x  200)  P( z  0.2)  0,5  0, 07932  0, 42068
Yetişkinlerin %42’sinin kolesterolü yüksektir.
0,42068 * 10000 = 4207 kişinin kolesterolü yüksektir.
Örnek:
Bir grup hastanın BKİ’nin 22 ortalama ve 16 varyans
ile normal dağıldığı bilindiğine göre
• Ne kadarının BKİ 30’un üzerindedir?
• Ne kadarının BKİ 18’in altındadır?
P( x  30)  ?
x
z

0
z=2
30  22
P( x  30)  P( z 
)  P( z  2)
4
 0.0228
P(x < 18) = ?
x
z

18  22
P( x  18)  P( z 
)  P( z  1)
4
 0,5  0,3413
 0,1587
Örnek:
• Bir doğum kliniğinde son bir yıl içerisinde doğan
1000 bebeğin ağırlıkları, 3100 gr ortalama ve 300 gr
standart sapma ile normal dağılım göstermektedir.
• Doğum ağırlığı 2500 gr’ın altında olan bebek sayısı
nedir?
• Doğum ağrılığı 2500-3500gr arasında olan bebek
sayısı nedir
P(x2500)=?
P(x2500)
P(z  ? )
2500
z
x

P(z  -2 )=?
3100
(µ)
2500  3100

 2
300
P(x2500)=P(z-2)=?
Standart Normal Dağılım Tablosu kullanarak:
P(2  z  0)  0,4772
0,4772
-2
0
P(z  2)  0,5  0,4772  0,0228
Son bir yıl içerisinden doğan bir bebeğin kilosunun 2500 gr’ın
altında olması olasılığı % 2,28’dir.
Doğum ağırlığı 2500 gr’ın altında olan bebek sayısı:
1000 x 0,0228  23 bebek
z
P(2500  x3500)=?
x

3500  3100

 1,33
300
P( -2  z 1,33)
0,4082
0,4772
-2
0
1,33
P( -2  z 1,33)=0,4477+0,4082=0,8854
Bebeklerin %88,54’ünün ağırlığı 2500 gr ile 3500 gr arasında
değişmektedir.
Doğum ağırlığı 2500 gr ile 3500 gr arasında olan bebek sayısı:
1000 x 0,8854
885 bebek.
Örnek:
Türk toplumunun %25’inin obez olduğu bilinmektedir
Türk toplumunda BKİ’nin 23 ortalama ve 5 standart
sapma ile normal dağıldığı bilindiğine göre
Bir kişiye obez diyebilmek için BKİ en az kaç olmalıdır?
P( Z  z )  0,25  z  0,68
z
x

x  23
0,68 
5
x  23  0,68 * 5  26,4
Poisson Dağılımı
e   x
P( x) 
x!
; x  0,1,...
Örnek:
Bir bölgedeki acil servis çağrı merkezine gelen
çağrıların günde ortalama 3 çağrı ile poisson dağılımı
gösterdiği bilinmektedir.
• Günde en çok 3 çağrı gelmesi olasılığı nedir?
• Günde 2’den fazla çağrı gelmesi olasılığı nedir?
• Hiç çağrı gelmemesi olasılığı nedir?
En çok 3 çağrı gelmesi olasılığı nedir?
P(x Ј 3) = P(x = 0) + P(x = 1) + P(x = 2) + P(x = 3)
e- l l x e- 3 3 x
P( x ) =
=
x!
x!
e- 3 30
P(x = 0) =
= 0.0498
0!
e- 3 31
P(x = 1) =
= 0.1494
1!
e- 3 32
P(x = 2) =
= 0.224
2!
e- 3 33
P(x = 3) =
= 0.224
3!
P(x Ј 3) = 0.0498 + 0.1494 + 0.224 + 0.224 = 0.6472
Günde 2’den fazla çağrı gelmesi olasılığı nedir?
e   x
P( x) 
x!
; x  0,1,...
P( x  2)  P(3)  P(4)  ...
e 3 3x
P( x  2)  
 1  P( x  2)
x!
x 3

P(x > 2) = 1 - (0.0498 + 0.1494 + 0.224) = 0.5768
Hiç çağrı gelmemesi olasılığı nedir?
e- l l x e- 3 3 x
P( x ) =
=
x!
x!
e- 3 30
P(x = 0) =
= 0.0498
0!
Örnek:
Yapılan bir araştırmaya göre bir kliniğe başvuran
hastaların %70'inin doktorlarını görmek için en az 15
dakika beklemek zorunda kaldığını göstermektedir.
Bu klinikte 10 hasta olması durumunda,
• 3 hastanın 15 dakikadır doktorunu bekleme olasılığı
nedir?
• 8’den çok hastanın 15 dakikadır doktorunu bekleme
olasılığı nedir?
3 hastanın 15 dakikadır doktorunu bekleme olasılığı
жnц
x
n- x
ч
P(X) = зз ч
p
(1
p
)
ч
зиx ш
ч
ж10ч
ц
x
10- x
з
P(X) = з ч
0.70
(1
0.70)
ч
зиx ч
ш
ж10ц
3
10- 3
ч
P(X=3) = зз ч
0.70
(1
0.70)
= 0.009
зи3 ч
ч
ш
8’den fazla hastanın 15 dakikadır doktorunu bekleme olasılığı
P(X>8) = P(X=9)+P(X=10)
ж10ц
ж10ц
9
1
10
0
ч
з
зз ч
ч
= з ч
0,70
(1
0,70)
+
0,70
(1
0,70)
ч
ч
зи9 ш
з10ш
ч
ч
и
= 0,121 + 0,028 = 0,149
Örneklem Dağılışları
P
e
r
c
e
n
t
n=10
n=25
n=100
P
e
r
c
e
n
t
n=10
n=25
n=100
Örnek:
Miyokard enfaktüs tanısı konmuş erkeklerde kolesterol
düzeyinin ortalaması 240 mg/dl standart sapması 40
mg/dl olan bir normal dağılıma uyduğu biliniyorsa, bu
kitleden çekilecek 100 erkeğin kolesterol değerlerinin
ortalamasının 250 mg/dl’den büyük olması olasılığı
nedir?
P ( x  250)  ?
x   250  240
z

 2,5
 / n 40 / 100
P ( z  2,5)  0.5  0, 4938  0, 0062
100 genişliğindeki bir örneklemin ortalamasının 250
mg/dl’den daha büyük olması olasılığı %0,62’dir.
Örneklem genişliği 16 olsaydı:
P ( x  250)  ?
x   250  240
z

1
 / n 40 / 16
P ( z  1)  0.5  0,3413  0,1587
16 genişliğindeki bir örneklem ortalamasının 250
mg/dl’den daha büyük olması olasılığı yaklaşık olarak
%16’dır. Yani 100 genişliğindeki bir örneklemden böyle
bir sonucun elde edilmesinden daha olası bir
durumdur.
Örnek:
Bir araştırmacı sağlıklı erkeklerin ortalama serum
kolesterol düzeyini tahmin etmek istiyor.
Rastgele seçilen 100 erkeğin serum kolesterol düzeyi
ortalaması 160 ve standart sapması 30 mg/dl'dir.
Buna göre %95 güven aralığı,
s
s
xi  t( n1; )
   xi  t( n1; )
n
n
30
30
160 - 1.98
Ј mЈ 160 + 1.98
100
100
154.06    165.94
100 yerine 36 erkek olsaydı
Buna göre %95 güven aralığı,
s
s
xi  t( n1; )
   xi  t( n1; )
n
n
30
30
160 - 1.98
Ј mЈ 160 + 1.98
36
36
150.1    169.9
Buna göre %95 güven aralığı,
30
30
160 - 1.66
Ј mЈ 160 + 1.66
36
36
152.7    168.3
Örnek:
Bir araştırmacı elli yaşın üzerindeki kadınlarda
osteoporoz prevalansını tahmin etmek istiyor.
Rasgele olarak seçilen 100 kadından 15’i osteoporoz
tanısı aldığına göre kadınlarda osteoporoz oranı için
%95 güven aralığı nedir?
15
p
 0.15
100
Sp 
p(1  p)
0.15x0.85

 0.036
n
100
%95 güven aralığı
p  t ( n1; ) S p  P  p  t ( n1; )S p
0.15  1.98  0.036  P  0.15  1.98  0.036
0.08  P  0.22
%90 güven aralığı
0.15  1.66  0.036  P  0.15  1.66  0.036
0.09  P  0.21
Download