Document

advertisement
Parametre Tahmini
Ankara doğumlu 1 yaşındaki (12 aylık) çocukların ağırlık ortalaması nedir? Tüm
çocukları gözlemeden bu soruya cevap verilmesi istendiğine, “iyi” bir örnekleme yapıp
çocukların kitlesinden n birimlik bir örnek (n tane çocuk) çeker, bunların ağırlıklarını ölçer ve
gözlenen değerlerin aritmetik ortalamasını alırız diye düşünebiliriz. Ancak, aklımıza hemen
şu soru takılmaktadır. Bizden habersiz başka birisi aynı araştırmayı aynen bizim gibi yapsa
aynı sonucu elde eder mi? Başka birisi, gözlediği değerlerin ortancasını cevap olarak söylerse
ne olur?
Bu derste İstatistiksel Sonuç Çıkarımın iki ana konusu olan Parametre Tahmini ve
Hipotez Testi konularından biri olan Parametre Tahmini konusuna giriş yapacağız. Parametre
tahmini, parametre için nokta tahmin ve parametre için aralık tahmini diye ikiye
ayrılmaktadır.
Bir X rasgele değişkeninin dağılımı f X (.; q), ( q Î Q) olasılık (yoğunluk) fonksiyonu
ile verilsin.  değerine parametre ve Q kümesine parametre kümesi denir. Örneğin, b(1, p)
Bernoulli dağılımında parametre p ve parametre kümesi Q = (0,1)  p   (0,1)  R  dır.
Poisson dağılımında parametre  ve parametre kümesi Q = (0, ¥ )     (0, )  R  dır.
Gamma dağılımında iki tane parametre  ,  bulunmaktadır ve parametre kümesi
  (0, )  (0, )
 ( ,  )    (0, )  (0, )  R 
2
dır. Gamma dağılımının beklenen
değeri  . olup, parametrelerin bir fonksiyonudur. Normal dağılımda da iki tane parametre
bulunmaktadır ve (  ,  2 )    (, )  (0, )  R 2 dır. Bir dağılımda parametre sayısı iki
veya daha çok olduğunda  ‘yı vektör olarak görebiliriz.
Bir X rasgele değişkenin olasılık (yoğunluk) fonksiyonu f X (.; q), ( q Î Q) olmak
üzere, X1 , X 2 ,..., X n ‘ler X ‘in dağılımından alınan n birimlik bir örneklem olsun.
X1 , X 2 ,..., X n ‘ler bağımsız ve her biri X gibi dağılımlı rasgele değişkenlerdir. X1 , X 2 ,..., X n
örnekleminin bir fonksiyonuna (bilinmeyen parametre içermeyen bir fonksiyonuna ) istatistik
dendiğini önceki derste öğrendik.
Nokta Tahmin
Tanım 1 Bir istatistik bilinmeyen bir parametrenin (veya parametrenin bir fonksiyonunun)
belirlenmesi amacıyla kullanıldığında bu istatistiğe tahmin edici denir. Tahmin edicinin aldığı
değere (tahmin edicinin gözlenen değerine ) tahmin denir.
Örnek 1 Bir yaşındaki çocukların ağırlık ortalamasını tahmin etmek amacıyla çocukların
kitlesinden rasgele seçilen 10 birimlik bir örnek için ağırlıklar,
x1 = 9.6 , x2 = 7.7 ,
x6 = 12.4 , x7 = 11.0 ,
x3 = 10.2 ,
x8 = 9.9 ,
x4 = 10.5
,
x9 = 10.6 ,
x5 = 8.2
x10 = 10.9 (kg)
n
olarak gözlenmiş olsun. Örneklem ortalaması olan X n =
å
Xi
i= 1
n
istatistiğini kitle ortalaması
için bir tahmin edici olarak alırsak, çocukların ağırlık ortalamasını
10
å
x10 =
xi
i= 1
10
= 10.1 (kg)
olarak tahmin ederiz.
n
Her zaman örneklem ortalaması X n =
å
Xi
‘yi kitle ortalamasının bir tahmin edicisi
n
olarak alabiliriz. Kitle ortalaması için başka tahmin ediciler olabilir mi? Varsa, bu tahmin
edicilerden hangisi tercih edilecektir? Bir tahmin ediciyi tercih etmede aranan ölçütler veya
özellikler nelerdir?
Bir istatistik olan her hangi bir T ( X1 , X 2 ,..., X n ) tahmin edicisini kısaca T harfi ile de
göstereceğiz.
i= 1
Tanım 2 Bir  ( q Î Q ) parametresi için önerilen bir T tahmin edicisi her q Î Q için
E T   
özelliğine sahipse, bu tahmin ediciye yansız tahmin edici denir.
Tanım 3 Bir  ( q Î Q ) parametresi için önerilen bir T tahmin edicisi için
Yanlılık (T ,  )  E (T )  
değerine T tahmin edicisinin yanlılığı denir.
Örnek 2
Belli bir olgu ile ilgili rasgelelik içeren bir özelliğin ölçülen ( X ) değerinin
n
dağılımı  ortalamalı ve 
2
varyanslı olsun.
å
Xn =
Xi
i= 1
n
örneklem ortalaması ile
n
Sn2 =
å
( X i - X )2
örneklem varyansını  ve  2 ‘yi tahmin etmek için tahmin edici
i= 1
n
olarak kullanabiliriz.
æn
ö
çç å X ÷
÷
n
ö 1 n
çç i= 1 i ÷
1 æ
1 n
÷
ççå X ÷
÷
E ( X n ) = E çç
=
E
=
E
(
X
)
=
÷
÷
å
å m= m
i÷
i
n èç i= 1 ø
n i= 1
n i= 1
çç n ÷
÷
÷
÷
ççè
÷
ø
olmak üzere, X n örneklem ortalaması  kitle ortalaması için yansız bir tahmin edicidir.


2
E ( Sn )  E 




n
( X i  X n )2 

i 1

n
 1  n

1  n
 E   ( X i  X n )2   E    X i2  2 X i X n  ( X n ) 2  
 n  i 1
 n  i 1



n

1  n 2
 E   X i  2 X n  X i  n( X n )2 
n  i 1
i 1


n

1  n 2 2 n
E   X i   X j  X i  n( X n )2 
n  i 1
n j 1
i 1


1  n 2 2 n
E  Xi  
n  
n j 1
i 1
n
(X
i 1
j

X i )  n( X n ) 2 



1 n
2 n
2
  E ( X i )  
n  i 1
n j 1
2
E
(
X
X
)

nE
(
X
)

j i
n 

i 1


1 n
2 n
2
  E ( X i )  
n  i 1
n j 1
 E( X

n
n
i 1
2
X
)

nE
(
X
)
……( E ( X 2 )  Var ( X )  ( E ( X )) 2 )
j i
n 



2
1 n
2
2
2
2
2
2


(



)

n
(



)

n
(
n

1)


n
(
  2 ) 
 


n  i 1
n
n

1
n( 2   2 )  2( 2   2 )  2(n  1)  2   2  n 2 

n
1
  n 2   2 
n
n 1 2


n
olmak üzere, S n2 örneklem varyansı  2 kitle varyansı için yansız bir tahmin edici değildir. Bu
tahmin edicicinin yanlılığı,
n 1 2
1
Yanlılık ( S n2 ,  2 )  E ( S n2 )   2 
  2    2
n
n
dır.

 n
 n

2 
(
X

X
)
( X i  X n )2 


i
n



n

 2
E  i 1
E  i 1
n 1
n

 n 1 









olmak üzere,
n
Sn2- 1 =
olarak tanımlanan S
å
( X i - X )2
i= 1
2
n- 1
n- 1
istatistiği  2 kitle varyansı için yansız bir tahmin edicidir. Sn2- 1
istatistiğine de örneklem varyansı denir. Sn2- 1 ile S n2 örneklem varyanslarından hangisinden
söz edildiği belirtilmediğinde, yani sadece S 2 örneklem varyansı dendiğinde, kitaplarda
genellikle Sn2- 1 kastedilmektedir.
Örnek 3
U ( 0 , ),    ( 0
, düzgün
)
dağılımında  parametresi dağılımın üst sınırını
belirlemektedir. Dağılımın beklenen değeri (ortalaması)  

ve varyansı  2 
2
dır.
2
12
Örneğin   10 olduğunda, X U (0,10) dağılımlı bir X rasgele değişkeni için E ( X )  5 ,
Var ( X )  100 /12 ve olasılık yoğunluk fonksiyonu ile dağılım fonksiyonu,
1
, 0  x  10

f X ( x)  10
 0 ,
d.y
0
x

FX ( x)  P( X  x)  
10
 1
,
x0
, 0  x  10
,
x  10
olup grafikleri,
f ( x)
o
1/10o
x
10
F ( x)
1
x
10
dır.
Hayatımızda ulaşım, yemek, sağlık, banka gibi hizmet gördüğümüz değişik yerlerdeki
kuyruklarda beklediğimiz, yani boşa harcadığımız zaman olmaktadır. İnsanların boşa
harcadıkları zamanın U (0,  ) ,    (0, ) gibi bir düzgün dağılıma sahip olduğu bilinsin.
Kuyruklarda harcanan boş zaman için ortalama değerin, varyansın ve üst sınırın tahmin
edilmesi istensin. Rasgele seçilen 65 kişi için haftalık boşa harcanan zaman,
0.03
0.61
2.37
0.17
2.76
3.55
4.65
0.72
0.41
4.12
1.23
1.45
1.53
3
0.74
2.12
3.53
0.52
1.82
4.58
1.9
2
1.06
3.06
1.74
0.74
4.5
0.93
4.76
3.03
(saat/hafta)
3.12
2.29
4.71
4.7
2.25
4.11
4.85
3.78
0.72
2.71
0.05
1.12
0.13
3.2
1.52
1.34
0.29
2.64
3.36
4.22
4.12
0.72
2.7
3.82
3.39
2.54
3.26
0.46
olarak gözlenmiş olup, bu veriler için histogram
10
8
6
4
2
0
0
0.5
1
1.5
2
2.5
örneklem ortalaması,
65
å
xi
i= 1
x65 =
65
= 2.35
örneklem varyansı,
65
2
s65
=
å
( xi - x10 ) 2
i= 1
65
= 2.0028
65
2
s65
-1 =
å
( xi - x10 )2
i= 1
64
= 2.0341
ve gözlenen en büyük değer,
max x1 , x2 ,..., x65  4.85
dır.
3
3.5
4
4.5
5
2
2
2.11
3.46
1.44
2.39
3.6
U (0,  ) ,     (0, ) dağılımında tahmin etmek istediklerimiz dağılımın ortalaması,
varyansı ve üst sınırı olmak üzere, bunlar

2
2
2 
12

Dağılımın üst sınırı  
dır.  parametresinin bir fonksiyonu olan bu değerleri tahmin etmek için tahmin edici olarak,
n
å
Xn =
Xi
i= 1
n
n
Sn2- 1 =
å
( X i - X )2
i= 1
n- 1
T = max {X1 , X 2 ,..., X n }
istatistiklerini kullanırsak, yukarıdaki veriye dayalı olarak,
x65  2.35
2
s65
1 =2.0341
max x1 , x2 ,..., x65  4.85
tahminlerini elde ederiz.
Kullandığımız tahmin edicilerden X n örneklem ortalaması  

kitle ortalaması için
2
n
yansız bir tahmin edicidir. Sn2- 1 =
å
( X i - X )2
de  2 
2
için yansız bir tahmin edicidir.
12
n- 1
T = max {X1 , X 2 ,..., X n } tahmin edicisi  için yansız mıdır? Önce, T rasgele değişkeninin
dağılımını bulalım. T ‘nin dağılım fonksiyonu,
FT (t )  P(T  t )  P  max  X1, X 2 ,..., X n   t 
i= 1
 P  X1  t , X 2  t ,..., X n  t 
 P  X1  t ) P( X 2  t )...P( X n  t 
n
 t 1   t n
   dx    
 0    
olmak üzere, olasılık yoğunluk fonksiyonu,
fT (t ) 
dır.
n

n
t n 1
, 0  t 

E (T )   t
0
n
n
t
n 1


n t n 1
n
dt  n  t dt  n


 0
 n  1 t 0 n  1
n
n
olmak üzere, T = max {X1 , X 2 ,..., X n } tahmin edicisi  için yansız tahmin edici değildir.
V=
n+ 1
T
n
istatistiği için
E (V ) =
n+ 1
E (T ) = q
n
n+ 1
T istatistiği  için yansız bir tahmin edicidir. Diğer taraftan,
n
E (2 X n )  
olmak üzere, V =
olmak üzere, U  2 X n istatistiği de  için yansız bir tahmin edicidir. Bu iki tahmin ediciden
hangisinin varyansı daha küçüktür?
Var (U )  Var (2 X n )  4Var ( X n )  4 
ve
Var (V )  Var (

E (T )   t
2
0
2
2
12n

2
3n
n 1
n 1 2
n 1 2
T)  (
) Var (T )  (
)  E (T 2 )  ( E (T )) 2 
n
n
n
n
n
t
n 1
dt 
n


 n 0
t
n 1
n t n2
n
dt  n

2
 n  2 t 0 n  2
2
 n
n
 n  
Var (V )  
2 
 
2
2
 n  1   (n  2)(n  1)
 n  2
olmak üzere,
Var (V )  Var (U )
n+ 1
n+ 1
T=
max {X 1 , X 2 ,..., X n } tahmin edicisi yansız ve varyansı, yine yansız
dır. V =
n
n
olan U  2 X n tahmin edicisinin varyansından daha küçüktür. V tahmin edicisinden daha
küçük varyanslı başka yansız bir tahmin edici var mıdır? En küçük varyanslı yansız tahmin
edici nedir? Bu soruların cevaplarını önümüzdeki ders yılında verebileceksiniz.
Tanım 4 Bir  ( q Î Q Ì R ) parametresi için önerilen bir T tahmin edicisi için
HKO(T ,  )  E T   
2
sayısına T tahmin edicisinin Hata Kare Ortalaması denir.
Teorem  ( q Î Q Ì R ) bir parametre ve T bir tahmin edici olmak üzere,
HKO(T ,  )  Var (T )  Yanlılık (T ,  ) 
2
dır.
İspat:
HKO(T ,  )  E T     E T  E (T )  E (T )   
2
2
 E T  E(T )   2E T  E(T )  E(T )     E  E (T )   
2
 E T  E (T )   2  E (T )    E T  E (T )   E  E (T )   
2
2
2
0
 Var (T )  Yanlılık (T ,  ) 
2
Bir tahmin edicinin yansız olması, yansız olmadığında küçük bir yanlılığa sahip
olması, Hata Kare Ortalamasının küçük olması gibi özellikler, tahmin edicilerde aranan
özelliklerden sadece bir kaçıdır. Tahmin edicilerde aranan özellikleri ve belli özelliklere sahip
tahmin edicilerin nasıl elde edileceğini önümüzdeki ders yılında İST202 dersinde
göreceksiniz. Yukarıda örneklem ortalamasını kitle ortalaması için ve örneklem varyansının
da kitle varyansı için bir tahmin olarak kullandık. Genel olarak, örneklem momentleri kitle
momentleri için birer tahmin edici olarak kullanılabilir.
Şimdi, tahmin edicileri elde etme yöntemlerinden biri olan En Çok Olabilirlik
Yöntemine kısaca değineceğiz.
Bir X rasgele değişkenin olasılık (yoğunluk) fonksiyonu f X (.; q), ( q Î Q) olmak
üzere, X1 , X 2 ,..., X n ‘ler X ‘in dağılımından alınan n birimlik bir örneklem olsun.
X1 , X 2 ,..., X n ‘ler bağımsız ve her biri X gibi dağılımlıdır. X1 , X 2 ,..., X n ‘lerin ortak
olasılık (yoğunluk) fonksiyonu,
f X1, X 2 ..., X n ( x1, x2 ,..., xn ; q) = f X1 ( x1; q) f X 2 ( x2 ; q)... f X n ( xn ; q) , ( x1 , x2 ,..., xn ) X
dır. X1 , X 2 ,..., X n örnekleminin gözlenmiş x1 , x2 ,..., xn değerleri için yukarıdaki fonksiyon q
'nın bir fonksiyonu olmaktadır.
L(q) = f X1 ( x1; q) f X 2 ( x2 ; q)... f X n ( xn ; q) , q Î Q
fonksiyonuna Olabilirlik Fonksiyonu denir. Bu fonksiyonu maximum yapan değer
ˆ( x1 , x2 ,..., xn ) olmak üzere, ˆ( X1, X 2 ,..., X n ) istatistiğine  parametresinin En Çok
Olabilirlik Tahmin Edicisi denir.  ‘nın En Çok Olabilirlik Tahmin Edicisi’ni bulmak için
genellikle L(q) yerine ln L(q) fonksiyonu maximize edilir.
Örnek 4 Üstel dağılımın parametresinin En Çok Olabilirlik Tahmin edicisi nedir?
Üstel dağılıma sahip bir X rasgele değişkenin olasılık yoğunluk fonksiyonu,
1 - qx
f X ( x; q) = e
,
q
x> 0
( q Î Q = (0, ¥ ))
olmak üzere, X1 , X 2 ,..., X n ‘ler bu dağılımdan bir örneklem olsun. X1 , X 2 ,..., X n ‘ler
bağımsız ve her biri X gibi dağılımlıdır. X1 , X 2 ,..., X n ‘lerin ortak olasılık (yoğunluk)
fonksiyonu,
f X1, X 2 ..., X n ( x1, x2 ,..., xn ; q) = f X1 ( x1; q) f X 2 ( x2 ; q)... f X n ( xn ; q)
= 1e
q
x1
q
1 - xq2 1 e ... e
q
q
xn
q
n
å
1 e
qn
=
xi
i= 1
q
dır. Olabilirlik fonksiyonu,
n
å
1
qn
L(q) =
xi
- i= 1
e q
ve
n
n
å
1
ln L(q) = ln( n ) q
å
xi
i= 1
= - n ln q -
q
xi
i= 1
q
olmak üzere, bu fonksiyonu maximum yapan  değerini bulmak için  ‘ya göre türev
alınsın.
n
å
d
- n
ln L(q) =
+
dq
q
xi
i= 1
q2
n
2å xi
d2
n
ln L(q) = 2 2
dq
q
i= 1
3
q
olup, birinci türevin sıfıra eşitlenmesiyle,
n
å
x
- n i= 1 i
=0
q
q2
denklemi elde edilir. Bu denklemin çözümü,
n
ˆ( x1 , x2 ,..., xn ) 
ve
x
i
i 1
n
d2
ln L(qˆ( x1 , x2 ,..., xn )) < 0 olmak üzere,
d q2
n
ˆ( X 1 , X 2 ,..., X n ) 
X
i 1
i
n
istatistiği  parametresinin En Çok Olabilirlik Tahmin Edicisi’dir.
Örnek 5 Poisson dağılımın parametresinin En Çok Olabilirlik Tahmin edicisi nedir?
Poisson dağılımına sahip bir X rasgele değişkenin olasılık fonksiyonu,
e- l l x
f X ( x; l ) =
, x = 0,1, 2,... ( l Î Q = (0, ¥ ))
x!
olmak üzere, X1 , X 2 ,..., X n ‘ler bu dağılımdan bir örneklem olsun. X1 , X 2 ,..., X n ‘ler
bağımsız ve her biri X gibi dağılımlıdır. X1 , X 2 ,..., X n ‘lerin ortak olasılık (yoğunluk)
fonksiyonu,
f X1, X 2 ..., X n ( x1, x2 ,..., xn ;l ) = f X1 ( x1;l ) f X 2 ( x2 ;l )... f X n ( xn ;l )
e- l l x1 e- l l x2 e- l l xn
=
...
x1 !
x2 !
xn !
n
e- nl l
=
åi= 1 xi
x1 ! x2 !...xn !
dır. Olabilirlik fonksiyonu,
n
e- nl l
L(l ) =
åi= 1 xi
x1 ! x2 !...xn !
ve
n
ln L(l ) = - nl +
å
xi ln l - ln (x1 ! x2 !...xn !)
i= 1
olmak üzere, bu fonksiyonu maximum yapan  değerini bulmak için
alınsın.
n
å
d
ln L(l ) = - n +
dl
xi
i= 1
l
n
d2
ln L(l ) = dl 2
å
xi
i= 1
l
2
olup, birinci türevin sıfıra eşitlenmesiyle,
n
å
- n+
xi
i= 1
=0
l
denklemi elde edilir. Bu denklemin çözümü,
n
ˆ ( x1 , x2 ,..., xn ) 
ve
x
i 1
i
n
d2
ln L(lˆ( x1 , x2 ,..., xn )) < 0 olmak üzere,
2
dl
 ‘ya göre türev
n
ˆ ( X 1 , X 2 ,..., X n ) 
X
i 1
i
n
istatistiği  parametresinin En Çok Olabilirlik Tahmin Edicisi’dir.
Bir kavşakta günlük trafik kazası sayısının Poisson dağılımına sahip olduğu
bilinmektedir. Rasgele seçilen 10 gün için kaza sayısı,
x1 = 0 , x2 = 3 , x3 = 2 , x4 = 0 , x5 = 4
x6 = 1 , x7 = 2 , x8 = 0 , x9 = 1 , x10 = 1
olarak gözlenmiş olsun.  parametresinin En Çok Olabilirlik Tahmini,
10
̂ = ˆ ( x1 , x2 ,..., x10 ) 
x
i
 1.4
10
dır.  parametresi Poisson dağılımının beklenen değeri olmak üzere, günlük ortalama trafik
kazası sayısını 1.4 olarak tahmin edildiğini söyleyebiliriz.
i 1
Poisson dağılımının varyansı  dır.
n
Sn2- 1 =
å
( X i - X )2
i= 1
n- 1
örneklem varyansı kitle varyansı  için yansız bir tahmin edicidir. Bu tahmin edicinin verdiği
değer,
10
s102 - 1 =
å
10
å
( xi - x10 ) 2
i= 1
10 - 1
=
xi2 - 10 x 2
i= 1
9
=
36 - 10´ 1.42 16.4
=
= 1.822
9
9
dır. Böylece  parametresi için elimizde iki tane rahmin değeri bulunmaktadır. Birisi 1.4
diğeri 1.882 dir. Her ikisi de yansız birer tahmin edici tarafından elde edilmiştir. Tahmin
edicilerden varyansı küçük olan tahmin ediciyi tercih etmemiz gerekir. En Çok Olabilirlik
Tahmin Edici’sinin (örneklem ortalamasının) varyansını biliyoruz.
 n
  Xi
ˆ
Var  ( X 1 , X 2 ,..., X n )  Var  i 1
 n





 

 n


æn
ö
çç å ( X - X ) 2 ÷
÷
÷
çç i= 1 i
÷
2
÷
= ? Bu sorunun
Örneklem varyansının varyansı nedir? Var (S n- 1 ) = Var çç
÷
÷
n- 1
çç
÷
÷
÷
ççè
ø÷
cevabı da önümüzdeki ders yılına kalsın.
Aralık Tahmini
Bir yaşındaki çocukların ağırlıklarının ortalamasını (  kitle ortalamasını) tahmin
n
etmek için X n 
X
i 1
i
örneklem ortalamasını tahmin edici olarak kullanabiliriz. Bu tahmin
n
n
x
i
değeri  için bir nokta tahmindir. Kitle dağılımının, yani
n
çocukların boy uzunluklarının N (  ,  2 ) gibi bir normal dağılıma sahip olması durumunda,
edicinin aldığı xn 
i 1
2
Xn
N ( ,
Z
Xn  
n
)
ve
N (0,1)

n
dır. Ayrıca,
P( z / 2  Z  z1 / 2 )  1  
P( z1 / 2  Z  z1 / 2 )  1  
olmak üzere,
Xn  
P( z1 / 2 

 z1 / 2 )  1  
n

P( X n  z1 / 2
n
   X n  z1 / 2

n
)  1 
yazılabilir. Bu son eşitlik, 1   olasılıkla ( X n  z1 / 2

n
, X n  z1 / 2

n
) aralığı  kitle
ortalamasını (parametresini) kapsar diye okunmaktadır.

( X n  z1 / 2
, X n  z1 / 2

)
n
n
aralığına,  için 1   güven katsayılı güven aralığı denmektedir. Örneğin,
( X n  1.96

, X n  1.96

)
n
n
aralığı  için 1    %95 güven katsayılı ve
( X n  1.645

n
, X n  1.645

n
)
aralığı  için 1    %90 güven katsayılı bir güven aralığıdır. Bu güven aralıklarının
kullanışlı olması için  değerinin bilinmesi gerekir.
Örnek 6
Bir yaşındaki çocukların ağırlıklarının  2  1.5 varyanslı normal dağılıma
( N (  ,  2  1.5) ) sahip olduğu bilinmektedir. Rasgele seçilen 10 birimlik bir örnek için
ağırlıklar,
x1 = 9.6 , x2 = 7.7 , x3 = 10.2 , x4 = 10.5 , x5 = 8.2
x6 = 12.4 , x7 = 11.0 , x8 = 9.9 , x9 = 10.6 , x10 = 10.9 (kg)
olarak ve gözlenmiştir.
10
å
xi
i= 1
x10 =
= 10.1
10
olmak üzere, kitle ortalaması  için 1    %95 güven katsayılı güven aralığı
(10.1  1.96
1.5
1.5
,10.1  1.96
)
10
10
(9.341 , 10.859)
olarak elde edilmektedir.
Kitle dağılımının, yani çocukların boy uzunluklarının dağılımı bilinmiyor olsun. Sonlu
varyanslı olan her kitle dağılımı için Merkezi Limit Teoremi’nden, büyük örneklem
hacimlerinde
 X 

P  n
 t   P(Z  t )
  n

olmak üzere,
X 
P( z1 / 2  n
 z1 / 2 )  1  

n
yazılabilir. Buna göre,
( X n  z1 / 2

, X n  z1 / 2

)
n
n
aralığı  parametresi için 1   güven katsayılı bir güven aralığıdır. Bu güven aralığının
kullanışlı olması için  değerinin bilinmesi gerekir.  2 kitle varyansı bilinmediğinde,
n
Sn2- 1 =
å
( X i - X )2
i= 1
n- 1
örneklem varyansını  “yerine yazabiliriz”. Büyük örneklem hacimlerinde,  kitle
ortalaması için 1   güven katsayılı bir güven aralığı
2
( X n  z1 / 2
Sn 1
n
, X n  z1 / 2
Sn 1
n
)
dır.
Dikkat ettiyseniz, sadece  kitle ortalaması (kitle dağılımının beklenen değeri) için
güven aralığı üzerinde durmaktayız. Kitle oranı da bir anlamda kitle dağılımının beklenen
değeridir. b(1, p) Bernoulli dağılımının beklenen değeri (ortalaması)   p dır. Kitle oranı p
bilinmediğinde, p için bir nokta tahmin edici,
n
Xn 
X
i 1
i
n
ve 1   güven katsayılı bir güven aralığı,
( X n  z1 / 2
Sn 1
, X n  z1 / 2
Sn 1
)
n
n
dır. Bernoulli dağılımından alınan örneklemler için
n
n
i 1
i 1
 X i   X i2
olmak üzere,
n
Sn2- 1 =
å
n
å
( X i - X )2
i= 1
n- 1
=
n
å
X i2 - nX n2
i= 1
n- 1
=
X i - nX n2
i= 1
n- 1
=
nX n - nX n2 nX n (1- X n )
=
n- 1
n- 1
olup, p için 1   güven katsayılı bir güven aralığı,

X n (1  X n )
X n (1  X n ) 
, X n  z1 / 2
 X n  z1 / 2



n

1
n

1


dır.
Örnek 7 Rasgele seçilen 100 öğrenciden 40 tanesinin sigara içtiği gözlenmiştir. Sigara
içenlerin kitledeki oranı p için 1    %95 güven katsayılı bir güven aralığı,

0.40(1  0.40)
0.40(1  0.40) 
, 0.40  1.96
 0.40  1.96

100  1
100  1


(0.3035 , 0.4965
dır.
Download