Prof. Dr. Halim Özdemir Yrd. Doç. Dr. Nesrin güler

advertisement
BÖLÜM III
ÖRNEKLEME DAĞILIMLARI VE TAHMİN ETME
3.1.Giriş
em
ir
Daha önce bahsettiğimiz gibi, istatistiğin en önemli problemlerinden biri örneklemlerden
bulunan sonuçları kitleye genelleştirmektir. Bu bölümde bu genelleştirmenin nasıl yapıldığını
göreceğiz, şöyle ki örneklem istatistiği kullanarak bilinmeyen kitle parametrelerinin nasıl
tahmin edileceği hesaplanacaktır.
er
isteyebiliriz.
gü
l
zd
Örnek: Bir X rastgele değişkeni, μ ortalaması ve  2 varyansı ile bir normal yoğunlukla
tanımlanırsa, bir x1 , x2 ,..., xN rastgele örneklemini kullanarak μ ve  2 yi tahmin etmeyi
rin
im
Ö
Örnek: Kitle, belli bir üniversitedeki öğrenciler ise ve biz öğrencilerin ortalama boy uzunluğu
µ’yü öğrenmek istediğimizde bir örnekleme dayanarak karar vereceğiz. Bu nedenle µ’yü tam
olarak bilemeyiz. Yapabileceğimiz en iyi yol hacmi N olan bir örneklemden µ’yü tahmin
etmektir.
es
al
Tanım 1. Bir istatistiğin olasılık dağılımına örnekleme dağılımı denir.
N
H
Örneklem ortalaması X , kitle ortalaması µ’yü tahmin ederse, biliyoruz ki N artarken µ ile
ilgili kesin olmama yargımız kesinliğe yaklaşacaktır. Örneklem kitlenin tümünü kapsadığında
X   olacaktır. Ayrıca bir istatistiğin beklenen değeri kitle parametresine eşit olabilir.
.D
r.
.D
r.
Örneğin, ( X )   ' dür. Daha sonra göreceğimiz gibi her tahmin edicinin beklenen değeri
tahmin edilen parametreye eşit olmayabilir.
oç
D
Pr
of
Tanım 2. Bir kitle parametresini tahmin etmek için kitle yerine, örneklemin kullanılmasından
oluşan hataya örnekleme hatası denir.
3.2 Örneklem Ortalaması ve Varyansın Bazı Özellikleri
d.
Örneklem ortalaması ve örneklem varyansı istatistikleri, matematiksel özelliklerinden dolayı
başka çalışmalar için özellikle önem taşır. X1 , X 2 , , X N rastgele değişkenler ise, örneklem
Yr
ortalaması ve varyansı da rastgele değişkendir.
Teorem 3.2.1. X1 , X 2 ,
, X N ‘lerin her birinin beklenen değeri  ise   X    dür.
1

İspat:   X      X 1 + X 2   X N   , beklenen değerin özelliklerinden,
N

1
1
1
( X i )  ( X i ) , a  , b  0 ) olduğundan,
N
N
N
1
  X1  X 2 
N
olur. Fakat   X i    , i  1, 2,
 XN  
1
  X1     X 2  
N
, N , olduğundan   X  
1
   
N
  
N

N
er
em
olur.
   X N 
ir
 X  
gü
l
7
dir.
2
Ö
gösteriniz ki   X  
zd
Örnek: İki zar atıldığında üste gelen yüzlerdeki noktaların sayısı sırasıyla X1 , X 2 ise
al
rin
edilir. Buradan
2
3
4
5
6
f  x    X  x
1
6
1
6
1
6
1
6
1
6
1
6
.D
r.
r.
N
1
H
X x
 j     j    xi f  xi   1  2  3  4  5  6 
.D
6
i 1
1
6
1
6
1
olasılığı ile elde
6
es
im
Çözüm: X 1 (ve X 2 ‘nin) mümkün değerleri; 1, 2,3, 4,5,6 nın her biri
1
6
1
6
1
6
1
6
7
; j  1, 2
2
oç
d.
olduğu görürlür.
D
Pr
of
1
1  7 7  1 14 7
   2 
  X    1
      1      2        
2
2
2 2 2 2 2 2


Örnek: Kitle 2, 4,6,8,10 olarak verilsin. Yerine koymaksızın bu kitleden 2 birimlik
Yr
örneklemler seçelim. Örneklem ortalamasının ( X ‘nin) beklenen değerini bulunuz.
5
Çözüm:    10 farklı örneklem vardır.
 2
Örneklem
 
Örn.Ort X
2, 4
2, 6
2,8 2,10
3
4
5
4, 6
4,8
5
6
4,10
6,8
6,10
7
7
8
6
8,10
9
1
olasılık ile elde edileceğinden rastgele örneklem seçmiş oluyoruz. Örneğin,
10
2
  X  5 olabilmesi için örneklem  2,8 ya da  4, 6  olmalıdır. Bu nedenle   X  5 
10
dur. X ’nin örnekleme dağılımı
3
  X  x
5
4
6
7
8
9
er
X x
em
ir
Her bir sonuç
Ö
olur. Beklenen değerin tanımı kullanılırsa;
gü
l
zd
0.1 0.1 0.2 0.2 0.2 0.1 0.1
al
es
olur. Öte yandan kitle ortalaması
H
N
1
 2  4  6  8  10   6
5

, X N rastgele bağımsız değişkenleri için   X i    , V ar  X i    X2
 X2
oç
of
,  olmak üzere Var  X  
Pr
, i  1, 2,
.D
r.
.D
r.
ve böylece   X    olduğu görülür.
Teorem 3.2.2. X1 , X 2 ,
rin
im
  X   3   0.1  4   0.1  5   0.2   6   0.2   7   0.2   8   0.1  9   0.1  6
N
dir.
d.
D
İspat: Tanımdan Var  X     X    dir. O halde
Yr
 X  X2 
Var  X     1
N


 XN
2
2
1

    2   X 1      X 2    
N

1 
2
2
  X1      X 2    
2

N
  X N    
2
  X N     ikili karşılıklı çarpımlar 

2
yazılır. Burada her ( X i   )( X j   ) ikili çarpımının beklenen değeri i  j için, X i ve X j
bağımsız olduğundan sıfır olacaktır. Yani
  X i     X j       X i      X j               0
dır. Böylece   i      X2 , i  1, 2,..., N olduğundan
2


1
2
2
  X1       X 2    
2
N
 X2
N
  XN  
2
  N1 
2
  X2 
2
X
  X2 
  X2
ir
Var  X  
er
em
elde edilir.
gü
l
zd
Örnek: Sonuçların X 1 ve X 2 olduğu düzgün iki zarın atılması deneyi için Var  X  yi
Çözüm :
1
6
1
6
1
6
1
6
1
6
1
6
1
6
2
6
3
6
4
6
5
6
6
6
al
4
N
oç
D
6
+
Yr
1 1
12  
6 6
1 4
22  
6 6
1 9
32  
6 6
1
16
42  
6 6
1 25
52  
6 6
1 36
62  
6 6
+
 X  
d.
Pr
of
5
.D
r.
.D
r.
3
x2 f  x 
es
xf  x 
H
1
2
f  x    X  x
im
X x
rin
Ö
bulunuz. ( X 1 üst yüzde görünecek noktaların sayısını göstersin.)
 X 2  
21 7

6 2
  X1     X 2  
91
6
7
2
ve
V  1   V   2   
2
X1

2
X2
 
2
1
   
1
2
2
91  7  35
   
6  2  12
ve Teorem 3.2.2’ den
35
35
Var  X  
 12 
N
2
4
 X2
bulunur.
3
olduğunu gösteriniz.
8
3
ve
2
er
Var  X  
em
ir
Örnek: Düzgün iki para üç kez atılsın. Turaların ortalaması X ise   X  
gü
l
zd
Çözüm: Paraların her birinin ayrı ayrı üç kez atılmasındaki turaların sayısı sırasıyla X 1 , X 2
Olasılık
TTT
3
TTY
2
TYT
1
8
1
8
1
8
1
8
1
8
1
8
1
8
1
8
0
Yr
d.
YYY
1
D
Pr
YYT
1
es
.D
r.
of
YTY
1
oç
.D
TYY
2
r.
YTT
N
H
2
rin
Turaların Sayısı
im
Örnek Nokta
al
Ö
olsun. O halde paraların birisi için düşünüldüğünde;
X1  x
f  x     X1  x 
0
1
2
3
1
8
3
8
3
8
1
8
3
3
 1   3   3   1  12 3
  X1    xi f  xi   0    1   2    3        1      2    
2
8 8 8 8 8 2
i 1
ve benzer şekilde V  1   V   2  
3
olur. Buradan, Teorem 3.2.1 ve Teorem 3.2.2’ den
4
sırasıyla
3
1
1
1 3 3
ve Var  X    X2  Var  X1    
2
2
2
2 4 8
em
olarak bulunur.
er
ir
  X     X1     X 2  
, XN
, N ); aynı kitleden bağımsız şekilde seçilen N hacimli örneklem;
im
Var  i    X2 ( i  1, 2,
formülü
N
bağımsız r. değişkenleri için   i    ve
Ö
ile verilmiştir. (Teorem 3.2.2; X1 , X 2 ,
2
gü
l
, X N ‘ler bağımsız iseler örneklem ortalamasının varyansı Var  X  
rin
X1 , X 2 ,
zd
NOT: Kitle sonsuz elemanlı olduğunda, bu kitleden seçilen rastgele örneklemdeki
yani her biri bir r. değişkeni temsil ediyor.) Kitle sonlu ise N p kitle hacmi olmak üzere
es
N
H
al
 X    X  ve Var  X  ile ilgili aşağıdaki teoremleri ispatsız olarak vereceğiz.
Teorem 3.2.3 N p h.h. sonlu bir kitlenin büyüklüğünü, N bu kitleden yerine koymaksızın
.D
r.
Var  X  
 2 Np  N
N

N p 1
D
dir.
Pr
 X    X    ve
oç
of
.D
r.
seçilen bir örneklemin büyüklüğünü gösterirse, N elemanlı tüm olanaklı örneklemler için
ortalamaların ortalaması  X ve varyansı  X2 , sırasıyla
d.
Not: “ N  1 olduğunda  X2   2 dir. N p , N ’ye göre oldukça büyük ise,
Np  N
N p 1
değeri 1 ’e
Yr
2
yakın, fakat daima 1 ’ den küçük ve dolayısıyla yaklaşık olarak,
olur.
N
Teorem 3.2.4. N p herhangi sonlu bir kitlenin büyüklüğünü ve N bu kitleden tekrar yerine
koyma yoluyla seçilen bir örneğin büyüklüğünü gösterirse, N büyüklüğünde tüm olanaklı
örnekler için ortalamaların ortalaması (beklenen değeri)  X ve varyansı  X2 sırasıyla  X  
ve  X2 
1 2
 dir.
N
Örnek: N p  7 olan 7,10,9,11,13,12,15 kitlesinden N  2 büyüklüklü rastgele örneklemleri
 2 Np  N
yerine koymaksızın seçtiğimizde   X    ve  X2 

N p 1
olduğunu gösteriniz.
ir
N
er
gü
l
rin
es
N
oç
D
d.
8
8.5
1
21
1 1 2
21 21 21
Yr
P  X  x
.D
r.
r.
.D
of
Pr
X x
2
Ö
al
im
8.5
8.00
9.00
10.00
9.5
11.0
9.5
10.5
11.5
11.0
12.5
10.0
11.0
10.5
12.0
12.0
11.5
.13.0
12.5
14.0
13.5
 X i    X 


6.25
9.00
4.00
1.00
2.25
0.00
2.25
0.25
0.25
0.00
2.25
1.00
0.00
0.25
1.00
1.00
0.25
4.00
2.25
9.00
6.25
zd
Xi
H
Olanaklı
örneklemler
7,10
7,9
7,11
7,13
7,12
7,15
10,9
10,11
10,13
10,12
10,15
9,11
9,13
9,12
9,15
11,13
11,12
11,15
13,12
13,15
12,15
em
7
Çözüm Örneklem sayısı    21 ‘dir. Kitle: 7,10,9,11,13,12,15 ;
 2
9 9.5 10 10.5 11 11.5 12 12.5 13 13.5
 X   8
2
21
2
21
3
21
1
1
 8.5 
21
21
2
21
2
21
2 1
21 21
 14
1 231

 11
21 21
1
21
14
1
21
bulunur. Tablodan
 X2 

1 21
 Xi    X 
21 i 1
bulunur. Öte yandan, kitleden  

52.50
 2.5
21
77
42
 11 ve  2 
 6 elde edilir. Böylece
7
7
6  7  2 6 5
 
   2.5 ve   X     11
N p  1 2  7  1 2 6
 2 Np  N
zd
elde edilir.
er
em
N

ir
  2.5 
2
X

2
, X N rastgele değişkenlerinin ortalaması  ve varyansı  2 ise Teorem 3.2.1 ve
Ö
X1 , X 2 ,
gü
l
NOT: Örneklem ortalamalarının standart sapması  X ye ortalamanın standart hatası denir.
rin
es
, X N normal dağılıma sahip bir kitleden alınmışsa, X ile ilgili son derece önemli
N
H
X1 , X 2 ,
al
im
2
3.2.2 gereğince X ‘nin ortalaması  ve varyansı
‘dir. Çünkü rasgele değişkenler sonsuz
N
bir kitleden alınan sonlu bir örneklem olarak düşünülebilir.
Teorem 3.2.5 X1 , X 2 ,
.D
r.
.D
r.
sonuç elde edilir. İspat dersin amacını aşar diye düşünüyorum.
, X N bağımsız rastgele değişkenleri, ortalaması  ve varyansı  2
oç
D
d.
Pr
of
2
olan bir normal dağılıma sahipse, X de  ortalamalı ve
varyanslı, normal dağılıma
N
sahiptir.
Ayrıca olasılıktan biliyoruz ki
X  

değişkeni bir standart normal dağılıma sahiptir.
Yr
N
Örneklem varyansını incelemeye geçmeden önce ispat etmeksizin son derece önemli olan ve
Merkezi Limit Teoremi olarak bilinen bir teoremi yine ispat etmeksızın vereceğiz.
Teorem 3.2.6 (Merkezi Limit Teoremi): X1 , X 2 ,
, X N değişkenleri  ortalamalı ve  2
varyanslı aynı olasılık dağılımına sahip bağımsız rastgele değişkenler olsun. X rastgele
, X N değişkenlerinin aritmetik ortalaması olmak üzere, Z 
değişkeni X1 , X 2 ,
X  

ile
N
tanımlanan Z rastgele değişkeni N ’nin büyük değerleri için yaklaşık olarak standart normal
ir
dağılıma sahiptir.
er
em
Örnek: Belli bir grup tarafından bir radyo istasyonunun müzik programlarının her hafta
dinlenilme süresi yaklaşık olarak normal dağılıma sahiptir.   4 ve   1 dir. Bu gruptan
al
N







1
1 
 P Z 
 P  Z  2   0.0456
  P Z 
2 
1



2




4
16 

.D
d.
D
oç
of




1 
  P Z 


2 




N 

.D
r.
r.
H
 X 
1
1

P X      P

 X
2
2  X


Pr
gü
l
rin
Çözüm:
es
im
Ö
zd
seçilen 16 kişilik bir örneklem için ortalama dinleme zamanı X dir. X ’nin grup
1
ortalamasından (yani kitle ortalamasından)
saatten daha çok farklı olmasının olasılığı
2
1
nedir? Yani, P( X    )  ?
2
0
2
Yr
-2
Z
Örnek: Bir sanayi kuruluşunda çalışanların ücretleri   800 TL ortalama ve   90 TL
standart sapmalıdır. Rastgele seçilen 81 işçinin saat ücretlerinin ortalamasının 810 TL ve 825
TL arasında bulunma olasılığı nedir?
Çözüm   800 ve   90 , X ’nin örnekleme dağılımı için  X   olduğundan  X  800
ve ortalamanın standart hatası  X 

N

X  X
90
değişkeni
 10 bulunur. O halde Z 
X
81
kullanılarak
 810  800 X  800
825  800 
P 810  X  825  P 

Z

10
10
10


gü
l
rin
es
al
im
Ö
zd
bulunur.
er
em
ir
 P 1  Z  2.5  0.4938  0.3413  0.1525
N
H
Şimdi iki grup gözlem kullanarak ortalamanın nasıl bulunacağını göreceğiz.
.D
r.
r.
Teorem 3.2.7 1 ve  2 ortalamalı  12 ve  22 varyanslı iki ayrı dağılımdan sırasıyla X 1 ve
.D
X 2 ortalamalı N ve M hacimlik iki örneklem seçilirse aşağıdakiler doğrudur.,
a.   X1  X 2   1  2
 12

 22
.
oç
of
b. Var  X 1  X 2  
N
M
D
Pr
İspat Olasılıktan biliyoruz ki iki rastgele değişkenin toplamının ortalaması onların
ortalamalarının toplamına eşittir. Buradan (a) derhal yazılır;
d.
  X1  X 2     X1     X 2   1  2
Yr
(b)’yi göstermek için de olasılıktan bildiğimiz Var  X  Y   Var  X   Var Y  ( X ve Y
bağımsız) sonucunu kullanarak,
Var  X1  X 2   Var  X 1   Var  X 2  
elde edilir.
12
N

 22
M
Şimdi aşağıdaki gibi tanımlanan örneklem varyansı ile ilgili teorem vereceğiz:
S x2 
Teorem 3.2.8. X1 , X 2 ,
1 N
( X i  X )2

N  1 i 1
, X N ‘ler   X i    ve Var  X i    2 , i  1, 2,
, N , olan bağımsız
rastgele değişkenler iseler   S x2    2 ‘dir.
ir
İspat: Olasılıktan a ve b sabitler ve X rastgele değişken olmak üzere   ax  b   a  x   b
em
olduğunun biliyoruz;

bulunur.   X i      ve   X    
N
D
rin
olduğundan,

1
2
2
  N 2  N
 
N 1 
N
oç
  S X2  
d.
Yr
2
.D
r.
.D
Pr
of
bulunur.
2
2
r.
2
es
H
al
2
1
N
2

   X i     N   X    
N  1  i 1

N
im
2
1
N
2

   X i     N    X   2 N  X    
N  1  i 1

gü
l
zd
Ö
2 
1
N 
2

   X i     2  X i       X      X   

N  1  i 1 

er
2
1
1
 1 N
N

2
S   
(Xi  X )  
  ( X i  X ) 2  
  X i        X 

 N  1 i 1
 N  1  i 1
 N 1
2
x
Download