örnekleme dağılışları ve tahminleyicilerin özellikleri

advertisement
TEMEL KAVRAMLAR
ÖRNEKLEME DAĞILIŞLARI VE
TAHMİNLEYİCİLERİN ÖZELLİKLERİ
• Doç. Dr. Ali Kemal ŞEHİRLİOĞLU
PARAMETRE:
ÖRNEK İSTATİSTİĞİ
(PARAMETRE
• Populasyonun sayısal
açıklayıcı bir ölçüsüdür ve TAHMİNLEYİCİSİ):
anakütledeki tüm
• Bir örneğin sayısal betimsel
elemanlar dikkate
ölçüsüdür ve örnekteki
gözlemlerden hesaplanır.
alınarak hesaplanabilir.
• Ana kütledeki tek bir
• Diğer bir deyişle bilinmeyen bir
eleman dahi işlemin
parametrenin sayısal değerini
dışında kalır ise elde
bulabilmek (tahminlemek) için
kullanılır.
edilen sonuç parametre
olarak kabul edilemez.
1
PARAMETRE VE ÖRNEK
İSTATİSTİKLERİ İÇİN ÖRNEKLER
Parametre θ
• Anakütle ortalaması µ
• Anakütle Medyan M
• Anakütle Varyansı σ2
• Anakütle Standart
sapması
σ
• Anakütle Oranı
π
Örnek istatistiği θˆ
• Örnek ortalaması
• Örnek Medyanı
• Örnek Varyansı
• Örnek Standart
sapması
• Örnek Oranı
x
m
s2
s
p
3
2
Bir Populasyon Parametresi Hakkında
En Geniş Bilgiyi Hangi Örnek
İstatistiğinin İçerdiğine Nasıl Karar
Verilecek?
Örneğin anakütle ortalaması µ için
• Aritmetik ortalama
• Geometrik ortalama
• Harmonik ortalama
• Medyan
vb. örnek istatistiklerinden hangisi tercih
edilmelidir.
4
1
Örnek 1 a
Bir zar atılışında x üst yüzdeki sayıyı göstersin. E(x)=µ
anakütle parametresini (anakütle ortalamasını)
bulunuz.
x
1
2
3
4
5
6
P(x)
1/6
1/6
1/6
1/6
1/6
1/6
xP(x) 1/6
2/6
3/6
4/6
5/6
6/6
6
1
6
µ = E ( x ) = ∑ xP ( x) = +
x =1
Örnek 1b
• Ancak bu µ değerinin bir an için bilinmediği
ve bunu tahmin etmek için populasyondan
3 örnek alındığını varsayılsın.
2
6 21
+ ...... + =
= 3,5
6
6 6
5
•Zar 3 kez daha atılsın ve örnek sonuçları; x1=3, x2=4,
x3=6 elde edilsin.
• Zar 3 kez atılsın ve örnek sonuçları; x1=2, x2=2,
x3=6 elde edilsin.
x=
∑ x 2 + 2 + 6 10
x=
=
=
= 3,333 ve m=2 hesaplanabilir.
n
3
3
1
2
m=2
SONUÇ:
x
µ =3.5
3
4
13
= 4,3
3
ve m=4
µ
5
6
1
6
2
3
4
m
5
6
x
X=3.3
SONUÇ: m değeri µ değerine daha yakındır.
değeri µ değerine daha yakındır.
7
8
2
ÖRNEKLEME DAĞILIMLARI
Örnek İçin Yorum
1. Örnekten hesaplanan örnek istatistikleri (tahminleyiciler)
birer şans değişkenidir.
2. Ne örnek aritmetik ortalaması x
Ne de örnek medyanı (m) ,
populasyon ortalamasına daima daha yakındır denilemez.
Sonuçların genellenebilmesi için örnek istatistiklerinin
dağılışına gerek duyulmaktadır.
9
ÖRNEKLEME DAĞILIMLARI
• Bu koşullar (N, n) altında
hesaplanabilecek örnek
istatistiği sayısı k adettir.
• Örnek istatistiğinin
anakütlesindeki eleman sayısı k
olur.
• Örnek verilerinden hesaplanan
bir örnek istatistiği için elde
edilen bu anakütle örnekleme
dağılışı olarak adlandırılır.
• Anakütleden n adet ölçümden
x1, …, xn oluşan bir örnekten
alınmış olsun.
• Anakütledeki eleman sayısı N
olsun.
• Anakütleden alınabilecek her
biri n adet eleman içeren tüm
N
mümkün örnek sayısı:   = k
n
10
ÖRNEKLEME DAĞILIMLARI
• Örnekleme dağılımı bu
istatistiğin bir olasılık
dağılışıdır.
• Örnekleme dağılımı
anakütledeki eleman sayısı N ve
n örnek hacminin bir
fonksiyonudur.
11
12
3
Mümkün Örnekler
ÖRNEK 2
Büyük bir populasyondan alınmış 3 ölçümün (0, 3, 12) olasılık dağılışı aşağıdaki gibidir.
0
1
3
x
P(x)
3
1
3
12
1
3
n=3
a)
Örnek ortalaması ( x )’ nın örnekleme dağılışı
b)
Örnek medyanı (m)’ nın örnekleme dağılışını bulunuz.
DİKKAT: ANAKÜTLEDEKİ ELEMAN SAYISI N BİLİNMİYOR. FAKAT ŞANS
DEĞİŞKENİNİN OLASILIK DAĞILIMI P(x) BİLİNİYOR.
13
ÖRNEK 2
0
1
27
1
3
27
2
3
27
3
1
27
4
3
27
5
6
27
6
3
27
8
3
27
9
3
12
1
27
0
7
27
0
3
12
0
3
12
0
3
12
0
3
12
0
3
12
0
3
12
0
3
12
0
3
12
0
3
12
0
1
4
1
2
5
4
5
8
1
2
5
2
3
6
5
6
9
4
5
8
5
6
9
8
9
12
0
0
0
0
3
3
0
3
12
0
3
3
3
3
3
3
3
12
0
3
12
3
3
12
12
12
12
Olasılık
1/27
1/27
1/27
1/27
1/27
1/27
1/27
1/27
1/27
1/27
1/27
1/27
1/27
1/27
1/27
1/27
1/27
1/27
1/27
1/27
1/27
1/27
1/27
1/27
1/27
1/27
1/27
p= x / n
(x tek sayı
gelmesi durumu)
0/3
1/3
0/3
1/3
2/3
1/3
0/3
1/3
0/3
1/3
2/3
1/3
2/3
3/3
2/3
1/3
2/3
1/3
0/3
1/3
0/3
1/3
2/3
1/3
0/3
1/3
0/3
5
14
• sapmasızlık
• minimum varyanslılık
27
Eğer bir tahminleyici bu iki özelliği de sağlıyor ise buna
en iyi tahminleyici-etkin tahminleyici denir.
• Medyan Örnekleme Dağılışı
m
P (m)
0
0
0
3
3
3
12
12
12
0
0
0
3
3
3
12
12
12
0
0
0
3
3
3
12
12
12
m
ÖRNEK İSTATİSTİKLERİNİNTAHMİNLEYİCİLERİN
ÖZELLİKLERİ
• Aritmetik Ortalama Örnekleme Dağılışı
x
P(x )
0
0
0
0
0
0
0
0
0
3
3
3
3
3
3
3
3
3
12
12
12
12
12
12
12
12
12
x
3
13
27
12
7
27
15
16
4
θ : Parametre
A, B : İstatistik
SAPMASIZLIK
f(A)
• Eğer örnek istatistiğinin örnekleme dağılışının
anakütle ortalaması populasyon parametresine
eşit ise bu istatistiğe parametrenin
sapmasız tahminleyicisi
denir.
• E θˆ = θ
()
f(B)
Sapma
17
B
18
• Anakütle parametresi θ olsun.
• Parametrenin tahminleyicileri; θˆ1 ,K ,θˆk
olsun.
• Eğer,
V θˆi ≤ V θˆ j i ≠ j = 1,..., k − 1
E ( m) ≠ µ
Sapmasız
θ
θ için sapmalı örnek istatistiği
MİNİMUM VARYANSLILIK
ÖRNEK 3 Sapmasızlık
Anakütle ortalaması için aritmetik ortalama sapmasız fakat medyan
sapmalı bir tahminleyicidir.
E(x) = µ
A
θ
θ için sapmasız örnek istatistiği
Sapmalı
( ) ( )
ise
θˆi tahminleyicisi θ parametresinin minimum
µ= x
m
varyanslı tahminleyicisidir.
19
20
5
ÖRNEK: MİNİMUM VARYANSLILIK
ÖRNEK: ETKİN TAHMİNLEYİCİ
• Anakütle parametresi µ (anakütle
ortalaması) olsun.
• Parametrenin alternatif tahminleyicileri;
θˆ1 = x
θˆ2 = G.O
θˆ3 = H .O
θˆ4 = m
olsun.
• V ( x ) < V ( m ) < V ( G.O ) < V ( H .O )
x tahminleyicisi µ parametresinin minimum
varyanslı tahminleyicisidir.
• Anakütle parametresi µ (anakütle
ortalaması) olsun.
• Parametrenin alternatif tahminleyicileri;
θˆ1 = x
θˆ2 = G.O
θˆ3 = H .O
θˆ4 = m
olsun.
• E ( x ) = µ ve
V ( x ) < V ( m ) < V ( G.O ) < V ( H .O )
x tahminleyicisi µ parametresinin etkin
tahminleyicisidir.
21
22
ÖRNEKLEME DAĞILIMI ÖRNEK
HACMİNİN BİR FONKSİYONUDUR
ÖRNEK: ETKİN TAHMİNLEYİCİ
Örnek Hacmi büyüdükçe tahminleyicinin varyansı küçülür.
Ortalamanın
örnekleme
dağılışı
P(X)
Medyanın
örnekleme
dağılışı
Büyük
örnek
hacimli
durum
B
A
µ
23
µ
Küçük
örnek
hacimli
durum
X
24
6
ÖRNEK 3:
ÖRNEK 3:
• Örnek 2 verileri için aritmetik ortalama ve
örnek medyanının tahminleyici özelliklerini
araştırınız.
Aritmetik ortalama x , anakütle ortalamasının
µ sapmasız bir tahminleyicisi midir?
x
0 3 12
P(x) 1/3 1/3 1/3
N
µ = E ( x ) = ∑ xi P( xi )
i =1
1 1
1
= 0   + 3   + 12  
 3  3
3
=5
25
ÖRNEK 3:
26
ÖRNEK 3:
0 1 2 3 4 5 6 8 9 12
x
P ( x ) 1/27 3/27 3/27 1/27 3/27 6/27 3/27 3/27 3/27 1/27
Sonuç:
E(x) = µ
olduğundan aritmetik ortalama (tahminleyici),
anakütle ortalamasının (parametrenin)
sapmasız bir tahminleyicisidir.
N
µ x = E ( x ) = ∑ xi P( xi )
i =1
 1   3 
 1 
= 0   + 1  + K + 12  
 27   27 
 27 
=5
27
28
7
ÖRNEK 3:
ÖRNEK 3:
Örnek medyanı m, anakütle ortalamasının µ
sapmasız bir tahminleyicisi midir?
Sonuç:
E (m) ≠ µ
olduğundan örnek medyanı (tahminleyici),
anakütle ortalamasının (parametrenin)
sapmalı bir tahminleyicisidir.
m
0
3
12
P(m) 7/27 13/27 7/27
 7   13 
 7 
E ( m ) = ∑ mi P ( mi ) = 0   + 3   + 12  
i
 27   27 
 27 
= 4.56
E (m) ≠ µ
29
ÖRNEK 3
ÖRNEK 3:
Aritmetik ortalamanın varyansı σ x2
Aritmetik ortalama x , anakütle ortalamasının µ
Minimum Varyanslı bir tahminleyicisi midir?
xi
0 1 2 3 4 5 6 8 9 12
1
3
3
1
3
6
3
3
3
1
P ( xi )
27
27
27
27
27
27
27
27
27
27
0 1 4 9 16 25 36 64 81 144
xi 2
xi 2 P ( xi ) 0 3 27 12 27 9 27 48 27 150 27 108 27 192 27 243 27 144 27
x
0 3 12
1
P(x) 13 13
3
2
x
0 9 144
2
x P(x) 0 9 3 144 3
E ( x 2 ) = ∑ xi2 P ( xi ) =
153
3
σ x2 = V ( x ) = E ( x 2 ) −  E ( x ) 
153 2
−5
3
= 26
30
E ( x 2 ) = ∑ xi 2 P ( xi ) =
2
=
31
V ( x ) = E ( x 2 ) − [ E ( x )]
909
=
− (5) 2
27
=8,66
909
27
2
32
8
ÖRNEK 3
ÖRNEK 3
Örnek medyanının varyansı σ m2
mi
P(mi)
m i2
mi2 P(mi)
E (m
2
0
7
3
13
27
0
0
27
9
117
Sonuç:
V ( x ) < V (m)
12
7
Aritmetik ortalama x , anakütle ortalamasının
µ Sapmasız ve Minimum Varyanslı
bir tahminleyicisidir.
27
144
27
1008
27
) = ∑ m P ( m ) = 41.66
2
i
i
V ( m ) = E ( m ) − [ E ( m) ]
= 41.66 − (4.56) 2
=20.86
2
2
33
34
BEKLENEN DEĞER VE VARYANS
OPERATÖRLERİNİN ÖZELLİKLERİ
BEKLENEN DEĞER VE VARYANS
OPERATÖRLERİNİN ÖZELLİKLERİ
BEKLENEN DEĞER OPERATÖRÜ E(.)
Şans değişkeni x anakütle ortalaması µ ve
anakütle varyansı σ2 olsun.
VARYANS OPERATÖRÜ V(.)
Şans değişkeni x anakütle ortalaması µ ve
anakütle varyansı σ2 olsun.
a ile b birer sabit sayı olmak üzere,
• V(a)=0
• V(ax)=a2V(x)= a2σ2
• V(ax+b)= a2V(x)= a2σ2
a ile b birer sabit sayı olmak üzere,
• E(a)=a
• E(ax)=aE(x)=aµ
• E(ax+b)=aE(x)+b=aµ+b
35
36
9
Şans Değişkenlerinin
Standartlaştırılması
MERKEZİ LİMİT TEOREMİ
• Şans değişkeni x’in dağılımı ne olursa
olsun bu anakütleden alınan n hacimli
örneklerden hesaplanan aritmetik
ortalamanın x dağılımı yaklaşık olarak
normal dağılıma sahiptir.
• Örnek hacmi büyüdükçe aritmetik
ortalamanın x dağılımının normal
dağılıma yakınsaması artar.
• Standart değişkenler genellikle z ile
gösterilir.
• ortalaması sıfır, E(z)=0
• Varyansı bir, V(Z)=1.
z=
şans değişkeni-anakütle ortalaması
anakütle standart sapması
37
BAZI ÖNEMLİ TAHMİNLEYİCİLER İÇİN
ÖRNEKLEME DAĞILIMLARININ
BELİRLENMESİ
• Aritmetik ortalama x
• Örnek varyansı s2
• Örnek oranı p
39
38
BİR DAĞILIMIN BELİRLENMESİ
• Dağılışın tipinin belirlenmesi,
(Normal, Üstel, Poisson vb.)
• Dağılımın parametrelerinin
belirlenmesi
40
10
ARİTMETİK ORTALAMA x İÇİN
ÖRNEKLEME DAĞILIMI
Şans değişkeni x anakütle ortalaması µ ve
anakütle varyansı σ2 olsun.
∑ i=1 xi
DAĞILIMIN TİPİ
• Merkezi limit teoremine göre aritmetik
ortalamanın dağılımı yaklaşık olarak
normal dağılıma sahiptir.
• Normal dağılımın parametreleri:
n
x=
x1 + x2 + K + xn
n
n
Cevaplanması gereken sorular
• Dağılımın tipi?
• Parametreleri;
E(x) = ?
V (x) = ?
=
– Anakütle ortalaması
– Anakütle varyansı
41
Dağılımın Parametreleri: Aritmetik
Ortalama için Anakütle Ortalaması
 ∑n x  1
E ( x ) = E  i =1 i  =  E ( x1 ) + K + E ( xn ) 
 n  n


1
nµ
E ( x ) = [µ +K + µ ] =
n
n
E(x) = µ
42
Dağılımın Parametreleri: Aritmetik
Ortalama için Anakütle Varyansı
 ∑n x  1
V ( x ) = V  i =1 i  = 2 V ( x1 ) + K + V ( xn ) 
 n  n


1
nσ 2
V ( x ) = 2 σ 2 + K + σ 2  = 2
n
n
V (x) =
43
σ2
n
44
11
ARİTMETİK ORTALAMA x İÇİN
ÖRNEKLEME DAĞILIMI
Aritmetik Ortalamanın
Standartlaştırılması
x -µ x
σx
x -µ x
z=
σx n
z=

σ 
x ~N ( µ x ;σ x2 ) ≡ N  µ x ; 
n 

2
x
45
Normal olmayan dağılışlardan
örnekleme
•Merkezi eğilim
σσ = 10
Anakütle dağılışı
σσ = 10
µx = µ
•Yayılma
σx =
Normal dağılış gösteren bir
anakütleden örnekleme
•Merkezi eğilim
Anakütle dağılışı
µx = µ
46
•Yayılma
σ
n
– Yerine koyarak
örnekleme
µµ = 50
X
σx =
Örnekleme dağılışı
n=4
σ X = 5
n =30
σX = 1.8
µµX-X = 50
X
47
σ
n
Yerine konularak
örnekleme
µµ = 50
X
Örnekleme dağılışı
n=4
σ X = 5
n =16
σX = 2.5
µµX-X = 50
X
48
12
Merkezi limit teoremi
Örnek
hacmi
yeterince
büyükse
(n ≥ 30) ...
σx =
ÖRNEK 3
σ
n
Örnekleme
dağılışı
hemen hemen
normal olur.
X
X
µx = µ
49
X −− µµ 7.8 −− 8
Z ==
==
== −−.50
σσ n 2 25
X −− µµ 8.2 −− 8
==
== .50 Standart Normal
σσ n 2 25
Dağılış
σX = .4
© 1984-1994 T/Maker Co.
50
ÖRNEK ORANI: p
Çözüm
Örnekleme dağılışıZ ==
•Telekom’da çalışan bir
uzman, uzun zaman
yaptığı gözlemlerden,
telefon konuşma
sürelerinin (x),
µ = 8 dk. & σ = 2 dk. olan
normal dağılış gösterdiğini
belirlemiştir.
25 görüşme rasgele
seçilirse, örnek
ortalamasının 7.8 & 8.2
dakika arasında çıkması
olasılığı nedir?
σ=1
.3830
• Birbirinden bağımsız n adet Bernoulli Deneyinin bir
araya gelmesi sonucunda x başarı sayısı Binom
Dağılımına sahiptir.
• Başarı olayının populasyon oranının bilinmediği
durumlarda olasılık hesaplamaları için kullanacak dağılışı
belirlemek bir problemdir olarak.
• Örnek olarak bir yeni ilin A partisi için oy oranının
belirlenmesi veya yeni çıkan bir derginin tüm rakip
dergiler dikkate alında satış yüzdesinin belirlenmesi
verilebilir.
.1915 .1915
7.8 8 8.2 X
-.50 0 .50
Z
51
52
13
ÖRNEK ORANI: p
ÖRNEK ORANI p İÇİN
ÖRNEKLEME DAĞILIMI
• Bu gibi örneklerde anakütle başarı olasılığını “π” ’yi
tahminlemek amacıyla populasyondan alınan örnekten
elde edilen bilgiler doğrultusunda örnek oranı p
hesaplanır.
• İlgilenilen
başarı olasılığının π’nin bilinmediği
durumlarda n hacimlik örnek alındığında ve x örnekteki
başarı sayısı olarak ele alındığında, örnekten elde edilen
başarı olasılığı (örnek oranı);
p=
x
n
53
Şans değişkeni x sabit n hacimli denemede
ortaya çıkan başarı sayısı olsun. x ~B ( n; π )
Örnek oranı:
x
p=
n
Cevaplanması gereken sorular
• Dağılımın tipi?
• Parametreleri;
µp = E ( p) = ?
σ p2 = V ( p ) = ?
54
Dağılımın Parametreleri: Örnek Oranı
için Anakütle Ortalaması
DAĞILIMIN TİPİ
• Merkezi limit teoremine göre örnek oranının
dağılımı eğer n örnek hacmi yeterince büyük ise
yaklaşık olarak normal dağılıma sahiptir.
• Bunun temel sebebi örnek oranının, n adet
denemede ortaya çıkan ortalama başarı sayısını
temsil etmesidir.
• Normal dağılımın parametreleri:
– Anakütle ortalaması
– Anakütle varyansı
55
x 1
E ( p) = E   = E ( x)
n n
nπ
E ( p) =
n
E ( p) = π
Not: x şans değişkeni binom dağılımına
sahip olduğundan:
E(x)=nπ
56
14
Dağılımın Parametreleri: Örnek oranı
için Anakütle Varyansı
 x 1
V ( p) = V   = 2 V ( x)
n n
nπ (1 − π )
V ( p) =
n2
π (1 − π )
V ( p) =
n
Not: x şans değişkeni binom dağılımına
sahip olduğundan:
V(x)=nπ(1-π)
 π (1 − π ) 
p ~N ( µ p ;σ p2 ) ≡ N  π ;

n


57
Örnek Oranının Standartlaştırılması
z=
z=
ÖRNEK ORANI p İÇİN
ÖRNEKLEME DAĞILIMI
58
Örnek Hacminin Örnek Oranı Üzerindeki
Etkisi
Anakütle oranı π sabitken örnek hacmi arttığında örnek
oranının standart hatası küçülür.
Aşağıdaki şekilde görüldüğü gibi örnek hacmi arttığında
p’in
kendi
ortalaması
etrafında
yoğunlaştığı
görülmektedir.
p -µ p
σp
p -π
f ( p)
π (1 − π ) n
n=400
n=100
59
.68 .72 .76
.80 .84 .88 .92
p
60
15
ÖRNEK 4
ÖRNEK 4
Büyük bir populasyondan alınan 3 ölçüm ile ilgili
örneğe dönersek x başarı sayısının örnekte tek sayı
gelme olayını göstermek üzere örnek oranının
beklenen değerini ve varyansını bularak dağılımını
elde ediniz.
pi
0/3 1/3
2/3 3/3
pi2
0/9 1/9
4/9 9/9
P(pi) 8/27 12/27 6/27 1/27
E ( p ) = ∑ pi P ( pi )
i
E ( p) = π = µ p
E ( p) =
8  0  12  1  6  2  1  3 
  +   +   +   = 0.33
27  3  27  3  27  3  27  3 
61
ÖRNEK 4
62
ÖRNEK 5
I. YÖNTEM σ 2p = V ( p ) = π (1 − π )
Gelirler Genel Müdürlüğü’ne göre, bütün vergi
beyannamelerinin % 75’i vergi iadesine yol açmaktadır. 100
beyannamelik bir rassal örneklem alınmıştır.
a) Vergi iadesine yol açan beyannamelerin örneklem
oranının ortalaması kaçtır?
b) Örneklem oranının varyansı kaçtır?
c) Örneklem oranının standart hatası kaçtır?
d) Örneklem oranının 0,8’den büyük olma olasılığı kaçtır?
n
π (1 − π ) 0.33(1 − 0.33)
σ 2p =
=
= 0.074
n
3
II. YÖNTEM σ 2p = E ( p 2 ) − [ E ( p)]2
E ( p 2 ) = ∑ pi2 P ( pi )
i
E( p2 ) =
8  0  12  1  6  4  1  9 
  +   +   +   = 0.185
27  9  27  9  27  9  27  9 
σ 2p = E ( p 2 ) − [ E ( p) ] = 0.185 − (0.33) 2 = 0.074
2
63
64
16
ÖRNEK 5
ÖRNEK 5
Çözüm:
a)
E ( p ) = π = 0,75
b)
σ 2p =
σ 2p =
d) P ( p > 0,8) = ?
P ( p > 0,8) = P (
π (1 − π )
n
p −π
σp
>
0,8 − π
σp
)
0,8 − 0,75
0,8 − 0,75
) = P( z >
)
0,0433
0,0433
= P( z > 1,15) = 0,5 − 0,3749 = 0,1251
= P( z >
0,75(1 − 0,75)
= 0,001875
100
c) Standart Sapma (ya da Standart Hata)
σ p2 = σ p = 0,001875 = 0,0433
65
Ki-Kare Dağılışı
χ v2
=
Ki-Kare Dağılışı
(n - 1) s 2
σ
66
• Ki-kare dağılımının tek bir parametresi
vardır: v
• Bu parametre genel olarak serbestlik
derecesi olarak adlandırılır.
• χ v2 şeklinde gösterilir.
• Ki-kare dağılımı normal (standart normal)
dağılıma sahip şans değişkenlerinden elde
edlilir.
2
n = örnek miktarı
s 2 = örnek varyansı
σ 2 = anakütle varyansı
df = serbestlik derecesi = n – 1=v
67
68
17
Ki-Kare Dağılışı
Ki-Kare Dağılışı
Şans değişkenleri xi ler normal dağılıma sahip
olmak üzere, Örnek varyansı:
∑( x − x )
s2 =
i
n −1
Ki-kare şans değişeninin beklenen değeri:
2
⇒ ( n − 1) s 2 = ∑ ( xi − x )
2
E ( χ v2 ) = v
Eşitliğin her iki tarafı anakütle varyansına
bölünerek
( n − 1) s 2 = ∑ ( xi − x )
σ
2
σ
2
Ki-kare şans değişeninin varyansı:
V ( χ v2 ) = 2v
2
= χ n2−1
69
ÖRNEK VARYANSININ
ÖRNEKLEME DAĞILIMI
Ki-kare istatistiğinin dağılışının
özellikleri
1.
ki-kare dağılışı simetrik değildir
2.
Serbestlik derecesi arttıkça, dağılış daha simetrik
hale gelir (normale yaklaşır)
Anakütle ortalaması µ x ve anakütle varyansı σ x olan bilinmeyen bir
populasyondan x1, x2,…, xn ile gösterilen n adet rassal bir örnek
alındığında populasyon varyansı aşağıdaki gibi bir beklenen değer
ifadesine eşittir:
2
σ x2 = E ( xi − µ x ) 2
df = 10
Simetrik değil
Populasyon ortalaması µ x bilinmediğinde yerine x konularak örnek
varyansı aşağıdaki gibi tanımlanır.
df = 20
0
70
sx2 =
x2
0
5 10
15 20
25 30 35 40 45
1 n
∑ ( xi − x )2
n − 1 i =1
Tüm değerler sıfır veya pozitif
71
72
18
ÖRNEK VARYANSININ
ÖRNEKLEME DAĞILIMI
ÖRNEK VARYANSININ
ÖRNEKLEME DAĞILIMI
Varyansı σ x2 olan bir populasyondan alınan n hacimlik bir
örneğin örnek varyansı sx2 olarak ifade edildiğinde;
( n − 1) s
2
x
σ2
=χ
2
n −1 ⇒
2
x
s =
σ χ
2
x
2
n −1
•
sx2 ’nin örnekleme dağılımının ortalaması σ x2 ’dir.
E ( sx2 ) =
σ x2 E ( χ n2−1 )
( n − 1)
( n − 1)
=
σ x2 ( n − 1)
( n − 1)
E ( sx2 ) = σ x2
73
74
ÖRNEK VARYANSININ
ÖRNEKLEME DAĞILIMI
• s x2 ’nin örnekleme dağılımının varyansı, örnekleme
dağılımın Ki- Kare dağılımına uygun olduğunu
sonucundan hareketle ;
 σ 2 χ 2  σ x V ( χ n −1 )
V ( sx2 ) = V  x n−1  =
2
( n − 1)
 ( n − 1) 
2σ 4 ( n − 1)
V sx2 = x
2
( n − 1)
2σ x4
V ( sx2 ) =
( n − 1)
4
2
( )
75
19
Download