ARALIK TAHM˙IN˙I (INTERVAL ESTIMATION): • Nokta tahmininde

advertisement
YTÜ-İktisat İstatistik II
'
Aralık Tahmini I
1
ARALIK TAHMİNİ (INTERVAL ESTIMATION):
$
• Nokta tahmininde ilgilenilen anakütle parametresine ilişkin örneklem
bilgisinden hareketle tek bir sayı üretilir.
• Bir nokta tahmini çoğunlukla bilinmeyen parametreye ilişkin
oluşturacağımız en iyi bahis olarak düşünülebilir.
• Ancak bir nokta tahmini, bu tahminin bilinmeyen gerçek populasyon
parametresine ne kadar yakın olabileceğine, başka bir deyişle, doğru
parametre değerine hangi olasılıkla ve ne kadar yakın olduğuna ilişkin bir
şey söylemez.
• Örneğin büyük bir parti maldan rassal çekilmiş parçaların %10’unun
kusurlu olduğu tahmini yapılmış olsun. Aralık tahmininde gerçek kusurlu
oranının %5 ile %15 ya da %8 ile %12 gibi iki değer arasında olmasından
ne kadar emin olabiliriz sorusuna cevap aranır.
• Aralık tahmini bilinmeyen parametreye ilişkin belirsizliği açık olarak
yansıtır.
&
YTÜ-İktisat İstatistik II
'
Aralık Tahmini I
%
2
ARALIK TAHMİNİ:
$
• Bir anakütle katsayısının aralık tahmin edicisi, o anakütle katsayısının
içine düşebileceği bir aralığı örneklem bilgisine dayanarak belirlemenin
kuralıdır.
• Buna karşılık gelen tahmine de aralık tahmini denir.
• θ bilinmeyen populasyon parametresi olsun. θ’nın aralık tahmin edicisi
P (A < θ < B) = 1 − α,
B>A
• Burada A ve B örneklem bilgisine bağlıdır ve rassal değişkendir. A: alt
güven sınırı, B: üst güven sınırı
• 1 − α: güven düzeyi ya da olasılık içeriği
• A ve B’nin belli örneklem gerçekleşmelerini a ve b ile gösterirsek, bu (a, b)
aralığına θ’nın %100(1 − α) güven aralığı denir:
&
a<θ<b
%
YTÜ-İktisat İstatistik II
'
Aralık Tahmini I
3
$
ARALIK TAHMİNİ:
Güven Aralığının Anlamı:
• Olasılığın göreli sıklık (relative frequency) yorumu
• X1 , X2 , . . . , Xn rassal değişkenlerinin belli gerçekleşmeleri x1 , x2 , . . . , xn
örneklem değerlerinden hareketle θ için güven aralığını oluşturduğumuzu
düşünelim. Bu aralığa [a1 , b1 ] diyelim.
• Anakütleden yeniden aynı kurallarla başka bir örneklem çekilsin. Bu
örneklemden hareketle oluşturulan güven aralığına da [a2 , b2 ] diyelim.
• Bu işlemi çok sayıda, diyelim ki N kere tekrarlamış olalım. Elimizde N tane
güven aralığı olacaktır: {[a1 , b1 ], [a2 , b2 ], . . . , [aN , bN ]}
• Güven katsayısı 1 − α’nın anlamı şudur: Bu N güven aralığından
%100(1 − α) kadarı doğru anakütle parametresi θ’yı içerecektir.
&
%
YTÜ-İktisat İstatistik II
'
Aralık Tahmini I
4
Bir Normal Dağılım Ortalamasının µ Güven Aralıkları:
Populasyon Varyansı σ 2 Biliniyor
$
Varsayım: X1 , X2 , . . . , Xn rassal değişkenlerinin her biri ortalaması µ varyansı
σ 2 olan bir NORMAL dağılımdan çekilmiş ve bağımsızdır. Anakütle varyansı
σ 2 biliniyor. µ için güven aralığı oluşturmak istiyoruz.
• σ 2 bilindiğine göre güven aralıklarını aşağıdaki büyüklüğe dayandırabiliriz:
Z=
X −µ
√ ∼ N (0, 1)
σ/ n
• Standart Normal Dağılımın birikimli dağılım fonksiyonundan
P (Z < 1.645) = FZ (1.645) = 0.95, P (Z > 1.645) = 0.05 ve
P (Z < −1.645) = 0.05
• Öyleyse bir standart normal r.d.’nin %90 olasılıkla içinde kalacağı aralık:
P (−1.645 < Z < 1.645)
=
=
&
=
1 − P (Z > 1.645) − P (Z < −1.645)
1 − 0.05 − 0.05
0.90
%
YTÜ-İktisat İstatistik II
'
Aralık Tahmini I
5
$
Bir Normal Dağılım Ortalamasının µ Güven Aralıkları:
Populasyon Varyansı σ 2 Biliniyor
µ için %90 güven aralığı tahmin edicisi:
0.90
=
=
=
=
P (−1.645 < Z < 1.645)
X −µ
√ < 1.645
P −1.645 <
σ/ n
−1.645σ
1.645σ
√
P
<X −µ< √
n
n
1.645σ
1.645σ
P X− √
<µ<X+ √
n
n
Belli bir örneklem gerçekleşmesine dayanan güven aralığı şöyle olur:
x−
1.645σ
1.645σ
√
<µ<x+ √
n
n
&
YTÜ-İktisat İstatistik II
'
%
Aralık Tahmini I
6
$
Bir Normal Dağılım Ortalamasının µ Güven Aralıkları:
Populasyon Varyansı σ 2 Biliniyor
Basit Bir Simulasyon: N (5, 1) dağılımından çekilmiş n = 15 büyüklüğündeki
örneklemden hareketle µ için %90 güven aralığı oluşturmak istediğimizi
düşünelim. Bu deneyi N = 10 kere tekrarladığımızda oluşturulan güven
aralıkları:
&
%
YTÜ-İktisat İstatistik II
'
Aralık Tahmini I
7
Simulasyon No
X
a
b
µ = 5 içeriliyor mu?
1.0000
5.0755
4.6508
5.5002
evet
2.0000
5.0724
4.6477
5.4971
evet
3.0000
4.7330
4.3083
5.1577
evet
4.0000
5.1043
4.6796
5.5290
evet
5.0000
5.1145
4.6898
5.5392
evet
6.0000
5.0787
4.6540
5.5034
evet
7.0000
5.2688
4.8441
5.6935
evet
8.0000
4.5039
4.0792
4.9286
hayır
9.0000
5.0707
4.6460
5.4954
evet
10.0000
5.1370
4.7123
5.5617
evet
&
$
%
YTÜ-İktisat İstatistik II
'
Aralık Tahmini I
8
$
µ icin GUVEN ARALIKLARI, N=10
4
&
4.2
4.4
4.6
4.8
5
5.2
5.4
5.6
5.8
%
YTÜ-İktisat İstatistik II
'
Aralık Tahmini I
9
µ icin GUVEN ARALIKLARI, N=100
4
4.5
5
5.5
6
N = 100 için Güven Aralıkları. Bu 100 simulasyondan 91 tanesi gerçek µ
değerini içeriyor.
&
YTÜ-İktisat İstatistik II
'
3.5
Aralık Tahmini I
%
10
µ icin GUVEN ARALIKLARI, N=1000
4
4.5
5
5.5
$
6
N = 1000 için Güven Aralıkları. Bu 1000 simulasyondan 908 tanesi gerçek µ
değerini içeriyor.
&
$
6.5
%
YTÜ-İktisat İstatistik II
'
Aralık Tahmini I
11
$
Bir Normal Dağılım Ortalamasının µ Güven Aralıkları:
Populasyon Varyansı σ 2 Biliniyor
µ için %100(1 − α) güven aralığı tahmin edicisi:
1−α
= P (−zα/2 < Z < zα/2 )
X −µ
√ < zα/2
= P −zα/2 <
σ/ n
zα/2 σ
−zα/2 σ
√
<X −µ< √
= P
n
n
zα/2 σ
zα/2 σ
= P X− √
<µ<X+ √
n
n
Burada zα/2 , P (Z > zα/2 ) = α/2 olmasını sağlayan sayıdır. Belli bir örneklem
gerçekleşmesine dayanan güven aralığı şöyle olur:
zα/2 σ
zα/2 σ
x− √
<µ<x+ √
n
n
&
YTÜ-İktisat İstatistik II
'
%
Aralık Tahmini I
12
$
Bir Normal Dağılım Ortalamasının µ Güven Aralıkları:
Populasyon Varyansı σ 2 Biliniyor
Güven Aralıklarının Özellikleri
• (1 − α) ve n verilmişken, anakütle standart sapması σ büyüdükçe µ’nun
güven aralığı genişler.
• (1 − α) ve σ verilmişken, n büyüdükçe µ’nun güven aralığı daralır.
• n ve σ verilmişken, olasılık içeriği (güven düzeyi) (1 − α) yükseldikçe µ’nun
güven aralığı genişler.
&
%
YTÜ-İktisat İstatistik II
'
Aralık Tahmini I
13
Bir Anakütle Ortalamasının µ Güven Aralıkları:
BÜYÜK ÖRNEKLEMLERDE
Örneklem yeterince büyükse (gevşek kural n ≥ 30, sıkı kural n ≥ 100) MLT’den
hareketle µ için %100(1 − α) güven aralığı tahmin edicisi:
1−α
$
= P (−zα/2 < Z < zα/2 )
X −µ
√ < zα/2
= P −zα/2 <
sx / n
zα/2 sx
−zα/2 sx
√
= P
<X −µ< √
n
n
zα/2 sx
zα/2 sx
<µ<X+ √
= P X− √
n
n
Burada sx örneklem standart sapmasıdır. Anakütle normal dağılmasa da
yukarıdaki g.a.t.e. yaklaşık olarak doğrudur. Belli bir örneklem gerçekleşmesine
dayanan güven aralığı şöyle olur:
&
x−
YTÜ-İktisat İstatistik II
'
zα/2 sx
zα/2 sx
√
<µ<x+ √
n
n
Aralık Tahmini I
%
14
STUDENT t DAĞILIMI: TANIM: Z ve Y şu şekilde dağılan birbirinden
bağımsız iki r.d. olsun: Z ∼ N (0, 1), ve Y ∼ χ2ν . Aşağıda tanımlanan r.d. ν
serbestlik derecesi ile Student t Dağılımına uyar.
$
Z
∼ tν
tν = p
Y /ν
tν rassal değişkeni ν s.d. ile Student t dağılımına uyar. Buradaki ν s.d. paydada
yer alan ki-kare r.d.’nin serbestlik derecesidir.
• ν serbestlik derecesine sahip Student t Dağılımının o.y.f.:
Γ ν+1
1
2
√
, −∞ < t < ∞
f (t) =
Γ(ν/2) πν (1 + (t2 /ν))(ν+1)/2
• Tek parametreli (ν) ve simetrik bir dağılımdır. E(tν ) = 0 ve ν ≥ 3 için
V ar(tν ) = ν/(ν − 2)
• ν → ∞, tν → N (0, 1)
• İzleyen grafikler çeşitli s.d.ne sahip t yoğunluklarını std normal ile
karşılaştırmalı olarak göstermektedir.
&
%
YTÜ-İktisat İstatistik II
'
Aralık Tahmini I
15
$
0.4
Standart Normal
tν ν=1
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
−5
−4
−3
−2
−1
0
1
2
3
4
5
&
%
YTÜ-İktisat İstatistik II
'
Aralık Tahmini I
16
$
0.4
Standart Normal
tν ν=1
t ν=2
ν
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
−5
&
−4
−3
−2
−1
0
1
2
3
4
5
%
YTÜ-İktisat İstatistik II
'
Aralık Tahmini I
17
$
0.4
Standart Normal
t ν=1
ν
t ν=2
ν
0.35
tν ν=3
0.3
0.25
0.2
0.15
0.1
0.05
0
−5
−4
−3
−2
−1
0
1
2
3
4
5
&
%
YTÜ-İktisat İstatistik II
'
Aralık Tahmini I
18
$
0.4
Standart Normal
tν ν=1
t ν=2
ν
0.35
tν ν=3
t ν=4
ν
0.3
0.25
0.2
0.15
0.1
0.05
0
−5
&
−4
−3
−2
−1
0
1
2
3
4
5
%
YTÜ-İktisat İstatistik II
'
Aralık Tahmini I
19
$
0.4
Standart Normal
t ν=1
ν
t ν=2
ν
0.35
t ν=3
ν
t ν=4
ν
t ν=5
0.3
ν
0.25
0.2
0.15
0.1
0.05
0
−5
−4
−3
−2
−1
0
1
2
3
4
5
&
%
YTÜ-İktisat İstatistik II
'
Aralık Tahmini I
20
$
0.4
Standart Normal
t ν=1
ν
t ν=2
ν
0.35
t ν=3
ν
t ν=4
ν
t ν=5
0.3
ν
tν ν=10
0.25
0.2
0.15
0.1
0.05
0
−5
&
−4
−3
−2
−1
0
1
2
3
4
5
%
YTÜ-İktisat İstatistik II
'
Aralık Tahmini I
21
$
0.4
Standart Normal
t ν=1
ν
t ν=2
ν
0.35
tν ν=3
t ν=4
ν
t ν=5
0.3
ν
tν ν=10
t ν=20
ν
0.25
0.2
0.15
0.1
0.05
0
−5
−4
−3
−2
−1
0
1
2
3
4
5
&
%
YTÜ-İktisat İstatistik II
'
Aralık Tahmini I
22
$
0.4
Standart Normal
t ν=1
ν
t ν=2
ν
0.35
t ν=3
ν
t ν=4
ν
t ν=5
0.3
ν
t ν=10
ν
t ν=20
ν
tν ν=30
0.25
0.2
0.15
0.1
0.05
0
−5
&
−4
−3
−2
−1
0
1
2
3
4
5
%
YTÜ-İktisat İstatistik II
'
Aralık Tahmini I
$
23
STUDENT t DAĞILIMI
Olasılıkların hesaplanması (Ek Çizelge 6, s.941):
tν , ν s.d. ile Student t dağılımına uyan bir rassal değikeni ifade etsin. tν,α
aşağıdaki eşitliği sağlayan sayı olarak tanımlanır:
P (tν > tν,α ) = α
Örneğin ν = 5 ve α = 0.05 için yukarıdaki eşitliği sağlayan sayı tν,α = 2.015’dir:
P (t5 > 2.015) = 0.05
Standart Normal dağılımla karşılaştırırsak:
P (Z > 2.015) ≈ 1 − 0.9781 = 0.0219
Ya da eşik değerlerini karşılaştırırsak:
P (Z > 1.645) = 0.05
Burada 2.015 > 1.645 olduğuna dikkat edin. Genel olarak tν,α ≥ zα yazılabilir.
P (Z > zα ) = α olduğunu hatırlayın.
&
%
YTÜ-İktisat İstatistik II
'
$
Aralık Tahmini I
24
5 s.d. Student t dagilimi
0.4
0.35
0.3
0.25
0.2
0.15
0.1
P(t5>2.015)=α=0.05
1−α
0.05
α
0
−5
&
−4
−3
−2
−1
0
1
2
3
4
t
5 5
%
YTÜ-İktisat İstatistik II
'
Aralık Tahmini I
25
$
STUDENT t DAĞILIMI
Olasılıkların hesaplanması (Ek Çizelge 6, s.941):
Küçük örneklemlerde Student t dağılımı Normal Dağılıma göre daha yayvandır.
Bu nedenle kuyruk olasılıkları daha büyüktür. ν büyüdükçe bu olasılıklar
birbirine yaklaşır. Örneğin ν = 60 için
P (t60 > 1.671) = 0.05,
ve
P (Z > 1.671) =≈ 1 − 0.9525 = 0.0475
Yani, ν → ∞, tν,α → zα
Ek Çizelge 6’nın son satırına baktığımızda eşik değerlerinin standart normal
dağılımla aynı olduğu görülebilir.
&
%
YTÜ-İktisat İstatistik II
'
Aralık Tahmini I
26
$
5 s.d. t dagilimi ve standard normal dagilim
0.4
0.35
Std Normal
0.3
0.25
0.2
0.15
0.1
t5
0.05
0
−5
&
−4
−3
−2
−1
0
1
2
3
4
5
%
YTÜ-İktisat İstatistik II
'
Aralık Tahmini I
27
STUDENT t DAĞILIMI
$
Olasılıkların hesaplanması (Ek Çizelge 6, s.941):
ν serbestlik derecesine sahip bir t rassal değişkeninin %100(1 − α) olasılıkla
içinde yer alacağı iki değer bulmak istiyoruz. t eşik değerleri tablosundan ve
simetri özelliğinden hareketle
α
α
P tν > tν,α/2 = , ve P tν < −tν,α/2 =
2
2
Olasılık parantezi içinde yer alan olaylar birbiriyle bağdaşmaz ve bütünü
kapsayıcı olduğuna göre:
P (−tν,α/2 < tν < tν,α/2 )
=
=
=
1 − P (tν > tν,α/2 ) − P (tν < −tν,α/2 )
α α
1− −
2
2
1−α
Örneğin ν = 10 ve 1 − α = 0.95 için t10,0.025 = 2.228, P (t10 > 2.228) = 0.025 ve
P (t10 < −2.228) = 0.025, buradan
P (−2.228 < t10 < 2.228) = 1 − 0.025 − 0.025 = 0.95
&
YTÜ-İktisat İstatistik II
'
%
Aralık Tahmini I
28
$
10 s.d. Student t dagilimi
0.4
0.35
0.3
0.25
0.2
0.15
0.1
P(−2.228<t10<2.228) = 1−α
0.05
0
−5
&
α = 0.025
−4
α = 0.025
1−α = 0.95
−3
−2
−2.228
−1
0
1
2
2.228
3
4
5
%
YTÜ-İktisat İstatistik II
'
Aralık Tahmini I
29
$
Bir Normal Dağılım Ortalamasının Güven Aralıkları: Anakütle Varyansı
Bilinmiyor:
Ortalaması µ bilinmeyen varyansı σ 2 olan normal bir anakütleden n boyutlu
rassal bir örneklem çekildiğini ve örneklem bilgisinden hareketle µ’nun
%100(1 − α) güven aralığının istendiğini düşünelim.
Varyansın bilinmediği durumda, daha önce yaptığımız gibi standart normal
dağılımı kullanamayız. Bilinmeyen varyansı örneklem bilgisinden hareketle
tahmin etmemiz gerekir. σ 2 ’nin sapmasız bir t.e.’nin s2x olduğunu daha önce
görmüştük.
Kullanacağımız örnekleme dağılımı varyansa ilişkin belirsizliği de gözönünde
bulundurmalıdır.
&
%
YTÜ-İktisat İstatistik II
'
Aralık Tahmini I
30
$
Bir Normal Dağılım Ortalamasının Güven Aralıkları: Anakütle Varyansı
Bilinmiyor:
Bu varsayımlar altında aşağıdaki iki büyüklük birbirinden istatistik bakımından
bağımsızdır.
Pn
2
X −µ
(n − 1)s2x
i=1 (Xi − X)
√ ∼ N (0, 1), ve
=
∼ χ2n−1
σ2
σ2
σ/ n
olduğunu hatırlarsak t dağılımının tanımından hareketle
X−µ
√
σ/ n
q
(n−1)s2x
σ2
/(n − 1)
=
X −µ
√
sx / n
Bu rassal değişken n − 1 serbestlik derecesi ile Student t dağılımına uyar.
tn−1 =
&
X −µ
√ ∼ tn−1
sx / n
%
YTÜ-İktisat İstatistik II
'
Aralık Tahmini I
31
$
Bir Normal Dağılım Ortalamasının Güven Aralıkları: Anakütle Varyansı
Bilinmiyor:
µ’nun %100(1 − α) güven aralığı şöyle oluşturulabilir:
1 − α = P −tn−1,α/2 < tn−1 < tn−1,α/2
X −µ
√ < tn−1,α/2
= P −tn−1,α/2 <
sx / n
tn−1,α/2 sx
−tn−1,α/2 sx
√
√
= P
<X −µ<
n
n
tn−1,α/2 sx
tn−1,α/2 sx
√
√
<µ<X+
= P X−
n
n
x̄ ve sx belli örneklem tahminleriyse %100(1 − α) güven aralığı
x̄ −
tn−1,α/2 sx
tn−1,α/2 sx
√
√
< µ < x̄ +
n
n
ÖRNEK 8.4, s.316, 8.5, s. 317
&
%
Download