YTÜ-İktisat İstatistik II ' Aralık Tahmini I 1 ARALIK TAHMİNİ (INTERVAL ESTIMATION): $ • Nokta tahmininde ilgilenilen anakütle parametresine ilişkin örneklem bilgisinden hareketle tek bir sayı üretilir. • Bir nokta tahmini çoğunlukla bilinmeyen parametreye ilişkin oluşturacağımız en iyi bahis olarak düşünülebilir. • Ancak bir nokta tahmini, bu tahminin bilinmeyen gerçek populasyon parametresine ne kadar yakın olabileceğine, başka bir deyişle, doğru parametre değerine hangi olasılıkla ve ne kadar yakın olduğuna ilişkin bir şey söylemez. • Örneğin büyük bir parti maldan rassal çekilmiş parçaların %10’unun kusurlu olduğu tahmini yapılmış olsun. Aralık tahmininde gerçek kusurlu oranının %5 ile %15 ya da %8 ile %12 gibi iki değer arasında olmasından ne kadar emin olabiliriz sorusuna cevap aranır. • Aralık tahmini bilinmeyen parametreye ilişkin belirsizliği açık olarak yansıtır. & YTÜ-İktisat İstatistik II ' Aralık Tahmini I % 2 ARALIK TAHMİNİ: $ • Bir anakütle katsayısının aralık tahmin edicisi, o anakütle katsayısının içine düşebileceği bir aralığı örneklem bilgisine dayanarak belirlemenin kuralıdır. • Buna karşılık gelen tahmine de aralık tahmini denir. • θ bilinmeyen populasyon parametresi olsun. θ’nın aralık tahmin edicisi P (A < θ < B) = 1 − α, B>A • Burada A ve B örneklem bilgisine bağlıdır ve rassal değişkendir. A: alt güven sınırı, B: üst güven sınırı • 1 − α: güven düzeyi ya da olasılık içeriği • A ve B’nin belli örneklem gerçekleşmelerini a ve b ile gösterirsek, bu (a, b) aralığına θ’nın %100(1 − α) güven aralığı denir: & a<θ<b % YTÜ-İktisat İstatistik II ' Aralık Tahmini I 3 $ ARALIK TAHMİNİ: Güven Aralığının Anlamı: • Olasılığın göreli sıklık (relative frequency) yorumu • X1 , X2 , . . . , Xn rassal değişkenlerinin belli gerçekleşmeleri x1 , x2 , . . . , xn örneklem değerlerinden hareketle θ için güven aralığını oluşturduğumuzu düşünelim. Bu aralığa [a1 , b1 ] diyelim. • Anakütleden yeniden aynı kurallarla başka bir örneklem çekilsin. Bu örneklemden hareketle oluşturulan güven aralığına da [a2 , b2 ] diyelim. • Bu işlemi çok sayıda, diyelim ki N kere tekrarlamış olalım. Elimizde N tane güven aralığı olacaktır: {[a1 , b1 ], [a2 , b2 ], . . . , [aN , bN ]} • Güven katsayısı 1 − α’nın anlamı şudur: Bu N güven aralığından %100(1 − α) kadarı doğru anakütle parametresi θ’yı içerecektir. & % YTÜ-İktisat İstatistik II ' Aralık Tahmini I 4 Bir Normal Dağılım Ortalamasının µ Güven Aralıkları: Populasyon Varyansı σ 2 Biliniyor $ Varsayım: X1 , X2 , . . . , Xn rassal değişkenlerinin her biri ortalaması µ varyansı σ 2 olan bir NORMAL dağılımdan çekilmiş ve bağımsızdır. Anakütle varyansı σ 2 biliniyor. µ için güven aralığı oluşturmak istiyoruz. • σ 2 bilindiğine göre güven aralıklarını aşağıdaki büyüklüğe dayandırabiliriz: Z= X −µ √ ∼ N (0, 1) σ/ n • Standart Normal Dağılımın birikimli dağılım fonksiyonundan P (Z < 1.645) = FZ (1.645) = 0.95, P (Z > 1.645) = 0.05 ve P (Z < −1.645) = 0.05 • Öyleyse bir standart normal r.d.’nin %90 olasılıkla içinde kalacağı aralık: P (−1.645 < Z < 1.645) = = & = 1 − P (Z > 1.645) − P (Z < −1.645) 1 − 0.05 − 0.05 0.90 % YTÜ-İktisat İstatistik II ' Aralık Tahmini I 5 $ Bir Normal Dağılım Ortalamasının µ Güven Aralıkları: Populasyon Varyansı σ 2 Biliniyor µ için %90 güven aralığı tahmin edicisi: 0.90 = = = = P (−1.645 < Z < 1.645) X −µ √ < 1.645 P −1.645 < σ/ n −1.645σ 1.645σ √ P <X −µ< √ n n 1.645σ 1.645σ P X− √ <µ<X+ √ n n Belli bir örneklem gerçekleşmesine dayanan güven aralığı şöyle olur: x− 1.645σ 1.645σ √ <µ<x+ √ n n & YTÜ-İktisat İstatistik II ' % Aralık Tahmini I 6 $ Bir Normal Dağılım Ortalamasının µ Güven Aralıkları: Populasyon Varyansı σ 2 Biliniyor Basit Bir Simulasyon: N (5, 1) dağılımından çekilmiş n = 15 büyüklüğündeki örneklemden hareketle µ için %90 güven aralığı oluşturmak istediğimizi düşünelim. Bu deneyi N = 10 kere tekrarladığımızda oluşturulan güven aralıkları: & % YTÜ-İktisat İstatistik II ' Aralık Tahmini I 7 Simulasyon No X a b µ = 5 içeriliyor mu? 1.0000 5.0755 4.6508 5.5002 evet 2.0000 5.0724 4.6477 5.4971 evet 3.0000 4.7330 4.3083 5.1577 evet 4.0000 5.1043 4.6796 5.5290 evet 5.0000 5.1145 4.6898 5.5392 evet 6.0000 5.0787 4.6540 5.5034 evet 7.0000 5.2688 4.8441 5.6935 evet 8.0000 4.5039 4.0792 4.9286 hayır 9.0000 5.0707 4.6460 5.4954 evet 10.0000 5.1370 4.7123 5.5617 evet & $ % YTÜ-İktisat İstatistik II ' Aralık Tahmini I 8 $ µ icin GUVEN ARALIKLARI, N=10 4 & 4.2 4.4 4.6 4.8 5 5.2 5.4 5.6 5.8 % YTÜ-İktisat İstatistik II ' Aralık Tahmini I 9 µ icin GUVEN ARALIKLARI, N=100 4 4.5 5 5.5 6 N = 100 için Güven Aralıkları. Bu 100 simulasyondan 91 tanesi gerçek µ değerini içeriyor. & YTÜ-İktisat İstatistik II ' 3.5 Aralık Tahmini I % 10 µ icin GUVEN ARALIKLARI, N=1000 4 4.5 5 5.5 $ 6 N = 1000 için Güven Aralıkları. Bu 1000 simulasyondan 908 tanesi gerçek µ değerini içeriyor. & $ 6.5 % YTÜ-İktisat İstatistik II ' Aralık Tahmini I 11 $ Bir Normal Dağılım Ortalamasının µ Güven Aralıkları: Populasyon Varyansı σ 2 Biliniyor µ için %100(1 − α) güven aralığı tahmin edicisi: 1−α = P (−zα/2 < Z < zα/2 ) X −µ √ < zα/2 = P −zα/2 < σ/ n zα/2 σ −zα/2 σ √ <X −µ< √ = P n n zα/2 σ zα/2 σ = P X− √ <µ<X+ √ n n Burada zα/2 , P (Z > zα/2 ) = α/2 olmasını sağlayan sayıdır. Belli bir örneklem gerçekleşmesine dayanan güven aralığı şöyle olur: zα/2 σ zα/2 σ x− √ <µ<x+ √ n n & YTÜ-İktisat İstatistik II ' % Aralık Tahmini I 12 $ Bir Normal Dağılım Ortalamasının µ Güven Aralıkları: Populasyon Varyansı σ 2 Biliniyor Güven Aralıklarının Özellikleri • (1 − α) ve n verilmişken, anakütle standart sapması σ büyüdükçe µ’nun güven aralığı genişler. • (1 − α) ve σ verilmişken, n büyüdükçe µ’nun güven aralığı daralır. • n ve σ verilmişken, olasılık içeriği (güven düzeyi) (1 − α) yükseldikçe µ’nun güven aralığı genişler. & % YTÜ-İktisat İstatistik II ' Aralık Tahmini I 13 Bir Anakütle Ortalamasının µ Güven Aralıkları: BÜYÜK ÖRNEKLEMLERDE Örneklem yeterince büyükse (gevşek kural n ≥ 30, sıkı kural n ≥ 100) MLT’den hareketle µ için %100(1 − α) güven aralığı tahmin edicisi: 1−α $ = P (−zα/2 < Z < zα/2 ) X −µ √ < zα/2 = P −zα/2 < sx / n zα/2 sx −zα/2 sx √ = P <X −µ< √ n n zα/2 sx zα/2 sx <µ<X+ √ = P X− √ n n Burada sx örneklem standart sapmasıdır. Anakütle normal dağılmasa da yukarıdaki g.a.t.e. yaklaşık olarak doğrudur. Belli bir örneklem gerçekleşmesine dayanan güven aralığı şöyle olur: & x− YTÜ-İktisat İstatistik II ' zα/2 sx zα/2 sx √ <µ<x+ √ n n Aralık Tahmini I % 14 STUDENT t DAĞILIMI: TANIM: Z ve Y şu şekilde dağılan birbirinden bağımsız iki r.d. olsun: Z ∼ N (0, 1), ve Y ∼ χ2ν . Aşağıda tanımlanan r.d. ν serbestlik derecesi ile Student t Dağılımına uyar. $ Z ∼ tν tν = p Y /ν tν rassal değişkeni ν s.d. ile Student t dağılımına uyar. Buradaki ν s.d. paydada yer alan ki-kare r.d.’nin serbestlik derecesidir. • ν serbestlik derecesine sahip Student t Dağılımının o.y.f.: Γ ν+1 1 2 √ , −∞ < t < ∞ f (t) = Γ(ν/2) πν (1 + (t2 /ν))(ν+1)/2 • Tek parametreli (ν) ve simetrik bir dağılımdır. E(tν ) = 0 ve ν ≥ 3 için V ar(tν ) = ν/(ν − 2) • ν → ∞, tν → N (0, 1) • İzleyen grafikler çeşitli s.d.ne sahip t yoğunluklarını std normal ile karşılaştırmalı olarak göstermektedir. & % YTÜ-İktisat İstatistik II ' Aralık Tahmini I 15 $ 0.4 Standart Normal tν ν=1 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 −5 −4 −3 −2 −1 0 1 2 3 4 5 & % YTÜ-İktisat İstatistik II ' Aralık Tahmini I 16 $ 0.4 Standart Normal tν ν=1 t ν=2 ν 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 −5 & −4 −3 −2 −1 0 1 2 3 4 5 % YTÜ-İktisat İstatistik II ' Aralık Tahmini I 17 $ 0.4 Standart Normal t ν=1 ν t ν=2 ν 0.35 tν ν=3 0.3 0.25 0.2 0.15 0.1 0.05 0 −5 −4 −3 −2 −1 0 1 2 3 4 5 & % YTÜ-İktisat İstatistik II ' Aralık Tahmini I 18 $ 0.4 Standart Normal tν ν=1 t ν=2 ν 0.35 tν ν=3 t ν=4 ν 0.3 0.25 0.2 0.15 0.1 0.05 0 −5 & −4 −3 −2 −1 0 1 2 3 4 5 % YTÜ-İktisat İstatistik II ' Aralık Tahmini I 19 $ 0.4 Standart Normal t ν=1 ν t ν=2 ν 0.35 t ν=3 ν t ν=4 ν t ν=5 0.3 ν 0.25 0.2 0.15 0.1 0.05 0 −5 −4 −3 −2 −1 0 1 2 3 4 5 & % YTÜ-İktisat İstatistik II ' Aralık Tahmini I 20 $ 0.4 Standart Normal t ν=1 ν t ν=2 ν 0.35 t ν=3 ν t ν=4 ν t ν=5 0.3 ν tν ν=10 0.25 0.2 0.15 0.1 0.05 0 −5 & −4 −3 −2 −1 0 1 2 3 4 5 % YTÜ-İktisat İstatistik II ' Aralık Tahmini I 21 $ 0.4 Standart Normal t ν=1 ν t ν=2 ν 0.35 tν ν=3 t ν=4 ν t ν=5 0.3 ν tν ν=10 t ν=20 ν 0.25 0.2 0.15 0.1 0.05 0 −5 −4 −3 −2 −1 0 1 2 3 4 5 & % YTÜ-İktisat İstatistik II ' Aralık Tahmini I 22 $ 0.4 Standart Normal t ν=1 ν t ν=2 ν 0.35 t ν=3 ν t ν=4 ν t ν=5 0.3 ν t ν=10 ν t ν=20 ν tν ν=30 0.25 0.2 0.15 0.1 0.05 0 −5 & −4 −3 −2 −1 0 1 2 3 4 5 % YTÜ-İktisat İstatistik II ' Aralık Tahmini I $ 23 STUDENT t DAĞILIMI Olasılıkların hesaplanması (Ek Çizelge 6, s.941): tν , ν s.d. ile Student t dağılımına uyan bir rassal değikeni ifade etsin. tν,α aşağıdaki eşitliği sağlayan sayı olarak tanımlanır: P (tν > tν,α ) = α Örneğin ν = 5 ve α = 0.05 için yukarıdaki eşitliği sağlayan sayı tν,α = 2.015’dir: P (t5 > 2.015) = 0.05 Standart Normal dağılımla karşılaştırırsak: P (Z > 2.015) ≈ 1 − 0.9781 = 0.0219 Ya da eşik değerlerini karşılaştırırsak: P (Z > 1.645) = 0.05 Burada 2.015 > 1.645 olduğuna dikkat edin. Genel olarak tν,α ≥ zα yazılabilir. P (Z > zα ) = α olduğunu hatırlayın. & % YTÜ-İktisat İstatistik II ' $ Aralık Tahmini I 24 5 s.d. Student t dagilimi 0.4 0.35 0.3 0.25 0.2 0.15 0.1 P(t5>2.015)=α=0.05 1−α 0.05 α 0 −5 & −4 −3 −2 −1 0 1 2 3 4 t 5 5 % YTÜ-İktisat İstatistik II ' Aralık Tahmini I 25 $ STUDENT t DAĞILIMI Olasılıkların hesaplanması (Ek Çizelge 6, s.941): Küçük örneklemlerde Student t dağılımı Normal Dağılıma göre daha yayvandır. Bu nedenle kuyruk olasılıkları daha büyüktür. ν büyüdükçe bu olasılıklar birbirine yaklaşır. Örneğin ν = 60 için P (t60 > 1.671) = 0.05, ve P (Z > 1.671) =≈ 1 − 0.9525 = 0.0475 Yani, ν → ∞, tν,α → zα Ek Çizelge 6’nın son satırına baktığımızda eşik değerlerinin standart normal dağılımla aynı olduğu görülebilir. & % YTÜ-İktisat İstatistik II ' Aralık Tahmini I 26 $ 5 s.d. t dagilimi ve standard normal dagilim 0.4 0.35 Std Normal 0.3 0.25 0.2 0.15 0.1 t5 0.05 0 −5 & −4 −3 −2 −1 0 1 2 3 4 5 % YTÜ-İktisat İstatistik II ' Aralık Tahmini I 27 STUDENT t DAĞILIMI $ Olasılıkların hesaplanması (Ek Çizelge 6, s.941): ν serbestlik derecesine sahip bir t rassal değişkeninin %100(1 − α) olasılıkla içinde yer alacağı iki değer bulmak istiyoruz. t eşik değerleri tablosundan ve simetri özelliğinden hareketle α α P tν > tν,α/2 = , ve P tν < −tν,α/2 = 2 2 Olasılık parantezi içinde yer alan olaylar birbiriyle bağdaşmaz ve bütünü kapsayıcı olduğuna göre: P (−tν,α/2 < tν < tν,α/2 ) = = = 1 − P (tν > tν,α/2 ) − P (tν < −tν,α/2 ) α α 1− − 2 2 1−α Örneğin ν = 10 ve 1 − α = 0.95 için t10,0.025 = 2.228, P (t10 > 2.228) = 0.025 ve P (t10 < −2.228) = 0.025, buradan P (−2.228 < t10 < 2.228) = 1 − 0.025 − 0.025 = 0.95 & YTÜ-İktisat İstatistik II ' % Aralık Tahmini I 28 $ 10 s.d. Student t dagilimi 0.4 0.35 0.3 0.25 0.2 0.15 0.1 P(−2.228<t10<2.228) = 1−α 0.05 0 −5 & α = 0.025 −4 α = 0.025 1−α = 0.95 −3 −2 −2.228 −1 0 1 2 2.228 3 4 5 % YTÜ-İktisat İstatistik II ' Aralık Tahmini I 29 $ Bir Normal Dağılım Ortalamasının Güven Aralıkları: Anakütle Varyansı Bilinmiyor: Ortalaması µ bilinmeyen varyansı σ 2 olan normal bir anakütleden n boyutlu rassal bir örneklem çekildiğini ve örneklem bilgisinden hareketle µ’nun %100(1 − α) güven aralığının istendiğini düşünelim. Varyansın bilinmediği durumda, daha önce yaptığımız gibi standart normal dağılımı kullanamayız. Bilinmeyen varyansı örneklem bilgisinden hareketle tahmin etmemiz gerekir. σ 2 ’nin sapmasız bir t.e.’nin s2x olduğunu daha önce görmüştük. Kullanacağımız örnekleme dağılımı varyansa ilişkin belirsizliği de gözönünde bulundurmalıdır. & % YTÜ-İktisat İstatistik II ' Aralık Tahmini I 30 $ Bir Normal Dağılım Ortalamasının Güven Aralıkları: Anakütle Varyansı Bilinmiyor: Bu varsayımlar altında aşağıdaki iki büyüklük birbirinden istatistik bakımından bağımsızdır. Pn 2 X −µ (n − 1)s2x i=1 (Xi − X) √ ∼ N (0, 1), ve = ∼ χ2n−1 σ2 σ2 σ/ n olduğunu hatırlarsak t dağılımının tanımından hareketle X−µ √ σ/ n q (n−1)s2x σ2 /(n − 1) = X −µ √ sx / n Bu rassal değişken n − 1 serbestlik derecesi ile Student t dağılımına uyar. tn−1 = & X −µ √ ∼ tn−1 sx / n % YTÜ-İktisat İstatistik II ' Aralık Tahmini I 31 $ Bir Normal Dağılım Ortalamasının Güven Aralıkları: Anakütle Varyansı Bilinmiyor: µ’nun %100(1 − α) güven aralığı şöyle oluşturulabilir: 1 − α = P −tn−1,α/2 < tn−1 < tn−1,α/2 X −µ √ < tn−1,α/2 = P −tn−1,α/2 < sx / n tn−1,α/2 sx −tn−1,α/2 sx √ √ = P <X −µ< n n tn−1,α/2 sx tn−1,α/2 sx √ √ <µ<X+ = P X− n n x̄ ve sx belli örneklem tahminleriyse %100(1 − α) güven aralığı x̄ − tn−1,α/2 sx tn−1,α/2 sx √ √ < µ < x̄ + n n ÖRNEK 8.4, s.316, 8.5, s. 317 & %