MERKEZİ LİMİT TEOREMİ Günlük yaşantımız içerisindeki uygulamaların çoğunda karşılaşılan şans değişkeni ( x ), oldukça büyük sayıda bağımsız şans değişkeninin toplamı yada ortalaması ( doğrusal bir fonksiyonu ) dır. x1 , x2 ..............., xn n tane bağımsız şans değişkeni olsun. Ortalamaları varyansı x x1 x2 .......... xn elde edilen yeni değişken için aşağıdakiler söylenebilir. E x E x1 E x2 ........... E xn Varx Varx1 Varx2 ........... Varxn Ex n Varx n 2 X E X X n X n X n n n z 2 n n n Var X n x x n n n n 1 Tanım1: Merkezi Limit Teoremi ortalaması 2 olan ve birbirinden farklı dağılımlara uyan n adet bağımsız şans değişkeni olsun. Bu şans değişkenlerinin toplamını X, ortalamasını x ile gösterelim, n büyüdükçe, x n x z n 2 n olan z değişkeni standart normal dağılışa yaklaşır. 2 x1 , x2 ..............., xn ; Tanım2: Eğer n gözlemlik bir şans örneği herhangi bir populasyondan seçilirse, ve n yeteri kadar büyük ise, x ’nın örnekleme dağılışı normal dağılış olacaktır. Örnek büyüklüğü n büyüdükçe, x ’nın örnekleme dağılışına normalite yaklaşımı daha iyi olur. 3 n adet bağımsız üniform x şans değişkeninin ortalamasının olasılık yoğunluk fonksiyonları f( x ) f( x ) n=1 x n=2 x f( x ) n=10 x 4 Teorem: Normal dağılışa sahip bir populasyondan çekilen örneklerin ortalamaları, örnek büyüklüğü dikkate alınmaksızın, normal dağılışa sahiptir. Teorem: Örnek büyüklüğü artışı ile ( n → ∞ ) herhangi bir dağılıştan çekilen örneklerin ortalamalarının normal dağılışa yaklaşır. Bu teorem merkezi limit teoremidir. 2 2 Not: x 5 Teorem: Eğer, ortalaması standart sapması olan bir dağılıştan n hacimli şans örnekleri çekilir ise bu örneklerin aritmetik ortalamaları; ortalaması ve standart sapması n olan yaklaşık normal dağılış gösterir. Bu yaklaşım n büyüdükçe daha doğru olur. Veya bir başka ifadeyle, Tekrar tekrar örnek alındığında eğer n yeteri kadar büyükse, gözlemlerin toplamı da yani, n xi , ortalaması n, standart sapması olan normal dağılış gösterir. 6 Bu teorem iki bakımdan önemlidir. 1) Niçin bazı gözlemler yaklaşık normal dağılış gösterir. 2) Tahminleyicilerin gösterdiği varsayım hakkında karar verilir. normal dağılış ile populasyon Teoremin sakıncası “ n yeteri kadar büyük olmalıdır “ cümlesinin anlamı amaca göre değişir. Ancak her zaman doğru olmamakla beraber bayağı küçük örnekler için de geçerli olabilir. 7 Farklı örnek büyüklükleri ( n ) ve farklı populasyonlar için ’nın örnekleme dağılışı orjinal populasyon n=2 için n=5 için n=30 için x x x 8 x Örnek: X ~ Bernoulli(p ) olan bir populasyondan n hacimlik bir örnek alındığına göre; a) x ’nın örnekleme dağılışının ortalamasını ve standart sapmasını bulunuz. E ( x) 0(q) 1( p) p 2 E ( x ) 2 0 p 2 q 1 p 2 p p q q p pq( p q) pq 2 2 b) p = 0.8 ve n = 1, 10, 25, 100 için örnek ortalamasını ve standart sapmasını formüle ediniz. x p 0.8 x pq (0.8)(0.2) 0.4 n n n E(x) p x n pq n n x x 1 10 25 100 0,8 0,8 0,8 0,8 0,4 0,1265 0,08 0,04 9 ÖRNEKLEME DAĞILIŞI Parametre n adet ölçümden oluşan bir örnekten hesaplanan bir örnek istatistiği için örnekleme dağılışı, bu istatistiğin bir olasılık dağılışıdır. Aritmetik ortalama Medyan Varyans Standart sapma M Örnek istatistiği 2 m s2 s ÖRNEK : Büyük bir populasyondan alınmış 3 ölçümün (0, 3, 12) olasılık dağılışı aşağıdaki gibidir. x P(x) 0 1 3 3 1 3 12 1 3 10 Mümkün Örnekler (n = 3 için) x m Olasılık 0 0 0 0 0 1 0 0 3 1 0 1 0 0 12 4 0 1 0 3 0 1 0 1 0 3 3 2 3 1 0 3 12 5 3 1 0 12 0 4 0 1 0 12 3 5 3 1 0 12 12 8 12 1 3 0 0 1 0 1 3 0 3 2 3 1 3 0 12 5 3 1 3 3 0 2 3 1 27 p=x/n (toplamın tek sayı gelmesi durumu) 0/3 27 1/3 27 0/3 27 1/3 27 2/3 27 1/3 27 0/3 27 1/3 27 0/3 27 1/3 27 2/3 27 1/3 27 2/3 11 Mümkün Örnekler (n = 3 için) x m Olasılık 3 3 3 3 3 1 3 3 12 6 3 1 3 12 0 5 3 1 3 12 3 6 3 1 3 12 12 9 12 1 12 0 0 4 0 1 12 0 3 5 3 1 12 0 12 8 12 1 12 3 0 5 3 1 12 3 3 6 3 1 12 3 12 9 12 1 12 12 0 8 12 1 12 12 3 9 12 1 12 12 12 12 12 1 27 p=x/n (toplamın tek sayı gelmesi durumu) 3/3 27 2/3 27 1/3 27 2/3 27 1/3 27 0/3 27 1/3 27 0/3 27 1/3 27 2/3 27 1/3 27 0/3 27 1/3 27 0/3 12 Aritmetik Ortalama Örnekleme Dağılışı x 0 P x 1 27 1 3 27 2 3 3 1 27 27 4 3 27 5 6 6 3 27 27 8 3 27 9 12 3 27 1 27 Medyan Örnekleme Dağılışı m P (m) 0 7 27 3 13 27 12 7 27 13 Örnek: Buca ilçesindeki kiralık evlerin aylık kira ücretlerinin ortalaması 400 YTL., standart sapması 10 YTL. olan Normal Dağılışa uygun olduğu bilinmektedir. a)Kiralık bir evin aylık kira miktarının 380 YTL. İle 410 YTL. arasında olma olasılığını hesaplayınız. b)36 kiralık evin aylık kira miktarlarının ortalamasının 395 YTL ile 402 YTL arasında olma olasılığını hesaplayınız. 400 YTL. 10 YTL. a) P ( 380 < X < 410 ) = ? 410 400 380 400 P(380 X 410) P z P(2 z 1) 10 10 0,4772 0,3413 0,8185 b) P ( 395 < x < 420) = ? 395 400 402 400 P(3 z 1,2) P(395 x 402) P z 10 36 10 36 14 0,4987 0,3849 0,8836 İSTATİSTİKSEL TAHMİNLEME VE ÖRNEKLEME TEORİSİ İSTATİSTİKSEL TAHMİNLEME VE YORUMLAMA SÜRECİ YORUMLAMA SÜRECİ ÖRNEKLEME VE ÖRNEKLEME ÖRNEKLEME VE ÖRNEKLEME DAĞILIMLARI DAĞILIMLARI 15 Yorumlama süreci Tahminler ve testler Populasyon Örnek İstatistikleri ( X , ps) Örnek 16 Örnek Tipleri Örnek Tipi Olasılık Dışı Olasılık Basit Şans Yargı Kota Sistematik Tabakalı Kümeli Kitle 17 Niçin Örnek? Anakütle parametrelerinin örnek değerleri(örnek istatistikleri) yardımıyla tahmin edilmesine imkan sağlamak modern istatistiğin önemli bir görevidir. Anakütlenin tamamı incelenmez. Anakütleden bir şans örneği alınır. Elde edilen örnek değerlerinin anakütle parametresi yerine kullanılması için iki şart vardır: a. Örnek şans örneği olmalı. Anakütledeki her birimin örneğe girme şansı eşit olmalı b. Örnek yeterince büyük olmalı 18 Örnekleme; İadeli örnekleme:Çekilen birimin anakütleye tekrar iade edilmesidir. İadesiz örnekleme:Çekilen birim anakütleye iade edilmez. Bir anakütleden alınan şans örneklerinin her birisi için örnek istatistikleri hesaplandığında örnekleme dağılımları ortaya çıkar: Bir örneğin ortalaması hesaplanmışsa elde edilen Xi dağılımı ortalamaların örnekleme dağılımı, Her örnek için p oranları hesaplandığında oranların örnek dağılımı elde edilir. 19 İki ayrı anakütlenin karşılaştırılması yapılıyorsa farklarla ilgili örnekleme dağılımı ortaya çıkar: Her iki anakütleden alınan nA ve nB büyüklüğündeki örneklerin ortalamaları hesaplanmış ve bu ve XA XB değerleri arasındaki farklar belirlenmişse elde edilen dağılım ortalamalar arası farkların örnekleme dağılımıdır. Anakütlelerden alınan örnekler için oranlar hesaplanmış ve bu oranların anakütleler itibariyle gösterdikleri farklılıklar ortaya konulmuşsa elde edilen dağılım oranlar arası farkların örnekleme dağılımıdır. 20 Bir populasyon parametresini tahminlemek için şans değişkenleri kullanılır: Örnek ortalaması, örnek oranı, örnek medyanı… Örnek hacmi arttıkça (n 30) ... Merkezi Limit Teoremi Örnekleme dağılışı normal dağılıma yaklaşır. 21 X ORTALAMALARIN ÖRNEKLEME DAĞILIMI Ortalamaların örnekleme dağılımı anakütle ortalamasının iyi bir tahmincisidir. Her biri n hacimli çok sayıda örneğe ait ortalamaların gösterdiği dağımın değişkenliği tek örneğin değişkenliğinden daha azdır. Standart sapma bir örneğin değişkenliği hakkında bilgi verirken , Ortalamaların örnekleme dağılımının değişkenliği standart hatayla gösterilir. 22 Aşırı değerlerin etkisinin önemli ölçüde yok edilmesi, ortalamaların örnekleme dağılımının değişkenliğini azaltıcı bir faktördür. Ana kütle standart sapması bilindiğinde standart hata x x n eşitliğiyle hesaplanır. Z Standart z değerleri X x formulüyle hesaplanır. Ortalamaların örnekleme dağılımında X X x x x x yerini alır. 23 Herhangi bir Z değerinin standart Z değerine dönüştürmesinde X X Z x X x x eşitliği kullanılır. Örnekleme dağılımı Standart normal dağılım X z = 1 X X Z = 0 Z 24 Normal populasyondan örnekleme •Merkezi eğilim Populasyon dağılımı = 10 X Yayılım X n 50 X Örnekleme dağılımı n=4 X = 5 n =16 X = 2.5 50 X X 25 Alıştırma •Türk telekomda çalışan bir operatörsünüz. Uzun mesafeli telefon görüşmeleri = 8 dk. & = 2 dk. ile normal dağılmaktadır. Eğer 25 lik örnekler seçilirse örnek ortalamalarının % kaçı 7.8 & 8.2 dk. arasında olacaktır? 26 Çözüm x n 2 25 0.4 X 7.8 8 Z .50 n 2 25 Örnekleme dağılımı Z X X = .4 n 8.2 8 2 25 .50 Standart normal dağılım Z = 1 .3830 .1915 .1915 7.8 8 8.2 X -.50 0 .50 Z27 ORANLARIN ÖRNEKLEME DAĞILIMI Oranların örnek dağılımının ortalaması anakütle oranına eşittir. P 1 P P n Z pP P 1 P n ÖRNEK: Büyük bir alışveriş merkezinde 15000 YTL’den fazla alışveriş yapan müşterilerin %30’unun kredi kartı kullandığı tespit edilmiştir. 15000 YTL’den fazla alışveriş yapan 100 müşteri için oranların örneklem dağılımının standart hatası nedir? P P 1 P n 0.30 1 0.30 100 0.0458 28 ORANLARIN ÖRNEKLEME DAĞILIMI Aynı örnek için 15000 YTL’den fazla alışveriş yapan 100 müşteriden %20 ile %25’inin kredi kartı kullanması ihtimalini hesaplayınız. p1 P 0.20 0.30 Z1 2.18 0.30(1 0.30) P 1 P 100 n Z2 p2 P P 1 P n 0.25 0.30 1.09 0.30(1 0.30) 100 0.1233 0.3621 -2.18 -1.09 0.4854 P(0.20 P 0.25) P(2.18 Z 1.09) 0.4854 0.3621 P(0.20 P 0.25) 0.1233 29 ORTALAMALAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI Ortalamalar arası farkın örnek dağılımının ortalaması μ1 – μ2 ve standart hatası da 1 - 2 ile gösterilir. X1 X2 n1 n 2 2 1 2 2 X Z 1 X 2 1 2 12 22 n1 n 2 30 ORTALAMALAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI Örnek: İki farklı un fabrikasında paketlenen standart 1 kg’lık un paketleri test edilmiş ve birinci fabrikadan alınan 100 paketin ortalaması 1.03 kg, standart sapması 0.04kg; ikinci fabrikadan alınan 120 paketin ortalaması 0.99 kg, standart sapması 0.05 kg bulunmuştur. Anakütle standart sapmaları bilinmediği için örnek standart sapmalarından hareketle ortalamalar arası farkın standart hatası, X1 X2 12 22 s12 s 22 n1 n 2 n1 n 2 (0.04) 2 (0.05) 2 = 100 120 = 0.006 31 ORANLAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI Oranlar arası farkın örnek dağılımının ortalaması P1 –P2 ve standart hatası da 1 - 2 ile gösterilir. P 1 Z P2 P1 1 P1 P2 1 P2 n1 n2 p1 p2 P1 P2 P1 1 P1 P2 1 P2 n1 n2 32 ORANLAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI Örnek: Birinci fabrikadaki kusurlu mamul oranının 0.08 ve ikinci fabrikadaki kusurlu mamul oranının 0.05 olduğu bilinmektedir. Tesadüfi olarak birinci fabrikadan 100, ikinci fabrikadan 150 mamul seçilmiş ve birinci örnekteki kusurlu mamul oranı 0.09, ikinci örnekteki kusurlu mamul oranı 0.06 olarak gözlenmiştir. Buna göre kusur oranları arasındaki farkın standart hatası: P P 1 2 P P 1 2 P P 1 2 P1 1 P1 n1 0.08 0.92 100 0.0324 P2 1 P2 n2 0.05 0.95 150 33 İstatistiksel metotlar İstatistiksel metotlar Tanımlayıcı istatistikler Yorumlayıcı istatistikler Tahminleme Hipotez Testi 34 Yorumlayıcı İstatistikler • Aralık tahminleme ve hipotez testlerini içerir. Populasyon? • Amacı populasyon karakteristikleri hakkında karar vermektir. 35 Tahmin süreci Populasyon Ortalama, , bilinmiyor Şans örneği Ortalama X = 50 %95 eminim ki, 40 ile 60 arasındadır. 36 Bilinmeyen populasyon parametreleri tahminlenir... Populasyon Örnek istatistiğiyle Tahminle! parametresini Ortalama X Oran P p Varyans 2 s Farklar 12 X1 X2 2 37 Tahminleyicilerin Özellikleri 1. Sapmasızlık P(X ) Sapmasız A Sapmalı B X N birimlik aynı anakütleden farklı sayıda örneklem seçilebileceği için tahmin edicinin değeri de seçilen örnekleme göre değişmektedir. Bu durumda örneklem sayısı kadar elde edilen tahmin edici, bir rassal değişken olup, ortalaması ve varyansı olan bir olasılık dağılımına sahiptir. Bu dağılımın beklenen değerinin anakütle parametresine eşit olmasına, diğer bir ifadeyle bir istatistiğin beklenen değeri ile bilinmeyen anakütle parametresi arasındaki farkın sıfıra eşit olmasına “sapmasızlık” denir. E(X) E(X) 0 38 Tahminleyicilerin Özellikleri 2. Tutarlılık (Kararlılık) Büyük örnek hacmi P(X) B Küçük örnek hacmi A X Örneklemdeki birim sayısı sonsuza doğru arttırıldığında, tahmin edicinin değerinin anakütle değerine yaklaşması ve n=N olması durumunda aralarındaki farkın sıfıra inmesi özelliğine “tutarlılık” denir. lim P 1 n ̂ ,’nın tutarlı tahmincisidir. 39 Tahminleyicilerin Özellikleri 3. Etkinlik Etkin Tahminci P(X) B A X Birden fazla sapmasız ve tutarlı tahminci olması durumunda, bir tahmincinin varyansının, aynı anakütle parametresinin başka bir tahmincisinin varyansından daha küçük olması durumunda elde edilen tahmincilere “etkin” tahminci adı verilmektedir. 40 İstatistiksel Tahminleme Nokta Tahmini Populasyon parametresinin tek bir tahmin değerini verir X μ̂ s σ̂ p P̂ Aralık Tahmini Populasyon parametresinin tahmin aralığını verir. Nokta tahmini kullanılarak hesaplanır. 20 μ 60 2.5 σ 3.4 2 0.25 P .035 41 Güven Aralığı Tahmini Bir değer aralığı verir. Populasyon parametresine yakınlık hakkında bilgi verir. Olasılık terimleriyle ifade edilir. Güven Aralığı Tahmininin Elemanları Populasyon parametresinin aralık içinde bir yere düşmesinin olasılığı Örnek istatistiği Güven aralığı Alt güven sınırı 42 Üst güven sınırı 42