9. Ders Đstatistikte Monte Carlo Çalışmaları Đstatistik, rasgelelik olgusu içeren olay, süreç ve sistemlerin modellenmesinde özellikle bu modellerden sonuç çıkarmada ve bu modellerin geçerliliğini sınamada kullanılan bazı bilgi ve yöntemleri sağlayan bir bilim dalıdır. Đstatistikte simülasyon; eğitimde kavramların kavratılmasında, örneklemin birer fonksiyonu olan istatistiklerin dağılımları ile ilgili analitik olarak elde edilemeyen bazı özelliklerin irdelenmesinde, tahmin edicilerin iyilik ölçütlerine göre karşılaştırılmasında, test fonksiyonlarının güç fonksiyonu değerlendirmelerinde, son yıllarda çok kullanılan bootstrap gibi yeniden örneklem tekniklerinde, beklenen değer yani integral hesabı yapılan Monte Carlo integrasyonunda ve başka birçok konuda kullanılmaktadır. Ancak, istatistikteki simülasyonun amacı olgu veya sistem simülasyonundaki amaçlardan farklıdır. Örneğin bir benzin istasyonu ile ilgili kuyruk modeli üzerinde yapılan simülasyonun amacı sistemdeki bekleme zamanını ve maliyeti en küçük yapacak şekilde hizmet birimlerinin sayısını belirlemek olabilir. Burada istatistik bilimi açısından bir amaç yoktur. Gamma dağılımı için parametre tahmininde, momentler ve en-çok olabilirlik tahmin edicilerinden hangisi hata kareleri ölçütüne göre daha iyidir, sorusunun cevabı simülasyon yaparak verilmeye çalışıldığında, burada istatistiksel bir amaç söz konusudur. Özellikle bu soruya analitik olarak cevap verilemiyorsa simülasyon önem kazanmaktadır. Ancak, simülasyonun ispatın yerini tutacağı sanılmasın. Simülasyon bir ispat yöntemi değildir. Simülasyona, örneklerle doğruyu yanlışı tespit etme, bazı durumlarda analitik olarak çözülemeyen problemlere çözüm yolu getirme, bazen de kendisinin en iyi çözüm yolunu sunduğu bir yöntem olarak bakabiliriz. Örneklem Đstatistikleri ve Dağılımları Belli bir rasgelelik olgusunu modelleyen olasılık dağılımı F olsun. X 1 , X 2 ,..., X n bağımsız ve aynı F dağılımlı rasgele değişkenler, yani F dağılımından bir örneklem olmak üzere, bu kısaca X 1 , X 2 ,..., X n örneklem ( F ) biçiminde gösterilir. Örneklemin Borel ölçülebilir herhangi bir T ( X 1 , X 2 ,..., X n ) foksiyonuna istatistik denir. Đstatistikler birer rasgele değişkendir veya rasgele vektördür. Birçok durumda istatistikler örneklemin karmaşık fonksiyonu olduklarından dağılımlarının bulunması kolay olmamaktadır. Örneklem istatistikleri arasında, n X= ∑X i =1 i n örneklem ortalamasının çok özel bir yeri vardır. Örneğin, örneklem N ( µ , σ 2 ) normal dağılımdan alındığında X ~ N ( µ , σ 2 / n) dır. N ( µ = 1, σ 2 = 1) dağılımının olasılık yoğunluk fonksiyonunun grafiği ve bu dağılımdan alınan n = 10,20,50 birimlik örneklemler için simülasyon ile gözlenen x1 , x 2 ,..., x100 örneklem ortalamalarının histogramları aşağıdadır.. close all; clear all; subplot(2,3,2); fplot('1/sqrt(2*pi)*exp(-.5*(x-1)^2)',[-4 4],'k') for i=1:100 ; x=randn(10,1)+1; xort(i)=mean(x); end subplot(2,3,4) ; hist(xort) ; title('n=10') for i=1:100 ;x=randn(20,1)+1; xort(i)=mean(x); end subplot(2,3,5) ; hist(xort) ; title('n=20') for i=1:100 ; x=randn(50,1)+1; xort(i)=mean(x); end subplot(2,3,6); hist(xort): title('n=50') 0.4 0.3 0.2 0.1 0 -4 -2 n=10 0 2 4 n=20 20 15 n=50 25 25 20 20 15 15 10 10 5 5 10 5 0 Örneklem 0 1 α, β 2 parametreli 0 0 1 Γ (α , β ) 2 Gamma 0 0.5 1 1.5 dağılımından alındığında X ~ Γ(nα , β / n) dır. Örneğin Γ(α = 2, β = 1 / 2) dağılımının olasılık yoğunluk fonksiyonunun grafiği ve bu dağılımdan alınan n = 10,20,50 birimlik örneklemler için simülasyon ile gözlenen x1 , x 2 ,..., x100 örneklem ortalamalarının histogramları aşağıdaki gibidir. 0.8 0.6 0.4 0.2 0 0 n=10 2 4 n=20 20 15 n=50 25 25 20 20 15 15 10 10 5 5 10 5 0 0 1 2 0 0.5 1 1.5 0 0.5 1 1.5 Örneklem, olasılık yoğunluk fonksiyonu 2 (1 − bx ) , 0 < x < b f ( x) = b , d . y. 0 olan dağılımdan alındığında X nin dağılımı nedir? b (b ∈ (0, ∞ )) parametresinin b = 3 olması durumunda olasılık yoğunluk fonksiyonunun grafiği ve olasılık yoğunluk fonksiyonu bu olan dağılımdan alınan n = 10,20,50 birimlik örneklemler için simülasyon ile gözlenen x1 , x 2 ,..., x100 örneklem ortalamalarının histogramları aşağıdaki gibidir. 1 0.8 0.6 0.4 0.2 0 0 n=10 2 4 n=20 20 15 n=50 25 25 20 20 15 15 10 10 10 5 0 5 0 1 5 0 0.5 2 1 f ( x) = Örneklem, olasılık fonksiyonu 0 0.5 1.5 1 1.5 1 , x = 1,2,3,4,5,6 6 olan dağılımdan alındığında X nin dağılımı nedir? Olasılık fonksiyonunun grafiği ve n = 10,20,50 birimlik örneklemler için simülasyon ile gözlenen x1 , x 2 ,..., x100 örneklem ortalamalarının histogramları aşağıdadır. 0.5 0.4 0.3 0.2 0.1 0 0 n=10 5 n=20 20 15 n=50 25 25 20 20 15 15 10 10 10 5 5 0 5 0 2 4 6 0 2 4 6 2 4 6 Dağılımdan bağımsız olarak, yani dağılım ne olursa olsun örneklem ortalaması ile ilgili aşağıdaki iki teorem söz konusudur. Beklenen değeri µ ve varyansı σ 2 sonlu olan bir dağılımdan alınan X 1 , X 2 ,..., X n örneklemi için: 1- Zayıf Büyük Sayılar Kanunu n ∑X Xn = i i =1 n p → µ (ε > 0 için lim P( X n→∞ n ) − µ < ε) =1 2- Merkezi Limit Teoremi n ∑X i =1 n i − E (∑ X i ) i =1 n = Var (∑ X i ) X n −µ σ/ n d → Z ~ N (0,1) i =1 dır. Bu iki teoremin söylediklerini anlamak için n = 10,20,50 için çizilen yukarıdaki histogramları yeniden gözden geçiriniz. Ayrıca, düzgün bir tavla 1 zarının atılması deneyini modelleyen f ( x) = , x = 1,2,3,4,5,6 dağılımından 6 üretilen sayıların dizisi X 1 , X 2 ,..., X n ,... ve ortalamalar dizisi X 1 , X 2 ,..., X n ,... olmak üzere simülasyon sonucu elde edilen yörüngeler aşağıdaki gibi olmuştur. Örneklem hacmi n arttıkça örneklem ortalaması kitle ortalamasına daha yakın bir çevrede salınmaktadır. 6 4 2 0 0 10 20 30 40 50 60 0 10 20 30 40 50 60 6 4 2 0 Örneklem istatistikleri arasında X örneklem ortalamasının yanında önemli olan ikinci bir istatistik n S2 = örneklem varyansıdır. ∑(X i =1 i −X ) 2 n −1 Bilindiği gibi, örneklem N (µ,σ 2 ) dağılımından alındığında, (n − 1) S 2 σ 2 ~ χ (2n −1) dır. Örneklem Γ (α , β ) dağılımından alındığında S 2 'nin dağılımı nedir? Simülasyon yaparak S 2 'nin dağılımını irdelemeye çalışalım. Örneğin, N ( µ = 1, σ 2 = 1) dağılımından alınan n = 10,20,50 birimlik örneklemler için 2 örneklem varyanslarının histogramları simülasyon ile gözlenen s12 , s 22 ,..., s 300 aşağıdaki gibidir. 0.4 0.3 0.2 0.1 0 -5 n=10 0 5 n=20 n=50 80 80 80 60 60 60 40 40 40 20 20 20 0 0 2 4 0 0 2 4 0 0 1 2 Γ(α = 2, β = 1 / 2) dağılımından alınan n = 10,20,50 birimlik örneklemler 2 örneklem varyanslarının histogramları için simülasyon ile gözlenen s12 , s 22 ,..., s 300 aşağıdadır. 0.8 0.6 0.4 0.2 0 0 2 n=10 4 n=20 150 150 100 100 50 50 n=50 80 60 40 20 0 0 0 2 4 0 0 1 2 0 1 2 Normal dağılımda X örneklem ortalaması ile S 2 örneklem varyansı ile S 2 'nin bağımsız istatistiklerdir. Gamma dağılımında durum nedir? X bağımsızlığı simülasyon yaparak irdelenebilir mi? Histogram gibi frekans poligonu da bir istatistiktir (Bir rasgele elemandır). Örneğin N ( µ = 1, σ 2 = 1) dağılımından alınan 60 birimlik simülasyonla üretilen bir örneklem için histogram ile frekans poligonu aşağıdaki gibidir. 0.4 0.3 0.2 0.1 0 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 15 10 5 0 -1 -0.5 0 0.5 1 1.5 2 2.5 3 3.5 Histogram ile frekans poligonunun ortaya çıkardığı görsel etki, N ( µ = 1, σ 2 = 1) dağılımının olasılık yoğunluk fonksiyonunun grafiğinin biçimi ile ilgilidir. Eğer düşey eksen frekans yerine, frekans bölü histogram alanı olarak ölçeklendirilirse, frekans plogonu ile olasılık yoğunluk fonksiyonu arasındaki uyum aynı grafik üzerinde görülebilir. Örneklem hacmi arttıkça bu uyum daha iyi olmaktadır. n=60 0.5 0.4 0.3 0.2 0.1 0 -2 -1 0 1 2 3 4 2 3 4 n=600 0.4 0.3 0.2 0.1 0 -2 -1 0 1 Histogramın ilgili dağılımın biçimi hakkında fikir verdiğini; N ( µ = 1, σ 2 = 1) dağılımının olasılık yoğunluk fonksiyonunu, n = 100 birimlik örneklem için histogramı ve n = 100 için üretilen 100 adet X örneklem ortalaması için üst üste çizilen aşağıdaki histogramları gözden geçiriniz. 0.4 0.3 0.2 0.1 0 -4 -3 -2 -1 0 1 2 3 4 -3 -2 -1 0 1 2 3 4 30 20 10 0 -4 Bir istatistik olan X örneklem ortalamasının dağılımının biçimi simülasyon ile görülmek istendiğinde X nin dağılımından çok sayıda gözlem alınıp histogram çizilebilir. Ancak, yukarıdaki örneklerde bu böyle yapılmadı. Örnekleme yapılan dağılımın kendisinden (“kitle dağılımından”), örneklemler üretilip (sözde örneklemler), örneklemin bir fonksiyonu olan istatistiğin ( X ) değeri hesaplanarak elde edilen değerler ile histogram çizildi. Kısaca, belirlenmiş bir dağılımdan çok kez (örneğin 100 kez) n tane sayı (n birimlik örnek) üretilip X aldığı değerin histogramı çizildi. Gerçekte bunu yapmak demek, kitleden 100 kez örnek almak, yani 100 kez örnekleme yapmak demektir. Ancak, örnekleme bir kez yapılmaktadır. Bazen, ön araştırma niteliğinde küçük çaplı bir örnekleme ve ardından asıl örnekleme, bazen de doğrulama amaçlı yine küçük çaplı örnekleme yapılabilir ama, 100 kez örneklemeyi bırakın, iki kez bile örnekleme olmaz. Olsa iyi olur, masraflar karşılanırsa. Bootstrap Örneklemesi Örneklemeyi tekrarlamak ve çok kez yapmak elverişli değildir. Elimizde, sadecei bir veri (data, gözlemler) bulunmaktadır. Verinin alındığı kitlenin ortalamasını tahmin etmek istemişsek, elimizde tahmin olarak örnek ortalaması bulunmaktadır. Kitle dağılımı hakkında hiçbir varsayım yapılmamışsa, küçük hacimli örneklemede, kitle ortalaması için güven aralığı söyleyemeyiz, aralık tahmini yapamayız. Bu gibi sorunların altından kalmak için elimizdeki veri ile ilgili “yeniden n hacimlik örneklemeler” yapılıp, ilgili istatistiğin değeri çok kez gözlenip, dağılımı hakkında fikir elde edilebilir. “Yeniden n hacimlik örneklemeler” nasıl yapılabilir? Gözlenen verilerin ilgili dağılımı temsil ettiği ve örneklem dağılım fonksiyonu, # {X i : X i ≤ x , i = 1,2,..., n} Fˆ ( x) = n ‘nın F yerine alınabileceği düşüncesi ile F̂ 'dan n birimlik örneklemler simülasyon ile üretilebilir. Bunlara bootstrap örneklemleri denir. F̂ 'dan n birimlik bir örneklem üretmek x1 , x 2 ,..., x n verilerinden iadeli olarak n kez çekiliş yapmak demektir (örneğin x1 , x 2 ,..., x n değerleri n tane top üzerine yazılıp iadeli olarak n çekiliş yapmak demektir). Böylece bootstrap örneklemleri (örnekleri) çok kolay bir şekilde üretilebilir. Üretilen B tane bootstrap örneklemi için, X örneklem ortalaması, x1 , x2 ,..., x B olarak gözlendiğinde, bu gözlemlerin histogramı X 'nin dağılımı hakkında fikir verecektir. Üretilen B tane bootstrap örneklemi için, S 2 örneklem varyansı s12 , s 22 ,..., s B2 olarak gözlendiğinde, bunların histogramı, S 2 'nin dağılımı hakkında fikir verecektir. Üretilen B tane bootstrap örneklem medyanı m1 , m2 ,..., m B olarak gözlendiğinde, örneklemi için, M bunların histogramı M 'nin dağılımı hakkında fikir verecektir. Fen Fakültesi öğrencileri arasından rasgele seçilen n = 60 öğrenciye, haftada evde kaç saat ders çalıştıkları sorulduğunda aşağıdaki veriler gözlenmiştir. 1.5 3 4 2 5 5 9 10 2 2 2.25 4 8 .5 4 9 4 7 5 0 4.5 8 6 1 15 6 7 3 3 11 5 1 7 3 7 3 10 5 2 2 14 7 1 1 2 12 1 5 9.5 2 2 3 1 10 1 4 4 7 9 6 1 18 16 14 12 10 8 6 4 2 0 0 2 4 6 8 10 12 14 16 %Bootstrap clc; close all ; clear all load veri ; hist(veri) for B=1:200 for i=1:60 sec=fix(rand*60)+1; x(i)=veri(sec); end Bvaryans(B)=std(x)^2; Bort(B)=mean(x); Bmedyan(B)=median(x) end figure; subplot(1,3,1); hist(Bort) ;title('Ortalama') subplot(1,3,2) ; hist(Bvaryans) ;title('Varyans') subplot(1,3,3) ; hist(Bmedyan) ; title('Medyan') Ortalama Varyans Medyan 60 50 50 50 40 40 30 30 20 20 10 10 40 30 20 10 0 0 0 5 10 0 0 20 40 0 20 40 Bootstrap örneklemleri bir tür yeniden alınmış örneklemler olarak düşünüldüğünde bootstrap bir yeniden örnekleme (resampling) tekniğidir. Birçok yeniden örnekleme teknikleri vardır. Bunlardan birisi Jacknife'dır. Jacknife tekniğinde n tane gözlemden birisi dışarıda bırakılıp diğerleri ile n − 1 birimlik yeni bir örneklem oluşturulmaktadır. Bu şekilde sadece n tane farklı örneklem oluşturulabilir. Bootstrap tekniğinde ise istenildiği kadar yeni örneklem oluşturulabilir. Parametre Tahmini Rasgelelik olgusunu modelleyen olasılık dağılımının biçiminin bilinmesi, yani model olarak kullanılabilecek dağılımlar ailesinin bilinmesi ve bu ailenin bir parametre ile modellenmiş olması durumunda problem bu parametrenin belirlenmesine indirgenmektedir. Parametre kümesi Θ ve X 1 , X 2 ,..., X n örneklem F (⋅ ;θ ) , θ ∈ Θ olmak üzere, θ parametresini tahmin etmek için kullanılacak bir T ( X 1 , X 2 ,..., X n ) istatistiğinin (tahmin edicisinin) belirlenmesi gerekmektedir. Burada birbiri ile ilgili iki sorun söz konusudur. Bunlardan birisi, tahmin edicilerde aranan özellikler neler olmalı ve diğeri de tahmin edicileri bulma yöntemidir. Örneğin N ( µ , σ 2 ) dağılımının parametrelerinin ençok olabilirlik tahmin edicileri, µ için n X = ∑X i =1 i n ve σ 2 için n S2 = ∑(X i =1 i −X ) 2 n dır. X yansız ve S 2 yansız değildir. Her ikisi de olasılıkta tutarlı, yani p X → µ p S2 → σ2 dır. µ parametresi aynı zamanda kitle medyanı olduğundan örneklem medyanı M de µ için bir tahmin edici olarak düşünülebilir. M örneklem medyanı µ için yansız bir tahmin edici midir? Hata Kareleri Ortalaması (MSE) ölçütüne göre hangisi daha iyidir? Bu soruların cevabı kolay görünmemektedir. MSE ( X ) = E ( X − µ ) 2 = Var ( X ) = σ2 n ve MSE ( M ) = E ( M − µ ) 2 olmak üzere, N ( µ = 1, σ 2 = 1) dağılımında n = 10 için 100 kez simülasyon ile gözlenen x1 , x 2 ,..., x100 ve m1 , m2 ,..., m100 değerleri için, 100 Mˆ SE ( X ) = ∑ (x i =1 i − µ)2 100 100 Mˆ SE ( M ) = ∑ (m i =1 i = 0.0966 − µ)2 100 = 0.1697 σ2 olarak elde edilmiştir. Mˆ SE ( X ) değerinin değerine, yani 1/10 sayısına yakın n çıkması gerekmektedir. Mˆ SE ( M ) değerinin hangi sayıya yakın çıkması gerekmektedir. Bunu bilmiyoruz. 100 değil de 500, 1000, 1500,…,15000 kez n = 10 için M örneklem medyanı gözlenip, Mˆ SE ( M ) hesaplandığında şekildeki (aşağıda) gibi bir durum ortaya çıkmaktadır. Şekilden görüldüğü gibi 0.138 gibi bir sayı etrafında salınmaktadır. Mˆ SE ( M ) değerleri MSE ( X ) < MSE ( M ) olduğu söylenebilir mi? Evet. MSE ölçütüne göre örneklem ortalaması, örneklem medyanından daha iyi bir tahmin edicidir. Bunun simülasyon ile söylendiği unutulmamalıdır. Simülasyon sadece N ( µ = 1, σ 2 = 1) dağılımı üzerinde yapılmıştır. Acaba diğer normal dağılımlarda durum nedir? 0.144 0.142 0.14 0.138 0.136 0.134 0.132 0 5000 10000 15000 Üstel dağılımın olasılık yoğunluk fonksiyonu, 1 −θx , x>0 e f ( x) = θ 0 , d . y. ve beklenen θ , varyansı değeri θ2 medyanı θ ln( 2) olmak üzere θ (θ ∈ (0, ∞)) parametresi için T1 = X , T2 = S 2 , T3 = M ln(2) tahmin edicileri düşünülsün. Hangisinin Hata Kareleri Ortalaması ölçütüne göre daha iyi olduğunu simülasyon yaparak gözleyiniz (Aşağıdaki matlab programını kullanabilirsiniz). clc; close all ;clear all teta=1; n=10; N=100; for i=1:N x=-teta*log(rand(n,1)); T1(i)=mean(x); T2(i)=std(x); T3(i)=median(x)/log(2); end MSET1=sum((T1-teta).^2)/100 MSET2=sum((T2-teta).^2)/100 MSET3=sum((T3-teta).^2)/100 Bilindiği gibi Poisson dağılımında beklenen değer ile varyans birbirine eşittir ve bu değer dağılımın parametresi olan λ 'dır. λ parametresi için yansız birer tahmin edici olan, n Xn = ∑ Xi i =1 n n ile S n2−1 = ∑(X i =1 i −X ) 2 n −1 tahmin edicilerinden hangisi daha küçük varyanslıdır? Teorik, yani analitik olarak bu soruya cevap vermek biraz zordur. Simülasyon ile bu kolayca görülebilir. Hipotez Testi Đstatistiksel hipotez, dağılım hakkında bir önermedir. Örneğin, bir rasgelelik olgusunu modelleyen dağılımın üstel olduğunun söylenmesi (iddia edilmesi) bir hipotezdir. Bir dağılımla ilgili, örneğin, varyansının belli bir sayıdan küçük olduğunun söylenmesi, iki değişkenli bir dağılımda değişkenlerin bağımsız olduğunun söylenmesi birer hipotezdir. Parametrelerle ilgili hipotezlerde, Θ parametre kümesi olmak üzere, parametrenin bir Θ 0 ⊂ Θ kümesinde bulunmasına veya kısaca Θ 0 'a hipotez denir ve H0 ile gösterilir. Θ1 = Θ \ Θ 0 'ya da karşıt (alternatif) hipotez denir ve H1 (veya H A ) ile gösterilir. Hipotezler, H 0 :θ ∈ Θ 0 H 1 : θ ∈ Θ1 ve X 1 , X 2 ... X n örneklem F (.;θ ),θ ∈ Θ = Θ 0 ∪ Θ olmak üzere, ϕ : Rn → [ 0, 1] ( X1, X 2 ... X n ) → ϕ ( X1, X 2 ... X n ) istatistiğinin aldığı değer y = φ ( X 1 , X 2 ... X n ) olduğunda: “ b(1, p = y ) Bernoulli denemesi başarı ile sonuçlandığında H 0 reddedilsin, aksi halde H0 kabul edilsin”, biçiminde bir karara götüren φ ( X 1 , X 2 ... X n ) istatistiğine, rasgeleleştirilmiş test fonksiyonu (kısaca test fonksiyonu) denir. Eğer φ nin görüntü kümesi {0,1} yani 1 , ( X1, X 2 ... X n ) ∈ B ⊂ R n φ ( X1, X 2 ... X n ) = 0 , ( X1, X 2 ... X n ) ∈ B biçiminde ise φ ye rasgeleleştirilmemiş test fonksiyonu, B kümesine H0 hipotezi için red bölgesi, B kümesine de H0 hipotezi için kabul bölgesi denir. Bir φ test fonksiyonu ile ilgili güç fonksiyonu, π : Θ 0 ∪ Θ1 →[0, 1] θ →π (θ ) = Pθ ,φ ( H 0 ın reddedilmesi) olmak üzere, α = sup{π (θ ) :θ ∈ Θ 0 } değerine, testin anlam düzeyi denir. Anlam düzeyi, H0 doğru iken H0 'ın reddedilmesi yani I. tip hata yapma olasılığı için üst sınırdır. Anlam düzeyi α olan test fonksiyonları arasında tüm θ ∈ Θ1 için β (θ ) değerleri en büyük olan φ testine, düzgün en güçlü test denir. Genel olarak böyle φ testlerini bulmak mümkün olmamakla birlikte bazı durumlar, örneğin basit hipotezler için düzgün en güçlü test bulunabilmektedir. N ( µ , σ 2 = 1) dağılımı için H 0 : µ = 1 , H 1 : µ ≠ 1 hipotezi ile ilgili, 1 , X − 1 > 0.2 φ= 0 , X − 1 < 0.2 test fonksiyonu önerilsin. n = 100 birimlik örneklem için α = P ( X − 1 > 0.2 / H 0 do ğ ru ) = P ( Z > 2) = 0.0436 dır. π güç fonksiyonunun grafiği aşağıdadır. fplot('1-normcdf(10*(1.2-x))+normcdf(10*(.8-x))',[-2 3]) 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 -1 -0.5 0 0.5 1 1.5 2 2.5 3 Güç fonksiyonu simülasyon yaparak da çizdirilebilir. 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 -1 -0.5 0 0.5 1 1.5 2 % güç fonksiyonu grafiğini simülasyon yaparak çizdirmek clc : close all:clear all s=0; for mu=-1:.05:3 say=0; s=s+1; for i=1:200 x=randn(100,1)+mu; ort(i)=mean(x); if (ort(i)>0.8) if (ort(i)<1.2) say=say+1; end end end olas=1-say/200; guc(s)=olas; end mu=-1:.05:3 plot(mu,guc,'k') 2.5 3 Bernoulli dağılımı ( b(1, p ), p ∈ Θ = (0,1) ) ile ilgili, H 0 : p ≥ 0.70 (Θ 0 = [0.70 , 1)) H 1 : p < 0.70 (Θ1 = (0 , 0.70) ) hipotezini test etmek amacıyla, X 1 , X 2 ... X 10 örneklem b(1, p ) , alınması durumu için 1 , a) φ ( X 1 , X 2 ... X 10 ) = 0 , 1 , b) φ ( X 1 , X 2 ... X 10 ) = 0 , 1 , c) φ ( X 1 , X 2 ... X 10 ) = 0.5 , 0 , 10 ∑X i =1 10 ≤6 i ∑X i ≥7 i ≤7 i =1 10 ∑X i =1 10 ∑X i i =1 10 ∑X i =1 10 ≥8 ≤6 i ∑X i =7 ∑X i ≥8 i =1 10 i =1 test fonksiyonları önerilsin. Bu test fonksiyonlarından, a ile b şıkkındakiler rasgeleleştirlmemiş, c şıkkındaki test fonksiyonu rasgeleleştirilmiş bir test fonksiyonudur. Bunlar için π güç fonksiyonlarının grafikleri aşağıda verilmiştir. %guc fonksiyonu (teorik) clc ;close all ;clear all s=0; for p=0.01:.05:.99 s=s+1; guca(s)=binocdf(6,10,p); end s=0; for p=0.01:.05:.99 s=s+1; gucb(s)=binocdf(7,10,p); end s=0; for p=0.01:.05:.99 s=s+1; gucc(s)=binocdf(6,10,p)+0.5*binopdf(7,10,p); end p=0.01:.05:.99 plot(p,guca,'k',p,gucb,'k--',p,gucc,'k-.') legend('a','b','c') 1 a b c 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Güç fonksiyonlarının simülasyon yapılarak çizdirilen grafikleri aşağıda verilmiştir. %güç fonksiyonu (simülasyon) clc: close all: clear all:s=0; for p=0.01:.05:.99 s=s+1; guca(s)=sum(sum(rand(10,1000)<p)<=6)/1000; end s=0; for p=0.01:.05:.99 s=s+1; gucb(s)=sum(sum(rand(10,1000)<p)<=7)/1000; end s=0; for p=0.01:.05:.99 s=s+1; m=sum(rand(10,1000)<p); m7=sum(m==7); red=sum(rand(m7,1)<0.5); gucc(s)=(sum(sum(rand(10,1000)<p)<=6)+red)/1000; end p=0.01:.05:.99 plot(p,guca,'k',p,gucb,'k--',p,gucc,'k-.') legend('a','b','c') 1 a b c 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 P-Değeri N ( µ , σ 2 ) dağılımı ile ilgili ( σ 2 bilindiğinde) H 0 : µ = µ0 H 1 : µ = µ1 ( µ1 > µ 0 ) hipotezleri α anlam düzeyinde test edilmek istensin. Basit hipotezler için Neyman-Pearson Lemması yardımıyla elde edilen düzgün en güçlü test fonksiyonu 1 , X > c φ ( X 1 , X 2 ... X n ) = 0 , X < c biçimindedir. c sabiti, Pµ0 ( X > c) = α P( X - µ0 σ/ n P(Z > > c - µ0 σ/ n c - µ0 σ/ n ) =α ) =α ⇒ c - µ0 σ/ n = Z 1−α c = Z1−α σ/ n + µ 0 olarak bulunur. φ test fonksiyonu alışılagelmiş olarak X - µ0 > Z 1−α 1 , / n σ φ ( X 1 , X 2 ... X n ) = 0 , X - µ 0 < Z 1−α σ/ n biçiminde yazılır. Hesaplanan Zh = X - µ0 σ/ n değeri normal dağılım tablosundan okunan Z tablo = Z 1−α değerinden büyük olduğunda H0 reddedilir. Bu hipotez için p-değeri, p = P( Z > Z h ) = ∞ ∫ Zh 1 2π e − z2 2 dz dır. Küçük p değerlerinde H0 reddedilir. P-değeri Z h istatistiğinin (rasgele değişkeninin) bir fonksiyonu olduğundan kendisi de bir rasgele değişkendir. Bu rasgele değişken PZ h ile gösterilsin. PZ h rasgele değişkeninin dağılımı nedir? Sıfır hipotezi doğru iken PZ h rasgele değişkeninin dağılımını simülasyon ile görmeye çalışalım. Örneğin, N ( µ , σ 2 = 9) dağılımında H0 :µ = 0 H1 : µ = 1 için, n = 16 olduğunda 1000 kez simülasyon yaparak bulunan PZ h değerlerinin histogramı, sıfır hipotezi gibidir. altında ve karşıt hipotez altında sırasıyla aşağıdaki %Sıfır hipotezi altında clc;close all;clear all zh=(mean(3*randn(16,1000))-0)/(3/sqrt(16)); p=1-normcdf(zh,0,1);hist(p,10) Karsit hipotez altinda Sifir hipotezi altinda 600 120 500 100 400 80 300 60 200 40 100 20 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Gerçekte sıfır hipotezi doğru olduğunda p değerinin olasılık dağılımı düzgün dağılımdır. Dolayısıyla p değeri ile ilgili yorumlamalar-da, p değerinin büyük olması sıfır hipotezinin kabul edilmesi anlamına gelip p değerinin büyüklüğünün bir anlamı yoktur. 1