ÇOK DEĞİŞKENLİ İSTATİSTİKSEL SONUÇ ÇIKARIMI DERSİ FİNAL SORULARININ ÇÖZÜMLERİ 1. Σ, p×p boyutlu pozitif tanımlı bir matris, λ1 , λ2 , . . . , λp bu matrisinin özdeğer0 leri, ei = (ei1 , ei2 , . . . , eip ) , i = 1, 2, . . . , p bu özdeğerlere karşılık gelen normalleştrilmiş özvektörler, E = (e1 , e2 , . . . , ep ) ve λ1 0 · · · 0 0 λ2 · · · 0 Λ = .. .. . . .. . . . . 0 0 · · · λp 1 olmak üzere karakök Σ 2 matrisi p X p 1 0 0 Σ = λi ei ei = EΛ 2 E 1 2 i=1 şeklinde tanımlanmak üzere ³ 1 ´0 1 a) Σ = Σ 2 , yani Σ 2 simetriktir. 1 2 1 1 b) Σ = Σ 2 Σ 2 olduğunu ispat ediniz. 1a. ³ 1 ´0 ´0 ³ 1 0 2 2 Σ = EΛ E ³ 0 ´0 ³ 1 ´0 0 Λ2 E = E 1 0 1 = EΛ 2 E = Σ 2 1 , burada 1. satır Σ 2 in tanımı gereği yazılmıştır. Satırdan 2. satıra Soru 1 de bahsedilen e özelliğinden, 2. satırdan 3. satıra Soru 1 de bahsedilen f özelliğinden ³ 1 ´0 1 1 2 geçilmiştir. Ayrıca Λ köşegen matris olduğundan Λ 2 = Λ 2 olduğu aşikardır. 1 1b. 1 2 Σ Σ ´³ ´ ³ 1 1 0 0 2 2 EΛ E = EΛ E ³ ´ 1 1 0 0 = EΛ 2 E E Λ 2 E 1 2 1 1 0 2 2E = EΛ ´ 0 ³ IΛ 1 1 = E Λ2 Λ2 E 0 = EΛE = Σ 1 , burada 1. satır Σ 2 nin tanımı gereği yazılmıştır. 2. satırdan 3. satıra ortogonal ma0 0 trisin tanımından (E ortogonal ise E E = EE = I), 4. satırdan 5. satıra Λ köşegen matris olduğundan geçilebilmiştir. Karakök matrisini kullanarak µ ve Σ parametreli çok değişkenli normal dağılımdan sayı üretmek için bir dönüşüm yazınız. 1 Σ 2 , p×p boyutlu Σ pozitif tanımlı matrisin karakök matrisi olmak üzere, Z ∼ Np (0, I) olmak üzere 1 Y = Σ2 Z + µ dönüşümü için Y ∼ Np (µ, Σ) dir. ¶ µ ¶ µ 4 1 X1 , Varyans kovaryans matrisi Σ = ve ortalaması µ = 2. X = X2 1 9 µ ¶ 5 olan iki değişkenli normal dağılıma sahip bir rasgele vektör olmak üzere 0 (1) Y1 = 2X1 + X2 Y2 = 3X1 − X2 şeklinde tanımlanan Y1 ve Y2 rasgele değişkenlerinden oluşan Y = µ Y1 Y2 ¶ rasgele vektörünün dağılımını elde ediniz. Bu soruyu cevaplayabilmek için aşağıdaki iki teorem kullanılacaktır: Teorem 1. X, p değişkenli normal dağılıma sahip bir rasgele vektör, A, k × p boyutlu sabitlerin matrisi olmak üzere Y = AX lineer dönüşümü k değişkenli normal dağılıma sahip bir rasgele vektördür. Teorem 2. X, µ ortalamalı, Cov(X) = Σ kovaryans matrisli bir rasgele vektör olmak üzere b ∈ Rp vektörü ve A, k × p boyutlu matrisi için ³ 0 ´ 0 E bX = bµ E (AX) = Aµ 2 ³ 0 ´ 0 V ar b X = b Σb 0 Cov (AX) = AΣA dir. (1) dönüşümü matris formunda ¶µ ¶ µ X1 2 1 Y = 3 −1 X2 Y = AX şeklinde yazılabilir. Teorem 1 den Y iki değişkenli normal dağılıma sahiptir. Teorem 2 den Y nin beklenen değer ve kovaryans matrisi E (Y) = E (AX) = AE (X) = Aµ µ ¶µ ¶ 2 1 5 = 3 −1 0 ¶ µ 10 = 15 Cov (Y) = = = Cov (AX) 0 ACov (X) A 0 AΣA µ ¶µ ¶µ ¶ 2 1 4 1 2 3 = 3 −1 1 9 1 −1 µ ¶ 29 16 = 16 39 biçiminde elde edilir. Size göre yukarıda tanımlanan Σ = µ 4 1 1 9 ¶ , varyans kovaryans matrisi olabilir mi? Neden? Varyans-Kovaryans matrisi, pozitif veya pozitif yarı tanımlı(pozitif yarı tanımlılığın tanımı matrisin simetrik olmasını barındırmaktadır.) olmalıdır. Σ matrisi simetriktir. Alt determinantlar sırasıyla 4 > 0 ve 35 > 0 olduğundan Σ matrisi pozitif tanımlıdır. Bu nedenle Σ Varyans-Kovaryans matrisidir. 0 0 3) Z = (Z1 , Z2 , Z3 ) rasgele vektörü µ = (0, 1, 2) ortalamalı 1 0 −1 Σ = 0 2 0 −1 0 4 3 varyans-kovaryans matrisli çok değişkenli normal dağılıma sahip olmak üzere (a) Z3 ve Z2 rasgele değişkenleri bağımsız mıdır? Neden? Cov (Z2 , Z3 ) = 0 0 olduğundan Z2 ve Z3 rasgele değişkenleri ilişkisizdir. Z = (Z1 , Z2 , Z3 ) , çok değişkenli normal dağılıma sahip olduğundan Z2 ile Z3 ün ilişkisiz olması aynı zamanda bağımsız olması anlamına gelmektedir. (b) Z1 + Z3 rasgele değişkeninin dağılımını elde ediniz. Z1 + Z3 dönüşümü matris formunda Z 1 ¡ ¢ 1 0 1 Z2 Y = Z3 Y 0 = bZ şeklinde yazılabilir. Teorem 1 den Y, tek değişkenli normal dağılıma sahiptir. Teorem 2 den Y nin beklenen değer ve varyansı ³ 0 ´ 0 E bZ = bµ ¡ ¢ 0 1 0 1 1 = 2 = 2 dir. 1 0 −1 1 ³ 0 ´ ¡ ¢ 1 0 1 0 2 0 0 V ar b Z = −1 0 4 1 ¡ ¢ 1 0 0 3 0 =3 = 1 (c) Z rasgele vektörü çok değişkenli normal dağılıma sahip olmasaydı Z1 + Z3 rasgele değişkeninin dağılımı için neler söylenebilirdi? Z1 + Z3 rasgele değişkeninin dağılımı hakkında birşey söylenemez ancak Z1 + Z3 nin beklenen değeri 2, varyansıµ3 dir.¶ µ ¶ ρσ 1 σ 2 σ 21 µ1 ortalamalı Σ = kovaryans 4) X rasgele vektörü µ = µ2 ρσ 1 σ 2 σ 22 matrisli iki değişkenli normal dağılıma sahip ise µ ve Σ nın en çok olabilirlik tahmin edicilerini elde ediniz. 4 Bu sorunun cevabı için ders notlarına bakılabilir. İki değişkenli normal dağılımın parametreleri için parametre uzayını yazınız. İki değişkenli normal dağılımın parametreleri için parametre uzayı Γ = {ρ, σ 1 , σ 2 , µ1 , µ2 : −1 ≤ ρ ≤ 1, σ 1 ≥ 0, σ 2 ≥ 0, µ1 ∈ R, µ2 ∈ R} şeklindedir. Sizce bu tahmin edicilerin aldığı değerler, parametre uzayının dışına çıkabilir mi? Neden? Çıkarsa ne olur? µ b1 = X 1 ve µ b2 = X 2 olduğundan ve µ b1 ve µ b2 tahmin edicilerinin aldığı değerler reel sayı olacağından bu tahmin edicilerin parametre uzayının dışına çıkması söz konusu değildir. v v u n u n u1 X¡ u1 X¡ ¢2 ¢2 t σ b1 = S1 = b2 = S2 = t X1j − X 1 ve σ X2j − X 2 n i=1 n i=1 olduğundan ve S1 ve S2 tahmin edicilerinin aldığı değerler pozitif reel sayı olacağından bu tahmin edicilerin parametre uzayının dışına çıkması söz konusu değildir. b ρ1 = R = S12 S1 S2 dir, burada ¢¡ ¢ 1 X¡ = X1j − X 1 X2j − X 2 n i=1 n S12 ρ1 < 1 dir ve parametre uzayının dışına biçimindedir. S12 < S1 S2 olacağından −1 < b çıkması söz konusu değildir. µ ¶ µ ¶ µ ¶ X1 X2 Xn 5) , ,..., bağımsız ve aynı Y1 µ µY2 ¶ µYn 2 ¶¶ µ1 σ1 ρσ 1 σ 2 Normal2 µ = ,Σ = dağılıma sahip bir örneklem olµ2 ρσ 1 σ 2 σ 22 mak üzere Fisher’in Z dönüşümünü ve asimptotik dağılımını yazarak ρ için asimptotik (1 − α) güven seviyeli güven aralığı oluşturunuz. Fisher’in Z dönüşümü kullanılarak ρ için %95 lik güven aralığı aşağıdaki gibi elde edilir: n > 3 ve H0 : ρ = ρ0 hipotezinin doğruluğu altında µ ¶ 1+R 1 Z = log 2 1−R 5 ´ ´ ³ ³ 1 0 , dır. Buradan rasgele değişeninin asimptotik dağılımı Normal 12 log 1+ρ 1−ρ n−3 0 p L = zα/2 1/ (n − 3) U = z1−α/2 p 1/ (n − 3) olmak ³ ´ üzere Z − 12 log 1+ρ 1−ρ P zα/2 < p < z1−α/2 1/ (n − 3) µ µ ¶ ¶ 1 1+ρ = P L < Z − log <U 2 1−ρ µ µ ¶ ¶ 1+ρ = P 2 × (Z − L) > log > 2 × (Z − U ) 1−ρ µ ¶ 1+ρ = P exp [2 × (Z − L)] > > exp [2 × (Z − U)] 1−ρ ½ ¾ exp [2 × (Z − L)] − 1 exp [2 × (Z − U)] − 1 = P >ρ> =1−α exp [2 × (Z − L)] + 1 exp [2 × (Z − U )] + 1 p eşitliği elde edilir. z = −z eşitli ği göz önüne alınırsa L = z 1/ (n − 3) = 1−α/2 α/2 α/2 p −z1−α/2 1/ (n − 3) = −U olur ve buradan ½ ¾ exp [2 × (Z − U)] − 1 exp [2 × (Z + U )] − 1 P <ρ< =1−α exp [2 × (Z − U )] + 1 exp [2 × (Z + U)] + 1 elde edilir. Bir örneklem için bu aralık (−2, 2) olarak elde edilirse ne yaparsınız? Korelasyon katsayısı −1 ≤ ρ ≤ 1 arasında olduğundan ρ nun %95 ihtimalle (−2, 2) aralığında olması hiç birbilge vermez. Çünkü ρ nun %100 (−1, 1) aralığında olduğunu biliyoruz. Bu durumda ρ için başka güven aralıkları elde edilebilir. 6