2. Ders NORMAL DAĞILIM ve NORMAL DAĞILIMLI RASGELE VEKTÖRLERİN KARESEL FORMLARININ DAĞILIMLARI Bir X rasgele değişkenin olasılık yoğunluk fonksiyonu, 1 x ( )2 1 2 e , x 2 f ( x) biçiminde olduğunda, X rasgele değişkenine normal dağılıma sahiptir denir ve X N ( , 2 ) biçiminde gösterilir. R ve ( 0, ) sayıları, dağlılımın parametreleri olmak üzere 1 x ( )2 1 2 E( X ) x e dx 2 - z 2 E( X ) zx - 1 x 2 ( )2 1 2 e dx 2 2 2 ve Var ( X ) 2 dır. Normal dağılıma sahip bir X r.d. nin moment çıkaran fonksiyonu, t M X ( t ) E ( etx ) e 2 t 2 2 dır. 0 , 1 olan N ( 0,1) dağılımına standart normal dağılım denir. Z N ( 0,1) için x2 1 2 ( z ) e dx , z R 2 z z fonksiyonu standart normal dağılımın dağılım fonksiyonu olmak üzere bu fonksiyonun değerleri standart normal dağılım tablolarında mevcuttur. X1 , X2 ,..., Xn , N ( , 2 ) normal dağılımından bir örneklem olmak üzere, dağılımın paremetrelerinin en çok olabilirlik tahmin edicileri, n ˆ X i 1 n i X ve n 2 (X i 1 i X )2 n dır. Bu tahmin ediciler bağımsız istatistiklerdir. Aynı zamanda momentler yöntemi ile elde edilen tahmin edicilerdir. Ayrıca, ̂ en küçük kareler tahmin edicisidir. Yansız ve tutarlı bir tahmin edici olan ̂ tahmin edicisi N ( , 2 n ) dağılımlıdır. n 1 2 n E ( 2 ) olmak üzere 2 tahmin edicisi yansız değildir. Yansız olacak şekilde düzeltilmiş olan tahmin edici, n ( X i X )2 n ˆ 2 2 i 1 n 1 n 1 olsun. ˆ 2 nin dağılımı ile ilgili olarak n (n 1)ˆ 2 2 (X i 1 i X )2 2 (2n 1) olduğunu hatırlatalım. Tanım S : n´ n tipinde pozitif tanımlı simetrik matris, :n 1 tipinde bir vektör olmak üzere bir Y rasgele vektörün olasılık yoğunluk fonksiyonu f ( y ) f ( y1, y2 ,..., yn ) ( y )1 ( y ) 2 e 1 (2 ) n det() , yi , i 1, 2,..., n biçiminde ise Y rasgele vektörüne normal dağılıma (çok değişkenli normal dağılıma) sahiptir denir. Y rasgele vektörü normal dağılıma sahip olduğunda moment çıkaran fonksiyonu MY ( t ) E ( et Y ) = ¥ ¥ òL ò - ¥ = - ¥ æ ö ( y- m)¢S - 1 ( y- m) ÷ çç ÷ ÷ ççt ¢y÷ ÷ 2 ÷ çè ø 1 (2p ) n det(S ) e dy1...dyn t ¢S t t ¢m+ 2 e dır. Y vektörünün i . bileşeninin moment çıkaran fonksiyonu MYi ( ti ) MY ( 0,..., 0, ti , 0,..., 0) = dır. Burada s ii , S fonksiyondan n’nın 1 timi + s iiti2 2 e i . köşegen elemanıdır. Bu moment çıkaran Yi ~ N (mi , s ii ) , i = 1,..., n olduğu söylenebilir. Y nin herbir bileşeni bir boyutlu normal dağılıma sahiptir. Yi ile Yj nin ortak marjinal dağılımını bulalım. MYi ,Y j ( ti , t j ) MY ( 0,..., 0, ti , 0,..., t j , 0,..., 0) = e = ti mi + t j mj + s iiti2 + 2s ij tit j + s jj t 2j 2 és s ij ùét ù úêi ú ét ,t ùê ii êëi j ú ê ûs êt j ú s jj ú é ù m ij ê ú ë ûë û ét ,t ùê i ú+ êëi j ú ûêëmj ú 2 û e olmak üzere (Yi , Yj ) nin ortak dağılımı iki değişkenli normal dağılımdır. Ayrıca, E (Yi ) i E (Yj ) j Var (Yi ) = s ii Var (Y j ) = s jj Cov(Yi , Y j ) = s ij dır. vektörünün yoğunluk fonksiyonunda bulunan vektörü Y nin bileşenlerinin ortalamalarının vektörü, S matrisi ise Y nin bileşenlerinin varyans-kovaryans matrisidir. Y 11 12 22 Cov(Y ) 21 n1 n 2 1n 2 n nn , ij Cov(Yi , Y j ) , i 1, 2,..., n j 1, 2,..., n Bir E (Y ) Y rasgele vektörü n-değişkenli normal dağılıma sahip ve , Cov(Y ) , rank( ) n ise bu kısaca, Y N ( , ) biçiminde gösterilir. Burada varyans-kovaryans matrisi simetrik ve pozitif tanımlı bir matristir. Bu durumdaki çok değişkenli normal dağılımlara singüler olmayan çok değişkenli normal dağılım denir. Y N (, ) olmak üzere Y nin lineer dönüşümü olan, U AY b rasgele vektörü de normal dağılıma sahiptir. Gerçekten, Mu ( t ) E ( et u ) E ( et ( AY b ) ) et b E ( et AY ) t b e 1 t A t A ( t A) 2 e t b MY ( A t ) e olmak üzere u rasgele vektörü, U N ( A b, A A ) dağılımına sahiptir. 0 , I olması durumunda N ( 0, I ) dağılımına çok değişkenli standart normal dapılım denir. Y N (, ) olmak üzere, :n n varyans- kovaryans matrisinin 1 invers matrisi kendi özdeğer ve özvektörlerinin oluşturduğu matrisler cinsinden, d1 0 1 P 0 0 0 P 0 dn 0 d2 0 olarak yazılsın ve 1/2 olsun. d1 0 P 0 0 d2 0 0 0 P 0 d n Z 1/ 2 ( Y ) dönüşümü sonucu Z rasgele vektörü standart normal dağılıma sahiptir, yani Z N ( 0, I ) dır. Marjinal ve Koşullu Dağılımlar Y n1 N (, ) , rank( ) n 11 12 Y1 1 Y 22 Y 2 , 2 , 21 Yn n n1 n 2 1n 2n , ii Var (Yi ) , ij ji Cov(Yi , Y j ) nn 1 t t t 2 MY (t ) e olmak üzere Y1, Y2 ,..., Yk ( k n) rasgele değişkenlrinin ortak marjinal veya Y1 Y 2 Y 1 Yk vektörünün marjinal dağılımını bulmak için Y 1 'in moment çıkaran fonksiyonunu bulalım. k M Y 1 (t1 , t2 ,..., tk ) M Y (t1 , t2 ,..., tk , 0,..., 0) e i 1 11 12 22 1 ti i t1 ,t2 ,...,tk 21 2 k 1 k 2 1k t1 2 k t2 olduğundan 1 11 12 22 Y 1 N ( 2 , 21 k k1 k 2 kk tk 1k 2k ) kk dır. Y1, Y2 ,..., Yn ‘lerin ortak marjinal dağılımı normaldir. Y N (, ) olmak üzere aşağıdaki, 1 2 1 k n1 ... .... k 1 (n k ) 1 k 1 2 k 2 ... n n1 Y1 Y 2 Y 1 Yk Y n1 ... .... k 1 Y 2 (n k ) 1 Yk 1 Y k 2 ... Y n n1 gösterimler altında, Y1 N ( , 11 ) 1 Y 2 N ( , 22 ) 2 ve fY ( y ) 1 1 fY ( y ) 2 2 1 ( 2 ) k det( 11 ) 1 1 ( y ) 11 (( y ) 1 1 1 1 2 e 1 ( 2 )n k det ( 22 ) 1 1 ( y ) 22 ( y ) 2 2 2 2 2 e dır. Y 2 y verildiğinde Y 1 in koşullu dağılımının yoğunluk fonksiyonu, 2 f (y ,y ) 1 2 f ( y) f (y / y ) 1 2 fY ( y ) fY ( y ) 2 2 2 2 olmak üzere, 1 f (y / y ) 1 2 ( 2 )n det ( ) 1 ( 2 )n det ( 22 ) 1 ( y ) 1 ( y ) e 2 1 1 ( y ) 22 ( y ) 2 2 2 2 2 e ve 1 1 1 11.2 11.2 1222 11 12 1 1 1 22.1 21 22 222111.2 1 1 1 11 12 22.1 1 11.2 1 1 22.1 22.12111 1 1 11.2 11 12 22 21 1 22.1 22 2111 12 ve ayrıca, 1 det( ) det( 11 ) det( 22 2111 12 ) 1 det( 22 ) det( 11 12 22 21 ) olduğundan, f (y / y ) 1 2 1 ( 2 ) k det ( 11.2 ) 1 Q e 2 elde edilir. Burada, 1 1 1 Q ( y ) 12 22 ( y ) 11 ( y ) 12 22 (y ) .2 1 2 1 2 1 2 1 2 dır. Y2 y 2 verildiğinde Y 1 in koşullu dağılımına karşılık gelen rasgele vektör Y1/ Y 2 y ile gösterilirse bu rasgele vektör, 2 beklenen değeri ve 1 E ( Y1/ Y y ) 12 22 (y ) 2 1 2 2 2 Cov( Y1/ Y y ) 11.2 2 2 varyans-kovaryans matrisi ile normal dağılıma sahiptir, yani 1 Y1/ Y y N ( 12 22 ( y ), 11.2 ) 2 1 2 2 2 dır. 1 E ( Y1/ Y y ) 12 22 (y ) 2 1 2 2 2 denklemine regresyon denklemi denir. Y 1 vektörü bir bileşenli, yani Y1 rasgele değişkeni olduğunda, 1 E ( Y1/ Y y ) 1 12 22 (y ) 2 2 2 2 denklemine Y 2 vektörü üzerinde Y1 rasgele değişkeninin regresyon denklemi denir. Y1 Y , Y 1 olmak üzere, Y2 Y 2 Y3 Y1 1 * Y Y2 N ( 2 , ) Y3 3 1 E ( Y1/ Y y ) 1 12 22 (y ) 2 2 2 2 1 23 y2 2 1 12 , 13 22 32 33 y3 3 denklemi Y1 in Y2 ile Y3 üzerine regresyon denklemidir. 11.2 nin elemanları Y1 in koşullu dağılımındaki Yi ile Yj , (i , j 1, 2,..., k ) lerin kovaryanslarıdır. Bu kovaryanslar, i , j /( k 1, k 2,...,n) , i , j 1,2 ,..., k biçiminde gösterilir. i , j /( k 1, k 2 ,...,n ) ij/( k 1, k 2 ,...,n ) ii/( k 1, k 2 ,...,n ) , i , j 1, 2,..., k değerine , Y 2 y2 verildiğinde Yi ile Y j arasındaki kısmi korelasyon katsayısı denir. Y1 Y1 Y Y 2 Y vektörü, Y 2 ve buna bağlı olarak matrisi, Yn Y m 1m 11 12 22 2 m 21 mm m1 m 2 biçiminde parçalansın. Cov(Yi , Y j ) ij , i , j 1, 2,..., m olmak üzere, Y i ve Y j vektörleri için Cov(Y i , Y j ) = S ij = 0 matrisi ise Y i ve Y j vektörlerine ilişkili değildir denir. Çok sık rasgele vektörlerin bağımsızlığı ile ilgileniriz. Rasgele vektörler bağımsız ise ilişkili değillerdir. İlişkili olmayan rasgele vektörlerin bağımsız olduklarını her zaman söyleyemeyiz. Ancak rasgele vektörlerin ortak dağılımı normal olduğunda bağımsız olmaları için gerek ve yeter şart ilişkili olmamalarıdır. Y N (, ) ve Y ile aşağıdaki gibi parçalansın. Y1 Y 2 Y Y m , 11 12 22 21 m1 m 2 1m 2 m mm Y1, Y2 ,..., Ym vektörleri bağımsız ij 0 i , j 1, 2 , 3,..., n , i j dır. Y N (, ) , I ise Y1, Y2 ,..., Yn rasgele değişkenleri bağımsızdır. 1 1 2 * Y N ( 2 , 3 0 4 0 2 0 0 5 0 0 Y Y ) ise 1 vektörü ile 3 vektörü ilişkili değildir. 0 2 4 Y2 Y4 0 4 3 Bu iki vektör üstelik bağımsızdır. 1 1 2 0 0 2 2 5 0 0 ) olmak üzere, * Y N ( , 0 0 0 2 0 1 0 0 0 1 ve Y4 rasgele değişkeni bağımsızdır. Y1 O L M Pvektörü, Y3 rasgele değişkeni Y2 Q N 1 1 0 1 * Y N ( 0 , 0 2 1) ise Y1 ile Y2 bağımsızdır. 2 1 1 3 1 1 2 0 * Y N( , 0 0 1 0 0 0 0 5 0 0 ) ise Y1, Y2 , Y3 , Y4 bağımsızdır. 0 2 0 0 0 1 Ki-Kare Dağılımı Bir X rasgele değikenin olasılık yoğunluk fonksiyonu, 1 R x 1e x / | f ( x) S () |T0 , x0 , d . y. biçiminde olduğunda, X e Gamma dağılımına sahiptir denir ve X (, ) biçiminde gösterilir. (0, ), (0, ) parametrelerine bağlı olarak, E ( X ) Var ( X ) 2 M X ( t ) (1 t ) dır. 2 olan (, 2) dağılımına r 2 serbestlik dereceli (tam sayı olmak kaydıyla ) ki-kare dağılımı denir ve ( r ) biçiminde gösterilir. X ~ c (r ) dağılımlı ise, r R 1 || r x 2 1e x / 2 , x 0 f ( x) S ( ) 2r / 2 || 2 , d . y. T0 E( X ) r Var ( X ) 2r M X ( t ) (1 2t ) r 2 dır. Bağımsız X1, X2 ,..., Xn rasgele değişkenleri sırasıyla r1, r2 ,..., rn serbestlik dereceli ki-kare dağılımına sahip ise Y X1 X2 ... Xn rasgele değişkeni serbestlik derecesi r r1 r2 ... rn olan ki-kare dağılımına sahiptir. Gerçekten, MY (t ) M X1 (t ). M X 2 (t )... M X n (t ) (1 2t ) r1/ 2 (1 2t ) r2 / 2 ...(1 2t ) rn / 2 r r ... rn 1 2 2 (1 2t ) olduğundan Y ( r1 r2 ... rn ) dır. X 2( n ) , X1 2( m) , n m , X1 ile X2 bağımsız ve X X1 X2 ise X2 2( n m) dır. Gerçekten, X2 rasgele değişkenin moment çıkaran fonksiyonu M X 2 ( t ) olmak üzere, M X (t ) M X1 (t ) M X 2 (t ) (1- 2t )- n/2 = (1- 2t )- M X 2 ( t ) (1 2t ) m/2 nm 2 M X 2 (t ) yani, X2 2( n m) dır. Z N ( 0, 1) olmak üzere X Z 2 ‘nin dağılımı 12 dır. X1, X2 ,..., X n rasgele değişkenleri bağımsız ve her biri N ( , 2 ) dağılımlı, ya da X1, X2 ,..., Xn N ( , 2 ) dağılımından örneklem olmak üzere, n ( Xi ) i 1 n 2 2 2 ( Xi X ) i 1 2( n ) 2 2( n 1) dır. X1, X2 ,..., X n rasgele değişkenleri bağımsız ve herbiri N ( 0, 1) dağılımlı olduğunda n 2 2 X i ( n ) i 1 dır. X1, X2 ,..., Xn rasgele değişkenleri bağımsız ve sırasıyla N ( i ,1) , i 1, 2,..., n dağılımlı olduğunda, n 2 2 ( Xi i ) ( n ) i 1 n dır. Merkezileştirme yapılmaksızın Xi2 rasgele değişkeninin dağılımı nedir? i 1 Şimdi bu problemi göz önüne alalım. X1 X X 2 N ( , I ) Xn , ém1 ù ê ú êm ú m = êê 2 úú ê Mú êm ú ë nû olmak üzere Xi2 X X rasgele değişkenin dağılımını bulmak istiyoruz. n i 1 A matrisi ilk satırı 1 m¢ ( a ) vektörü olan bir ortogonal matris a olsun. Y AX dönüşümü sonucu Y N ( A, I ) dağılımlıdır. a 0 A 0 olmak üzere, n 2 2 Yi ( n 1) i 2 dır. V Y12 U Yi2 Y Y V X X V n i 2 olmak üzere V ile U bağımsızdır. Amacımızın X X U V nin dağılımını bulmak olduğunu hatırlatalım. İlk olarak V nin dağılımını, daha sonra V ile U nun ortak dağılımını ve buradan U V nin dağılımını bulmaya çalışalım. Y1 N ( a ,1) olmak üzere V Y12 rasgele değişkenin olasılık yoğunluk fonksiyonu 1 1 R - ( v a) - ( v 1 1 1 | 2 + e 2 fV ( v ) S2 e 2 v 2 |T0 a R || e- 2 v-1/ 2e- v/ 2 (e- av + e av ) , v > 0 fV ( v ) S ||02 2 , d.y. T 2 a )2 1 -2 v , v>0 , d.y. - a2 j e v -1/2 e-v/2 (av) , v >0 fV (v) 2 j=0 (2j)! , d.y. 0 dır. V ile U nun ortak o.y.f. fV ,U ( u, v ) fV ( v ). fU ( u) R S T0 , v > 0, u > 0 , d.y. olmak üzere, Z U V U W U V l q dönüşümünün ( z , w): z 0, w 1 bölgesi üzerinde ters dönüşümü U ZW V Z (1 W ) ve Jakobiyeni, L M N O P Q w z (u, v) det z ( z , w) 1 w z dır. Buna göre Z ile W ‘nun ortak olasılık yoğunluk fonksiyonu, f z , w ( z , w) R fV ( z (1 w)). fU ( zw ). z S T0 , z > 0,0 < w < 1 , d.y. ve Z ‘nin marjinal olasılık yoğunluk fonksiyonu, dır. 1 R | zfV ( z (1 w)). fU ( zw ) zdw , z > 0 fz ( z) S 0 |T0 , d.y. 1 e1/ 2 z 2 0 n 1 zw 1 z ( 1 w ) ( az (1 w )) ( zw ) 2 e 2 2 ( z (1 w )) 1/ 2 e zdw n 1 ( 2 j )! j 0 n 1 ( )2 2 2 n e a / 2 2 1 z / 2 z e 2 a jz j 1 z(1 w) n 1 n 1 2 ( )2 j 0 ( 2 j )! 0 j 1/ 2 n 1 w 2 dw 2 n 1 a/ 2 2 e z e z / 2 1 n 1 )( ) a jz j 2 2 n ( 2 j )! ( j ) 2 ( n 1 j 0 n 1 2 ( )2 2 2 e a/ 2 j a j 0 ( 2 j )! e a / 2a j j 0 ( 2 j )! ve 1 ( j ) 2 n 2 2n/ 2 ( j ) n2 j 1 z 2 e z / 2 1 n2 j ( j ) 1 2 z 2 e z / 2 n2j 2n/ 2 ( ) 2 1 2 j 1 2 j 3 3 1 1 ( j ) ( )( )... ( ) 2 2 2 22 2 1 ( 2 j )! 2 j j !1. 3. 5...( 2 j 1) 22 j j! olması sebebiyle n2 j R 1 1 || e a / 2 ( a / 2 ) j 2 z e z / 2 n2 j j ! j 0 fZ ( z) S n2j ( )2 2 || 2 , T0 elde edilir. , z0 d . y. a 2 2 n olmak üzere Z U V X X Xi2 rasgele değişkenin olasılık yoğunluk i 1 fonksiyonu, n2 j R 1 e j 1 || 2 z e z / 2 n 2 j j 0 j! fZ ( z) S n2j ( )2 2 || 2 T0 , z0 , d . y. olarak yazılır. Bu olasılık yoğunluk fonksiyonu parametreli Poisson 2 n 2 j , ( j 0,1, 2 ,...) serbestlik dağılımındaki olasılıklar ile ağırlıklandırılmış dereceli ki-kare dağılımlarının olasılık yoğunluk fonksiyonlarının ağırlıklı toplamıdır. Böyle bir olasılık yoğunluk fonksiyonuna sahip dağılıma, n serbestlik dereceli parametreli (merkezsel olmama parametreli) merkezsel olmayan ki-kare dağılımı denir ve 2( n, ) biçiminde gösterilir. Özetlersek, X N ( , In ) X X Xi2 2 n i 1 ( n, 2 ) dır. 2( n, ) dağılımına sahip bir X rasgele değişkeni için, 2 t n/ 2 1 2 t M X ( t ) (1 2 t ) e , t 1 2 E ( x) n 2 Var ( x) 2(n 4) dır. 2( n, ) merkezsel olmayan ki-kare dağılımı 0 için alışılmış ki-kare dağılımının kendisidir. Bu dağılıma merkezsel ki-kare dağılımı da denir. Merkezsel ki-kare dağılımı yardımıyla oluşturulan t ve F dağılımlarına benzer şekilde, merkezsel olmayan ki-kare dağılımı yardımıyla, merkezsel olmayan t ve F dağılımları tanımlanmıştır. t-Dağılımı U N (0,1) , V 2( r ) ve U ile V bağımsız iki rasgele değişken olmak üzere, X U v r rasgele değişkenin olasılık yoğunluk fonksiyonu, r 1 ) r 1 2 2 (1 x ) 2 , x f ( x) r 2 r ( ) 2 dır. Bu o.y.f. na sahip r.d. lere r serbestlik dereceli t -dağılımına sahiptir denir ve X t(r ) biçiminde gösterilir. ( X t( r ) olmak üzere, E ( X ) 0 , ( r > 1) ve Var ( X ) r r 2 , ( r > 2) dır. Tr t(r ) olmak üzere, dağılımda r® ¥ Tr ¾ ¾ ¾ ¾ ® Z (Z ~N(0,1)) dır. Teorem X1, X 2 ,..., X n , N ( , 2 ) dağılımından bir örneklem olmak üzere, X ( Xi X ) ( n 1) n 2 t( r ) dır. Tanım Z N (0,1) , U 2( r ) ve Z ile U bağımsız olsun. , sabit bir sayı olmak üzere, X Z u/ r rasgele değişkenine r serbestlik dereceli, merkezsel olmama parametreli t - dağılımına sahiptir denir ve X t (r , ) biçiminde gösterilir. f ( x) 2 rr/ 2 e 2 r j 1 j 2 x2 j / 2 ( )( )( ) , ( r / 2) ( r x2 )( r 1)/ 2 j 0 2 j ! r x2 x dır. Teorem Y N (, 2 ) , U 2( r ) ve Y ile U bağımsız olmak üzere, Y u/ r t (r , ) dır. F -Dağılımı U 2( r ) , V 2r ve U ile V bağımsız iki rasgele değişken olmak üzere, 1 2 U / r1 X V / r2 rasgele değişkenin olasılık yoğunluk fonksiyonu, r1 r r r r1 r2 ( 1 2 )( 1 ) 2 r1 1 r 2 r2 f ( x) x 2 (1 1 x ) 2 , 0 x ( r1 / 2 ) ( r2 / 2 ) r2 dır. Bu olasılık yoğunluk fonksiyonuna sahip rasgele değişkenlere F - dağılımına sahiptir denir ve X F (r1, r2 ) biçiminde gösterilir. X F (r1, r2 ) ise 1/ X F (r2 , r1) dır. T t ( r ) ise T2 F (1, r ) dır. F ( r1, r2 ) dağılımında, F ( r1, r2 ) noktası sol tarafındaki alan olacak şekilde bir nokta olmak üzere, F (r1, r2 ) dır. 1 F1 (r2 , r1) U1 2( r , ) , U2 2( r ) , U1 ile U 2 bağımsız olsun. 1 2 X= U1 / r1 U2 / r2 rasgele değişkeninin olasılık yoğunluk fonksiyonu r 2 j R 2 j r r r l j 1 2 1 || e l G( r r 2 j )( ) 2 r1 2 r2 ( r 2 j 2 )/ 2 2 x (1 x ) f ( x ) S r2 2 j r1 r j 0 2 j !G ( )G ( ) || 2 2 |T0 1 1 2 , x0 1 , x0 dır. Bu olasılık yoğunluk fonksiyonuna sahip bir dağılıma merkezsel olmama parametreli, r1 ve r2 sebestlik dereceli F - dağılımı denir ve X F (r1, r2 , ) biçiminde gösterilir. r (r 2 ) E( X ) 2 1 , ( r2 2 ) r1 ( r2 2 ) r ( r 2 )2 ( r1 4 )( 2 ) Var ( X ) 2 ( 2 )2 1 , ( r2 4 ) r1 ( r2 2 )2 ( r2 4 ) dır. X F ( r1 , r2 , ) olmak üzere, r 2 k 1 r1 ( r1 2 )2 r r1 4 için X / k rasgele değişkenin dağılımı yaklaşık olarak F ( r1, r2 ) dır. Karesel Formların Dağılımları Bu kısımda normal dağılıma sahip rasgele vektörlerin formlarının olasılık dağılımları ele alınacaktır. karesel Y n1 N ( 0, I ) olması durumunda Y Y 2( n ) ve Y n1 N (0, 2 I ) olması 1 Y Y 2 olduğunu biliyoruz. durumunda da (n) 2 Şimdi Y n1 N ( 0, ) (rank( n)) olmak üzere, Q Y 1 Y karesel formunun dağılımını bulmaya çalışalım. Q nun moment çıkaran fonksiyonu ¢ - 1Y M Q (t ) = E (etQ ) = E (etY S = ¥ ¥ ò- ¥ L ò- ¥ = (1- 2t )- n/2 ) - 1 ( 2p )n (det S )1/2 e 1- 2t ¢ - 1 yS y 2 dy1dy2 L dyn , t < 1/ 2 olduğundan, Q 2( n) dır. Y N ( 0, In ) ve A reel simetrik bir matris olmak üzere Q Y AY karesel formunu gözönüne alalım. Bu karesel formun moment çıkaran fonksiyonu, M Q( t ) E ( etY AY ) = ¥ ¥ ò- ¥ L ò- ¥ 1 ( 2p )n - 1/2 - e 1 y ¢( I - 2tA) y 2 dy1dy2 L dyn , t h dır. Burada h sayısı, I 2tA matrisi pozitif tanımlı olacak şekilde bir sayıdır. A reel simetrik bir matris olmak üzere, P ortogonal matrisi vardır, öyleki = [det( I - 2tA)] 1 0 PAP 0 0 2 0 0 0 0 n ve det( I 2tA) det( P ( I 2tA) P) (1 2 t1 )(1 2 t 2 )...(1 2 t n ) dır. rank( A) r olsun. 0 r n olmak üzere A matrisinin özdeğerlerinden r tanesi sıfırdan farklıdır, bunlar 1, 2 ,..., r olsun. O zaman, MQ (t ) (1 2t1)(1 2t2 )...(1 2tr ) 1/ 2 dır. Q Y AY karesel formunun dağılımı ki-kare olması için moment çıkaran fonksiyonunun (1 2t ) k / 2 biçiminde olması gerektiğini hatırlatalım. İlk önce Q Y AY 2( k ) olduğunu varsayalım. Bu durumda, - 1/2 [(1- 2tl 1)(1- 2tl 2 )...(1- 2tl r )] = (1- 2t )- k /2 olacaktır. Polinomların özdeş olması için r k ve 1 2 ... r 1 olması gerekir. Diğer özdeğerlerin de sıfır olduğu göz önüne alınırsa A matrisi idempotent bir matris olmalıdır. Diğer taraftan Y N (0, I ) ve reel simetrik A matrisi için rank( A) r , 2 A A , yani A idempotent ise, MQ ( t ) (1 2 t ) r / 2 ve Q Y AY 2( r ) olacaktır. Böylece aşağıdaki Teoremi ispatlamış olduk. Teorem Y N (0, In ) ve An n reel simetrik rankı r olan bir matris olmak üzere, Y AY 2( r ) A2 A dır. Aşağıdakiler (teoremler) de benzer şekilde ispatlanabilir: * Y N (0, n n ) ve rank( ) n, Bnn reel simetrik bir matris olmak üzere, Y BY 2( r ) ( B )2 B ve rank( B) r dır. * Y N (, In ) için Y Y 2 1 ( n , ) 2 * Y N (, nn ) için Y 1Y 2 1 ( n , 1 ) 2 * Y N (, In ) için A reel simetrik bir matris olmak üzere, Y AY 2 1 ( r , A ) 2 A2 A ve rank( A) r dır. * Y N (, nn ) ve regüler C matrisi için CC I , Z CY N (C, I ) olsun. O zaman, Y AY Z C 1 AC 1 Z 2 1 ( r , CC 1 AC 1C ) 2 olması için gerek ve yeter şart C 1 AC1 matrisinin idempotent ve rank( C 1 AC 1) Rank ( A) r olmasıdır. Yukarıda verilenler, aşağıdaki teoremin özel halleridir. TEOREM Y N (, ) , rank( ) n ve üzere, Y AY 2 dır. 1 ( r , A ) 2 A reel simetrik bir matris olmak A idempotent ve rank( A ) r Karesel Formların Beklenen Değeri ve Varyansı Teorem X n 1 boyutlu bir rasgele vektör olmak üzere, E ( X A X ) tr ACov ( X ) E ( X ) AE ( X ) dır. İspat E ( X A X ) E ( aij Xi X j ) ij aij E ( Xi X j ) aij Cov( Xi X j ) E ( Xi ) E ( X j ) ij ij = aijCov( Xi X j ) aij E ( Xi ) E ( X j ) ij ij tr ( ACov( X )) E( X ) AE ( X ) Sonuç Cov( X ) 2 I ve E ( X ) 0 ise E ( X AX ) 2tr( A) dır. Teorem X n1 N (, ) olmak üzere L M N O P Q a) E ( X A X )( X B X ) tr ( A ) tr ( B ) 2tr ( AB ) Atr ( B ) Btr ( A ) A B ( A ) ( B ) b) Cov( X A X , X B X ) 2tr ( A B ) 4 A B c) Var ( X ¢AX ) = 2tr éê( AS )2 ùú+ 4m¢AS Am ë û dır. Normal Dağılımlı Rasgele Vektörlerin Lineer ve Karesel Formların Bağımsızlığı Teorem Y N (, nn ) , rank( ) n olmak üzere, AY ile Y BY bağumsız A B 0 dır. Teorem Y N (, nn ) , rank( ) n olmak üzere, Y BY ile Y CY baðýmsýz BC 0 dır. Cohran Teoremi Y N ( , 2 In ) A1, A2 ,..., Ak matrisleri simetrik, sırasıyla n1, n2 ,..., nk ranklı ve A1 A2 ... Ak In , yani Y Y Y A1Y Y A2 Y ... Y Ak Y k olsun. Eğer ni n ise, i 1 Y A1 Y , Y A2 Y ,..., Y Ak Y karesel formları bağımsız ve i 1, 2,..., n için, 1 2 Y Ai Y 2 ( ni ,i 1 2 2 Ai ) dır. Tersine, 1 2 Y Ai Y karesel formları bağımsız ve 1 2 Y Ai Y 2( r , ) , i 1, 2 ,..., k i i ß k ri = ni , i = 1, 2,..., k ve å ni = n i= 1 dır. Cochran Teoremi karesel formların parçalanmasında çok kul-lanışlı bir teoremdir. Bu teoremdeki Ai Aj 0 , i j , i , j 1, 2,..., n ya da Ai 2 Ai , denktir. Yani bu üç şart birbirine denktir. n ni n i 1 olması şartı, i 1, 2,..., n olması şartlarına Normal Dağılım ve Karesel Formlar İle İlgili Bazı Örnekler Örnek Y n1 N (0, 2 I ) olsun. Y vektörünün Y1, Y2 ,..., Yn bileşenlerine N ( 0, 2 ) dağılımından alınmış n birimlik bir örneklem olarak bakabiliriz. 1 1 1 1 Jn 1 1 1 1 , rank ( J n ) n 1 nn ve 1/ n 1/ n 1/ n 1/ n 1 A Jn n 1/ n 1/ n 1/ n 1/ n 1/ n olmak üzere, 2 1 nY Q Y ( 2 A) Y 2 karesel formunu göz önüne alalım. rank( A) 1 ve nY 2 2 2(1) dır. Ayrıca A matrisi simetrik ve idempotent olduğundan bir dik izdüşüm matrisidir. Gerçekte, 1 1 1 1n , 1n 1,1,...,1 n 1 n1 A = 1n1+n olmak üzere, A matrisi R n ‘deki vektörleri 1n vektörünün gerdiği 1n altuzayı üzerine dik izdüşüm matrisidir. 1/ n 1/ n 1/ n 1/ n Yˆ AY 1/ n 1/ n 2 2 Yˆ Yˆ Yˆ Y AY nY 1/ n Y1 Y 1/ n Y2 Y Y 1n 1/ n Yn Y ve Yˆ ile Y Yˆ vektörleri birbirine dik olduğundan, Y 2 2 Yˆ Y Yˆ n 2 2 n 2 2 Yi nY (Yi Y ) i 1 i 1 dır. Y 2 Yi2 Y Y de bir karesel formdur. Bu karesel formun matrisi, I n i 1 birim matrisidir. Bu karesel form ile ilgili, Y ( 1 2 I )Y 2( n ) olduğunu biliyoruz. n 2 (Yi Y ) de Y nin bir karesel formudur. i 1 Y ¢( I - 1 J n )Y = n n å i= 1 (Yi - Y ) 2 Bu karesel formun matrisi I n idempotent ve 1n In - 1 Jn n olmak üzere, bu matris simetrik, altuzayı üzerine dik izdüşüm matrisidir. 1 J n matrisi ile Y n ‘nin varyans kovaryans matrisi olan 2 I matrisinin çarpımı olan æ öæ ö çç( I n - 1 J n )s 2 I ÷ çç( I n - 1 J n )s 2 I ÷ ¹ ÷ ÷ ÷ ÷ çè ç øè ø n n matrisini idempotent yapmak için I n - æ ö çç( I n - 1 J n )s 2 I ÷ ÷ ÷ çè ø n 1 1 1 J n yerine ( I J n ) yazılmasıyla, n n n s2 æ1 öæ 1 ö çç ( I n - 1 J n )s 2 I ÷ çç ( I n - 1 J n )s 2 I ÷ = ÷ ÷ ÷ ÷ 2 2 èçs øèçs ø n n æ ö çç 1 ( I n - 1 J n )s 2 I ÷ ÷ ÷ 2 çès ø n ve 1 s 2 Y ¢( I n - 1 J n )Y ~ c (2r ) n olur. Buradaki r serbestlik derecesi, I n - 1 J n matrisinin rankı olmak üzere n aynı zamanda bu matrisinin sütun vektörlerinin gerdiği 1n boyutudur. In - alt uzayının 1 J n matrisi idempotent olduğundan, n rank ( I n - 1 1 1 1 J n ) = tr ( I n - J n ) = tr ( I n ) - tr ( J n ) = n - n = n - 1 n n n n ve buna göre, n Y dır. 1 2 ( In 2 ( Yi Y ) 1 J n )Y i 1 n 2 2( n 1) Ayrıca, 1 1 Jn (In - Jn ) = 0 n n olduğundan, n 2 1 1 ¢ ¢ Y J n Y = nY ile Y ( I n - J n )Y = å (Yi - Y ) 2 n n i= 1 karesel formları bağımsızdır. Özetlersek: Y1, Y2 ,..., Yn ‘ler N ( 0, 2 ) dağılımından alınmış n birimlik bir örneklem, yani éY1 ù ê ú êY ú Y n´ 1 = êê 2 úú~ N (0, s 2 I ) ê Mú êY ú ë nû olsun. n 2 n 2 2 Yi nY (Yi Y ) i 1 1 s 2 i 1 n å Yi2 = Y ¢( i= 1 1 s 2 I )Y ~ c (2n) ü ïï ïï : ïï s2 ïï n ý bağımsız ïï 2 ( Y Y ) å i ïï 1 1 ¢ 2 i = 1 Y 2 ( I n - J n )Y = ~ c ( n- 1) ïï 2 ïï n s s þ nY dır. 2 2 c (1) Örnek Y n 1 N (, 2 I ) ve 1n olsun. vektörünün Y1, Y2 ,..., Yn Y bileşenlerine, N ( , 2 ) dağılımından alınmış n birimlik örneklem olarak bakabiliriz. Y1, Y2 ,..., Yn ‘ler N ( , 2 ) dağılımından n birimlik örneklem olsun. n n 2 2 2 Yi nY (Yi Y ) i 1 i 1 n å Yi2 i= 1 2 s 1 = Y ¢( 2 I )Y ~ c 2 nm2 s ( n,l = ) 2 2s nY s n å 2 = 2 1 Y ¢( J n )Y ~ c 2 nm2 n s (1,l = ) 1 2 2s 2 (Yi - Y )2 i= 1 s 2 = 1 s 2 Y ¢( I n - 1 J n )Y ~ c (2n- 1,l = 0) n dır. Ayrıca, n 2 ( Yi ) i 1 2 n (Y ) 2 dır. 2 2( n ) 2(1) Y1, Y2 ,..., Yn ‘ler N (0, s 2 = 25) dağılımından alınmış n birimlik bir örneklem nY s 2 2 : 2 c (1) Y1, Y2 ,..., Yn ‘ler N (m = 5, s 2 = 25) dağılımından alınmış n birimlik bir örneklem nY s 2 2 ~ c2 (1,l = nm2 2s 2 ) >> veri=randn(10,100)*5; >> hist(10*(mean(veri)).^2/25) >> veri=randn(10,100)*5+5; >> hist(10*(mean(veri)).^2/25) 60 25 20 40 15 10 20 5 0 0 0 2 4 6 8 n 1 2 n å å Yi2 ~ c (2n= 10) 15 15 10 10 5 5 å 5 10 15 s 2 0 20 n (Yi - Y )2 i= 1 å ~ c (2n- 1) s 15 15 10 10 5 5 5 0 10 i= 1 20 0 10 20 25 30 35 15 20 20 30 40 (Yi - Y )2 20 0 15 s >> hist(sum((veri).^2)/25); 20 0 10 ~ c (2n= 10,l = 5) 2 20 0 5 Yi2 i= 1 s i= 1 >> hist(sum((veri).^2)/25); n 0 0 0 2 ~ c (2n- 1,l = 0) 5 10 15 20 Örnek Y N ( 0, 2 I ) olsun. X n p , rank( X ) p olmak üzere, Q YY , Q1 2 Y X ( X X ) 1 X Y 2 , Q2 Y ( I X ( X X ) 1 X )Y 2 karesel formların dağılımlarını bulalım. Q Y ( X ( X X ) 1 1 2 I)Y 2(n ) X idempotent, rank( X ( X X ) 1 X ) tr ( X X ( X X ) 1 ) tr ( I p ) p olduğundan Q1 Y L O 1 X ( X X ) 1 X P Y 2( p ) M 2 N Q ve I X ( X X )1 X idempotent, rank( I X ( X X )1 X ) n p olduğundan Q2 Y dır. Ayrıca, L O 1 ( I X ( X X ) 1 X ) P Y 2( n p ) M 2 N Q X ( X X ) 1 X ( I X ( X X )1 X ) 0 olduğundan Q1 ile Q2 karesel formları bağımsızdır ve dır. Q1 n p F( p,n p) Q2 p X ( X X ) 1 X matrisi X X 1, X 2 ,..., X p matrisinin sütun vektörleinin gerdiği [X ]= span {X 1, X 2 ,..., X p } uzayı üzerine dik izdüşüm dönüşümüne karşılık gelen matristir. Y vektörünün Yˆ X ( X X ) 1 X Y ile gösterilirse, Y 2 2 Yˆ Y Yˆ X üzerine dik izdüşümü 2 Y Y Y X ( X X ) 1 X Y Y I X ( X X ) 1 X Y dır. Örnek: İki Değişkenli Normal Dağılım İki değişkenli normal dağılıma sahip X , Y rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu, E X X , E Y Y , Cov X , X XY , XX XY XY YY olmak üzere, f x, y 1 2 det 12 1 x X exp x X , y Y 1 , y Y 2 dır. X ile Y ‘nin marjinal dağılımları X N ( X , XX ) Y N (Y , YY ) ve koşullu dağılımları, æ ö s ÷ Y/ X = x : N çççmY + XY ( x - mX ) , s YY (1- r 2XY ) ÷ ÷ ÷ s XX è ø E (Y/ X = x ) = mY + s XY ( x - mX ) s XX Var (Y/ X = x ) = s YY (1- r 2XY ) æ ö s ÷ X /Y = y : N çççmX + XY ( y - mY ) , s XX (1- r 2XY ) ÷ ÷ s YY è ø÷ E ( X /Y = y ) = mX + s XY ( y - mY ) s YY Var ( X /Y = y ) = s XX (1- r 2XY ) dır. x y Z1 , Z 2 iki değişkenli standart normal dağılıma sahip olduğunda, f z1 , z2 1 1 exp z12 z22 , z1 , z2 2 2 dır. Bu olasılık yoğunluk fonksiyonunun grafiği, 0.2 0.15 0.1 0.05 0 5 5 0 0 -5 -5 dır. İki değişkenli standart normal dağılımdan 100 birimlik bir örnek için serpilme diyagramı, 3 2 1 0 -1 -2 -3 -3 dır. -2 -1 0 1 2 3 >> clear all; close all mu=[5 ;10]; sigmamatrisi=[2 0.5;0.5 2]; sigmaters=inv(sigmamatrisi); c=1/(2*3.14*sqrt(det(sigmamatrisi))); for ii=1:101; for jj=1:101; xx=mu(1,1)-5+10*(ii/101); yy=mu(2,1)-5+10*(jj/101); z(ii,jj)=c*exp(-0.5*[xx-mu(1,1);yy-mu(2,1)]'*sigmaters*[xx-mu(1,1);yy-mu(2,1)]); z(ii,jj)=c*exp(-0.5*[xx-mu(1,1);yy-mu(2,1)]'*sigmaters*[xx-mu(1,1);yy-mu(2,1)]); end end xxx=(mu(1,1)-5):.1:(mu(1,1)+5); yyy=(mu(2,1)-5):.1:(mu(2,1)+5); meshgrid(xxx,yyy); mesh(xxx,yyy,z); sigmamatrisi=[2 1.6;1.6 2] sigmamatrisi=[2 0.5;0.5 2] 0.1 0.14 0.08 0.12 0.06 0.1 0.08 0.04 10 0.06 0.02 10 0.04 5 0 15 0.02 10 5 0 0 15 5 10 5 0 >> clc ; clear all ; close all n=1000; sigmamatrisi=[2 0.5;0.5 2]; veri=sqrt(sigmamatrisi)*randn(2,n); sinifsayisi=10; [fx,sx]=hist(veri(1,:),sinifsayisi); [fy,sy]=hist(veri(2,:),sinifsayisi); for i=1:sinifsayisi for j=1:sinifsayisi x1=sx(i)-(sx(2)-sx(1))/2 ; x2=sx(i)+(sx(2)-sx(1))/2 ; y1=sy(j)-(sy(2)-sy(1))/2 ; y2=sy(j)+(sy(2)-sy(1))/2 ; frekans=0; for ii=1:n if veri(1,ii)<x2 if veri(1,ii)>=x1 if veri(2,ii)<y2 if veri(2,ii)>=y1 frekans=frekans+1; end,end,end,end end frpolig(i,j)=frekans; x=[x1 x2]; y=[y1 y2]; meshgrid(x,y); z=frekans*ones(2,2); mesh(y,x,z); hold on end end figure meshgrid(sx,sy); mesh(sy,sx,frpolig); figure plot(veri(1,:),veri(2,:),'.') sigmaters=inv(sigmamatrisi); c=1/(2*3.14*sqrt(det(sigmamatrisi))); figure for ii=1:101; for jj=1:101; xx=-5+10*(ii/101); yy=-5+10*(jj/101); z(ii,jj)=c*exp(-0.5*[xx;yy]'*sigmaters*[xx;yy]); end end xxx=-5:.1:5; yyy=-5:.1:5; meshgrid(xxx,yyy); mesh(xxx,yyy,z); 100 50 0 -6 -5 -4 -2 0 0 2 4 6 5 100 80 60 40 20 0 5 0 -2 -5 -6 -4 0 2 4 5 4 3 2 1 0 -1 -2 -3 -4 -5 -6 -4 -2 0 2 4 6 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0 5 0 -5 -5 0 5 >> hist3(veri); Y X N Y , X YY XY XY dağılımında, XX æ ö s ÷ Y/ X = x : N çççmY + XY ( x - mX ) , s YY (1- r 2XY ) ÷ ÷ ÷ s XX è ø E (Y/ X = x ) = mY + s XY ( x - mX ) s XX Var (Y/ X = x ) = s YY (1- r 2XY ) olmak üzere, Y rasgele değişkeninin X rasgele değişkeni üzerine regresyon denklemi , E (Y/ X = x ) = mY + s XY ( x - mX ) s XX dır. X , Y ‘nin ortak dağılımından alınan n birimlik örneklem, Y1 Y2 X , X , ... , 1 2 Yn X n olsun. Bu gözlemler için Yi = mY + s XY 2 ( X i - mX ) + ei , i = 1, 2,..., n , ei : N 0, s e2 = s XX (1- r XY ) s XX ( ) ei ' ler bağımsız yazılabilir. Buna Y rasgele değişkeninin X rasgele değişkeni üzerine regresyon modeli denir. Bu modeli, Yi = b 0 + b1 X i + ei , i = 1, 2,..., n biçiminde yazalım. Regresyon katsayıları, b 0 = mY b1 = s XY mX s XX s XY s XX olmak üzere, bu katsayıları ve hata terimi e ‘nun varyansı olan s e2 parametresini gözlemlerden tahmin etmek isteyelim. Tahmin edici olarak, mX , s XX = s X2 , mY , s YY = s Y2 , s YY = Cov( X , Y ) , r 2XY parametrelerin örneklem karşılıklarını kullanır ve b 0 = mY b1 = s XY mX s XX s XY s XX s e2 = s XX (1- r 2XY ) ifadelerinde yerlerine yazarız. Böylece, n bˆ1 = å ( X i - X )(Yi - Y ) i= 1 n å = ( X i - X )2 SXY SXX i= 1 SXY bˆ0 = Y X = Y - bˆ1 X SXX æ ö SXY 2 sˆ e2 = SYY (1- rˆ 2 ) = SYY (1- rXY ) = SYY çç1- ( )2 ÷ ÷ ÷ çè SXX .SYY ø >> n=15; >>sigmamatrisi=[2 4 ; 4 16]; >>veri=sqrt(sigmamatrisi)*randn(2,n)+[10; 2.5]*ones(1,n); >>Y=veri(1,:)'; >>X=veri(2,:)'; >>R=corrcoef(Y,X); >>S=cov(Y,X); >>SYY=S(1,1); >>SXX=S(2,2); >>SXY=S(1,2); >>beta1=SXY/SXX beta1 = 0.5679 >>beta0=mean(Y)-beta1*mean(X) beta0 = 8.6036 >> beta=regress(Y,[ones(n,1) X]) beta = 8.6036 0.5679 >> sigmaepsilon=SYY*(1-R(1,2)^2) sigmaepsilon = 0.1923 >> (Y-[ones(n,1) X]*beta)'*(Y-[ones(n,1) X]*beta)/(n-2) ans = 0.2071 >> (Y-[ones(n,1) X]*beta)'*(Y-[ones(n,1) X]*beta)/(n-1) ans = 0.1923 % En Küçük Kareler % SSE/(n-2) = AKT/(n-2) >> plot(X,Y,'.') >> hold on >> x=-8:.1:15; >> plot(x,beta0+beta1*x) 18 16 14 12 10 8 6 4 2 -10 -5 0 5 10 15