UYGULAMA-2 X1, X 2 ,..., X n bir örneklem, X ⊂ R n örneklem uzayı ve T : X → R k olmak üzere, k-boyutlu, T1( X1, X 2 ,..., X n ) T ( X , X ,..., X ) n T( X1, X 2 ,..., X n ) = 2 1 2 ⋮ Tk ( X1, X 2 ,..., X n ) rasgele vektörü bir istatistiktir. T : X → R n fonksiyonu özdeşlik dönüşümü olarak alınırsa, T ( X1, X 2 ,..., X n ) = ( X1, X 2 ,..., X n ) olmak üzere, örneklemin kendisi de bir istatistiktir. Bu istatistiğin olasılık (yoğunluk) fonksiyonu, yani X1, X 2 ,..., X n rasgele değişkenlerinin ortak olasılık (yoğunluk) fonksiyonu, n f X1, X 2 ,..., X n ( x1, x2 ,..., xn ;θ ) = f X ( x1;θ ) f X ( x2 ;θ )... f X ( xn ;θ ) = ∏ f X ( xi ;θ ) , ( x1, x2 ,..., xn ) ∈ X i =1 dır. Burada, f X (.;θ ) kitle dağılımının olasılık (yoğunluk) fonksiyonudur. Örneğin, normal dağılımlı bir kitle için örneklemin olasılık yoğunluk fonksiyonu, n f X1, X 2 ,..., X n ( x1, x2 ,..., xn ; µ , σ 2 ) = ∏ f X ( xi ; µ , σ 2 ) i =1 − n 1 2 1 e 2σ 2πσ =∏ i =1 ( = 2πσ ( xi − µ ) 2 1 n − 2 ∑ ( xi − µ )2 − n /2 2σ i =1 2 ) e , − ∞ < xi < ∞ , i = 1, 2,..., n dır. Üstel dağılımlı kitle için, n f X1, X 2 ,..., X n ( x1, x2 ,..., xn ;θ ) = ∏ f X ( xi ;θ ) i =1 n 1 − xi 1 n =∏ e θ i =1 θ − ∑ xi = θ − ne θ i =1 , xi > 0, i = 1, 2,..., n Poisson dağılımlı kitle için, n f X1, X 2 ,..., X n ( x1, x2 ,..., xn ; λ ) = ∏ i =1 dır. e− λ λ xi f X ( xi ; λ ) = ∏ = x ! i i =1 n n ∑ xi − nλ i =1 e λ n ∏ xi ! i =1 , xi = 0,1, 2,... , i = 1, 2,..., n Sıralama Fonksiyonu, Sıralama Đstatistiği ve Sıra Đstatistikleri x1, x2 ,..., xn ∈ R sayıları küçükten büyüğe doğru ( ≤ bağıntısına göre) sıralansın ve sıralanmış sayılar x(1) , x(2) ,..., x( n ) biçiminde gösterilsin. ( x1, x2 ,..., xn ) ∈ R n olmak üzere, T : R n → R n fonksiyonu, T: Rn → Rn ( x1, x2 ,..., xn ) → T ( x1, x2 ,..., xn ) = ( x(1) , x(2) ,..., x( n ) ) olarak tanımlansın. Bu fonksiyona sıralama dönüşümü diyelim. X1, X 2 ,..., X n bir örneklem ve T : X ⊂ R n → R n sıralama dönüşümü olmak üzere, T ( X1, X 2 ,..., X n ) = ( X (1) , X (2) ,..., X ( n) ) istatistiğine sıralama istatistiği diyebiliriz. Bir vektör olan bu istatistiğin bileşenleri derste tanımlanan X (1) , X (2) ,..., X ( n) sıra istatistikleridir. Derste, sıra istatistiklerinin dağılımları üzerinde duruldu. Şimdi, sürekli rasgele değişkenlerin dönüşümleri ile ilgili bildiklerimizi kullanarak sıra istatistiklerin dağılımlarını bulmaya çalışacağız. Sürekli dağılıma X (1) < X (2) < ... < X ( n) sahip kitlelerden alınan örneklemler için bir olmak üzere, T ( X1, X 2 ,..., X n ) = ( X (1) , X (2) ,..., X ( n ) ) istatistiğinin olasılık yoğunluk fonksiyonu, başka bir ifade ile olasılıkla sıralama X (1) , X (2) ,..., X ( n) sıra istatistiklerinin ortak olasılık yoğunluk fonksiyonu, f X (1) , X (2) ,..., X ( n ) ( y1, y2 ,..., yn ) = n ! f ( y1) f ( y2 )... f ( yn ) , y1 < y2 < ... < yn , ( y1, y2 ,..., yn ) ∈ X dır ( f (.) fonksiyonu, kitle dağılımının olasılık yoğunluk fonksiyonudur). n=3 olsun. Örneklemdeki X1, X 2 , X 3 rasgele değişkenlerinin, x1 = −2, x2 = 4, x3 = 5 x1 = −2, x2 = 5, x3 = 4 x1 = 4, x2 = −2, x3 = 5 x1 = 4, x2 = 5, x3 = −2 x1 = 5, x2 = −2, x3 = 4 x1 = 5, x2 = 4, x3 = −2 gibi gözlem değerleri T ( x1, x2 , x3 ) = ( x(1) , x(2) , x(3) ) sıralama dönüşümü sonucunda, ( x(1) , x(2) , x(3) ) = (−2, 4,5) noktasına dönüşecektir. Sıralama dönüşümü bire-bir değildir. x1, x2 , x3 ∈ R olmak üzere, B1 = {( x1, x2 , x3 ) : x1 < x2 < x3} B2 = {( x1, x2 , x3 ) : x1 < x3 < x2 } B3 = {( x1, x2 , x3 ) : x2 < x1 < x3} B4 = {( x1, x2 , x3 ) : x2 < x3 < x1} B5 = {( x1, x2 , x3 ) : x3 < x1 < x2 } B6 = {( x1, x2 , x3 ) : x3 < x2 < x1} bölgelerini göz önüne alalım. R 3 = B1 ∪ B2 ∪ B3 ∪ B4 ∪ B5 ∪ B6 ∪ {( x1, x2 , x3 ) : x1 = x2 veya x1 = x3 veya x2 = x3} olup, sıralama fonksiyonu B1, B2 , B3 , B4 , B5 , B6 bölgelerinin her biri üzerinde bire-bir dir. Örneğin B2 bölgesi üzerinde, T ( x1, x2 , x3 ) = ( x(1) = x1, x(2) = x3 , x(3) = x2 ) olmak üzere, ters dönüşüm, x1 = x(1) , x2 = x(3) , x3 = x(2) dır. Dönüşümün jakobiyen matrisi, 1 0 0 ∂ ( x1, x2 , x3 ) = 0 0 1 ∂ ( x(1) , x(2) , x(3) ) 0 1 0 olmak üzere, determinantı bire eşittir. Diğer bölgeler için de jakobiyen matrislerin determinantları birdir. Sürekli dağılımlarda, {( x1, x2 , x3 ) : x1 = x2 veya x1 = x3 veya x2 = x3} gibi kümelerin olasılıkları sıfır olduğundan, dönüşüm sonucundaki dağılıma bir etkileri olmamaktadır. Buna göre, olasılık yoğunluk fonksiyonu f (.) olan sürekli dağılıma sahip bir kitleden alınan n=3 birimlik X1, X 2 , X 3 örnekleminin X (1) , X (2) , X (3) sıra istatistiklerinin ortak olasılık yoğunluk fonksiyonu, f X (1) , X (2) , X (3) ( x(1) , x(2) , x(3) ) = 3! f ( x(1) ) f ( x(2) ) f ( x(3) ) , x(1) < x(2) < x(3) dır. Sıra istatistiklerinin marjinal dağılımları, bu ortak olasılık yoğunluk fonksiyonunda, diğerleri üzerinden integral alınarak elde edilebilir. Örnek: X1, X 2 , X 3 üstel dağılımdan bir örneklem olsun. Kitle dağılımının olasılık yoğunluk fonksiyonu, 1 − x /θ θ e f ( x) = 0 , x>0 , d . y. olmak üzere, X (1) , X (2) , X (3) sıra istatistiklerinin ortak olasılık yoğunluk fonksiyonu, 1 − x(1) /θ 1 − x(2) /θ 1 − x(3) /θ e e 3!θ e θ θ f X (1) , X (2) , X (3) ( x(1) , x(2) , x(3) ) = 0 6 −( x(1) + x(2) + x(3) )/θ 3e θ = 0 biçiminde de yazabiliriz. 0 < x(1) < x(2) < x(3) , d . y. , 0 < x(1) < x(2) < x(3) , d . y. dır. Bu fonksiyonu, 6 − ( x+ y + z )/θ 3e θ f X (1) , X (2) , X (3) ( x, y, z ) = 0 , , 0<x< y< z , d . y. X (1) in marjinal olasılık yoğunluk fonksiyonu, f X (1) ( x) = ∞z ∫ ∫ fX (1) , X (2) , X (3) ( x, y, z )dzdy xy ∞ ∞ 6 ∫ ∫ 3 e− ( x+ y + z )/θ dzdy x yθ = 0 − x /θ 6e θ3 = x>0 , d . y. ∞ ∞ e− y /θ e− z /θ dz dy ∫ ∫ x y 0 6e− x /θ ∞ 2 ∫ e −2 y /θ dy θ x = 0 3 −3 x /θ e θ = 0 dır. , , x>0 , d . y. , x>0 , d . y. , x>0 , d . y. X (2) nin marjinal olasılık yoğunluk fonksiyonu, y∞ f X (2) ( y ) = ∫ ∫ f X (1) , X (2) , X (3) ( x, y, z )dydz 0y y∞ 6 ∫ ∫ e− ( x+ y + z )/θ dzdx , y > 0 0 y θ 3 = 0 , d . y. − y /θ y ∞ 6e e − x /θ e− z /θ dz dx , y > 0 ∫ θ3 ∫ 0 y = 0 , d . y. 6e−2 y /θ y e− x /θ dx , y > 0 ∫ 2 θ 0 = 0 , d . y. 6e−2 y /θ (1 − e − y /θ ) , y > 0 θ = 0 , d . y. 6 −2 y /θ − e−3 y /θ ) , y > 0 (e θ = 0 , d . y. dır. X (3) , üçüncü sıra istatistiğinin olasılık yoğunluk fonksiyonu, zz f X (3) ( z ) = ∫ ∫ f X (1) , X (2) , X (3) ( x, y, z )dydx 0x z z 6 ∫ ∫ 3 e −( x + y + z )/θ dydx , z > 0 0 x θ = 0 , d . y. z 6e− z /θ z − x /θ − y /θ dx , z > 0 e e dy ∫ ∫ θ 3 0 x = 0 , d . y. 6e− z /θ z 2 ∫ e −2 x /θ − e − z /θ e− x /θ dx , z > 0 θ 0 = 0 , d . y. 6e− z /θ 1 ( (1 − e−2 z /θ ) − e− z /θ (1 − e − z /θ )) , z > 0 2 θ = 0 , d . y. 3 − z /θ (1 − e − z /θ ) 2 , z > 0 e θ = 0 , d . y. ( dır. ) θ =5 için X (1) , X (2) , X (3) sıra istatistiklerinin olasılık yoğunluk fonksiyonlarının grafikleri ve n=3 birimlik 100 tane örneklem için gözlenen sıra istatistikler için histogramlar aşağıdaki gibidir. >>x=0:.1:10 ; plot(x,3/5*exp(-3*x/5)) >> veri= exprnd(5,3,100); >> hist(min(veri)) 0.7 45 40 0.6 35 0.5 30 0.4 25 20 0.3 15 0.2 10 0.1 5 0 0 1 2 3 4 5 6 7 8 9 >> y=0:.1:10 >> plot(y,6/5*(exp(-2*y/5)-exp(-3*y/5))) 10 0 0 1 2 3 4 5 6 7 8 9 >> veri= exprnd(5,3,100); >> hist(median(veri)) 35 0.18 0.16 30 0.14 25 0.12 20 0.1 15 0.08 0.06 10 0.04 5 0.02 0 0 0 5 10 15 20 >> z=0:.1:25 >> plot(z,3/5*exp(-z/5).*(1-exp(-z/5)).^2) 0 5 10 15 20 >> veri= exprnd(5,3,100); >> hist(max(veri)) 35 0.09 0.08 30 0.07 25 0.06 20 0.05 0.04 15 0.03 10 0.02 5 0.01 0 0 5 10 15 20 25 0 0 5 10 15 20 25 30 35 40 Örnek: Bir X1, X 2 ,..., X n örnekleminde 1. ve n. sıra istatistikleri X (1) = min{ X1, X 2 ,..., X n } X ( n) = max{ X1, X 2 ,..., X n } olmak üzere, bunların olasılık yoğunluk fonksiyonları: a) U(0,1) dağılımında, f X (1) ( x) = n(1 − x)n −1 I (0,1) ( x) f X ( n ) ( x) = nx n−1I (0,1) ( x) b) U (0,θ ) ,θ ∈ Θ = (0, ∞) ⊂ R dağılımında, n f X (1) ( x) = (1 − θx ) n−1 I (0,θ ) ( x) θ f X ( n ) ( x) = n ( θx ) n−1 I (0,θ ) ( x) θ c) θ ∈ Θ = (0, ∞) parametreli üstel dağılımda, f X (1) ( x) = n θ f X ( n ) ( x) = − nx e θ I (0,∞ ) ( x) n e θ − θx (1 − e − θx n −1 ) I (0,∞ ) ( x) d) θ , α ∈ (0, ∞) parametreli ötelenmiş üstel dağılımda, f X (1) ( x) = f X ( n ) ( x) = n θ e n θ − e n ( x −α ) θ − xθ−α I (α ,∞ ) ( x) (1 − e − x θ−α n −1 ) I (α ,∞ ) ( x) Not: θ , α ∈ (0, ∞) parametreli ötelenmiş üstel dağılıma sahip bir X rasgele değişkenin olasılık yoğunluk fonksiyonu, − x −α 1 e θ , x >α x −α θ 1 − f ( x;θ , α ) = e θ I (α ,∞ ) ( x) = θ 0 , d . y. olup, beklenen değeri ve varyansı, E( X ) = α + θ Var ( X ) = θ 2 dır.