∏ ∏ ∏ ∏ ∏ ∏ ∏ - 80.251.40.59

advertisement
UYGULAMA-2
X1, X 2 ,..., X n bir örneklem, X ⊂ R n örneklem uzayı ve T : X → R k olmak üzere,
k-boyutlu,
T1( X1, X 2 ,..., X n ) 
T ( X , X ,..., X ) 
n 
T( X1, X 2 ,..., X n ) =  2 1 2
⋮



Tk ( X1, X 2 ,..., X n ) 
rasgele vektörü bir istatistiktir. T : X → R n fonksiyonu özdeşlik dönüşümü olarak alınırsa,
T ( X1, X 2 ,..., X n ) = ( X1, X 2 ,..., X n ) olmak üzere, örneklemin kendisi de bir istatistiktir. Bu
istatistiğin olasılık (yoğunluk) fonksiyonu, yani X1, X 2 ,..., X n rasgele değişkenlerinin ortak
olasılık (yoğunluk) fonksiyonu,
n
f X1, X 2 ,..., X n ( x1, x2 ,..., xn ;θ ) = f X ( x1;θ ) f X ( x2 ;θ )... f X ( xn ;θ ) = ∏ f X ( xi ;θ ) , ( x1, x2 ,..., xn ) ∈ X
i =1
dır. Burada, f X (.;θ ) kitle dağılımının olasılık (yoğunluk) fonksiyonudur. Örneğin, normal
dağılımlı bir kitle için örneklemin olasılık yoğunluk fonksiyonu,
n
f X1, X 2 ,..., X n ( x1, x2 ,..., xn ; µ , σ 2 ) = ∏ f X ( xi ; µ , σ 2 )
i =1
−
n
1
2
1
e 2σ
2πσ
=∏
i =1
(
= 2πσ
( xi − µ ) 2
1 n
− 2 ∑ ( xi − µ )2
−
n
/2
2σ i =1
2
)
e
, − ∞ < xi < ∞ , i = 1, 2,..., n
dır. Üstel dağılımlı kitle için,
n
f X1, X 2 ,..., X n ( x1, x2 ,..., xn ;θ ) = ∏ f X ( xi ;θ )
i =1
n
1
−
xi
1
n
=∏ e θ
i =1
θ
−
∑ xi
= θ − ne θ i =1
, xi > 0, i = 1, 2,..., n
Poisson dağılımlı kitle için,
n
f X1, X 2 ,..., X n ( x1, x2 ,..., xn ; λ ) = ∏
i =1
dır.
e− λ λ xi
f X ( xi ; λ ) = ∏
=
x
!
i
i =1
n
n
∑ xi
− nλ i =1
e λ
n
∏ xi !
i =1
, xi = 0,1, 2,... , i = 1, 2,..., n
Sıralama Fonksiyonu, Sıralama Đstatistiği ve Sıra Đstatistikleri
x1, x2 ,..., xn ∈ R sayıları küçükten büyüğe doğru ( ≤ bağıntısına göre) sıralansın ve
sıralanmış sayılar x(1) , x(2) ,..., x( n ) biçiminde gösterilsin. ( x1, x2 ,..., xn ) ∈ R n
olmak üzere,
T : R n → R n fonksiyonu,
T:
Rn
→
Rn
( x1, x2 ,..., xn ) → T ( x1, x2 ,..., xn ) = ( x(1) , x(2) ,..., x( n ) )
olarak tanımlansın. Bu fonksiyona sıralama dönüşümü diyelim.
X1, X 2 ,..., X n bir örneklem ve T : X ⊂ R n → R n sıralama dönüşümü olmak üzere,
T ( X1, X 2 ,..., X n ) = ( X (1) , X (2) ,..., X ( n) )
istatistiğine sıralama istatistiği diyebiliriz. Bir vektör olan bu istatistiğin bileşenleri derste tanımlanan
X (1) , X (2) ,..., X ( n) sıra istatistikleridir. Derste, sıra istatistiklerinin dağılımları üzerinde
duruldu. Şimdi, sürekli rasgele değişkenlerin dönüşümleri ile ilgili bildiklerimizi kullanarak
sıra istatistiklerin dağılımlarını bulmaya çalışacağız.
Sürekli
dağılıma
X (1) < X (2) < ... < X ( n)
sahip kitlelerden alınan örneklemler için bir
olmak üzere, T ( X1, X 2 ,..., X n ) = ( X (1) , X (2) ,..., X ( n ) )
istatistiğinin olasılık yoğunluk fonksiyonu, başka bir ifade ile
olasılıkla
sıralama
X (1) , X (2) ,..., X ( n)
sıra
istatistiklerinin ortak olasılık yoğunluk fonksiyonu,
f X (1) , X (2) ,..., X ( n ) ( y1, y2 ,..., yn ) = n ! f ( y1) f ( y2 )... f ( yn ) , y1 < y2 < ... < yn , ( y1, y2 ,..., yn ) ∈ X
dır ( f (.) fonksiyonu, kitle dağılımının olasılık yoğunluk fonksiyonudur).
n=3 olsun. Örneklemdeki X1, X 2 , X 3 rasgele değişkenlerinin,
x1 = −2, x2 = 4, x3 = 5
x1 = −2, x2 = 5, x3 = 4
x1 = 4, x2 = −2, x3 = 5
x1 = 4, x2 = 5, x3 = −2
x1 = 5, x2 = −2, x3 = 4
x1 = 5, x2 = 4, x3 = −2
gibi gözlem değerleri T ( x1, x2 , x3 ) = ( x(1) , x(2) , x(3) ) sıralama dönüşümü sonucunda,
( x(1) , x(2) , x(3) ) = (−2, 4,5)
noktasına dönüşecektir. Sıralama dönüşümü bire-bir değildir.
x1, x2 , x3 ∈ R olmak üzere,
B1 = {( x1, x2 , x3 ) : x1 < x2 < x3}
B2 = {( x1, x2 , x3 ) : x1 < x3 < x2 }
B3 = {( x1, x2 , x3 ) : x2 < x1 < x3}
B4 = {( x1, x2 , x3 ) : x2 < x3 < x1}
B5 = {( x1, x2 , x3 ) : x3 < x1 < x2 }
B6 = {( x1, x2 , x3 ) : x3 < x2 < x1}
bölgelerini göz önüne alalım.
R 3 = B1 ∪ B2 ∪ B3 ∪ B4 ∪ B5 ∪ B6 ∪ {( x1, x2 , x3 ) : x1 = x2 veya x1 = x3 veya x2 = x3}
olup, sıralama fonksiyonu B1, B2 , B3 , B4 , B5 , B6 bölgelerinin her biri üzerinde bire-bir dir.
Örneğin B2 bölgesi üzerinde,
T ( x1, x2 , x3 ) = ( x(1) = x1, x(2) = x3 , x(3) = x2 )
olmak üzere, ters dönüşüm,
x1 = x(1) , x2 = x(3) , x3 = x(2)
dır. Dönüşümün jakobiyen matrisi,
1 0 0
∂ ( x1, x2 , x3 )
= 0 0 1 
∂ ( x(1) , x(2) , x(3) )
0 1 0 
olmak üzere, determinantı bire eşittir. Diğer bölgeler için de jakobiyen matrislerin
determinantları birdir. Sürekli dağılımlarda, {( x1, x2 , x3 ) : x1 = x2 veya x1 = x3 veya x2 = x3}
gibi kümelerin olasılıkları sıfır olduğundan, dönüşüm sonucundaki dağılıma bir etkileri
olmamaktadır. Buna göre, olasılık yoğunluk fonksiyonu f (.) olan sürekli dağılıma sahip bir
kitleden alınan n=3 birimlik X1, X 2 , X 3 örnekleminin X (1) , X (2) , X (3) sıra istatistiklerinin ortak
olasılık yoğunluk fonksiyonu,
f X (1) , X (2) , X (3) ( x(1) , x(2) , x(3) ) = 3! f ( x(1) ) f ( x(2) ) f ( x(3) ) , x(1) < x(2) < x(3)
dır.
Sıra istatistiklerinin marjinal dağılımları, bu ortak olasılık yoğunluk fonksiyonunda,
diğerleri üzerinden integral alınarak elde edilebilir.
Örnek: X1, X 2 , X 3 üstel dağılımdan bir örneklem olsun. Kitle dağılımının olasılık yoğunluk
fonksiyonu,
 1 − x /θ
θ e

f ( x) = 
 0


,
x>0
,
d . y.
olmak üzere, X (1) , X (2) , X (3) sıra istatistiklerinin ortak olasılık yoğunluk fonksiyonu,
 1 − x(1) /θ 1 − x(2) /θ 1 − x(3) /θ
e
e
3!θ e
θ
θ

f X (1) , X (2) , X (3) ( x(1) , x(2) , x(3) ) = 

0


 6 −( x(1) + x(2) + x(3) )/θ
 3e
θ
=

0


biçiminde de yazabiliriz.
0 < x(1) < x(2) < x(3)
,
d . y.
,
0 < x(1) < x(2) < x(3)
,
d . y.
dır. Bu fonksiyonu,
 6 − ( x+ y + z )/θ
 3e
θ
f X (1) , X (2) , X (3) ( x, y, z ) = 

0


,
,
0<x< y< z
,
d . y.
X (1) in marjinal olasılık yoğunluk fonksiyonu,
f X (1) ( x) =
∞z
∫ ∫ fX
(1) , X (2) , X (3)
( x, y, z )dzdy
xy
∞ ∞ 6
 ∫ ∫ 3 e− ( x+ y + z )/θ dzdy
x yθ

=

0



 − x /θ
 6e
 θ3


=




x>0
,
d . y.
∞
∞

 e− y /θ e− z /θ dz  dy
∫
∫

x
y

0
 6e− x /θ ∞
 2 ∫ e −2 y /θ dy
 θ
x

=

0



 3 −3 x /θ
 e
θ
=

0


dır.
,
,
x>0
,
d . y.
,
x>0
,
d . y.
,
x>0
,
d . y.
X (2) nin marjinal olasılık yoğunluk fonksiyonu,
y∞
f X (2) ( y ) = ∫ ∫ f X (1) , X (2) , X (3) ( x, y, z )dydz
0y
y∞ 6
 ∫ ∫ e− ( x+ y + z )/θ dzdx , y > 0
0 y θ 3

=

0
, d . y.



 − y /θ y 
∞

 6e
 e − x /θ e− z /θ dz  dx , y > 0
∫
 θ3 ∫

0
y



=

0
, d . y.



 6e−2 y /θ y

e− x /θ dx , y > 0
∫
2
 θ
0

=

0
, d . y.



 6e−2 y /θ
(1 − e − y /θ ) , y > 0

 θ

=

0
, d . y.


 6 −2 y /θ
− e−3 y /θ ) , y > 0
 (e
θ
=

0
, d . y.


dır.
X (3) , üçüncü sıra istatistiğinin olasılık yoğunluk fonksiyonu,
zz
f X (3) ( z ) = ∫ ∫ f X (1) , X (2) , X (3) ( x, y, z )dydx
0x
z z 6
 ∫ ∫ 3 e −( x + y + z )/θ dydx , z > 0
0 x θ

=

0
, d . y.



z
 6e− z /θ z 

− x /θ
− y /θ


 dx , z > 0
e
e
dy
∫
∫

 θ 3 0 
x


=

0
, d . y.



 6e− z /θ z
 2 ∫ e −2 x /θ − e − z /θ e− x /θ dx , z > 0
 θ
0

=

0
, d . y.



 6e− z /θ 1
( (1 − e−2 z /θ ) − e− z /θ (1 − e − z /θ )) , z > 0

2
 θ

=

0
, d . y.


 3 − z /θ
(1 − e − z /θ ) 2 , z > 0
 e
θ
=

0
, d . y.


(
dır.
)
θ =5 için X (1) , X (2) , X (3) sıra istatistiklerinin olasılık yoğunluk fonksiyonlarının grafikleri ve
n=3 birimlik 100 tane örneklem için gözlenen sıra istatistikler için histogramlar aşağıdaki
gibidir.
>>x=0:.1:10 ; plot(x,3/5*exp(-3*x/5))
>> veri= exprnd(5,3,100);
>> hist(min(veri))
0.7
45
40
0.6
35
0.5
30
0.4
25
20
0.3
15
0.2
10
0.1
5
0
0
1
2
3
4
5
6
7
8
9
>> y=0:.1:10
>> plot(y,6/5*(exp(-2*y/5)-exp(-3*y/5)))
10
0
0
1
2
3
4
5
6
7
8
9
>> veri= exprnd(5,3,100);
>> hist(median(veri))
35
0.18
0.16
30
0.14
25
0.12
20
0.1
15
0.08
0.06
10
0.04
5
0.02
0
0
0
5
10
15
20
>> z=0:.1:25
>> plot(z,3/5*exp(-z/5).*(1-exp(-z/5)).^2)
0
5
10
15
20
>> veri= exprnd(5,3,100);
>> hist(max(veri))
35
0.09
0.08
30
0.07
25
0.06
20
0.05
0.04
15
0.03
10
0.02
5
0.01
0
0
5
10
15
20
25
0
0
5
10
15
20
25
30
35
40
Örnek: Bir X1, X 2 ,..., X n örnekleminde 1. ve n. sıra istatistikleri
X (1) = min{ X1, X 2 ,..., X n }
X ( n) = max{ X1, X 2 ,..., X n }
olmak üzere, bunların olasılık yoğunluk fonksiyonları:
a) U(0,1) dağılımında,
f X (1) ( x) = n(1 − x)n −1 I (0,1) ( x)
f X ( n ) ( x) = nx n−1I (0,1) ( x)
b) U (0,θ ) ,θ ∈ Θ = (0, ∞) ⊂ R dağılımında,
n
f X (1) ( x) = (1 − θx ) n−1 I (0,θ ) ( x)
θ
f X ( n ) ( x) =
n
( θx ) n−1 I (0,θ ) ( x)
θ
c) θ ∈ Θ = (0, ∞) parametreli üstel dağılımda,
f X (1) ( x) =
n
θ
f X ( n ) ( x) =
−
nx
e θ I (0,∞ ) ( x)
n
e
θ
− θx
(1 − e
− θx n −1
)
I (0,∞ ) ( x)
d) θ , α ∈ (0, ∞) parametreli ötelenmiş üstel dağılımda,
f X (1) ( x) =
f X ( n ) ( x) =
n
θ
e
n
θ
−
e
n ( x −α )
θ
− xθ−α
I (α ,∞ ) ( x)
(1 − e
− x θ−α n −1
)
I (α ,∞ ) ( x)
Not: θ , α ∈ (0, ∞) parametreli ötelenmiş üstel dağılıma sahip bir X rasgele değişkenin olasılık
yoğunluk fonksiyonu,
 − x −α
1 e θ
, x >α
x −α

θ
1 −

f ( x;θ , α ) = e θ I (α ,∞ ) ( x) = 
θ
 0
, d . y.


olup, beklenen değeri ve varyansı,
E( X ) = α + θ
Var ( X ) = θ 2
dır.
Download