temel olasılık kavramları

advertisement
BÖLÜM 1
TEMEL OLASILIK KAVRAMLARI
1.1. Kümeler
İstatistik, adına veri (data) denilen sayısal değerlerin derlenmesi, analizlerinin yapılması
ve analiz sonuçlarının yorumlanmasında gerekli bilgileri sağlayan bir bilim dalıdır. Aslında
istatistik, doğadaki bu üç problemin çözümüne yardımcı olmaktadır. Verilerin derlenmesi,
analizlerin ve analiz sonuçlarının yorumlanması ise belli kurallara bağlıdır.
Bir paranın atılması deneyinde sonuç, yazı ya da turadır. Ancak hangisinin geleceği
hakkında kesin bir şey söylenemez. Yani, deneyin sonucu tamamen rastlantıya bağlıdır. Bu
bağlamda istatistik, rasgelelik içeren olaylar, süreçler ve sistemler hakkında modeller
kurmada, bu modellerden sonuçlar çıkarmada gerekli bilgileri sağlayan bir bilim dalıdır
(Öztürk, 1993). Aşağıda ayrıntılarına girmeden temel olasılık kavramları ile ilgili kısa
bilgiler verilecektir.
Bir deney yapıldığında, gerçekleşebilecek bütün sonuçların kümesine örnek uzay denir.
Örnek uzay,  ya da S ile gösterilir. Bir paranın atılması deneyinde örnek uzay, sadece
iki elemandan oluşan bir kümedir. Bunu   {Y , T } şeklinde gösterebiliriz. Bir zarın
atılması deneyi için örnek uzay,   {w1, w2 ,..., w6 } şeklindedir. Burada w i , üzerinde i
tane nokta bulunan zarı ifade etmektedir.
Örnek uzay bir kümedir. Kümenin net bir tanımı olmasa da, hakkında düşündüğümüz
ne ise buna küme diyeceğiz. Kümeler büyük harfler ile gösterilecektir. Aşağıda, kümeler ile
ilgili bazı temel kavramlar özetlenmiştir.
Boş Küme: Elemanı olmayan kümeye boş küme denir ve  ile gösterilir.
Alt Küme: A ve B iki küme olmak üzere, A nın her elemanı aynı zamanda B nin de
bir elemanı ise, A kümesi B kümesinin alt kümesidir denir ve A  B ile gösterilir.
Matematiksel olarak, A  B   x  A için x  B şeklinde ifade edilir.
2
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
  {a, b, c, d , e, f , g} ve  nın iki alt kümesi A  {a, b } , B  {a, b, c, d , e} olsun.
Buna göre, A nın her elemanı aynı zamanda
B nin de bir elemanı olup A  B dir.
A  B bağıntısı şematik olarak Şekil (1.1.1) de verilmiştir.
Şekil 1.1.1 Altküme bağıntısı
A ve B kümeleri için A  B ve B  A kapsama bağıntıları sağlanıyorsa, A ve B
kümeleri eşittir denir ve A  B yazılır. Yani, A ve B eşit kümelerdir.
Arakesit (kesişim) Kümesi: Her iki kümeye de ait elemanların oluşturduğu kümedir.
Arakesit kümesi matemetiksel olarak A  B  { x   : x  A ve x  B} şeklinde ifade edilir.
Yani arakesit kümesi, ortak elemanların oluşturduğu kümedir.
Birleşim Kümesi: A ve B gibi iki kümeden en az birine ait elemanların oluşturduğu
kümedir. Birleşim kümesi de A  B  { x   : x  A veya x  B} şeklinde ifade edilir.
Tümleme: Evrensel kümede olup da A kümesinde olmayan elemanların kümesi, A
nın tümleyen kümesidir ve Ac ile gösterilir. Ac kümesi Ac  { x  : x  A} ile ifade edilir.
Ayrıca, ( A  B)c  Ac  B c ve ( A  B)c  Ac  B c dir.
Fark Kümesi: Kümelerden birinde olup da diğerinde olmayan elemanların oluşturduğu
kümedir ve A \ B ile gösterilir. Fark kümesi bazen A  B c şeklinde de ifade edilir. Burada,
A \ B  A  Bc {x  : x  A ve x  B} dir.
Simetrik Fark Kümesi:: İki fark kümesinin birleşim kümesidir ve A  B ile gösterilir.
Simetrik fark kümesi A  B  ( A \ B )  ( B \ A) veya A  B  ( A  B c )  ( B  Ac ) şeklinde
de ifade edilebilir.
TEMEL OLASILIK KAVRAMLARI
3
  {a, b, c, d , e, f } olmak üzere  nın A  {a, b, c} ve B  {c, d , e} alt kümelerini
seçelim. Bu alt kümeler kullanılarak yukarıdaki işlemler Şekil (1.1.2) de gösterilmiştir. Bu
kümeler,
Ac  {d , e, f } ,
A \ B  {a, b} ,
A  B  {c} ,
A  B  {a, b, c, d , e} ,
A  B  ( A \ B)  ( B \ A)  {a, b, d , e}
şeklindedir.
Şekil 1.1.2 Kümeler ve küme işlemleri (tararı alan ilgili kümeyi göstermektedir)
Kümeler üzerindeki bütün işlemler arakesit ve birleşim işlemlerine bağlıdır. Sayılabilir
sayıdaki kümelerin bir dizisi n  1 için An olsun. An lerin sayılabilir birleşimkümesi

 An   x   : en az bir i için x  Ai  ,
n 1
sayılabilir arakesit kümesi ise

 An  x  :
n1
her i için x  Ai 
şeklinde ifade edilir. Diğer taraftan, kümelerin sayılabilir birleşimlerinin (ve arakesitlerinin)
tümleyeni,
c



c
  An    An
 n1  n1
c



ve   An    Anc
 n1  n1
şeklinde olup dağılma kuralları
4
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
birleşimin kesişim üzerine dağılma özelliği: A  ( B  C )  ( A  B )  ( A  C )
kesişimin birleşim üzerine dağılma özelliği: A  ( B  C )  ( A  B )  ( A  C )
şeklindedir.
Tanım 1.1.1 Örnek uzayın bazı alt kümelerinin oluşturduğu bir kolleksiyona sınıf denir 
Sınıflar için  ,  ,  veya  gibi semboller kullanılacaktır. Bir paranın atılması
deneyinde örnek uzay   {Y , T } olup, 1  {, ,{Y }} ve 2  {,{T }} birer sınıftır.
Örnek uzay   {a, b, c, d } ise   {  ,  ,{a, b},{a, c, d },{b, c}} de bir sınıftır.
Tanım 1.1.2 Bir kümenin bütün alt kümelerinin oluşturduğu sınıfa o kümenin kuvvet
kümesi denir 
Kuvvet kümesi  (  ) ile gösterilecektir. Bir kümenin n tane elemanı varsa kuvvet
kümesindeki alt kümelerin sayısı 2 n dir. A kümesinin elemanlarının sayısı n( A) ile
gösterilecektir.
Örnek 1.1.1   {a , b , c, d } ise kuvvet kümesinde 16 tane alt küme vardır. Bunlar;
 ()  { ,  , {a}, {b}, {c}, {d }, {a, b}, {a, c}, {a, d }, {b, c},
{b, d }, {c, d }, {a, b, c}, {a, b, d },{a, c, d },{b, c, d } }
dir. Örnek uzayın elemanlarının sayısı sonlu sayıda olabilir. Ayrıca, örnek uzayın
elemanları sayılabilir sonsuz çoklukta olabileceği gibi, sayılamayan çoklukta da olabilir.
Böyle durumlarda, örnek uzayın kuvvet kümesi yukarıda olduğu gibi yazılamaz 
Tanım 1.1.3  boş olmayan bir küme,  da  nın bazı alt kümelerinden oluşan bir
sınıf olsun.  sınıfı,
a)   
b) her A   için Ac  
c) her A, B   için A  B  
özelliklerini sağlıyorsa,  sınıfına bir cebir denir.  sınıfı (c) yerine
c*) n   olmak üzere An   için

 An  
n 1
özelliğini sağlıyorsa  sınıfına bir   cebir (sigma cebir) denir.  nun her elemanına bir
olay, (  ,  ) ikilisine de ölçülebilir bir uzay denir 
TEMEL OLASILIK KAVRAMLARI
5
Tanımdan da anlaşılacağı gibi her   cebir aynı zamanda bir cebir olmasına rağmen
tersi doğru değildir. Ancak, örnek uzay sonlu elemanlı ise cebir aynı zamanda   cebirdir.
Örnek 1.1.2 a) Kuvvet kümesi tanımdaki üç koşulu sağladığından bir   cebirdir.
   (  ) denirse,    olduğundan    dır. Diğer taraftan, A   ise A  
olup, A c   olduğundan Ac   dur. Son olarak, n  1 için An   ise her n için
An   ve  evrensel küme olduğundan

 An  
dır. Yani,
n 1

 An  
olup kuvvet
n 1
kümesi bir sigma cebirdir.
b)   {a, b, c, d } olsun. a  { , , {a}, {b, c, d }} sınıfı bir cebirdir. Bu cebir aynı
zamanda   cebirdir. Ayrıca, b  { , , {b}, {a, c, d }} sınıfı da bir sigma cebirdir.
c)  sonsuz elemanlı herhangi bir küme olmak üzere 1 sınıfı
 1  { A   : A veya Ac sonlu elemanlıdır}
olarak tanımlansın. Bu sınıf bir cebir olmasına rağmen   cebir değildir. Önce  1
sınıfının bir cebir olduğunu gösterelim.  c   olup,  nin eleman sayısı sonludur. O
halde,    1 dir. Ayrıca, A   1 ise A ya da A c sonlu elemanlıdır. A sonlu elemanlı
ise, ( A c ) c  A olup Ac   1 dir. A c sonlu elemanlı ise, sonlu elemanlı kümeler 1
sınıfında olacağından Ac   1 dir. Son olarak, 1 deki herhangi iki küme A ve B olsun.
Burada üç farklı durum olabilir: i) kümelerin ikisi de sonlu elemanlı ii) kümelerin her
ikisinin de tümleyeni sonlu elemanlı iii) kümelerden birinin kendisi sonlu elemanlı diğerinin
tümleyeni sonlu elemanlı olabilir. Her üç durumda da A  B veya ( A  B ) c sonlu
elemanlı olduğunun gösterilmesi gerekir. Şimdi bunları ayrı ayrı inceleyelim.
i) A ve B nin her ikiside sonlu elemanlı ise A  B de sonlu elemanlıdır. Kendisi
sonlu elemanlı kümeler 1 de olduğundan A  B   1 dir.
ii) A ve B nin her ikisinin de tümleyeli sonlu elemanlı ise A c  B c de sonlu
elemanlıdır ( ( A  B )c  Ac  B c olup sonlu elemanlı kümelerin arakesiti de sonlu
6
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
elemanlıdır). Yani, A  B nin tümleyeni sonlu elemanlıdır. Tümleyeni sonlu elemanlı
kümeler 1 de olduğundan A  B   1 dir.
iii) Son olarak A sonlu elemanlı, B nin de tümleyeni sonlu elemanlı olsun. Buna göre,
A c  B c de sonlu elemanlıdır ( ( A  B )c  Ac  B c  B c olup sonlu elemanlı bir
kümenin alt kümesi de sonlu elemanlıdır). Yani, A  B nin tümleyeni sonlu elemanlıdır. O
halde, A  B   1 dir.
Burada tanımlanan 1 sınıfı cebir olma koşullarını sağladığı için bir cebirdir. Bu sınıf
bir cebir olmasına rağmen   cebir değildir. Bunu göstermek için tersine bir örnek vermek
yeterlidir. Örnek uzay doğal sayılar kümesi (    ) olsun. Her n için, An  {2 n } denirse,
tek elemanlı kümeler 1 sınıfındadır (kendileri sonlu elemanlı). Bu sınıfın bir   cebir
olabilmesi için bu kümelerin sayılabilir birleşimlerinin de bu sınıfta olması gerekir. Oysa
sayılabilir birleşim kümesi ve tümleyeni

 An  2, 4, 6, 8,
...

n 1


ve   An
 n1
c

  1, 3, 5, 7, . . .



şeklinde olduğundan, her iki küme de sonlu elemanlı değildir. O halde,
1 sınıfı bir   cebir değildir.

 An   1
olup
n 1
d)  sayılamayan sonsuzlukta elemanı olan bir küme olsun.  nın bazı alt
kümelerinden oluşan bir sınıf da
 2  { A   : A veya Ac sayılabilir elemanlı}
şeklinde tanımlansın. Bu sınıf   cebirin tanımındaki koşulları sağlar. Önce,  c  
olup  nin eleman sayısı sıfırdır. O halde   2 dir. Şimdi A  2 olsun. Buna göre,
A ya da A c sayılabilir elemanlı kümelerdir. A sayılabilir ise, ( A c ) c  A olduğundan
Ac   2 (tümleyeni sayılabilir) dir. A c sayılabilir ise kendisi sayılabilir olan kümeler  2
sınıfına aittir ( Ac   2 ) dir. Son olarak, bütün n  1 için An   2 olsun. Seçilen An ler üç
farklı durumda olabilir. Bütün n ler için An ler sayılabilir olabilir. Bu durumda, sayılabilir
TEMEL OLASILIK KAVRAMLARI
7

kümelerin sayılabilir birleşimleri de sayılabilir olduğundan
 An   2
dir. Diğer taraftan,
n 1
bütün n ler için An lerin tümleyenleri sayılabilir ise

 Anc de sayılabilirdir. Buna göre,
n 1
c

 

c
  An    An
 n1  n1

 An   2
eşitliğinden
dir. Son olarak, seçilen alt kümelerin bazılarının kendileri,
n 1
diğerlerinin de tümleyeni sayılabilir olabilir. Kendileri sayılabilen olanları Bn , tümleyenleri
sayılabilenleri de C n ile gösterelim. Buna göre,






 k 1

 j 1


 An    Bk     C j 
n1

 C cj
olup
kümesi sayılabilirdir. Ayrıca,
j 1
c
  c

   c   c
  An     Bk     C j     C j 
 n 1   k 1   j 1 
 j 1 

olduğundan sayılabilir bir kümenin her alt kümesi de sayılabilirdir. Buradan,
 An
n 1

kümesinin tümleyeni sayılabilir olup  An   2 dır. Yani, 2 sınıfı   cebir tanımındaki
n 1
bütün koşullarını sağladığından bir   cebirdir 
Teorem 1.1.1  boş olmayan bir küme,  da  üzerinde bir sigma cebir olsun. Buna
göre,
a)   
b) her n için An   ise

 An  
n 1
c) A , B   ise A \ B  A  B c  
dir.
8
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
 bir sigma cebir olduğundan    ve  daki her elemanın tümleyeni
İspat: a)
de  da olacağından  c     dur.
b)  bir sigma cebir olduğundan her elemanının tümleyeni de  dadır. Yani, bütün
c
n  1 için An   ise An   dir. Yine  bir sigma cebir olduğundan bunların sayılabilir
birleşimleri de  dadır. Yani,

 Anc  
dir. Yine, sigma cebirin tanımından bu elemanın
n 1
tümleyeni de  nun bir elemanıdır. Buradan da
c



 An    Anc   
n 1
 n1 
elde edilir.
c) A , B   için A , B c   olup (b) den A \ B  A  B c   dur 
Teorem 1.1.2  kümesi üzerindeki iki sigma cebir 1 ve  2 olsun. Bu durumda
   1   2 de bir sigma cebirdir.
İspat: Sigma cebirlerin arakesitlerinden oluşan  sınıfının bir sigma cebir olabilmesi
için tanımdaki üç koşulu sağlaması gerekir. 1 ve  2 birer sigma cebir olduğundan
   1 ve   2 olup    1   2 dir. Ayrıca, A   ise A   1 ve A  2 dir. 1
ve  2 birer sigma cebir olduğundan Ac   1 ve Ac   2 dir. Yani, Ac   1   2 olup,
Ac   dur. Son olarak, n  1 için An   ise arakesitin özelliğinden her n için An   1
ve An   2 olup, 1 ve  2 sigma cebir olduğundan
Buradan da

 An  
n 1


n 1
An   1 ve

 An   2 dir.
n 1
elde edilir.  sınıfı tanımdaki bütün koşulları sağladığından bir
sigma cebirdir 
Teoremin genel hali aşağıda ispatsız olarak verilmiştir. İspat için herhangi bir olasılık
teorisi kitabına bakılabilir (Öztürk, 1993).
TEMEL OLASILIK KAVRAMLARI
9
Teorem 1.1.3 I bir indis kümesi ve   I için  lar aynı örnek uzay üzerinde
tanımlı sigma cebirler olsun. Buna göre,
   da bir sigma cebirdir 
 I
Tanım 1.1.4  kümesi üzerinde tanımlı iki sigma cebir 1 ve  2 olsun. 1 deki her
olay aynı zamanda  2 de bir olay ise 1 sigma cebiri  2 sigma cebirinden daha küçüktür
denir 
Teorem 1.1.4  nın bazı alt kümelerinden oluşan bir sınıf  olsun (sigma cebir
olmak zorunda değildir). Bu  sınıfını kapsayan en küçük bir sigma cebir vardır.
İspat: Önce, bu sınıfı kapsayan en az bir sigma cebir vardır. Kuvvet kümesi  nın
bütün alt kümelerinden oluşan sigma cebir olduğundan bu sınıfı kapsar. Bu sınıfı kapsayan
başka sigma cebirler de olabilir. Bunlara, I bir indis kümesi olmak üzere   I için 
diyelim. Bu sigma cebirlerin herbiri  sınıfını kapsadığından  ların arakesiti de 
sınıfını kapsar. Diğer taraftan, bu arakesit sigma cebiri  sınıfını kapsayan diğer 
sınıflarından küçüktür. O halde,  sınıfını kapsayan en küçük sigma cebir vardır 
Herhangi bir  sınıfını kapsayan en küçük bir sigma cebir  (  ) ile gösterilecektir.
Bu  sınıfını kapsayan en küçük sigma cebire  nin ürettiği sigma cebir denir.
Örnek uzay reel sayılar kümesi (    ) olsun. Reel sayılar doğrusu üzerindeki bir
açık aralık, a , b   ve a  b olmak üzere, ( a , b ) şeklinde ifade edilir. Buna göre
aşağıdaki sınıfları tanımlayalım:
1   (a , b ): a , b ve a  b  , açık aralıkları sınıfı
2   [a , b ]: a , b  ve a  b  , kapalı aralıklar sınıfı
3   (a , b ]: a , b  ve a  b  , yarı açık aralıklar sınıfı.
Bu sınıfların hiçbiri sigma cebir değildir.    olduğundan   (  ,  ) olup 
bir reel sayı değildir. Dolayısı ile,   1 ,   2 ve   3 dır. Bu sınıflar birer sigma
cebir olmamasına rağmen, Teorem (1.1.4) gereğince, bu sınıfları kapsayan en az bir sigma
cebir vardır.
Tanım 1.1.5  deki açık aralıkların ürettiği sigma cebire Borel cebiri denir 
Borel cebiri  (  ) ile gösterilecektir. Bu tanıma göre,  deki bütün açık aralıklar
Borel cebirindedir.  deki diğer alt kümeler de Borel cebirindedir. Yani, {a} , {a, b, c}
10
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
türündeki tek nokta kümeleri, [ a , b ] gibi kapalı aralıklar, ( a , b ] gibi yarı-açık aralıklar ve
(  , b ] gibi aralıklar da Borel cebirindedir. Yani, Borel cebiri  deki açık aralıklar
tarafından üretilen sigma cebiri olmasına rağmen,  deki diğer alt kümeleri de içerir.
Şimdi bunu gösterelim. Önce a   olmak üzere, An  (a  (1/ n) , a  (1/ n)) açık
aralıklar dizisini ele alalım. An ler açık aralıklar olduğundan her n   için An   (  )
dir. Ayrıca, Borel cebiri aynı zamanda bir sigma cebir olduğundan Teorem (1.1.1b)
gereğince sayılabilir arakesitleri de Borel cebirindedir. Yani,

{a}   An   ( )
n 1
olup {a} şeklindeki tek nokta kümeleri Borel cebirindedir. An  {n} alınırsa,  (  ) bir
sigma cebir olduğundan  nin de (doğal sayılar kümesi) Borel cebirinde olduğu görülür.
Benzer şekilde, rasyonel sayılar kümesi Q , sayılabilir bir küme olduğundan Q   (  ) dir.
İirrasyonel sayılar kümesi I , rasyonel sayılar kümesinin tümleyeni olduğundan I   (  )
dir.
Diğer taraftan, a , b  ve a  b olmak üzere, [ a , b ]  {a}  ( a , b )  {b} () dir.
Bununla birlikte, An  [ a  n , a ] olarak seçildiğinde,
(  , a ] 

 An   ( )
n 1
olur. Buradan,  deki bütün alt kümelerin Borel cebirinde olduğu izlenimi oluşmaktadır.
Oysa,  de olup da Borel cebirinde olmayan alt kümeler olabilir.
Bir kümenin herhangi bir fonksiyona göre görüntüsü ile ters görüntüsü bir sonraki
bölümde inceleyeceğimiz rasgele değişkenler açısından önemlidir. Burada, altkümelerin
görüntüleri ile ters görüntülerini kısaca hatırlayalım.  ve  boş olmayan iki küme ve
f :    olsun. Herhangi bir A   için f ( A)  B   dir. Ayrıca, B   için, B
nin
f
fonksiyonuna göre ters görüntüsü
f 1 ( B )  {w   : f ( w)  B} dir. Burada,
f 1 ( B )   olup, f 1 ( B ) alt kümesi, görüntüleri B de olan  nın elemanlarının
oluşturduğu altkümedir.
TEMEL OLASILIK KAVRAMLARI
11
Şekil 1.1.3 Görüntü ve Ters Görüntü Kümeleri
Altkümelerin görüntüleri ile ters görüntülerine ilişkin özellikler aşağıdaki teoremde
özetlenmiştir. Yukarıda da bahsedildiği gibi, herhangi iki küme birbirinin alt kümeleri ise,
bu iki küme eşittir (yani, A  B ve B  A özellikleri sağlanıyorsa A  B dir).
Teorem 1.1.5  ve  boş olmayan iki küme ve f :    olsun. Her i   için
ve Bi   olmak üzere,
  
a) f 1   Bi    f 1 ( Bi )
 i 1  i 1
  
b) f 1   Bi    f 1 ( Bi )
 i 1  i 1
c) f 1 ( A \ B )  ( f 1 ( A)) \ ( f 1 ( B)) , A, B  
dir.
İspat: a) Her x  A için x  B ise A  B ve her x  B için x  A ise B  A dır. Bu
iki altküme bağıntısı da geçerli ise A  B dir. Buradan,


 
x  f 1   Bi   f ( x)   Bi  n0  f ( x)  Bn0  x  f 1 ( Bn0 )  x   f 1 ( Bi )
i 1
i 1
 i 1 
  
olduğundan f 1   Bi    f 1 ( Bi ) elde edilir. Benzer şekilde,
 i 1  i 1


 
x   f 1 ( Bi )   n0  x  f 1 ( Bn0 )  f ( x )  Bn0  f ( x)   Bi  x  f 1   Bi 
i 1
i 1
 i 1 

 
olup  f 1 ( Bi )  f 1   Bi  dir. Bu iki alt küme bağıntısından da,
i 1
 i 1 




f 1   Bi    f 1 ( Bi )
 i 1  i 1
eşitliği elde edilmiş olur. Bu da ispatın (a) kısmını tamamlar.
12
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
b) Benzer şekilde,


 
x  f 1   Bi   f ( x)   Bi  f ( x)  Bi , i  x  f 1 ( Bi ) , i  x   f 1 ( Bi )
i 1
i 1
 i 1 
  
olduğundan f 1   Bi    f 1 ( Bi ) alt küme bağıntısı elde edilir. Diğer taraftan,
 i 1  i 1


 
x   f 1 ( Bi )  x  f 1 ( Bi ) ,  i  f ( x )  Bi , i  f ( x)   Bi  x  f 1   Bi 
i 1
i 1
 i 1 




eşitliğinden  f 1 ( Bi )  f 1   Bi  alt küme bağıntısı elde edilir. Bu iki alt küme
i 1
 i 1 

 
bağıntısından  f 1 ( Bi )  f 1   Bi  eşitliği elde edilmiş olur.
i 1
 i 1 
c) 4Önce, f 1 ( B c )  [ f 1 ( B)]c olduğunu gösterelim. Bu eşitlik de,
x  [ f 1 ( B)]c  x  f 1 ( B )  f ( x)  B  f ( x)  B c  x  f 1 ( B c )
önermesinden açıktır. Buradan da,
f 1 ( A \ B )  f 1 ( A  B c )  f 1 ( A)  f 1 ( B c )  f 1 ( A)  [ f 1 ( B)]c  f 1 ( A) \ f 1 ( B )
bulunur 
Teorem 1.1.6  ve  boş olmayan iki küme ve f :    olsun. Her i   için
Ai   olmak üzere,
  
a) f   Ai    f ( Ai )
 i 1  i 1
  
b) f   Ai    f ( Ai ) , burada eşitlik yoktur
 i 1  i 1
c) f ( f 1 ( B ))  B  f () , B  
dir.
İspat: Bu teoremin ispatı da bir önceki gibi iki kümenin birbirlerinin altkümeleri
olduğu gösterilerek yapılabilir.

 
a) y  f   Ai   y  f ( x) olacak şekilde bir x   Ai vardır. Buradan,
i 1
 i 1 
TEMEL OLASILIK KAVRAMLARI
13


i 1
i 1
x   Ai   n0    x  An0  f ( x)  f ( An0 )  y  f ( x)   f ( Ai )
  
 f   Ai    f ( Ai )
 i 1  i 1
dir. Diğer taraftan,


y   f ( Ai )   n0  y  f ( An0 )  y  f ( x) olacak şekilde  x  An0  x   Ai
i 1
i 1







 f ( x)  f   Ai    f ( Ai )  f   Ai 
 i 1  i 1
 i 1 
  
dir. Bu iki alt küme bağıntısından f   Ai    f ( Ai ) eşitliği elde edilir. Böylece, ispatın
 i 1  i 1
(a) kısmı tamamlanmıştır.
b) Kolayca görüleceği gibi

 
y  f   Ai   y  f ( x ) olacak şekilde bir x   Ai vardır
i 1
 i 1 

 x  Ai , i    y  f ( x)  f ( Ai ), i    f ( x)   f ( Ai )
i 1




 f   Ai    f ( Ai )
 i 1  i 1
dir.
Eşitliğin sağlanmadığını göstermek için tersine bir örnek vermek yeterlidir. Bunun için
f :    fonksiyonu f ( x)  x 2 şeklinde verilmiş olsun. A1  {1, 0} ve A2  {0,1}
diyelim.
A1  A2  {0}
olup
f ( A1  A2 )  {0}
dır.
Oysa,
f ( A1 )  {0,1}
ve
f ( A2 )  {0,1} dir. Yani, f ( A1 )  f ( A2 )  {0,1} olup f ( A1  A2 )  f ( A1 )  f ( A2 ) dir.
Bu sonuç da, eşitliğin sağlanmadığını göstermek için yeterlidir. Sonuç olarak
f ( A1  A2 )  f ( A1 )  f ( A2 ) dir.
c) B   olsun. Bu durumda,
y  f ( f 1 ( B))  y  f ( x) olacak şekilde bir x  f 1 ( B ), x  vardır.
 x   ve f ( x)  B  y  f ( x)  f () ve y  f ( x)  B dir.
14
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
 y  B  f ()  f ( f 1 ( B ))  B  f ()
dır. Diğer taraftan,
y  B  f ()  y  B ve y  f ()  x    y  f ( x ) ve f ( x)  B, x  f 1 ( B)
 y  f ( x)  f ( f 1 ( B))  B  f ()  f ( f 1 ( B ))
olup, bu iki altküme bağıntısından f ( f 1 ( B ))  B  f () eşitliği elde edilir 
1.2. Olasılık Ölçüsü ve Olasılık Uzayları
Bu kısımda, olasılık ölçüsü ve bazı temel özellikleri incelenecektir.
Tanım 1.2.1  boş olmayan bir küme,  da  üzerinde bir sigma cebir olsun. 
üzerinde tanımlı,
P :    0,1
A  P ( A)
P küme fonksiyonu,
a)  A   için P ( A)  0
b) P (  )  1
c) An , n   ler  daki ayrık ( Ak  A j  , k  j ) olayların bir dizisi olmak üzere,
 
 
P   An    P( An )


 n 1  n 1
özelliklerini sağlıyorsa, P ye bir olasılık ölçüsü, P ( A) sayısına A olayının olasılığı,
( ,  , P ) üçlüsüne de bir olasılık uzayı denir 
Aşağıda, olasılık ölçüsü ile ilgili özelliklerden bazıları bir teorem altında toplanmıştır.
İspatlar, ifadelerden hemen sonra verilmiştir.
Teorem 1.2.1 (  ,  , P ) bir olasılık uzayı olsun.
a)  A   için, P( Ac )  1  P( A) dır.
İspat: A  Ac   ve A ile Ac ayrık olaylar ( A  Ac   ) olduğundan,
P( A )  P( Ac )  P( A  Ac )  P(  )  1
olup P( Ac )  1  P( A) dir.
b) P (  )  0 dır.
TEMEL OLASILIK KAVRAMLARI
15
İspat:  c   olup (a) daki sonuca göre P(  )  P( c )  1  P()  0 elde edilir.
c) A1 , A2  , An ayrık olaylar ise,
 n  n
P   Ai    P ( Ai )


 i 1  i 1
dir.
İspat: k  1, 2,3,... için An  k   alındığında sonuç olasılık ölçüsü tanımından açıktır.
Buradan A, B   , A ve B ayrık ise, P ( A  B )  P ( A)  P ( B ) dir.
d) A, B   ve A  B ise P ( A)  P ( B ) dir.
İspat: B  A  ( B  Ac ) olup, A ile B  Ac ayrık olaylar ve P bir olasılık ölçüsü
olduğundan P ( A  B c )  0 dır. Buradan aranan sonuç
P ( B )  P ( A  ( B  Ac ))  P ( A)  P ( B  Ac )  P ( A)
şeklinde elde edilir. Buradan da, A  B ise, P ( B \ A)  P ( B )  P ( A) elde edilir. Ayrıca,
A   için   A   altküme bağıntısından, P ( )  P ( A)  P ( ) olup, 0  P ( A)  1
dir.
e) A, B   ise, P ( A  B )  P ( A)  P ( B )  P ( A  B ) dir. Bu ifadenin daha genel
hali, A n   , n   için,
 n
 n
P   Ai    P( Ai )   P( Ai  A j )   P( Ai  A j  Ak )


1i  j  n
1i  j  k  n
 i 1  i 1
 ...  (1) n1 P( A1  A 2  ...  A n )
şeklindedir.
İspat: n  2 alalım (genel hali için matematiksel tümevarım kullanılır). A  B kümesi
A  B  A  ( B \ A) şeklinde yazılabilir. Buradan da, A ile B \ A kümeleri ayrık
olduğundan P( A  B)  P( A)  P( B \ A) dir. Diğer taraftan, A  B ile B \ A ayrık olaylar
olup B kümesi de B  ( A  B )  ( B \ A) olarak yazıldığında B olayının olasılığı
P( B)  P( A  B)  P( B \ A) olarak yazılabilir. Buradan da B \ A olayının olasılığı
P( B \ A)  P( B)  P( A  B) dir. P ( B \ A) nin değeri P ( A  B ) eşitliğinde yerine
yazıldığında aranan sonuç elde edilir. Yani,
16
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
P( A  B)  P( A)  P( B \ A)  P( A)  P( B)  P( A  B )
dir.
f) n   için A n  ise,
 
 
P   An    P( An )
 n 1  n 1
dir.
İspat: n   için A n  olaylarının dizisi ayrık değildir. An kümelerini kullanılarak
 n 1 
B1  A1 ve B n  A n \   A i 
 i 1 




n 1
n 1
n 1
n 1
ayrık olayların dizisini tanımlayalım. Önce,  A n   B n ve  B n   A n alt küme


n 1
n 1
bağıntılarının geçerli ise  A n   B n dir. Şimdi, eşitliğin geçerli olduğunu gösterelim.
Bunun için önce, her n   için B n  A n olduğundan,


n 1
n 1
 B n   An
(*)

dir. Diğer taraftan,  x   A n için,  n 0   öyleki x An 0 dır. Bu n 0 doğal sayısı
n 1
x  A1 , x  A2 , ..., x  An 0 1, x  An 0
olacak şekilde seçilebilir ( x  A1 ve x  A 2 için n 0  2 olup, x  A 2 \ A1  B 2 dir).
Buradan,
n 0 1
x  A1 , x  A 2 , ..., x  A n 0 1 , x  A n 0  x  A n 0 \  Ai  B n 0
i 1



n 1
n 1
n 1
(**)
 x   B n   An   B n
olur. (*) ve (**) daki ifadeler birleştirildiğinde,


n 1
n 1
 A n   B n eşitliği elde edilir. Şimdi bu
sonucu kullanarak ispatı yapabiliriz. Bn ler ayrık ve A  B ise P ( A)  P ( B ) , özellikleri
kullanıldığında aranan sonuç,
TEMEL OLASILIK KAVRAMLARI
 

 

P   An   P   B n  
 n 1 
 n 1 
17


n 1
n 1
 P(B n )   P( An )
şeklinde elde edilir 
Şimdi, reel sayılardaki limit kavramını hatırlayalım ve sonra da küme dizilerinde limit
tanımını yazalım. Elemanları reel sayılar olan bir dizi an olsun. Her   0 için  n 0  
öyleki her n  n 0 için | a n  a |  oluyorsa, an dizisinin limiti vardır ve lim a n  a dır.
n
Bir an dizisi için bir çok alt ve üst sınır yazılabilir. Bu alt sınırların en büyüğüne
dizinin limit infimumu denir ve lim inf an veya
n
lim an ile gösterilir. an dizisinin limit
x 
infumunu için,
 
lim inf an  lim an  lim inf ak  sup inf ak  supinf ak : k  n : n  0
n
n
n k n
n0 k n
şeklindeki gösterimlerden herhangi biri kullanılabilir. Benzer şekilde, üst sınırlarının en
küçüğüne de dizinin limit supremumu denir ve lim sup an veya lim an ile gösterilir. an
n
n
dizisinin supremumu için de


lim sup an  lim an  lim sup ak   inf sup ak  inf sup ak : k  n : n  0
n
n 
n  k  n
 n 0 k  n
gösterimlerinden biri kullanılabilir. Elemanları reel sayılar olan an dizisinin limit
supremumu ve limit infimumu her zaman vardır. Eğer an dizisinin limiti varsa
lim inf an  lim sup an
n
n
dir. Genel olarak, lim inf an  lim sup an dir.
n
n
Reel sayı dizilerindeki kavramlardan biraz farklı olarak küme dizilerinin limiti
tanımlanır. Küme dizilerinde büyüklük ve küçüklük gibi kavramlar tanımlı olmadığı için alt
küme kavramı kullanılır. A n küme dizisini kapsayan bir çok alt küme bulunabilir. O
zaman, A n dizisini kapsayan alt kümelerden her biri A n dizisi için bir üst sınır olarak
alınabilir. Benzer şekilde A n küme dizisi için alt sınırlar da yazılabilir.
18
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
 nın alt kümelerinden oluşan bir dizi A n olsun. Açıkça görüleceği gibi bütün n  
ler için


k n
k n
 Ak  An dir. Buna göre  Ak kümeleri her
n için A n dizisinin bir alt sınırı
olarak alınabilir. Bu alt sınırların en büyüğü olarak bu kümelerin birleşimi alınabilir. Benzer
şekilde, n   için An 


k n
k n
 Ak olduğundan  Ak kümeleri An dizisi için bir üst
sınırdır. Bu üst sınırların en küçüğü de bu kümelerin arakesiti olur. Buradan, An küme
dizisinin limit infimumu ile limit supremumu,
lim inf A n  lim A n 
n
n


 
n 1 k  n

n

  Ak
lim sup A n  lim A n 
Ak ,
n
n 1 k  n
olarak tanımlanır. Buradaki en büyük alt sınır ve en küçük üst sınır için,
lim inf A n 
n


  Ak  w  
n 1 k  n
:  n 0 için w  An 0 , n  n 0

ve
lim sup A n 
n


  Ak  w   :
n 1 k  n
sonsuz çoklukta n için w  An 
ifadeleri de kullanılabilir. lim sup An için bazen lim sup A n  {w   : w  A n , i. o}
n
n
ifadesi de kullanılır (“ i. o. infinitely often”).
Tanım 1.2.2 Bir A n küme dizisinin limit infimumu ile limit supremumu eşit ise, A n
dizisinin limiti vardır denir 
Bu tanıma göre, lim inf An  lim sup An  A ise, lim An  A dır. Diğer taraftan,
n
n

w  lim inf A n  w  
n


n 1 k  n
n
Ak  n 0 için w 


k n 0
Ak
 w  A k , k  n 0 , n 0  1 , n 0  2,...
 w


k n 0
Ak , her n 0  w 


 
n 0 1 k n 0
Ak  lim sup A n
n
TEMEL OLASILIK KAVRAMLARI
19
olduğundan lim inf An  lim sup An dir. Buradan, Teorem (1.2.1d) gereğince, ( ,  , P )
n
n
bir olasılık uzayı ve n   için A n   olmak üzere,
P  lim inf An   P  lim sup An 
 n

 n

dir. Ayrıca, ispatı bir çok olasılık kitabında bulunan ve Fatou Lemması olarak bilinen
eşitsizlik,
 
 
P  lim inf An   lim inf P An  lim sup P An  P  lim sup An 
n
 n
 n
 n

şeklindedir (Feller, 1970, sayfa 110-111). Fatou lemmasının ispatı ileride Teorem (1.2.4) de
verilmiştir.
Örnek 1.2.1 A n  {1, 2, 3,..., n} olarak verilen A n küme dizisinin limiti varsa bulalım.
Bunun için dizinin limit infimumu ile limit supremumunun hesaplanması gerekir. Önce,

A n artan bir dizi (  n   için A n  A n1 ) olduğundan  Ak  A n dir. Buradan,
k n
dizinin limit infimumu
lim inf A n 
n


 
n 1 k  n

Ak   A n  
n 1
dir. Benzer şekilde A n artan olduğundan,



 A n   olup dizinin limit supremumu da
k n
lim sup A n    Ak  
n
n 1 k  n
dir. lim inf A n  lim sup A n   olup A n dizisinin limiti vardır ve lim An   dir 
n
n
n
Küme dizilerinin limitinin bulunması bazen kolaydır. Aşağıdaki teorem artan ya da
azalan küme dizisinin limitini bulmak için kullanılabilir.
Teorem
1.2.2
An
artan
( n  
için
A n  A n1 )
(  n   için A n1  A n ) kümelerin bir dizisi ise limiti vardır ve
a) A n artan ise lim A n 
n

 An
n 1

b) A n azalan ise lim A n 
n
 An
n 1
ya
da
azalan
20
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
dir.

 Ak  A n olup dizinin limiti infimumu,
İspat: a) Önce A n artan ise

k n


lim inf A n    Ak   A n
n
n 1 k  n
n 1
dır. Şimdi, dizinin limit supremumunu bulalım. Bunun için A n artan olduğunda,
lim sup A n 
n



  Ak   A n
n 1 k  n
n 1
olduğunu göstermek istiyoruz. Eğer


 
n 1 k  n
Ak 


n 1

An

ve
n 1
An 


  Ak
n 1 k  n
her iki kapsama bağıntısıda gerçekleşirse, dizinin limit supremumu bulunmuş olur. Önce,


x 

n 1 k  n


k n
n 1
A k   n   için x   Ak  x   A n
olduğundan


 
n 1 k  n
Ak 

 An
n 1
elde edilir. Diğer taraftan, x 

 A n  x  A n0 olacak şekilde bir n 0 doğal sayısı vardır.
n 1
A n dizisi artan ise bütün k   için x  An 0 k dir. Dolayısı ile, bütün k   için

x   An 0  k  x 
k 1

dir. Buradan,
 An

n 1


  Ak
n 1 k  n



 
n0 1 k n0
 
Ak
  Ak
bulunur. Bu iki sonuç birleştirildiğinde,
n 1 k  n

 An
n 1

ve


 A n    Ak
n 1
n 1 k  n
alt küme bağıntıları sağlanır. Dolayısı ile, artan An dizisi için
eşitliği elde edilir. Buna göre A n dizisinin limit supremumu


 
n 1 k  n
Ak 

 An
n 1
TEMEL OLASILIK KAVRAMLARI


21

  Ak   A n
lim sup A n 
n
n 1 k  n
n 1
dir. Buradan
lim sup A n  lim inf A n 
n
n

 An
n 1
olduğundan
lim A n 
n

 An
n 1
bulunur.
b) Şimdi A n azalan (yani,  n   için A n1  A n ) olsun. An azalan ise A nc dizisi
artan olup limiti vardır. Buradan, (a) daki sonuç kullanıldığında, Anc artan küme dizisi için





lim inf A nc    A kc  lim sup A nc    Akc   A nc
n
olup lim Anc 
n
n 1 k  n
n
n 1 k  n
n 1

 Anc
dir. Diğer taraftan,
n 1
c
c
 lim inf A c      A c     A  lim sup A
  k

 

n
n
n
 n
  n1 k n k  n1 k n
c
 lim sup A c      Ac     A  lim inf A

  k   k
n
n
n
 n
  n1 k n  n1 k n
eşitlikleri yazılır. Buradan da, An dizisinin limiti için alt ve üst limitler
c
c
c
c
c  

   c 

c
lim inf An    Ak     Ak    lim sup A n     Anc    A n
n
  n1  n1
n1 k  n
 n1 k n   n


c  

 


lim sup An    Ak     Akc    lim inf A nc     Anc    An
n
  n1  n1
n1 k n
 n1 k n   n
 
şeklinde hesaplanmıştır. Dolayısı ile

lim inf An  lim sup An   An
n
n
n1
22
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
olduğundan dizinin limiti vardır ve

lim An   An
n
n 1
dir 
Teorem 1.2.3 ( ,  , P ) bir olasılık uzayı ve  n  için A n   olsun. A n ler 
daki artan ya da azalan olayların bir dizisi ise,
P  lim A n   lim P( An )
 n  n
dir.
İspat: A n dizisi olsun. Teorem (1.2.2) ye göre, A n dizisinin limiti vardır ve

lim A n   A n dir. A n dizisine bağlı olarak, B n ayrık olayların bir dizisini
n
n 1
B1  A1 ve n  2 için B n  A n \ A n1
şeklinde tanımlayalım. Önce,


n 1
n 1
 A n   B n eşitliğinin doğru olduğunu görelim. Bunun
için  n   için B n  A n olduğundan


n 1
n 1
 B n   An
yazılır. Diğer taraftan,


x   A n   n0 için x  A n 0 ve x  A n 0 1  x  B n 0  x   B n
n 1
olduğundan


n 1
n 1
n 1
 A n   B n elde edilir. Bu iki sonuç birleştirildiğinde sayılabilir birleşim
kümelerinin eşit olduğu görülür. Yani,


n1
n1
 A n   B n dir. Diğer taraftan, her n   için
B n  A n olduğundan,
P( B n )  P( A n ) ve P( B n )  P( A n \ A n1 )  P( A n )  P( A n1 )
dir. Ayrıca, olasılık ölçüsünün tanımından B n ayrık olayları için
TEMEL OLASILIK KAVRAMLARI
23
 
 
P   B n    P( B n )
 n1  n1
dır. Buradan,
n
 

 
 
P  lim A n   P   A n   P   B n    P ( B n )  lim  P ( B k )




n k 1
 n

 n1 
 n1  n 1
 lim  P ( B 1 )  P ( B 2 )  P ( B 3 )  ...  P ( B n 1 )  P ( B n ) 
n
 lim  P( A 1)  P( A2 \ A1)  P( A3 \ A2 )  ...  P( An1 \ An2 )  P( An \ An1) 
n
 lim  P( A 1)  P( A2 )  P( A1)  P( A3 )  P( A2 )  ...  P( An )  P( An1) 
n
 lim P( An )
n
elde edilir. Dolayısı ile, A n olaylarının dizisi artan ise,
P  lim A n   lim P( An )
 n  n
dir. Şimdi, A n dizisi azalan (yani,  n   için A n1  A n ) olsun. O zaman, Anc dizisi

c
c
artandır. Dolayısı ile, P  lim A n   lim P( A n ) dir. Ayrıca, A n azalan ve Anc artan
 n

n
olduğundan, Teorem (1.2.2) ye göre,
lim A n 
n


n 1
An ,
lim A nc 
n


n 1
A nc
dir. Buna göre,
c
 
 

 



c 

P  lim A n   P   A n   P   A n   1  P   A nc 
  n 1  
 n

 n1

 n 1 


 1  lim P ( A nc )  1  lim 1  P ( A n )   lim P( A n )
n
n
n
olduğu kolayca görülür 
Şimdi yukarıda ifade edilen ve ispatı birçok olasılık kitabında bulunan(Örneğin, Feller,
1970, sayfa 110-111) Fatou lemmasını ifade ve ispat edelim.
Teorem 1.2.4 (Fatou Lemması) ( ,  , P ) bir olasılık uzayı ve  n  için A n  
olsun. Bu durumda,
24
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
 
 
P  lim inf An   lim inf P An  lim sup P An  P  lim sup An 
n
 n
 n
 n

dir.
İspat: Herhangi bir an reel sayı dizisi için lim inf an  lim sup an olduğu açıktır
n
n
(bir dizinin alt sınırlarının en büyüğü üst sınırlarının ek küçüğünden küçük ya da eşittir).
Ayrıca, An olaylar dizisi için limit infimum ve limit supremum tanımlarından,
lim inf A n 
n


  Ak
ve lim sup A n 
n
n1 k  n


  Ak
n1 k  n
olup Teorem (1.2.3) den An olaylarının dizisi artan ya da azalan ise limit ile olasılık ölçüsü
yer değiştirebilir. Yani An ler artan ya da azalan ise P  lim A n   lim P ( A n ) dir.
 n
 n
Bn 

 Ak
k n
denirse Bn ler artan olup lim Bn  lim inf A n dir. Buradan, Bn ler
n


n
artan olduğundan P lim Bn  lim P( Bn ) dir. Diğer taraftan, herhangi bir reel sayı
n 
n 
dizisinin limiti varsa, bu limit aynı zamanda limit infimum (ya da limit supremum) değerine


eşittir. Buradan P lim Bn  lim inf P( Bn ) yazılabilir. Ayrıca, her n   için Bn  An
n 
n
dir. Yani, P ( Bn )  P ( An ) dir. Bu sonuçlar birleştirildiğinde,
  
elde edilir. Yani, P  lim inf A   lim inf P ( A ) dir.

P lim inf An  P lim Bn  lim P ( Bn )  lim inf P( Bn )  lim inf P( An )
n 
n 
n
n 
Benzer şekilde D n 


n
n 

 Ak
k n
denirse, Dn
n
n
n
ler azalan olup lim Dn  lim sup A n ve
n
n
P lim Dn  lim P( Dn ) dir. Ayrıca, her n   için An  Dn olup P( An )  P( Dn ) dir.
n 
n 
Diğer taraftan, herhangi bir reel sayı dizisinin limiti varsa, bu limit aynı zamanda limit
supremum değerine (ya da limit infimum) eşittir. Bu sonuçlar birleştirildiğinde de,
TEMEL OLASILIK KAVRAMLARI
25
P  lim sup A n   P  lim D n   lim P( D n )  lim sup P( Dn )  lim sup P ( An )
n 
n 
 n 

 n 
 n 
eşitliği elde edilir. Buradan da,
 
 
P  lim inf An   lim inf P An  lim sup P An  P  lim sup An 
n
 n
 n
 n

şeklinde aranan eşitsizlik elde edilmiş olur 
1.3. Bağımsız Olaylar ve Koşullu Olasılık
(  ,  , P ) bir olasılık uzayı ve B   için P ( B )  0 olsun.  sigma cebiri üzerinde
PB küme fonksiyonu,
PB :    0,1
A  PB ( A) 
P ( A  B)
P( B)
şeklinde tanımlanan PB küme fonksiyonu bir olasılık ölçüsüdür. Gerçekten, P bir olasılık
ölçüsü olup her A   için P ( A)  0 ve A   için PB ( A)  P ( A  B ) / P ( B )  0 olduğu
açıktır. Diğer taraftan,    olup PB ()  P (  B ) / P ( B )  P ( B ) / P ( B )  1 dir. Son
olarak, n   için A n  
için A n ler ayrık olayların bir dizisi olsun. Bu durumda,
C n  A n  B olaylar dizisi de ayrıktır. Buradan,
 
PB   An

 n 1






 


 

P    An   B  P   ( A n  B ) 




  n 1 
   n 1
 
P(B)
P(B)


n 1
P( An  B)
P(B)


 P ( An  B )
n 1
P(B)

 PB ( A n )
n 1
elde edilir. Dolayısı ile, PB küme fonksiyonu bir olasılık ölçüsüdür. Bu olasılık ölçüsüne,
B olayına göre koşullu olasılık ölçüsü denir.
Tanım 1.3.1 (  ,  , P ) bir olasılık uzayı ve A   olsun. Yukarıdaki şekilde
tanımlanan PB olasılık ölçüsü için, PB ( A) sayısına B bilindiğinde A nın koşullu olasılığı
denir 
26
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
PB ( A) koşullu olasılığı için genellikle P ( A | B ) gösterimi kullanılır. Tanıma göre, B
verildiğinde A olayının koşullu olasılığı P ( A | B )  P ( A  B ) / P ( B ) dir. Buradan, A  B
olayının olasılığı P ( A  B )  P ( B ) P ( A | B ) şeklinde hesaplanabilir.
A, B  
olayları A  ( A  B)  ( A  B c ) ve B  ( A  B)  ( Ac  B) şeklinde
yazılabilir (Şekil (1.3.1)). Ayrıca, ( A  B) ve ( A  B c ) ayrık olaylar olup B   ve
0  P ( B )  1 olmak üzere,
P( A)  P( A  B)  P( A  Bc )  P( B) P( A | B)  P( B c ) P( A | B c )
dir.
Şekil: 1.3.1 Bir olayın ayrık olaylar türünden yazılması
Daha genel olarak, B1, B 2 , B 3 ,..., B n olayları  örnek uzayının bir parçalanması olsun
(yani, B j ler ayrık ve B1  B 2  B 3  ...  B n   ). Eğer i  1, 2,..., n için P ( B i )  0 ise
herhangi bir A   olayının olasılığı,
n
P ( A)   P ( B i ) P ( A | B i )
i 1
şeklinde hesaplanır. B1, B 2 , B 3 ,..., B n olayları  örnek uzayının bir parçalanması olmak
üzere herhangi bir A   olayı,
n
A  A    A  ( B1  B 2  B 3  ...  B n )   ( A  Bi )
i 1
olarak yazıldığında, Bayes formülü olarak da bilinen P( B1 | A) koşullu olasılığı
P ( B1 | A) 
P( A  B1 )
P ( A)

P ( B1 ) P ( A | B 1 )
n
 P( B i ) P( A | B i )
i 1
TEMEL OLASILIK KAVRAMLARI
27
şeklinde hesaplanır.
Örnek 1.3.1 İki kavanozdan birincisinde 5 sarı 5 de mavi top vardır. İkinci kavanozda
ise 10 sarı 5 mavi top vardır. Birinci kavanozdan rasgele bir top çekilip ikinci kavanoza
atılıyor. Daha sonra ikinci kavanozdan bir top çekiliyor. İkinci kavanozdan çekilen topun
mavi olduğu verildiğinde, birinci kavanozdan çekilen topun mavi olması olasılığını
hesaplayalım.
Kavanozlar K1 ve K 2 olsun. A1  {K 1 den Mavi top} , A 2  {K 1 den Sarı top} ve
B  {K 2 den Mavi top} olaylarını tanımlayalım.
Şekil: 1.3.2 Bir olayın ayrık olaylar türünden yazılması
A1 ile A2 ayrık ve A1  A 2   olduğundan A1 ve A2 ,  nın bir parçalanmasını
oluşturur. Buradan herhangi bir B kümesi ( B   ),
B  B    B  ( A1  A 2 )  ( B  A1 )  ( B  A 2 )
şeklinde yazılabilir (Şekil (1.3.2)). Buna göre B olayının olasılığı da,
P ( B )  P ( B  A1 )  P ( B  A 2 )
 P ( A1 ) P ( B | A1 )  P ( A 2 ) P ( B | A 2 )  (1 / 2) (6 / 16)  (1 / 2) (5 / 16)  (11/ 32)
olarak hesaplanmış olur. Dolayısı ile aranan olasılık
P ( A1 | B ) 
P ( A1  B )
P( B)

P ( A1 ) P ( B | A1 )
P( B)

(1/ 2)(6 /16)
(6 / 32)
6


(11/ 32)
(11/ 32) 11
dir.
Şimdi deneyi değiştirelim. Rasgele bir kavanoz seçip bu kavanozdan bir top çekelim.
Çekilen topun mavi olduğu verildiğinde bunun birinci kavanozdan çekilmiş olması
olasılığını hesaplayalım. Kavanozlar K1 ve K 2 olmak üzere bu olaylar (Şekil (1.3.2))
28
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
A1  {K 1 'in seçilmesi} , A2  {K 2 ' nin seçilmesi} ve B  {Mavi top çekilmesi }
şeklinde yazılır. Yine, A1 ile A2 ayrık olaylar olup A1  A 2   dir. A1 ve A2 olayları
 örnek uzayının bir parçalanması olduğundan herhangi bir B   için B olayını
B  B    B  ( A1  A 2 )  ( B  A1 )  ( B  A 2 )
şeklinde yazabiliriz. Buna göre, B olayının olasılığı
P( B)  P( B  A1)  P( B  A2 )  P( A1) P( B | A1)  P( A2 ) P( B | A2 ) 
1 5 1 5
5


2 10 2 15 12
olup aranan olasılık bu defa,
P ( A1 | B ) 
P ( A1  B )
P( B)

P ( A1 ) P ( B | A1 )
P( B)

(1/ 2) (5 /10)
(1/ 4)
3


(5 /12)
(5 /12) 5
olur 
Tanım 1.3.1
(,,P)
bir olasılık uzayı olsun.
A, B  
olayları için
P ( A  B )  P ( A) P ( B ) ise A ve B olayları bağımsızdır denir. i  1, 2,..., n için Ai  
olmak üzere,
n
 n
P   A i    P ( Ai )
 i 1  i 1
oluyorsa, A1, A 2 ,..., A n olayları n  li bağımsızdır denir 
Örnek 1.3.2   {a, b, c, d } ve    (  ) olsun.  sigma cebiri açık olarak
  , , a , b , c , d  , a, b ,a, c , a, d b, c , b, d  , c, d a, b, c ,
a, b, d  , a, c, d , b, c, d 
şeklinde yazılır. A   için P ( A)  n ( A) / 4 denirse ( ,  , P ) bir olasılık uzayı
olur. A  {a, b} ve B  {b, d } olayları için P ( A)  P ( B )  1 / 2 dir. A  B  {b } olup
P ( A  B )  1 / 4 dür. Buradan, P ( A  B )  0.25  (0.5) (0.5)  P ( A) P ( B ) olup A ve
B olayları bağımsızdır.
TEMEL OLASILIK KAVRAMLARI
29
Şekil: 1.3.3 Bağımlı ve bağımsız olaylar
Ancak K  {a, b, c} ile M  {b, d } olayları bağımsız değildir. A  B  {b} olup,
P ( A)  3 / 4 , P ( B )  1/ 2 ve P ( A  B )  1/ 4 dir. Buradan
P ( A  B )  0.25  (3 / 4) (1/ 2)  P ( A) P ( B )
dir. Yani, K ve M olayları bağımsız değildir 
Örnek 1.3.3 ( ,  , P ) bir olasılık uzayı ve A, B   olsun. A ve B bağımsız ise,
a) Ac ile B
b) A ile B c
c) Ac ile B c
olayları da bağımsızdır.
a) B  ( A  B )  ( B \ A) ve ( A  B ) ile ( B \ A) ayrık olaylardır. Dolayısı ile,
P( B)  P( A  B)  P( B  Ac )  P( A) P( B)  P( B  Ac )
eşitliği düzenlendiğinde
P ( Ac  B )  P ( B )  P ( A) P ( B )  P ( B )[1  P ( A)]  P ( Ac ) P ( B )
bulunur. Buradan, Ac ile B olayları bağımsızdır.
b) Benzer şekilde, A  ( A  B )  ( A \ B ) olduğundan yine ( A  B ) ile ( A \ B ) ayrık
olaylar olup P( A)  P( A  B)  P( A  Bc )  P( A) P( B)  P( B c  A) dir. Buradan,
P( A  Bc )  P( A)  P( A) P( B)  P( A)[1  P( B)]  P( A) P( Bc )
olduğundan, A ile B c olayları bağımsızdır.
c) Ac ile B c olaylarının bağımsızlığı için P( Ac  B c )  P( Ac ) P( B c ) olduğunun
gösterilmesi gerekir. Kolayca görüleceği gibi,
P ( Ac  B c )  P ( A  B )c   1  P ( A  B )  1   P ( A)  P ( B )  P ( A  B )


 1  P( A)  P( B)  P( A  B )  1  P( A)  P( B)  P ( A) P( B)
30
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
 1  P( A) 1  P( B)   P ( Ac ) P( B c )
dir. Yani, Ac ile B c olayları bağımsızdır 
Örnek 1.3.4 ( ,  , P ) bir olasılık uzayı olsun.  ile  nin herhangi bir A   olayı
ile bağımsız olduğu
P ( A   )  P ( A)  P ( A).1  P ( A) P (  )
ve
P ( A   )  P ( )  P ( A) .0  P ( A) P ( )
eşitliklerinden açıktır 
Teorem 1.3.1 ( ,  , P ) bir olasılık uzayı ve n   için A n   olsun. Bu durumda,
a)

 P( A n )
n 1


  ise P  lim sup An   0
 n

b) A n   olayları bağımsız ve

 P( An )
n 1


  ise P  lim sup A n   1
 n

dir.
İspat a) lim sup A n 
n

 
n 1 k  n
 

P  lim sup An   P  

 n

 n1
yazılır.

Ak 

 Ak
olduğundan
k n

 

 Ak   P   Ak  
k n

 k n 


n 1
n 1

 P( A k )
k n
 P( A n ) yakınsak (  P( A n )   ) ise serinin kalan terimi sıfıra gider. Yani,
n   iken,

 P( A n )  0 dır. Buradan n  
iken,
k n

0  P  lim sup A n   P  

 n

 n1


 

A

P
A



 k
 k
k n

 k n 

 P( A k )  0
k n


elde edilir. O halde, P  lim sup An   0 dır.
 n

b) Önce, 0  x  1 için e x  1  x olduğunu hatırlayalım. Ayrıca, A n dizisinin üst
limitinin tanımı ile Cm 
m
 Ak
k n
dizisinin artan olduğu dikkate alındığında,
TEMEL OLASILIK KAVRAMLARI
31
 m

P  lim sup A n   lim lim P   Ak 
 n
 n m  k n 
yazılır. Diğer taraftan, A n ler bağımsız olaylar ise A nc ler de bağımsızdır. Buradan,
c
 m
m
 
 m
 m

P   A k    P   A kc    P ( A kc )   1  P ( A k ) 
  k n  
k n
 k n
 k n


m
m
 e
 P ( Ak )
e
  P ( Ak )
k n
k n
elde edilir.

 P ( A n )   olduğundan ıraksak bir serinin kalan terimi sonsuza gider.
n 1
m
Yani, m   iken
m
 P ( A n )   olup e
  P ( Ak )
k n
 0 olur. Buradan, m   iken
k n
c
 m
 

P   Ak    0
 
 
  k n  
yazılır. O halde,
 m

P  lim sup A n   lim lim P   Ak 
 n
 n m  k n 
olduğu dikkate alındığında, m   iken,
c
 m
 m

 

P   A k   1  P   A k   1
  k n  
 k n





olup, P  lim sup A n   1 elde edilir 
 n

1.4. Permütasyonlar ve Kombinasyonlar
1.4.1 Permütasyonlar
Olasılık hesaplarında çok kullanılan kavramlardan biri de hiç şüphesiz nesnelerin
tamamının ya da belli bir kısmının farklı sıralanmalarının sayısıdır. Permütasyonun
Latince’de
“yer
değiştirme”
anlamına
gelen
“permütare”
sözcüğünden
türediği
32
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
sanılmaktadır (Oruç, 1982). Örneğin A , B ve C gibi üç nesnenin değişik sıralamaları
ABC , ACB , BAC , BCA , CAB ve CBA şeklinde olacaktır. Yani, değişik sıralamaların
sayısı 6 dır. Benzer şekilde, bu üç nesnenin ikişerli sıralamaları, AB , AC ve BC şeklinde
olabilir. Ancak, önce A sonra B sıralaması ( AB ) ile önce B sonra A sıralamaları farklı
ise, sıralamalar; AB , BA , AC , CA , BC ve CB şeklinde olur. Bu durumdaki
sıralamaların sayısı ise 6 dır.
Dört öğretim üyesi arasında üç kişilik bir jüri oluşturmak istendiğini düşünelim. Bu
dört öğretim üyesi A , B , C ve D olarak adlandırılmış olsun. Bu durumda, ABC
sıralaması ile ACB aynı olacağından olası jüri üyeleri ABC , ABD , ACD ve BCD
şeklinde olabilir. Yani, dört farklı şekilde jüri oluşturulabilir. Ancak, ilk seçilen jüri başkanı
olacak denirse,
ABC
ile
BAC
farklı olacaktır. Bu durumda, farklı oluşumlar
ABC , ABD, ADC , BAC , BAD, BDC , CAB, CAD, CBD , DAB, DAC , DBC şeklindedir
(sayısı 12). Burada, sonraki seçilen iki kişi arasındaki sıralama önemli değildir. Bunların
uzun uzun yazılması yerine, farklı oluşumların toplam sayılarının formülize edilmesi
gerekir.
Tanım 1.4.1 a) 1 den n ye kadar pozitif tam sayıların çarpımına n  faktöriyel (ya da
n  çarpansal) denir ve n ! ile gösterilir.
b) Nesnelerin kümesinin bir kısmının ya da tamamının belli bir sıralanmasına (ya da
düzenlenmesine) permütasyon denir 
Tümü birlikte kullanılan n nesnenin permütasyonları sayısı n ! dir. Bu sayı P (n, n) ile
gösterilmiştir. n nesneden bir defada alınan r nesnenin permütasyonları (sıralanmalarının)
sayısı ise P (n, r ) ile gösterilir.
n nesneden r tanesi r tane kutucuğa yerleştirilmek istensin. Bu durumda birinci
kutucuğa n nesneden herhangi biri yerleştirilebilir (yani ilk kutucuk için n farklı seçim
yapılabilir). Sonra ikinci kutucuk, geri kalan n  1 nesneden herhangi biri ile doldurulabilir
(yani, ikinci kutucuk için n  1 farklı seçim yapılır). Böyle devam edilirse, son kutucuk için
geri kalan n  (r  1) nesneden biri ile doldurulur. Buna göre, farklı sıralamaların sayısı
n (n  1)( n  2)...(n  (r  1))  n(n  1)(n  2)...( n  r  1)

n(n  1)( n  2)...( n  r  1)(n  r )!
n!

 P ( n, r )
(n  r )!
(n  r )!
TEMEL OLASILIK KAVRAMLARI
33
olur. Elimizde bulunan n nesnenin ya hepsi farklıdır, ya da bazıları aynıdır. Buna göre, n
nesnenin permütasyonlarının sayısı için bu iki durum farklı değerlendirilmelidir.
a) Birbirinden farklı n nesnenin permütasyonları sayısı: n  1 ise, bu nesne bir tek
biçimde yazılabilir ve permütasyon sayısı 1 dir. Yani, 1!  1 dir. Şimdi, n  2 olsun. Bu
nesneler A ve B ise, sıralamalar, AB ve BA şeklinde olup, sayısı 2 dir. Yani, 2 nesnenin
permütasyonları sayısı 2!  2 dir. n  3 için sıralamalar; ABC , ACB , BAC , BCA , CAB
ve CBA şeklinde olur ve sayısı 3!  6 dır. Tümevarım yöntemine göre, n  1 nesnenin
permütasyonları sayısı (n  1)! olsun. n .nci nesne geri kalan n  1 nesne arasına n farklı
şekilde yerleştirilebilir. O zaman, çarpma kuralı gereğince, bu sıralamaların sayısı da
n(n  1)! olur. Bu değer de n ! dir.
b) Şimdi, n nesneden n1 tanesi bir tür, geri kalanlardan n2 tanesi başka bir tür olmak
üzere, nk tanesi de başka bir türden nesne olsun. Yani, bu n nesne k farklı türden oluşsun.
Bu durumda, k  n ve n1  n2  ...  nk  n olduğu açıktır. Buna göre, n1 tane nesne aynı
olduğundan sıralanışta n1 ! tane sıralanış aynı, benzer nedenle n2 ! sıralanış aynı olacaktır.
Böylece, n nesnenin permütasyonları sayısı n !/ (n1 !n2 !...nk !) olur.
Örnek 1.4.1 1, 2,3, 4 ve 5 rakamlarının tümü kullanılarak toplam 5!  120 farklı sayı
yazılabilir. Bunlardan;
a) Kaç tanesinde çift rakamlar tek rakamlardan önce gelir? Bu rakamlar dizisi içinde 3
tane tek (1,3 ve 5), 2 tane (2 ve 4) de çift rakam vardır. Çift rakamlar kendi aralarında 2!
sayıda sıralanır. Sonra tek rakamlar da kendi aralarında 3! farklı şekilde sıralanabilir. O
zaman toplam sayı 2!(3!)=12 dir. Bu sayılar,
24135 24153 24315 24351 24513 24531
42135 42153 42315 42351 42513 42531
şeklindedir.
b) Kaç tanesinde 2, 1 den hemen sonra gelir? (1,2) ikilisi beraber alınarak, toplam dört
rakam varmış gibi düşünüldüğünde, farklı permütasyonların sayısı P (4, 4)  4!  24 dür.
c) Kaç tanesinde 2 rakamı 1 den önce gelir? Permütasyonlar içinde, 1 in 2 den önce
geldiği sayıda 2 de 1 den önce gelir. O zaman aranan cevap, P (5,5) / 2  5!/ 2  60 dır.
34
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
d) kaç tanesinde 1 ve 2 rakamları 3 ve 4 rakamlarından önce gelir? Önce, 1, 2, 3 ve 4
rakamları kendi aralarında 4! Sayıda sıralanır. Oysa, toplam 5 tane rakam vardır. Koşullara
uyan sıralamalar
1 2 3 4
1 2 4 3
2 1 3 4
2 1 4 3
olup 5 rakamının nereye geldiği önemli değildir. Buradaki her bir sıralama için 5 rakamı her
bir sıralamadaki 5 farklı yere gelebilir. O zaman aranan sıralamaların sayısı 4(5)=20 dir.
e) Kaç tanesinde 1, 2 den önce, 2 de 3 den önce gelir? 1,2 ve 3 rakamlarının
permütasyonları sayısı 3!=6 dır. O halde toplam sayı (5!/3!)=20 dir.
f) Beş basamaklı sayılardan kaç tanesinde ilk iki rakamın toplamı 6 dan küçüktür?
Bunun için,
Birinci yerde 1 varsa, ikinci yer için 3 seçim (2,3,4) yapılabilir,
Birinci yerde 2 varsa, ikinci yer için 2 seçim (1,3) yapılabilir,
Birinci yerde 3 varsa, ikinci yer için 2 seçim (1,2) yapılabilir
Birinci yerde 4 varsa, ikinci yer için 1 seçim (1) yapılabilir.
İlk iki basamağa yazılacak rakamlar önemli olup diğerlerinin sıralaması önemli
değildir. İlk iki basamak doldurulduktan sonra geriye kalan 3 rakam (3! faklı şekilde
yazılabilir) herhangi bir şekilde doldurulur. O zaman aranan sayı (3+2+2+1)3!=48 dir.
g) Rakamlar yinelenmeden 4 basamaklı kaç sayı yazılabilir? Bunun için, birinci yere
herhangi bir rakam (5 tanesinden biri) yazılır. Yani, birinci yer 5 farklı şekilde doldurulur.
İkinci yer geri kalan 4 tanesinden biri ile, üçüncü yer geri kalan 3 tanesinden biriyle ve son
yer de geri kalan 2 rakamdan biri ile doldurulur. Aranan sayı 5.4.3.2=120 dir.
h) Rakamlar yinelenebilir ise 4 basamaklı 625 sayı yazılabilir. Yani, birinci yer 5 farklı
şekilde doldurulabilir. Aynı şekilde ikinci yer de 5 farklı şekilde doldurulabilir.
i) Rakamlar yinelenmeden 4 basamaklı tek sayıların sayısını bulalım. O zaman, elde
edilecek sayı tek olacağından son basamak 3 farklı şekilde (1 3 ve 5) doldurulabilir. Birinci
yer geri kalan 4 rakamdan biri ile, ikinci yer geri kalan 3 rakamdan biri ile ve üçüncü yer de
geri kalan 2 rakamdan biri ile doldurulur. Yani, toplam sayı (4)(3)(2)(3)=72 dir.
TEMEL OLASILIK KAVRAMLARI
35
j) A, A, B, B, B , C , C , D, D, D nesneleri kaç farklı şekilde sıralanabilir. Dört faklı
türden 10 nesne vardır. Buna göre, farklı sıralamaların sayısı için, n  10, n1  n4  2 ve
n2  n3  3 olup permütasyonların sayısı
10!/ (2!3!3!2!)  3628800 / (144)  25200
dür 
Bir çember üzerindeki n farklı nesnenin permütasyonları sayısı (n-1)! dir. Örneğin,
yuvarlak bir masa etrafına 4 kişi (4-1)!=6 farklı şekilde sıralanabilir. Burada, insanların saat
yönünde hareket ettiği düşünülürse, bir kişi sabit tutularak diğerlerinin birer kaydırılması ile
aranan permnütasyonların sayısı bulunur.
1.4.2 Kombinasyonlar
Tanım 1.4.2 Birbirinden farklı n nesne verilmiş olsun. Bu n nesneden k tanesinin
farklı çekiliş sayısına n nesnesin k li kombinasyonu denir 
Tanımdan da anlaşılacağı gibi, burada iki durum vardır. 1) çekilen nesne geri
konmadan (iadesiz) yeni bir çekiliş yapılır ya da 2) çekilen yerine konup (iadeli) yeni bir
çekiliş yapılır.
1) İadesiz (Yinelemesiz) Kombinasyon: n nesneden k tanesi seçilmek istensin. k  1
ise n nesne içinde n farklı şekilde seçim yapılabilir. k  2 için nesneleri a1 , a2 ,…, an ile
gösterelim. Buna göre seçimler,
a1a2 , a1a3 ,..., a1an , a2 a1 , a2 a3 ,..., a2 an , a3a1, a3a2 ,..., a3an ,…, an a1 , an a2 ,..., an an1
şeklinde olup sayısı n(n  1)  n !/ (n  2)! dir. k  3 olsun. İlk çekilişte a1, a2 ,..., an den
biri çekilir. Geriye n  1 nesne kalır. n  1 nesneden 2 -li (n  1) (n  1  1)  (n  1)(n  2)
kombinasyon yapılabilir. n nesnenin 3 -lü kombinasyon sayısı n(n  1)(n  2)  n !/ (n  3)!
olur. O halde, n nesnenin (k  1) -li kombinasyonlarının sayısının
n!
 n(n  1)(n  2)...(n  (k  2))
(n  (k  1))!
36
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
olduğunu kabul edelim ve k -li kombinasyonlarının sayısını bulalım. n nesnenin 1 -li
kombinasyonlarının sayısı n dir. Geriye n  1 nesne kalır. (n  1) nesnenin (k  1) -li
kombinasyonlarının sayısı,
(n  1)!
(n  1)!

((n  1)  (k  1))! ( n  k )!
dir. Bu son ifadenin her iki tarafı n ile çarpılırsa,
n(n  1)!
n!

(n  k )! (n  k )!
sayısı, n nesnenin k -li kombinasyon sayısı olur. Herhangi bir nesnenin çekiliş sırası
önemli değilse, her k ! çekiliş aynı olacağından aranan sayı,
n
n!
 
k !(n  k )!  k 
C (n, r ) 
dir.
2) İadeli (Yinelemeli) Kombinasyon 1, 2,3 ve 4 rakamları ile kullanılan rakam bir
daha kullanılmamak üzere 2 basamaklı sayı yazmak isteyelim. Bunların sayısının
P(4, 2) 
4!
 12
(4  2)!
olduğunu biliyoruz. Bu sayılar; 12, 13, 14, 21, 23, 24, 31, 32, 34, 41, 42, 43 dir. Kullanılan
rakam bir daha kullanılabilir ise, 11, 22, 33 ve 44 sayıları da buna eklenmelidir. O zaman
toplam sayı 16 olur. Yani, 24 tane farklı sayı yazılabilir. Yinelemeli kombinasyonda, iki
farklı durum (sıra önemli ve sıra önemsiz) ayrı ayrı değerlendirilmelidir.
Birbirinden farklı n nesneden r tanesinin çekiliş sayısı, n nesnenin r li
n
n!
kombinasyonu olup sayısı C (n, r ) veya   
dir. n nesne r ! yolla
 r  r ! n  r  !
düzenlenebileceğinden, C (n, r )
olduğundan
kombinasyonlarından herbiri için
permütasyonların sayısı
r ! permütasyon
r !C (n, r )  P (n, r )  n !/ (n  1)!
olur.
Ayrıca,
C (n, r )  C (n, n  r ) dir.
Örnek 1.4.2 a) Dört kişi arasından üç kişiden oluşan bir komisyon seçilmek isteniyor.
Bu dört kişi A, B, C ve D olsun. Bu oluşumlar, ABC , ABD, ACD ve BCD şeklinde olur.
Bunlar kendi aralarında 3! şekilde sıralanabilir. Örneğin, A, B , C kişileri kendi aralarında
TEMEL OLASILIK KAVRAMLARI
37
ABC , ACB , BAC , BCA , CAB ve CBA şeklinde sıralanabilir. Burada ABC ile ACB
aynı komisyondur. Bu dört kişiden oluşacak üçlü kombinasyon ve permütasyonlar aşağıdaki
şekilde oluşturulabilir.
Kombinasyonlar
ABC
ABD
ACD
BCD
ABC
ABD
ACD
BCD
ACB
ADB
ADC
BDC
Permütasyonlar
BAC BCA CAB CBA
BAD BDA DAB DBA
CAD CDA DAC DCA
CBD CDB DBC DCB
Burada, kombinasyonların sayısı,
 4
4!
C (4,3)    
4
 3  3!(4  3)!
permütasyonların sayısı (yani sıralama önemli) ise,
P(4,3) 
4!
 24
(4  3)!
olup, P (4,3)  24  3!4  3!C (4, 3) dir.
b) 4 Fizikçi, 4 Kimyacı ve 2 Biyolog arasından 3 kişilik bir komisyon. hiç bir koşul
olmadan C (10,3)  120 farklı şekilde seçilebilir.
i) Kurulda en az 1 biyolog olacak şekilde kaç farklı seçim yapılabilir. Bunun için önce
hiç biyolog bulunmaması durumunu hesaplayalım. Kurulda 3 fizikçi olabilir, 3 kimyacı
olabilir, 2 fizikçi 1 kimyacı veya 1 fizikçi 2 kimyacı olabilir. Buna göre,
3 fizikçi C (4,3)  4
3 kimyacı C (4,3)  4
2 fizikçi, 1 kimyacı C (4, 2) C (4,1)  6(4)  24
2 kimyacı 1 fizikçi C (4, 2) C (4,1)  6(4)  24
farklı şekilde seçilebilir. Bunların toplam sayısı 56 olup, en az 1 biyolog bulunduran
kombinasyonların sayısı 120  56  64 dür.
ii) Kurulda her branştan 1 kişinin olabileceği kombinasyonların sayısı ise
C (4,1) C (4,1) C (2,1)  4(4)2  32
dir 
38
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
n nesnenin r1 tanesi birinci çeşit, r2 tanesi ikinci çeşit ve rk tanesi de k . nci çeşit
olsun. Yani, nesnelerim tümü birbirinden farklı olmasın. Bu durumda, r1  r2  ...  rk  n
olmak üzere, tümü birlikte alınan n nesnenin permütasyonları sayısı,
P(n; r1 , r2 ,..., rk ) 
n


n!


r1 !r2 !...rk !  r1, r2 ,..., rk 
dir. r ve n pozitif tamsayılar olmak üzere 0  r  n için, C (n  1, r )  C (n, r  1)  C ( n, r )
dir (Pascal kuralı). Yani,
 n  n
n!
n!
C (n, r  1)  C (n, r )  
  


 r  1  r  (r  1)!(n  r  1)! r !(n  r )!
n!
n!
n!
1
 1



 

(r  1)!(n  r )!(n  r  1) (r  1)!r (n  r )! (r  1)!(n  r )!  n  r  1 r 
 n  1
n!
n 1
n!



  C (n  1, r )
(r  1)!(n  r )! r (n  r  1) (r )!(n  1  r )!  r 
dir.
Örnek 1.4.3 a) 52 lik bir oyun kağıdı 4 oyuncuya
52


 52  39  26  13 
52!
      


13,13,13,13  13!13!13!13! 13 13  13  13 
farklı şekilde dağıtılabilir.
b) 2 kırmızı, 3 siyah ve 5 beyaz top sıraya dizilmek istensin. Aynı rekli toplar benzer
ve aynı büyüklüktedir. Bu toplar, n  10, r1  5, r2  3 ve r3  2 olmak üzere bu toplar,
 10 
10!
 2520


 5,3, 2  5!'3!2!
farklı şekilde sıraya dizilebilir.
c) n tane A ve r tane B ile, her dizide A ların tümü kullanılmak üzere A ve B
lerden kaç farklı dizi oluşturulabilir.
n
dizide n tane A ve 0 tane B ile    1
0
 n  1 (n  1)!
dizide n tane A ve 1 tane B ile 
 (n  1)

n !1!
 1 
TEMEL OLASILIK KAVRAMLARI
39
 n  2  (n  2)!
dizide n tane A ve 2 tane B ile 

2!n !
 2 
……
 n  r  (n  r )!
dizide n tane A ve r tane B ile 

r !n !
 r 
farklı dizi oluşturulabilir. Bunların toplam sayısı ise Pascal kuralına göre,
 n   n  1  n  2 
 n  r   n  r  1
 

  ...  


0  1   2 
 r   r 
dir.
d) Bir sınıfta 12 kız ve 10 erkek öğrenci vardır. Sınıf, kızlar ve erkekler boy
uzunluklarına göre sıralanacak biçimde kaç farklı yolla düzenlenebilir.
Kızlar ve erkekler kendi aralarında permütasyona tabii olmayacağından birbirinin
benzeri gibi düşünülebilir. Buna göre 22 nesnenin permütasyonu,
 22 
22!
 646646


12,10  12!10!
dir 
Bir A kümesinde n tane nesne bulunsun. A kümesinin A1, A2 ,..., Ak formunda farklı
parçalanmalarının sayısı, A1 de r1 , A2 de r2 ve Ak de rk nesne ve r1  r2  ...  rk  n
olmak üzere,
n


n!
 r , r , r ,..., r  
k  r1 ! r2 ! r3 !...rk !
1 2 3
dir. Şimdi bunu gösterelim. Önce, nesnelerden A1 içine C (n, r1 ) farklı seçim yapılabilir.
Sonra, geri kalan n  r1 nesneden A2 içine r2 tane nesne C (n  r1, r2 ) farklı seçim
yapılabilir. Bu şekilde devam ettiğnde, i  1, 2,3,..., k için Ai içine ri tane nesne
C (n  r1  r2  ...  ri 1, ri ) farklı şekilde seçilebilir. O halde, A nın farklı parçalanmalarının
sayısı (n  r1  r2  ...  rk )  0!  1 olduğundan,
40
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
 n   n  r1   n  r1  r2   n  r1  r2  ...  rk 1 


 ... 
r 
rk
 1   r2  r3
 

(n  r1  r2  ...  rk 1 )!
(n  r1 )!
n!
n!

...

r1 !(n  r1 )! r2 !(n  r1  r2 )! rk !(n  r1  r2  ...  rk )! r1 !r2 !r3 !...rk !
dir.
Örnek 1.4.4 a) 10 oyuncak 3 kardeş arasında en küçüğü 4 diğerleri üçer tane olmak
üzere
10!
 4200
4! 3! 3!
farklı şekilde dağıtılabilir.
b) Bir kavanozda 1 den 7 ye kadar numaralandırılmış 7 top vardır. Önce 2 sini sonra 3
ünü en sonunda da 2 sini olmak üzere kaç farklı şekilde seçebiliriz. Başka bir ifade ile, 7 top
2 si A1 kutusuna, üçü A2 kutusuna ve geri kalan ikisi de A3 kutusuna kaç farklı şekilde
yerleştirilebilir. Burada, ({1, 2},{3, 4,5},{6,7}) ile ({6,7},{3, 4,5},{1, 2}) farklı olduğundan
bunlar sıralı parçalanmalardır. Buna göre, 7 toptan 2 si A1 kutusuna C (7, 2) farklı şekilde,
geri kalan 5 toptan üçü A2 kutusuna C (5,3) farklı şekilde ve son ikisi de A3 kutusuna
C (2, 2) farklı şekilde yerleştirilir. Yani, toplam sayı,
 7  5  2  7! 5! 2!
 210
    
 2  3  2  2!5! 3!2! 2!0!
dur 
Sırasız Parçalanma a) Bir sınıfta 12 öğrenci vardır. Her takımda 4 öğrenci olacak
şekilde 12 öğrenci A1 , A2 ve A3 gruplarına ayrılmak istensin. Öğrencilerin her bir
{ A1, A2 , A3} parçalanma sayısı 3!=6 dır. Buna göre, farklı parçalanmaların sayısı,
12  8  4  1  12  1
12! 1
 5775
     
 
 4  4  4  3!  4, 4, 4  3! 4!4!4! 3!
dir.
TEMEL OLASILIK KAVRAMLARI
41
b) 10 öğrenci, biri 4 diğerleri üçer kişilik 3 gruba kaç farklı şekilde ayrılabilir. Burada,
{ A1, A2 , A3} grubu ile { A1, A3 , A2 } grupları aynıdır. Buna göre farklı parçalanmaların
sayısı,
10  6  3  1  10  1
12! 1
 2100
     
 
4
3
3
4,3,3
2!
2!
4!3!3!
2!
   


dür 
Binom Teoremi: n pozitif bir tamsayı olmak üzere,
n n
n
n
n
 n
(a  b)n     ai b ni    a n    a n1b1    a n 2b 2  ...    b n
0
1 
2
n
i 0  i 
 n
 n
 n
n
   b n    b n1a1    b n 2 a 2  ...    a n
0
1 
2
n
n
dir. Buradaki,   katsayılarına Binom katsayıları denir. Eşitlikte a  b  1 alınırsa,
i 
 n  n  n
 n
2n           ...   
 0  1   2 
n
elde edilir. Ayrıca, a  1, b  1 denirse,
n  n  n
n n
         ...  (1)    0
 0  1   2 
n
bulunur. Birinci eşitlikten ikinci eşitlik çıkartılırsa ( n tek)
 n   n   n 
 n 
 n  n  n
 n
2          ...      2n           ...     2n 1
 n 
1   3   5 
n
 1   3   5 
iki terimin taraf tarafa toplanması ile ( n çift)
 n   n   n 
 n 
 n  n  n
 n
2          ...      2n           ...     2n 1
 n 
0 2  4
n
 0   2   4 
elde edilir. Burada n nin tek veya çift olması dikkate alınmalıdır. Diğer taraftan,
 k  r   k  r   k  r 
 k  r   k  r 
     
   
  ...      

 0  n  1  n  1  2  n  2 
 n  0   n 
ya da,
42
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
n
 k  r   k  r 
  


i  0  i  n  i   n 
olup, eşitlikte k  r  n alındığında
2
2
2
2
n  n  n
 n   2n 
         ...      
 0  1   2 
n  n 
eşitliği elde edilmiş olur.
1.5. Çözümlü Problemler
1.5.1   [0,1] ,    (  ) ve P ( A)  " A nın aralık uzunluğu " olsun. Buna göre,
( ,  , P ) bir olasılık uzayıdır.  nın alt kümelerinden oluşan iki dizi
A n  {x   : ( n  1) 1  x  1} , B n  { x   : 0  x  n 1}




olarak verildiğinde, P  lim An  ve P  lim B n  olasılıklarını hesaplayınız.
 n

 n

Çözüm: Her n   için A n  A n1 ve B n1  B n olduğu
( n  1)  ( n  2)  ( n  2) 1  ( n  1) 1
önermesinden açıktır. Yani,
A n  { x   :( n  1) 1  x  1}  { x   : ( n  2) 1  x  1}  An 1
olup A n dizisi artandır. Benzer şekilde B n dizisi de azalandır. Teorem (1.2.2) ye göre, A n
ve B n dizilerinin limitleri vardır ve lim A n  (0,1] ve lim B n   dir. Buna göre,
n
n


P  lim An   P   An   P   0 , 1   1
 n 
 n1 
ve


P  lim B n   P   B n   P     0


 n 
 n1 
elde edilir.
1.5.2  boş olmayan bir küme,  da  üzerinde bir sigma cebir olsun. B   için,
 B  {A : A  B  C , C  }
TEMEL OLASILIK KAVRAMLARI
43
şeklinde tanımlanan  B sınıfının B üzerinde bir sigma cebir olduğunu gösteriniz.
Çözüm:  B sınıfının bir sigma cebir olması için Tanım (1.1.3) deki sigma cebir olma
koşullarını sağlanması gerekir. Şimdi bu koşulları inceleyelim.
(i) B   ve B  B  B olduğundan, B  B dir.
(ii) Şimdi, B deki her elemanın tümleyeninin de (tümleme B ye göre) B de
olduğunun gösterilmesi gerekir. A B ise A  B  C olacak şekilde bir C   vardır. O
halde, A nın B ye göre tümleyeni (bunu ABc ile gösterelim) de bu sınıfta olmalıdır. Bunun
için, ABc  B  ( B \ A)  B \ A  B  Ac olup, B \ A  olduğundan, ABc  B dir.
(iii) B deki elemanların sayılabilir birleşimleri de B de olmalıdır. Bunun için n  
için An   B olsun. O zaman A n  B  C n olacak şekilde Cn   küme dizisi vardır.
Ayrıca,




A

(
B

C
)

B

 n 
  Cn   B  C
n
n1
n1
 n1 
olarak yazılabildiğinden,

 An  B dir. Dolayısı ile, B sınıfı, B üzerinde bir sigma
n 1
cebirdir.
1.5.3 ( ,  , P ) bir olasılık uzayı, P ( A1  A2  A3 )  0 olacak şekilde dört olay
A1, A2 , A3 ve A4   olsun. Gösteriniz ki,
P( A1  A 2  A3  A4 )  P( A1) P( A2 | A1) P( A3 | A1  A2 ) P( A4 | A1  A2  A3 )
dir.
Çözüm: B1  A1  A 2  A3 denirse,
P ( A1  A 2  A 3  A 4 )  P ( B1  A 4 )  P ( B1 ) P ( A 4 | B1 )
 P ( A1  A 2  A 3 ) P ( A 4 | A1  A 2  A 3 )
yazılır. Şimdi B 2  A1  A2 denirse,
P ( A1  A 2  A3 )  P( A3  B 2 )  P( B 2 ) P( A3 | B 2 )  P( A1  A 2 ) P( A3 | A1  A 2 )
olur. Son olarak, P( A1  A 2 )  P( A1) P( A 2 | A1 ) olup sonuçlar birleştirildiğinde,
44
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
P( A1  A2  A3  A4 )  P( B1  A4 )  P( B1 ) P( A4 | B1 )  P( A1  A2  A3 ) P( A4 | A1  A2  A3 )
 P( A1  A2 ) P( A3 | A1  A2 ) P( A4 | A1  A2  A3 )
 P( A1 ) P( A2 | A1 ) P( A3 | A1  A2 ) P( A4 | A1  A2  A3 )
şeklinde aranan eşitlik elde edilmiş olur.
1.5.4 a) ( ,  , P ) bir olasılık uzayı,
A ve B  
bağımsız ve
P( A1)  0.6 ,
P ( A 2 )  0.3 olsun. P ( A1  A 2 ) , P ( A1  A 2 ) ve P ( A1  Ac2 ) olasılıklarını hesaplayınız.
b) ( ,  , P ) bir olasılık uzayı, P ( A 1)  1/ 2 , P ( A 2 )  1 / 3 ve P ( A 3)  1 / 4 olacak
şekilde A 1, A 2 ve A 3  bağımsız olaylar olsun. Buna göre, P ( A1  A2  A3 ) olasılığını
hesaplayınız.
c) ( ,  , P ) bir olasılık uzayı, P( A1 )  P( A 2 )  P( A3 )  1/ 4 olacak şekilde A1 ,
A 2 ve A 3  bağımsız olaylar olsun. P[( A1c  Ac2 )  A3 ] olasılığını hesaplayınız.
Çözüm: a) A1 ve A 2 bağımsız olduğundan Örnek (1.3.3) den A1 ile A2c , A12 ile A2 ve
A1c ile A2c bağımsız olaylardır. Buradan aranan olasılıklar
P( A1  A 2 )  P( A1 ) P( A2 )  (0.6) (0.3)  0.18
P ( A1  A 2 )  P ( A1 )  P ( A 2 )  P ( A 1 A 2 )  P ( A1 )  P ( A 2 )  P ( A1 ) P ( A 2 )
 0.6  0.3  0.18  0.72
P( A1  Ac2 )  P( A1 )  P( A c2)  P( A 1 A c2)  P( A 1)  P( A c2)  P( A 1) P( A c2)
 0.6  (1  0.3)  (0.6)(1  0.3)  0.6  0.7  0.42  0.88
şeklinde bulunur.
b) Bu olasılık doğrudan
P ( A 1 A 2 A 3)  P ( A 1)  P ( A 2 )  P ( A 3)  P ( A 1 A 2)
 P ( A 1 A 3)  P ( A 2 A 3)  P ( A 1 A 2  A 3)
 P ( A 1)  P ( A 2)  P ( A 3)  P ( A 1) P ( A 2)
 P ( A 1) P ( A 3)  P ( A 2 ) P ( A 3)  P ( A 1) P ( A 2) P ( A 3)


1 1 1 1 1 1 1 1 1 1 1 1
  




2 3 4  2 3  2 4 3 4  2 3 4
12  8  6    4  3  2   1  18  3
24
24
4
TEMEL OLASILIK KAVRAMLARI
45
olarak hesaplanmıştır.
c) Önce P ( A  B )  P ( A)  P ( B )  P ( A  B ) olduğunu hatırlayalım. B  A 1c  A c2
denirse aranan olasılık P ( B  A3 ) haline dönüşür. O zaman aranan olasılık,
P[( A 1c  A c2)  A3 ]  P[ A 1c  A c2]  P( A3 )  P[( A 1c  A c2)  A3 ]
 P( A 1c ) P( A c2)  P( A3 )  P ( A 1c ) P( A c2 ) P( A3 )
 [1  P( A 1)] [1  P ( A 2 )]  P( A3 )  [1  P ( A1 )][1  P ( A2 )]P ( A3 )

3 3 1 3 3 1 9 1 9 36  16  9 43
 
  


4 4 4 4 4 4 16 4 64
64
64
dir.
1.5.5 ( ,  , P ) bir olasılık uzayı ve A, B   olsun. P ( A | B )  P ( A) ise A olayı
B olayına göre itici olay denir. Ayrıca, P ( A | B )  P ( A) ise A olayı B olayına göre çekici
olay denir.
a) A olayı B olayına göre çekici ise, B olayının da A olayına göre çekici olduğunu
gösteriniz
b) A olayı B olayına göre çekici ise, B c olayının A olayına göre itici olduğunu
gösteriniz.
Çözüm: a) P ( A | B )  P ( A) ise A olayı B ye göre çekicidir. A olayı B ye göre
çekici ise P ( A | B )  P ( A) olup, koşullu olasılığın tanımından
P ( A | B )  P ( A) 
P ( A  B)
P( A  B)
 P ( A) 
 P ( B )  P ( B | A)  P ( B )
P ( B)
P ( A)
yazılır. Yani, B olayı da A ya göre çekicidir.
b) A olayı B ye göre çekici ise, P( Bc | A)  P( Bc ) olduğunun gösterilmesi gerekir.
A olayı B ye göre çekici ise, P ( A | B )  P ( A) dir. Koşullu olasılığın tanımından
P ( A | B )  P ( A)  P ( A  B )  P ( A) P ( B )
dir. Buradan, P ( B c  A)  P ( A)  P ( A  B )  P ( A)  P ( A) P ( B ) yazılır. Ayrıca,
46
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
P ( B c  A)  P ( A)  P ( A) P ( B )  P ( A)[1  P ( B )]  P ( A) P ( B c )

P ( B c  A)
 P ( B c )  P ( B c| A)  P ( B c )
P ( A)
elde edilir. Yani, B c olayı A ya göre iticidir.
1.5.6 ( ,  , P )
bir olasılık uzayı ve 0  P (C )  1 olmak üzere, A, B , C   olsun.
c
c
P ( A | C )  P ( B | C ) ve P( A | C )  P( B | C ) ise P ( A)  P ( B ) olduğunu gösteriniz.
Çözüm: A  ( A  C )  ( A  C c ) ve B  ( B  C )  ( B  C c ) olup
P( A)  P( A  C )  P( A  C c ) ve P( B)  P( B  C )  P( B  C c )
dir. Diğer taraftan,
P( A | C ) 
P( A  C )
P( B  C )
 P( B | C ) 
 P( A  C )  P( B  C )
P (C )
P (C )
ve
P( A | C c) 
P( A  C c)
c
P (C )
 P( B | C c) 
P( B  C c)
c
P (C )
 P( A  C c)  P( B  C c)
olacağından
P( A)  P( A  C )  P( A  C c )  P( B  C )  P( B  C c )  P( B)
eşitsizliği elde edilir. Yani P ( A)  P ( B ) dir.
1.5.7 ( ,  , P ) bir olasılık uzayı ve A, B   olsun. P( A | B)  P( A | B c ) ise A ve
B olaylarının bağımsız olduğunu gösteriniz.
Çözüm: P( A | B)  P( A | B c ) ise P ( A  B )  P ( A) P ( B ) olduğunun gösterilmesi
gerekir. A  ( A  B)  ( A  B c ) olup ( A  B ) ile ( A  B c ) ayrık olaylardır. Buradan,
P ( A  B )  P( B ) P ( A | B)

 P( A  B)  P( A  B c )  P( B ) P( A | B )  P( B c ) P ( A | B c )
c
c
c 
P( A  B )  P( B ) P( A | B ) 
elde edilir. Ayrıca,
P ( A)  P ( B ) P ( A | B )  P ( B c ) P ( A | B c )  P ( A)  P ( B ) P ( A | B )  P ( B c ) P ( A | B )
 P ( A)  P ( A | B )  P ( B )  P ( B c )   P ( A | B )


dir. Buradan da,
TEMEL OLASILIK KAVRAMLARI
P ( A)  P ( A | B )  P ( A) 
47
P( A  B)
P( B)
olup P ( A  B )  P ( A) P ( B ) elde edilir. Yani, A ve B olayları bağımsızdır.
1.5.8 ( ,  , P ) bir olasılık uzayı ve P ( A  B )  6 / 25 ve P ( A | B )  P ( B | A)  1
olacak şekilde A, B   bağımsız olaylar olsun. P ( A) olasılığını hesaplayınız (Not:
P ( A)  P ( B ) dir).
Çözüm: P ( A | B )  P ( B | A)  1 ise P ( A)  P ( B )  1 olduğu
P ( A  B ) P ( A  B ) P ( A) P ( B ) P ( A) P ( B )



 P ( A)  P ( B )
P( B)
P ( A)
P( B)
P ( A)
eşitliğinden açıktır. Dolayısı ile,
P ( A | B )  P ( B | A) 
P ( A)  P ( B )  P ( A | B )  P ( B | A)  1 ve P ( A  B )  6 / 25
ise,
( P( A)  P ( B )) 2  ( P ( A)  P ( B )) 2  4 P ( A) P ( B )  1  (24 / 25)  1 / 25
olup ( P( A)  P ( B))  (1/ 5) dır. Ayrıca, P ( A)  P ( B ) olduğundan, P( A)  P( B)  (1/ 5)
dir. Buna göre, P ( A)  P ( B )  1 ve P ( A)  P ( B )   (1/ 5) eşitliklerinden 2 P ( A)  4 / 5
elde edilir. Buradan da, P ( A)  (2 / 5) olur.
İkinci yol: Bu soruyu başka bir yoldan da çözebiliriz. A ve B olayları bağımsız
olduğundan P ( A  B )  P ( A) P ( B ) şeklinde yazılır. Ayrıca, P ( A)  P( B )  1 olduğundan da
P ( B )  1  P ( A) dır. Dolayısı ile,
6
 P ( A  B )  P ( A) P ( B )  P ( A) (1  P ( A))
25
eşitliğinde x  P ( A) denirse, x 2  x  (6 / 25)  0 ikinci derece denklemi elde edilir. Bu
denklemin çözümleri ise, x  2 / 5 ve x  3 / 5 dir. P ( A)  P ( B ) olduğundan dolayı x  2 / 5
sonucu elde edilir. Yani, P ( A)  2 / 5 dir.
1.5.9 ( ,  , P ) bir olasılık uzayı ve A, B   bağımsız olaylar olsun. Bu durumda,
P ( A)  P ( B )  p ve P ( A  B )   ise p olasılığını  türünden hesaplayınız.
Çözüm: P ( A  B ) olasılığı açık olarak,
  P( A  B )  P( A)  P( B )  P( A  B )  P( A)  P( B )  P( A) P( B)  p  p  p 2
48
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
şeklinde yazılır. Buradan p , p 2  2 p    0 ikinci dereceden denkleminin çözümüdür.
Yani, p  1  1   dir. Ayrıca, p bir olasılık olduğundan 1 den büyük olamaz ve
p  1  1   dir.
1.5.10 Bir ürün birbirinin aynısı A , B ve C makineleri tarafından üretiliyor. A
makinesi tarafından üretilenlerin %5 nin, B makinesi tarafından üretilenlerin %4 nün ve C
makinesi tarafından üretilenlerin %3 nün hatalı olduğu bilinmektedir. Seçilen bir gün içinde
üretilen ürünlerin %25 i A makinesinden, %30 u B makinesi tarafından ve %45 i de C
makinesi tarafından üretilmiştir. Bu gün içinde üretilen ürünlerden rasgele seçilen bir
ürünün hatalı olduğu gözlendiğinde bunun C makinesi tarafından üretilmiş olması
olasılığını hesaplayınız.
Çözüm: Bunun için, H  {seçilen ürün hatalı} olayı ile
A   Ürün A makinesinde üretilmiştir 
B   Ürün B makinesinde üretilmiştir 
C   Ürün C makinesinde üretilmiştir 
olaylarını tanımlayalım. Buna göre, A , B ve C olayları örnek uzayın bir parçalanmasını
oluşturur.
Verilen olasılıklar
P ( A)  0.25 , P ( H | A)  0.05 , P ( B )  0.30 , P ( H | B )  0.04 ,
P (C )  0.45 , P ( H | C )  0.03
şeklinde yazıldığında H olayının olasılığı
P ( H )  P ( A) P ( H | A)  P ( B ) P ( H | B )  P (C ) P ( H | C )
1 1
3 1
9 3
19




4 20 10 25 20 100 500
olup aranan olasılık,
P (C | H ) 
olarak bulunur.
P (C  H ) P (C ) P ( H | C ) (9 / 20)(3 / 100)
27 500 27 1 27





P(H )
P(H )
(19 / 500)
2000 19
4 19 76
BÖLÜM 2
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
2.1. Rasgele Değişkenler
İstatistik rasgelelik içeren olaylar, sistemler ve süreçler hakkında model kurmak ve bu
modellerden sonuç çıkarmada gerekli bilgileri sağlayan bir bilim dalıdır (Öztürk, 1993).
Bütün bilimlerin ortak amaçlarından biri, gerçek dünya hakkında bilgi sahibi olmaktır.
Örneğin, yazı tura oynayan iki kişiden birinin çoğunlukla yazı atması, diğer oyuncuda
paranın hileli olabileceği düşüncesi oluşabilir. O zaman, paranın hileli olup olmadığının
sınanması gerekir. Böyle bir durumda, para atma deneyi tekrar edilerek düzgün bir paranın
atılması halinde beklenen turaların sayısı ile karşılaştırma yapılır. Para havaya atıldığında,
yazı ya da tura gelecektir. Ancak deney gerçekleşmeden önce hangisinin geleceği kesinlikle
söylenemez. Para atma deneyinde Y paranın yazı gelen yüzünü, T de tura gelen yüzünü
göstermek üzere örnek uzay   {Y , T } olup, bu gözlemler ile herhangi bir matematiksel
işlem yapılamaz. Yani, yazı ile tura ne toplanabilir ne de çıkartılabilir. Bu deney belli sayıda
tekrar edildiğinde, kaç defa tura geleceği de söylenemez. Ancak kaç defa tura geleceği
beklentisi verilebilir. Yani, deney sonunda gerçekleşen olaylar bilinen bir uzaya (reel
sayılar) aktarılabilirse, bu uzayda işlemler yapılabilir. Örneğin para atma deneyinde X
fonksiyonu yazı gözlendiğinde 0 tura gözlendiğinde 1 değerini alıyorsa, X in değer
kümesi reel sayıların bir altkümesi olup, X in değer kümesinde matematiksel işlemler
yapılabilir.
Tanım 2.1.1 (  ,  , P ) bir olasılık uzayı olmak üzere,
X :  
w  X ( w)
şeklinde tanımlanan X fonksiyonu,
 a   için {w : X ( w)  a} 
özelliğini sağlıyorsa, X fonksiyonuna bir rasgele değişken denir 
50
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
Buradaki, {w : X ( w)  a}  kümesi X 1 (, a] şeklinde de ifade edilebilir. Bir
rasgele değişkenin değer kümesi  nin bir alt kümesidir ve DX ile gösterilir.
Şekil 2.1.1 Rasgele değişkenin tanım ve değer kümesi
Rasgele değişken, örnek uzaydaki olayları reel sayılara aktaran bir fonksiyondur. Para
atma deneyinde, 0 ve 1 değerleri gözlenmez. Gözlenenler yazı veya turadır. Dolayısı ile,
analizler X in değer kümesinde yapılır.
Örnek 2.1.1 a) Bir paranın üç defa atılması deneyi için örnek uzay,
  YYY , YYT , YTY , TYY , TTY , TYT , YTT , TTT 
dir. Sigma cebir de kuvvet kümesi (    (  ) ) olmak üzere, örnek uzaydan reel sayılara
giden X fonksiyonu da
X :  



w  X ( w)  


0
1
2
3
,
,
,
,
w  YYY
w  YYT , YTY , TYY
w  TTY , TYT , YTT
w  TTT
olarak tanımlansın. Fonksiyonun değer kümesi DX  {0,1, 2,3} olup DX   dir.
Şekil 2.1.2 Bir paranın üç defa atılması deneyi için rasgele değişkenin tanımı
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
51
Bu fonksiyon, bir para üç defa atıldığında gelen turaları sayan bir fonksiyondur. Şimdi
bu fonksiyonun bir rasgele değişken olduğunu gösterelim. Bunun için, her a   için
X 1 (, a]  {w : X ( w)  a}  olduğunun gösterilmesi gerekir.    (  ) olduğu
için  nın bütün alt kümeleri  sigma cebirin bir elemanıdır. Buna göre,
a  0  { w : X ( w)  a}    
0  a  1  { w : X ( w)  a}  YYY  
1  a  2  { w : X ( w)  a}  YYY , YYT , YTY , TYY   
2  a  3  { w : X ( w)  a}  YYY , YYT , YTY , TYY , TTY , TYT , YTT   
a  3  { w : X ( w)  a}    
olduğundan, X fonksiyonu bir rasgele değişkendir.
b) (,  , P ) bir olasılık uzayı ve A  olmak üzere, X fonksiyonu
X :  
1 , w  A
w  X ( w)  
0 , w  A
olarak tanımlansın. Fonksiyonun değer kümesi DX  {0,1} dir (fonksiyon gösterge veya
indikatör (indicator) fonksiyonu olarak bilinir ve genellikle I A ( w) ile gösterilir). Gösterge
fonksiyonunun da bir rasgele değişken olduğunu gösterelim. Bunun için, her a   için
{w : X ( w)  a}   olduğunun gösterilmesi gerekir. Kolayca görüleceği gibi,
a0
 {w : X ( w)  a}    
0  a  1  {w : X ( w)  a}  Ac  
a  1  {w : X ( w)  a}    
dir. Yani, her a   için {w : X ( w)  a}   olup, X bir rasgele değişkendir.
c)   [ 1,1] ,    () ve A  için P ( A)  " A nın aralık uzunluğu " / 2 olarak
tanımlandığında (,  , P ) bir olasılık uzayıdır. X fonksiyonu,
X :  
w  X ( w)  w2
olarak tanımlansın. Fonksiyonun değer kümesi DX  [0,1] olup bu fonksiyon da bir rasgele
değişkendir. Şimdi bunu gösterelim. Önce, X ( w) pozitif bir reel sayı olduğundan a  0
için {w : X ( w)  a}     olduğu açıktır. Diğer taraftan, 0  a  1 için,
52
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
{w : X ( w)  a}  {w : w2  a}  {w :  a  w  a }  {w : w  a } \{w : w   a }  
dır (Problem 2.7.1). Ayrıca, a  1 için, {w : X ( w)  a}     olduğu açıktır. Buna göre
X fonksiyonu, her a   için {w : X ( w)  a}   koşulunu sağladığından bir rasgele
değişkendir 
Yukarıdaki örnekte de görüldüğü gibi rasgele değişkenlerin değer kümesi, reel sayıların
bazen sayılabilir, bazen de sayılamayan bir alt kümesidir.
Tanım 2.1.2 Bir X rasgele değişkeninin değer kümesi DX ,
reel sayıların sayılabilir bir alt kümesi ise X e kesikli bir rasgele değişken,
reel sayıların sayılamayan bir alt kümesi ise X e sürekli bir rasgele değişken
denir 
Bu tanıma göre, Örnek (2.1.1) de verilen rasgele değişkelerden, (a) ve (b) dekiler
kesikli, (c) deki ise süreklidir. Bir paranın n defa atılması deneyinde gelen turaları sayan
rasgele değişken kesikli bir rasgele değişkendir. Ayrıca, bir paranın tura gelinceye kadar
atılması deneyinde yapılan denemeleri sayan fonksiyon da kesikli bir rasgele değişkendir.
Diğer taraftan, bir kişinin ağırlığı veya boy uzunluğu sürekli rasgele değişkenlerdir.
Bir deney sonunda, olabilecek bütün sonuçların kümesi sayılabilir olabilir. Bu küme
sonlu elemanlı bir küme de olabilir. Ayrıca, örnek uzay   [0 ,1] gibi sayılamayan bir
küme olabilir. Böyle bir durumda,  dan  ye kesikli bir rasgele değişken tanımlanabilir.
Örneğin,
X :  
0 , 0  w  0.5
w  X ( w)  
1 , 0.5  x  1
şeklinde tanımlanan fonksiyonunun değer kümesi DX  {0,1} dir.   [0 ,1] , 
 ( )
ve A  için P ( A)  " A nın aralık uzunluğu" olarak tanımlandığında (,  , P ) bir
olasılık uzayı olup  sayılamayan bir küme olmasına rağmen, X fonksiyonu kesikli bir
rasgele değişkendir. Rasgele değişkenin kesikli ya da sürekli olması fonksiyonun tanımı ile
ilgili görünse de, örnek uzayın yapısına da bağlıdır.
Bir hasta doktora gittiğinde doktor koyduğu teşhisten sonra vereceği ilaçları kullanması
ile hastaya ateşinin düşeceğini söyleyebilir. Buna rağmen hastanın ateşi düşmeyebilir veya
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
53
beklediği derecede düşmeyebilir. Bu sadece bir beklenti olup ateşin ne kadar düşeceği
konusunda kesin bir şey söylenemez. Bu sadece istatistiki bulguların bir sonucudur.
Bununla birlikte, ilaçların düzenli bir şekilde kullanılması ile ateşin 2 ile 3 derece arasında
düşebileceği söylenebilir. Böyle bir deney için, ölçülen ateşin derecesi sürekli bir rasgele
değişkendir.
Örnek 2.1.2 X ve Y herhangi iki rasgele değişken ve c ( c   ) de sabit bir reel sayı
olsun. Buna göre,
a) c X
b) X  Y
c) | X |
e) X 2
f) max{ X , Y }
g) min{ X , Y }
d) XY
fonksiyonları da birer rasgele değişkendir (Öztürk, 1993) . Bunlardan (c), (d), (e), (f ) ve
(g) de verilen fonksiyonların birer rasgele değişken olduğunu gösterelim.
c) X bir rasgele değişken olduğundan, her a   için {w : X ( w)  a }   dır. | X |
fonksiyonunun bir rasgele değişken olduğunu göstermek için, her a   için
{w :| X | ( w)  a}  {w :| X ( w) |  a}   ,  a  
olduğunun gösterilmesi gerekir. Buna göre, a  0 ise {w :| X ( w) |  a}     olduğu
açıktır. Diğer taraftan a  0 için {w : X ( w)  a }    {w : X ( w)  a }   olduğundan
(Problem (2.7.1))
{w :| X ( w) |  a }  {w :  a  X ( w)  a}  {w : X ( w)  a} \{w : X ( w)   a}  
dir. Yani, | X | de bir rasgele değişkendir.
d) a  0 ise, {w : X 2 ( w)  a}     olduğu açıktır. a  0 için {w : X 2 ( w)  a}  
olduğunun da gösterilmesi gerekir. Bunun için,
{w : X 2 ( w)  a}  {w : X ( w)  a } \ {w : X ( w)   a }  
olduğundan X bir rasgele değişken ise X 2 de bir rasgele değişkendir.
e) Kolayca görüleceği gibi, (a), (b) ve (d) de verilen fonksiyonlar birer rasgele değişken
ise XY ,
X Y  (( X  Y ) 2  ( X  Y ) 2 ) / 4
olarak yazılabildiğinden, X Y de bir rasgele değişkendir.
54
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
f) X ve Y nin her ikisi de rasgele değişken olduğundan, her a   için
{w : X ( w)  a}   ve {w :Y ( w)  a}  
dır. Buna göre, her a   için max{ X , Y }( w)  max{ X ( w), Y ( w)} olmak üzere,
{w :max{ X , Y }( w)  a }  {w : X ( w)  a}  {w :Y ( w)  a}  
olup max{ X , Y } de bir rasgele değişkendir.
g) Benzer şekilde, her a   için min{ X , Y }( w)  min{ X ( w), Y ( w)} olmak üzere,
{w :min{ X , Y }( w)  a }  {w : X ( w)  a}  {w :Y ( w)  a}  
olduğundan min{ X , Y } de bir rasgele değişkendir 
2.2. Dağılım Fonksiyonları
Bir rasgele değişkenin özelliklerini incelemek için, o rasgele değişkenin dağılım
fonksiyonu bilinmelidir. Dağılım fonksiyonu, rasgele değişkeni en iyi karakterize eden
fonksiyondur. Diğer bütün özellikler dağılım fonksiyonu ile ilgilidir.
Tanım 2.2.1 (,  , P ) bir olasılık uzayı, X de  üzerinde tanımlı bir rasgele
değişken olmak üzere, P olasılık ölçüsü yardımı ile reel sayılardan [0,1] aralığına,
F :   [0,1]
x  F ( x)  P({w : X ( w)  x})
şeklinde tanımlanan F
fonksiyonuna, X
rasgele değişkeninin dağılım fonksiyonu
(birikimli dağılım fonksiyonu) denir 
Dağılım fonksiyonu genellikle, F ( x)  P ( X  x) şeklinde gösterilir. Bir X rasgele
değişkeninin dağılım fonksiyonu için öncelikle (,  , P ) olasılık uzayının belirli olması
gerekir.
(,  , P ) bir olasılık uzayı, X de  üzerinde tanımlı bir rasgele değişken olsun.
 () reel sayılar üzerindeki Borel cebirini göstermek üzere,
X 1 ( ( ))  { A   : A  {w   : X ( w)  B}, B   ( )}
şeklinde tanımlanan X 1 ( ( )) sınıfı  üzerinde bir sigma cebirdir (Öztürk, 1993).
Teorem 2.2.1 (,  , P ) bir olasılık uzayı, X bir rasgele değişken, F de X in
dağılım fonksiyonu olsun. Buna göre,
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
55
a) F azalmayan bir fonksiyondur.
b) F sağdan süreklidir.
c) lim F ( x)  0 ve lim F ( x)  1 .
x 
x 
İspat a) x1, x 2   olmak üzere, x1  x 2 ise {w : X ( w)  x1}  {w : X ( w)  x2 } olup
Teorem (1.2.1d) ye göre ( A  B ise P ( A)  P ( B ) dir),
F ( x 1)  P({w : X ( w)  x 1})  P ({w : X ( w)  x 2})  F ( x 2)
yazılır. Yani, x1  x 2 ise F ( x 1)  F ( x 2) dir. Bu da F nin azalmayan olduğunu gösterir.
b) Fonksiyonun sağdan sürekli olduğunu göstermek için
lim F ( x  h)  F ( x)
h0
olduğunun gösterilmesi yeterlidir. Bunun için, An  {w : X ( w)  x  1/ n} şeklinde azalan
olayların bir dizisini tanımlayalım. Bu durumda Teorem (1.2.2) ye göre An dizisinin limiti
vardır ve
lim An  lim {w : X ( w)  x  1/ n}  {w : X ( w)  x}
n
n
dir. An ler azalan olayların bir dizisi olduğundan limit ile olasılık ölçüsü yer değiştirilebilir
(Teorem (1.2.3)). Buna göre h  1/ n için,
lim F ( x  h)  lim F ( x  1/ n)  lim P w : X ( w)  x  1/ n   lim P  An 
h0
n
n

n


 P  lim An   P   w : X ( w)  x  1/ n   P w : X ( w)  x  F ( x)


 n 
 n1

olduğundan F dağılım fonksiyonu sağdan süreklidir.
c) A n  {w : X ( w)  n} seçildiğinde, An artan olayların bir dizisi olup limiti vardır
(Teorem (1.2.2)). Buna göre lim A n  lim {w : X ( w)  n}   olup limit ile olasılık
n
n
ölçüsü yer değiştirebilir. Buradan da,
lim F ( x)  lim F ( n)  lim P w : X ( w)  n
x 
n
n
 lim P ( A n )  P  lim A n   P()  1
n
 n

elde edilir. B n  {w : X ( w)   n} azalan bir dizi olup, lim B n   dir. Buradan da,
n
56
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
lim F ( x)  lim F ( x)  lim F ( n)  lim P w : X ( w)  n 
x 
x
n 
n
 lim P (B n )  P  lim B n   P()  0
n
 n

şeklinde aranan sonuç elde edilmiş olur 
Teorem 2.2.2 X bir rasgele değişken, F de X in dağılım fonksiyonu olsun. Bu
durumda,
a) a, b   ve a  b ise P ({w : a  X ( w)  b})  F (b)  F (a )
b) a   için, P({w : X ( w)  a})  F (a  )  F (a  )
dır. Burada F (a  ) ve F (a  ) sırası ile fonksiyonun a noktasındaki sağdan ve soldan
limitlerini göstermektedir.
İspat a) a, b   ve a  b için, {w : X ( w)  b} kümesi
{w : X ( w)  b}  {w : X ( w)  a}  {w : a  X ( w)  b}
şeklinde yazılabilir. Ayrıca, {w : X ( w)  a} ile {w : a  X ( w)  b} kümeleri ayrıktır.
Buradan,
F (b)  P ({w : X ( w)  b})  P ({w : X ( w)  a})  P ({w : a  X ( w)  b})
 F (a )  P ({w : a  X ( w)  b})
olup aranan eşitlik P ({w : a  X ( w)  b})  F (b)  F (a ) şeklinde bulunur.
b) A n  {w : a  (1/ n)  X ( w)  a  (1 / n)} seçildiğinde A n azalan bir dizi olup
Teorem (1.2.2) ye göre lim A n  {w : X ( w)  a} dır. Ayrıca, Teorem (1.2.3) e göre,
n
olasılık ölçüsü ile limit yer değiştirebilir. Teoremdeki (a) sonucu kullanıldığında,
P  w : X (w)  a    P  lim An   lim P( An )
 n  n

1
1 
 
1
1 

 lim P   w : a   X ( w)  a     lim  F  a    F  a   
n
n   n  
n
n 
n  

1
1


 lim F  a    lim F  a    F (a  )  F (a )
n  n 
n
n 
şeklinde aranan sonuç elde edilir 
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
57
Örnek 2.2.1 a) Bir paranın üç defa atılması deneyi için Örnek (2.1.1a) daki gelen
turaları sayan rasgele değişkenin dağılım fonksiyonunu bulalım. Bu deney için örnek uzay,
  YYY , YYT , YTY , TYY , TTY , TYT , YTT , TTT 
olup sigma cebir, kuvvet kümesi (    () ) olsun. A  için P ( A)  n( A) / 8 olasılık
ölçüsü tanımlandığında, (,  , P ) bir olasılık uzayıdır. Rasgele değişkenin değer kümesi
DX  {0,1, 2,3} dir. Bu rasgele değişkenin dağılım fonksiyonunu bulalım. Önce, x  0
için {w : X ( w)  x}   olduğundan, F ( x)  0 ve x  3 için {w : X ( w)  x}   olup
F ( x)  1 olduğu açıktır. Fonksiyonun diğer değerleri,
0  x  1 için, F ( x)  P w : X ( w)  x   P YYY    1/ 8
1  x  2 için, F ( x)  P w : X ( w)  x   P YYY , YYT , YTY , TYY    4 / 8
2  x  3 için,
F ( x)  P w : X ( w)  x   P YYY , YYT , YTY , TYY , TTY , TYT , YTT    7 / 8
şeklindedir. Buna göre, X rasgele değişkeninin dağılım fonksiyonu,
 0
1/ 8

F ( x)  4 / 8
7 / 8

 1
,
,
,
,
,
x0
0  x 1
1 x  2
2 x3
x3
grafiği de Şekil (2.2.1) de verildiği gibidir.
Şekil 2.2.1 Bir paranın üç defa atılması deneyi için tanımlanan rasgele değişkenin dağılım
fonksiyonu
Fonksiyonun açık ifadesinden ve grafiğinden görüldüğü gibi, dağılım fonksiyonu
azalmayan ve sağdan süreklidir.
58
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
Şekil 2.2.2 Bir paranın üç defa atılması deneyi için tanımlanan rasgele değişkenin
olasılık fonksiyonu
Teorem(2.2.2b) ye göre, rasgele değişkenin 0,1,2 ve 3 değerleri için,
P ({w : X ( w)  0})  (1/ 8)  0  1/ 8 ,
P ({w : X ( w)  2})  (7 / 8)  (4 / 8)  3 / 8 ,
olasılıkları hesaplanır. Bununla birlikte
P ({w : X ( w)  1})  (4 / 8)  (1 / 8)  3 / 8
P ({w : X ( w)  3})  1  (7 / 8)  1/ 8
x   \ DX için, P ({w : X ( w)  x})  0 olduğu
açıktır.
Kesikli rasgele değişkenlerde olasılık fonksiyonu bazen x  DX için
{w : X ( w)  x}
P ({w : X ( w)  x})
0
1/ 8
1
3/8
2
3/8
3
1/ 8
şeklinde tablo halinde verilir.
Örnek 2.2.2   [ 1,1] , sigma cebir de  üzerindeki Borel cebiri (    () ) olsun.
Olasılık ölçüsü, A  için P ( A)  " A nın aralık uzunluğu " / 2 olarak tanımlandığında,
(,  , P ) bir olasılık uzayı olur. Buna göre,
a)
b)
X :  
Y :  
w  X ( w) | w |
w  Y ( w)  w2
şeklinde tanımlanan X ve Y rasgele değişkenlerinin dağılım fonksiyonlarını bulalım.
a) DX  [0,1] olup x  0 ise F ( x)  0 ve x  1 ise F ( x)  1 olduğu açıktır. Diğer
taraftan, 0  x  1 için,
F ( x)  P w : X ( w)  x   P w :| w |  x   P w :  x  w  x    (2 x ) / 2  x
dir. Buradan, X rasgele değişkeninin dağılım fonksiyonu
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
0 ,

F ( x)   x ,
1 ,

59
x0
0  x 1
x 1
olup grafiği de Şekil (2.2.3a) de verilmiştir.
Şekil 2.2.3a Örnek (2.2.2a) deki dağılım fonksiyonunun grafiği
b) Benzer şekilde, DY  [0,1] olup, yine y  0 ise F ( y )  0 ve y  1 ise F ( y )  1
olduğu açıktır. 0  y  1 ise dağılım fonksiyonunun değeri,
F ( y )  P({w :Y ( w)  y})  P ({w : w2  y})  P({w :  y  w  y })  (2 y ) / 2 
dir.
Şekil 2.2.3b Örnek (2.2.2b) deki dağılım fonksiyonunun grafiği
Buna göre, rasgele değişkenin dağılım fonksiyonu,
 0

F ( y)   y
 1

,
y0
,
,
0  y 1
y 1
olup grafiği Şekil (2.2.3b) de verildiği gibidir 
Örnek 2.2.3   [ 1, 2] ve    () olsun. A  için olasılık ölçüsü de
P ( A)  " A nın aralık uzunluğu " / 3
y
60
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
olarak tanımlandığında, (,  , P ) bir olasılık uzayıdır. X ve Y rasgele değişkenleri
a)
X :  
b)
Y :  
w  X ( w)  w2
w  Y ( w)  w2  2 w
şeklinde tanımlansın. Bu rasgele değişkenlerin dağılım fonksiyonlarını bulalım. Rasgele
değişkenlerin değer kümeleri grafiklerden (Şekil 2.2.4a ve 2.2.4b) de görüldüğü gibi,
DX  [0, 4] ve DY  [1, 3] dir. Şimdi bu rasgele değişkenlerin dağılım fonksiyonlarını
bulalım.
a) x  0 ise FX ( x)  0 ve x  4 ise FX ( x)  1 olduğu açıktır. Fonksiyonun grafiği de
dikkate alınarak, fonksiyonunun diğer değerleri 0  x  1 için,
FX ( x)  P({w : X ( w)  x})  P ({w : w2  x})  P({w :  x  w  x })  (2 x ) / 3
ve 1  x  4 için,
FX ( x)  P({w : X ( w)  x})  P ({w : w2  x})  P ({w :  1  w  x })  (1  x ) / 3
olarak heaplanmıştır. Buna göre, X in dağılım fonksiyonu
 0

 2 x
 3
FX ( x)  
1  x
 3

 1
, x0
, 0  x 1
, 1 x  4
, x4
olup grafiği rasgele değişkenin değer kümesi ile beraber Şekil (2.2.4a) de verilmiştir.
Şekil 2.2.4a Örnek (2.2.3a) da verilen rasgele değişkenin değer kümesi ile dağılım fonksiyonu
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
61
b) DY  [1,3] olduğundan, y  1 ise FY ( y )  0 ve y  3 ise FY ( y )  1 olduğu
açıktır. Ayrıca 1  y  0 için fonksiyonun değeri

  P  w : 2 

FY ( y )  P w : Y ( w)  y   P w : w2  2 w  y

44 y
2  4  4 y  
w
 
2
2
 
  2  2 1  y
2  2 1  y  
2 1 y
 P  w :
x 
 



2
2
3
 

ve 0  y  3 için,


2

  P  w : 2 
FY ( y )  P  w : Y ( w)  y   P w : w2  2 w  y

 
44 y
 w  2 
2
 
2 44 y
1 1 y
2

3
3
olarak bulunmuştur.
Şekil 2.2.4b Örnek (2.2.3b) de verilen rasgele değişkenin değer kümesi ile dağılım fonksiyonu
Buradan Y rasgele değişkeninin dağılım fonksiyonu da,


 2

FY ( y )  
1 



0
1 y
3
1 y
3
1
,
y  1
, 1  y  0
, 0 y3
,
y3
şeklinde olup, grafiği değişkenin tanım bölgesi ile beraber Şekil (2.2.4b) de verilmiştir 
Rasgele değişkenleri kesikli ve sürekli olmak üzere iki ayrı gruba ayırmıştık. Rasgele
değişkenin değer kümesi sayılabilir ise kesikli, aksi halde sürekli rasgele değişken demiştik.
62
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
Dağılım fonksiyonunun sağdan sürekli olduğunu biliyoruz (Teorem 2.2.1). Yukarıdaki
örneklerde de görüldüğü gibi, rasgele değişken sürekli ise dağılım fonksiyonu da süreklidir.
2.3. Olasılık (Yoğunluk) Fonksiyonu
Olasılık ve istatistikte rasgele değişkenin dağılım fonksiyonu yerine, genellikle dağılım
fonksiyonundan elde edilen olasılık veya olasılık yoğunluk fonksiyonu kullanılır. Aslında,
dağılım fonksiyonu verildiğinde olasılık fonksiyonu, olasılık fonksiyonu verildiğinde de
dağılım fonksiyonu bulunabilir.
Kesikli bir X rasgele değişkeninin dağılım fonksiyonu F olsun. X in değer kümesi
DX olmak üzere, x   için Teorem (2.2.2) den {w : X ( w)  x} olayının olasılığının
P({w : X ( w)  x})  F ( x  )  F ( x  )
şeklinde hesaplandığını biliyoruz (Teorem 2.2.22b). Buna göre, x  DX için,
P({w : X ( w)  x})  F ( x  )  F ( x  )
veya kısaca P( X  x)  F ( x  )  F ( x  ) olasılıkları hesaplanır. x   \ DX
için de
P ( X  x)  0 olduğu açıktır.
Tanım 2.3.1 Değer kümesi DX olan kesikli bir X rasgele değişkeninin olasılık
fonksiyonu,
 P( X  x) , x  DX
f ( x)  
0
, diğer yerlerde

dir 
Bir rasgele değişkenin olasılık fonksiyonu, bütün reel sayılar kümesinde tanımlıdır.
Fonksiyon değer kümesi dışında 0 olarak tanımlandığı için, rasgele değişkenin olasılık
fonksiyonu bazen P ( X  x) olarak da verilir. Ancak, bazı x  DX için P ( X  x)  0
olabilir. Herhangi bir rasgele değişkenin olasılık fonksiyonu f ( x) aşağıdaki koşulları
sağlar. Bu koşullar,
i) f ( x)  0 , her x  
ii)
 P( X  x)  1
xDX
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
63
dir.
Örnek 2.3.1 a) X rasgele değişkeninin olasılık fonksiyonu,
c x , x  1, 2,3, 4,5
f ( x)  
 0 , diğer yerlerde
olarak verilmiş olsun. Bu fonksiyonun bir olasılık fonksiyonu olabilmesi için c sabitinin
değerini bulalım. Her x   için f ( x)  0 olduğundan c x  0 ve
 P( X  x)  1
xDX
olması gerekir. Buradan, c sabitinin değeri
5
5
x 1
x 1
1   P ( X  x)   P ( X  x)   cx  15 c  c 
xDX
1
15
olarak bulunur. Yani, X rasgele değişkeninin olasılık fonksiyonu,
 x /15 , x  1, 2,3, 4,5
f ( x)  
, diğer yerlerde
 0
dir. Buna göre, P ( X  3) olasılığı da
P ( X  3)  P ( X  3)  P ( X  4)  P ( X  5) 
1
4
 3  4  5 
15
5
olarak hesaplanmış olur.
b)   0 olmak üzere, X rasgele değişkeninin olasılık fonksiyonu,
 c  x / x ! , x  0,1, 2,3,...
f ( x)  
, diğer yerlerde
 0
olarak verildiğinde c sabitinin değerini bulalım. Yine, her x   için f ( x)  0 olması
gerektiğinden c  0 olmalıdır. Ayrıca, e fonksiyonunun Taylor serisi açılımından c
sabitinin değeri


x
x 0
x 0
x!
 P( X  x)   P( X  x)  c 
xDX
 c e  c  e
dir. Yani, X rasgele değişkeninin olasılık fonksiyonu,
64
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
 e   x / x ! , x  0,1, 2,3,...
f ( x)  
0
, diğer yerlerde

şeklindedir 
Kesikli rasgele değişkenlerde, dağılım fonksiyonu verildiğinde, olasılık fonksiyonu
P  X  x   F ( x  )  F ( x  ) eşitliği ile bulunur. Rasgele değişkenin olasılık fonksiyonu
verildiğinde dağılım fonksiyonu da,
F ( x)   P( X  t )
t x
şeklinde bulunur.
Bir önceki örnekte verilen olasılık fonksiyonunu ele alalım. Olasılık fonksiyonu,
 x /15 , x  1, 2,3, 4,5
f ( x)  
, diğer yerlerde
 0
olup dağılım fonksiyonunu bulmak için olasılık fonksiyonunu,
X x
P ( X  x)
1
1 /15
2
2 /15
3
3 /15
4
4 /15
5
5 /15
şeklinde yazalım. Buradan dağılım fonksiyonunun değerleri
x  1  F ( x)   P( X  t )  0 ,
tx
1  x  2  F ( x)   P ( X  t )  P ( X  1) 
tx
1
,
15
2  x  3  F ( x)   P ( X  t )  P ( X  1)  P ( X  2) 
tx
3
,
15
3  x  4  F ( x)   P ( X  t )  P ( X  1)  P ( X  2)  P ( X  3) 
tx
6
,
15
4  x  5  F ( x)   P ( X  t )  P ( X  1)  P ( X  2)  P ( X  3)  P ( X  4) 
tx
x  5  F ( x)   P( X  t )  1
tx
olarak bulunur. Buna göre, dağılım fonksiyonu açık olarak,
10
,
15
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
 0
 1/ 15

 3 /15
F ( x)  
 6 / 15
10 / 15

 1
,
,
,
,
,
,
65
x 1
1 x  2
2 x3
3 x  4
4 x5
x5
şeklinde yazılır.
X sürekli ise dağılım fonksiyonu da süreklidir. O halde, X sürekli ise her x   için
P( X  x)  F ( x  )  F ( x  )  0 dir. Ayrıca X sürekli ise, rasgele değişkenin olasılık
fonksiyonunu kesikli olasılık fonksiyonlardan ayırmak için “olasılık yoğunluk fonksiyonu”
ifadesi kullanılır. Sürekli rasgele değişkenlerin dağılım fonksiyonları, sürekli olmasına
rağmen dağılım fonksiyonunun türevlenemediği yerler olabilir.
Tanım 2.3.2 Değer kümesi DX olan sürekli bir X rasgele değişkeninin dağlım
fonksiyonu F ( x) olsun. X in olasılık yoğunluk fonksiyonu,
 d F ( x)
, F nin türevlenebildiği yerlerde

f ( x)   dx
 0
, diğer yerlerde
dir 
X rasgele değişkeninin olasılık yoğunluk fonksiyonu f ( x) ,
i)
ii)
f ( x)  0,

her x  
f ( x) dx  1
xDX
koşullarını sağlar. Diğer taraftan, P ({w : X ( w) A}) olasılığı (veya P ( X  A) olasılığı)
P ( X  A)   f ( x) dx
A
integrali ile hesaplanır.
Örnek 2.3.2   [1, 2] ,    () ve A  için P ( A)  " A nın aralık uzunluğu" / 3
olmak üzere, (,  , P ) bir olasılık uzayıdır.
66
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
X :  
w  X ( w)  w2
olarak verilen X rasgele değişkeninin dağılım fonksiyonu (Örnek, 2.2.3a) sürekli olmasına
rağmen, x  0, x  1 ve x  4 noktalarında türevlenemez. Dolayısı ile, X rasgele
değişkeninin değer kümesi D X  [0, 4] olup, olasılık yoğunluk fonksiyonu
 1
 3 x

dF ( x)  1
f ( x) 

dx
 6 x


 0
,
0  x 1
, 1 x  4
,
d . y.
olup grafiği Şekil (2.3.1) de verilmiştir.
Şekil 2.3.1 Örnek (2.3.2) de verilen rasgele değişkenin olasılık yoğunluk fonksiyonu
Bu fonksiyon, her x   için f ( x)  0 ve

DX
1
1
4
1
2 x
f ( x) dx  
dx  
dx 
3
3 x
6 x
0
1
1
x 0
x

3
4

x1
2 1

3 3


2 1
4  1   1
3 3
özelliklerini sağladığı için bir olasılık yoğunluk fonksiyonudur. P ({w :0  X ( w)  2})
olasılığı ise,
P ({w :0  X ( w)  2}) 

DX
1
1
2
1
2 x
f ( x ) dx  
dx  
dx 
3
3 x
6 x
0
1
1
x 0
x

3
2
x 1
RASGELE DEĞİŞKENLER VE DAĞILIMLARI

2 1

3 3


67
2  1 
1 2
 0.8047
3
olarak hesaplanmıştır. Sürekli rasgele değişkenlerde, aralık sınırları yazılırken uç noktaların
önemi yoktur. Yani,
P ({w :0  X ( w)  2})
ile
P ({w :0  X ( w)  2})
olasılıkları
aynıdır 
X rasgele değişkeninin olasılık yoğunluk fonksiyonu f ( x) verildiğinde, dağılım
fonksiyonu,
x
F ( x) 

f (t ) dt

integrali ile hesaplanır. Bir rasgele değişkenin dağılım fonksiyonu verildiğinde, bu özelliği
sağlayan bir f fonksiyonu varsa, bu fonksiyon rasgele değişkenin olasılık yoğunluk
fonksiyonudur. Böyle bir fonksiyon bulunamayabilir veya bulunduğu zaman da fonksiyonu
belirlemek kolay olmayabilir. Oysa, bir rasgele değişkenin dağılım fonksiyonu her zaman
vardır. Bu nedenle, rasgele değişkenlerin olasılık veya olasılık yoğunluk fonksiyonları
dağılım fonksiyonlarından elde edilmeye çalışıldı. Bir rasgele değişkenin aksi
söylenmedikçe olasılık veya olasılık yoğunluk fonksiyonunun var olduğu kabul edilecektir.
Kesikli dağılımlarda uç noktalar önemlidir. Örneğin, Örnek (2.3.1b) de verilen rasgele
değişken için P ( X  2) ve P ( X  2) olasılıkları farklıdır. Olasılık fonksiyonu,   0 için
P( X  x)  e   x / x ! , x  0,1, 2,3,... olup olasılıklar,
P( X  2)  P( X  0)  P( X  1)  P( X  2)  e  (1     2 / 2)
ve
P( X  2)  P( X  0)  P( X  1)  e  (1   )
olup, P ( X  2)  P ( X  2) dir.
Genel olarak, olasılık veya olasılık yoğunluk fonksiyonu verildiğinde olasılıklar
  P( X  x) ,
 xA
P ({w : X ( w)  A})  P( X  A)  
,
  f ( x) dx
 A
ile hesaplanır.
X kesikli
X sürekli
68
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
2.4. Çok Değişkenli Dağılım Fonksiyonları
Bu kısımda rasgele vektörler (veya vektör rasgele değişkenler) ve dağılım fonksiyonları
ile ortak olasılık (veya ortak olasılık yoğunluk) fonksiyonları üzerinde durulacaktır.
Bileşenleri X1, X 2 ,..., X k olan k  boyutlu bir rasgele değişken X  ( X1, X 2 ,..., X k )

şeklinde gösterilecektir. Böyle bir rasgele değişken (veya rasgele vektör)
( X1 ,..., X k ) :    k
w  ( X1 ( w),..., X k ( w))
şeklinde tanımlanır. k  boyutlu rasgele değişkenin ortak dağılım fonksiyonu,
F X , X ,..., X 
1 2
k
: k
 [0,1]
( x1,...xk )  F( X1, X 2 ,..., X k ) ( x1,...xk )  P({w : X1 ( w)  x1 ,..., X k ( w)  xk })
şeklinde tanımlanır. Karmaşıklığı önlemek için k  2 alalım. O zaman, bileşenleri X ve Y
olan iki boyutlu vektör rasgele değişkenin ortak dağılım fonksiyonu,
F ( x, y)  P({w : X (w)  x, Y (w)  y})  P( X  x, Y  y)
şeklinde olur. Çok değişkenli dağılım fonksiyonları tek değişkenli dağılım fonksiyonlarında
olduğu gibi benzer özelliklere sahiptir. Bunlardan bazıları aşağıdaki teoremde özetlenmiştir.
Teorem 2.4.1 (,  , P ) bir olasılık uzayında tanımlı marjinalleri FX ( x) ve FY ( y ) olan
X  ( X , Y ) iki boyutlu rasgele vektörün dağılım fonksiyonu F ( x, y ) aşağıdaki özellikleri

sağlar:
i)
ii)
lim F ( x, y )  FY ( y ) , lim F ( x, y )  FX ( x)
x 
y 
lim F ( x, y)  0 ,
x  
iii) lim
lim F ( x, y )  0 ,
y  
lim
lim
x   y   
F ( x, y )  0
lim F ( x, y )  1 .
x  y  
İspat: i) lim F ( x, y )  FY ( y ) için
x 
lim F (n, y )  FY ( y ) olduğunun gösterilmesi
n 
yeterlidir. Bunun için, An  {w : X ( w)  n} ve B  {w : Y ( w)  y} kümelerini tanımlayalım.
Buradaki An dizisi artan olup lim An   dır. Dolayısı ile,
n
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
69
lim F (n, y )  lim P w : X ( w)  n, Y ( w)  y   lim P( An  B)
n 
n 
n


 P   lim An   B   P (  B )  P( B)  P {w : Y ( w)  y}  FY ( y )
  n 

dir. Bn  {w : Y ( w)  n} ve A  {w : X ( w)  x} alınarak
lim F ( x, y )  FX ( x) elde
y 
edilir.
ii)
lim F ( x, y)  0 için lim F ( n, y )  0 olduğunu göstermek yeterlidir. Bunun
x  
n 
için de An  {w : X ( w)   n} ve B  {w : Y ( w)  y} kümelerini tanımlayalım. An azalan olup
lim An   dir. Ayrıca, An azalan olduğundan limit ile olasılık yer değiştirebilir. Buradan
n
lim F ( n, y )  lim P w : X ( w)   n, Y ( w)  y   lim P( An  B)
n 
n 
n


 P   lim An   B   P (  B )  P()  0
  n 

elde edilir. Yine benzer şekilde, Bn  {w : Y ( w)  n} ve A  {w : X ( w)  x} alınarak
lim F ( x, y)  0 , An  {w : X ( w)   n} ve Bn  {w : Y ( w)  n} küme dizileri kullanılarak
y  
da
lim
lim
x   y   
F ( x, y )  0 elde edilir.
iii) An  {w : X ( w)  n} ve Bn  {w : Y ( w)  n} küme dizilerini tanımlayalım. Her iki
küme dizisi de artan olup, lim An   ve lim Bn   dir. Buradan da,
n
lim
lim F ( x, y )  lim
x  y  
n
lim F (n, n)  lim P w : X ( w)  n, Y ( w)  n
n  n  
n 


 lim P( An  Bn )  P   lim An    lim Bn    P(  )  P ()  1
n
  n   n  
elde edilir 
Bileşenleri X ve Y olan iki boyutlu vektör rasgele değişkenin dağılım fonksiyonu
F ( x, y) verildiğinde, X ve Y nin marjinal dağılım fonksiyonları sırası ile,
FX ( x)  F ( x ,  ) ve FY ( y )  F (   , y )
70
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
şeklinde bulunur. Buradaki FX ve FY fonksiyonları, X ve Y nin marjinal dağılım
fonksiyonlarıdır. Buradan da, her bir rasgele değişkenin marjinal olasılık veya olasılık
yoğunluk fonksiyonu elde edilir.
Tek değişkenli dağılım fonksiyonu azalmayan ve sağdan süreklidir. Vektörlerde
sıralama bağıntısı olmadığından, çok değişkenli dağılım fonksiyonları azalmayandır veya
artandır gibi ifadeler kullanılamaz. Ancak, çok değişkenli dağılım fonksiyonu her bir
değişkenine göre sağdan sürekli ve azalmayandır. İki değişkenli dağılım fonksiyonunun bu
özellikleri aşağıdaki teoremde ifade edilmiştir.
Teorem 2.4.2 (,  , P ) bir olasılık uzayında tanımlı marjinalleri FX ( x) ve FY ( y ) olan
X  ( X , Y ) iki boyutlu rasgele vektörün dağılım fonksiyonu F ( x, y ) değişkenlerine göre

sağdan sürekli ve azalmayandır.
İspat: Önce, fonksiyonun bileşenlerine göre sağdan sürekli olduğunu gösterelim.
F ( x, y) fonksiyonunun x bileşenine göre sağdan sürekliliği için, lim F ( x  h, y )  F ( x, y )
h 0
veya lim F ( x  (1 / n), y )  F ( x, y ) olduğunun gösterilmesi yeterlidir. Bunun için de
n
lim  F ( x  (1 / n), y )  F ( x, y )  0
n
olduğunun gösterilmesi yeterlidir. Ayrıca lim  F ( x  (1 / n), y )  F ( x, y )  ,
n
lim  F ( x  (1 / n), y )  F ( x, y )  lim  P ( X  x  (1 / n), Y  y )  P ( X  x, Y  y )
n
n
 lim  P( x  X  x  (1 / n), Y  y )
n
şeklinde yazılabilir. An  {w : x  X (w)  x  (1 / n)} ve Bn  {w : Y ( w)  y} kümeleri için, An
küme dizisi azalan olup lim An   dir. Buna göre,
n
lim  F ( x  (1 / n), y )  F ( x, y )  lim  P ( x  X  x  (1 / n), Y  y )  lim P ( An  B )
n
n
n


 P  lim ( An  B )     lim An   B)   P (  B)  P ()  0
 n
   n 

elde edilir. Bu da, F ( x, y ) fonksiyonunun x değişkenine göre sağdan sürekli olduğunu
gösterir. Benzer düşünce ile, fonksiyonun y değişkenine göre de sağdan sürekli olduğu
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
71
gösterilir. Şimdi de, fonksiyonun her iki değişkenine göre de sağdan sürekli olduğunu
görelim. Bunun için de,
lim  F ( x  (1 / n), y  (1 / n))  F ( x, y )  0
n
olduğunun gösterilmesi yeterlidir. Diğer taraftan,
lim  F ( x  (1 / n), y  (1 / n))  F ( x, y )  lim  P ( X  x  1 / n , Y  y  1 / n )  P ( X  x , Y  y 
n
n
 lim  P( x  X  x  1 / n , y  Y  y  1 / n ) 
n 
şeklinde yazılabilir. An  {w : x  X (w)  x  (1 / n)} ve Bn  {w : y  Y ( w)  y  (1 / n)} için,
her iki küme dizisi de azalan olup, lim An   ve lim Bn   dir. Buradan,
n
n
lim  F ( x  (1 / n), y  (1 / n))  F ( x, y )  lim  P ( x  X  x  1 / n , y  Y  y  1 / n ) 
n
n


 lim P ( An  Bn )  P  lim ( An  Bn )   P   lim An    lim Bn    P ()  0
n
 n

  n   n  
elde edilir. Bu da fonksiyonun her iki değişkenine göre sağdan sürekli olduğunu gösterir.
Şimdi, fonksiyonun her iki bileşenine göre ayrı ayrı azalmayan olduğunu gösterelim.
Fonksiyonun x e göre azalmayan olduğunu göstermek için, her y   ve x1  x2 için
F ( x1, y )  F ( x2 , y ) olduğunun gösterilmesi gerekir. Bunun için de, x1  x2 ise
{w : X ( w)  x1}  {w : X ( w)  x2 }  {w : X ( w)  x1 , Y ( w)  y}  {w : X ( w)  x2 , Y ( w)  y}
altküme bağıntısı yazılabilir. Buradan da, x1  x2 ise,
P ({w : X ( w)  x1 , Y ( w)  y})  P({w : X ( w)  x2 , Y ( w)  y})  F ( x1 , y )  F ( x2 , y )
elde edilir. Bu da fonksiyonun, x değişkenine göre azalmayan olduğunu gösterir. Benzer
şekilde fonksiyonun y bileşenine göre de azalmayan olduğu gösterilir. Yani, her x   ve
y1  y2 için F ( x, y1 )  F ( x, y2 ) dir 
Teorem 2.4.3 (,  , P ) bir olasılık uzayında tanımlı marjinalleri FX ( x) ve FY ( y ) olan
X  ( X , Y ) iki boyutlu rasgele vektörün dağılım fonksiyonu F ( x, y ) olsun. Bu durumda,

max{FX ( x)  FY ( y )  1, 0} F ( x, y )  min{FX ( x), FY ( y )}
dir (Frechet sınırları).
İspat: A  {w : X ( w)  x} , B  {w : Y ( w)  y} altkümelerini tanımlayalım. Buradan,
72
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
P ( A  B )  P ( A)  P ( B )  P ( A  B )  1 den P ( A  B )  P ( A)  P ( B )  1
yazılır. Buna göre,
P ( A  B )  P( A)  P( B )  1  P ( X  x, Y  y )  P ( X  x)  P (Y  y )  1
 F ( x, y )  FX ( x)  FY ( y )  1
elde edilir. FX ( x)  FY ( y )  1 değeri negatif olabileceği göz önüne alındığında,
F ( x, y )  max{FX ( x )  FY ( y )  1 , 0}
ifadesi yazılabilir. Diğer taraftan, P ( A  B )  P ( A) ve P ( A  B )  P ( B ) özelliklerinden,
P ( X  x, Y  y )  P ( X  x) ve P ( X  x, Y  y )  P(Y  y )
dir. Yani, F ( x, y )  FX ( x) ve F ( x, y )  FY ( y ) olup, F ( x, y )  min{FX ( x), FY ( y )} dir. Bu iki
eşitsizlik birleştirildiğinde,
max{FX ( x)  FY ( y )  1, 0} F ( x, y )  min{FX ( x), FY ( y )}
şeklinde aranan eşitsizlik elde edilmiş olur 
Tek değişkenli dağılım fonksiyonlarında, P (a  X  b)  F (b)  F (a ) dır. Burada da
benzer özellik geçerlidir.
Teorem 2.4.4. (,  , P ) bir olasılık uzayında tanımlı marjinalleri FX ( x) ve FY ( y )
olan X  ( X , Y ) iki boyutlu rasgele vektörün dağılım fonksiyonu F ( x, y ) olsun. x1  x2

için P ( x1  X  x2 , Y  y )  F ( x2 , y )  F ( x1 , y ) dir.
İspat: x1, x2   olmak üzere, x1  x2 ise {w : X ( w)  x2 , Y ( w)  y} kümesi
{w : X ( w)  x2 , Y ( w)  y}  {w : X ( w)  x1 , Y ( w)  y}  {w : x1  X ( w)  x2 , Y ( w)  y}
şeklinde iki ayrık kümenin birleşimi olarak yazılabilir. Buradan da,
P ({w : X ( w)  x2 , Y ( w)  y})  P ({w : X ( w)  x1 , Y ( w)  y})  P ({w : x1  X ( w)  x2 , Y ( w)  y})
eşitliğinden F ( x2 , y)  F ( x1 , y )  P ( x1  X  x2 , Y  y ) bulunur. Bu da ispat için yeterlidir 
(,  , P ) bir olasılık uzayında tanımlı marjinalleri FX ( x) ve FY ( y ) olan X  ( X , Y )

iki boyutlu rasgele vektörün dağılım fonksiyonu F ( x, y ) olsun. Bu durumda,
P ( X  x, Y  y )  1  FX ( x)  FY ( y )  F ( x, y )
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
73
eşitliği için A  {w : X ( w)  x} , B  {w : Y ( w)  y} kümelerini tanımlayalım. FX ( x)  P( A) ,
FY ( y )  P( B ) ve F ( x, y )  P ( A  B ) olduğundan,


P ( X  x, Y  y )  P ( Ac  B c )  P ( A  B)c  1  P ( A  B )
 1   P ( A)  P ( B)  P ( A  B)   1  FX ( x)  FY ( y )  F ( x, y )
eşitliği elde edilir. Yani, P ( X  x, Y  y )  1  FX ( x)  FY ( y )  F ( x, y ) dir.
Rasgele değişkenler kesikli ve sürekli olmak üzere iki gruba ayrılmıştı. Burada, her iki
rasgele değişken kesikli veya sürekli olabildiği gibi biri kesikli diğeri sürekli de olabilir.
Her iki rasgele değişken de kesikli ise rasgele vektörün ortak olasılık fonksiyonu için
bütün x  DX ve y  DY için P ( X  x, Y  y ) olasılıkları hesaplanır. Yani, kesikli X ve
Y rasgele değişkenlerinin ortak olasılık fonksiyonu,
 P( X  x, Y  y ) , x  DX , y  DY
f ( x, y )  
0
, diğer yerlerde

şeklindedir.
Rasgele değişkenlerin her ikisi de sürekli ise, ortak dağılım fonksiyonu F ( x, y) olan
X ve Y rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu da,
  2 F ( x, y )
, F nin türevlenebildiği yerlerde

f ( x, y )   x y

0
, diğer yerlerde

olarak bulunur. Rasgele değişkenlerden biri kesikli diğeri sürekli ise tek değişkenlilerde
olduğu gibi olasılık veya olasılık yoğunluk fonksiyonları bulunur. Marjinal olasılık veya
olasılık yoğunluk fonksiyonları ise aşağıdaki gibi bulunur.
a) X ve Y rasgele değişkenleri kesikli ve ortak olasılık fonksiyonu P ( X  x, Y  y )
ise, marjinal olasılık fonksiyonları
P ( X  x)   P ( X  x, Y  y ) , bütün x  DX
yD Y
P (Y  y )   P ( X  x, Y  y ) , bütün y  DY
xD X
dir.
74
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
b) X ve Y rasgele değişkenleri sürekli ve ortak olasılık yoğunluk fonksiyonu f ( x, y )
ise marjinal olasılık yoğunluk fonksiyonları x  DX ve y  DY için
f X ( x) 
 f ( x, y ) dy ve
yDY
fY ( y ) 
 f ( x, y ) dx
xDX
integralleri ile hesaplanır.
c) X kesikli, Y sürekli rasgele değişkenler ve ortak olasılık fonksiyonu f ( x, y ) ise
marjinal olasılık ve olasılık yoğunluk fonksiyonları x  Dx ve y  D y için,
f X ( x )  P ( X  x) 
 f ( x, y ) dy ve
yDY
fY ( y )   f ( x, y )
xDX
şeklindedir. Ortak olasılık veya olasılık yoğunluk fonksiyonu verildiğinde, ortak dağılım
fonksiyonları da
  P( X  k , Y  ) ,
 k  x ,  y

F ( x, y )   x y
   f ( s, t ) d t d s
,
  
şeklinde bulunur.
X ve Y kesikli
X ve Y sürekli
Tanım 2.4.1 X ve Y rasgele değişkenlerinin ortak olasılık veya olasılık yoğunluk
fonksiyonu f ( x, y ) , marjinal olasılık veya olasılık yoğunluk fonksiyonları da sırası ile
f X ( x) ve fY ( y ) olsun. Bütün x  DX ve y  DY için
f ( x, y )  f X ( x) fY ( y )
ise X ve Y rasgele değişkenlerine bağımsızdır denir 
Tanım 2.4.2 X ve Y rasgele değişkenlerinin ortak olasılık veya olasılık yoğunluk
fonksiyonu f ( x, y ) , marjinal olasılık ve olasılık yoğunluk fonksiyonları da sırası ile
f X ( x) ve fY ( y ) olsun. Y  y verildiğinde X in koşullu olasılık veya olasılık yoğunluk
fonksiyonu,
 P ( X  x, Y  y )

P (Y  y )

f X |Y  y ( x | y )  
f ( x, y )


fY ( y )
dir 
, P(Y  y )  0 , kesikli
,
fY ( y )  0, sürekli
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
75
Örnek 2.4.1 a) Bir çift zarın aynı anda atılması deneyini ele alalım. X1 birinci zarın
üzerindeki noktaların sayısını, X 2 de ikinci zarın üzerindeki noktaların sayısını göstersin.
Buna göre, örnek uzay ( x ve y zarların üzerindeki nokta sayılarına göre şekilleri
göstermek üzere),   {( x, y ): x  1, 2,.., 6, y  1, 2,..., 6} olup sigma cebir de kuvvet
kümesi (    ()) olsun. A  için P ( A)  n( A) / 36 denirse (,  , P ) bir olasılık
uzayı olur. X1 ve X 2 birer rasgele değişken olup Örnek (2.1.2) gereğince X  X 1  X 2
ve Y  | X 1  X 2 | rasgele değişkendir. X ve Y nin değer kümeleri D X  {2, 3, 4,...,12}
ve DY  {0,1, 2,3, 4,5} olup, ortak olasılık fonksiyonu için olasılıklar ayrı ayrı hesaplanır.
Aşağıda bu olasılıklardan birkaç tanesi hesaplanmış diğerleri de benzer şekilde
hesaplanarak tablo halinde ortak olasılık fonksiyonu verilmiştir.
Önce, P ( X  2, Y  0) olasılığını hesaplayalım. Burada,
{w : X ( w)  2}  {(1,1)} ve {w : Y ( w)  0}  {(1,1), (2, 2), (3, 3), (4, 4) , (5,5) , (6, 6)}
olup arakesit kümesi
{w : X ( w)  2, Y ( w)  0}  {(1,1)}
dir. Buradan, P ( X  2, Y  0) olasılığı,
P ( X  2, Y  0)  P ( w : X ( w)  2, Y ( w)  0})  P ({(1,1)})  1/ 36
olarak hesaplanır.
Benzer şekilde, P ( X  5, Y  3) olasılığı için
{w : X ( w)  5}  {(1, 4), (2, 3), (3, 2), (4,1)}
ve
{w : Y ( w)  3}  {(1, 4), (2,5), (3, 6), (4,1) , (5, 2) , (6,3)}
olup arakesit kümesi,
{w : X ( w)  5, Y ( w)  3}  {(1, 4), (4,1)}
dir. Buradan, P ( X  5, Y  3) olasılığının değeri
P ( X  5, Y  3)  P ({w : X ( w)  5, Y ( w)  3})  P({(1, 4), (4,1)})  2 / 36
dır. Diğer olasılıklar benzer şekilde hesaplanarak aşağıda tablo halinde verilmiştir.
76
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
X 
Y
2
3
4
5
6
7
8
9
10
11
12
P (Y  y )
0
1
36
0
1
36
0
1
36
0
1
36
0
1
36
0
1
36
1
0
2
36
0
2
36
0
2
36
0
2
36
0
2
36
0
2
0
0
2
36
0
2
36
0
2
36
0
2
36
0
0
3
0
0
0
2
36
0
2
36
0
2
36
0
0
0
4
0
0
0
0
2
36
0
2
36
0
0
0
0
6
36
10
36
8
36
6
36
4
36
5
0
0
0
0
0
0
0
0
0
0
P ( X  x)
1
36
2
36
3
36
4
36
5
36
5
36
4
36
3
36
2
36
1
36
2
36
6
36
2
36
1
X ve Y nin ortak olasılık fonksiyonundan, marjinal olasılık fonksiyonları da
P( X  x)   P( X  x, Y  y ) , x  DX
yDY
ve
P(Y  y )   P( X  x, Y  y ) , y  DY
xDX
formülleri kullanılarak
X x
P ( X  x)
2
1
36
3
2
36
Yy
P (Y  y )
4
3
36
0
6
36
5
4
36
6
5
36
1
10
36
7
6
36
2
8
36
8
5
36
3
6
36
9
4
36
10
3
36
4
4
36
11
2
36
12
1
36
5
2
36
şeklinde bulunmuştur.
Koşullu olasılık fonksiyonları da koşullu olasılık fonksiyonunun tanımı kullanılarak
hesaplanır. Örneğin, X  5 verildiğinde Y nin koşullu olasılık fonksiyonu y  DY için
P (Y  y | X  5) olasılıkları hesaplanarak bulunur. Bu koşullu olasılıklar
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
77
P( X  5, Y  0)
0

0
P( X  5)
4 / 36
P( X  5, Y  1) 2 / 36 1
 1| X  5) 


P( X  5)
4 / 36 2
P( X  5, Y  2)
0
 2 | X  5) 

0
P( X  5)
4 / 36
P( X  5, Y  3) 2 / 36 1
 3 | X  5) 


P ( X  5)
4 / 36 2
P( X  5, Y  4)
0
 4 | X  5) 

0
P( X  5)
4 / 36
P( X  5, Y  5)
0
 5 | X  5) 

0
P( X  5)
4 / 36
P(Y  0 | X  5) 
P(Y
P(Y
P(Y
P(Y
P(Y
şeklinde hesaplanmış olup koşullu olasılık fonksiyonu,
Yy
P (Y  y | X  5)
0
0
1
0.5
3
0.5
2
0
4
0
5
0
olarak elde edilmiştir.
P ( X  x, Y  y )  P ( X  x) P (Y  y ) olduğundan X ve Y bağımsız değildir.
b) X ve Y rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu,
e  y
f ( x, y )  
 0
, 0x y
, d . y.
olarak verilmiş olsun (Casella ve Berger, 2002, sayfa 150). X ve Y nin marjinal olasılık
yoğunluk fonksiyonları,
f X ( x) 
fY ( y ) 



f ( x, y ) dy   e y dy  e  y

f ( x, y ) dx   e  y dx  e  y x
yDY
xDX
yx
y
x 0
 
yx
 e x
y
x 0
 ye y
integrallerinden
e  x
f X ( x)  
 0
, x0
,
d . y.
ve
 y e  y
fY ( y )  
 0
şeklinde bulunmuştur. Buradan da
e y  f ( x, y )  f X ( x) fY ( y )  (e x )( y e  y )
,
y0
,
d . y.
78
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
olduğundan X ve Y bağımsız değildir. Koşullu olasılık yoğunluk fonksiyonları da yine
kesikli rasgele değişkenlerde olduğu gibi bulunur. Y  y verildiğinde X in koşullu olasılık
yoğunluk fonksiyonu
f X |Y  y ( x | y ) 
f ( x, y )
e y
1
 y 
fY ( y ) y e
y
eşitliğinden,
1

f X |Y  y ( x | y )   y
0

şeklinde bulunmuştur.
, 0 x y
,
d . y.
c) X ve Y rasgele değişkenlerinin ortak olasılık fonksiyonu,
c y e x y
f ( x, y )  
 0
, x  0, y  1, 2,3
, d . y.
olarak verilmiş olsun. Önce, fonksiyonun bir olasılık fonksiyonu olabilmesi için c sabitinin
değeri bulunmalıdır.
f ( x, y ) bir olasılık fonksiyonu olduğundan toplam olasılık 1
olmalıdır. Yani,
  3
  3



1     f ( x, y )  dx     c y e x y  dx  c  e  x  2 e 2 x  3 e3 x dx  3 c




x 0  y 1
x 0  y 1
x 0




eşitliğinden c  1/ 3 bulunur. Yani X ve Y nin ortak olasılık fonksiyonu,
1  x y
 ye
f ( x, y )   3
 0
, x  0 , y  1, 2, 3
, d . y.
şeklindedir. Marjinal olasılık fonksiyonları için,
3

y 1
3

1 x y 1 x
ye
 e  2 e 2 x  3 e3 x
3
y 1 3
f ( x, y )  

ve

xDX


y 
1
1

 1

f ( x, y ) dx    y e x y  dx   e  x y dx    e x y 

3 x 0

 3
 x 0 3
x 0  3
integral ve toplamın sonuçlarından marjinal olasılık fonksiyonları sırası ile
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
1 x
2 x
 3 e 3 x ) , x  0
 (e  2 e
f X ( x)   3

0
, d . y.
79
1
, y  1, 2, 3

fY ( y )   3
 0 , d . y.
,
olarak bulunmuştur.
d) Aynı marjinal olasılık (veya olasılık yoğunluk) fonksiyonlarını veren farklı ortak
olasılık (veya olasılık yoğunluk) fonksiyonları bulunabilir. Örneğin, X1  ( X1 , Y1 ) nin ortak
olasılık yoğunluk fonksiyonu,
0  x, y  1
1 ,
f1 ( x, y )  
0 , diğer yerlerde
ve X 2  ( X 2 , Y2 ) rasgele vektörünün ortak olasılık yoğunluk fonksiyonu da,
1   (2 x  1)(2 y  1) , 0  x, y  1 , 0    1
f 2 ( x, y )  
0
,
diğer yerlerde

şeklinde verildiğinde her iki ortak olasılık yoğunluk fonksiyonu için marjinal olasılık
yoğunluk fonksiyonları aynıdır. X1  ( X1 , Y1 ) rasgele vektörünün ortak olasılık yoğunluk
fonksiyonundan marjinallerin,
0  x 1
1 ,
f1, X1 ( x)  
0 , diğer yerlerde
ve
0  y 1
1 ,
f1, X 2 ( x)  
0 , diğer yerlerde
şeklinde olduğu açıktır. Buradan, her x, y   için, f1 ( x, y )  f1, X1 ( x) f1,Y1 ( y ) olduğundan
X1 ve Y1 bağımsızdır. Şimdi, X 2  ( X 2 , Y2 ) nin ortak olasılık yoğunluk fonksiyonundan
1
1
0
0
f1, X 2 ( x)   1   (2 x  1) (2 y  1) dy  1 ve f1,Y2 ( x)   1   (2 x  1) (2 y  1)  d y  1
olduğundan X 2 ve Y2 nin marjinal olasılık yoğunluk fonksiyonları da,
0  x 1
1 ,
f 2, X 2 ( x)  
0 , diğer yerlerde
ve
0  y 1
1 ,
f 2,Y2 ( x)  
0 , diğer yerlerde
şeklinde olup, yukarıdaki marjinal olasılık yoğunluk fonksiyonları ile aynıdır. Ancak bu
rasgele değişkenler f 2 ( x, y )  f 2, X 2 ( x) f 2,Y2 ( y ) olduğundan bağımsız değildir 
80
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
Örnek 2.4.2 X ve Y rasgele değişkenlerinin ortak dağılım fonksiyonu F ( x, y) olsun
(Öztürk, 1993, sayfa 174). a1, b1 , a2 , b2   olmak üzere,
P({w : a1  X ( w)  a 2 , b1  Y ( w)  b 2 })  F (a1, b1 )  F (a 2 , b2 )  F (a1, b2 )  F (a2 , b1 )
dir. Bunu göstermek için,
A  {w : a1  X ( w)  a 2 , b1  Y ( w)  b 2 }
B  {w : X ( w)  a1, Y ( w)  b 2 }
C  {w : X ( w)  a2 , Y ( w)  b1}
D  {w : X ( w)  a2 , Y ( w)  b 2 }
olaylarını tanımlayalım. Fonksiyonun tanım kümesi Şekil (2.4.1) de verilmiştir.
Şekil 2.4.1 Örnek (2.4.2) de aranan olasılık (taralı alan)
Şekildeki taralı alan {w : a1  X ( w)  a 2 , b1  Y ( w)  b 2 } kümesini göstermektedir.
Buna göre,
B  C  {w : X ( w)  a1 , Y ( w)  b1} ve A  ( B  C )   ve E  A  ( B  C )
küme ilişkileri yazılabilir. Buradan,
P( D)  F (a2 , b2 )  P({w : X ( w)  a2 , Y ( w)  b 2 })  P ( A  [ B  C ])  P ( A)  P( B  C )
 P( A)  [ P( B)  P(C )  P( B  C )]
 P({w : a1  X ( w)  a2 , b1  Y ( w)  b 2 })  P ({w : X ( w)  a1, Y ( w)  b 2 })
 P({w : X ( w)  a2 , Y ( w)  b1})  P ({w : X ( w)  a1 , Y ( w)  b1})
olup F ( x, y)  P ({w : X ( w)  x, Y ( w)  y}) tanımı da kullanıldığında,
F (a2 , b2 )  P({w : X ( w)  a2 , Y ( w)  b 2 }) , F (a1 , b2 )  P({w : X ( w)  a1, Y ( w)  b 2 })
F (a2 , b1 )  P({w : X ( w)  a2 , Y ( w)  b1}) , F (a1 , b1 )  P({w : X ( w)  a1, Y ( w)  b1})
eşitlikleri yazılır. Buradan da, F (a2 , b2 ) nin değeri
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
81
F (a2 , b2 )  P ({w : X ( w)  a2 , Y ( w)  b 2 })
 P ({w : a1  X ( w)  a2 , b1  Y ( w)  b 2 })  P({w : X ( w)  a1, Y ( w)  b 2 })
 P ({w : X ( w)  a2 , Y ( w)  b1})  P({w : X ( w)  a1, Y ( w)  b1})
 P ({w : a1  X ( w)  a2 , b1  Y ( w)  b 2 })  F (a1, b2 )  F (a2 , b1 )  F (a1, b1 )
olarak bulunur. Bu ifadeler birleştirildiğinde aranan eşitlik,
P({w : X ( w)  a2 , Y ( w)  b1})  F (a2 , b2 )  F (a1, b1 )  F (a1, b2 )  F (a2 , b1 )
şeklinde elde edilmiş olur 
Örnek 2.4.3   {( x, y ) :  1  x  1 ,  1  y  1} ,    () ve A 
için P ( A)  " A
nın alanı "/ 4 olmak üzere, (,  , P ) bir olasılık uzayıdır. w  ( x, y )   olmak üzere,
( X1 , X 2 ) :    2
w  ( X1 , X 2 )( w)  ( X1 ( w), X 2 ( w))  ( x 2 ,| y |)
şeklinde tanımlanan ( X1 , X 2 ) rasgele vektörünün dağılım fonksiyonunu bulalım. ( X1 , X 2 )
nin değer kümesi şekilde de görüldüğü gibi D  ( x1, x2 ) :0  x1, x2  1 dir.
Şekil 2.4.2 İki boyutlu rasgele değişkenin tanım ve değer kümesi ( X1 ( x)  x1 , X 2 ( x)  x2 )
Şimdi, ( X1 , X 2 ) nin dağılım fonksiyonunu bulalım. Dağılım fonksiyonu,
F :  2  [0,1]
( x1, x2 )  F ( x1, x2 )  P ({w : X1 ( w)  x1, X 2 ( w)  x2 })  P( X1  x1, X 2  x2 )
şeklindedir. ( x1, x2 )  D için fonksiyonun değeri,
82
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
F ( x1, x2 )  P ({w : X1 ( w)  x1 , X 2 ( w)  x2 })
 P ({( x, y )   : x 2  x1,| y |  x2 })


 P {( x, y )   :  x1  x  x1 ,  x2  y | x2 }

(2 x2 )(2 x1
 x2 x1
4
dir. D1  {( x1, x2 ) : x1  0 , x2  0} olmak üzere ( x1, x2 )  D1 için
F ( x1, x2 )  P ({w : X1 ( w)  x1, X 2 ( w)  x2 })
 P ({( x, y )   : x 2  x1,| y |  x2 })  P ()  0,
D2  ( x1 , x2 ) : x1  1 veya x2  1 olmak üzere ( x1, x2 )  D2 için fonksiyonu değeri,
F ( x1, x2 )  P ({w : X1 ( w)  x1 , X 2 ( w)  x2 })
 P ({( x, y )   : x 2  x1,| y |  x2 })  P ()  1
olarak elde edilmiştir. Şimdi D3  {( x1, x2 ) : x1  1 ve 0  x2  1} kümesini tanımlayalım.
( x1, x2 )  D3 için fonksiyonun değeri yandaki taralı bölgenin alanının dörtle biridir. Yani,
F ( x1, x2 )  P {w : X1 ( w)  x1 , X 2 ( w)  x2 }
 P {( x, y )   : 0  x  1,  x2  y  x2 }
 (2 x2 ) / 4  x2 / 2
dir.
Son olarak D4  ( x1 , x2 ) : 0  x1  1 ve x2  1 olmak üzere ( x1, x2 )  D3 için F ( x1 , x2 )
de şekilde gösterilen dikdörtgenin alanının dörtte biridir. Yani,
F ( x1 , x2 )  P {w : X1 ( w)  x1 , X 2 ( w)  x2 }


 P {( x, y )   : x 2  x1, 0  y  1}


 P {( x, y )   :  x1  x  x1 , 0  y  1}

2 x1
x
 1
4
2
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
83
dir. Buna göre, ( X1 , X 2 ) rasgele vektörünün dağılım fonksiyonu
F :  2  [0,1]
 0

 x2 x1

( x1, x2 )  F ( x1, x2 )   x2 / 2

 x1 / 2
 1
,
x1  0 veya x2  0
, 0  x1  1, 0  x2  1
,
x1  1, 0  x2  1
,
0  x1  1, x2  1
,
x1  1, x2  1
Şekil 2.4.3 Örnek (2.4.3) de verilen iki değişkenli dağılım fonksiyonu
şeklinde olup ortak olasılık yoğunluk fonksiyonu,
 1
 2 F ( x1, x2 ) 
f ( x1 , x2 ) 
  2 x1
x1 x2
 0

, 0  x1  1, 0  x2  1
,
diğer yerlerde
şeklinde elde edilir 
2.5. Beklenen Değer
Bu kısımda, kitlenin önemli özelliklerinden rasgele değişkenlerin momentleri üzerinde
durulacaktır. X bir rasgele değişken g de tanım kümesi reel sayılar olan herhangi bir
fonksiyon olmak üzere g ( X ) de bir rasgele değişkendir. X in olasılık veya olasılık
yoğunluk fonksiyonu verildiğinde g ( X ) in de olasılık veya olasılık yoğunluk fonksiyonu
da bulunabilir. Rasgele değişkenlerin dönüşümlerinin dağılımlarının bulunması bir sonraki
bölümde incelenecektir. Bu kısımda, X in olasılık veya olasılık yoğunluk fonksiyonu
84
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
verildiğinde rasgele değişkenin momentleri üzerinde durulacaktır. Ayrıca, momentler ile
ilgili bazı kavramlar da kısaca ele alınacaktır.
Tanım 2.5.1 Değer kümesi DX olan X rasgele değişkenin olasılık veya olasılık
yoğunluk fonksiyonu f ( x) olsun. g ( X ) rasgele değişkeninin beklenen değeri
 | g ( x )| f ( x) dx   ,
 D
 X
  | g ( x )| f ( x)   ,
 DX
 g ( x) f ( x) dx   , X sürekli

ise E ( g ( X ))   DX
X kesikli
  g ( x) f ( x)   , X kesikli
 DX
X sürekli
dir 
Rasgele değişkenin beklenen değeri her zaman olmayabilir. Yani,

g ( x) f ( x) dx
DX
 g ( x) f ( x) değerleri sonlu olsa bile,  | g ( x)| f ( x) dx (veya  | g ( x)| f ( x) )
veya
DX
DX
DX
integrali (veya toplamı) sonlu olmayabilir. Böyle durumlarda rasgele değişkenin beklenen
değeri yoktur diyeceğiz. Şimdi, bunu bir örnek üzerinde görelim.
Örnek 2.5.1 X rasgele değişkeninin olasılık fonksiyonu,
P( X  x)  1/ 2 x , x  1, 2,3,...
olarak verilmiş olsun (Öztürk, 1993, sayfa 241). g ( x)  (1) x 2 x / x alındığında

DX
 

2x  1
( 1) x
g ( x) f ( x)    (1) x

  ln(2)



x  2 x x 1 x
x 1 
olmasına rağmen,

DX

| g ( x)| f ( x)   (1) x
x 1

2x 1
1



x
x 2
x1 x
olduğundan g ( X ) rasgele değişkeninin beklenen değeri yoktur 
X
herhangi bir rasgele değişken ve
x0  
olsun. Eğer her
x   için
P( X  x0  x)  P( X  x0  x) ise X rasgele değişkeni x0 noktasına göre simetriktir
denir. Herhangi bir X rasgele değişkeni c noktasına göre simetrik ise, E ( X )  c dir
(Biswal, sayfa 64).
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
85
Tanım 2.5.2 X rasgele değişkeninin olasılık veya olasılık yoğunluk fonksiyonu f ( x)
ve her k   için E ( X k ) var olsun. E ( X k ) değerine X rasgele değişkeninin k . momenti
denir ve k ile gösterilir. Ayrıca,
a) k  1 için E ( X ) değerine X in beklenen değeri denir ve  ile gösterilir.
b) E ( X   ) k değerine X in  ye göre k . merkezi momenti denir ve mk ile
gösterilir.
c) m2  E ( X   ) 2 değerine X in varyansı denir ve Var ( X ) veya  2 ile gösterilir.
d) E ( X ( X  1)( X  2)...( X  ( k  1))) değerine X in k . çarpımsal momenti denir 
Var ( X )  2  12 olup X rasgele değişkeninin varyansının pozitif kareköküne X in
standart sapması denir. X in varyansı  2 ise standart sapması  (  0) dır.
Örnek 2.5.2 X rasgele değişkeninin olasılık fonksiyonu   0 için,
P( X  x)  e   x / x ! , x  0,1, 2,3,...
şeklinde verilmiş olsun. Bu rasgele değişkenin beklenen değeri
  x 11
e   x

  E ( X )   x P( X  x)   x P( X  x)   x
e 
x!
x 0
x 1
x 1
x 1 ( x  1)!


 x 1

  e 
x 1 ( x  1)!


y
y 0
y!
 e   
 e  e  
dir. Yani, E ( X )   dir. İkinci moment ise ( y  x  2 denirse),


2  E ( X 2 )   x 2 P( X  x)   ( x  x( x  1))

 x
x 0
e
x 0
 x

x!

   e 

  x ( x  1)
x 0
 x  2 2
x 2 ( x  2)!
e
x 0
 x

x!

 E ( X )   x ( x  1)
x2

   2 e  
    2 e   e     2
e   x
x!
 x2
x 2 ( x  2)!
e   x
x!

y
y 0
y!
   2e  
86
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
şeklinde bulunmuştur. Rasgele değişkenin bu iki momentinden X in varyansı da
Var ( X )  2  12  (   2 )   2  
olarak bulunmuştur 
Tanım 2.5.3 X rasgele değişkeninin olasılık veya olasılık yoğunluk fonksiyonu f ( x)
ve E ( g ( X )) var olsun.
a) t   ve g ( x)  et x için E (et X ) fonksiyonuna, X in moment çıkaran fonksiyonu
denir ve M X (t ) ile gösterilir.
b) i  1 olmak üzere, t   ve g ( x)  eit x için E (eit X ) fonksiyonuna, X in
karekteristik fonksiyonu denir ve  X (t ) ile gösterilir.
c) t   ve g ( x)  t x için
E (t X ) fonksiyonuna, X in çarpımsal moment üreten
fonksiyonu denir ve N X (t ) ile gösterilir 
Bu fonksiyonlar kullanılarak da rasgele değişkenlerin momentleri hesaplanabilir.
Örneğin, X in moment çıkaran fonksiyonu M X (t ) varsa, X in momentleri
k  E ( X k ) 
dk
dt k
M X (t )
t 0
şekilde moment çıkaran fonksiyonunun türevinden hesaplanır. Türev ile beklenen değer
operatörlerinin yer değiştirebildiği varsayımı altında, moment çıkaran fonksiyonunun k .
türevi,
dk
dt k
M X (t ) 
dk
dt k
 
E e
tX
 d k tX
 E k e
 dt


k tX
  E X e



olup, türevde t  0 yazıldığında rasgele değişkenin k . momentinin
dk
dt
k

 E X k etX
M X (t )
t 0
 t 0  E ( X k )   k
olduğu görülür.
Örnek 2.5.3 a) X rasgele değişkeninin olasılık fonksiyonu   0 için
P( X  x)  e   x / x ! , x  0,1, 2,3,...
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
87
olarak verilmiş olsun. Bu rasgele değişkenin ilk iki momenti Örnek (2.5.2) de E ( X )   ve
E ( X 2 )     2 olarak hesaplanmıştı. Bu rasgele değişkenin moment çıkaran fonksiyonu
( e x fonksiyonunun Taylor serisi açılımı kullanılarak),
M X (t )  E (et X ) 

t
t
e   x
( et  ) x
 e 
 e   e e  e ( e 1)
x!
x!
x 0

 et x
x 0
olup rasgele değişkenin birinci momenti,
1  E ( X ) 
d M X (t )
dt

t 0


d  (et 1)
e
dt

t
  et e (e 1)
t 0

t 0

ve ikinci momenti,
2  E ( X 2 ) 
d 2 M X (t )
d t2

t 0
d2
d t2

t
e ( e 1)
t
t
  et e ( e 1)   2 e 2 t e ( e 1) 


t 0


t 0

t
d
 et e ( e 1)
dt

t 0
   2
şeklinde hesaplanabilir. Bu moment çıkaran fonksiyonu kullanılarak, rasgele değişkenin
diğer tüm momentleri, k   ler için


k 1    k 
d k 

d 
şeklinde ardışık olarak bulunabilir. Şimdi, bu bağıntının doğru olduğunu görelim. Bunun
için matematiksel tümevarım yöntemi kullanılabilir. Önce, k  1 için eşitliğin sol tarafı
2  E ( X 2 )     2 dir. Eşitliğin sağ tarafı ise,


  1 
d 1 
d 

2
   (  1)    
   
d 
d 

olup bağıntı k  1 için geçerlidir. Matematiksel tümevarım gereği, eşitliğin k için doğru
olduğunu varsayarak k  1 için doğru olduğunu gösterelim. Eşitlik k için doğru ise,
moment çıkaran fonksiyonunun türevinde t  0 yazılarak momentlerin elde edildiğini de
göz önüne alarak


k 1 (t )    k (t ) 
d k (t ) 

d 
88
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
yazalım. Buradan, k  1 için eşitliğin sol tarafı
k  2 (t ) 
d k 2
d t k 2
M X (t ) 
 d
d  (t )  
d  d k 1
d  
 k 1 M X (t )    k 1 (t )     k (t )  k  
dt  d t
dt  
d  
 dt


d k (t ) 
d d k (t ) 
d d k (t ) 
d
   k (t ) 
   k 1 (t ) 
    k 1 (t ) 


dt d  
d  dt 
d 
 dt


şeklinde yazılır. Burada t  0 yazıldığında eşitlik k  1 için,
d 

k  2     k 1  k 1 
d 

olup iddia k  1 için de doğrudur. Yani, iddia her k için doğrudur.
b) Negatif değerler almayan kesikli bir X rasgele değişkeninin beklenen değeri varsa,
bu beklenen değerin
E( X ) 

 P ( X  n)
n 0
şeklinde hesaplanabileceğini görelim. Sağ taraftaki serinin açık olarak yazılması ile

 P( X  n)  P( X  0)  P( X  1)  P( X  2)  P( X  3)  ...
n 0
 P( X  1)  P( X  2)  P( X  3)  P( X  4)  ...
 P( X  2)  P( X  3)  P ( X  4)  P( X  5)  ...
 P( X  3)  P( X  4)  P( X  5)  ...
.........
 1 P ( X  1)  2 P ( X  2)  3P ( X  3)  4 P ( X  4)  ...

  x P( X  x) 
x 1

 x P( X  x)  E ( X )
x 0
şeklinde aranan eşitlik elde edilir.
Negatif olmayan değerler alan sürekli bir X rasgele değişkeninin dağılım fonksiyonu
F ( x) olsun. X rasgele değişkenin beklenen değeri varsa,

E ( X )   (1  F ( x)) d x
0
dir (Öztürk, 1993) 
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
89
Bir rasgele değişkenin varyansı, ortalamadan (beklenen değer) sapmasının karesinin
beklenen değeridir. Tanım (2.5.2) de bir rasgele değişkenin varyansı Var ( X )  E ( X   )2
olarak tanımlandı.Bu varyans genellikle Var ( X )  E ( X 2 )  ( E ( X ))2 hesaplanır. Yani,
2
Var ( X )  2  12  E ( X 2 )   E ( X )   E ( X   ) 2
dir. a, b   olmak üzere g ( x)  a x  b fonksiyonunu tanımlayalım. Buradan kesikli
g ( X ) rasgele değişkeninin beklenen değeri (sürekli durumda toplam sembolleri yerine
integraller gelir),
E ( g ( X ))  E (a X  b)   (a x  b) P( X  x)
xDX
 a  x P ( X  x )  b  P ( X  x)  a E ( X )  b
xDX
xDX
ve
2
Var ( g ( X ))  Var (a X  b)  E  (a X  b)  E (aX  b   E  aX  b  aE ( X )  b 
2
2
 E  a ( X   )   a 2 E ( X   )2  a 2Var ( X )
dir. Yani bir rasgele değişkenin lineer birleşiminin beklenen değer ve varyansı a, b  
olmak üzere, E (aX  b)  aE ( X )  b ve Var ( aX  b)  a 2Var ( X ) dir.
Buraya kadar bir boyutlu rasgele değişkenlerin beklenen değeri incelendi. Şimdi,
bileşenleri X ve Y olan iki boyutlu rasgele vektörün ortak olasılık veya olasılık yoğunluk
fonksiyonu f ( x, y ) olsun. Marjinal olasılık fonksiyonlarından E ( X ), E (Y ), Var ( X ) ve
Var (Y ) değerleri hesaplanabilir. Ayrıca, X ve Y aynı örnek uzay üzerinde tanımlı rasgele
değişkenler, g de  2 den  ye tanımlı bir fonksiyon olmak üzere g ( X , Y ) tek boyutlu
bir rasgele değişkendir. Buna göre E ( g ( X , Y )) beklenen değeri varsa, bu beklenen değer

g ( x, y ) f ( x, y ) dy dx
,
 xD yD
X
Y
E ( g ( X , Y ))  
   g ( x, y ) P ( X  x, Y  y ) ,
 xDX yDY
X sürekli
X kesikli
şeklinde hesaplanır.
Tanım 2.5.4 Bileşenleri X ve Y olan iki boyutlu bir rasgele vektörün ortak olasılık
veya olasılık yoğunluk fonksiyonu f ( x, y ) olsun.
90
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
a) X ile Y arasındaki kovaryans Cov( X , Y )  E[( X  E ( X ))(Y  E (Y )] ,
b) X ile Y arasındaki korelasyon ise,
Cov( X , Y )
,
Var ( X ) Var (Y )
 X ,Y 
c) Bileşenleri X ve Y olan iki boyutlu bir rasgele vektör X olmak üzere, X rasgele


vektörün beklenen değer vektörü ile varyans kovaryans matrisi sırası ile,
 E ( X )

 E (Y ) 


Cov( X , Y ) 
 Var ( X )
V 

Cov( X , Y ) Var (Y ) 
,
dir 
X ile Y arasındaki kovaryans genellikle Cov( X , Y )  E ( XY )  E ( X ) E (Y ) şeklinde
hesaplanır.
Örnek 2.5.4 a) Bileşenleri X ve Y olan iki boyutlu bir rasgele vektörün ortak olasılık
yoğunluk fonksiyonu
e  y
f ( x, y )  
 0
, 0x y
, d . y.
olsun. X ve Y nin marjinal olasılık yoğunluk fonksiyonları,
e  x
f X ( x)  
0
, x0
,
d . y.
 y e  y
fY ( y )  
0
ve
,
y0
,
d . y.
dir (Örnek (2.4.1b)). Marjinal olasılık yoğunluk fonksiyonlarından E ( X )  1 , Var ( X )  1 ,
E (Y )  2 , Var (Y )  2 elde edilir. Ayrıca,

y
 
E ( XY ) 
x y e  y dx dy 
y 0 x 0



ye
y 0


y 0
y
 y

y e y   dx  dy


 x 0 

 y2 
1
(4) 3!
3 y
 3
  dy   y e dy 
2
2
2
 2 
y 0
olup X ile Y arasındaki korelasyon
 X ,Y 
Cov( X , Y )
E ( XY )  E ( X ) E (Y ) 3  (1) (2)
1



Var ( X ) Var (Y )
Var ( X ) Var (Y )
(1) (2)
2
olarak hesaplanmıştır.
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
91
b) X ile Y nin ortak olasılık yoğunluk fonksiyonu,
1 , 0  x  1, x  y  x  1
f ( x, y )  
d . y.
0 ,
olarak verilmiş olsun (Casella ve Berger, 2002, sayfa 170). DX  [0,1] ve DY  [0, 2]
olmak üzere marjinal olasılık yoğunluk fonksiyonları,
, 0  y 1
y

ve
fY ( y )   2  y , 1  y  2
0
, d . y.

dir. Burada, X rasgele değişkeninin marjinal olasılık yoğunluk fonksiyonu,
1 , 0  x  1
f X ( x)  
0 , d . y.
x 1
f X ( x)   dy  1
y x
ve Y nin marjinal olasılık yoğunluk fonksiyonu da,
0  y  1 için fY ( y ) 
y
1
x 0
x  y 1
 dx  y ve 1  y  2 için fY ( y ) 
 dx  2  y
olarak hesaplanmıştır. Marjinal olasılık yoğunluk fonksiyonlarından, X ve Y nin beklenen
değer ve varyansı
E ( X )  1/ 2 ,
Var ( X )  1/12 ,
E (Y )  1 ve Var (Y )  1/ 6
dır. Diğer taraftan,
1 x 1
E( X Y ) 
 
x 0 y  x
1
x y dy dx 
2
1

x 0


x ( x  1) 2  x 2 dx 
7
12
olup, X ile Y arasındaki korelasyon
 X ,Y
7 1
7 6
 (1)

Cov( X , Y )
E ( XY )  E ( X ) E (Y ) 12 2
12
12  1




Var ( X ) Var (Y )
Var ( X ) Var (Y )
1 1
1 1
2
12 6
12 6
dir.
c) (,  , P ) bir olasılık uzayı olsun. A, B   için P ( A)  0.5, P ( B | A)  0.4 ve
P ( A  B )  0.8 olmak üzere, X ve Y rasgele değişkenleri
92
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
X :  
Y :  
1 , w  A
w  X ( w)  
0 , w  A
1 , w  B
w  Y ( w)  
0 , w  B
şeklinde tanımlansın. Her iki rasgele değişkenin değer kümesi aynıdır ( DX  DY  {0,1} ).
Buna göre, X in olasılık fonksiyonu,
P ( X  1)  P ( A)  0.5 ve P( X  0)  P( Ac )  1  0.5  0.5
den,
P( X  x)  (0.5) x (0.5)1 x , x  0,1
şeklinde yazılabilir. Y nin olasılık fonksiyonu için
P ( A  B )  P ( A) P ( B | A)  (0.5) (0.4)  0.2
olduğundan B olayının olasılığı,
P ( B )  P ( A  B )  P ( A)  P ( A  B )  0.8  0.5  0.2  0.5
şeklinde olup, Y nin olasılık fonksiyonu da aynıdır. Yani,
P (Y  1)  P ( B )  0.5 ve P(Y  0)  P( B c )  1  0.5  0.5
olasılıklarının hesabından, Y nin olasılık fonksiyonu
P(Y  y )  (0.5) y (0.5)1 y , y  0,1
şeklinde bulunur. Yani, X ve Y nin olasılık fonksiyonları aynıdır. Ayrıca,
P( X  0, Y  0)  P( Ac  B c )  1  P( A  B)  1  0.8  0.2
P( X  0, Y  1)  P( Ac  B)  P( B)  P( A  B)  0.5  0.2  0.3
P( X  1, Y  0)  P( A  B c )  P( A)  P( A  B)  0.5  0.2  0.3
P ( X  1, Y  1)  P ( A  B )  0.2
olasılıklarından ortak olasılık fonksiyonu da,
Y/X
0
1
0
0.2
0.3
1
0.3
0.2
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
93
şeklinde bulunmuştur. Buradan,
E ( XY ) 
1
1
  x y P( X  x, Y  y)  P( X  1, Y  1)  0.2
x 0 y 0
olup X ile Y arasındaki korelasyon
Cov( X , Y )
E ( XY )  E ( X ) E (Y ) 0.2  (0.5) (0.5) 0.05
1




0.25
5
Var ( X ) Var (Y )
Var ( X ) Var (Y )
(0.25)(0.25)
 X ,Y 
dir. X ve Y aynı olasılık fonksiyonlarına sahiptir ancak bağımsız değildir 
Tanım 2.5.5 Herhangi bir X rasgele değişkeninin beklenen değeri  varyansı  2 ,
dağılım fonksiyonu da F ( x) olsun. Buna göre,
a) (Medyan) X in medyanı
P( X  M ) 
1
ve
2
P( X  M ) 
1
2
özelliğini sağlayan M sayısı,
b) Varyasyon katsayısı (Coefficient of Variation): V   /  ,
c) Çarpıklık (skewness) katsayısı :   E ( X   )3 /  3 ,
d) Basıklık (kürtosis) katsayısı
:   ( E ( X   )4 /  4 )  3
dür 
Örnek 2.5.5 X rasgele değişkeninin olasılık fonksiyonu   0 için
P( X  x)  e   x / x ! , x  0,1, 2,3,...
olarak verilsin. Moment çıkaran fonksiyonu yardımı ile ilk üç moment ve merkezi
momentler,
E ( X )   , E ( X 2 )     2 , E ( X   )2   ,
E ( X   )3   ,
E ( X   ) 4  3 2  
E ( X 3 )   3  3 2  
ve Var ( X )  
olarak hesaplanmıştır. Buradan da çarpıklık ve basıklık katsayıları sırası ile,

E ( X   )3

3



3/2

1

94
MATEMATİKSEL İSTATİSTİĞE GİRİŞ

E ( X   )4
4
3 
  3 2
1
3 
2


dır 
Çok değişkenli dağılım fonksiyonlarından (Kısım (2.4)) koşullu olasılık fonksiyonları
ve buradan da koşullu beklenen değer bulunabilir. Örneğin, X1, , X k ve Y rasgele
değişkenlerinin ortak olasılık veya olasılık yoğunluk fonksiyonu f ( x1, , xk , y ) olsun.
X1  x1, , X k  xk verildiğinde Y rasgele değişkeninin koşullu olasılık veya olasılık
yoğunluk fonksiyonu f ( y | x1, , xk ) olup X1  x1, X 2  x2 , , X k  xk verildiğinde Y
nin koşullu beklenen değeri
E (Y | X1  x1, X 2  x2 ,, X k  xk ) 

yDY
y f ( y | x1,, xk ) d y
dir ( Y kesikli ise formülde integral yerine toplam sembolü gelir). Bu koşullu beklenen
değer x1 , , xk nin bir fonksiyonudur. Yani,
E (Y | X1  x1, , X k  xk )  h( x1 , , xk )
dir. Bir değişkenin diğer değişkenler üzerine regresyonu (burada Y nin X1, , X k ler
üzerine regresyonu) bu koşullu beklenen değerdir. Regresyon konusu kitabın son
bölümünde ayrıntılı olarak incelenecektir. Buradaki h( x1, , xk ) fonksiyonu x1 , , xk
lerin lineer birleşimi ise regresyon, linner regresyon denklemi, değilse lineer olmayan
regresyon denklemi adını alır. Koşullu beklenen değer E (Y | X1  x 1 )  h( x1 )
ve
h( x1 )  a  b x1 şeklinde ise regresyona basit doğrusal regresyon denir.
Teorem 2.5.1 X ve Y rasgele değişkenlerinin ortak olasılık veya olasılık yoğunluk
fonksiyonu f ( x, y ) olmak üzere,
E ( E ( X | Y ))  E ( X )
dir.
ve
Var ( X )  E (Var ( X |Y ))  Var ( E ( X | Y ))
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
95
İspat: İspatı sürekli durum için yapalım (kesikli durumda integraller yerine toplamlar
gelir). X ve Y nin ortak olasılık yoğunluk fonksiyonu f ( x, y ) ise, Y  y verildiğinde X
in koşullu olasılık yoğunluk fonksiyonu f ( x | y) olsun. Buradan koşullu beklenen değer,



E  E ( X | Y )    E  X | Y  y  fY ( y ) dy  
x f ( x | y )dx  fY ( y ) dy
 

yDY
yDY  xDX





f ( x, y )
  x   f ( x | y ) fY ( y )dy  dx   x  
fY ( y )dy  dx




f ( y)
xDX  yDY
xDX  yDY Y





  x  f ( x, y )dy  dx   x f X ( x)dx  E ( X )


xDX  yDY
xDX

şeklinde bulunur. Varyansın tanımından, X in varyansı
Var ( X )  E ([ X  E ( X )]2 )  E ([ X  E ( X | Y )  E ( X | Y )  E ( X )]2 )
 E ([ X  E ( X | Y )]2 )  E ([ E ( X | Y )  E ( X )]2 )
 2 E  ([ X  E ( X | Y )])[ E ( X | Y )  E ( X )]
olarak yazılabilir. Bu ifadedeki son terim sıfırdır. Bunu görebilmek için,

E  X  E ( X | Y ) E ( X | Y )  E ( X )   E E  X  E ( X | Y )  E ( X | Y )  E ( X )

eşitliğini yazalım. Koşullu dağılımdaki X | Y ve X rasgele değişkenler olup E ( X | Y ) ve
E ( X ) sabittir. Dolayısı ile,

E E  X  E ( X | Y )  E ( X | Y )  E ( X ) 


  E ( X | Y )  E ( X )  E  X  E ( X | Y ) | Y 

  E ( X | Y )  E ( X )  E ( X | Y )  E ( X | Y )    E ( X | Y )  E ( X )  .0  0
elde edilir. Buradan, E  ( X  E ( X | Y ))[ E ( X | Y )  E ( X )]  E (0)  0 olup
E ([ X  E ( X | Y )]2 )  E ( E{[ X  E ( X |Y )]2 | Y })  E (Var ( X |Y ))
ve
E ([ E ( X |Y )  E ( X )]2 )  Var ( E ( X |Y ))
olduğundan,
96
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
Var ( X )  E ([ X  E ( X | Y )]2 )  E ([ E ( X | Y )  E ( X )]2 )
 E (Var ( X | Y ))  Var ( E ( X | Y ))
şeklinde aranan eşitlik elde edilir 
Teorem 2.5.2 X ve Y herhangi iki rasgele değişken, g de tanım kümesi reel sayılar
olan herhangi bir fonksiyon olmak üzere,
min E ([Y  g ( X )]2 )  E ([Y  E (Y | X )]2 )
g ( x)
dir.
İspat: Kolayca görüleceği gibi,
E ([Y  g ( X )]2 )  E ([Y  E (Y | X )  E (Y | X )  g ( X )]2 )
 E ([Y  E (Y | X )]2 )  E ([ E (Y | X )  g ( X )]2 )
 2 E [Y  E (Y | X )] [ E (Y | X )  g ( X )]
olup son terim sıfırdır. Dolayısı ile,
E ([Y  g ( X )]2 )  E ([Y  E (Y | X )]2 )  E ([ E (Y | X )  g ( X )]2 )
 E ([Y  E (Y | X )]2 )
olup g ( X )  E (Y | X ) olduğunda eşitlik sağlanır 
Örnek 2.5.6 a) X ve Y rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu,
e  y
f ( x, y )  
 0
, 0x y
, d . y.
olsun. X  x verildiğinde, Y nin koşullu olasılık yoğunluk fonksiyonu,
e ( y  x )
f ( y | x)  
 0
,
yx
, d . y.
şeklinde olup Y nin koşullu beklenen değeri,

E (Y | X  x) 


y x

 e x  e  y  ye y

dir.

y f ( y | x) dy 
ye
( y  x)
yx

dy  e
x


y e  y dy
y x



x x
x
 x 1
  e e  xe
y x 
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
97
b) X ve Y nin ortak olasılık fonksiyonu x  0,1, 2,..., n , y  0,1, 2,..., n ve x  y  n
için,
n

 x y
n x  y
f ( x, y )  
  1  2 (1   1   2 )
x
,
y
,
n

x

y


olarak verilmiş olsun. Burada,
n


n!


 x, y, n  x  y  x ! y !(n  x  y )!
dir. X rasgele değişkeninin marjinal olasılık fonksiyonu x  0, 1, 2,  , n için,
f X ( x) 
n x

y 0
 n
n!
f ( x, y )     1x (1   1 )n  x 
 1x (1   1 )n  x
x ! n  x !
 x
olup X  x verildiğinde Y nin koşullu olasılık fonksiyonu da
f ( x, y )  n  x    2 
f ( y | x) 



f X ( x)  y   1   1 
y
 11  2 


 11 


n x  y
, y  0,1, 2,..., n  x
olarak bulunur. Buradan, X  x verildiğinde Y nin koşullu beklenen değeri
E (Y | X  x) 
n x
n x
y 0
y 0
 y f ( y | x)   y P(Y  y | X  x)
 n  x   2 
  y


y   1   1 
y 0 
n x
y
 11  2 


 11 


n x  y

( n  x)  2
1  1

n 2

2
11 11
x   x
olur. Burada,   n  2 / (1   1 ) ve    2 / (1   1 ) dir.
c) X ve Y kesikli iki rasgele değişken ve ortak olasılık fonksiyonları h( x, y ) olsun.
E (Y | X  x)  a  b x ise a ve b değerlerini bulmak isteyelim. X ve Y kesikli rasgele
değişkenlerinin marjinal olasılık fonksiyonları
f ( x) ve g ( y ) olmak üzere, X  x
verildiğinde Y nin koşullu beklenen değeri
E (Y | X  x) 

yDY
dir. Başka bir ifade ile,
y h( y | x ) 

yDY
 h ( x, y ) 
y
 a b x
 f ( x) 
98
MATEMATİKSEL İSTATİSTİĞE GİRİŞ

y h ( x , y )  ( a  b x) f ( x )
yDY
dir. Diğer taraftan,
E (Y ) 

yDY




y   h( x, y )  


yDY  xD X

 a  b x  f ( x)  a  b E ( X )
y g ( y) 


xD X


  y h( x, y ) 
 yD


Y

xD X
dir. Benzer şekilde X ile Y arasındaki korelasyon  olmak üzere,
 Var ( X )Var (Y )  E ( X ) E (Y )  E ( XY )  
xDX


 ( x y) h( x, y)   x   y h( x, y) 
yD
xD
yD
Y
X


Y
  x  a  b x  f ( x)   (ax  b x ) f ( x)  a E ( X )  b E ( X )
2
xDX
2
xDX
 a E ( X )  b (Var ( X )  [ E ( X )]2 )
eşitliği yazılabilir. Bu iki eşitlik, E (Y )  a  b E ( X ) ve


 Var ( X ) Var (Y )  E ( X ) E (Y )  a E ( X )  b Var ( X )  E ( X )2

şeklinde yazıldığında iki bilinmeyenli iki denklemin çözümünden,
 Var (Y ) 
 Var (Y ) 
a  E (Y )   
 E ( X ) ve b   

 Var ( X 
 Var ( X 
bulunur 
Teorem 2.5.3 X ve Y herhangi iki rasgele değişken ve a, b   olsun. Buna göre,
a) E (aX  bY )  a E ( X )  b E (Y )
b) Var ( aX  bY )  a 2Var ( X )  b2Var (Y )  2 a b Cov( X , Y )
dir.
İspat:Kesikli durumu göz önüne alalım (sürekli durumda toplam yerine integral gelir).
a) Beklenen değerin tanımından aranan eşitlik
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
E (aX  bY )  
99
 ( a x  b y ) P ( X  x, Y  y )
xDX yDY
 a  x  P ( X  x, Y  y )  b 
xDX
yDY
 y P ( X  x, Y  y )
xDX yDY
 a  xP( X  x)  b  y P(Y  y )
xDX
yDY
 a E ( X )  b E (Y )
şeklinde gösterilmiş olur. Bu da Teoremin (a) kısmını tamamlar.
b) Varyansın tanımında E (aX  bY ) in yukarıdaki değeri yerine konursa,

 
Var (aX  bY )  E [(aX  bY )  E ( aX  bY )]2  E [ a( X  E ( X ))  b(Y  E (Y ))]2

 a 2 E ([ X  E ( X )]2 )  b 2 E ([Y  E (Y )]2 )  2 a b E ([ X  E ( X )][Y  E (Y )])
 a 2 Var ( X )  b 2 Var (Y )  2 a b Cov( X , Y )
şeklinde aranan sonuç elde edilir 
2.6. Üretici Fonksiyonlar
Bu kısımda, rasgele değişkenlerin beklenen değerine bağlı bazı üretici fonksiyonlar ve
bunların kullanıldığı yerler üzerinde durulacaktır. Bunlardan, moment çıkaran fonksiyonu
ile karekteristik fonksiyon bir önceki kısımda tanımlanmıştı.
1. Moment Çıkaran Fonksiyonu:
Bu fonksiyonun tanımı bir önceki kısımda (Tanım(2.5.3a)) verildi. X in moment
çıkaran fonksiyonu, t   için M X (t )  E (et X ) dir. Moment çıkaran fonksiyonu yardımı
ile
var
olması
halinde
herhangi
bir
rasgele
değişkenin
bütün
momentlerinin
hesaplanabileceğini biliyoruz. Ayrıca, rasgele değişkenin bütün momentleri biliniyorsa,
rasgele değişkenin olasılık veya olasılık yoğunluk fonksiyonuna ihtiyaç duyulmadan
moment çıkaran fonksiyonu da bulunabilir. M X (t )  E (et X ) olduğundan beklenen değer
ile sonsuz toplamın yer değiştirebildiği varsayımı altında, et X fonksiyonunun Taylor serisi
açılımından moment çıkaran fonksiyonu,
  ( X t )k
M X (t )  E et X  E  

 k 0 k !
 
  tk
k
   E ( X )
 k 0 k !
100
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
şeklinde de ifade edilebilir. Yani, rasgele değişkenin bütün momentleri ile moment çıkaran
fonksiyonu arasında bir ilişki de vardır. Ancak, buradaki geçişin yapılabilmesi için sonsuz
toplam ile beklenen değer operatörünün yer değiştirebilir olması gerekir. Benzer durum,
moment çıkaran fonksiyonundan momentlere geçiş için de vardır. Orada da beklenen değer
operatörü ile türev operatörlerinin yer değiştirebilmesi varsayımı yapılır. Bu yer
değiştirebilme varsayımları momentlerin var olmasından dolayı genellikle sağlanır.
Örnek 2.6.1 a) X rasgele değişkeninin olasılık yoğunluk fonksiyonu,
e x , x  0
f ( x)  
 0 , d . y.
olarak verilmiş olsun. X rasgele değişkeninin moment çıkaran fonksiyonu, t  1 için
M X (t )  E (e
tX

)  e
0
tx

f ( x) dx   e
t x x
0
e

dx   e
0
 x (t 1)
1  x (t 1)
dx 
e
1 t

x 0

1
1 t
dir. Rasgele değişkenin momentlerinin
dk
dx
k
 E ( X k etX )
M X (t )
t 0
t 0
 E ( X k )  k
şeklinde hesaplanabildiğini bir önceki kısımdan biliyoruz. Moment çıkaran fonksiyonunu
kullanarak, bu rasgele değişkenin beklenen değer ve varyansını bulalım. Birinci moment,
yani rasgele değişkenin beklenen değeri,
M X (t ) 
1
d
1
d
1

M X (t ) 
 E( X ) 
M X (t )

2
2
1 t
dt
dt
(1  t )
t 0 (1  t )
1
t 0
olup ikinci momenti de
1
d2
2
d2
2
2
M X (t ) 
 2 M X (t ) 
 E ( X )  2 M X (t )

3
1 t
dt
(1  t )
dt
(1  t )3
t 0
2
t 0
dir. Dolayısı ile, rasgele değişkenin varyansı Var ( X )  E ( X 2 )  ( E ( X ))2  2  1  1 dir.
b) Herhangi bir X rasgele değişkeninin bütün k   için E ( X k )  2k k ! olarak
verilsin. Bu rasgele değişkenin moment çıkaran fonksiyonu için yukarıdaki formülde
E ( X k )  2k k ! yazıldığında moment çıkaran fonksiyonu, t  (1 / 2) olmak üzere,
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
  ( X t )k
M X (t )  E (et X )  E  
 k 0 k !

101
 tk

  tk
1
E ( X k )   (2k k !)   (2t ) k 
  
1  2t
k 0 k !
k 0
 k 0 k !
olur. Aslında, bir X rasgele değişkeninin olasılık yoğunluk fonksiyonu
 1  x /2
 e
f ( x)   2
 0
, x0
,
d .d .
şeklinde verilmiş ise, bu rasgele değişkenin k . nci momenti

E ( X k )   x k f ( x)dx 
0
1  k  x /2
1
x e
dx  (k  1) 2k 1  2k k !

20
2
ve moment çıkaran fonksiyonu da t  (1 / 2) olmak üzere

1  tx  x /2
1   x (0.5t )
1
1
M X (t )  E (e )   e f ( x)dx   e e
dx   e
dx 

20
20
2  (1/ 2)  t  1  2t
0
tX
tx
dir 
2. Kümülant Üreten Fonksiyonu
Tanım 2.6.1 X rasgele değişkeninin moment çıkaran fonksiyonu var ve M X (t )
olsun. Buna göre, X in kümülant üreten fonksiyonu,
K n (t ) 
dn
d tn
ln  M X (t ) 
dir 
X rasgele değişkeninin moment çıkaran fonksiyonu (dolayısı ile, kümülant üreten
fonksiyonu) bilindiğinde X in n. kümülantı
Kn 
dn
d tn
ln  M X (t ) 
t 0
formülü ile bulunur.
Örnek 2.6.2 X rasgele değişkeninin kümülant üreten fonksiyonu
K1 (t ) 
d
M X (t )
ln  M X (t )  
dt
 M X (t ) 
olup birinci kümülant değeri
102
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
K1 
d
M  (t )
ln  M X (t ) 
 X
dt
M X (t )
t 0
 E( X )
t 0
dir. İkinci kümülant değeri de,
K2 
d2
dt
2
ln  M X (t ) 


M X' (t )M X (t )  M X' (t )
 M X (t ) 
t 0

2
2
 E( X 2 )   E( X )   Var( X )
2
t 0
dir. Türevler ardışık olarak devam ettirildiğinde üçüncü ve dördüncü kümülantların,
K3  E ( X 3 )  3E ( X 2 ) E ( X )  2 ( E ( X ))3
K 4  E ( X 4 )  4 E ( X 3 ) E ( X )  3( E ( X 2 )) 2  12 E ( X 2 ) ( E ( X )) 2  6( E ( X ))4
şeklinde olduğu görülür. X rasgele değişkeninin olasılık fonksiyonu   0 için
P( X  x)  e   x / x ! , x  0,1, 2,3,...
t
şeklinde verildiğinde, X in moment çıkaran fonksiyonu M X (t )  e (e 1) olup kümülant
üreten fonksiyonu,
K n (t ) 
dn
ln  M X (t )  
n
dn

t
dt
d tn
dir. Buradan kümülantlar bütün n   ler için,
Kn 
dn
dt
n
ln  M X (t ) 
  et
t 0

ln e ( e 1)   et
t 0

dir. Yani, bu rasgele değişkenin bütün kümülantları aynıdır 
3. Çarpımsal Moment Üreten Fonksiyonu
Bu fonksiyonun tanımı da bir önceki kısımda (Tanım (2.5.3c)) verildi. X rasgele
değişkeninin olasılık fonksiyonu, f ( x) olmak üzere, X in çarpımsal moment üreten
fonksiyonu t  
için
N X (t )  E (t X ) dir. Rasgele değişkenin çarpımsal üreten
fonksiyonu verildiğinde çarpımsal momentler,
E  X ( X  1)( X  2)...( X  ( k  1))  
şeklinde hesaplanır.
d k N X (t )
d tk
t 1
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
103
Örnek 2.6.3 X rasgele değişkeninin olasılık fonksiyonu   0 için
P( X  x)  e   x / x ! , x  0,1, 2,3,...
olarak verilmiş olsun. Bu rasgele değişkenin çarpımsal moment üreten fonksiyonu,


x
x 0
x 0
x!
N X (t )  E (t X )   t x P( X  x)  e    t x
(t ) x
 e  e t  e ( t 1)
x
!
x 0

 e  
olup çarpımsal momentler,
E( X ) 
d
N X (t )
dt
E ( X ( X  1)) 
  e (t 1)
t 1
d2
dt
2
t 1

  2 e (t 1)
N X (t )
t 1
E ( X ( X  1)( X  2)...( X  ( k  1))) 
dk
dt
k
t 1
 2
  k e (t 1)
N X (t )
t 1
t 1
 k
şeklindedir 
4. Karekteristik Fonksiyon
Karekteristik fonksiyonun tanımı da daha önce (Tanım (2.5.3b)) verildi. Karekteristik
fonksiyon, üretici fonksiyonlar içinde önemli bir yer tutar. Bir rasgele değişkenin moment
çıkaran fonksiyonu bazen olmayabilir. Ancak, karekteristik fonksiyonu her zaman vardır.
Ayrıca, karekteristik fonksiyon biliniyorsa, olasılık veya olasılık yoğunluk fonksiyonu
bulunabilir. i  1 olmak üzere, X rasgele değişkeninin karekteristik fonksiyonu
t   için  X (t )  E (ei t X ) dir. Daha açık olarak, X in karekteristik fonksiyonu
  ei t x P ( X  x) ,
 xD
X
 X (t )  E (ei t X )  
it x
  e f ( x) dx ,
 xDX
X kesikli
X sürekli
dir. X rasgele değişkeninin karekteristik fonksiyonu  X (t ) ise momentler (var olması
halinde),
k
E( X ) 
dk
i k dt k
 X (t )
formülü ile hesaplanır.
t 0
104
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
Örnek 2.6.4 X rasgele değişkeninin olasılık yoğunluk fonksiyonu   0 için
(1/  ) e x / 
f ( x)  
0

, x0
,
d . y.
şeklinde verilmiş olsun. X in karekteristik fonksiyonu,
 X (t )  E (e
it X
1

e

)
it x  x / 
e
dx 
0
1

e

 x (1it  ) / 
dx  (1  i t  ) 1
0
olup ilk iki moment,
d
 X (t )
i dt
E( X ) 
E( X 2 ) 

1 i 
 

i  (1  it  )2 
t 0
d2
i dt
 (t )
2 X

t 0

t 0
1  2 i2  2 


i 2  (1  it  )3 
 22
t 0
2
dir. Rasgele değişkenin varyansı da Var ( X )  E ( X 2 )   E ( X )   2  2   2   2 dir 
Örnek 2.6.5 X rasgele değişkeninin olasılık yoğunluk fonksiyonu
f ( x) 
1
1
, x
 1  x2
olarak verilmiş olsun. Bu rasgele değişkenin moment çıkaran fonksiyonu tanımlı değildir.
Oysa, X in karekteristik fonksiyonu Euler formülü olarak bilinen eit x  cos(t x)  i sin(t x)
eşitliği kullanılarak bulunabilir. X in karekteristik fonksiyonunu,
 X (t )  E (e


1



it X
)
1

cos(t x )
1  x2


e

dx 

1
cos(t x)  i sin( tx)

dx  
dx

2
 
1  x2
 1 x 
it x 
i




1
sin(t x)
1  x2
dx 
1



h1 ( x) dx 

i



h 2 ( x) dx  I1  I 2

şeklinde yazılalım ve I1 ve I 2 değerlerini hesaplayalım. Önce,
h 2 ( x) 
sin(t x)
1  ( x)
2

sin(t x)
1  x2
 h 2 ( x)
olduğundan h 2 ( x) fonksiyonu tektir. Tek bir fonksiyonun simetrik bir bölge üzerinden
integrali de sıfırdır. Yani,
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
I2 
i




sin(t x)
1  x2
105
dx  0
dır. Benzer şekilde,
h1 ( x) 
cos( t x)
 X (t )  E (eit X ) 

cos(t x)
 h1 ( x)
1  ( x)
1  x2
olduğundan h1 ( x) fonksiyonu çifttir. Buna göre, karekteristik fonksiyon,
2
1




cos(t x)
1 x
2
dx 
2



0
cos(t x)
1 x
2
dx  e | t |
olarak bulunur (Billingsley, 1986) 
Karekteristik fonksiyonunun olasılık teorisinde önemli olduğunu belirtmiştik. Şimdi, bu
fonksiyonun özelliklerinden bazılarını kısaca hatırlayalım.
a) herhangi bir X rasgele değişkeni, örnek uzaydan reel sayılara giden reel değerli bir
fonksiyondur. Reel değerli bir
X
rasgele değişkeninin karekteristik fonksiyonu,
eit X  cos(t X )  i sin(t X ) gibi kompleks değerli bir rasgele değişkenin beklenen
değeridir. Ayrıca,




| eit X |  | cos(t X )  i sin(t X )|  1 ve
dir.
it x
 | e | f ( x) dx   f ( x) dx  1
b)  X ( 0 )  1 olduğu açıktır.
c) | X (t )|  | E (ei t X ) |  E (| eit X |)  1
olup her t   için |  X (t )|   X ( 0 ) dır.
d) z kompleks bir sayı olsun ( yani a, b   için z  a  i b ve z nin kompleks
konjugesi z  a  i b dir). Herhangi bir X rasgele değişkeninin karekteristik fonksiyonu
 X (t ) olmak üzere,
 X (t )  E (e i t X )  E (cos(t X )  i sin(t X ))  E (cos(t X ))  i E (sin(t X ))   X (t )
dir. Yani,  X (t ) karekteristik fonksiyonu Hermitian özelliğine sahiptir.
e) X rasgele değişkeninin karekteristik fonksiyonu  X ( t ) ise a, b   olmak üzere
Y  b  a X nin karekteristik fonksiyonu da
106
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
 Y ( t )  E (eit Y )  E (ei t (b a X ) )  eit b X ( a t )
şeklindedir.
f) Bir rasgele değişkenin karekteristik fonksiyonu  X ( t ) biliniyorsa, dağılım
fonksiyonu da bulunabilir. Aşağıdaki teorem bunu ifade etmektedir.
Teorem 2.6.1 Herhangi bir X rasgele değişkeninin dağılım fonksiyonu F ( x) ,
karekteristik fonksiyonu da  X (t ) olsun. h pozitif bir sayı olmak üzere F ( x) nin sürekli
olduğu yerlerde,
F ( x  h)  F ( x ) 1

h
2



e it x  e  it ( x  h)
 X (t ) dt
it h
ve
1
f ( x) 
2


e  it x (t ) dt

dir (Billingsley, 1986, sayfa 357) 
Örnek 2.6.6 a) Karekteristik fonksiyonu,  X (t )  e  | t | olan X rasgele değişkeninin
olasılık yoğunluk fonksiyonunu bulalım. Bunun için, cos( x )  (ei x  ei x ) / 2 eşitliğinden
X in olasılık yoğunluk fonksiyonu (Teorem (2.6.1))
f ( x) 




1   it x
1   it x  |t |
1  0  it x  t
 it x  t


e

(
t
)
dt

e
e
dt

e
e
dt

e
e
dt




X
2 
2 
2  

0


1  i t x t
1    t it x i t x 
 it x  t 
e dt  
dt 
  e e dt   e
 e e e
2  0

0
 2  0

1

t
 e cos(t x) dx 
0

  x  t
1  t

e
cos(
t
x
)
   e sin(t x) dx
t 0  
 
0


x2  e t
  0  1   e sin(t x) dx  
x
sin(
t
x

cos(
t
x
)





 0
  1  x 2
 t 0
1

x
t
1
x2  1 1
1 1  1
 x2 

1





  1  x 2    1  x 2   1  x 2
1
şeklinde bulunur. Yani, X rasgele değişkeninin olasılık yoğunluk fonksiyonu x   için,
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
f ( x) 
dir.
1
107
1
 1  x2
b) X rasgele değişkeninin karekteristik fonksiyonu    ve   0 için,
 X (t )  e i  t t
2 2
 /2
 exp(i  t  t 2 2 / 2)
olarak verildiğinde yine Teorem (2.6.1) den olasılık yoğunluk fonksiyonu için
f ( x) 

1  i t x
1  i t x
t 2 2 
e

(
t
)
dt

e
exp
i

t


 dt


X
2  
2 
2



 t 2 2 t 2 2

1 
exp


(
i
x

i

)

 dt


2 
2
2 2



 2
1 

exp

2 
 2

2
2

 i x  i    i x  i     2  i x  i   
t 2  2 t 



 


 dt

  2    2   2   2  
 2
  2  i x  i  2  1 
1



exp 
exp

 2   2   2 
 2
2



  i x  i  
t  
2 

  
2
 dt


ifadesi elde edilir. Bu son ifade,
  i x  i  
du
u   t  
 dt 
2 


  
dönüşümü ile,
 ( x   )2  1
1
f ( x) 
exp  

2  2

2 
2






e u
2
/2
du 
 ( x   )2 
1
exp  

2 

2 
2



haline gelir. Yani, X in olasılık yoğunluk fonksiyonu, x   için
f ( x) 
 ( x   )2 
1
exp  


2 
2 2 

dir. 
2.7. Çözümlü Problemler
2.7.1 X bir rasgele değişken ise, aşağıdaki önermelerin denk olduğunu gösteriniz.
a) a   için {w   : X ( w)  a}  
b) a   için {w   : X ( w)  a}  
c) a   için {w   : X ( w)  a}  
d) a   için {w   : X ( w)  a}  
108
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
Çözüm:  bir sigma cebir olduğundan her A  için Ac   dur. Buradan, (a) ile
(b) önermeleri ve (c) ile (d) önermeleri denktir. Buna göre, (b) ile (c) önermeleri denk ise
bütün önermeler denk olur. Önce, a   için w   : X ( w)  a   olsun. O zaman her
n   için A n  w : X ( w)  a  (1/ n)  küme dizisini tanımlayalım.  bir sigma
cebir olduğundan A n kümelerinin sayılabilir arakesitleri de  dadır. O halde,


1

 A n    w : X ( w)  a    w : X ( w)  a  
n1
n1 
n
olur. Yani, (b)  (c) önermesi doğrudur. Şimdi, a   için {w   : X ( w)  a}  
olsun. Buradan her n   için, B n  {w : X ( w)  a  (1/ n)}  yazıldığında,  bir
sigma cebir olduğundan B n lerin sayılabilir birleşimleri de  nun elemanıdır. Buradan,



n1 
1
n
 B n    w : X ( w)  a    w : X ( w)  a 
n1
elde edilir. Buna göre, (c)  (b) önermesi sağlanmış olur. Dolayısı ile, (b)  (c) ve
(c)  (b) olduğundan iki önerme denktir.
2.7.2   [ 1, 2] ,    () ve A  için P ( A)  " A nın aralık uzunluğu "/3
olmak üzere, (,  , P ) bir olsılık uzayıdır.
X :  
w  X ( w)  w2  3 w  2
şeklinde tanımlanan X rasgele değişkeninin beklenen değerini bulunuz.
Çözüm: X in değer kümesinin DX  [0.25, 6] olduğu fonksiyonun aşağıda (Şekil (2.7.1))
verilen grafiğinden görülmektedir. X in değer kümesi  nin bir alt kümesi olup en küçük
ve en büyük alabileceği değerlerini bulabilmek için fonksiyonun türevinden yararlanabiliriz
( X , w nın türevlenebilen bir fonksiyonudur). Yani,
dX ( w)
 2w3 0  w  3/ 2
dw
olduğundan X rasgele değişkeni en küçük değerini w  3 / 2 noktasında alır. Bu noktadaki
değeri ise 0.25 dir. Rasgele değişkenin değer bölgesini gösteren grafik Şekil (2.7.1) de
verilmiştir. Yani X rasgele değişkeninin değer kümesi DX  [0.25, 6] dır.
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
109
Şekil 2.7.1 Problem (2.7.2) de tanımlanan rasgele değişkenin değer bölgesi
Şimdi, X in dağılım fonksiyonunu bulalım. Önce, x  0.25 ise F ( x)  0 ve x  6
için F ( x)  1 olduğu açıktır. 0.25  x  0 için dağılım fonksiyonunun değeri
F ( x)  P({w : X ( w)  x})  P({w : w2  3 w  2  x})  P({w : w2  3 w  2  x  0})
  3  1  4 x
3  1  4 x  
1 4 x
 P  w :
w
 



2
2
3
 

0  x  6 için fonksiyonun değeri de,
F ( x)  P({w : X ( w)  x})  P({w : w2  3 w  2  x})  P({w : w2  3 w  2  x  0})
  3  1  4 x
 P  w :
w

2

  1  1  4 x
2  
6
 
olarak hesaplanmıştır. Buna göre, X
in dağılım fonksiyonu ile olasılık yoğunluk
fonksiyonu (dağılım fonksiyonu x  0.25, 0 ve 6 noktalarında türevlenemez) sırası ile,
0


 1  4x

3
F ( x)  
1  1  4 x

6

1

,
x  0.25
, 0.25  x  0
,
,
0 x6
,
x6

3


f ( x)  
3



2
1  4x
1
1  4x
0
, 0.25  x  0
,
0 x6
,
d . y.
şeklindedir. Ayrıca,

xDX
0
6
2
1
1 2
dx  
dx    1
3 3
0.25 3 1  4 x
0 3 1  4x
f ( x) dx  
olduğundan bu fonksiyon bir olasılık yoğunluk fonksiyonudur. Rasgele değişkenin
beklenen değeri de
110
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
0
6
2x
x
dx  
dx
 xf ( x) dx  
xDX
0.25 3 1  4 x
0 3 1  4x
 (1  4x)3/ 2
1  4x 




36
12 

0
 (1  4x)3/ 2
1  4x 




72
24 

x0.25
6

x0
1 14 3
 
18 9 2
olarak hesaplanmıştır.
2.7.3 X ve Y rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu
c x y 2
f ( x, y )  
 0
, 0  x  1, 0  y  1
,
d . y.
olarak verilmiş olsun.
a) c sabitinin değerini bulunuz.
b) P ( X  Y  1) ve P (0  X  0.75) olasılıklarını hesaplayınız.
Çözüm: a) c  6 olduğu,
1
1
 
x 0 y 0
x y 2 dy dx 
1
6
çift katlı integralinin sonucundan açıktır.
b) P ( X  Y  1) olasılığına karşılık gelen bölge Şekil (2.7.2) de gösterilmiştir. Bu
bölgenin alanı (aranan olasılık),
1
1
 y3 
P( X  Y  1)    6 x y dy dx   6 x  
dy  2  x(1  x3 ) dx
 3 
x 0 y  x
x 0
x 0
  y x
1
1
2
1
 x 2 x5  3
 2  ( x  x ) dx  2    
5  5
x 0
 2
1
4
dir.
Şekil 2.7.2 Problem (2.7.3) de aranan olasılığa ait bölge
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
111
Diğer olasılık için, X in marjinal olasılık yoğunluk fonksiyonuna ihtiyacımız vardır.
1

6 x y 2 dy  2 x
y 0
integralinin sonucundan X rasgele değişkeninin marjinal olasılık yoğunluk fonksiyonu,
2 x , 0  x  1
f X ( x)  
d.y
0 ,
şeklinde bulunmuştur. Dolayısı ile aranan olasılık,
0.75

P(0  X  0.75) 
2 xdx  x 2
0
0.75
x 0

9
16
dır.
2.7.4 a) X ve Y rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu
c e 2 x
f ( x, y )  
 0
, 0 y x
,
d.y
olarak verilmiş olsun.
a) c sabitinin değerini, P ( X  Y ) olasılığını ve X ile Y arasındaki korelasyonu
hesaplayınız.
b) X ve Y rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu
 2 e2 x  y
f ( x, y )  
0

, x  0, y  0
,
d . y.
olarak verildiğinde P ( X  Y ) olasılığını hesaplayınız.
Çözüm: a) Önce,

x
 
e
2 x


dy dx 
x 0 y 0

x 0
e


1

dy dx   x e 2 x dx 



4
x 0
 y 0 
2 x 
x
olduğundan, c  4 dür. Yani, X ve Y in ortak olasılık yoğunluk fonksiyonu,
4 e2 x
f ( x, y )  
 0
dir. Ayrıca,
, 0 y x
,
d.y
112
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
x
x

f ( x, y ) dy 

f ( x, y ) dx 
f X ( x) 
y 0

fY ( y ) 

4 e2 x dy  4 x e2 x

4 e 2 x dx   2 e 2 x
y 0

x y
x y

x y
 2 e2 y
integrallerinden X ve Y rasgele değişkenlerinin marjinal olasılık yoğunluk fonksiyonları,
4 x e2 x
f X ( x)  
 0
2 e2 y
fY ( y )  
 0
, x0
,
d . y.
,
y0
,
d . y.
olarak yazılır. Marjinal olasılık yoğunluk fonksiyonlarından beklenen değer ve varyanslar,
E ( X )  1 , E ( X 2 )  3 / 2 , Var ( X )  1/ 2 ve E (Y )  1/ 2 , E (Y 2 )  1/ 2 , Var (Y )  1/ 4
olarak hesaplanmıştır. Marjinaller hesaplandıktan sonra, aranan olasılık

P( X  Y ) 
 P( X  Y |Y  y ) fY ( y ) dy   P( X  y ) fY ( y ) dy
yDY
y 0

  P( X  y) 2 e
y 0
2 y

dy   2 e

2 y 


f ( x) dx  dy
 x  y X


y 0



3
  2 e 2 y   4 x e2 x dx  dy   2 e2 y 2 y e 2 y  e 2 y dy 
 x y

4
y 0
y 0







olarak elde edilir. Ayrıca,

E ( XY ) 

x
 
xy f ( x, y ) dy dx 
x 0 y 0
x
 
4 xy e
2 x

dy dx  2
x 0 y 0

x3 e2 x dx 
x 0
olup X ve Y rasgele değişkenleri arasındaki korelasyon da
3
1
 (1)
Cov( X , Y )
E ( XY )  E ( X ) E (Y ) 4
2  2  1
 XY 


2
Var ( X ) Var (Y )
Var ( X ) Var (Y )
11
2
24
olarak bulunmuştur.
b) X ve Y rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu
 2 e2 x  y
f ( x, y )  
0

, x  0, y  0
,
d . y.
3
4
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
113
şeklinde verildiğinde marjinaller
2 e 2 x
f X ( x)  
 0
 e y
fY ( y )  
 0
, x0
,
d . y.
,
y0
,
d . y.
şeklinde olur. Ayrıca, her x, y   için f ( x, y )  f X ( x) fY ( y ) olup X ve Y bağımsız
rasgele değişkenlerdir. Buna göre P ( X  Y ) olasılığı,


P( X  Y ) 
P( X  Y | Y  y ) fY ( y ) dy 
yDY

P( X  y ) fY ( y ) dy
y 0
 

    2 e 2 x dx  e y dy 


y 0  x  y




e
2 y  y
e

dy 
y 0

e3 y dy 
y 0
1
3
olarak bulunmuştur.
2.7.5 X rasgele değişkeninin olasılık yoğunluk fonksiyonu,
(1/  ) e  x / , x  0
f ( x)  
0
, d . y.

olarak verildiğinde, bu rasgele değişkenin momentleri arasında,
E ( X n 1 )   E ( X n )   2
d
E( X n )
d
şeklinde bir bağıntının olduğunu gösteriniz.
Çözüm: Türev ile integral operatörlerinin yer değiştirebildiği varsayımı altında, çarpım
şeklindeki iki fonksiyonun türevi kullanılarak eşitliğin sağ tarafındaki ikinci terim

d
d  n 1  x /  d
n
 x e
E ( X ) 
dx  
d
d   
 d
0
 1  

   x ne x / dx 
   0



d  1   n  x /   1  d

dx    
xne x/ dx
  x e

d     

d

  
0
0

d
d

1

 1   n  x /  1

dx  
  x e
    0
 

x

0
n
1

e  x / dx 
şeklinde yazılabilir. Buradan da
1

2


n
x
0
x
0
n1
d  x /
1
e
dx   2
d

1

e x / dx  
1


n  x /
 x e dx 
0
E ( X n ) 
1

2
1

3

x
n 1  x / 
0
E ( X n1 )
e
dx
114
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
d
1
1
d
E ( X n )   E ( X n )  2 E ( X n1 )  E ( X n 41 )   E ( X n )   2
E ( X n )
d

d

şeklinde aranan eşitlik elde edilmiş olur.
2.7.6 X ve Y rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu,
c x 2 y , x 2  y  1
f ( x, y )  
,
d . y.
 0
olarak verilmiş olsun.
a) c sabitinin değerini bulunuz.
b) P ( X  Y ) olasılığını hesaplayınız.
c) X ve Y nin marjinal olasılık yoğunluk fonksiyonlarını bulunuz.
d) P (Y  3 / 4 | X  1 / 2) koşullu olasılığını hesaplayınız.
e) X ile Y arasındaki korelasyonu hesaplayınız.
f) X  x verildiğinde, Y nin koşullu beklenen değerini hesaplayınız.
Çözüm: a) x 2  1 olduğundan, X in sınırları  1  x  1 dir. Yani, DX  [1, 1] dir.
Buradan c sabitinin değeri,
1
1 
1
4
 1

1
4c
2
2 1 x


f ( x, y )dydx  c 
 ydy x dx  c  x 2 dx  21

x 1  y  x 2
x 1

1

x 1 y  x2
eşitliğinden c  21 / 4 olarak bulunmuş olur.
b) P ( X  Y ) olasılığı için
A  { X ( w)  Y ( w)}  {( x, y ) :0  x  1, x 2  y  x }
kümesini göz önüne alalım. Buradan aranan olasılık,
21
P( X  Y ) 
4
1

x
21
 2 x y dydx  3
x 0 y  x
2
 x

1
4
 2
21
3
2 x x


x
y
dy
dx

x
dx 


  2 

 2 
4
20


x 0
x 0
 y x

1
2
olarak hesaplanır.
c) X ve Y nin marjinal olasılık yoğunluk fonksiyonlarını bulalım. Önce,
RASGELE DEĞİŞKENLER VE DAĞILIMLARI

yDY
1
21
f ( x, y ) dy  x 2
4

y dy 
y  x2
115
21 2
x (1  x 4 )
8
olup X in marjinal olasılık yoğunluk fonksiyonu,
 21 2
4
 x (1  x ) , 1  x  1
f X ( x)  8

0
,
d . y.
dir. x 2  y ise  y  x 

xDX
21
f ( x, y ) dx 
y
4
y olduğundan

21 
2
 x dx  4 y  2
 y

y
y

0

3 y

21
x
7
x 2 dx  
y 
 y5 / 2
 2  3 
  x 0 2

integralinden sonucu olarak, Y nin marjinal olasılık yoğunluk fonksiyonu da,
 7 5/2
 y
fY ( y )   2
 0
, 0  y 1
,
d . y.
olarak bulunur.
d) P (Y  3 / 4 | X  1 / 2) olasılığı için X  x verildiğinde Y nin koşullu olasılık
yoğunluk fonksiyonuna ihtiyaç vardır. x 2  y  1 için
f ( y | x) 
f ( x, y )
(21/ 4) x 2 y
2y


f X ( x) (21 / 8) x 2 (1  x 4 ) 1  x 4
olduğundan X  x verildiğinde Y nin koşullu olasılık yoğunluk fonksiyonu,
2 y / (1  x 4 ) , x 2  y  1
fY | X  x ( y | x)  
0
,
d . y.

dir. Diğer taraftan,
1

x
2
2y
1  x4
dy 
y2
1
1  x4
1
y x
2
olduğundan fY | X  x ( y | x ) bir olasılık yoğunluk fonksiyonudur. Buradan aranan olasılık da,
1
P(Y  3 / 4 | X  1 / 2) 

3/ 4
1


2y
32
7


dy

3 / 4  (1  (1 / 2) 4 )  15 3/ 4y dy  15
1
f ( y | 1 / 2) dy 
olarak hesaplanmıştır.
e) Marjinal olasılık yoğunluk fonksiyonlarından beklenen değer ve varyanslar
116
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
E( X )  0 , E( X 2 ) 
7
7
7
7
28
, Var ( X ) 
, E (Y )  , E (Y 2 ) 
, Var (Y ) 
15
15
9
11
891
şeklinde bulunmuştur. Ayrıca,
21 1 1
21 1  1 2  3
71 3


E( X Y ) 
xy f ( x, y) dydx 
y dy x dx   x (1  x6 )dx  0




4 x1 y  x2
4 x1  y  x2
4 1



dır. Dolayısı ile, X ile Y arasındaki kolerasyon
X Y 
Cov( X , Y )
E ( XY )  E ( X ) E (Y )
0  0 (7 / 9)


0
Var ( X ) Var (Y )
Var ( X ) Var (Y )
(7 /15)(28 / 891)
dır. X ve Y rasgele değişkenleri bağımsız olmamasına rağmen, aralarındaki korelasyon
sıfırdır.
f) X  x verildiğinde, Y nin koşullu beklenen değeri,
E Y | X  x  
1

yDY
y fY | X  x ( y | x) dy   2 y 2 / (1  x 4 ) dy 
y  x2
2(1  x 6 )
3(1  x 4 )
dir.
2.7.7 X ve Y rasgele değişkenlerinin ortak olasılık fonksiyonu,
P ( X  x, Y  y )  cx / y , x  1, 2 , y  1, 2
olarak verilmiş olsun. c sabitinin değerini bulunuz. X ile Y bağımsız mıdır?
Çözüm: Önce,
2
2
  ( x / y)  9 / 2
y 1 x 1
olduğundan c  2 / 9 dur. Marjinal olasılık fonksiyonları da
P ( X  x)  x / 3, x  1, 2 , P (Y  y )  2 /(3 y) , y  1, 2
şeklindedir. Buradan, Y  y verildiğinde X in koşullu olasılık fonksiyonu, x  1, 2 için
P( X  x |Y  y) 
P ( X  x, Y  y )  2 x / 9 y  x

  P ( X  x)
P (Y  y )
 2 / (3 y )  3
olup X ve Y rasgele değişkenleri bağımsızdır.
2.7.8 (,  , P ) bir olasılık uzayı ve A, B   olsun. X ve Y rasgele değişkenleri
RASGELE DEĞİŞKENLER VE DAĞILIMLARI
X :  
117
Y :  
1 , w  A
w  X ( w)  
0 , w  A
1 , w  B
w  Y ( w)  
0 , w  B
olarak tanımlansın. Buna göre,
Cov( X , Y )  0  P (Y  1| X  1)  P(Y  1)
önermesini ispat ediniz.
Çözüm: DX  DY  {0,1} olduğundan, E ( X )  P ( X  1) , E (Y )  P (Y  1) olup,
E ( XY ) 
1
1
  x y P( X  x, Y  y )  P( X  1, Y  1)
x 0 y 0
dir. Buradan,
Cov( X , Y )  E ( XY )  E ( X ) E (Y )  P( X  1, Y  1)  P ( X  1) P (Y  1)
yazılır. Dolayısı ile,
Cov( X ,Y )  0  P( X  1,Y  1)  P( X  1)P(Y  1)  0  P( X  1,Y  1)  P( X  1)P(Y  1)

P( X  1,Y  1)
 P(Y  1)  P(Y  1| X  1)  P(Y  1)
P( X  1)
elde edilir.
2.7.9 Dağılım fonksiyonu,
1  e  x  x e  x
F ( x)  

, x0
,
d . y.
şeklinde verilen bir X rasgele değişkenin modunu bulunuz.
Çözüm: Bir rasgele değişkenin olasılık yoğunluk fonksiyonu dağılım fonksiyonunun
türevi olduğundan X in olasılık yoğunluk fonksiyonu,
 x e x
f ( x)  

, x0
,
d . y.
dir. Bir rasgele değişkenin modu ise olasılık fonksiyonunu maksimum yapan değerdir.
Buradan, X in modu olasılık yoğunluk fonksiyonunun türevini sıfır yapan noktadır. O
halde, f ( x)  e  x  xe  x  0  x  1 olduğundan rasgele değişkenin modu x  1 dir.
2.7.10 X ve Y rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu,
118
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
1/ y , 0  x  y  1
f ( x, y )  
d . y.
 0 ,
olarak verilmiş olsun.
a) Marjinal olasılık yoğunluk fonksiyonlarını bulunuz.
b) P ( X  1/ 2) , P ( X  1/ 4 , Y  1 / 2) ve P ( X  1 / 4 veya Y  1/ 4)
olasılıklarını hesaplayınız.
Çözüm: a) Önce,
1
f X ( x) 

yx
1
1
dy  ln( y ) y  x   ln( x) ve fY ( x) 
y
y

x 0
1
dx  1
y
integral değerleri kullanılarak marjinal olasılık yoğunluk fonksiyonları sırası ile
 ln( x) , 0  x  1
f X ( x)  
,
d . y.
 0
1 , 0  y  1
fY ( y )  
d . y.
0 ,
ve
şeklinde bulunmuştur.
b) Şimdi olasılıkları hesaplayalım. Önce, P ( X  1/ 2) olasılığı,
1/2
P( X  1/ 2) 

0
1/2
 ln( x) dx   x ln( x) 0 
1/2
1/2
 dx   x ln( x) 0
0
1/2
x0 
1 1 1
 ln    0.847
2 2 2
dir. Burada, L’Hospital kuralı iki defa uygulandığında (limit ifadesinde 0 / 0 veya  / 
ifadeleri geldiği zaman uygulanır),


1/ x 2 / (1/ x)
ln(1/ x)
lim   x ln( x)   lim
 lim
 lim x  0
x 0
x0 1/ x
x0
x 0
1/ x 2
olduğunu belirtmek gerekir. P ( X  1/ 4 , Y  1 / 2) olasılığı ise,
1/4 1/2
P( X  1/ 4, Y  1/ 2)  
0


1/4
1
dy
dx

 y
  ln(1/ 2)  ln( x)  dx
x
0
1/4
1/4
0
0
  ln(1 / 2)  dx     ln( x)  dx 
1  1  1/4
ln     ( ln( x) ) dx
4 2 0
1 1 
1 1 1 1 1
1/4
ln      x ln( x)  x 0   ln    ln   
 4 2 4 4 4
4 2 
RASGELE DEĞİŞKENLER VE DAĞILIMLARI

119
1   1/ 2   1 1
1
ln 
    ln(2)   0.423

4   1/ 4   4 4
4
dür. Son olarak, P ( X  1 / 4 veya Y  1/ 4) olasılığını hesaplayalım. Bunun için,
1
P( X  1/ 4) 
  ln( x) dx    x ln( x)  x  x1/4  0.403 ,
1/4
1
P(Y  1/ 4) 
1
1
3
1
y
 dy  1  4  4
1/4
ve
P( X  1/ 4 , Y  1/ 4)  
1/ 4
1 
1
1 
3 1 1
dx
dy

  y
 1  4 y  dy  4  4 ln  4   0.403
 

1/ 4  
1/ 4 
olduğundan aranan olasılık,
P( X  1/ 4 veya Y  1/ 4)  P( X  1/ 4)  P(Y  1/ 4)  P( X  1/ 4, Y  1/ 4)
3
3
 0.403   0.403 
4
4
şeklinde bulunmuştur. Burada integrallerin analitik hesabı için Mapple VIII programından
yararlanılmıştır.
BÖLÜM 3
RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ VE
DAĞILIM FONSİYONLARI
3.1. Tek Değişkenli Dönüşümler
Bir önceki bölümde, rasgele değişkenlerin dağılım fonksiyonları, olasılık veya olasılık
yoğunluk fonksiyonları ve momentlerine ilişkin bazı özellikleri incelendi. X bir rasgele
değişken ise, X in herhangi bir fonksiyonu da bir rasgele değişkendir.
(,  , P ) bir olasılık uzayı, X de  üzerinde tanımlı bir rasgele değişken olsun. Reel
sayılardan reel sayılara giden bir fonksiyon da g ( g :    ) olmak üzere, g  X
fonksiyonu da  dan  ye giden bir fonksiyondur ( g  X :    ). Yani, X bir rasgele
değişken ise, g  X bileşke fonksiyonu da aynı örnek uzay üzerinde tanımlı bir rasgele
değişkendir (Öztürk, 1993, sayfa 139 ve Ash, 1970 sayfa 58). X :    , g :    ise
g  X :    olup, ( g  X )( w)  g ( X ( w)) dir. Bu bileşke fonksiyon şematik olarak
aşağıda Şekil (3.1.1) de gösterilmiştir.
Şekil 3.1.1 Rasgele değişkenin dönüşümü
İkinci bölümde, rasgele değişkenleri kesikli ve sürekli olmak üzere iki gruba ayırmıştık.
g  X de bir rasgele değişken olduğuna göre, bu rasgele değişken de kesikli ya da sürekli
olabilir. Ancak, X kesikli ise, g  X kesikli veya sürekli olabilir. Benzer şekilde, X
sürekli ise g  X de kesikli veya sürekli olabilir. Örneğin X , değer kümesi DX  [0, 2]
olan sürekli bir rasgele değişken,  den  ye bir g fonksiyonu da
122
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
1 , x  [ 0,1)
g ( x)  
2 ,
x  [1, 2 ]
şeklinde tanımlandığında g  X , değer kümesi Dg  X  {1, 2} olan kesikli bir rasgele
değişkendir. Bu kitapta aksi belirtilmedikçe, X kesikli ise g  X de kesikli, X sürekli ise
g  X de sürekli rasgele değişken olarak ele alınacaktır. Ayrıca, g  X rasgele değişkeni
kısaca g ( X ) ile gösterilecektir. Bu bölümde, herhangi bir X rasgele değişkeninin olasılık
veya olasılık yoğunluk fonksiyonu verildiğinde g ( X ) gibi rasgele değişkenlerin olasılık
veya olasılık yoğunluk fonksiyonlarının bulunma yöntemleri tartışılacaktır.
Kesikli rasgele değişkenlerin dönüşümlerinin olasılık fonksiyonlarının bulunması
kolaydır. X kesikli ise, g ( X ) in de kesikli olduğunu düşünürsek, Y  g ( X ) rasgele
değişkeninin olasılık fonksiyonu için, her y  DY için P (Y  y ) olasılıklarının doğrudan
hesaplanması en kolay yoldur. Bunu aşağıdaki örnek üzerinde açıklayalım.
Örnek 3.1.1 X rasgele değişkeninin olasılık fonksiyonu,
X x
P ( X  x)
2
1/ 5
1
1/ 5
0
1/ 5
1
1/ 5
2
1/ 5
şeklinde verilmiş olsun. DX  {2,  1,0, 1, 2} olup Y  X 2 rasgele değişkeninin olasılık
fonksiyonunu bulalım. Y nin değer kümesinin DY  {0, 1, 4} olduğu açıktır. y  DY için
P (Y  y ) olasılıkları,
P (Y  0)  P ( X  0)  1/ 5 ,
1
1
2
5
5
5
P (Y  1)  P ( X 2  1)  P ( X  1 veya X  1)  P ( X  1)  P( X  1)   
1
1
2
5
5
5
P(Y  4)  P( X 2  4)  P( X  2 veya X  2)  P ( X  2)  P( X  2)   
şeklinde hesaplanmıştır. Buna göre, y   \ DY
için P (Y  y )  0
ve y  DY içinde
olasılıklar yukarıda verildiği gibidir. Buna göre, Y nin olasılık fonksiyonunu
Yy
P (Y  y )
şeklinde yazabiliriz 
0
1/ 5
1
2/5
4
2/5
RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ
123
Dağılım fonksiyonu FX ( x) , olasılık veya olasılık yoğunluk fonksiyonu da f ( x) olan
X
rasgele değişkenini göz önüne alalım. Y  g ( X ) rasgele değişkeninin dağılım
fonksiyonu FY ( y ) , X in dağılım fonksiyonu türünden
FY ( y )  P(Y  y )  P( g ( X )  y )  P( X  g 1 ( y ))  FX ( g 1 ( y ))
şeklinde yazılabilir. Buradan da, Y kesikli bir rasgele değişken ise olasılık fonksiyonu,
y  DY için olasılıklar
P(Y  y )  FY ( y  )  FY ( y  )
şeklinde hesaplanabilir. Y sürekli ise olasılık yoğunluk fonksiyonu y  DY için,
 d FY ( y )
, FY ( y ) nin türevlenebildiği yerlerde

fY ( y )   dy
 0
,
d.y

şeklindedir. Ayrıca, Y
nin dağılım fonksiyonu FY ( y )  FX ( g 1 ( y )) olup, bileşke
fonksiyonun türevi ( Y nin olasılık yoğunluk fonksiyonu),
fY ( y ) 
d FY ( y )
dy

d
dy
FX ( g 1 ( y ))  f X ( g 1 ( y ))
d g 1 ( y )
dy
şeklindedir. g ( x) fonksiyonu monoton artan ise birinci türevi pozitif, monoton azalan ise
negatiftir. Ancak, fonksiyon, bazı yerlerde artan, bazı yerlerde azalan olabilir (Şekil
(3.1.2)).
Şekil 3.1.2 Monoton artan ve azalan dönüşümler
Buradan,
fonksiyon monoton artan ve türevlenebilir ise
fonksiyon monoton azalan ve türevlenebilir ise
d g 1 ( y )
0
dy
d g 1 ( y )
0
dy
124
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
olup seçilen fonksiyonun durumuna göre, Y in olasılık yoğunluk fonksiyonu,
fY ( y ) 

d FY ( y ) d

FX ( g 1 ( y ))  f X g 1 ( y )
dy
dy

d g 1 ( y )
dy
şeklinde yazılmalıdır.
Örnek 3.1.2 X rasgele değişkeninin olasılık yoğunluk fonksiyonu,
2 x , 0  x  1
f ( x)  
d . y.
0 ,
olarak verilmiş olsun. Y  3 X  1 ve Z  3 X  1 rasgele değişkenlerinin olasılık
yoğunluk fonksiyonlarını bulalım. DY  (1, 4 ) olup g ( x)  3x  1 fonksiyonu monoton
artandır. Ayrıca,
g 1 ( y ) 
y 1
d 1
1
ve
g ( y) 
3
dy
3
olup 1  y  4 için Y nin olasılık yoğunluk fonksiyonu,

1
fY ( y )  f X g ( y )

d g 1 ( y )
 y 1  1 2
 2
  ( y  1)
dy
 3 3 9
şeklindedir. Yani, Y nin olasılık yoğunluk fonksiyonu,
2
 ( y  1) , 1  y  4
fY ( y )   9
 0
,
d . y.
şeklindedir. Diğer taraftan, Z nin değer kümesi DZ  (  2, 1) olup h( x)  3x  1
fonksiyonu monoton azalandır. Ters dönüşüm ve türevi,
g 1 ( z ) 
1 z
d 1
1
ve
g (z)  
3
dz
3
olup,

f Z ( z )  f X g 1 ( z )

d g 1 ( z )
 1 y  1 2
 2
   (1  y )
dz
 3  3 9
eşitliğinden Z rasgele değişkeninin olasılık yoğunluk fonksiyonu da,
2
 (1  z ) , 2  z  1
fZ ( z)   9
 0
,
d . y.
RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ
125
olarak bulunmuştur 
Herhangi bir X rasgele değişkeninin olasılık yoğunluk fonksiyonu f ( x) , dağılım
fonksiyonu da FX ( x) olsun. Y  | X | rasgele değişkeninin dağılım fonksiyonu y  DY için,
FY ( y )  P(Y  y )  P(| X | y )  P ( y  X  y )  FX ( y )  FX ( y )
ve dağılım fonksiyonunun türevinden de Y nin olasılık yoğunluk fonksiyonu,
 f ( y )  f X ( y ) ,
fY ( y )   X
0
,

y0
d . y.
dir. Z  X 2 rasgele değişkeninin olasılık yoğunluk fonksiyonu ise,
FZ ( z )  P( Z  z )  P( X 2  z )  P( z  X  z )  FX ( z )  FX ( z )
şeklindeki dağılım fonksiyonunun türevinden
 f X ( z )  f X ( z )
, z0

f Z ( z)  
2 z

0
, d . y.

şeklinde olur.
Örnek 3.1.3 Herhangi bir X rasgele değişkeninin olasılık yoğunluk fonksiyonu,
1/ 3 , 1  x  2
f ( x)  
d . y.
 0 ,
olsun. Y  X 2 nin olasılık yoğunluk fonksiyonunu bulalım.
Şekil 3.1.3 g ( x)  x 2 dönüşümünün [1, 2] aralığındaki grafiği
Y nin değer kümesi Şekil (3.1.3) deki grafikten de görüldüğü gibi D Y  (0, 4) dür.
Buna göre, g ( x)  x 2 fonksiyonu (1, 0 ) aralığında azalan, (1, 2 ) aralığında ise artandır.
126
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
Y nin dağılım fonksiyonu için D Y  (0 , 4) olduğundan, y  0 ise FY ( y )  0 ve
y  4 ise FY ( y )  1 olduğu açıktır. Diğer taraftan, 0  y  1 için
y
2
FY ( y )  P(Y  y )  P( X  y )  P( y  X 
y) 

 y
2 y
1
dx 
3
3
ve 1  y  4 için
y
2
FY ( y )  P(Y  y )  P( X  y )  P(1  X 
y) 

1
1 y
1
dx 
3
3
dir. Buradan Y nin dağılım fonksiyonu ile olasılık yoğunluk fonsiyonu,
 0

 2 y
 3
FY ( y )  
1  y
 3

 1
,
y0
, 0  y 1
ve
, 1 y  4
,
y4
 1
3 y

d FY ( y )  1
fY ( y ) 

dy
6 y


 0
0  y 1
1 y  4
,
d . y.
şeklindedir 
Örnek 3.1.4 Dağılım fonksiyonu F olan X rasgele değişkenini göz önüne alalım.
U  F ( X ) rasgele değişkeninin olasılık yoğunluk fonksiyonunu bulalım.
F dağılım fonksiyonu olduğundan azalmayandır. Ayrıca, DU  [0,1] olup u  0 için
FU (u )  0 ve u  1 için FU (u )  1 olduğu açıktır. Fonksiyon kesin artan ise, 0  u  1 için
fonksiyonun değeri
FU (u )  P(U  u )  P( F ( X )  u )  P( X  F 1 (u ))  F ( F 1 (u ))  u
dur. Ancak, F dağılım fonksiyonu olduğundan azalmayan olup fonksiyon bazı yerlerde
sabit olabilir (Şekil 3.1.4). Örneğin, seçilen bir [ x1 , x2 ] aralığında, her x  [ x1 , x2 ] için
F ( x)  u olabilir. Yani, seçilen bir u değerine karşılık bir çok x değeri vardır. Yani,
F 1 (u ) iyi tanımlı değildir. Bunun için, F 1 (u ) fonksiyonu, F 1 (u )  inf{x : F ( x )  u}
olarak tanımlandığında problem giderilmiş olur.
RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ
127
Şekil 3.1.4 F Dağılım fonksiyonunun ters dönüşümü
Dağılım fonksiyonunun sabit olduğu aralıkta her x değerine karşılık bir u , her u
değerine karşılık da bir x değeri vardır. Yani, F 1 (u ) iyi tanımlıdır. Bu durum dikkate
alındığında, U nun dağılım fonksiyonu ile olasılık yoğunluk fonksiyonu,
u0
0 ,

FU (u )  u , 0  u  1
1 ,
1

ve fU (u ) 
dFU (u ) 1 , 0  u  1

d . y.
du
0 ,
şeklindedir 
3.2. Çok Değişkenli Dönüşümler
Bu kısımda, X ve Y ortak olasılık veya olasılık yoğunluk fonksiyonu f ( x, y ) olan
herhangi iki rasgele değişken olmak üzere, U  g ( X , Y ) gibi bir rasgele değişkenin olasılık
fonksiyonunun elde edilmesi üzerinde durulacaktır. Burada, g fonksiyonu,  2 den  ye
giden bir fonksiyondur. İşlemlerin kolay yürütülebilmesi için, ağırlıklı olarak iki değişkenli
dönüşümler ele alınacaktır. Burada g fonksiyonu sürekli olabildiği gibi, X ve Y nin
sürekli olmayan bir fonksiyonu da olabilir. Ayrıca, X1, X 2 , , X k ortak olasılık veya
olasılık yoğunluk fonksiyonu f ( x1 , x2 , , xk ) olan rasgele değişkenler olmak üzere,
U  g ( X1, X 2 , , X k ) şeklindeki bir rasgele değişkenin olasılık veya olasılık yoğunluk
fonksiyonuna da ihtiyaç duyulabilir. Diğer taraftan, X ve Y nin ortak olasılık veya
olasılık yoğunluk fonksiyonu verildiğinde, U  g1 ( X , Y ) ve V  g 2 ( X , Y ) şeklinde
tanımlanan U ve V
rasgele değişkenlerinin ortak olasılık veya olasılık yoğunluk
fonksiyonu da bulunabilir.
128
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
Şekil 3.2.1 İki boyutlu dönüşüm
U  g ( X , Y ) rasgele değişkeninin dağılımı değişik yollardan elde edilebilir. U tek
değişkenli bir rasgele değişken olduğundan bazen doğrudan dağılım fonksiyonu bulunabilir.
Dağılım fonksiyonundan da olasılık yoğunluk fonksiyonu bulunur. Bazen, başka tekniklerin
denenmesi gerekebilir. Bunu aşağıdaki örnek üzerinde açıklamaya çalışalım.
Örnek 3.2.1 Bağımsız aynı f ( x) olasılık yoğunluk fonksiyonuna sahip iki rasgele
değişken X ve Y olsun. Olasılık yoğunluk fonksiyonları
e  x
f X ( x )  fY ( x )  
 0
, x0
,
d . y.
şeklinde verildiğinde, U  max( X , Y ) ve V  min( X , Y ) rasgele değişkenlerinin olasılık
yoğunluk fonksiyonlarını bulalım. Burada olasılık yoğunluk fonksiyonlarını bulmak için
dağılım fonksiyonu tekniği kullanılabilir. u  0 ise, FU (u )  0 ve u  0 için,
FU (u )  P(U  u )  P(max( X , Y )  u )  P ( X  u , Y  u )
 P( X  u ) P( Y  u )  [ P( X  u )]2  (1  e u )2
olup U nun dağılım fonksiyonu
0

FU (u )  
u 2
(1  e )
,
u0
,
u0
şeklindedir. Dağılım fonksiyonunun türevinden U nun olasılık yoğunluk fonksiyonu,
fU (u ) 
dFU (u )  2 eu (1  e u ) , u  0

du
, d . y.
0
olarak bulunur. V
rasgele değişkeninin dağılım fonksiyonu da benzer şekilde bulunur.
Yani, V nin dağılım fonksiyonu, v  0 ise FV (v)  0 ve v  0 için de
FV (v)  P(V  v)  P(min( X , Y )  v)  1  P (min( X , Y )  v)
 1  P ( X  v, Y  v)  1  P ( X  v) P( Y  v)  1  [ P ( X  v)]2  1  e 2v
olup V nin dağılım fonksiyonu da
RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ
 0
FV (v)  
2 v
1  e
,
v0
,
v0
129
şeklindedir. Yine dağılım fonksiyonunun türevinden V nin olasılık yoğunluk fonksiyonu da
fV (v) 
dFV (v)  2 e2v

dv
0
, v0
,
d . y.
olarak elde edilir 
Kesikli rasgele değişkenlerde, dağılım fonksiyonuna ihtiyaç duyulmadan olasılık
fonksiyonu bulunabilir.
Örnek 3.2.2 Bağımsız X ve Y rasgele değişkenlerinin olasılık fonksiyonu   0 için
P( X  x)  P(Y  x )  e   x / x ! , x  0,1, 2,...
olarak verilsin. U  X  Y rasgele değişkeninin olasılık fonksiyonunu bulalım. U nun
değer kümesi ile X ve Y nin değer kümeleri aynı olup olasılık fonksiyonu u  0,1, 2, 3,...
için,
P(U  u)  P( X  Y  u) 

u
u
y0
y 0
 P( X  Y  u | Y  y) P(Y  y)   P( X  y  u) P(Y  y)
 P( X  u  y) P(Y  y) 
y 0

u
e2 
u!
 e  u y  e  y  u u !  e  u y  e  y 

  (u  y)! 
 y !   u !  (u  y)! 
 y ! 
y 0 

 y0 


u

 y u y e2 
u!
  y!(u  y)!     u !

y 0 
u
2 
 u  y u y e2 
(2 )u
u e



(



)

  y
u!
u!
y0  
u
şeklinde doğrudan hesaplanabilir. U nun olasılık fonksiyonu, X (veya Y nin) nin olasılık
fonksiyonuna benzemektedir. X ve Y nin olasılık fonksiyonlarında  yerine 2
gelmiştir. Yani, U nun olasılık fonksiyonu
P(U  u )  e 2  (2 )u / u ! , u  0,1, 2,...
dir 
Örnek 3.2.3 a) Birim uzunluğundaki düzgün bir çubuk üzerinde rasgele iki nokta
işaretlensin. Bu iki nokta arasındaki uzaklığa Z diyelim. Z nin moment çıkaran
fonksiyonunu bulup E ( Z n ) beklenen değerini hesaplayalım.
130
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
Birim uzunluğundaki çubuk üzerindeki noktalar X ve Y olsun. Rasgele seçilen bu iki
nokta arasındaki uzaklık (şekilde de görüldüğü gibi) Z  | X  Y | dir.
X ve Y rasgele değişkenleri bağımsız olup aynı olasılık yoğunluk fonksiyonuna
sahiptir. Buna göre, X ve Y nin ortak olasılık yoğunluk fonksiyonu ile marjinal olasılık
yoğunluk fonksiyonları,
1
f X ,Y ( x, y )  
0
, 0  x, y  1
,
d . y.
1
, f X ( x )  fY ( x )  
0
, 0  x 1
,
d . y.
olarak yazılabilir. DZ  [0,1] olup aşağıdaki grafik bilgileri de dikkate alındığında Z nin
dağılım fonksiyonu, z  0 için FZ ( z )  0 , z  1 için FZ ( z )  1 ve 0  z  1 için
FZ ( z )  P( Z  z )  1  (1  z ) 2 şeklinde yazılır (Şekil (3.2.3)). Dağılım fonksiyonunun
türevinden olasılık yoğunluk fonksiyonu,
 2(1  z ) , 0  z  1
fZ ( z)  
,
d . y.
0
olarak bulunur.
Şekil 3.2.2 Örnek (3.2.3a) da aranan olasılık (alan)
Buradan, Z nin moment çıkaran fonksiyonu,
M Z (t )  E (et Z ) 
1

z 0
et z f Z ( z ) dz 
1

z 0
et z 2(1  z ) dz 
2
t
2
(et  t  1)
şeklinde hesaplanmıştır.
Moment çıkaran fonksiyonunun sıfır noktası komşuluğundaki Taylor serisi açılımı,
RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ
M Z (t )  E (et Z ) 

tn
t2
131
t3
tn
 n! E (Z n )  1  t E ( Z )  2! E (Z 2 )  3! E ( Z 3 )  ...  n! E (Z n )  ...
n 0
2
olup M Z (t )  E (et Z )  (et  t  1) olduğundan, bu fonksiyonun Taylor serisi açılımı,
t2
 2

2 t
2   tn
t 2 t3
tn
(
e

t

1)


t

1


1

t

1

t



...


..





 t2 
2!
3!
n
!
t2
t 2  n 0 n !





2  t2 t3
tn
t 2t 2 2t 3 2t 4
2t n


...


..

1





...

 ...


n ! 
3 4! 5!
6!
(n  2)!
t 2  2! 3!
şeklinde yazılabilir. Buradan,
t2
t3
tn
2
3
M Z (t )  1  t E ( Z )  E ( Z )  E ( Z )  ...  E ( Z n )  ...
2!
3!
n!
ve
t 2t 2 2t 3 2t 4
2t n
M Z (t )  2 (e  t  1)  1  


 ... 
...
3 4!
5!
6!
(n  2)!
t
2
t
eşitlikleri elde edilir. Buradaki polinomlarının katsayıları eşitlendiğinde,
E (Z ) 
2 1
 ,
3! 3
1
2
4 1
1
E(Z 2 )   E(Z 2 )   
2!
4!
4! 3! 2(3)
ve n  2 için diğer momentler
tn
2t n
2 n!
2
E (Z n ) 
 E (Z n ) 

n!
( n  2)!
(n  2)! (n  1)(n  2)
dir. Dolayısı ile, Z rasgele değişkeninin bütün momentleri
E(Z n ) 
2
(n  1)(n  2)
olarak hesaplanmış olur.
b) İki kişi saat 12:00 ile 13:00 arasında belli bir yerde görüşmek üzere anlaşıyorlar.
Görüşme yerine önce gelen a saat ( 0  a  1 ) bekleyecektir. Her ikisinin de anlaştıkları
yere varmaları birbirinden bağımsız olup (a) da verilen olasılık yoğunluk fonksiyonuna
sahiptir. Bu iki kişinin karşılaşma olasılıklarını ( p diyelim) bulalım. Ayrıca, p  0.84
olarak verildiğinde a yı (ne kadar bekleyeceğini) bulalım.
X ve Y kişilerin belirlenen yere gelme saatini göstersin. İki kişinin karşılaşabilmesi
için Z  | X  Y |  a olması gerekir. Buna göre, aranan olasılık (a) daki sonuçtan
132
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
p  P ( Z  a)  P | X  Y |  a   1  (1  a ) 2
dir. p  0.84 ise bekleme süresi 1  (1  a) 2  0.84 eşitliğinden a  0.6 saat veya a  36
dakika olarak bulunur. Yani, önce gelen kişi en fazla 36 dakika bekleyecektir.
c) Birim uzunluğundaki düzgün bir çubuk üzerinde rasgele bir nokta işaretleyelim (bu
nokta X olsun). Buna göre, elimizde uzunlukları X ve 1  X olan iki doğru parçası
vardır. Daha sonra, (0, X ) aralığından rasgele bir nokta (buna Y diyelim), ( X ,1)
aralığından da ikinci bir nokta (buna da Z diyelim) işaretleyelim. Y ve Z nin ortak olasılık
yoğunluk fonksiyonu ile U  Z  Y nin olasılık yoğunluk fonksiyonunu bulalım. Bu
noktalar aşağıda şematik olarak gösterilmiştir.
X in olasılık yoğunluk fonksiyonu ile X  x verildiğinde Y ve Z nin koşullu olasılık
yoğunluk fonksiyonları
1

fY | X  x ( y | x)   x
 0
1 , 0  x  1
f X ( x)  
d . y.
0 ,
 1

f Z | X  x ( z | x)  1  x
 0
,
0 yx
,
d . y.
, 0  x  z 1
,
d . y.
şeklindedir. Buradan, X , Y , Z nin ortak olasılık yoğunluk fonksiyonu,
f ( x, y , z )  f X ( x ) f Y | X  x ( y | x ) f Z | X  x ( z | x ) 
1
x(1  x)
 1
, 0  y  x  z 1

 f ( x, y, z )   x(1  x)
 0
,
d . y.

olarak bulunur. Y ve Z nin ortak olasılık yoğunluk fonksiyonu ise,
z

x y
1
dx 
x(1  x)
z

x y
integralinin sonucundan,
1
dx 
x
z

x y
1
dx  ln( x)
(1  x)
z
x y
 ln(1  x)
z
x y
 z (1  y ) 
 ln 

 y (1  z ) 
RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ
133
  z (1  y ) 
, 0  y  z 1
ln
fY ,Z ( y, z )    y (1  z ) 

0
,
d . y.

olarak elde edilir.
Şimdi, U  Z  Y rasgele değişkeninin olasılık yoğunluk fonksiyonunu bulalım. Önce,
0  u  z  1 ve
fU (u ) 

1
f ( z , y ) dz 
zDZ
 z (1  ( z  u )) 
ln 
 dz  2  u ln(u )  ((1  u ) ln(1  u ) 
( z  u ) (1  z ) 

z u

olduğundan, U rasgele değişkeninin olasılık yoğunluk fonksiyonu
2  u ln(u )  ((1  u ) ln(1  u )  , 0  u  1
fU (u )  
,
d . y.
 0
olarak bulunur 
Buraya kadar, X ve Y rasgele değişkenlerinin ortak olasılık veya olasılık yoğunluk
fonksiyonu verildiğinde,
g :  2   olmak üzere, g ( X , Y ) tek boyutlu rasgele
değişkeninin olasılık fonksiyonu elde edilmeye çalışıldı. Şimdi, X1, , X k rasgele
değişkenlerinin
ortak
olasılık
yoğunluk
fonksiyonu
verildiğinde,
i  1, 2,3,..., k ,
gi :  k   reel değerli fonksiyonları için
Y1  g 1 ( X1, , X k ) , Y 2  g 2 ( X1, , X k ) ,…, Y k  g k ( X1 , , X k )
rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonunu bulalım. Burada verilen
dönüşümlerden i  1, 2,3,..., k için X i lerin
X 1  h1 (Y1 , , Yk ) , X 2  h 2 (Y1, , Yk ) ,…, X k  h k (Y1 , , Yk )
şeklinde ters dönüşümlerinin bulunduğunu ve h i , i  1, 2,3,..., k fonksiyonlarının her bir
bileşenine göre türevlenebildiğini varsayalım. Buradan, Jacobien matrisi
134
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
  h1 (Y1, , Yk )

 Y1

  h (Y , , Y )
k
 2 1

 Y1

J 
.

.

.


  h k (Y1 , , Yk )

 Y1

 h1 (Y1 , , Yk )
 Y2
 h 2 (Y1, , Yk )
 Y2
.
.
.
 h k (Y1, , Yk )
 Y2
.
.
.
.
.
.
.
.
.
 h1 (Y1, , Yk ) 

 Yk

 h 2 (Y1 , , Yk ) 


 Yk

.


.

.


 h k (Y1, , Yk ) 

 Yk

olarak yazılır. X1, X 2,  , X k rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu
f ( x1 , , xk ) ise Y1, Y 2,  , Y k rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu,
| J | | det( J ) | olmak üzere, y 1, , y k  DY1,,Y k için
fY1,,Y k ( y1, , yk )  | J | f X 1 ,, X k (h1 ( y1, , yk ), h 2 ( y1, , yk ),..., h k ( y1, , yk ))
şeklindedir.
Örnek 3.2.4 a) X ve Y aynı dağılımlı bağımsız rasgele değişkenlerinin olasılık
yoğunluk fonksiyonu,
f ( x) 
2
1
e x /2 , x  
2
şeklinde verilmiş olsun. U  X  Y ve V  X  Y rasgele değişkenlerinin ortak olasılık
yoğunluk fonksiyonunu bulalım. Ters dönüşümler X  (U  V ) / 2 ve Y  (U  V ) / 2 olup
Jacobien matrisi ve determinantı,
 X
 U
J 
 Y
 U
 X  1
V   2
 
Y  1
V   2
1 
2 

1

2 
ve det( J )  
1
2
dir. X ve Y bağımsız olduğundan ortak olasılık yoğunluk fonksiyonu x, y   için,
f ( x, y )  f X ( x) fY ( y ) 
1  x 2 /2 1  y 2 /2
1  ( x 2  y 2 )/2
e
e

e
2
2
2
dir. Buradan U ve V nin ortak olasılık yoğunluk fonksiyonu, u , v   için
RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ
135
 1  u  v  2  u  v  2  
1 1
exp   


 2  2   2   
2 2



1
 1


exp    (u  v )2  (u  v) 2  


4
 8

1
1  (u 2  v 2 ) / 4
 1


exp    2u 2  2v 2   
e

4
4
 8
J f X ,Y  x(u, v), y (u , v)  
fU ,V (u, v) 
şekildedir. Ayrıca bu ortak olasılık yoğunluk fonksiyonu
fU ,V (u, v) 
1  (u 2 v 2 )/4
e

4
1 u 2 /4
e
4
1  v 2 /4
e
 fU (u ) fV (v)
4
şeklinde yazılabildiğinden, fU ,V (u , v)  fU (u ) fV (v ) eşitliği sağlanır. Yani, U ve V
rasgele değişkenleri bağımsızdır.
b) Şimdi de U  X / Y rasgele değişkeninin olasılık yoğunluk fonksiyonunu bulalım.
Bunun için, V  Y şeklinde bir yardımcı dönüşüm tanımlayalım. Buradan, U  X / Y
ve
V  Y rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu elde edildiğinde U nun
marjinal olasılık yoğunluk fonksiyonu bulunur. Ters dönüşümler X  U V ve Y  V olup
Jacobien matrisi ve determinantı,
 X
 U
J 
 Y
 U
X
V   v u 

 Y  0 1 
V 
ve det( J )  v
şeklindedir. Buna göre, U ve V nin ortak olasılık yoğunluk fonksiyonu u , v  DU ,V için
fU ,V (u , v)  | J | f X ,Y ( x(u , v), y (u, v)) 

|v|
 1

exp   [(uv )2  v 2 )] 
2
 2

 v2

|v|
exp   [u 2  1] 
 2

2


dir. Herhangi bir h( x) fonksiyonu çift ( h( x)  h( x) ) ise, a    için,
a
a
a
0
 h( x) dx  2 h( x) dx
136
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
dir. Buna göre, U ve V nin ortak olasılık yoğunluk fonksiyonu v ye göre çifttir. Ortak
olasılık yoğunluk fonksiyonunun DV üzerinden integrali ( a  u 2  1 diyelim),


fU (u ) 
fU ,V (u, v) dv 


1

e at dt ,
1
a
  at
 e




1
2
t
0


| v | e a v
2
/2
dv 

2
2

 ve
a v2 / 2
dv
0
v2
dönüşümü ile
2

1 1
 1



t 0  a 
 1 u2
olup U rasgele değişkeninin olasılık yoğunluk fonksiyonu,
fU (u ) 
1
1
 1  u2
, u
olarak bulunmuştur 
Örnek 3.2.5 a) X ve Y aynı dağılımlı bağımsız rasgele değişkenlerinin olasılık
yoğunluk fonksiyonu,
e x
f ( x)  
 0
olsun. U  X  Y
, x0
, d . y.
ve V  X / ( X  Y )
rasgele değişkenlerinin olasılık yoğunluk
fonksiyonlarını bulalım. Ters dönüşümler, X  U V ve Y  U (1  V ) olup Jacobien matrisi
ile determinantı,
 X
 U
J 
 Y
 U
X
u
V   v
 
 Y  (1  v) u 
V 
ve det( J )  uv  u (1  v)  u
dir. X ve Y bağımsız olduğundan ortak olasılık yoğunluk fonksiyonu,
e ( x y )
f ( x, y )  
 0
, x  0, y  0
,
d . y.
RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ
137
dır. U ve V nin ortak olasılık yoğunluk fonksiyonu ise 0  v  1 ve u  0 için,
 uv  (u (1 v ) 
fU ,V (u, v) | J | f X ,Y ( x(u, v), y (u , v)) | u | e 
 u eu
şeklindedir. Daha açık olarak ortak olasılık yoğunluk fonksiyonu,
u eu
fU ,V (u , v)  
 0
, 0  v  1, u  0
,
d . y.
dir. Bu ortak olasılık yoğunluk fonksiyonundan U ve V nin marjinal olasılık yoğunluk
fonksiyonları da,
1

1
fU ,V (u, v) dv 
v 0

u
u e dv  u e

u
ve
v 0


fU ,V (u, v) du 
u 0

u eu du  1
u 0
integrallerinin sonucundan
u eu
fU (u )  
 0
,
u 0
,
d . y.
olarak bulunmuştur. Ayrıca,
1 ,
fV (v)  
0 ,
0  v 1
d . y.
fU ,V (u , v)  fU (u ) fV (v ) olduğundan U ve V
rasgele
değişkenleri bağımsızdır (bu sonuç Teorem (7.4.2) den de elde edilebilirdi).
b) X , Y aynı dağılımlı bağımsız rasgele değişkenlerinin olasılık yoğunluk fonksiyonu,
1 , 0  x  1
f ( x )  fY ( x )  
d . y.
0 ,
olarak verildiğinde, U  X Y rasgele değişkeninin olasılık yoğunluk fonksiyonunu bulalım.
V  X yardımcı dönüşümü ile ters dönüşümler, X  V ve Y  U / V olup Jacobien matrisi
ile determinantı,
 X
 U
J 
 Y
 U
X
1 
0
V  
 1
u 
 2
Y  
v 
 v
V 
,
det( J )  
1
v
şeklinde hesaplanmıştır. Buradan, U ve V nin ortak olasılık yoğunluk fonksiyonu,
1
, 0  u  v 1

fU ,V (u , v)   v
 0 ,
d . y.
138
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
olup U nun marjinal olasılık yoğunluk fonksiyonu,

1
fU ,V (u, v) dv 
vDV

v u
dv
  ln(u )
v
den,
 ln(u ) , 0  u  1
fU (u )  
,
d . y.
 0
olarak bulunur.
c) X1, X 2 , X 3 rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu,
6 e  x1  x2  x3
f X1 , X 2 , X 3 ( x1, x2 , x3 )  
 0
, 0  x1  x2  x3  
,
d . y.
olarak verilmiş olsun. U1  X1 , U 2  X 2  X1 ve U 3  X 3  X 2 rasgele değişkenlerinin
ortak olasılık yoğunluk fonksiyonunu bulalım. Ters dönüşümler,
X1  U1
X 2  U1  U 2 , X 3  U1  U 2  U 2
olup Jacobien matrisi ve determinantı
  X1

 U1
 X2
J 
 U1
 X
3

 U1
 X1
U 2
 X2
U 2
 X3
U 2
 X1 

U 3 
1 0 0 
 X2  

  1 1 0 
U 3 
1 1 1 
 X3 

U 3 
,
det( J )  1
dir. Buradan, U1 , U 2 , U 3 rasgele değişkenlerinin ortak olasılık fonksiyonu,
6 e3u1 2u2 u3
fU1 ,U 2 ,U 3 (u1, u2 , u3 )  
 0
, ui  0 , i  1, 2,3
,
d . y.
şeklinde bulunmuş olur. Diğer taraftan, marjinaller hesaplandığında, X1, X 2 , X 3 rasgele
değişkenleri bağımsız olmamasına rağmen,
fU1,U 2 ,U 3 (u1, u2 , u3 )  fU1 (u1 ) fU 2 (u2 ) fU 3 (u3 )
eşitliği sağlandığından, U1 , U 2 , U 3 rasgele değişkenleri bağımsızdır 
RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ
139
3.3. Üretici Fonksiyonlar Tekniği
İkinci bölümde, bazı üretici fonksiyonlardan söz edildi. Bu fonksiyonlar genellikle
rasgele değişkenlerin momentlerinin hesaplanmasında kullanılmakla birlikte bazen rasgele
değişkenlerin dönüşümlerinin olasılık fonksiyonlarının bulunmasında da kullanılır.
Dönüşümün moment çıkaran fonksiyonu (varsa) bilinen bir dağılımın moment çıkaran
fonksiyona benzeyebilir.
X ve Y bağımsız rasgele değişkenler olmak üzere, U  X  Y rasgele değişkeninin
moment çıkaran fonksiyonu, X ve Y nin moment çıkaran fonksiyonlarının çarpımı olarak
yazılabildiğini ( MU (t )  M X Y (t )  M X (t ) M Y (t ) ) biliyoruz. Benzer şekilde, U nun
karekteristik fonksiyonu da  U (t )   X Y (t )   X (t )  Y (t ) dir. U nun moment çıkaran
fonksiyonu (veya karekteristik fonksiyonu) bazen olasılık fonksiyonuna ihtiyaç duyulmadan
bulunabilir. U nun moment çıkaran fonksiyonu (veya karekteristik fonksiyonu) bilinen bir
dağılımın (genellikle beşinci bölümde bahsedilecek dağılımlar) moment çıkaran fonksiyonu
ile aynı ise U nun olasılık veya olasılık yoğunluk fonksiyonu, o dağılımın olasılık veya
olasılık yoğunluk fonksiyonu olur. Var olması halinde genellikle moment çıkaran
fonksiyonu kullanılır. Moment çıkaran fonksiyonunun olmadığı hallerde karekteristik
fonksiyon kullanılabilir.
Örnek 3.3.1 a) X rasgele değişkeninin olasılık yoğunluk fonksiyonu,
f ( x) 
1
1
 1  x2
, x
olsun. Bu rasgele değişkenin moment çıkaran fonksiyonu yoktur, karekteristik fonksiyonu
ise t   için  X (t )  e  | t | dir (Örnek (2.6.5)). Bu olasılık yoğunluk fonksiyonuna sahip
bağımsız rasgele değişkenler X1, X 2 , , X n olsun. X i lerin örneklem ortalaması olarak
bilinen X n  ( X1    X n ) / n rasgele değişkenini tanımlayalım. Bu rasgele değişkenin
karekteristik fonksiyonu,
 X (t )  E (ei t X n )  E (ei t  X1  X n / n )
n
n
  E (e(i t / n ) X k )  [ X (t / n)]n  [e |t / n| ]n  e | t |   X (t )
k 1
140
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
olduğundan, X n ile X i rasgele değişkenlerinin karekteristik fonksiyonları aynıdır. O
halde, her ikisi de aynı olasılık yoğunluk fonksiyonuna sahiptir. Yani, X n nin olasılık
yoğunluk fonksiyonu,
f X ( y) 
n
1
1
, y
 1 y2
dir.
b) X rasgele değişkeninin olasılık yoğunluk fonksiyonu,
1

 1 e 2 x , x  0
f ( x)  
2 x3

0
, d . y.

olsun. X in karekteristik fonksiyonu (Maple VIII paket programı yardımı ile),
 X (t )  E (e
it X

)

0
 e
2 i t
1
2 x3
e

1
i t x
2x
dx

1
1
1
 
2 i t
2 i t


1

e
2 i t


  e

2 i t
e
 2 it

1
1 
2 i t




2 i t
olarak hesaplanmıştır. Bu olasılık yoğunluk fonksiyonuna sahip bağımsız rasgele
değişkenler X1, X 2 , , X n olmak üzere, X n  ( X1    X n ) / n örneklem ortalamasının
olasılık yoğunluk fonksiyonunu bulalım. X n nin karekteristik fonksiyonu
it X n
 X (t )  E (e
n
e
)  E (e
 n 2 it / n
it  X1  X n / n
n
)   E (e
(it / n) X k
k 1
e
 2 it / n
)  ( X (t / n))   e

n
2 i t / n



n
  X (t / n)
olup, X n ile X / n rasgele değişkeninin olasılık yoğunluk fonksiyonları aynıdır. Buradan,
X n nin olasılık yoğunluk fonksiyonu y  0 için
f X ( y )  n f X (n y ) 
n
veya daha açık olarak,
n
n 2 (ny )
3
e 1/(2 ny ) 
1
2 n y
3
e  1/(2 ny )
RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ
1


1
2n y

e
f X ( y)  
3
2 n y
n

0

,
y0
,
d . y.
141
şeklindedir 
Bir X
rasgele değişkeninin moment çıkaran fonksiyonu M X (t ) , karekteristik
fonksiyonu da  X (t ) olsun. Y  a X  b rasgele değişkeninin moment çıkaran fonksiyonu,
M Y (t )  M b a X (t )  E (e(b a X ) t )  ebt E (e at X )  ebt M X (a t )
ve karekteristik fonksiyonu da,
Y (t )   ba X (t )  E (ei (b a X ) t )  eibt E (ei at X )  eibt X (a t )
şeklindedir.
Örnek 3.3.2 a) X ve Y aynı olasılık fonksiyonuna sahip bağımsız rasgele değişkenler
olsun. Olasılık fonksiyonu   0 için
P( X  x)  e   x / x ! , x  0,1, 2,...
olarak verildiğinde, U  X  Y rasgele değişkeninin olasılık fonksiyonunu bulalım.
t
X in moment çıkaran fonksiyonunun M X (t )  e (e 1) (Örnek (2.5.3a)) olduğunu
biliyoruz. Buradan, U rasgele değişkeninin moment çıkaran fonksiyonu,
t
t
t
MU (t )  M X Y (t )  M X (t ) M Y (t )  (e (e 1) )(e (e 1) )  e2 ( e 1)
olup, X in moment çıkaran fonksiyonunda  yerine 2 gelmiştir. Buradan, U nun
olasılık fonksiyonu X in olasılık fonksiyonunda  yerine 2 yazılması ile elde edilir.
Yani, U nun olasılık fonksiyonu,
P(U  u )  e2 (2 )u / u ! , u  0,1, 2,...
dir (Örnek (3.2.2) ile karşılaştırınız).
b) 0  p  1 ve q  1  p olmak üzere bağımsız X ve Y rasgele değişkenlerinin
olasılık fonksiyonları,
142
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
P( X  x)  P(Y  x)  p x q1 x , x  0,1
olarak verilmiş olsun. Dolayısı ile, X ve Y nin moment çıkaran fonksiyonları da aynıdır.
X in moment çıkaran fonksiyonu,
1
M X (t )  E (et X )   et x P( X  x)  q  p et
x 0
olup U  X  Y rasgele değişkeninin moment çıkaran fonksiyonu da,
MU (t )  M X Y (t )  M X (t ) M Y (t )  (q  p et )(q  p et )  (q  p et ) 2
dir. Olasılık fonksiyonu,
2
P( Z  x)    p x q 2 x , x  0,1, 2
 x
olan bir Z rasgele değişkenin moment çıkaran fonksiyonu (beşinci bölümde bahsedilecek
olan özel dağılımlardan biridir)
2
2 2
2
M Z (t )  E (et Z )   et x   p x q 2 x     ( pet ) x q 2 x (q  pet )2
 x
x 0
x 0  x 
dir. Buradan, U  X  Y rasgele değişkeninin moment çıkaran fonksiyonu ile Z nin
moment çıkaran fonksiyonu aynıdır. O halde, U nın olasılık fonksiyonu
2
P(U  u )    pu q 2u , u  0,1, 2
u 
dir.
c) Bağımsız X
ve Y
rasgele değişkenlerinin olasılık yoğunluk fonksiyonları
 x ,  y   ve  x  0 ,  y  0 için,
f X ( x) 
 1

exp   2 ( x   x )2  , x  
 2

2  x2
x


fY ( y ) 
 1

exp   2 ( y   y )2  , y  
 2 y

2  2y


1
1
olarak verilmiş olsun. Bu rasgele değişkenlerin moment çıkaran fonksiyonları,
RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ
143


t 2 y2 
t 2 x2 


M X (t )  exp  t  x 
ve
M Y (t )  exp t  y 





2
2




olup U  X  Y nin moment çıkaran fonksiyonu    x   y ve  2   x2   y2 olmak
üzere,


t 2 x2 
t 2 x2 
MU (t )  M X Y (t )  M X (t ) M Y (t )  exp  t  x 
exp
t



 x



2 
2 




t 2 ( x2   x2 ) 
t 2 2 
 exp  t (  x   y ) 
  exp  t  




2
2




dir. Buna göre, U nun moment çıkaran fonksiyonu ile, X in moment çıkaran fonksiyonu
aynı yapıdadır (  x yerine  ,  x2 yerine  2 gelmiştir). Buna göre, U nun olasılık
yoğunluk fonksiyonu,
fU (u ) 
 1

exp   2 (u   ) 2  , u  
2
 2

2 
1
şeklinde yazılabilir. Benzer şekilde, V  X  Y rasgele değişkeninin moment çıkaran
fonksiyonu da,

 
 

MV (t )  M X Y (t )  E et ( X Y )  E et X ) E et Y )  M X (t ) M Y (t )


t 2 y2 
t 2 x2 

 exp  t  x 
 exp  t  y 




2
2






t 2 ( x2   x2 ) 
t 2 2 
 exp  t (  x   y ) 
  exp  t  




2
2




olup olasılık yoğunluk fonksiyonu,    x   y ve  2   x2   y2 olmak üzere,
fV (v) 
şeklindedir 
1


exp   2 (v   ) 2  , v  
 2

2  2
1
144
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
3.4. Çözümlü Problemler
3.4.1 Bağımsız aynı dağılımlı X1 ve X 2 rasgele değişkenlerinin olasılık yoğunluk
fonksiyonu
1/ 
f ( x)  
 0
, 0  x 
,
d . y.
olmak üzere Y1  min( X1, X 2 ) ve Y2  max( X1, X 2 ) rasgele değişkenlerini tanımlayalım.
E (Y1 ) , E (Y 2 ) ve E (Y1 / Y 2 ) değerlerini hesaplayınız.
Çözüm: Y1 ve Y 2 rasgele değişkenlerinin marjinal olasılık yoğunluk fonksiyonları,
2 
y1 
 2 y2
 2
 1   , 0  y1  
fY1 ( y1 )   
,
f
(
y
)

 

Y2 2

 0
0
,
d . y.


ve Y1 ve Y 2 nin ortak olasılık yoğunluk fonksiyonu da
, 0  y2  
,
d . y.
2   2 , 0  y1  y2  
fY1 ,Y2 ( y1 , y2 )  
,
d . y.
 0
dir (Casella ve Berger, 2002, sayfa 230). Marjinal olasılık yoğunluk fonksiyonlarından
beklenen değerler E (Y1 )   / 3 ve E (Y 2 )  (2  ) / 3 olarak hesaplanmıştır. U  Y1 / Y 2
rasgele değişkeninin olasılık yoğunluk fonksiyonu için V  Y2 yardımcı dönüşümünü
tanımlayalım. Ters dönüşümler Y1  UV ve Y2  V olup Jacobien matrisi ve determinantı
  Y1
 U
J 
  Y2
 U
 Y1 
V   v u 
,

 Y2   0 1 
V 
det( J )  v
şeklinde hesaplanmıştır. U ve V nin sınırları, 0  u  1 ve 0  v   olup ortak olasılık
yoğunluk fonksiyonu,
2 v  2 , 0  u  1, 0  v  
fU ,V (u , v)  
,
d . y.
 0
dir. Ortak olasılık yoğunluk fonksiyonunun V nin değer kümesi üzerinden integrali


v 0

fU ,V (u, v) dv 

2 v 2 dv  1
v 0
olduğundan U nun marjinal olasılık yoğunluk fonksiyonu,
RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ
145
1 , 0  u  1
fU (u )  
d . y.
0 ,
olup, E (U )  1/ 2 dır. Ayrıca, E (Y1 )   / 3 ve E (Y 2 )  (2 ) / 3 olduğundan,
E (Y1 )
E (Y 2 )

 /3 1
  E (U )  E (Y1 / Y 2 )
2 / 3 2
elde edilir. Genel olarak E (Y1 ) / E (Y 2 )  E (Y1 / Y 2 ) dir.
3.4.2
X1, , X n bağımsız aynı olasılık yoğunluk fonksiyonuna sahip rasgele
değişkenler olsun. i  1, 2,3,..., n için X i lerin olasılık yoğunluk fonksiyonu
 ek
f X k ( xk )   k
0

x
, x0
,
d . y.
olarak verildiğinde Y  min( X1, , X n ) olmak üzere P (Y  X k ) olasılığını hasaplayınız.
Çözüm: Önce, Y nin olasılık yoğunluk fonksiyonunu bulalım. Y nin dağılım
fonksiyonu,    1   2  ...   n olmak üzere,
FY ( y )  P(Y  y )  P(min{ X1 , X 2 ,..., X n }  y )  1  P (min{ X1 , X 2 ,..., X n }  y )

n
n 
1  P  X1  y, X 2  y,..., X n  y   1   P( X i  y )  1     i ei x dx 

i 1
i 1  y

n 
n


(  ... n ) y
1    ei x
 1   ei y  1  e 1 2
 1  e  y

x

y

i 1 
i 1
olup, olasılık yoğunluk fonksiyonu,
 e y
fY ( y )  
 0
,
y0
,
d . y.
olarak elde edilmiştir. Buradan da P (Y  X k ) olasılığı da,
P  Y  X k   P( X1  X k , X 2  X k ,..., X k 1  X k , X k 1  X k ,..., X n  X k )

  P( X1  X k , X 2  X k ,..., X k 1  X k , X k 1  X k ,..X n  X k | X k  t ) f X k (t )dt
0

  P( X1  t , X 2  t ,..., X k 1  t , X k 1  t ,..X n  t ) f X k (t )dt
0
146
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
 n
 n



 t
    ei t   k e k dt   k    ei t  dt   k  e(1 2 ...n ) t dt



0  i 1, i k
0  i 1
0


k
 (1 2 ...n ) t
e
(1  2  ...   n ) 
k



t 0  (1  2  ...   n )

olarak bulunmuştur.
3.4.3 Beklenen değeri  , varyansı  2 olan bağımsız aynı dağılımlı rasgele
değişkenlerin dizisi { X n , n  } olsun. Ayrıca, X i rasgele değişkenlerinden bağımsız,
negatif değerler almayan sonlu beklenen değer ve varyansa sahip kesikli bir rasgele
değişken de N olsun. S0  0 ve S n  X1  X 2    X n olacak şekilde S N rasgele
2
değişkenini tanımlayalım. E ( S N ) , E ( S N
) ve Var ( S N ) değerlerini hesaplayınız.
Çözüm: Önce, E ( S N ) değerini hesaplayalım. N  n verildiğinde,
E ( S n )  E ( X1  X 2    X n )  n 
olduğundan E ( S N ) beklenen değeri



n1
n 1
n 1
E ( S N )   E  S N | N  n  P ( N  n)   E  Sn  P ( N  n)    n P ( N  n)   E ( N )
olarak bulunur. Benzer şekilde N  n verildiğinde, Var ( Sn ) ve E ( S n2 ) değerleri de
Var ( Sn )  Var ( X1  X 2    X n )  n  2 ve E ( Sn2 )  Var ( S n )  ( E ( S n )) 2
2
olup, E ( S N
) beklenen değeri




 
E ( S N2 )   E S N2 | N  n P( N  n)   E S n2 P( N  n)
n1


n1
n1




  Var ( Sn )  ( E ( Sn ))2 P( N  n)   n  2  n 2  2 P ( N  n)


n 1
n1
n 1
  2  n P ( N  n)   2  n2 P ( N  n)   2 E ( N )   2 E ( N 2 )
şeklinde bulunmuştur. Son olarak varyansın tanımından,
Var ( S N )  E ( S N2 )  ( E ( S N )) 2   2 E ( N )   2 E ( N 2 )   2 ( E ( N ))2
  2 E ( N )   2 [ E ( N 2 )  ( E ( N ))2 ]   2 E ( N )   2 Var ( N )
RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ
147
elde edilir.
3.4.4 X ve Y nin ortak olasılık yoğunluk fonksiyonu, 0    1 için
f ( x, y ) 


1
 x 2  y 2  2  x y   , x, y  
exp  
2 


2 1   2
 2(1   )

1
şeklinde verilmiş olsun.
a) U  X   Y ve V  Y nin ortak olasılık yoğunluk fonksiyonunu bulunuz.
b) U  X  Y ve V  X  Y nin ortak olasılık yoğunluk fonksiyonunu bulunuz.
Çözüm: a) Ters dönüşümler X  U   V
ve Y  V olup Jacobien matrisi ve
determinantı,
 X1 
V  1  

 Y  0 1 
V 
 X
 U
J 
 Y
 U
ve det( J )  1
şeklinde hesaplanmıştır. Buradan U ve V nin ortak olasılık yoğunluk fonksiyonu,
fU ,V (u , v) 




1 
exp 
(u   v)2  v 2  2  (u   v)v  
2




2 1   2
 2(1   )

1


1  2
exp 
u  v 2 (1   2 )  
 2(1   2 ) 

2 1   2


1
 u 2  1
 v 2 
exp 
exp


  f (u ) fV (v)
 2(1   2 )  2
 2  U
2 (1   2 )




1
dir. Görüldüğü gibi, U ve V bağımsız rasgele değişkenlerdir.
b) Ters dönüşümler X  (U  V ) / 2 ve Y  (U  V ) / 2 olup Jacobien matrisi ve
determinantı
 X
 U
J 
 Y
 U
 X  1
V   2
 
Y  1
V   2
1 
2 

1
 
2 
ve det( J )  
1
2
dir. Buradan, U ve V nin ortak olasılık yoğunluk fonksiyonu
148
MATEMATİKSEL İSTATİSTİĞE GİRİŞ

 u  v  2  u  v  2
1
 u  v  u  v   

fU ,V (u, v) 
exp 

 2 



 2(1   2 )  2   2 
2  2   

4 1   2





1
1
 (u  v) 2  (u  v )2  2  (u  v)(u  v)  

exp  
2 


4 1   2
 8(1   )

1



1
u 2 (1   2 )  v 2 (1   2 )  
exp  
2



4 1   2
 4(1   )

1
olarak bulunur. Ayrıca, fU ,V (u , v)  fU (u ) fV (v ) olması için gerek ve yeter koşul   0
olmasıdır.
3.4.5 Bağımsız X1 ve X 2 rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu,
1 , 0  x1  1 , 0  x2  1
f ( x1, x2 )  
d . y.
0 ,
olarak verilsin. Y1  (2 ln( X1 ))1/2 cos(2 X 2 ) ve Y2  (2 ln( X1 ))1/2 sin(2 X 2 ) rasgele
değişkenlerinin ortak olasılık yoğunluk fonksiyonunu bulunuz.
Çözüm: Ters dönüşümler,
2
Y12  Y22  2 ln( X1 )  X1  e (Y1
Y22 ) / 2
ve
Y 
Y1
1
 tan(2 X 2 )  X 2 
arctg  1 
Y2
2
 Y2 
olup kısmi türevler,
2
2
2
2
 X1
 X1
 Y1 e (Y1 Y2 )/2 ,
 Y2 e  (Y1 Y2 )/2
Y1
Y2
Y1
 X2
1
Y2
 X2
1

,

Y1
2 Y12  Y22
Y 2 2 Y12  Y22
şeklindedir. Buradan Jacobien matrisi ve determinantı ise
 Y e (Y12 Y22 )/2
 1
J  1
Y2
  2 2
Y1  Y22

2
Y2 e(Y1
Y22 )/2 


Y1
1
2 Y12  Y22 
, det( J )  
olup Y1 ve Y 2 nin ortak olasılık yoğunluk fonksiyonu,
1 (Y12 Y22 )/2
e
2
RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ
fY1 ,Y2 ( y1, y2 ) 
149
1  ( y12  y22 )/2
e
, y1, y2  
2
olarak elde edilmiştir. Ayrıca, her y1 , y2   için
1
fY1 ,Y2 ( y1, y2 ) 
2
1  2 y1
e
2
1
2
1  2 y2
e
 fY1 ( y1 ) fY2 ( y2 )
2
olduğundan Y1 ve Y 2 bağımsızdır. Bu dönüşümler (literatürde Box-Müller metodu olarak
bilinir) normal dağılımdan veri üretmek için kullanılmaktadır. Monte-Carlo yöntemi
tamamen bu dönüşüme dayanır.
3.4.6 X1, , X n bağımsız aynı dağılıma sahip rasgele değişkenleri
(1/  ) e x / 
f ( x)  
0

, x0
,
d . y.
olasılık yoğunluk fonksiyonuna sahip olsun.
Y1  min{ X1 , , X n } , Y 2  İkinci en küçük{ X1, , X n } ,
Y 3  Üçüncü en küçük{ X1, , X n } … Y n  max{ X1, , X n }
olmak üzere, Y i ve Y j rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu, y i  y j
için
fYi ,Y j ( yi , y j ) 
n!
i 1
f X ( yi ) f X ( y j )  F ( yi ) 
(i  1)!( j  i  1)!(n  j )!
*[ F ( y j )  F ( yi )] j i 1[1  F ( y j )] n j
ve Y1, Y2  , Yn rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu da,
 n
n ! f ( y ) ,
fY1,,Yn ( y1, , yn )   i 1 X i i

0
,

şeklindedir. Buna göre,
y1  y2    yn
d . y.
a) R  Y n  Y1 rasgele değişkeninin olasılık yoğunluk fonksiyonunu bulunuz.
b) U1  Y1 , U 2  Y2  Y1, U 3  Y3  Y2 , ..., U n  Y n  Y n1 rasgele değişkenlerinin
ortak olasılık yoğunluk fonksiyonunu bulunuz.
150
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
Çözüm: a) X in dağılım fonksiyonu, x  0 için F ( x)  1  e x /  olup Y 1 ve Y n
rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu (Teorem 6.4.1),
fY1 ,Yn ( y1, yn ) 
n!
f X ( y1 ) f X ( yn )[ F ( yn )  F ( y1 )] n 2 , y1  yn
(n  1  1)!
şeklinde yazılır. Daha açık olarak, Y1 ve Y n rasgele değişkenlerinin ortak olasılık yoğunluk
fonksiyonu y1  yn için,
fY1 ,Yn ( y1, yn )  n(n  1) f X ( y1 ) f X ( yn )[ F ( yn )  F ( y1 )] n2
 n(n  1)  2e ( y1  yn )/  [(1  e  yn /  )  (1  e  y1 /  )]n 2
 n(n  1)  2e ( y1  yn )/  [e y1 /   e  yn /  ]n2
şeklindedir. Buradan, R nin olasılık yoğunluk fonksiyonu r  0 için,

f R (r )  n(n  1)
n2
  F (u  r )  F (u)
f (u ) f (u  r ) du


 n(n  1)  eu /   e (u  r ) /  


n2
 2e u /  e (u  r ) /  du
0
1  e  r /  


n2
 n(n  1) e  r /  1  e  r /  


n2
 n(n  1) e
r /

2

e
( n 2)u /  2u / 
e
du
0

 2  e  nu /  du  (n  1)  1 e r /  [1  e r /  ]n2
0
integralinin sonucundan,
n2

(n  1)  1 e  r /  1  e  r /  


f R (r )  

0
, r0
,
d . y.
şeklinde bulunmuştur.
b) Ters dönüşümler,
Y1  U1 , Y2  U1  U 2 , Y3  U1  U 2  U 3 , ..., Yn  U1  U 2  ...  U n
şeklinde olup Jacobien matrisi ve determinantı,
RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ
1
1

1
J 
.
.

1
0
1
1
.
.
0
0
1
.
.
.
.
.
.
.
1
1
1 1
151
0
0 
.
 ve det( J )  1
.
.

1
.
.
.
.
.
dir. Dolayısı ile, U i , i  1, 2,3,..., n rasgele değişkenlerinin ortak olasılık yoğunluk
fonksiyonu,
n
fU 1 ,,U n (u1,, u n )  n! f Xi ( yi (u1,, u n ))  n! f X (u1) f X (u1  u 2 )... f X (u1  u 2  ...  u n )
i1
 n!
1

n
nu1/ (n1) u 2 / (n2) u 3 /
e
e
e
u n /
... e
n nu / (n 1) (n1) u 2 / (n  2) (n2) u 3 / 1 u n /
 e 1
e
e
... e




 fU1 (u1) fU2 (u 2 ) fU3 (u 3 )... fUn (u n )
şeklindedir. Burada,
 (n  k  1) ( nk 1) u / 
e

f U k (u )  


0
, u0
,
d . y.
olup, U 1, ,U n rasgele değişkenleri bağımsızdır.
3.4.7 X ve Y rasgele değişkenlerinin ortak dağılım fonksiyonu,
0


x2 y
1
F ( x, y )   min( x, y ) 
2
2
1


olarak verilmiş olsun.
,
x, y  0
, 0  x, y  1
,
x, y  1
a) X ve Y nin marjinal olasılık yoğunluk fonksiyonlarını bulunuz
b) P (Y  1 / 2 | X  1 / 2) koşullu olasılığını hesaplayınız.
c) Z  min{ X , Y } rasgele değişkeninin olasılık yoğunluk fonksiyonunu bulunuz.
Çözüm: a) X ve Y rasgele değişkenlerinin marjinal dağılım fonksiyonları sırası ile,
152
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
1
1
FX ( x)  lim FX ,Y ( x, y )  ( x  x 2 ) , FY ( y )  lim FX ,Y ( x, y )  ( y  y )  y
2
2
y 
x 
olup marjinal olasılık yoğunluk fonksiyonları da,
 x  (1/ 2) , 0  x  1
f X ( x)  
,
0
,
d . y.

1 , 0  y  1
fY ( y )  
d . y.
0 ,
dir.
b) P (Y  1 / 2 | X  1 / 2) olasılığı X in marjinal olasılık yoğunluk fonksiyonundan,
P(Y  1/ 2 , X  1/ 2) P(Y  1/ 2 )  P(Y  1/ 2, X  1/ 2)

P( X  1 / 2)
1  P( X  1/ 2)
3
1 1 1 (1/ 4) (1 / 2) 1 1 1
 


3
2
 2 22
 2 4 16  16   0.3
3
5
10
1 11
1
1   
8
8
2 42
P(Y  1/ 2 | X  1/ 2) 
şeklinde hesaplanmıştır.
c) Z  min( X , Y ) rasgele değişkeninin değer kümesi, DZ  [0,1] olup, dağılım
fonksiyonu z  0 için FZ ( z )  0 ve z  1 için FZ ( z )  1 olduğu açıktır. Ayrıca, 0  z  1
için dağılım fonksiyonunun değeri de
FZ ( z )  P( Z  z )  P(min( X , Y )  z )  P ( X  z veya Y  z )
 P( X  z )  P( X  z )  P( X  z, Y  z )
 z  z2 
 z  z3  1

 z 
 z 2  z 1  z 
 2     2  2 




olduğundan Z nin dağılım fonksiyonu ve türevinden olasılık yoğunluk fonksiyonu
,
z0
 0
1

FZ ( z )   z (2  z )(1  z ) , 0  z  1 ,
2
,
z0
 1

2 z (2  z )
1  z 
fZ ( z)  
2

0
, 0  z 1
,
d . y.
şeklindedir.
3.4.8 Bağımsız X ve Y sürekli rasgele değişkenlerinin dağılım fonksiyonu F ( x) ,
olasılık yoğunluk fonksiyonu f ( x) olsun.
a) P ( X  Y ) olasılığını hesaplayınız.
RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ
153
b) X ve Y rasgele değişkenlerinin olasılık yoğunluk fonksiyonları sırası ile,
1
1
, 0 xa
, 0 xb


f X ( x)   a
fY ( y )   b
 0 ,
 0 ,
d . y.
d . y.
şeklinde verildiğinde P ( X  Y ) olasılığını hesaplayınız.
c) b  a ise Z  X  Y rasgele değişkeninin olasılık yoğunluk fonksiyonunu bulunuz.
Çözüm: a) Bu olasılık doğrudan,






P ( X  Y )   P ( X  Y | Y  y ) f ( y ) dy   P ( X  y ) f ( y ) dy   (1  F ( y )) f ( y ) dy
2 

 1   F ( y ) f ( y ) dy  1 

 F ( y)
 1
2
y 
1
1

2
2
şeklinde bulunmuştur. Rasgele değişkenlerinin dağılım fonksiyonları farklı ise,

P( X  Y ) 


P( X  Y |Y  y) fY ( y) dy 







P( X  y) fY ( y) dy

 (1  FX ( y)) fY ( y) dy  1  
1 1
FX ( y) fY ( y) dy  1  EY  FX (Y )   1  
2 2
olup P ( X  Y ) olasılığı her iki durumda da aynıdır. Y sürekli rasgele değişken ise,
U  FX (Y ) rasgele değişkeninin olasılık yoğunluk fonksiyonu,
1 , 0  u  1
fU (u )  
d . y.
0 ,
olup E (U )  1/ 2 dır (Örnek 3.1.4).
b) a  b ise (b, a ) aralığında, fY ( y )  0 olup, a  b için P ( X  Y ) olasılığı
b
b
b
1
b
 y1
P( X  Y )  1   FX ( y ) fY ( y ) dy  1     dy  1   y dy  1 
ab
2a
ab
0
0
0
dir. Şimdi, a  b olsun. Bu durumda (a, b) aralığında FX ( x)  1 olup, a  b için
154
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
b
a
b
 y1
 y1
P( X  Y )  1   FX ( y ) fY ( y ) dy  1     dy  1     dy   1. fY ( y ) dy
0
0 a  b
0 a  b
a
 1
b
1 a
1b
a
y
dy

dy 


ab 0
ba
2b
dir.
c) b  a ise bağımsız X ve Y değişkenlerinin ortak olasılık yoğunluk fonksiyonu,
1

f X ,Y ( x, y )   a 2
0

, 0  x, y  a
,
d . y.
şeklindedir. Buradan, DZ  [ a, a ] olup Z nin dağılım fonksiyonu z  a için FZ ( z )  0
ve z  a için FZ ( z )  1 dir. Ayrıca, FZ ( z )  P ( Z  z )  P ( X  Y  z ) olup iki durum ayrı
ayrı incelenmelidir.  a  z  0 için FZ ( z ) değeri (şekildeki taralı alan)
a y z
FZ ( z )  P( Z  z )  P( X  Y  z )   
z 0
1
a2
dx dy 
1
a
(a  z ) 2
a2
z
2 a2
 ( y  z ) dy 
olur.
Şekil 3.4.1 Problem (3.4.8) için fonksiyonun tanım bölgeleri
0  z  a aralığında dağılım fonksiyonunun değeri için Şekil (3.4.1) de gösterilen Ai
bölgelerinin alanlarının bulunması gerekir. Şekilden de görüldüğü gibi, dağılım fonksiyonu
aşağıda belirtilen alanların toplamıdır. Yani,
FZ ( z )  P( Z  z )  P( X  Y  z )  ( A1  A2  A3 ) / a 2
dir. Şekildeki bölgelerin alanları ( A1 , A2 ve A3 bölgeleri)
Alan( A1 )  a 2 / 2 , Alan( A 2 )  z 2 / 2 ve Alan( A3 ) 
1
z 2(a  z )2  z (a  z )
2
olarak hesaplanmıştır.
FZ ( z )  ( A1  A2  A3 ) / a 2 olasılığından FZ ( z ) nin değeri 0  z  a için,
RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ
155
FZ ( z )  P ( Z  z )  P ( X  Y  z )  ( A1  A2  A3 ) / a 2 
1
a
2
 (a2 / 2)  ( z 2 / 2)  z(a  z) 
1  a  z  2 z (a  z ) 
(a  z )  2 z

 
2
2
a 
2 a2

dir. İki sonuç birleştirildiğinde, Z nin dağılım fonksiyonu ve olasılık yoğunluk fonksiyonu
2

2
2
0


2
 (a  z )

2a 2
FZ ( z )  
2
2
 (a  z )  2 z

2a 2

1

,
2
z  a
, a  z  0
,
,
0 za
,
za
 (a  z )
 2
 a
 (a  z )
fZ ( z)   2
 a


 0
,
a  z  0
,
0 za
,
d . y.
şeklinde elde edilmiştir.
3.4.9 X1, X 2 , , X n dağılım fonksiyonu F ( x) olan aynı dağılımlı bağımsız rasgele
değişkenler olsun.
1 ,
I ( Xi  t)  
0 ,
olmak üzere,
Xi  t
d . y.
n
Fˆn (t )   I ( X i  t )
i 1
şeklinde verilen Fˆn (t ) rasgele değişkeninin olasılık fonksiyonunu bulunuz.
Çözüm: Fˆn (t ) , değer kümesi {0,1, 2,3,..., n} olan kesikli bir rasgele değişkendir.
I ( X i  t ) ler sadece 0 ve 1 değerlerini alan bağımsız rasgele değişkenler olup,
P( I ( X i  t )  1)  P( X i  t )  F (t )
ve
P( I ( X i  t )  0)  P( X i  t )  1  P( X i  t )  1  F (t )
dir. p  F (t ) ve Y i  I ( X i  t ) denirse, Y i rasgele değişkenlerinin olasılık fonksiyonu,
P(Yi  y )  p y (1  p )1 y , y  0,1
156
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
şeklinde olup moment çıkaran fonksiyonu da q  1  p olmak üzere M Y (t )  q  p et dir.
n
n
i 1
i 1
Buradan, Yi ler bağımsız ve Fˆn (t )   I ( X i  t )   Y i olduğundan, Fˆn (t ) rasgele
değişkeninin moment çıkaran fonksiyonu,
M Fˆ
n
n
n
i 1
i 1
(t )  M Y1 Y 2 ...Y n (t )   M Yi (t )   (q  pet )  (q  pet )n
(t )
dir. Bu fonksiyon da olasılık fonksiyonu,
n
P( X  x)    p x q n x , x  0,1, 2,..., n
 x
olan bir X rasgele değişkeninin moment çıkaran fonksiyonudur. O halde, Fˆn (t ) nin
olasılık fonksiyonu ile, X in olasılık fonksiyonu aynıdır.
3.4.10 X1, X 2 , , X n olasılık fonksiyonu, 0  p  1 ve q  1  p için,
P( X  x)  p q x1 , x  1, 2,3,...
olan bağımsız aynı dağılıma sahip rasgele değişkenler olsun. U  X1  X 2    X r
rasgele değişkeninin olasılık fonksiyonunu bulunuz.
Çözüm: X i lerin moment çıkaran fonksiyonu q  e t için


x 1
x 1
M X (t )  E (et X )   et x P( X  x)   et x p q x 1 
p 
 ( q et ) x
q x 1
 p  qet 
 p 1
p 
p et
t x
   (q e )  1  
 1  

t
q  x 0
 q 1  qet  1  qet
 q 1  qe
olup X i ler bağımsız olduğundan, U nun moment çıkaran fonksiyonu da
r
MU (t )  E (etU )  E (et ( X1  X r ) )   M X i (t )  [ pet / (1  q et )]r
i 1
şeklindedir.
Şimdi herhangi bir Y rasgele değişkeninin olasılık fonksiyonu,
 y  r  1 r y
P(Y  y )  
 p q , y  0,1, 2,3,...
 r 1 
olarak verilsin. Bu olasılık fonksiyonu,
 y  1  r y r
P(Y  y )  
, y  r , r  1, r  2,...
p q
 r  1
RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ
157
olarak yazıldığında, Y nin moment çıkaran fonksiyonu,
 
M Y (t )  E et Y 
 p
 
q
r 

 et y P(Y  y) 
y r
 
 y 1
  r  1 qet

y r 
y


 y  1
t y  y  1  r y r
r
e
p
q

p
  r  1
 et y  r  1  q y r




y r
y r
 p
 
q
r
 qet

t
 1  qe
r
  p et
  
t
  1  qe



r
şeklinde olup, U rasgele değişkeninin moment çıkaran fonksiyonu ile aynıdır. Buradan,
U  X1  X 2    X r ile Y nin olasılık fonksiyonları aynıdır. Yani, U rasgele
değişkeninin olasılık fonksiyonu,
 u  1  r u r
, u  r , r  1, r  2,...
p q
 r  1
P(U  u )  
dır (bu olasılık fonksiyonu beşinci bölümde bahsedilecek olan özel dağılımlardan biridir).
BÖLÜM 4
EŞİTSİZLİKLER
Olasılık ve istatistikte eşitsizlikler önemli bir yer tutar. Bazen, olasılıkların ve rasgele
değişkenin momentlerinin hesaplanması güç olabilir. Böyle durumlarda, olasılık ve
momentler için bir alt veya üst sınır verilir. Bu bölümde, olasılık ve momentlere ilişkin bazı
eşitsizliklerden bahsedilecektir.
4.1. Markov ve Chebyshev Eşitsizlikleri
4.1.1. Markov Eşitsizliği
Teorem 4.1.1 (Markov Eşitsizliği) X bir rasgele değişken g de g :     şeklinde
tanımlı negatif değerler almayan bir fonksiyon olsun. Bu durumda, r    için
P  g(X )  r  
E  g( X )
r
dir.
İspat: X sürekli olsun (kesikli durumda integral yerine toplam gelir). X in olasılık
yoğunluk fonksiyonu f ( x) olmak üzere, g ( X ) in beklenen değeri doğrudan yazıldığında

E  g ( X )    g ( x) f ( x) dx 




g ( x) f ( x) dx 
{g ( x ) r}
g ( x) f ( x) dx  r
{ g ( x )  r}

g ( x) f ( x) dx
{ g ( x ) r }
f ( x) dx  r P ( g ( X )  r )

{g ( x ) r}
şeklinde bir eşitsizlik elde edilir. Burada, g ( x) negatif olmayan değerler aldığından,
g ( x)  r 

{ g ( x )r}
g ( x) f ( x) dx 
r

f ( x) dx
{ g ( x )  r}
dir. Buradan da, r    için E ( g ( X ))  r P( g ( X )  r ) şeklinde aranan eşitsizlik ispat
edilmiş olur 
160
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
4.1.2. Chebyshev Eşitsizliği
Markov eşitsizliğinin bir sonucu olan Chebyshev eşitsizliği olasılık ve istatistikte en çok
kullanılan eşitsizliklerden biridir. Herhangi bir X rasgele değişkeninin beklenen değeri  ,
varyansı  2 olsun. g fonksiyonunu g ( x)  ( x   ) 2 /  2 şeklinde tanımlayalım. Buna
göre, E ( g ( X ))  1 olup, Markov eşitsizliğinden
P (| X   | k  )  P (| X   |2  k 2  2 )  P(| X   |2 / 2  k 2 )
E ( g ( X )) 1
 P(( X   ) 2 /  2  k 2 )  P( g ( X )  k 2 ) 
 2
k2
k
2
elde edilir. Yani, beklenen değeri  , varyansı  olan bir X rasgele değişkeni için
P (| X   |  k  )  1/ k 2
eşitsizliği yazılır. Bu eşitsizlik bazen, P (| X   |  k  )  1  (1/ k 2 ) olarak da ifade edilir
ve literatürde Chebyshev eşitsizliği olarak bilinir. Chebyshev eşitsizliği genellikle olasılıklar
için bir alt veya üst sınır belirlemek için kullanılır.
Örnek 4.1.1 Düzgün bir paranın 10 defa atılması deneyi için X rasgele değişkeni
gelen turaların sayısı olsun. X in olasılık fonksiyonu,
10 x
x
10   1   1 
P ( X  x)       
 x  2   2 
, x  0,1, 2,...,10
olup E ( X )    5 , Var ( X )   2  2.5 dır. P (| X   |  k 2.5) olasılığı ise
P (| X   |  k 2.5 )  P(| X   |  k  )
 P (5  k 2.5  X  5  k 2.5 )  P(k1  X  k2 )
şeklinde yazılılabilir. Chebyshev sınırı 1  1/ k 2 olmak üzere, k nin bazı değerleri için bu
olasılıklar hesaplanarak aşağıda verilmiştir.
k
1
1.5
2
2.5
3
3.5
k1
k2
P (| X   | k 2.5)
Chebyshev Sınırı
3.42
2.63
1.84
1.05
0.26
0.53
6.58
7.37
8.16
8.95
9.74
10.53
0.656250
0.890625
0.978516
0.978516
0.998047
1.000000
0.000000
0.555556
0.750000
0.840000
0.888889
0.918367
EŞİTSİZLİKLER
161
Tablodaki olasılık değerlerinden k  2 durumu için P (| X   | k 2.5) olasılığı,

pP

 

X    k 2.5  P 5  2 2.5  X  5  2.5  P(1.84  X  8.16)
8
 P( X  x) 
x 2
10 x
x
8
10   1   1 
  x   2   2 
x 2  
 0.978515625  0.978516
dır. Diğer olasılıklar benzer şekilde hesaplanır 
Markov eşitsizliğinde rasgele değişkenin olasılık veya olasılık yoğunluk fonksiyonu ve
g fonksiyonunun özel seçimi ile birçok eşitsizlik üretilebilir. Örneğin, negatif değerler
almayan X in olasılık yoğunluk fonksiyonu f ( x) olsun. Ayrıca, E ( X k ) varsa,



0
a
a
E ( X k )   x k f ( x) dx   x k f ( x) dx  a k  f ( x) dx  a k P( X  a)
olup P ( X  a )  E ( X k ) / a k
eşitsizliği yazılır. Örneğin, X
in olasılık yoğunluk
fonksiyonu,
e  x
f ( x)  
 0
, x0
, d . y.
olarak verildiğinde, P( X  a ) olasılığı ile E ( X k ) değeri
P( X  a)  e
a
k
ve E ( X ) 

x
k
0

f ( x) d x   x k e x d x  (k  1)  k !
0
şeklindedir. Bu eşitsizlikte k  n  a alınırsa, e
n
 n ! / n n elde edilir. Bu eşitsizlik biraz
düzenlendiğinde, n !  n n e  n veya n !  (n / e) n şeklinde bir eşitsizlik de elde edilebilir.
 ,  , P 
bir olasılık uzayı ve  üzerinde tanımlı bir X rasgele değişkeninin her
w  için | X ( w) |  M   özelliğini (sınırlılık) sağladığını varsayalım. X in ikinci
momenti kullanılarak
E( X 2 )   x2 f ( x) dx 

 c2  M 2

 x c

 x  c
x2 f ( x) dx 
f ( x) dx,
 c 2  M 2 P( X  c)

 x c
x2 f ( x) dx  c2
 f ( x) dx  1


 x c
f ( x) dx 

 x c
x2 f ( x) dx
162
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
şeklinde bir eşitsizlik yazılabilir. Buradan da,
P ( X  c) 
E( X 2 )  c2
M2
eşitsizliği elde edilmiş olur.
4.2. Hölder, Minkowsky ve Jensen Eşitsizlikleri
Bu eşitsizliklere geçmeden önce, rasgele değişkenler için norm kavramını hatırlayalım.
Tanım 4.2.1. X bir rasgele değişken ve p    için E ( X p ) varsa, X in p. normu,
X
  | x | p f ( x) dx 
p  

1/ p
dir 
X ve Y herhangi iki rasgele değişken ve p  1 için E (| X | p )   ve E (| Y | p )  
olsun. Kolayca görüleceği gibi (basit aritmetik işlemlerden sonra),
| X  Y | p  (| X | p  | Y | p )  (2 max{| X |,| Y |}) p  2 p (| X | p  | Y | p )
dir (Balcı, 2000, sayfa 93). E (| X | p )   ve E (| Y | p )   ise E (| X  Y | p )   dir.
 :     sürekli ve artan  fonksiyonu  (0)  0 ve lim  ( x)   özelliklerine
x
x
x
0
0
sahip olsun.  1   olmak üzere,  ( x)    (u) d u ve  ( x)   (u) d u diyelim.
Şekil 4.2.1
a b  (a)   (b) eşitsizliğinin görsel ifadesi
EŞİTSİZLİKLER
163
Grafiklerden de görüldüğü gibi, a b  (a )   (b) dir (Balcı, 2000). b   (a ) için
eşitlik sağlanır. Grafiksel olarak da desteklenen bu bağıntı kullanılarak aşağıdaki eşitsizliği
yazabiliriz.
4.2.1. Yardımcı Eşitsizlik
Teorem 4.2.1 a, b    ve p, q    ve (1/ p )  (1/ q )  1 olmak üzere,
a p bq

 ab
p
q
dir.
İspat Değişik ispat teknikleri olmakla birlikte, bu eşitsizliğin ispatını iki farklı şekilde
 (u )  u p 1 denirse  (u )  u1/ ( p 1)
yapacağız.
olur. Ayrıca,
(1/ p)  (1/ q)  1
olduğundan q  p / ( p  1) olup fonksiyondaki integral değerleri
a
a
0
0
 (a)    (u ) d u   u
p 1
ap
du
p
b
1/( p 1)
ve  (b)   u
0
u p /( p 1)
du 
p / ( p  1)
b
u 0
bq

q
şeklinde hesaplanır. Bu değerler a b  (a)   (b) eşitsizliğinde yerine konursa,
a p bq

 ab
p
q
eşitsizliği elde edilir. b   (a) için (yani b  u p 1 ) eşitlik sağlanır. İkinci ispat için,
a p bq
g (a) 

 ab
p
q
fonksiyonunu tanımlayalım. g (a)  0 ise ispat tamamlanmış olur. Fonksiyonun birinci
türevinin sıfıra eşitlenmesi ile
d g (a ) p a p 1

 b  a p 1  b  0  a  b1/ ( p 1)
da
p
bulunur. İkinci türev bu noktada pozitiftir. Yani, fonksiyonu minimum yapan değer
a  b1/ ( p 1) dir. p  q( p  1) olmak üzere fonksiyonun minimum değeri,
1 1 
a p a q ( p 1)
ap ap
p 1

aa 

 a p  a p    1  0
p
q
p
q
p q 
dır. Yani, g (a)  0 olup ispat tamamlanır 
164
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
0  p   için rasgele değişkenlerin bir sınıfı p  { X : E (| X | p )  , 0  p  }
ve p, q    için X  p ve Y  q olsun. (1/ p )  (1/ q )  1 ise X Y  1 dir.
Şimdi bunun doğru olduğunu gösterelim. Önce, | Y |  | X | p 1 ise | XY |  | X | p olup
XY  1 olduğu açıktır. Diğer taraftan, | Y | | X | p 1 ise
| Y |1/( p 1) | X | | Y |1/( p 1) | Y | | X || Y | | Y |q | XY |  X Y  1
dir. Yani, her iki durumda da X  p ve Y  q ise X Y  1 dir.
4.2.2. Hölder Eşitsizliği
Teorem 4.2.2 p, q    için (1/ p)  (1/ q)  1 olsun. X  p ve Y  q ise
XY
1
 X
p
Y
q
dir.
X
İspat: Önce,
eşitsizlik sağlanır.
b | Y | / Y
X
Y
p
 0 veya Y
p
 0 ve Y
 0 ise ifadenin her iki tarafı da sıfır olacağından
q
q
 0 olsun. Yardımcı eşitsizlikte, a | X | / X
p
ve
alınırsa, X ve Y rasgele değişkenleri için
q
X
X
p
Y

q
XY
X
p
Y
p
X

p
q

p
p
X
q
Y
q Y
q
q
eşitsizliği elde edilir. Her iki tarafın beklenen değeri alınıp aşağıdaki şekilde düzenlenirse,

XY
E
 X p Y

E X Y
X
p
Y

q

q


X
  E
 p X





E X
p
p X
p
p

p
p
p


q
  E Y

 q Y q
q


 
E Y
q
q Y
q
q
p
p
X
p X
p
p
den

XY
E
 X p Y


E X Y


X p Y
q


q
X Y
X
p
1
Y
1
q





Y
q Y
q
q
q
q

1 1
 1
p q
EŞİTSİZLİKLER
165
elde edilir. Buradan da,
X Y
1
 X p Y q şeklinde aranan eşitsizlik elde edilmiş
olur 
Hölder eşitsizliğinde rasgele değişkenlerin özel seçimleri ile olasılık ve istatistikte
kullanılan bazı eşitsizlikler türetilebilir. Bunlardan bazıları aşağıdadır.
a) Cauchy Schwartzd Eşitsizliği: Hölder eşistsiliği p  q  2 için,
XY
1
 X
2
Y
2
şeklinde yazılır. X ve Y rasgele değişkenleri için beklenen değerleri E ( X )   x ve
E (Y )   y olsun. Hölder eşitsizliği X yerine X   x ve Y yerine de Y   y yazılarak
uygulandığında,
| Cov( X , Y )|  | E (( X   x )(Y   y )) |  E (| ( X   x )(Y   y ) |)
 E ( X   x ) 2 E (Y   y ) 2 
Var ( X ) Var (Y )
elde edilir. Buradan, Cauchy-Schwartzd eşitsizliği,
| Cov( X , Y )|  Var ( X ) Var (Y )
veya
Cov  X , Y   2  Var ( X ) Var (Y )
şeklinde yazılır. Bu eşitsizlikten, korelasyon katsayısı ile ilgili
 X2 ,Y
Cov  X , Y   2

 1 veya 1   X ,Y  1
Var ( X ) Var (Y )
eşitsizliği de elde edilir.
b) Hölder eşitsizliğinde Y  1 alalım. Bu durumda, p    için
X
1
 X
p
 E (| X |)  ( E (| X | p ))1/ p
eşitsizliği elde edilmiş olur.
X 1  X p olup,
166
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
c) Hölder eşitsizliğinde Y  1 ve X yerine de X r yazalım. Bu durumda, Hölder
eşitsizliği E (| X r |)  ( E (| X r | p ))1/ p veya E (| X |r )  ( E (| X |rp ))1/ p şekline dönüşür. Her
iki tarafın 1/ r kuvveti alındığında Hölder eşitsizliği,
[ E (| X |r )]1/ r  [ E (| X |rp ))1/( rp )
olur. p  1 olduğundan, s  p r denirse, s  r dir. Dolayısı ile s  r için,
[ E (| X |r )]1/ r  [ E (| X |rp ))1/( rp ) veya
X
r
 X
s
eşitsizliği elde edilir. Bu eşitsizlik literatürde Liaponov eşistsizliği olarak bilinir.
Örnek 4.2.1 Cauchy-Schwartzd eşitsizliği, vektörler için benzer şekilde yazılır. a ve

b vektörleri, a  (a1, a2 ,..., an ) ve b  (b1, b2 ,..., bn ) olarak verildiğinde Cauchy


2



Schwartzd eşitsizliği, (a b)  (a a ) (b b) şeklinde ifade edilir (herhangi bir lineer cebir

 
kitabına bakılabilir). Son eşitsizlikte, a  (1,1,...,1) ve b  ( x1, x2 ,..., xn ) alındığında,


vektör çarpımları
n
n
(ab)   x i , (aa)  n ve (bb)   x i2
  i 1

  i 1
şeklinde olur. Cauchy-Schwartzd eşitsizliğinden,
 n 
  xi 
 i 1 
2

n
n  x i2
i 1
 n

veya   x i2 
 i 1 
1
 n 
 n   xi 
 i 1 
2
eşitsizliği elde edilir. Her i için xi  0 , a ve b vektörleri de


a  ( x1, x2 ,..., xn )' , b  ( x 1 1, x 2 1,..., x n 1 )'


olarak seçildiğinde ise vektör çarpımları,
n
n 1
(aa)   x i2 , (bb)   2 ve (ab)  n
  i 1 xi
  i 1

olur. (ab)2  (aa ) (bb) eşitsizliğinde bu değerler yerine yazıldığında ise

 
1
 n 2
 n 2  n 1 
1 n 1
n    xi    2  veya   xi   2  2
n i 1 xi
 i 1   i 1 xi 
 i 1 
2
eşitsizliği elde edilir 
EŞİTSİZLİKLER
167
4.2.3. Minkowsky Eşitsizliği
Aşağıda ifadesi verilen bu eşitsizlik, Hölder eşitsizliğine benzer. Literatürde, değişik
ispat teknikleri vardır (Chow ve Teicher (1988), sayfa 111, Bauer (1981), sayfa 65).
Teorem 4.2.3 X , Y  p olsun. Bu durumda,
X Y
p
 X
p
 Y
p
dir.
İspat: Önce, a, b   ve p    için,
| a  b | p  (| a | p  | b | p )  (2 max{| a |,| b |}) p  2 p (| a | p  | b | p )
olduğunu hatırlayalım. E (| X | p )   ve E (| Y | p )   ise, E (| X  Y | p )   dir. Yani,
X , Y  p ise X  Y  p dir. Ayrıca
X Y
1
 E  X Y  E  X   E  Y   X
1
 Y
1
olduğundan p  1 için eşitsizlik sağlanır. Şimdi, p  1 olsun. Buradan,
X Y
p
 X Y X Y
p 1
 X X Y
p 1
 Y X Y
p 1
olup eşitsizlikte her iki tarafın da beklenen değeri alınırsa,
X Y
p
p
 E (| X  Y | p )  E (| X || X  Y | p 1 )  E (| Y || X  Y | p 1 )
eşitsizliği elde edilir. (1/ p )  (1/ q )  1 olacak şekilde q sayısı seçildiğinde, p  q ( p  1)
olup, X  Y  q olur. Hölder eşitsizliğinden,
E(| X || X  Y | p1)  [ E(| X | p )]1/ p [ E(| X  Y |q( p1) )]1/ q  X
 X
p
X
p
[ E(| X  Y | p )]
yazılır. Yani,

E Y X Y
dir. Buradan da,
p 1
X Y
p/q
p
1p
pq
 X
p
X Y
p
p/ q
p
[ E(| X  Y |q( p1) )]1/ q
168
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
p
p
X Y

p
 E X Y
 X
 X
X Y
eşitsizliği elde edilir.
p
p
p/q
p
p
X

p
 Y
X Y

X Y
 X Y

X Y
p
p
p
p/q
p
p p / q
p
p

 Y
p
p/q
p
 Y
 X Y
p
X Y
p/q
p
p/q
p
 0 ise eşitsizlik sağlanır.
eşitsizliğin her iki tarafı X  Y p
X Y
X Y
p
p
 0 ise, son
ile bölündüğünde, p  ( p / q )  1 olduğundan,
 X Y
X



X
X Y
p/q
p
p
p
 X Y
X Y
X
p
 Y
p
 Y
 Y
p/q
p
p/q
p
p
p
elde edilir 
4.2.4. Jensen Eşitsizliği
Jensen eşitsizliğini yazmadan önce konveks fonksiyonları hatırlayalım. Bir g :   
fonksiyonu, 0    1 ve her x, y   için
g ( x  (1   ) y )   g ( x)  (1   ) g ( y )
özelliğini sağlıyorsa, konvekstir, aksi halde konkavdır denir. Konveks g ( x) fonksiyonun
grafiği aşağıda Şekil (4.2.2) de verildiği gibidir.
g(x)
g(x)
g(y)
)g
–λ
λ
g(x)
x
(1
)+
x
(
g
g(x)
g(x)
(y)
l(x)=a+bx
y
x
x
g(x)
Şekil 4.2.2 Konveks fonksiyon
Türevlenebilir bir fonksiyonun ikinci türevi pozitif ise konveks, negatif ise konkavdır.
Örneğin, g ( x)  x 2 fonksiyonu g ( x)  2  0 olduğundan konvekstir. Benzer şekilde,
EŞİTSİZLİKLER
169
g ( x)  1/ x fonksiyonunu için g ( x)  2 / x3 olup, x  0 için fonksiyon konveks, x  0
için de konkavdır. Şimdi, Jensen eşitsizliğini yazabiliriz.
Teorem 4.2.4 (Jensen Eşitsizliği): X herhangi bir rasgele değişken, g de  den 
ye herhangi bir konveks fonksiyon olmak üzere,
E  g ( X )  g  E( X )
dir. Fonksiyon konkav ise eşitsizlik yön değiştirir. P ( g ( X )  a  bX )  1 ise eşitlik vardır.
İspat: g fonksiyonu sürekli ve türevlenebilir olsun. Bu durumda herhangi bir I
aralığında, x0  I için x0 değerine bağlı en az bir  (    ( x0 ) ) vardır ve her x  I için
g ( x)  g ( x0 )   ( x  x0 ) dir. g nin x0 noktası komşuluğundaki birinci dereceden Taylor
serisi açılımı
1
g ( x)  g ( x0 )  g ( x0 ) ( x  x0 )  ( x  x0 ) 2 g ( )
2
olup
g
konveks olduğundan
g ( )  0
ve
0.5 ( x  x0 ) 2 g ( )  0
dır. Böylece
   ( x0 )  g ( x0 ) için g ( x)  g ( x0 )   ( x  x0 ) dır. Eşitsizlikte x0  E ( X ) alınırsa,
g ( X )  g ( E ( X ))   ( X  E ( X )) elde edilir. Her iki tarafın da beklenen değeri alınırsa
( E ( X  E ( X ))  0 ),
E[ g ( X )  g ( E ( X ))]  E ( g ( X ))  g ( E ( X ))  0
bulunur. Yani, E ( g ( X ))  g ( E ( X )) şeklinde Jensen eşitsizliği elde edilmiş olur.
g fonksiyonu yukarıda verildiği gibi sürekli ve türevlenebilir olmayabilir. Bu durumda
teoremin ispatı farklıdır. g ( x) konveks olduğundan, fonksiyonun E ( X ) noktasındaki
tanjant doğrusu Şekil (4.2.2) de görüldüğü gibidir. Bu doğruya (şekilde görüldüğü gibi)
( x) diyelim. Bazı a, b   için bu tanjant doğrusu ( x)  a  bx şeklinde yazılabilir.
g ( x) fonksiyonu konveks olduğundan, g ( x)  ( x) dir. Buradan,
g ( X )  ( X )  E ( g ( X ))  E (( X ))  E ( a  bX )  a  bE ( X )  ( E ( X )
yazılır. ( x)  a  bx doğrusu g ( x) fonksiyonunun E ( X ) noktasındaki tanjant değeri
olduğundan, ( E ( X ))  g ( E ( X )) dir. O halde,
E ( g ( X ))  ( E ( X ))  g ( E ( X )) veya E ( g ( X ))  g ( E ( X ))
170
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
olur. g ( x) fonksiyonu lineer ise eşitlik sağlanır 
Örnek 4.2.2 a) g ( x)  x 2 olsun. g ( x)  2  0 olduğundan g ( x)  x 2 fonksiyonu
konvekstir. Jensen eşitsizliğine göre,
E ( g ( X ))  E ( X 2 )  g ( E ( X ))  ( E ( X )) 2
2
dir. Yani, E ( X 2 )   E ( X )  veya Var ( X )  E ( X 2 )  ( E ( X )) 2  0 dır.
b) x  0 için g ( x)  1/ x konveks ( g  ( x)  2 / x3  0 ) olup Jensen eşitsizliğinden,
E ( g ( X ))  E (1/ X )  g ( E ( X ))  1/ E ( X )
yazılır. Yani, E (1/ X )  1/ E ( X ) dir.
c) g ( x) | x | fonksiyonu, 0    1 ve x, y   için,
g ( x  (1   ) y ) |  x  (1   ) y |   | x |  (1   ) | y |  g ( x)  (1   ) g ( y )
olduğundan konvekstir. Jensen eşitsizliğine göre,
E ( g ( X ))  E (| X |)  g ( E ( X )) | E ( X ) | dir. Yani, E (| X |)  | ( E ( X ) | dir 
Örnek 4.2.3 Hölder eşitsizliği Jensen eşitsizliği yardımı ile ispat edilebilir. Önce,
g ( x)  ln( x) fonksiyonu g ( x)  0 ( g ( x)  1/ x 2 ) olduğundan konkavdır. x, y    ve
  [0,1] olsun. Jensen eşitsizliğine göre ( E ( g ( X ))  g ( E ( X )) )
 ln( x)  (1   ) ln( y )  ln( x  (1   ) y )
eşitsizliği yazılabilir. Bununla birlikte, h( x)  e x fonksiyonu kesin artan olduğundan,
e ln( x )(1 )ln( y )  eln( x (1 ) y )
olup logaritma ve üstel fonksiyonun özelliklerinden (  ln( x)  ln( x  ) ve eln( a )  a )
eln( x
 ) ln( y (1 ) )

 eln( x (1 ) y )  eln( x ) eln( y
(1 )
)
 eln( x (1 ) y )
 x  y (1 )   x  (1   ) y
eşitsizliğini yazabiliriz. Son eşitsizlik yardımı ile Hölder eşitsizliğinin ispatını yapabiliriz.
Teorem (4.2.2) de   1/ p ve 1    1/ q alındığında (1/ p)  (1/ q )  1 dir. Eşitsizlikte,
X ve Y rasgele değişkenler olmak üzere   1/ p , 1    1/ q , x  | X | p / E (| X | p ) ve
y  | Y |q / E (| Y |q ) diyelim. Buna göre,
EŞİTSİZLİKLER
171
x y (1 )   x  (1   ) y 
|X|
|Y |
( E (| X | p )1/ p ( E (| Y |q )1/ q

1 | X |p
1 | Y |q

p ( E (| X | p ) q ( E (| Y |q )
dir. Her iki tarafın beklenen değeri alındığında ( (1/ p)  (1/ q )  1 dir)
E (| X |)
E (| Y |)
( E (| X | p )1/ p ( E (| Y |q )1/ q
1 E (| X | p ) 1 E (| Y |q ) 1 1


  1
p ( E (| X | p ) q ( E (| Y |q ) p q
eşitsizliği elde edilir. Buradan da,
E (| X |)
p 1/ p
( E (| X | )
E (| Y |)
q 1/ q
( E (| Y | )
 1
E (| X Y |)
p 1/ p
( E (| X | )
( E (| Y |q )1/ q
1
 E (| X Y |)  ( E (| X | p )1/ p ( E (| Y |q )1/ q
 XY 1  X
p
Y
q
şeklinde Hölder eşitsizliği elde edilir. Burada, Hölder eşitsizliği doğrudan Jensen
eşitsizliğinin bir sonucu değildir. Ancak, yukarıdaki logaritma fonksiyonunun konkav
olmasından dolayı elde edilen eşitsizliğin bir sonucudur 
X ve Y beklenen değerleri mevcut herhangi iki rasgele değişken olsun. Genellikle
E ( X / Y )  E ( X ) / E (Y ) dir. Ancak, Cov( X / Y , Y )  0 ise E ( X / Y )  E ( X ) / E (Y )
eşitliği yazılabilir. Kovaryansın tanımından,
X 
X 
X
0  Cov  , Y   E  Y   E 
Y

Y 
Y

X
 E (Y )  E  X   E 

Y

 E (Y )

eşitliğinden
X
X
 X  E( X )
0  E  X   E   E (Y )  E   E (Y )  E ( X )  E   
Y 
Y 
 Y  E (Y )
elde edilir.
4.3. Çözümlü Problemler
4.3.1 a1, a2 ,..., an    olmak üzere, bu ai reel sayılarının aritmetik, geometrik ve
harmonik ortalamaları
1 n
a A   ai ,
n i 1
1/ n
 n 
aG    ai 
 i 1 
,
aH
1 n 1 
  
 n i 1 ai 
1
172
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
şeklinde hesaplanır. aH  aG  a A olduğunu gösteriniz (Casella ve Berger (2002), sayfa
191).
Çözüm: Değer kümesi {a1, a2 ,..., an } olan herhangi bir X rasgele değişkeninin olasılık
fonksiyonu
1
, i  1, 2,3,..., n
n
olarak verilmiş olsun. g ( x)  log( x) fonksiyonu konkavdır ( g ( x)  1/ x 2 olup her
P ( X  ai ) 
zaman negatiftir). Bu durumda, X rasgele değişkeninin beklenen değeri
n
E ( X )   ai P( X  ai ) 
i 1
1 n
 ai  a A
n i 1
olup
  n 1/ n  1 n
log(aG )  log   ai     log(a i )  E  log( X ) 
 i 1   n i 1


ve
1 n 
log  E ( X )   log   a i   log(a A )
 n i 1 
dir. Jensen eşitsizliğine göre, E (log( X ))  log( E ( X )) olduğundan,
log(aG ) 
1 n 
1 n
a
E
X
E
X
log(
)
(log(
))
log(
(
))
log




  a i   log(a A )
i
n i 1
 n i 1 
yazılabilir. Yani, log  aG   log(a A ) eşitsizliği elde edilir. Logaritma fonksiyonunun
özelliğinden ise aG  a A dir. Yine g ( x)  log( x) fonksiyonunun konkav olduğundan,
1 n 1
log(1/ aH )  log  
 n i 1 a i


 1
  log  E 

 X



1
   E  log 

X


    E (log( X ))

Eşitsizliği yazılır. log  aG   E  log( X )  olup  E (log( X ))   log(aG )  log(1/ aG ) dir.
Yani, log(1/ aH )  log(1/ aG ) olup logaritmanın özelliğinden, (1/ aH )  (1/ aG ) yani,
aH  aG elde edilir. Bu iki eşitsizlik birleştirildiğinde aH  aG  a A elde edilir.
4.3.2 Sonlu beklenen değere sahip bir rasgele değişken X olsun. E ( X )   ve g de
azalmayan konveks bir fonksiyon ise, E ( g ( X ) ( X   ))  0 olduğunu gösteriniz.
EŞİTSİZLİKLER
173
Çözüm: X in olasılık yoğunluk fonksiyonu f ( x) olsun (kesikli ise integral yerine
toplam gelir). g ( x) konveks olduğundan Jensen eşitsizliğine göre, E  g ( X )   g  E ( X ) 
dir. Ayrıca, g ( x) azalmayan ( x  y ise, g ( x)  g ( y ) ) olduğundan,

E  g ( X ) ( X   )    g ( x) ( x   ) f ( x) dx

0


0
0



0
  g ( x) ( x   ) f ( x) dx   g ( x) ( x   ) f ( x) dx
  g (  ) ( x   ) f ( x) dx   g (  ) ( x   ) f ( x) dx

 g (  ) ( x   ) f ( x) dx  g (  ) E  ( X   )   0

şeklinde aranan eşitsizlik elde edilir.
X  1 olacak şekilde bir rasgele değişken için, E ( X n 1 )  E ( X ) E ( X n ) eşitsizliği
E  g ( X ) ( X   )   0 nin bir sonucu olarak elde edilir. Bunun için g ( x)  x n denirse,
g  ( x)  n(n  1) x n2  0 olup g ( x)  x n konveks ve x  1 için azalmayandır. Yukarıdaki
eşitsizlik g ( x)  x n fonksiyonuna uygulandığında,
0  E ( g ( X ) ( X   ))  E ( X n ( X   ))  E ( X n1 )   E ( X n )
 E ( X n1 )  E ( X ) E ( X n )
elde edilir. Buradan her n   için,
0  E ( X n1 )  E ( X ) E ( X n )  E ( X n1 )  E ( X ) E ( X n )
eşitsizliği yazılır. Yani, E ( X n 1 )  E ( X ) E ( X n ) dir.
4.3.3 X sürekli bir rasgele değişken ve E ( X )  0 , Var ( X )   2 olsun. Buna göre,
a)   0 ise P  X      2 / ( 2   2 )
b)   0 ise P  X     1   2 / ( 2   2 )
eşitsizliklerinin doğru olduğunu gösteriniz.
Çözüm: Sorunun çözümüne geçmeden önce  , t  0 olmak üzere önce
174
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
P  X     E ( X  t )2 /    t 
2
eşitsizliğinin doğru olduğunu gösterelim. Buradaki beklenen değer




E ( X  t ) 2   ( x  t ) 2 f ( x) dx   ( x  t ) 2 f ( x) dx




  (  t ) 2 f ( x) dx  (  t )2  f ( x) dx  (  t )2 P( X   )
şeklinde yazılabildiğinden, P ( X   )  E ( X  t ) 2 / (  t ) 2 bulunur. Bu eşitsizlik yardımı
ile istenen eşitsizlikler kolayca gösterilir.
a)   0 ise   0 olup,
2
P  X     P   X     E   X  t  /    t 
2
eşitsizliği yazılır. Buradan, t   2 /  için E ( X )  0 ve Var ( X )   2 olduğundan,
P  X     P   X    

E ( X   2 /  )2
(    2 /  ) 2

E ( X 2 )   2 E ( X ) /   ( 4 /  2 )
( 2   2 ) 2 /  2
 2  2   4  2 ( 2   2 )
2


( 2   2 ) 2
( 2   2 ) 2
( 2   2 )
şeklinde aranan eşitsizlik elde edilmiş olur.
b)   0 olsun. X
sürekli olduğundan P( X   )  P ( X   ) dir (kesikli ise
P ( X   )  P( X   ) dir). Buradan,
P  X     1  P  X     1  P( X   )  1  E ( X  t ) 2 /(t   ) 2
eşitsizliğinde t   2 /  yazıldığında aranan eşitsizlik,
P X    1
 

E X 2   2E( X ) /    4 /  2
 2   2 
2
/ 2
  1   2 2   4  1   2
2
2
2
  2   2  (   )
şeklinde elde edilir.
Burada, t   2 /  alınmasının nedeni, E ( X  t ) 2 / (t   ) 2 oranının bu noktada
minimum olmasıdır. Yani, E ( X  t ) 2 / (t   ) 2 fonksiyonu ( t fonksiyonudur) t   2 / 
noktasında minimumdur. E ( X )  0 ve Var ( X )   2 olduğundan,
E ( X  t ) 2 / (  t ) 2  ( 2  t 2 ) / (  t ) 2
EŞİTSİZLİKLER
175
olup,
d  E  X t

d t     t 2

2


 d   2  t 2  2 t   2
2
 




0
t
 dt     t 2 

   t 2



bulunur. İkinci türev bu noktada
2
d2  E X  t

d t 2     t 2

d2


  2 d t2
t 
  2  t2

    t 2




0
 2
t 

pozitif olup, E ( X  t ) 2 / (t   ) 2 oranının t   2 /  noktasında minimum olduğu görülür.
4.3.4 Markov eşitsizliğini kullanılarak, 0  p  1 için (1  p ) n  1/ (np ) olduğunu
gösteriniz.
Çözüm: Kesikli bir X rasgele değişkeninin olasılık fonksiyonu q  1  p olmak üzere,
P ( X  x)  p q x 1 , x  1, 2,3,...
şeklinde verilmiş olsun. Bu durumda, E ( X )  1/ p ve P( X  n) olasılığı,
n
n
n1
x 1
x 1
x 0
P ( X  n)  1  P ( X  n)  1   P ( X  x)  1   p q x 1  1  p  q x
 1 p
1  qn
1  qn
 1 p
 q n  (1  p) n
1 q
p
dir. Markov eşitsizliğinden,
(1  p )n  P( X  n)  E ( X ) / n  1/(np) veya (1  p ) n  1/ (np )
şeklinde aranan eşitsizlik elde edilir.
Aynı olasılık fonksiyonu kullanılarak Jensen eşitsizliğine göre 0  p  1 için
log( p)  ( p  1) eşitsizliği de yazılabilir. Bunun için x  0 için g ( x)  1/ x fonksiyonu
konveks olup, Jensen eşitsizliğine göre E (1/ X ) 1/ E ( X ) dir. g ( X )  1/ X in beklenen
değeri
1
E
X
x 1
 pq
  1



P
(
X
x
)



x
 x1 x
x 1
q x1

x 1 x

 p
 log(1  q ) 
p
p
   log( p )
q
q


olup, E ( X )  1/ p dir. Yani, Jensen eşitsizliğinden E (1/ X ) 1/ E ( X ) olup,
176
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
1
E
X
p
1
1


p
   log( p) 
q
E ( X ) 1/ p

elde edilir. Buradan da, ( p / q) log( p)  p dir. Ayrıca,
( p / q) log( p)  p   log( p)  q  log( p)  q  (1  p)  p  1
olduğundan log( p)  ( p  1) elde edilir.
4.3.5 a) Her n   için (n  1)  2 en / n olduğunu gösteriniz.
b) Her n   için (1/ 2n 1)  (1/ n) olduğunu gösteriniz.
Çözüm: a) X rasgele değişkeninin olasılık yoğunluk fonksiyonu,
 x e x
f ( x)  
 0
, x0
, d . y.
olarak verilmiş olsun. Buna göre,

P ( X  n)   x e x dx  ( x e x  e x )
xn

xn
 n e n  e n
dir. Ayrıca, E ( X )  (3)  2 olup Markov eşitsizliğinden,
n e  n  e  n  P ( X  n)  E ( X ) / n  2 / n
eşitsizliği yazılır. Eşitsizlik biraz daha düzenlendiğinde
e  n (n  1)  2 / n veya (n  1)  2 e n / n
şeklinde aranan eşitsizlik elde edilir.
b)
X
rasgele değişkeninin olasılık fonksiyonu, P ( X  x)  1/ 2 x , x  1, 2,3,...
şeklinde verilmiş olsun. P( X  n) olasılığı,


P ( X  n)   P ( X  x)  
1
x n 1 2
x n 1
dir. Ayrıca,


x 1
x 1 2
E ( X )   x P( X  x)  
olup yine Markov eşitsizliğinden,
x
x
2
x

1
2n
EŞİTSİZLİKLER
177
1/ 2n  P( X  n)  E ( X ) / n  2 / n veya (1/ 2n1 )  (1/ n)
eşitsizliği elde edilir.
4.3.6 Sonlu beklenen değere sahip herhangi iki rasgele değişken X ve Y olsun. Buna
göre,
a) E (min{ X , Y })  min{E ( X ), E (Y )}
b) E (max{ X , Y })  max{E ( X ), E (Y )}
c) E (min{ X , Y }  max{ X , Y })  E ( X )  E (Y )
eşitsizliklerinin doğru olduğunu gösteriniz.
Çözüm: Önce,
min{ X , Y }  0.5[( X  Y ) | X  Y |]
ve
max{ X , Y }  0.5[( X  Y ) | X  Y |]
olduğunu hatırlayalım. g ( x)  | x | fonksiyonu konveks olup Jensen eşitsizliğinden,
| E ( X  Y ) |  E (| X  Y |) dir. Buradan da  E (| X  Y |)   | E ( X  Y )| olup
 E  X  Y    E ( X  Y )   E ( X )  E (Y )
eşitsizliği yazılabilir. Şimdi eşitsizliklerin ispatına geçebiliriz.
a) min{ X , Y } nin ifadesi Jensen eşitsizliği ile beraber kullanıldığında ( g ( x) | x |
fonksiyonu konvekstir),
E (min{ X , Y })  0.5  E ( X  Y )  E (| X  Y |) 
 0.5[ E ( X )  E (Y ) | E ( X )  E (Y ) |]  min{E ( X ), E (Y )}
elde edilir. Yani, E (min{ X , Y })  min{E ( X ), E (Y )} dir.
b) Benzer şekilde max{ X , Y } nin yukarıdaki ifadesi Jensen eşitsizliği ile beraber
kullanıldığında,
E (max{ X , Y })  0.5[ E ( X  Y )  E (| X  Y |)]
 0.5[ E ( X )  E (Y ) | E ( X )  E (Y ) | max{E ( X ), E (Y )}
bulunur. Dolayısı ile, E (max{ X , Y })  max{E ( X ), E (Y )} dir.
c) min{ X , Y }  max{ X , Y }  X  Y olduğundan, kolayca görüleceği gibi
E (min{ X , Y }  max{ X , Y })  E ( X  Y )  E ( X )  E (Y )
dir.
178
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
4.3.7 Değer kümesi DX  {x1, x2 ,..., xn } olan X herhangi bir kesikli rasgele değişken,
f ve g azalmayan fonksiyonlar olsun. Bu durumda E[ f ( X )] E[ g ( X )]  E[ f ( X ) g ( X )]
olduğunu gösteriniz.
Çözüm: X in olasılık fonksiyonu, x1  x2  ...  xn için P( X  xi )  pi olsun.
Buradan eşitsizliğin ispatı için,
 n
 n
  n

f
(
x
)
P
(
X
x
)
g
(
x
)
P
(
X
x
)





k
k 
k
k     f ( xk ) g ( xk ) P ( X  xk ) 
 k 1
  k 1
  k 1

olduğunun gösterilmesi gerekir. f ve g azalmayan fonksiyonlar olduğundan 1  j  n ve
1  k  n için 0  { f ( xk )  f ( x j )}{g ( xk )  g ( x j )} dir. Buradan da,
f ( xk ) g ( x j )  f ( x j ) g ( xk )  f ( x j ) g ( x j )  f ( xk ) g ( xk )
yazılabilir. P ( X  xi )  pi  0 olduğundan, eşitsizliğin sol tarafı P ( X  x j ) P ( X  xk ) ile
çarpılıp toplandığında
n
n
  [ f ( xk ) g ( x j )  f ( x j ) g ( xk )] P( X  x j ) P( X  xk )
j 1 k 1
n
n
 2   f ( xk ) g ( x j ) P( X  x j ) P( X  xk )
j 1 k 1
 n
 n

 2   f ( x j ) P( X  xk )    g ( xk ) P( X  xk )    E ( f ( X ))  E ( g ( X )) 
 j 1
  k 1



eşitliği elde edilir. Benzer şekilde, yukarıdaki eşitsizliğin sağ tarafı kullanıldığında
n
n
  [ f ( x j ) g ( x j )  f ( xk ) g ( xk )] P( X  xk )P( X  x j )
k 1 j 1
n
n
n
n
k 1
j 1
j 1
k 1
  [ f ( xk ) g ( xk )] P( X  xk )  P( X  x j )   [ f ( x j ) g ( x j )] P( X  x j )  P( X  xk )
n
 2  [ f ( x j ) g ( x j )] P( X  x j )  2 E[ f ( X ) g ( X )]
j 1
eşitliği elde edilir. Buradan da, bu iki eşitlik
f ( xk ) g ( x j )  f ( x j ) g ( xk )  f ( x j ) g ( x j )  f ( xk ) g ( xk )
EŞİTSİZLİKLER
179
eşitsizliğinde kullanıldığında, E[ f ( X )] E[ g ( X )]  E[ f ( X ) g ( X )] eşitsizliği elde edilir. Bu
eşitsizlik literatürde, Chebyshev Lemması olarak bilinir (Chebyshev eşitsizliği ile
karıştırılmasın). Fonksiyonlardan biri azalmayan diğer artmayan ise eşitsizlik yön değiştirir.
4.3.8. Beklenen değeri sıfır, varyansı  2 olan bağımsız rasgele değişkenler
e1, e2 ,..., en olsun ( E (ei )  0 ve Var (ei )   2 ). x i , i  1, 2,3,..., n
rasgele olmayan
değişkenler olmak üzere, Y i   x i  ei , i  1, 2,3,..., n modelini göz önüne alalım.
Buradan,
n 
ˆ1    xi2 
i 1 
1 n
n 
ˆ2    xi 
i 1 
 x i Yi
i 1
1 n
ˆ3 
 Yi
i 1
1 n
 (Y i / x i )
n i 1
rasgele değişkenlerinin varyansları sırası ile,
1
 n

 n 
Var ˆ1   2   x i2  , Var ˆ 2  n  2   x i 
 i 1 
 i 1 
 
 
2
2 n 1
, Var ˆ 3 

n 2 i 1 x i2
 
dir. Bu varyansları küçükten büyüğe doğru sıralayınız.
Çözüm: Cauchy-Schwartz eşitsizliğinden
 n 2
  xi 
 i 1 
1
 n 
 n   xi 
 i 1 
2
 n

ve   xi2 
 i 1 
1

1 n

1
n 2 i 1 xi2
olduğunu biliyoruz (Örnek (4.2.1)). Buradan Var ( ˆ 1 )  Var ( ˆ 2 ) ve Var ( ˆ 1 )  Var ( ˆ 3 )
dir. Yani, Var ( ˆ 1 ) diğer iki varyansdan da küçüktür. Var ( ˆ 2 ) ve Var ( ˆ 3 ) arasındaki
sıralamaya bakalım. X rasgele değişkeninin olasılık fonksiyonu,
P ( X  xi ) 
1
, i  1, 2,3,..., n
n
olarak verilmiş olsun. Buna göre,
g ( x)  1/ x 2
fonksiyonu konvekstir. Jensen
eşitsizliğinden E ( g ( X ))  g ( E ( X )) olup beklenen değerler,
n
E  g ( X )    g ( xi ) P( X  xi ) 
i 1
1 n 1

n i 1 x i2
n
ve E ( X )   x i P( X  xi ) 
şeklinde hesaplanmıştır. Jensen eşitsizliğine göre,
i 1
1 n
 xi
n i 1
180
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
1 n 
1 n 1
E  g ( X )    2  g  E ( X )     xi 
n i 1 x i
 n i 1 
2
2

 n   xi 
 i 1 
n
2
eşitsizliği yazılabilir. Buradan,
 n 
1 n 1
 2  n2   xi 
n i 1 x i
 i 1 
2
 n 
 n   xi 
 i 1 
2

1
n
n
2 
1
2
i 1 x i
bulunur. Yani, Var ( ˆ 2 )  Var ( ˆ 3 ) dır. Bu eşitsizlikler birleştirildiğinde,
 
2
n
Var ˆ1    

 i 1

x i2 

1

 
 Var ˆ 2  n
2
 n 
  x i 
 i 1 
2

2
n
2
n
 x 2  Var  ˆ 3 
1
i 1 i
sıralaması elde edilir. Yani, Var ( ˆ1 )  Var ( ˆ 2 )  Var ( ˆ 3 ) dir.
4.3.9 X ve Y rasgele değişkenleri için E ( X )  E (Y )  0 , Var ( X )  Var (Y )  1 ve
X ile Y arasındaki korelasyon  olsun. Bu durumda,
E (max{ X 2 , Y 2 })  1  1   2
olduğunu gösteriniz (Öztürk, 1993, sayfa 298).
Çözüm: Önce, Problem (4.3.7) de verilen max{ X , Y }  0.5 [( X  Y ) | X  Y |] ifadesi
X 2 ve Y 2 rasgele değişkenleri için
max{ X 2 , Y 2 }  0.5[( X 2  Y 2 ) | X 2  Y 2 |]
şeklinde düzenlendiğinde, X 2  Y 2   X  Y  X  Y  olup Cauchy-Schwartz eşitsizliği de
X 2 ve Y 2 rasgele değişkenleri için,
[ E (| X 2  Y 2 |)]2  [ E (| X  Y |) 2 ][ E (| X  Y |) 2 ]
şeklinde yazılır. Buradan da,
1
E (max{ X 2 , Y 2 })  [ E ( X 2  Y 2 )  E (| X 2  Y 2 |)]
2
1
1
 [ E (| X 2  Y 2 |)  2] 1 
E (( X  Y ) 2 ) E (( X  Y ) 2
2
2
eşitsizliğine ulaşılmış olur. Ayrıca,
EŞİTSİZLİKLER
181
E (( X  Y )2 ) E (( X  Y ) 2 )
 [ E ( X 2 )  2 E ( XY )  E (Y 2 )][ E ( X 2 )  2 E ( XY )  E (Y 2 )]
  2  2   2  2    4(1   2 )
dir. Dolayısı ile aranan eşitsizlik,
 

E max X 2 , Y 2  1 

 



1
1
E ( X  Y )2 E ( X  Y )2  1 
4 1  2  1 1  2
2
2
den E (max{ X 2 , Y 2 })  1  1   2 olarak bulunmuş olur.
4.3.10 X ve Y aralarındaki korelasyon  olan herhangi iki rasgele değişken olsun.
  0 için E ( X )   x , E (Y )   y , Var ( X )   x2 ve Var (Y )   y2 olmak üzere,


P | X   x |   x veya |Y   y |   y 
1 
1  1   2 
2 


olduğunu gösteriniz (Öztürk, 1993, sayfa 299).
Çözüm: Eşitsizliğin sol tarafındaki olasılık açık olarak

P X   x   x veya Y   y   y
2

 X  x 

P 
  2 veya
   x 


2
2


2


 Y  y 
 X   x   Y   y   2 
2


    P  max 
   
 , 

 y 



x
y








 




şeklinde yazılır. Markov eşitsizliğinden de,

2

 X   x   Y   y

P max 
 , 


  x    y







2

 2 1 
 X   x   Y   y
     2 E  max 
 , 
 


  x    y


1
 2 1  1   2 

 
2
bulunur. Böylece,
P (| X   x | veya | Y   y |    y  (1  1   2 ) /  2
eşitsizliği elde edilmiş olur.




2 


 

BÖLÜM 5
ÖZEL DAĞILIMLAR
Bu bölümde, olasılık ve istatistikte öne çıkan bazı dağılımlar ele alınacaktır. Öncelikle,
olasılık dağılımlarının burada bahsedilen dağılımlarla sınırlı olmadığını belirtelim. Johnson
ve Kotz (1970) dağılımlar ile ilgili dört ciltlik bir kitap yayınlamıştır. Bunlardan birinci cildi
tek değişkenli kesikli dağılımlar, ikinci ve üçüncü ciltleri tek değişkenli sürekli
dağılımlardan oluşmaktadır. Dördüncü cilt çok değişkenli istatistik dağılımları içermektedir.
Olasılık dağılımları da rasgele değişkenlerde olduğu gibi kesikli ve sürekli dağılımlar olarak
ayrı ayrı incelenecektir. Rasgele değişkenler ve dağılımları ikinci bölümde ayrıntılı olarak
incelendiğinden, burada seçilen özel dağılımların bazı özellikleri üzerinde durulacaktır.
Ayrıca, çok değişkenli normal dağılım, özellikle iki değişkenli normal dağılım üzerinde de
durulacaktır. Bazı dağılım aileleri (üstel aileler) de bu bölümde yer verilecek konular
arasındadır.
5.1. Tek Değişkenli Kesikli Dağılımlar
5.1.1. Bernoulli Dağılımı
Sadece iki sonucu (başarı-başarısız, doğru-yanlış gibi) bulunan deneylere Bernoulli
deneyi denir. Bir Bernoulli deneyinin örnek uzayı iki elemandan oluşan bir kümedir. Yani,
örnek uzay Ω = {w1 , w2 } olup
X :Ω → 0 , w = w0
w → X ( w) = 
1 , w = w1
olarak tanımlanan X fonksiyonuna Bernoulli rasgele değişkeni denir ve değer kümesi
D X = {0,1} dir. Bu fonksiyonun bir rasgele değişken olduğu ikinci bölümde gösterildi.
Genellikle, {Başarı} yerine {w : X ( w) = 1} ve P ({Başarı}) veya P ({w : X ( w) = 1}) yerine
de kısaca P ( X = 1) yazılır. P ( X = 1) başarı olasılığına p denirse, q = 1 − p olmak üzere
Bernoulli rasgele değişkeni için olasılıklar,
184
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
P( X = x) = p x q1− x , x = 0,1
formülü ile hesaplanır. D X = {0,1} ve x ∈ DX için P( X = x) = p x q1− x olmak üzere,
Bernoulli rasgele değişkeninin olasılık fonksiyonu,
 P ( X = x ) , x ∈ DX
f ( x) = 
0
, d . y.

dir. Dağılımın olasılık fonksiyonu ile dağılım fonksiyonunun grafikleri Şekil (5.1.1) de
verilmiştir.
1
P(X=x)
F(x)
0,6
0,4
0,4
x
0
1
x
0
1
Şekil 5.1.1 Bernouilli dağılımının olasılık fonksiyonu ve dağılım fonksiyonu (p=0.6)
Bu olasılık fonksiyonu kısaca,
P( X = x) = p x q1− x , x = 0,1
şeklinde ifade edilecektir. 0 < p < 1 için p başarı olasılığını göstermek üzere, Bernoulli
dağılımı için X ~ Bern( p ) gösterimi kullanılacaktır.
Bernoulli dağılımının bütün momentleri başarı olasılığına eşittir. Yani, k sonlu bir
tamsayı ( k ∈ ) olmak üzere,
1
E ( X k ) = ∑ x P( X = x) = 0.P( X = 0) + 1. P( X = 1) = P( X = 1) = p
x =0
dir. Buradan, dağılımın varyansı
Var ( X ) = E ( X 2 ) − [ E ( X )]2 = p − p 2 = p(1 − p) = p q
ve moment çıkaran fonksiyonu da t ∈ için
1
M X (t ) = E (et X ) = ∑ et x P ( X = x) = q + p et
x =0
dir. Benzer şekilde, karekteristik fonksiyonu ϕ X (t ) = q + p eit , çarpımsal moment çıkaran
fonksiyonu da N X (t ) = E (t X ) = q + p t dir. X ~ Bern( p ) dağılımı için,
ÖZEL DAĞILIMLAR
E( X ) =
185
d N X (t )
=p
d t t =1
olup diğer bütün çarpımsal momentler sıfırdır. Yani,
E ( X ( X − 1) ) = 0 , E ( X ( X − 1)( X − 2) ) = 0 ,…, E ( X ( X − 1)( X − 2)...( X − k ) ) = 0
dır. Kümülant üreten fonksiyonu K X (t ) = ln( M X (t )) olup, kümülantlardan ilk üç tanesi
K1 =
K2 =
K3 =
d
p et
(ln(q + p et ) | t =0 =
|t =0 = p = E ( X )
dt
q + pet
d2
p q et
dt
(q + p e t ) 2
(ln(q + p et ) | t =0 =
2
d3
dt
(ln(q + pet ) | t =0 =
3
| t =0 = pq = Var ( X )
p qet (q + pet ) − 2(q + pet ) pet pqet
t 4
(q + pe )
| t =0 = pq − 2qp2 = pq(1 − 2 p)
şeklinde hesaplanmıştır. Diğerleri ardışık olarak hesaplanır.
5.1.2. Binom Dağılımı
Bir Bernoulli deneyi, her denemede başarı olasılığı aynı olacak şekilde birbirinden
bağımsız olarak n kez tekrarlansın. Böyle bir deneye Binom deneyi denir. X rasgele
değişkeni Binom deneyindeki başarıların sayısı olarak tanımlandığında, X in değer kümesi
D X = {0,1, 2,3,..., n} olur. Bernoulli denemesinde başarıyı B , başarısızlığı da B c ile
gösterirsek, Binom deneyinde x tane başarı,
B B c B B B c Bc B ..... B B c B c
1. başarı
2. başarı
3. başarı
x. başarı
şeklinde gözlenebilir. Bu x tane başarı, şekilde de görüldüğü gibi C (n, x) farklı şekilde
dizilebilir. Her bir denemede başarı olasılığı aynı ise, başarısızlık olasılığı da aynıdır. Buna
göre, başarı olasılığı p ( P ( B ) = p , q = 1 − p ) olmak üzere, Binom deneyinde x tane
başarı elde etme olasılığı x = 0,1, 2, 3,..., n için,
n
P( X = x) =   p x q n− x
 x
186
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
ile hesaplanır. Buradan, X in olasılık fonksiyonu, D X = {0,1, 2,3,..., n} olmak üzere,
 P( X = x) , x ∈ DX
f ( x) = 
0
, d . y.

dir. Binom dağılımı için X ~ Binom(n, p ) gösterimi kullanılacaktır. X ~ Binom(3, 0.6)
dağılımının olasılık fonksiyonu ile dağılım fonksiyonunun grafiği aşağıdadır (Şekil (5.1.2)).
P(X=x)
F(x)
0,432
1
0,288
0,784
0,216
0,352
0,064
0,064
x
0
1
2
3
x
0
1
2
3
Şekil 5.1.2 Binom dağılımının olasılık fonksiyonu ve dağılım fonksiyonu (n=3 ve p=0.6)
Bir Bernoulli deneyi birbirinden bağımsız olarak n defa tekrarlansın. X1 birinci
denemedeki başarıların sayısı, X 2 ikinci denemedeki başarıların sayısı ve X n de n.
denemedeki başarıların sayısı olsun. Bu rasgele değişkenlerin toplamı, Bernoulli deneyinin
n kez tekrarlanmasında gözlenen başarıların sayısı olur. Bu rasgele değişkenlerin her biri
bağımsız Bernoulli rasgele değişkenidir. Bernoulli deneyinin n kez tekrarlanmasında
gözlenen başarıların sayısı X olsun. Her i için X i ler 0 ya da 1 değerlerini aldığından
X i lerin toplamı X in değer kümesi olur. Yani bir Binom rasgele değişkeni, bağımsız
Bernoulli rasgele değişkenlerinin toplamıdır.
Düzgün bir paranın üç defa atılması deneyini göz önüne alalım. Burada örnek uzay,
Ω = {YYY , YYT , YTY , TYY , TTY , TYT , YTT , TTT } olup, Ω üzerinde tanımlanan sigma cebir
Ω nın kuvvet kümesi ( U = σ (Ω) ) olsun. Ayrıca A ∈ U için P ( A) = n( A) / 8 denirse,
(Ω, U , P ) bir olasılık uzayı olur. Bu deneyde, X gelen turaları (veya yazıları) sayan bir
rasgele değişkendir. Buna göre, deneme sayısı sabit olup her bir denemede tura gelmesi
olasılığı aynıdır. Denemeler birbirinden bağımsız ise X , Binom rasgele değişkenidir. Yani,
X ~ Binom( n = 3, p = 1/ 2) olup olasılık fonksiyonu,
x
3− x
3   1   1 
P( X = x) =      
 x  2   2 
dır. Bu olasılık fonksiyonu bazen
, x = 0,1, 2,3
ÖZEL DAĞILIMLAR
187
0
1/ 8
X =x
P ( X = x)
1
3/8
3
1/ 8
2
3/8
şeklinde de ifade edilir.
X ~ Binom( n, p ) olmak üzere olasılık fonksiyonu,
n
P( X = x) =   p x q n − x , x = 0,1, 2,3,..., n
 x
şeklinde verildiğinde fonksiyonun bir olasılık fonksiyonu olduğu
n
n n
∑ P( X = x) = ∑   p x q n− x = ( p + q) n = 1
x =0
x =0  x 
şeklindeki Binom açılımından ( p + q = 1 ) açıktır. Dağılımın momentlerinin doğrudan hesabı
biraz karmaşıktır. Örneğin, dağılımın birinci momenti, yani beklenen değeri
n
n n
n
x n!
E ( X ) = ∑ x P ( X = x) = ∑ x   p x q n− x = ∑
p x q n− x
x=0
x =0  x 
x =0 x !( n − x )!
n
n
np (n − 1)! x −1 n − x
(n − 1)!
p q
p x −1q n − x
= ∑
= np ∑
x =0 ( x − 1)!( n − x)!
x =0 ( x − 1)!( n − x )!
n−1
= np ∑
y =0
n −1  n 
(n − 1)!
p y q n−1− y = np ∑   p y q n −1− y
y !(n − 1 − y )!
y =0  y 
= np ( p + q ) n−1 = n p
dir. Binom rasgele değişkeni bağımsız Bernoulli rasgele değişkenlerinin toplamı olarak
düşünüldüğünde dağılımın beklenen değeri daha kolay hesaplanır. X1, X 2 ,… , X n aynı p
başarı
olasılığına
sahip
bağımsız
Bernoulli
rasgele
değişkenleri
olmak
üzere
X = X1 + X 2 + … + X n rasgele değişkeni de başarı olasılığı p olan Binom dağılımına
sahiptir. Her i için E ( X i ) = p olduğundan X ~ Binom(n, p ) dağılımının beklenen değeri,
E ( X ) = E ( X1 + X 2 + … + X n ) = E ( X1 ) + E ( X 2 ) + … + E ( X n ) = p + p + ... + p = n p
dir.
Beklenen değerlerin var olması halinde, rasgele değişkenlerin toplamının beklenen
değeri, beklenen değerlerinin toplamına eşittir. Eğer rasgele değişkenler bağımsız ise, rasgele
değişkenlerin toplamının varyansı da varyanslarının toplamıdır. Yani, X ve Y sonlu
beklenen değer ve varyansa sahip iki rasgele değişkenler ise,
E ( X ± Y ) = E ( X ) ± E (Y )
dir.
Var ( X ± Y ) = Var ( X ) + Var (Y ) ± 2 Cov( X , Y )
188
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
Şimdi, bu eşitliklerin doğru olduğunu gösterelim. X , Y kesikli ve olasılık fonksiyonu
(sürekli ise toplam yerine integral gelir) P ( X = x, Y = y ) olmak üzere E ( X ± Y ) beklenen
değeri
E( X ± Y ) = ∑
∑ ( x ± y )P( X = x, Y = y )
x∈DX y∈DY
= ∑
∑ [ x P ( X = x , Y = y ) ± y P ( X = x, Y = y ) ]
x∈DX y∈DY
= ∑ x ∑ P ( X = x, Y = y ) ± ∑ y ∑ P ( X = x , Y = y )
x∈DX
y∈DY
y∈DY
x∈DX
= ∑ x P( X = x) ± ∑ y P(Y = y ) = E ( X ) ± E (Y )
x∈DX
y∈DY
olur. Yani, E ( X ± Y ) = E ( X ) ± E (Y ) dir. Benzer şekilde varyans da,
Var ( X ± Y ) = E[( X ± Y )2 ] − [ E( X ± Y )]2
= E[ X 2 + Y 2 ± 2 XY ] − [( E( X ))2 + ( E(Y ))2 ± 2 E( X ) E (Y )]
= [ E( X 2 ) − ( E( X ))2 ] + [ E(Y 2 ) − ( E (Y ))2 ] ± 2[ E ( XY ) − E ( X ) E(Y )]
= Var ( X ) + Var (Y ) ± 2 Cov( X , Y )
dir.
X1, X 2 ,… , X n bağımsız Bernoulli rasgele değişkenleri olduğundan, i ≠ j için
Cov( X i , X j ) = 0 dır. Dolayısı ile Binom dağılımının varyansı,
Var ( X ) = Var ( X1 + X 2 + … + X n )
= Var ( X1 ) + Var ( X 2 ) + … + Var ( X n ) = pq + pq + ... + pq = n p q
dir. Diğer taraftan, Bernoulli dağılımının moment çıkaran fonksiyonu M X i (t ) = q + pet
olduğundan Binom dağılımının moment çıkaran fonksiyonu da,
n
n
(
i =1
) (
M X (t ) = M X1 +…+ X n (t ) = ∏ M X i (t ) = ∏ q + pet = q + pet
i =1
olarak bulunur. Kümülant üreten fonksiyonu,
K X (t ) = (t ) = ln( K X (t )) = ln[(q + pet )n ] = n ln(q + pet )
olup kümülantlar
Kn =
d n K X (t )
d tn
t =0
)
n
ÖZEL DAĞILIMLAR
189
eşitliği ile hesaplanır. Kümülantlardan ilk dört tanesi,
K1 =
K2 =
d K X (t )
dt
( q + p et )
t =0
d 2 K X (t )
dt
n p et
=
=
2
t =0
= n p = E( X )
t =0
n p et
t
(q + p e )
−
n p 2 e2 t
= n p − np 2
t 2
(q + p e )
t =0
= np (1 − p ) = n p q = Var ( X )
K3 =
d 3 K X (t )
n p et
=
d t3
(q + p et )
t =0
−
3n p 2 e2 t
( q + p et ) 2
+
2n p 3 e3 t
( q + p et )3
t =0
= n p − 3np 2 + 2n p 3
K4 =
d 4 K X (t )
d t4
=
t =0
n p et
(q + p et )
2
−
3
= n p − 7 np + 12 n p − 6 n p
3n p 2 e2 t
( q + p et ) 2
+
2n p 3 e3 t
( q + p et )3
t =0
4
olarak hesaplanmıştır. Dağılımın çarpımsal moment üreten fonksiyonu ise,
n
n
n n
 n
N X (t ) = E (t X ) = ∑ t x P( X = x) = ∑ t x   p x q n− x = ∑   (t p) x qn− x = (q + p t )n
x=0
x=0  x 
x=0  x 
olup dağılımın çarpımsal momentlerinden ilk üç tanesi ( p + q = 1 )
E( X ) =
d N X (t )
dt
E ( X ( X − 1)) =
= n(q + p t ) n−1 p
t =1
d 2 N X (t )
dt
t =1
= n p (n − 1) p (q + p t ) n− 2 p
2
t =1
E ( X ( X − 1)( X − 2)) =
=np,
d 3 N X (t )
dt
t =1
= n (n − 1) p 2 ,
= n p3 (q + p t ) n−3 (n 2 − 3n + 2)
3
t =1
t =1
= n (n 2 − 3n + 2) p3
olarak hesaplanmıştır.
n ∈ için X n rasgele değişkenlerinin moment çıkaran fonksiyonu M X n (t ) , sıfır
noktasının her komşuluğunda bir X rasgele değişkeninin moment çıkaran fonksiyonuna
( M X (t ) diyelim) yakınsıyorsa, X n lerin dağılım fonksiyonlarının dizisi de X in dağılım
fonksiyonuna yakınsar. Yani,
190
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
lim M X n (t ) = M X (t ) ise lim FX n ( x) = FX ( x)
n→∞
n→∞
dir.
Rasgele değişkenlerin moment çıkaran fonksiyonu bazen olmayabilir. Böyle
durumlarda karekteristik fonksiyonu kullanılır. n ∈ için X n rasgele değişkenlerinin
karekteristik fonksiyonları ( ϕ X n (t ) ) bir X rasgele değişkenin karekteristik fonksiyonuna
( ϕ X (t ) ) yakınsıyorsa, dağılım fonksiyonları da yakınsar. Yani,
lim ϕ X n (t ) = ϕ X (t ) ise lim FX n ( x) = FX ( x)
n→∞
n→∞
dir.
5.1.3. Çok Terimli Dağılım (Multinomial Distribution)
Bernoulli deneyinde sadece iki sonuç vardır. Olabilir sonuçlarının sayısı ikiden fazla
olan deneyler Bernoulli deneyi değildir. Örneğin, bir kavanozun içinde k farklı renkte top
bulunsun. Bu kavanozdan çekilen topun tekrar yerine konulması koşulu ile n tane top
çekelim. Buna göre, her bir denemede siyah top gelmesi olasılığı aynıdır. Kırmızı veya sarı
top gelmesi olasılıkları da aynıdır. Dolayısı ile, deneyin birbirinden ayrık k farklı sonucu
vardır. Siyah top gelmesi olayı E1 ise X 1 de gelen siyah topların sayısı olur. Kırmızı top
gelmesi olayı E2 ise X 2 kırmızı topların sayısını, E3 de sarı top gelmesi olayı ise X 3 , sarı
topların sayısı olarak tanımlanabilir. Denemeler birbirinden bağımsız ve herbir denemede
siyah top gelmesi olasılığı ( E1 olayının gerçekleşmesi olasılığı) aynıdır. Buna göre, X 1
rasgele değişkeninin değer kümesi DX1 ile X 2 rasgele değişkeninin değer kümesi aynıdır
( DX1 = DX 2 = {0,1, 2,3,..., n} ).
E1, E2 ,..., Ek ler bir deneyin ayrık sonuçları olsun. ( X 1 , X 2 ,… , X k ) bağımsız rasgele
değişkenleri de Ei olaylarının kaç defa gözlendiğini saysın. Yani, n bağımsız denemede
X1 rasgele değişkeni E1 olayının kaç defa gözlendiğini, X 2 de E2 olayının kaç defa
gözlendiğini saysın. P ( Ei ) = pi olmak üzere, ( X 1 , X 2 ,… , X k ) rasgele vektörünün olasılık
fonksiyonu x1 + x2 + ... + xk = n , p1 + p2 + ... + pk = 1 ,
için
xi = 0,1, 2,..., n ve i = 1, 2,..., k
ÖZEL DAĞILIMLAR
191
P ( X1 = x1, X 2 = x2 ,… , X k = xk ) =
n!
x
x x
p1 1 p2 2 ... pk k
x1 ! x2 !... xk !
dir. Şimdi bunun bir olasılık fonsiyonu olduğunu gösterelim. i = 1, 2,3,.., k için pi , xi ∈ ve x1 + x2 + ... + xk = n olmak üzere çok terimli Binom açılımı,
n n − x1
n− x1 −...− xk −1
x1 =0 x2 =0
xk =0
n
( p1 + p2 + ... + pk ) = ∑ ∑ ...
∑
n!
x
x x
p1 1 p2 2 ... pk k
x1 ! x2 !...xk !
şeklindedir. Bunun için,
n n 
x
( p1 + p2 + ... + pk ) n = ( p1 + ( p2 + ... + pk ))n = ∑   p1 1 ( p2 + ... + pk )n − x1
x1 =0  x1 
n − x1  n − x 
1
x2
n− x − x
( p2 + ... + pk ) n− x1 = ( p2 + ( p3 + ... + pk )) n− x1 = ∑ 
 p2 ( p3 + ... + pk ) 1 2
x
2 
x2 =0 
olup, böyle devam ederse,
  n − x1   n − x1 − ... − xk −1  x1 x2
xk
 p1 p2 ... pk
... 
 
x
x
x
 1  2  
k

n − x1 −...− xk −1  n
n n − x1
( p1 + p2 + ... + pk ) n = ∑ ∑ ...
∑
x1 = 0 x2 =0
xk =0
elde edilir. Bununla birlikte,
 n   n − x1   n − x1 − x2   n − x1 − x2 − ... − xk −1 


 ... 
 x 
xk
 1  x2  x3
 

(n − x1 − x2 − ... − xk −1 )!
(n − x1 )!
n!
n!
=
...
=
x1 !(n − x1 )! x2 !(n − x1 − x2 )! xk !(n − x1 − x2 − ... − xk )! x1 ! x2 ! x3 !...xk !
olduğundan
n − x1 −...− xk −1  n
n n− x1
( p1 + p2 + ... + pk )n = ∑ ∑ ...
x1=0 x2 =0
∑
xk =0
n n − x1
n − x1−...− xk −1
= ∑ ∑ ...
∑
x1=0 x2 =0
xk =0
  n − x1   n − x1 − .. − xk −1  x1 x2 xk
 p1 p2 .. pk
... 
 x 
xk
 1  x2  

n!
x
p1x1 p2x2 ... pk k
x1 ! x2 !..xk !
şeklinde çok terimli Binom açılımı elde edilmiş olur. p1 + p2 + ... + pk = 1 olduğundan,
n
n − x1
n − x1 −...− xk −1
∑ ∑ ...
x1 =0 x2 =0
∑
xk =0
P ( X 1 = x1 , X 2 = x2 ,… , X k = xk )
192
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
n
n − x1
n − x1 −...− xk −1
= ∑ ∑ ...
∑
x1 =0 x2 =0
xk =0
n!
p1x1 p2x2 ... pkxk = ( p1 + p2 + ... + pk )n = 1
x1 ! x2 !...xk !
olup x1 + x2 + ... + xk = n , p1 + p2 + ... + pk = 1 , xi = 0,1, 2,..., n ve i = 1, 2,..., k olmak
üzere
P ( X1 = x1, X 2 = x2 ,… , X k = xk ) =
n!
x
x x
p1 1 p2 2 ... pk k
x1 ! x2 !... xk !
şeklinde verilen fonksiyon bir olasılık fonksiyonudur.
Örnek 5.1.1 Bir kavanozda 5 siyah, 4 kırmızı ve 3 sarı top vardır. Çekilen topları tekrar
yerine koyarak kavanozdan 6 top çekelim. Çekilen topların 3 siyah, 2 kırmızı ve 1 sarı
olması olasılığını hesaplayalım. Burada olaylar her bir deneme için
E1 = {siyah top çekilmesi} , E2 = {kırmızı top çekilmesi} , E3 = {sarı top çekilmesi}
olarak yazıldığında E1 , E2 ve E3 olayları örnek uzayın bir parçalanmasını oluşturur. Her
bir olayın gerçekleşme olasılıkları ( n = 6 )
p1 = P ( E1 ) = 5 /12 ,
p2 = P ( E2 ) = 4 / 12 , p3 = P ( E3 ) = 3 / 12
şeklinde olup aranan olasılık,
3
P ( X1 = 3, X 2 = 2, X 3 = 1) =
2
1
6!  5   4   3  6!(53 )(42 )(3) 625
=
≅ 0.121
      =
3! 2!1!  12   12   12 
5184
3!2!1!(12)6
dır ⊕
5.1.4. Geometrik Dağılım
Bağımsız Bernoulli denemelerine ilk başarıyı elde edinceye kadar devam edelim. X
ilk başarıyı elde edinceye kadar yapılan denemelerin sayısı olsun. Bu durumda denemeler
B c B c Bc . . . . B c Bc
x −1 tane başarısız deneme
B
son deneme
şeklinde olacaktır. Binom deneyinde n deneme sayısı sabit olup bu n denemedeki
başarıların sayısı ile ilgileniyoruz. Oysa, geometrik deneyde başarı sayısı sabir (bir) olup bu
başarıyı elde edinceye kadar yapılan denemelerin sayısı ile ilgileniyoruz. x . denemede
başarı elde etmek için x − 1 defa başarısız denemenin gerçekleşmiş olması gerekir. Buna
göre, X in olasılık fonksiyonu, p başarı olasılığını göstermek üzere q = 1 − p için,
ÖZEL DAĞILIMLAR
193
P( X = x) = p q x −1 , x = 1, 2,3,...
şeklinde olur. Bu olasılık fonksiyonuna sahip X rasgele değişkenine Geometrik dağılıma
sahiptir denir ve X ~ Geometrik ( p ) veya X ~ Geo( p ) ile gösterilir.
Bu fonksiyon,
∞
∞
∞
∞
x =1
x =1
x =1
y =0
∑ P( X = x) = ∑ p q x−1 = p ∑ q x−1 = p ∑ q y =
p
p
= =1
1− q p
olduğundan bir olasılık fonksiyonudur. Dağılımın ilk iki momenti,
∞
∞
x =1
x =1
∞
d x
d ∞ x
q =p
∑q
dq x =1
x =1 dq
( )
E ( X ) = ∑ x P ( X = x) = ∑ x p q x −1 = p ∑
=p

d  1
d  1 −1 + q 
d  q 
− 1 = p 

= p 
=
dq  1 − q 
dq  1 − q 
dq  1 − q 
 1− q + q  p
1
p
=
=
 (1 − q )2  p 2 p


ve
∞
∞
∞
x =1
x =1
x =1
E ( X 2 ) = ∑ x 2 P( X = x) = p ∑ x 2 q x −1 = p ∑ x
d x
d ∞
q =p
∑ x qx
dq
dq x =1
( )
d ∞

d  ∞ d x
d   d ∞ x 
= p  ∑ x q x −1+1  = p  q ∑
q  = p q 
∑ q 
dq  x=1 dq 
dq   dq x =1
 dq x=1

 

d  d  1
d  q  1+ q
= p q 
− 1  = p 
= 2
dq  dq  1 − q  
dq  (1 − q ) 2 
p
olarak hesaplanmıştır. Buradan dağılımın varyansı da,
2
Var ( X ) = E ( X 2 ) − ( E ( X ) ) =
1+ q
p
2
−
1
p
2
=
q
p2
şeklinde bulunur.
F(x)
P(X=x)
1,0
0,9
0,8
0,7
0,3
0,25
0,6
0,5
0,20
0,4
0,3
0,2
0,15
0,10
0,05
x
1
2
3
4
5
6
7
x
0,1
1
2
3
4
5
6
7
8
Şekil 5.1.3 Geometrik dağılımının olasılık fonksiyonu ve dağılım fonksiyonu(p=0.3)
Dağılımın moment çıkaran fonksiyonu ise et < (1/ q ) ve t ∈ için,
194
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
∞
∞
x =1
x =1
M X (t ) = E (et X ) = ∑ et x P( X = x) = ∑ et x p q x−1 =
p ∞
p et
∑ (qet ) x =
q x=1
1 − q et
şeklinde hesaplanmıştır.
Örnek 5.1.2 X ~ Geometrik ( p ) olsun. P ( X > n) olasılığı,
n
n −1
x =1
y =0
P ( X > n) = 1 − P ( X ≤ n) = 1 − p ∑ q x −1 = 1 − p ∑ q y = 1 −
p (1 − q n )
= qn
1− q
ve s > t > 0 için {w : X ( w) > s} ⊂ {w : X ( w) > t} olup P ( X > s | X > t ) koşullu olasılığı
P( X > s | X > t) =
olduğundan
P ( X > s, X > t ) P ( X > s ) q s
=
=
= q s −t = P( X > s − t )
P( X > t )
P( X > t ) qt
P( X > s | X > t ) = P( X > s − t )
özelliğine sahiptir.
Kesikli
dağılımlar
içerisinde bu özelliğe (memoryless) sahip tek dağılım Geometrik dağılımdır ⊕
Teorem 5.1.1 Negatif değerler almayan kesikli X rasgele değişkeninin geometrik
dağılıma sahip olması için gerek ve yeter koşul bütün n ler için,
P ( X > x + n | X > x ) = P ( X > n)
özelliğinin sağlanmasıdır.
İspat: X ~ Geometrik ( p ) olsun. X in olasılık fonksiyonu
P( X = x) = p q x −1 , x = 1, 2,3,...
olup Örnek (5.1.2) den P( X > s ) = q s dir. Buradan,
P ( X > x + n | X > x) =
P ( X > x + n , X > x ) P ( X > x + n ) q x+n
=
= x = q n = P( X > n)
P ( X > x)
P( X > x)
q
elde edilir. Böylece, ispatın gerek koşulu ispatlanmış olur. Şimdi, negatif değerler almayan
kesikli X rasgele değişkeni bütün n ler için
P ( X > x + n | X > x ) = P ( X > n)
özelliğini sağlasın. Buradan P ( X ≥ 1) = 1 olduğu açıktır. Bununla birlikte,
P ( X = x + 1) = P ( X > x) − P ( X > x + 1) ve P ( X > x) = P ( X > x − 1) − P ( X = x)
eşitlikleri de sağlanır. P ( X > 1) = q diyelim. Diğer taraftan
ÖZEL DAĞILIMLAR
195
P( X = x + 1) P( X > x) − P( X > x + 1)
P( X > x + 1)
P( X > x + 1, X > x)
=
= 1−
= 1−
P( X > x)
P ( X > x)
P( X > x)
P( X > x)
= 1 − P ( X > x + 1| X > x ) = P( X > 1) = 1 − q
olduğundan, P ( X = x + 1) = (1 − q ) P ( X > x) eşitliği elde edilir. Benzer şekilde,
P ( X = x + 1) = (1 − q ) P ( X > x) = (1 − q ) [ P ( X > x − 1) − P ( X = x)]
= (1 − q ) [ P ( X > x − 1) − (1 − q ) P ( X > x − 1)] = (1 − q ) q P ( X > x − 1)
= (1 − q ) q [ P ( X > x − 2) − P ( X = x − 2)]
= (1 − q ) q [ P ( X > x − 2) − (1 − q ) P ( X > x − 2)]
= (1 − q ) q 2 P ( X > x − 2) = . . . . . = (1 − q ) q x = p q x
dir. Dolayısı ile, X rasgele değişkeni, P( X = x) = p q x −1 , x = 1, 2,3,... şeklinde bir
olasılık fonksiyonuna sahip olduğundan Geometrik dağılıma sahiptir ◊
Teoremin ispatı (özellikle yeter koşul) matematiksel tümevarımla da yapılabilirdi
(birinci baskıda yapıldığı gibi). Teoremden aşağıdaki sonucu yazabiliriz.
Sonuç: Negatif değerler almayan kesikli X rasgele değişkeninin geometrik dağılıma
olması için gerek ve yeter koşul bütün k ≥ 0 için P ( X = k + n | X ≥ n) = P ( X = k )
özelliğini sağlamasıdır.
İspat: P ( X = k + n | X ≥ n) koşullu olasılığı
P ( X = k + n | X ≥ n) =
P ( X = k + n , X ≥ n)
P ( X ≥ n)
=
P( X = k + n )
P ( X ≥ n)
olup X Geometrik dağılıma sahip ise olasılık fonksiyonu
P( X = x) = p q x −1 , x = 1, 2,3,... veya P( X = x) = p q x , x = 0,1, 2,3,...
şeklindedir. P( X = k + n) = p q k + n ve P( X ≥ n) = q n olduğundan bu koşullu olasılık için
P ( X = k + n | X ≥ n) =
P( X = k + n )
P ( X ≥ n)
=
p q k +n
q
n
= p q k = P( X = k )
elde edilir. Dolayısı ile teoremin gerek kısmı ispatlanmıştır. Diğer taraftan, negatif değerler
almayan kesikli X rasgele değişkeni P ( X = k + n | X ≥ n ) = P ( X = k ) özelliğine sahip
ise, X in olasılık fonksiyonunun
P( X = x) = p q x , x = 0,1, 2,3,...
196
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
şeklinde olduğununun gösterilmesi gerekir. Önce, P ( X = k + n | X ≥ n ) = P( X = k ) ise
P ( X = k + n ) = P ( X = k ) P ( X ≥ n)
(*)
olduğu açıktır. Şimdi bu özelliğe sahip kesikli X rasgele değişkeninin geometrik dağılıma
sahip olduğunu tümevarım ile gösterelim. n = 1 için (*) eşitliği
P ( X = k + 1) = P ( X = k ) P ( X ≥ 1)
şeklinde yazılabilir. p = P ( X = 0) ve q = 1 − p olsun. k = 1 için olasılık fonksiyonu,
P ( X = 1) = p q olur. (*) ifadesinde P ( X = 1) olasılığı
P( X = 1) = P( X = 0) P( X ≥ 1) = P( X = 0) [1 − P( X < 1)] = P( X = 0) [1 − P( X = 0)] = p q
olup iddia k = 1 için doğrudur. İddia k = m için doğru olsun. Yani, P( X = m) = p q m
olsun. Bu durumda, P( X = m + 1) = p q m+1 olduğunun gösterilmesi gerekir. Bunun için (*)
eşitliği m + 1 için tekrar yazıldığında,
P( X = m + 1) = P( X = m) P( X ≥ 1) = P( X = m)[1 − P( X < 1)]
= P( X = m)[1 − P( X = 0)] = pq m [1 − P] = pq m +1
elde edilir. Yani, negatif değerler almayan kesikli bir X rasgele değişkeni,
P ( X = k + n | X ≥ n ) = P( X = k )
özelliğine sahipse, olasılık fonksiyonu P( X = x) = p q x , x = 0,1, 2,... şeklindedir. Bu da
ispatı tamamlar ◊
Bilindiği gibi, bağımsız Bernoulli denemeleri tekrarlandığında, deneme sayısının sabit
ve her denemede başarı olasılığının aynı olduğu varsayıldı. Gözlenen başarıların sayısı X
Binom dağılımına sahiptir. Bağımsız Bernoulli denemelerinde başarı sayısı sabit (ilk başarı)
ise, yapılan denemelerin sayısı ( Y ), Y ~ Geo( p ) dir. Buna göre, bu iki dağılım arasında bir
ilişkinin olması beklenir. X ~ Binom(n, p ) ise, X in olasılık fonksiyonu
n
P( X = x) =   p x q n − x , x = 0,1, 2,3,..., n
 x
dir. Geometrik dağılımda başarı sayısı 1 olup denemelerin sayısı Y in olasılık fonksiyonu
g ( x) = P(Y = x) = p q x −1, x = 1, 2,3,... dir. Binom dağılımında, 1 başarı elde etme olasılığı
ÖZEL DAĞILIMLAR
197
P( X = 1) = n p q n−1 olup n = x için bu olasılık P( X = 1) = x p q x−1 dir. O halde,
X ~ Binom(n, p ) ve n = x için olasılık fonksiyonu f ( x) ise,
g ( x) = f ( x) / x = p q x −1, x = 1, 2,3,...
şeklinde Geometrik dağılımın olasılık fonksiyonuna dönüşür.
5.1.5. Negatif Binom Dağılımı
Bağımsız Bernoulli denemelerine k başarı elde edinceye kadar devam edelim. Burada,
k tane başarı elde edinceye kadar denemelere devam edileceği için, denemelerin en az k
defa tekrarlanması gerekir. Böylece denemeler, B i ler başarıları ( B1 birinci başarı, B2
ikinci başarı gibi) Bic de başarısız denemeleri göstermek üzere,
1 denem e ve k −1 başarı
x −
c c
c
c c
c
c c
c
c
B B ... B B1 B B ... B B 2 B B ... B B3 B .... B c B k
x denemede k başarı
biçiminde olabilir. Buna göre, k . başarıyı elde edinceye kadar yapılan Bernoulli
denemelerinin sayısı X olmak üzere, x. denemede k . başarıyı elde etme olasılığı,
 x − 1  k x −k
P( X = x) = 
, x = k , k + 1, k + 2,...
p q
 k − 1
şeklinde olur. Bu olasılık fonksiyonuna sahip X rasgele değişkenine Negatif Binom
dağılımına sahiptir denir ve p başarı olasılığını, k de başarıların sayısını göstermek üzere,
X ~ NB (k , p ) ile gösterilir. Şimdi 0 < a < 1 için
∞
( x + k − 1)! x (k − 1)!
a =
x!
(1 − a )k
x =0
∑
eşitliğini hatırlayalım. Bu eşitlikte y = x − k yazıldığında,
∞
 x − 1  k x−k
( x − 1)!
p k ∞ ( x − 1)! x −k
k x −k
p
q
=
p
q
=
q
∑
∑
∑

k
−
1
(
k
−
1)!(
x
−
k
)!
(
k
−
1)!
(
x
−
k
)!


x =k
x =k
x =k
∞
=
p k ∞ ( y + k − 1) y
p k (k − 1)! p k
q =
=
=1
∑
(k − 1)! y =0
y!
(k − 1)! (1 − q )k p k
bulunur. Yani, verilen fonksiyon bir olasılık fonksiyonudur.
198
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
Negatif Binom dağılımına sahip X rasgele değişkeni k . başarıyı elde edinceye kadar
yapılan bağımsız Bernoulli denemelerinin sayısıdır. X1 birinci başarıyı elde edinceye kadar
yapılan denemelerin sayısı, birinci başarıyı elde ettikten sonra ikinci başarıyı elde edinceye
kadar yapılan denemelerin sayısı X 2 ve k − 1 başarıdan sonra k . başarıyı elde edinceye
kadar yapılan denemelerin sayısı da
Xk
olmak üzere
X
rasgele değişkeni
X = X1 + X 2 + … + X k şeklinde yazılır. Burada, her i için X i ler bağımsız X i ~ Geo( p )
olup X = X1 + X 2 + … + X k ~ NB (k , p ) dir. Yani, Negatif Binom rasgele değişkeni,
bağımsız geometrik rasgele değişkenlerin toplamıdır. Buradan, Negatif Binom dağılımın
beklenen değeri ve varyansı
E ( X ) = E ( X1 + X 2 + … + X k ) = E ( X1 ) + X 2 + … + E ( X k ) = k / p
ve
Var ( X ) = Var ( X1 + X 2 + … + X k ) = Var ( X1 ) + Var ( X 2 ) + … + Var ( X k ) = kq / p 2
şeklinde hesaplanır. X ~ NB (k , p ) ise X in moment çıkaran fonksiyonu, Geometrik
dağılımın moment çıkaran fonksiyonu yardımı ile
 p et
M X (t ) = M X1 +…+ X k (t ) = ∏ M X i (t ) = ∏ 
t

i =1
i =1  1 − qe
k
k
  p et
 = 
t
  1 − qe



k
, et < (1/ q )
şeklinde bulunmuştur. Momentlerin doğrudan hesaplanması biraz karmaşıktır. Örneğin,
dağılımın birinci momenti,
∞  x − 1
∞
x ( x − 1)!
pk ∞
x!
k x −k
k x −k
E( X ) = ∑ x 
p
q
=
p
q
=
q x −k
∑
∑

k
−
1
(
k
−
1)!(
x
−
k
)!
(
k
−
1)!
(
x
−
k
)!

x=k 
x =k
x =k
=
pk ∞ ( y + k ) y
pk
k!
k pk
k
q
=
=
=
∑
1
1
k
+
k
+
(k − 1)! y =0 y !
(k − 1)! (1 − q )
p
p
dir. Daha yüksek mertebeden momentler daha da karmaşıktır. Onun için, Negatif Binom
dağılımının özellikleri incelenirken, Negatif Binom rasgele değişkenini bağımsız geometrik
rasgele değişkenlerin toplamı olarak almak, işlemlerin kolay yürütülmesine olanak sağlar.
Negatif Binom rasgele değişkeni, bağımsız Geometrik rasgele değişkenlerinin
toplamıdır.
Ancak
bu
dağılım,
herhangi
bir
şekilde
Binom
dağılımı
ile
ilişkilendirilmektedir. Bunu açıklamak için X ~ Binom(n, p ) ve Y ~ NB (k , p ) olsun.
Burada, X rasgele değişkeni n denemedeki başarıların sayısını gösterirken, Y rasgele
ÖZEL DAĞILIMLAR
199
değişkeni k başarı elde edinceye kadar yapılan denemelerin sayısıdır. Bu rasgele
değişkenler arasında,
P (Y ≤ n) = P ( X ≥ k ) ve P (Y > n) = P ( X < k )
şeklinde bir ilişki vardır. Burada,
a) İlk n denemede k ya da daha fazla başarı gözlenmiş ise, ilk k başarıyı elde etmek
için n ya da daha fazla deneme yapılması gerekir.
b) İlk n denemede k den az başarı gözlenmiş ise, k başarıyı elde etmek için n den
çok deneme yapılması gerekir.
5.1.6. Hipergeometrik Dağılım
Bir kavanozun içinde iki farklı renkte (sarı ve lacivert diyelim) toplam N tane top
bulunduğunu düşünelim. Bunlardan a tanesi sarı geri kalan N − a tanesi lacivert olsun.
Kavanozdan aynı anda n tane top çekelim (bir çeşit iadesiz çekiliş yapıyoruz). X bu n
tane top içindeki sarı topların sayısı olsun. O zaman, x tane sarı top gelmesi olasılığı
(dağılımın olasılık fonksiyonu),
 a  N − a 
 x  n − x 
 , x = 0,1, 2,..., n
P ( X = x) =  
N
 
n 
şeklinde olur. Böyle bir deneme için, X rasgele değişkeninin olasılık fonksiyonu bu
şekilde verilmiş ise, X e Hipergeometrik dağılıma sahiptir denir ve X ~ HYP (n, a, N ) ile
gösterilir. Şimdi bu fonksiyonun bir olasılık fonksiyonu olduğunu gösterelim. Bunun için,
n
N
∑ P( X = x) =  
n 
x =0
−1 n
 a  N − a 
∑  
 = 1 veya
x =0  x  n − x 
n
a N − a  N 
∑  
= 
x =0  x   n − x   n 
olduğunun gösterilmesi gerekir. Bunun için tümevarım yöntemini kullanabiliriz. Önce
iddianın n = 1 için doğru olduğunu gösterelim. n = 1 ise eşitliğin sağ tarafı N dir. Eşitliğin
sol tarafı ise,
1
 a   N − a   a  N − a   a  N − a 
∑  
 =  
 +  
 = ( N − a) + a = N
x =0  x   n − x   0  1 − 0   1  1 − 1 
200
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
olup iddia n = 1 için doğrudur. Şimdi, iddianın n için doğru olduğunu varsayalım ve n + 1
için doğru olduğunu gösterelim. İşlemlerde, m = n + 1 denirse n = m − 1 olup, m .nci
terimin eklenip çıkartılması ile,
n+1  a   N
n

−a
a N − a
  a  N − a
n
a N − a
  a 
∑  
 = ∑  
+ 

 = ∑  
+

x =0  x   n + 1 − x  x =0  x   n + 1 − x   n + 1   0  x =0  x   n + 1 − x   n + 1 
m−1  a   N − a   a 
m  a   N − a   a  N − a   a 
= ∑  
+
=
∑
 

 
 −  
+

x =0  x   m − x   n + 1 x =0  x   m − x   m  m − m   n + 1
 N  a   a   N   N 
=  − +
= =

 m   m   n + 1  m   n + 1
sonucu elde edilir. Yani, iddia her n için doğrudur. Başka bir deyişle, verilen fonksiyon bir
olasılık fonksiyonudur. Hipergeometrik dağılımın beklenen değer ve varyansının hesabı
biraz karmaşıktır. X in beklenen değeri,
n
N
E ( X ) = ∑ x P( X = x) =  
n 
x=0
N
= 
n 
−1 n
 a  N − a   N 
∑ x  
= 
x =0  x  n − x   n 
−1 n
N
= a 
n 
 N − a  N 
a!
∑

= 
x =1 ( x − 1)!( a − x)!  n − x   n 
−1 n −1
−1 n
∑x
x =1
 N −a
a!


x !(a − x)!  n − x 
−1 n−1
a (a − 1)!  N − a 


x =0 y !(( a − 1) − y )!  ( n − 1) − y 
∑
−1
 a − 1  N − a 
 N   N − 1
∑

 = a  

 n   n −1 
x =0  y   ( n − 1) − y 
( N − 1)!
n !( N − n)! na
=a
=
(n − 1)!( N − n)! N ! N
N
olarak hesaplanmıştır. Benzer şekilde (biraz daha karmaşık olmakla birlikte) rasgele
değişkenin varyansı da hesaplanabilir. Hipergeometrik dağılımın beklenen değer ve
varyansı sırası ile
E( X ) =
na
,
N
Var ( X ) =
N −n na 
a
1 − 
N −1 N  N 
dir.
X ~ HYP (n, a, N ) olsun. Bu durumda N → ∞ ve a → ∞ için p pozitif sabit bir sayı
olmak üzere (a / N ) → p ise her bir x = 0,1, 2,..., n için
ÖZEL DAĞILIMLAR
201
−1
 N   a  N − a   n  x
n− x
lim    
, x = 0,1, 2,3,..., n
 =   p (1 − p )
N →∞  n   x  n − x   x 
dir (Bain ve Engelhardt, 1992, sayfa 97). Yani, Hipergeometrik dağılım N → ∞ iken
Binom dağılımına yaklaşır.
Bazen sonlu elemanlı bir kitleden iadesiz çekiliş yapılmak istenebilir. Bir deneyin
sadece iki sonucu varsa (sarı ve lacivert topların bulunduğu bir kavanozdan aynı anda ya da
iadesiz çekiliş yapılması), çekilen örnek sayısı n sabit ve denemeler bağımlı (deneylerde
birinin sonucu diğerini etkiliyorsa) ise böyle durumlarda Hipergeometrik dağılım kullanılır.
Örnek 5.1.3 Bir kavanozda 3 kusurlu, 7 kusursuz parça vardır. Bu kavanozdan aynı
anda 3 parça rasgele seçilsin. Çekilen kusurlu parçaların olasılık fonksiyonunu bulalım. X
çekilen kusurlu parçaların sayısı olup, N = 10 , a = 3 , n = 3 dür.
X in değer kümesi DX = {0,1, 2,3} olup, olasılıklar
3  7 
 

x3− x

P( X = x) =
, x = 0,1, 2,3
10 
 
3 
formülü ile hesaplanır.
X kusurlu parçaların sayısı olmak üzere olasılıklar,
X =x
P ( X = x)
0
35 / 120
1
63 / 120
2
21 /120
3
1/ 120
şeklinde tablo halide yazılabilir ⊕
5.1.7. Kesikli Düzgün Dağılım
Değer kümesi D X = {x1 , x2 ,..., xN } olan X rasgele değişkeninin olasılık fonksiyonu,
P( X = x) =
1
, x = x1 , x2 ,..., xN
N
şeklinde ise X kesikli düzgün dağılıma sahiptir denir. Dağılımın beklenen değer ve
varyansı,
202
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
E( X ) =
N +1
N 2 −1
, Var ( X ) =
2
12
dir.
5.1.8. Poisson Dağılımı
Bir çok deney sürekli bir zaman aralığında yapılır. Böyle bir ortamda gözlenen sonuçlar
kesikli olabilir. Birim zaman aralıkları (dakika, saat, gün, ay, yıl gibi) veya birim uzunluk
(alan veya hacim gibi) sürekli ortamlardır. Örneğin, bir mağazaya belli bir saat dilimi içinde
gelen müşterilerin sayısı, böyle bir deneye örnektir. Bu tür deneylere Poisson deneyleri
denir. X sürekli ortamdaki kesikli sonuçların sayısını göstermek üzere, X in (Poisson
dağılımının) olasılık fonksiyonu, λ > 0 için,
P( X = x) = e− λ λ x / x ! , x = 0,1, 2,3,...
şeklindedir. X rasgele değişkeni bu olasılık fonksiyonuna sahipse, X Poisson dağılımına
sahiptir denir ve
X ~ Poisson(λ ) ile gösterilir. eλ fonksiyonunun sıfır noktası
komşuluğundaki Taylor serisi açılımı
∞ λx
e−λ λ x
−λ
=e ∑
= e − λ eλ = 1
∑ P( X = x) = ∑
x =0
x =0 x !
x =0 x !
∞
∞
olup verilen fonksiyon bir olasılık fonksiyonudur. İkinci ve üçüncü bölümlerde dağılımın
ismi verilmeden bu olasılık fonksiyonuna sahip bir rasgele değişkenin momentleri elde
edildi. Ayrıca, dağılımın üretici fonksiyonları ve özellikleri ikinci ve üçüncü bölümlerde
incelendi. Bunları tekrar hatırlayalım. Dağılımın ilk iki momenti ile varyansı Örnek (2.5.2)
de E ( X ) = λ , E ( X 2 ) = λ + λ 2 ve Var ( X ) = λ olarak elde edilmişti. Dağılımın moment
t
çıkaran fonksiyonu da M X (t ) = eλ ( e −1) dir (Örnek (2.5.3a)). Örnek (2.6.2) de dağılımın
kümülant üreten fonksiyonu, K X (t ) = λ (et − 1) olarak bulunmuş ve bütün kümülantların
aynı olduğu ( K n = λ ) görülmüştü. Dağılımın çarpımsal moment üreten fonksiyonu
N X (t ) = eλ (t −1) olup çarpımsal momentlerin bütün n ler için,
d n N X (t )
dt
=
n
t =1
dn
dt
n
( eλ (t −1) )
= λn
t =1
ÖZEL DAĞILIMLAR
203
şeklinde olduğunu biliyoruz ((Örnek (2.6.3)). Yani,
E ( X ) = λ , E ( X ( X − 1) ) = λ 2 , E ( X ( X − 1)( X − 2) ) = λ 3 ,
E ( X ( X − 1)( X − 2)( X − 3) ) = λ 4 , ... ( X ( X − 1)( X − 2)...( X − n + 1) ) = λ n
dir.
Binom dağılımı ile Poisson dağılımı arasında bir benzerlik kurulabilir. Örneğin, belirli
bir saat dilimi içinde bir mağazaya giren müşterilerin sayısı Poisson rasgele değişkenidir.
Oysa, mağazaya giren (maksimum müşteri sayısı sabit) her müşteriyi başarı olarak
değerlendirirsek, mağazaya giren müşterilerin sayısı Binom dağılımına sahip olur.
X ~ Binom(n, p ) ise dağılımın olasılık fonksiyonunun,
n
P ( X = x ) =   p x q n − x , x = 0,1, 2,..., n
 x
olduğunu biliyoruz. Bu dağılımın beklenen değeri µ = n p ( p = µ / n ) dir. Buradan,
P ( X = x) olasılığı için
x
 n
n!
µ  µ
P ( X = x) = Pn ( x) =   p x q n − x =
  1 − 
x !(n − x)!  n   n 
 x
=
n (n − 1) (n − 2) (n − 3) . . . (n − x + 1)
x! nx
x
n− x
n
µ 
µ
−x
µ 1 −  1 − 
 n  n
 1  2  3 
 x −1 
1 1 − 1 −  1 −  . . . 1 −
n
−x

n  x µ  µ
 n  n  n 

=
µ 1 −  1 − 
x!
 n  n
eşitliği elde edilir. Ayrıca, n yeterince büyük ( µ = n p sabit kalacak şekilde p sabit) ise,
  1  2   3 
 x −1 
lim 1 1 − 1 −  1 −  . . . 1 −
 =1
n  n   n 
n  
n→∞  

ve
 µ
lim  1 − 
n
n→∞ 
−x
n
 µ
= 1 , lim 1 −  = e − µ
n
n→∞ 
dir. Yani, X ~ Binom(n, p ) ve Y ~ Poisson( µ ) olmak üzere, n yeterince büyük ( µ = n p
sabit kalacak şekilde p sabit) ise
204
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
 n
e− µ µ x
Pn ( x) =   p x q n − x ≅
= P (Y = x)
x!
 x
yaklaşımı elde edilir. Yani, Binom dağılımına Poisson dağılımı olarak yaklaşılabilir. Bunun
tersi de olabilir.
1
 n  µ 
P ( X = 1) =   
1   n 
n = 20
n = 30
0.3774 0.3741
0.2702 0.2705
0.1368 0.1413
0.0576 0.0631
0.0211 0.0253
n = 10
µ =1
µ=2
µ =3
µ=4
µ =5
0.3874
0.2684
0.1211
0.0403
0.0098
n −1
 µ
1 − 
n

n = 40
0.3726
0.2706
0.1434
0.0657
0.0274
P (Y = 1) =
n = 50
n = 100
0.3716
0.2706
0.1447
0.0672
0.0286
0.3697
0.2707
0.1471
0.0703
0.0312
e − µ µ1
1!
0.3679
0.2707
0.1494
0.0733
0.0337
Yukarıda, değişik µ değerleri için Y ~ Poisson( µ ) ve X ~ Binom(n, p ) olmak üzere,
p = µ / n alınarak P ( X = 1) ve P (Y = 1) olasılıkları hesaplanarak (değerler dördüncü
basamaktan sonra yuvarlatılmıştır) tablo halinde verilmiştir. Tablodaki değerlerden de
görüldüğü gibi, n değeri büyüdükçe, P ( X = 1) Binom olasılıkları P (Y = 1) olasılıklarına
yaklaşmaktadır.
Örnek 5.1.4 X ~ Poisson(λ ) olsun. E ( X ) = Var ( X ) = λ olduğunu biliyoruz.
a) X rasgele değişkeninin çarpıklık ve basıklık katsayılarını hesaplayalım. Üçüncü ve
dördüncü merkezi momentler E ( X − λ )3 = λ ve E ( X − λ )4 = λ + 3λ 2 olup Poisson
dağılımının çarpıklık ve basıklık katsayıları γ = 1/ λ ve η = 1/ λ dir (Örnek (2.5.5).
b) E ( g ( X )) ve g (−1) sonlu olacak şekilde herhangi bir g fonksiyonu için,
E (λ g ( X )) = E ( X g ( X − 1)) olduğunu gösterelim (Casella ve Berger, 2002, sayfa 126).
E ( X g ( X − 1)) ifadesi y = x − 1 ve x / x ! = 1/ ( x − 1)! olduğu göz önüne alındığında,
∞
∞
E ( X g ( X − 1) ) = ∑ xg ( x − 1) P( X = x) = ∑ xg ( x − 1)
x =0
∞
= ∑ g ( x − 1)
x=1
x =1
e −λ λ x
x!
e λ
e−λ λ y +1 ∞
e −λ λ y
= ∑ g ( y)
= ∑ λ g ( y)
= E ( λ g( X ))
( x − 1)! y =0
y!
y!
y =0
−λ x
şeklinde aranan eşitlik elde edilir.
∞
ÖZEL DAĞILIMLAR
205
c) Bu sonuç kullanılarak, Poisson dağılımının momentleri ardışık olarak hesaplanabilir.
Önce, E ( X ) = λ ve Var ( X ) = λ olduğunu biliyoruz. Aslında, dağılımın ikinci momentinin
E ( X 2 ) = λ + λ 2 olduğunu da biliyoruz. g ( x) = x denirse ikinci moment
E ( X 2 ) = E ( XX ) = E ( X ( X − 1 + 1)) = E ( X ( X − 1) ) + E ( X )
= E (λ g ( X )) + E( X ) = E (λ X ) + E( X ) = λ 2 + λ
olarak da hesaplanır. Benzer şekilde, g ( x) = x 2 için dağılımın üçüncü momenti de
E ( X 3 ) = E ( XX 2 ) = E ( X ( X − 1 + 1)2 ) = E ( X ( X − 1) 2 ) + 2 E ( X ( X − 1) ) + E ( X )
= E ( λ g ( X ) ) + 2 E ( X ( X − 1) ) + E ( X ) = E (λ X 2 ) + 2λ 2 + λ
= λ (λ 2 + λ ) + 2λ 2 + λ = λ 3 + 3λ 2 + λ
şeklinde hesaplanır ⊕
Bu kısma son vermeden önce, burada verilen dağılımlar arasındaki ilişkileri özetleyelim.
1) X1, X 2 ,… , X n bağımsız Bernoulli dağılımına sahip rasgele değişkenler ise,
X = X1 + X 2 + … + X n ∼ Binom ( n , p ) dir.
2) X i , i = 1, 2,..., k için bağımsız ve X i ∼ Binom(ni , p ) ise n = n1 + n2 + ... + nk için,
X = X1 + X 2+ ... + X k ∼ Binom(n, p ) dir.
3) i = 1, 2,..., k için bağımsız ve X i ∼ Geo( p ) ise X = X1 + ... X k ∼ NB (k , p ) dir.
4) X i , i = 1, 2,..., k için bağımsız ve Poisson (λi ) ise, λ = λ1 + ... + λk olmak üzere
X = X1 + ... + X k ∼ Poisson(λ ) dır.
5.2. Tek Değişkenli Sürekli Dağılımlar
5.2.1. Sürekli Düzgün Dağılım
Olasılık yoğunluk fonksiyonu a, b ∈ ve a < b olmak üzere,
 1

f ( x) =  b − a
 0
, a< x<b
, d . y.
206
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
şeklinde olan bir X rasgele değişkenine (a , b ) aralığında sürekli düzgün dağılıma sahiptir
denir ve X ~ U (a, b) ile gösterilir. Sürekli düzgün dağılım yerine genellikle sadece düzgün
dağılım ifadesi kullanılır.
F(x)
f(x)
1
b-a
x
x
0
a
0
b
a
b
Şekil 5.2.1 Düzgün dağılımın olasılık yoğunluk fonksiyonu ve dağılım fonksiyonu
Olasılık yoğunluk fonksiyonu ile dağılım fonksiyonunun grafikleri Şekil (5.2.1) de
verildiği gibi olup dağılımın ilk iki momenti ile varyansı
b
b
a
a
1
a+b
E ( X ) = ∫ x f ( x) dx =
x dx =
,
∫
2
b−a
Var ( X ) = E ( X 2 ) − ( E ( X ))2 =
(b − a)
12
b
1
a 2 + b 2 + ab
2
E( X ) =
x dx =
b−a ∫
3
2
a
2
şeklinde hesaplanmıştır. Ayrıca, a < c1 < c2 < b olmak üzere P (c1 < X < c2 ) olasılığı,
c2
c2
P(c1 < X < c2 ) = ∫ f ( x)dx = ∫
c1
c1
f(x)
c −c
1
dx = 2 1
b−a
b−a
P(c 1 <x c 2 )
1
b-a
dir.
x
5.2.2. Gamma Dağılımı
0
a c1
Bu dağılımın özelliklerine geçmeden Gamma dağılımı ile ilgili,
∞
Γ(α ) β α = ∫ xα −1e− x / β d x , Γ(n + 1) = n !, Γ(α + 1) = α Γ(α ) , 0! = 1
0
eşitliklerini hatırlayalım. Buradan,
 xα −1e− x / β
, x>0

f ( x) =  Γ(α ) β α

0
, d . y.

şeklinde tanımlanan f fonksiyonunun tanım kümesi üzerinden integrali
c2 b
ÖZEL DAĞILIMLAR
207
∞
∫ f ( x)dx = 1
0
olduğundan f ( x) fonksiyonu bir olasılık yoğunluk fonksiyonudur. X rasgele değişkeni böyle
bir olasılık yoğunluk fonksiyonuna sahip ise X Gamma dağılımına sahiptir denir ve
X ~ Gamma (α , β ) ile gösterilir. X ~ Gamma (α , β ) ise n ∈ için
n
E( X ) =
∫
∞ n α −1 − x/ β
n
x f ( x) dx = ∫
x x
Γ(α ) β α
0
x∈DX
e
dx =
∞ n+α −1 − x/ β
1
Γ(α ) β α
∫
0
x
e
Γ(α ) β α
Γ(α + n) β n
dx =
Γ(α )
olup dağılımın bütün momentleri E ( X n ) = Γ(α + n) β n / Γ(α ) eşitliğinden elde edilir.
Buradan dağılımın ilk iki momenti ve varyansı,
E( X ) =
Γ(α + 1) β α Γ(α ) β
=
=α β
Γ(α )
Γ(α )
E( X 2 ) =
Γ(α + 2) β 2 (α + 1) Γ(α ) β 2 α (α + 1)Γ(α ) β 2
=
=
= α (α + 1) β 2
Γ(α )
Γ(α )
Γ(α )
2
2
Var ( X ) = E ( X 2 ) − ( E ( X ) ) = α (α + 1) β 2 − (α β ) = α β 2
dir. X ~ Gamma (α , β ) ise dağlımın moment çıkaran fonksiyonu da Gamma fonksiyonunun
özelliklerinden t < 1/ β için
M X (t ) = E (et X ) =
tx
∫ e f ( x) dx =
x∈DX
∞
∞
1
Γ(α ) β
α
t x α −1 − x / β
dx
∫e x e
0
α
Γ(α ) ( β / (1 − t β ) )
α
 1 
x e
dx =
=
=

α ∫
α
Γ(α ) β 0
Γ(α ) β
 1− tβ 
şeklinde bulunmuştur. a, b ∈ ve a < b olmak üzere P ({w : a < X ( w) < b}) veya kısaca
1
α −1 − x (1−t β )/ β
b
P (a < X < b) olasılığı
∫ f ( x) dx integrali ile hesaplanır. Örneğin, X ~ Gamma(3, 2) için
a
P (2 < X < 4) = 0.243 olarak hesaplanmıştır. Bu olasılık aşağıda (Şekil (5.2.2)) gösterilen
taralı alandır.
Olasılık ve istatistikte çok karşılaşılan dağılımların bazıları (Üstel ve Ki-kare gibi)
Gamma dağılımının özel halidir. Şimdi, bu özel durumları inceleyelim.
208
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
Şekil 5.2.2 α = 3 , β = 2 için Gamma dağılımının olasılık yoğunluk fonksiyonu
2a Üstel Dağılım
X ~ Gamma (α , β ) olsun. α = 1 için X in olasılık yoğunluk fonksiyonu,
(1/ β ) e− x / β
f ( x) = 
 0
, x>0
,
d . y.
şeklinde olup X rasgele değişkeni üstel dağılıma sahiptir ve X ~ Üstel ( β ) ile gösterilir.
Dağılımın momentleri ve varyansı Gamma dağılımının momentlerinde α = 1 yazılarak
bulunur. Yani,
E ( X ) = β , E ( X 2 ) = 2 β 2 ve Var ( X ) = αβ 2
dir. X ~ Gamma (α , β )
dağılımının bütün momentlerinin E ( X k ) = β k Γ(α + k ) / Γ(α )
şeklinde olduğundan α = 1 için Γ(k + 1) = k ! olup üstel dağılımın bütün momentleri
E ( X k ) = k ! β k şeklindedir. Dağılımın moment çıkaran fonksiyonu da Gamma dağılımının
moment çıkaran fonksiyonunda α = 1 yazılarak bulunur. Yani, X ~ Üstel ( β ) dağılımının
moment çıkaran fonksiyonu t < 1/ β için M X (t ) = 1/ (1 − t β ) dir. Üstel dağılımın olasılık
yoğunluk fonksiyonu ile dağılım fonksiyonunun grafikleri β = 5 için Şekil (5.2.3) de
verildiği gibidir.
Şekil 5.2.3 β = 5 için üstel dağılımın olasılık yoğunluk fonksiyonu ve dağılım fonksiyonu
Bir X rasgele değişkeninin ortancası (medyanı) P ( X ≥ m) ≥ 1/ 2 ve P ( X ≤ m) ≥ 1/ 2
koşullarını sağlayan bir m sayısıdır. Bu olasılıklar
ÖZEL DAĞILIMLAR
209
P( X ≥ m) = e− m / β ve P( X ≤ m) = 1 − e− m / β
olup dağılımın medyanı e− m / β = 1 − e− m / β eşitliğinden m = − β ln(1/ 2) = β ln(2) olarak
elde edilir. Yani, Üstel dağılımın medyanı m = β ln(2) dir.
2b Ki-Kare Dağılımı
X ~ Gamma (α , β ) olsun. α = p / 2 ve β = 2 için olasılık yoğunluk fonksiyonu,
 x ( p /2)−1e − x /2

f ( x) =  Γ( p / 2) 2 p /2

0

, x>0
,
d . y.
olur. Olasılık yoğunluk fonksiyonu bu şekilde olan X rasgele değişkenine serbestlik derecesi
p olan ki-kare dağılımına sahiptir denir ve X ~ χ 2p ile gösterilir. Dağılımın momentleri
Gamma dağılımının momentlerinde α = p / 2 ve β = 2 yazılarak bulunur. Yani,
E ( X ) = α β = ( p / 2) 2 = p ve Var ( X ) = α β 2 = ( p / 2) 22 = 2 p
dir. Ki-kare dağılımının beklenen değeri serbestlik derecesine, varyansı da serbestlik
derecesinin iki katına eşittir. Bu dağılım, ileride göreceğimiz normal dağılan bir rasgele
değişkenin fonksiyonu (karesi) olarak da karşımıza çıkmaktadır ve istatistikte çok kullanılan
dağılımlardan biridir. Dağılımın olasılık yoğunluk fonksiyonunun grafiği, p = 6 için
aşağıdadır. Ayrıca, X ~ χ 62 olmak üzere P (10 < X < 14) olasılığı Şekil (5.2.4) de belirtilen
taralı alandır.
Şekil 5.2.4 p = 6 için ki-kare dağılımının olasılık yoğunluk fonksiyonu
X ~ χ 62 olmak üzere P(10 < X < 14) olasılığı, Γ(6 / 2) 26/2 = 16 olup
14
14
1 2 − x /2
x e
dx = 0.0950158556 ≅ 0.095
16
10
P(10 < X < 14) = ∫ f ( x)dx = ∫
10
210
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
olarak hesaplanmıştır. Bu dağılım istatistikte çok kullanılan dağılımlardan biri olduğu için
değişik serbestlik dereceleri için olasılıklar hesaplanmış ve tablolaştırılmıştır. Bu tablolar
hemen hemen birçok istatistik kitabında bulunmaktadır. Örneğin, X ~ χ 62 dağılımı için
P (10.64 < X < 14.45) olasılığı (Maple VIII)
14.45
P(10.64 < X < 14.45) = ∫
14.45
1 2 − x /2
x e
dx = 0.07516647661 ≅ 0.075
10.64 16
f ( x)dx = ∫
10.64
olarak hesaplanmıştır. Tablo değerleri (ki-kare dağılım tabloları) kullanılarak aynı olasılık,
P (10.64 < X < 14.45) = FX (14.45) − FX (10.64) = 0.975 − 0.900 = 0.075
olarak bulunmuştur.
2c Weibull Dağılımı
X ~ Üstel ( β ) olsun. γ > 0 için Y = X γ dönüşümünün olasılık yoğunluk fonksiyonu,
( γ / β ) yγ −1e− yγ / β
f ( y) = 
 0
,
y > 0 , β > 0, γ > 0
,
d . y.
dir. Olasılık yoğunluk fonksiyonu bu şekilde olan Y rasgele değişkenine Weibull
dağılımına sahiptir denir. Dağılımın ilk iki momenti
E (Y ) = (1/ β )
−1/ γ
E (Y 2 ) = (1/ β )
Γ (1 + (1/ γ ) ) = β 1/ γ Γ ( (γ + 1) / γ )
−2/γ
,
 γ +1 1 
γ +2
Γ
+  = ( β )2/γ Γ 

γ
 γ
 γ 
dır. Burada, δ = 1/ γ denirse momentler
Eδ (Y ) = β δ Γ(δ + 1) ve Eδ (Y 2 ) = β 2δ Γ(2δ + 1)
şeklinde yazılır. Buradan,
Varδ (Y ) = β 2δ [Γ(2δ + 1) − (Γ(δ + 1)) 2 ] olup δ nın değişik
değerleri için dağılımın varyansı
δ
Var (Y )
1/ 2
β (1 − π / 4 )
1
β
2
2
20 β 4
şeklinde hesaplanmıştır. Weibull dağılımının olasılık yoğunluk fonksiyonunun grafiği de
γ = 2 ve β = 4 için Şekil (5.2.5) de verilmiştir.
ÖZEL DAĞILIMLAR
211
γ = 2 , β = 4 için dağılımın olasılık yoğunluk fonksiyonu,
0.5 y e− y 2 /4
f ( y) = 
0

,
y>0
,
d . y.
şeklinde olup P (3 < Y < 4) olasılığı,
4
4
P(3 < Y < 4) = ∫ f ( x)dx = ∫ 0.5 y e − y
3
2
/4
dy = 0.08708358567 ≅ 0.087
3
olarak hesaplanmıştır. Bu olasılık da, Şekil (5.2.5) de gösterilen taralı alandır.
Şekil 5.2.5 γ = 2 , β = 4 için Weibull dağılımının olasılık yoğunluk fonksiyonu
5.2.3. Beta Dağılımı
Matematikte Beta fonksiyonu,
1
Beta (α , β ) = ∫ xα −1 (1 − x) β −1 dx
0
olarak tanımlanır ve Beta ve Gamma fonksiyonları arasında
Beta (α , β ) =
Γ(α )Γ( β )
Γ(α + β )
şeklinde bir ilişki vardır. Buradan,
 Γ(α + β ) α −1
x (1 − x) β −1 , 0 < x < 1

f ( x) =  Γ(α )Γ( β )

0
, d . y.

şeklinde tanımlanan fonksiyonun tanım bölgesi üzerinden integrali 1 dir. Yani, bu
fonksiyon bir olasılık yoğunluk fonksiyonudur. Böyle bir olasılık yoğunluk fonksiyonuna
sahip X rasgele değişkenine Beta dağılımına sahiptir denir ve X ~ Beta (α , β ) ile
gösterilir. Bütün n ∈ için
212
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
1
Γ (α + β ) 1 n +α −1
E ( X ) = ∫ x f ( x)dx =
x
(1 − x) β −1 dx
Γ (α ) Γ ( β ) ∫
n
n
0
=
0
Γ (α + β ) Γ (α + n ) Γ ( β )
Γ (α ) Γ ( β ) Γ (α + n + β )
=
Γ (α + n )
Γ (α + β )
Γ (α + n + β )
Γ (α )
olduğundan dağılımın momentleri
E( X n ) =
Γ (α + n )
Γ (α + β )
Γ (α + n + β )
Γ (α )
formülü ile hesaplanır. Bu formülden dağılımın ilk iki momenti,
E( X ) =
Γ (α + 1)
Γ (α + β )
Γ (α + 1 + β )
Γ (α )
E( X 2 ) =
=
Γ (α + 2 )
Γ (α + β )
Γ (α + 2 + β )
Γ (α )
α Γ (α )
Γ (α + β )
α
=
( α + β ) Γ ( α + β ) Γ (α ) (α + β )
=
α (α + 1)
(α + β )(α + β + 1)
olup dağılımın varyansı da,
Var ( X ) =
αβ
(α + β ) (α + β + 1)
2
dir. X ~ Beta (α , β ) dağılımı α = β = 1 için X ~ U (0,1) dir. Yani düzgün dağılım, Beta
dağılımının özel halidir. X ~ Beta (2, 2) dağılımının olasılık yoğunluk fonksiyonunun
grafiği aşağıda Şekil (5.2.6) da vwerilmiştir.
f (x)
f (x)
1,4
1,4
1,2
1
1,2
1
0,8
0,8
0,6
0,4
0,2
0,6
0,4
0,2
0
0,2
0,4
0,6
0,8
1
,5
=0
)
0,5
X<
<
0
P(
0
0,2
0,4 0,5 0,6
0,8
Şekil 5.2.6 Beta (2, 2) dağılımının olasılık yoğunluk fonksiyonu
X ~ Beta (2, 2) ise olasılık yoğunluk fonksiyonu,
6 x(1 − x) , 0 < x < 1
f ( x) = 
0
,
d . y.

şeklinde olup P (0 < X < 0.5) olasılığı
1
ÖZEL DAĞILIMLAR
213
0.5
0.5
P(0 < X < 0.5) = ∫ 6 x(1 − x) dx = (2 x3 − 3x 2 )
= 0.5
x =0
0
olarak hesaplanmıştır.
Örnek 5.2.1 Yukarıda, Beta (α , β ) fonksiyonu ile Gamma (α , β ) fonksiyonu arasındaki
ilişki verildi. Beta ve Gamma dağılımları arasında da benzer bir ilişki beklenebilir. X ve Y
bağımsız X ~ Gamma (n, θ ) , Y ~ Gamma (m, θ ) olsun. U = X / ( X + Y ) dönüşümünün
dağılımı U ~ Beta (n, m) dir. Şimdi bunu gösterelim.
X ve Y bağımsız olduğundan ortak olasılık yoğunluk fonksiyonu,
f ( x, y ) =
1
Γ(n)Γ(m)θ
n+ n
x n −1 y m−1e− ( x+ y )/θ , x > 0, y > 0
şeklinde yazılır. V = X + Y
yardımcı dönüşümü ile ters dönüşümler X = U V
ve
Y = V (1 − U ) olur. Ayrıca, DU = (0,1) ve DV = + olduğu açıktır. Jacobien matrisi ve
determinantı,
∂ x
∂u
J =
∂ y
∂u

∂x
∂v   v
u 
=
⇒ det ( J ) = v
∂ y   −v 1 − u 
∂ v 
olup U ile V nin ortak olasılık yoğunluk fonksiyonu, , v > 0 , 0 < u < 1 için
fU ,V (u, v) =
v ( uv )
n−1 m −1
v
(1 − u ) m−1 e −v /θ
Γ(n)Γ(m)θ n + m
=
u n−1 (1 − u ) m−1 v n + m−1e −v /θ
Γ(n)Γ(m)θ n+ m
olarak elde edilir. Buradan U nun marjinal olasılık yoğunluk fonksiyonu, ortak olasılık
yoğunluk fonksiyonunun DV üzerinden integrali ile bulunur. Gamma fonksiyonunun
özelliğinden faydalanılarak U nun olasılık yoğunluk fonksiyonu 0 < u < 1 için,
∞
fU (u ) =
∫
fU ,V (u , v) dv =
v=0
n −1
=
u
(1 − u )
u n−1 (1 − u )m−1
Γ(n)Γ(m)θ
m−1 n + m
θ
Γ(n)Γ(m)θ
Γ ( n + m)
n+ m
n+ m
=
∞
∫
v n + m −1e −v /θ dv
v=0
Γ(n + m) n −1
u (1 − u ) m−1
Γ ( n )Γ ( m )
214
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
olarak bulunmuştur. Bu fonksiyon da U ~ Beta (n, m) dağılımının olasılık yoğunluk
fonksiyonudur ⊕
5.2.4. Cauchy Dağılımı
X rasgele değişkeninin olasılık yoğunluk fonksiyonu,
f ( x) =
1
1
π 1 + ( x − θ )2
, x∈
şeklinde ise, X Cauchy dağılımına sahiptir denir ve X ~ Cauchy (θ ) ile gösterilir. Bu
fonksiyon,
∞
∫
−∞
∞
f ( x)dx =
1
∫
−∞
1
π 1 + ( x − θ )2
dx =
1
π
( arctan(∞) − arctan(−∞) ) =
1 π
π  2
 π 
−  −  = 1
 2 
olduğundan bir olasılık yoğunluk fonksiyonudur. Cauchy dağılımının en belirgin özelliği
hiçbir momentinin olmamasıdır. Dağılım θ ya göre simetrik olup θ = 3 için olasılık
yoğunluk fonksiyonunun grafiği aşağıda Şekil (5.2.7) de verilmiştir.
Şekil 5.2.7 θ = 3 için Cauchy dağılımının olasılık yoğunluk fonksiyonu
X rasgele değişkeni Cauchy dağılımına sahip olsun. P (4 < X < 6) olasılığı,
6
P(4 < X < 6) = ∫ f ( x) dx =
4
=
1
π
16
1
1
6
dx = arctan( x − 3) x= 4
∫
π 4 1 + ( x − 3) 2
π
( arctan(3) − arctan(1) ) ≅
1  2π π  3
−
=
= 0.15
π  5 4  20
olarak hesaplanmıştır. Bu olasılık Şekil (5.2.7) de belirtilen taralı bölgenin alanıdır. Benzer
şeklde,
P(3 < X < 4) =
16
1
1
4
dx = arctan( x − 3) x =3
∫
π 4 1 + ( x − 3)2
π
ÖZEL DAĞILIMLAR
=
1
π
215
( arctan(1) − arctan(0) ) =
1 π
 1
 − 0  = = 0.25
π4
 4
dir.
5.2.5. Normal Dağılım
İstatistikte ve bir çok bilim alanında kuşkusuz en çok kullanılan normal dağılımdır.
Bunun nedenlerinden biri, bir sonraki bölümde inceleyeceğimiz merkezi limit teoremi ile
ilgilidir. Merkezi limit teoremine göre, ortalamada hemen hemen bütün dağılımlar normal
dağılıma yakınsar. Kitlelerin bilinmeyenleri hakkında istatistiki sonuç çıkarım için verilerin
normallik varsayımı olmazsa olmaz koşullardan biridir. Normallik özelliğinin sağlanmadığı
durumlarda değişik teknikler ile normallik varsayımı sağlatılmaya çalışılır. Normallik
varsayımı sağlandıktan sonra analizlerin ve devamında istatistiki sonuç çıkarımların
yapılması gerekir. Normal dağılımın uygulamada önemi hakkında ne yazılırsa yazılsın yine
de eksik kalan bir şeyler mutlaka olacaktır.
X rasgele değişkeninin olasılık yoğunluk fonksiyonu µ ∈ , ve σ ∈ + için,
f ( x) =
1
2 π σ2
−
e
1
2σ 2
( x−µ ) 2
, x∈
şeklinde ise X e beklenen değeri µ , varyansı σ 2 olan normal dağılıma sahiptir denir ve
X ~ N ( µ , σ 2 ) ile gösterilir.
X ~ N ( µ , σ 2 ) ise Z = ( X − µ ) / σ rasgele değişkeni beklenen değeri 0 , varyansı 1
olan standart normal dağılıma sahiptir ve Z ~ N (0,1) şeklinde ifade edilir. Standart normal
dağılımın olasılık yoğunluk fonksiyonu da,
f ( z) =
2
1
e− z /2
2π
, z∈
şeklindedir. Standart normal dağılımın olasılıkları için tablolar düzenlenmiştir. Bu tablolar
hemen hemen bütün istatistik kitaplarında bulunmaktadır. Örneğin Z ~ N (0,1) için
P (0 < Z < 1) olasılığı normal dağılım tablosundan 0.3413 olarak bulunur. Bu olasılık
Şekil (5.2.8) de gösterilen taralı bölgenin alanıdır.
216
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
f(z)
0.4
0.4
0.2
0.3
0.2
0.4
)=
413
0.1
75
0.1
.96
<1
<Z
P(0
.3
)=0
<1
<Z
P(0
0.3
f(z)
z
-3
-4
-2
-1
0
1
3
2
z
4
1.96
Şekil 5.2.8 Standart normal dağılımın olasılık yoğunluk fonksiyonu
Standart normal dağılımın olasılık yoğunluk fonksiyonu sıfır noktasına göre simetriktir.
Dolayısı ile, P (−1 < Z < 0) ile P (0 < Z < 1) olasılıkları aynıdır.
Bir h fonksiyonu tanımlı olduğu her x için h(− x) = h( x) özelliğini sağlıyorsa çift,
h(− x) = −h( x) ise tektir. İki çift fonksiyonun çarpımı çift, iki tek fonksiyonun çarpımı da
çift olup, tek bir fonksiyon ile çift bir fonksiyonun çarpımı tektir. Buna göre,
h( z ) = e − z
2
/2
= e−( − z )
2
/2
= h(− z )
2
olduğundan h( z ) = e− z / 2 fonksiyonu çifttir. Ayrıca, g ( z ) = z fonksiyonu ise g (− z ) = − z
= − g ( z ) olduğundan tektir. Buradan a > 0 olmak üzere herhangi bir f fonksiyonu için
a
∫
−a
,
 0
 a
f ( z ) dz = 
 2 ∫ f ( z ) dz ,
 0
f tek bir fonksiyon
f çift bir fonksiyon
2
eşitliği yazılabilir. f ( z ) = z e− z /2 fonksiyonu tek olduğundan,
∞
∫
E(Z ) =
z f ( z ) dz =
−∞
1
2π
∞
z e− z
∫
2
/2
dz = 0
−∞
dır. Dağılımın ikinci momenti ise,
E(Z 2 ) =
∞
∫
z 2 f ( z ) dz =
−∞
1
2π
∞
∫
−∞
z 2 e− z
2
/2
dz =
2
2π
∞
2 −z
∫z e
0
2
/2
dz =
2
2π
2π
=1
2
dir (Maple VIII). Buradan standart normal dağılımın varyansı da,
Var ( Z ) = E ( Z 2 ) − ( E ( Z )) 2 = 1
olur. Z = ( X − µ ) / σ ise X = µ + σ Z olduğundan, X ~ N ( µ , σ 2 ) dağılımının beklenen
değer ve varyansı,
ÖZEL DAĞILIMLAR
217
E ( X ) = E ( µ + σ Z ) = µ + σ E ( Z ) = µ ve Var ( X ) = Var ( µ + σ Z ) = σ 2 Var ( Z ) = σ 2
şeklinde bulunur.
X ~ N ( µ , σ 2 ) ise olasılıklar standart normal dağılıma dönüştürülerek standart normal
dağılım tablosundan bulunur. Örneğin, X ~ N ( µ = 100, σ 2 = 100) ise µ = 100 ve σ = 10
olup Z = ( X − 100) /10 ~ N (0,1) dir. Buradan P (100 < X < 110 ) olasılığı,
 100 − 100 X − 100 110 − 100 
P (100 < X < 110 ) = P 
<
<
 = P ( 0 < Z < 1) = 0.3413
10
10
 10

şeklinde standart normal dağılım tablosundan bulunur.
Şimdi, Z ~ N (0,1) olmak üzere olasılık yoğunluk fonksiyonu z ∈ için
2
1
f ( z) =
e − z /2
2π
fonksiyonun olasılık yoğunluk fonksiyonu olduğunu gösterelim. f ( z ) fonksiyonu çift olup,
∞
∫
−∞
1
f ( z ) dz =
2π
∞
dir. Ayrıca,
∫
e− z
2
/2
∞
∫
e
−z2 / 2
−∞
2
dz =
2π
∞
∫
e
− z2 / 2
∞
2
dz =
∫
π
0
e− z
2
/2
dz
0
dz integralinin doğrudan hesaplanması zordur. İntegralin çift katlı
0
integrale dönüştürülmesi integral hesabını kolaylaştırır.
∞
1=
∫
∞
f ( z ) dz ⇔
∫
e
− z 2 /2

⇔

2

π
dz =
0
−∞
∫
denkliklerinden,
∫
−∞
∞ ∞
f ( z ) dz = 1 için
∫
−( z
∫e
0
0
2
e
− z 2 /2
0
∞
∞
∞
 π
− z 2 /2
−u 2 /2
⇔∫ e
dz   ∫ e
du  =
⇔∫


 2
0
0
 0

∞
2
∞
∞
−( z
∫e

π
dz  =

2

2
+u 2 )/2
dz =
0
+u 2 ) / 2
dzdu =
π
2
π
2
olduğunu göstermek
yeterlidir. r > 0 ve 0 < θ < π / 2 için z = r cos(θ ) ve u = r sin(θ ) kutupsal koordinat
dönüşümlerinden dz du = r dr dθ olup yukarıdaki çift katlı integral,
218
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
∞ ∞
∫ ∫e
0
− ( z 2 +u 2 )/2
∞
∫
dz du =
0
π /2
∫
e−r
r =0 θ =0
∞
− r 2 /2
∫
=
re
2
/2
r dr dθ
π /2
∫
dr
r =0
dθ =
θ =0
π
2
∞
r e−r
∫
2
/2
dr =
r =0
π
2
olarak hesaplanır. Yani, f ( z ) bir olasılık yoğunluk fonksiyonudur.
Z ~ N (0,1) dağılımının moment çıkaran fonksiyonu, M Z (t ) = e t
2
/2
dir. Buradan da,
X ~ N ( µ , σ 2 ) dağılımının moment çıkaran fonksiyonu X = µ + σ Z eşitliğinden,
M X (t ) = M µ +σ Z (t ) = E (e( µ + σ Z ) t ) = e µ t M X (σ t ) = e µ t + σ
2 2
t /2
olarak bulunur.
Örnek 5.2.2 a) Z ~ N (0,1) ise Z nin bütün momentlerinin
 2n /2 Γ ( (n + 1) / 2 )
, n çift

E(Z n ) = 
π

0
, n tek

formülü ile hesaplanabilir. Şimdi bunu gösterelim. n ∈ için
∞
∞
1
n −z
∫ z e
2π −∞
E ( Z n ) = ∫ z n f ( z ) dz =
−∞
2
 2 ∞ n − z 2 /2
dz , n çift

∫z e
/2
dz =  2π 0

0
, n tek

olup çift n ler için u = z 2 / 2 dönüşümü ile z = 2 u ve du = z dz olduğundan E ( Z n ) ,
2 ∞ n − z 2 /2
dz =
∫z e
2π 0
E (Z n ) =
=
=
2
∞
π
0
∫ ( 2u )
( n−1)/2 −u
e
2
π
du =
∞
n −z
∫z e
2
/2
dz =
0
2
∞
π
0
2
∞
∫z
π 0
( n−1)/2 ( n−1)/2 −u
∫2
u
e
n−1 − z 2 /2
e
du =
z dz
2n/2 ∞
π
∫
 n+1 

−1
u  2  e−u du
0
2n/2 Γ((n + 1) / 2)
π
2
olarak elde edilir. n tek ise z n e− z /2 fonksiyonu tek olduğundan E ( Z n ) = 0 dır.
b) X ~ N ( µ = 100, σ 2 = 100) dağılımı için bazı olasılıklar aşağıda hesaplanmıştır.
ÖZEL DAĞILIMLAR
219
X − 100 110 − 100 
 90 − 100
P (9 0 < X < 1 1 0 ) = P 
<
<

10
10
10


= P ( − 1 < Z < 1 ) = 2 P (0 < Z < 1) = 2 (0 .3 4 1 3) = 0 .6 8 2 6
Bu olasılık Şekil (5.2.9a) da belirtilen taralı bölgenin alanıdır. Ayrıca,
 110 − 100 X − 100 120 − 100 
P (110 < X < 120 ) = P 
<
<

10
10 
 10
= P (1 < Z < 2) = P(0 < Z < 2) − P(0 < Z < 1) = 0.4772 − 0.3413 = 0.1359
olup, bu olasılık da yine Şekil (5.2.9b) de gösterilen taralı alana eşittir. Diğer taraftan,
 80 − 100 X − 100 95 − 100 
P ( 80 < X < 95 ) = P 
<
<
 = P ( −2 < Z < −0.5 )
10
10 
 10
= P(0.5 < Z < 2) = P(0 < Z < 2) − P(0 < Z < 0.5) = 0.4772 − 0.1915 = 0.2857
dir. Bu olasılık da Şekil (5.2.9c) de belirtilen bölgenin alanıdır. Son olarak da,
P (| X − 100 |≤ 20 ) = P ( −20 ≤ X − 100 ≤ 20 ) = P ( −2 ≤ Z ≤ 2 )
= 2 P ( 0 ≤ Z ≤ 2 ) = 2(0.4772) = 0.9544
olup, bu olasılık da Şekil (5.2.9d) de gösterilmiştir.
f(z)
0.4
(a)
f(z)
0.4
(b)
P (1
<Z
<2
)=0
.13
P (-
826
z
-2
0
-1
2
3
4
-3
-4
-3
2
3
4
2
3
4
44
.95
Z<
2
)=0
-2
-1
P(-
2<
0.2857
2<
P(-
1
0
f(z)
857
-4
-1
(d)
0. 2
5)=
-0.
Z<
-2
f(z)
0.4
(c)
1
z
0.9544
-3
-4
59
0.1359
0.6826
1<
Z<
1)=
0.6
z
z
0
1
2
3
4
-4
-3
-2
-1
0
1
Şekil 5.2.9 Normal dağılımda bazı olasılıklar (Örnek (5.2.2.b))
220
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
c) Bir dersten sınava giren öğrencilerin notları, beklenen değeri 70 varyansı 100 olan
normal dağılıma sahip olsun. Sınavdan 4 öğrencinin 90 ve üzerinde not aldığı bilindiğine
göre, sınava giren öğrenci sayısını yaklaşık olarak bulmak isteyelim. Bunun için
P ( X > 90) olasılığının hesaplanması yeterlidir.
Şekil 5.2.9a Normal dağılımda olasılık hesabı (Örnek (5.2.2.c))
Bu olasılık,
 X − 70 90 − 70 
P ( X > 90) = P 
>
 = P ( Z > 2 ) = 0.0228
10 
 10
olup öğrencilerin yaklaşık olarak %2.5 ’i 90 ve üzerinde not almıştır. Buna göre, sınava
giren öğrencilerin yaklaşık %2.5 ’i 4 kişi ise sınava giren öğrencilerin tamamı
400 /(2.5) = 160 dır ⊕
X1, X 2 ,..., X k bağımsız N ( µi , σ i2 ) dağılımlı rasgele değişkenler ise µ = µ1 + ... + µk
ve σ 2 = σ i2 + ... + σ k2 olmak üzere X = X 1 + X 2 + ... + X k ∼ N ( µ , σ 2 ) dir. Yani, bağımsız
normal dağılıma sahip rasgele değişkenlerin toplamı da normal dağılıma sahiptir.
b
b
Örnek 5.2.3 Z ~ N (0,1) olsun. Bazen, E−∞
( Z ) = ∫−∞ z f ( z ) dz
gibi beklenen
değerlere (truncated expectation) ihtiyaç duyulabilir. Şimdi bunlardan bazılarını göstermeye
çalışalım.
b
a) Önce, E−∞
(Z ) =
b
2
∫ z f ( z ) dz integrali için z / 2 = u ise zdz = du dur. Buradan
−∞
bir defa kısmi integrasyon sonucunda,
b
E−∞
(Z ) =
b
1 b
−1 − z 2 /2 b
−1 −b2 /2
− z 2 /2
dz =
e
=
e
= − f (b)
∫ z f ( z ) dz =
∫ ze
2π −∞
2π
2π
z =−∞
−∞
b
( Z ) = − f (b) dir.
elde edilir. Yani, E−∞
ÖZEL DAĞILIMLAR
221
b) Benzer şekilde,
1 ∞ − z 2 /2
−1 − z 2 /2 ∞
1 −b 2 /2
=
=
= f (b)
z
e
dz
e
e
∫
2π b
2π
2π
z =b
Eb∞ ( Z ) =
b
b
dir. Yani, Eb∞ ( Z ) = f (b) dir. Genel olarak, E−∞
( Z n ) = −bn −1 f (b) + (n − 1) E−∞
( Z n− 2 )
b
eşitliği yazılabilir. Şimdi bu eşitliğin doğru olduğunu gösterelim. E−∞
( Z n ) değeri,
b
b
( Z n ) = ∫ z n f ( z ) dz =
E−∞
−∞
1 b n − z 2 /2
1 b n −1 − z 2 /2
z
e
dz
=
z dz
∫
∫ z e
2π −∞
2π −∞
şeklinde yazılabilir. Burada, u = z n −1 denirse du = (n − 1) z n −2 olur. Ayrıca,
1 − z 2 /2
1 − z 2 /2
e
z dz = dv ⇒ v = −
e
2π
2π
olduğundan ∫ udv = uv − ∫ v du kısmni integrasyon formülü uygulanırsa,
b
E−∞
(Z n ) =
1 b n−1 − z 2 /2
z dz
∫ z e
2π −∞
z n −1 − z 2 /2
=−
e
2π
b
b
+ (n − 1)
z =−∞
n−2
∫ z
−∞
1 − z 2 /2
e
dz
2π
b
= −b n −1 f (b) + (n − 1) E−∞
( Z n−2 )
b
b
bulunur. Sonuç olarak, E−∞
( Z n ) = −bn −1 f (b) + (n − 1) E−∞
( Z n− 2 ) şeklinde aranan eşitlik
elde edilir ⊕
5.2.6. Log-Normal Dağılım
Bir X rasgele değişkeninin olasılık yoğunluk fonksiyonu µ ∈ ve σ ∈ + için
f ( x) =
1
2π σ
2
1
e
x
−
1
2σ2
( log( x ) − µ ) 2
, x ∈ +
şeklinde ise X log-normal dağılıma sahiptir denir ve X ~ log N ( µ , σ 2 ) ile gösterilir.
X ~ log N ( µ , σ 2 ) ise Y = log( X ) ~ N ( µ , σ 2 ) dir. Bu dağılım için önemli uygulama
alanları vardır. Örneğin, iktisadi veriler analiz edilmeden önce verilerin logaritmaları alınır.
Bunun nedenlerinden biri iktisadi verilerin log-normal dağılıma uygun olduğu varsayımıdır.
222
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
İstatistiki sonuç çıkarım için normallik varsayımı önemlidir. Normallik varsayımının
sağlanması için verilerin logaritmaları alınır. Dağılımın olasılık yoğunluk fonksiyonunun
grafiği, µ = 0 ve σ = 1 için Şekil (5.2.10) da verilmiştir.
Şekil 5.2.10 µ = 0 ve σ = 1 için log-normal dağılımın olasılık yoğunluk fonksiyonu
Şimdi, X ~ log N (0,1) olsun. P (0 < X < 1) olasılığını hesaplamak isteyelim. Bu
olasılık Z ~ N (0,1) olmak üzere doğrudan
1
P (0 < X < 1) = ∫ f ( x)dx =
0
=
1 1 1 −(log( x ))2 /2
1
dx , log( x) = u ⇒ dx = du
∫ xe
x
2π 0
1 0 −u 2 /2
du = P (−∞ < Z < 0) = 0.5
∫e
2π −∞
olarak hesaplanır. Benzer şekilde P (0 < X < 2) olasılığı
2
P(0 < X < 2) = ∫ f ( x)dx =
0
=
1
2π
log(2)
−u
∫ e
2
/2
1 2 1 − (log( x ))2 /2
1
dx , log( x) = u ⇒ dx = du
∫ xe
x
2π 0
du = P(−∞ < Z < log(2)) ≅ P (−∞ < Z < 0.3) = 0.6179
−∞
olarak bulunmuştur. Bu olasılık da, Şekil (5.2.10) da belirtilen taralı alandır. Dağılımın
beklenen değeri ve varyansı,
2
2
2
E ( X ) = e µ + σ / 2 ve Var ( X ) = e 2( µ +σ ) − e 2 µ +σ
dir.
5.3. İki Boyutlu Normal Dağılım
Bu kısımda, çok değişkenli normal dağılımı kısaca tanıdıktan sonra iki değişkenli
normal dağılımın bazı özellikleri ele alınacaktır. µ , x ∈ k ve Σ da k × k boyutlu
ÖZEL DAĞILIMLAR
223
varyans-kovaryans matrisi olsun. Buna göre | Σ | =| det(Σ)| olmak üzere, k -değişkenli
normal dağılımın ortak olasılık yoğunluk fonksiyonu,
1
 1

exp  − ( x − µ )′ Σ −1( x − µ ) 
f ( x) =
(2π )k /2 | Σ |1/2

 2 , x , µ ∈ k
şeklindedir ve X ~ MN k ( µ , Σ) ile gösterilir.
X ~ MN k ( µ , Σ) ve A uygun boyutlu sabit bir matris olmak üzere, Y = A X de çok
değişkenli normal dağılıma sahiptir. Yani, Y = A X ~ MN rank ( A) ( A µ , A Σ A′) dır. Burada,
E (Y ) = E ( A X ) = A E ( X ) = A µ ve Var (Y ) = Var ( A X ) = A Var ( X ) A′ = A Σ A′
dır. Buna göre, X ~ MN k ( µ , Σ) ise A matrisinin özel seçimi ile marjinallerin de normal
olduğu görülür.
Şimdi, k = 2 için iki değişkenli normal dağılımı ele alalım. İki boyutlu rasgele
değişkenin bileşenleri X ve Y olsun. µ x , µ y ∈ , σ x > 0 , σ y > 0 ve −1 < ρ < 1 olmak
üzere, iki değişkenli normal dağılımın olasılık yoğunluk fonksiyonu x, y ∈ için,
f ( x, y ) =
1
2π σ x σ y 1 − ρ 2

1

2(1− ρ 2 ) 

e
2
2
 x−µ x   y−µ y 
 x−µ x 

 + 
 −2 ρ 

 σx   σy 



 

 σx 
 y −µ y 


 σ y 


şeklindedir. Bu ortak olasılık yoğunluk fonksiyonu,
 σ 2x
µx 
µ =   ve Σ = 
ρ σ σ
 µ y 
x

ρσ xσ y
y
σ 2y



olmak üzere, yukarıda verilen çok değişkenli normal dağılımın olasılık yoğunluk
fonksiyonu ile aynıdır. Bunu,
 µ   σ 2
x
x
X
X =   ~ MN 2  
, 



µ y  ρ σ σ
Y 
x y


ρσ xσ y 
σ 2y



olarak ifade edebiliriz.
İki değişkenli normal dağılımın bazı özellikleri aşağıdaki teoremde özetlenmiştir.
224
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
Teorem 5.3.1 Bileşenleri X ve Y olan iki boyutlu X rasgele vektörü X ~ MN 2 ( µ , Σ)
olsun. Buna göre,
a) Marjinaller normaldir. Yani, X ~ N ( µ x , σ x2 ) ve Y ~ N ( µ y , σ y2 ) dir.
b) ρ X ,Y = ρ dir. Yani aralarındaki korelasyon ρ dur.
c) a, b ∈ için, aX + bY ~ N (a µ x + bµ y , a 2σ x2 + b 2σ 2y + 2 a b ρ σ xσ y ) dir.
d) Koşullu dağılımlar normaldir. Yani,
µ y | x = µ y + ρ (σ y / σ x )( x − µ x ) ,
σ 2y | x = σ 2y (1 − ρ 2 )
µ x | y = µ x + ρ (σ x / σ y )( y − µ y ) ,
, σ 2x | y = σ 2x (1 − ρ 2 )
olmak üzere,
Y | X = x ~ N ( µ y| x , σ 2y| x ) ve X |Y = y ~ N ( µ x| y , σ 2x| y )
dir.
İspat: İşlemlerin basit yürütülebilmesi için µ x = µ y = 0 ve σ x2 = σ y2 = 1 alalım. Buna
göre, iki boyutlu normal dağılımın olasılık yoğunluk fonksiyonu x ∈ 2 için
1
f ( x) =
2π | Σ | 1/ 2
1
− x′ Σ −1 / 2 x
e 2
olup x = ( x, y )′ ve
1
Σ=
ρ
ρ
det ( Σ ) = 1 − ρ 2 ve
,
1 
Σ −1 =
 1

1 − ρ 2 −ρ
1
−ρ 
1 
olmak üzere,
1
1
x ′ Σ −1 x =
(
x
,
y
)
−ρ
1− ρ 2

=
dir.
1
1− ρ
2
−ρ   x 
x
1
ρ
ρ
=
x
−
y
,
−
x
+
y
(
)





1   y  1− ρ 2
 y
( x2 + y 2 − 2 ρ x y)
ÖZEL DAĞILIMLAR
225
Şekil 5.3.1 ρ = 0.4 için iki değişkenli normal dağılımın olasılık yoğunluk fonksiyonu
Yani, X ve Y nin ortak olasılık yoğunluk fonksiyonu,
−
1
f ( x, y ) =
2π 1− ρ
2
e
1
( x2 + y 2 −2 ρ x y )
2(1− ρ 2 )
şeklinde yazılabilir. Şimdi ispata geçelim.
a) X ∼ MN 2 ( µ , Σ) olduğundan uygun bir a vektörü için a′ X ~ N (a′µ , a′ Σ a )
olduğunu biliyoruz. a = (1, 0)′ için a′ X = X olup a′µ = µ x ve a′ Σ a = σ x2 dir. Buradan,
X
2
a′ X = ( 1, 0 )   = X ~ N a′µ = µ x , a′ Σ a = σ x
Y 
(
)
olup X normal dağılıma sahiptir. Benzer şekilde a = (1, 0)′ için Y nin dağılımının da
normal olduğu görülür. Aynı sonuç, ortak olasılık yoğunluk fonksiyonunun Y nin değer
kümesi üzerinden integrali ile de elde edilir. X in marjinal olasılık yoğunluk fonksiyonu
x ∈ için,
∞
f X ( x) =

−1
f ( x, y ) dy =
exp 
∫

 2 1− ρ 2
2 π 1 − ρ 2 y =−∞

∞
1
∫
y =−∞
(
)
(


x + y − 2 ρ x y dy


2
2
)

 ∞

− x2 
−1


=
exp
exp
y2 − 2 ρ x y + ρ 2 x2 − ρ 2 x2
∫
 2 1 − ρ 2 
 2 1 − ρ 2
2
2π 1− ρ

 y =−∞

 2
 ∞


1
− x + ρ 2 x2 
−1
2


=
exp
exp
y − ρ x ) dy
 2 1 − ρ 2  ∫
 2 1 − ρ 2 (

2π 1 − ρ 2

 y=−∞


1
(
(
)
(
)
(

 − x2  ∞
−1
=
exp 
exp 

∫
 2 
 2 1 − ρ 2
2π 1 − ρ 2

 y=−∞

(
)

1
(
)
)
( y − ρ x)
2


dy
)

dy


226
MATEMATİKSEL İSTATİSTİĞE GİRİŞ

 − x2  ∞
1
1
−1
=
exp 
exp 
 ∫


2π
 2 1− ρ 2
 2  y =−∞ 2 π 1 − ρ 2

(

)
( y − ρ x)
2


dy =
 − x2 
1
exp 
 2 
2π


dir. Bu da, standart normal dağılımın olasılık yoğunluk fonksiyonudur.
b) µ x = µ y = 0 ve σ x2 = σ y2 = 1 olduğundan, X ile Y arasındaki korelasyon,
ρ X ,Y =
Cov ( X , Y )
Var ( X ) Var (Y )
=
E ( X Y ) − E ( X ) E (Y )
Var ( X ) Var (Y )
= E ( XY )
dir. Buna göre c −1 =  2π 1 − ρ 2  olmak üzere E ( XY ) değeri,


∞ ∞
E ( XY ) = c


1
 x 2 + y 2 − 2 ρ x y   dx dy
x y exp  −
 2(1 − ρ 2 ) 



−∞ −∞
∫ ∫
şeklinde yazılabilir. t = x , s = x y dönüşümleri altında ters dönüşümler x = t ve y = s / t
olup Jacobien matrisi ile determinantı
 ∂x
 ∂t
J =
 ∂y
 ∂t
∂x 
 1
∂s  
=
s
∂x   − 2
 t
∂s 
0
1
1  , det ( J ) =

t
t 
dir. | det( J ) | = 1/ t olup bunu | det( J ) | = 1/ t 2 şeklinde yazalım. Bu dönüşüm altında
E ( XY ) nin değeri,
∞ ∞
E ( XY ) = c


1
t 2 + ( s / t ) 2 − 2 ρ s   1 dt ds
s exp  −
2


 2
 2(1 − ρ )
 t
−∞ −∞
∫ ∫
şekline dönüşür. Ayrıca,
2
t 2 + ( s / t ) 2 − 2 ρ s  =  s − ρ t  + (1 − ρ 2 ) t 2

  t 
olduğundan integralin değeri, yani X ile Y arasındaki korelasyon
∞ ∞
E ( XY ) = c


1
 x 2 + y 2 − 2 ρ x y   dx dy
x y exp  −
2 


 2(1 − ρ )

−∞ −∞
∫ ∫
∞ ∞
=c
∫ ∫
−∞ −∞

 s − ρ t 2 

1
2 2 
exp  −
+
1
−
t
ρ

 ds dt


2 

2

t
2(1
−
)
ρ

 
t



s
(
)
ÖZEL DAĞILIMLAR
∞ ∞
2


2  
 t2 
1
s
−
ρ
t


exp  −  exp −
   ds dt
2






t
 2(1 − ρ ) 
t2
 2
  


s
∫ ∫
=c
227
−∞ −∞
 t2   ∞

1
s
( s − ρ t 2  

exp
−
exp
−
ds dt



∫ 2π  2   ∫
 2(1 − ρ 2 )t 2  
2 2

  −∞ 2π (1 − ρ ) t

 
−∞
∞
=
∞
 t2 
1
exp  −  [ E ( S )] dt , E ( S ) = ρ t 2
 2
2π


∫
=
−∞
∞
=ρ
∫
−∞
 t2 
t2
exp  −  dt
 2
2π


, T ~ N (0,1)
=ρ
olarak hesaplanmış olur.
c) X ~ MN 2 ( µ , Σ) ise a′ X ~ N (a′µ , a′ Σ a ) olduğunu biliyoruz. a′ = (a, b) için,
 µx 
a′µ = (a, b )   = a µ x + bµ y
 µy 
ve
1
a′Σa = (a, b) 
ρ
ρa
2 2
2 2
  = a σ x + b σ y + 2 a b ρ σ xσ y

1 b 
olduğundan, a, b ∈ için,
aX + bY ~ N (aµ x + bµ y , a 2σ x2 + b2σ 2y + 2 a b ρ σ xσ y )
bulunur.
d) Marjinal dağılımların da normal olduğunu biliyoruz. Koşullu olasılık yoğunluk
fonksiyonunun tanımından, Y = y verildiğinde X in koşullu olasılık yoğunluk fonksiyonu


1
 x2 + y 2 − 2ρ x y  
exp  −
 
 2 1 − ρ 2 
2
f ( x, y) 2π 1 − ρ


f X |Y = y ( x | y ) =
=
2
fY ( y)
 y 
1
exp  − 
 2 
2π


1
(
=
1
(
2π 1 − ρ 2
)
)


1
2
2
2 2


exp −
x + y − 2 ρ x y − (1 − ρ ) y
 2 1 − ρ 2 
 


(
)
228
=
MATEMATİKSEL İSTATİSTİĞE GİRİŞ

2


 x −ρ y
1
1
2
2 2




exp −
x + ρ y − 2ρ x y =
exp  −
 
2
2
 2 1 − ρ 2 
 2 1− ρ
π
ρ
2
1
−



(
1
(
2π 1 − ρ 2
)
(
)
(
)
(
) 

) 
2
olarak bulunur. Bu fonksiyon da, beklenen değeri ρ y , varyansı 1 − ρ 2 olan normal
dağılımın olasılık yoğunluk fonksiyonudur. Yani,
E ( X | Y = y ) = ρ y ve Var ( X | Y = y ) = 1 − ρ 2
dir.
Bu sonuç, µ x = µ y = 0 ve σ x2 = σ y2 = 1 olması halinde elde edildi. X1 = µ x + σ x X
ve Y1 = µ y + σ yY dönüşümleri altında koşullu beklenen değer ile koşullu varyans
σ y 
 (x − µx )
σx 
σx
σ y

µ x| y = µx + ρ 
µ y| x = µ y + ρ 
,
σ 2y | x = σ 2y (1 − ρ 2 )
, σ 2x | y = σ 2x (1 − ρ 2 )

( y − µy ) ,


olarak bulunur ◊
Örnek 5.3.1 İki değişkenli standart normal dağılımı göz önüne alalım. Yani, X ve Y
nin ortak olasılık yoğunluk fonksiyonu, x, y ∈ için
f ( x, y ) =


1
2
2
exp  −
(
x
+
y
−
2
ρ
x
y
)

 2 (1 − ρ 2 )

2π 1 − ρ 2


1
olarak verilmiş olsun. Buna göre P ( X > 0, Y > 0 ) olasılığını hesaplayalım. Bunun için,
U=X , V=
1
1− ρ 2
(Y − ρ X )
dönüşümlerinden ters dönüşümler, X = U , Y = 1 − ρ 2 V + ρ U olup Jacobien matrisi ve
determinantı,
 ∂X
 ∂U
J =
 ∂Y
 ∂U
∂X 
∂V  1
 =
∂Y  0

∂V 

 , det ( J ) = 1 − ρ 2
2
1 − ρ 
0
dir. Ayrıca, x 2 + y 2 − 2 ρ x y = (1 − ρ 2 ) (u 2 + v 2 ) olup U ve V
yoğunluk fonksiyonu,
nin ortak olasılık
ÖZEL DAĞILIMLAR
229
(
)(
 1 − ρ 2 u 2 + v2

fU ,U (u, v) =
exp −

2
2 1− ρ 2
2π 1 − ρ

= fU (u ) fV (v)
1− ρ 2
(
)
)  = 
 u 2   1
 v2 
1
exp  −  
exp  − 
  2π
 2   2π



 
 2 
 
şeklinde elde edilir. Ortak olasılık yoğunluk fonksiyonu marjinal olasılık yoğunluk
fonksiyonlarının çarpımı şeklinde yazılabildiğinden U ve V bağımsızdır. Diğer taraftan,
{ X > 0, Y > 0} =
{U > 0 , V > −ρ U /
1− ρ 2
}
eşitliği yardımı ile P ( X > 0, Y > 0) olasılığı,

−ρ U

P ({ X > 0, Y > 0} ) = P  U > 0 , V >

1− ρ 2


 1
 =
  2π
∞
∞
∫ ∫
0 −ρ u
 u 2 + v2 
exp  −
 dv du

2


1− ρ 2
şeklinde yazılabilir. 0 < θ < π / 2 ve r > 0 olmak üzere, u = r cos(θ ) ve v = r sin(θ )
kutupsal koordinatları için du dv = r dr dθ dir. tan(θ ) = v / u olduğundan θ = arctan(v / u )
yazılır. Buradan integralin alt sınırı


ρ u 
ρ
arctan  −
= arctan  −
 u 1− ρ 2 
 1− ρ 2







olup aranan olasılık,
1
P ({ X > 0, Y > 0} ) =
2π
∞
∞
 u 2 + v2 
exp
 −
 dv du
∫ ∫
2
−
ρ
u


0
1− ρ 2
π /2
=
∫

θ =arctan
π /2
∞ 1

 r2 
1
∫
exp  −  r dr  dθ =
∫
 2 
2π
 0 2π




 −ρ
−ρ 
θ =arctan 


 1− ρ 2 


2 

 1− ρ 

 −ρ
1 π
=
− arctan 
2π  2
 1− ρ 2


olarak bulunur. Ayrıca,
dθ


  = 1 − 1 arctan  − ρ
2
  4 2π


 1− ρ


 = 1 + 1 arctan  ρ
2
 4 2π


 1− ρ




230
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
 ρ
arctan 
 1− ρ 2


 = arcsin( ρ )


trigonometrik eşitliğinden aranan olasılık
P ({ X > 0, Y > 0} ) =
 ρ
1 1
arctan 
+
4 2π
 1− ρ 2


 = 1 + 1 ar c sin ( ρ )
 4 2π

olarak hesaplanmış olur ⊕
5.4. Dağılım Aileleri
5.4.1. Üstel Aileler
Kitlenin bilinmeyenleri aynı zamanda dağılımın bilinmeyenleridir. Bu bilinmeyenlere
parametre denir. Bir rasgele değişkenin olasılık veya olasılık yoğunluk fonksiyonu bu
parametrelere bağlıdır. Bu parametreler genellikle rasgele değişkenin beklenen değeri ve
varyansıdır. Bazen kitle başka parametreler de içerebilir. Rasgele değişkenin olasılık veya
olasılık yoğunluk fonksiyonu da parametre olarak alınabilir. Dolayısı ile, bir rasgele
değişkenin olasılık veya olasılık yoğunluk fonksiyonu yerine, bu olasılık veya olasılık
yoğunluk fonksiyonlarının bir ailesinden söz etmek daha anlamlıdır. Parametre değiştikçe
olasılık veya olasılık yoğunluk fonksiyonu da değişir. Bundan böyle, rasgele değişkenin
olasılık veya olasılık yoğunluk fonksiyonunu f ( x;θ ) ile göstereceğiz. Parametrelerin
sayısı birden fazla ise f ( x;θ ) gösterimi kullanılacaktır. Θ parametre kümesini göstermek
üzere ( Θ ⊂ olup bazen parametre sayısına bağlı olarak k nin bir alt kümesi de olabilir)
olasılık veya olasılık yoğunluk fonksiyonlarının ailesini,
C = { f ( x;θ ) : θ ∈ Θ}
ile gösterelim.
Tanım 5.4.1 Her f ( x;θ ) ∈ C için f ( x;θ ) fonksiyonu,
 k

f ( x;θ ) = h( x) c(θ ) exp  ∑ ti ( x) wi (θ ) 
 i =1

şeklinde yazılabiliyorsa, C = { f ( x;θ ) : θ ∈ Θ} sınıfına bir üstel aile denir ⊗
ÖZEL DAĞILIMLAR
231
Burada, h( x) ve i = 1, 2,3,..., k için ti ( x) ler x in bir fonksiyonu, wi (θ ) ler ve c(θ )
ise sadece parametrenin bir fonksiyonudur. Ayrıca, h( x) > 0 ve c(θ ) > 0 olması gerektiği
açıktır. Bilinen bir çok dağılım üstel aile özelliğine sahip olmasına rağmen, bu özelliğe
uymayan bir çok dağılım vardır. Düzgün dağılım gibi olasılık yoğunluk fonksiyonunun tanım
kümesi parametreye bağlı olan olasılık yoğunluk fonksiyonları üstel aile özelliğini sağlamaz.
Parametre tahmini ve istatistiki sonuç çıkarımlar açısından olasılık fonksiyonlarının üstel
aileye ait olması önemli kolaylıklar sağlar.
Örnek 5.4.1 a) X ~ Binom(n, θ ) olsun. X in olasılık fonksiyonu, 0 < θ < 1 için
n
f ( x) = P ( X = x) =   θ x (1 − θ )n − x , x = 0,1, 2,..., n
 x
şeklindedir. Bu olasılık fonksiyonu,
x
n
n
 θ 
f ( x;θ ) =   θ x (1 − θ ) n− x =   (1 − θ )n 

 1−θ 
 x
 x
n

 θ 
=   (1 − θ )n exp  x ln 
  = h( x) c(θ ) exp(t ( x) w(θ ))
 1−θ  

 x
şeklinde yazılabildiği için üstel aile özelliğini sağlar. Burada, t ( x) = x olmak üzere h ve c
fonksiyonları
 n 
  , x = 0,1, 2,..., n
h( x) =  x 
,
 0 , d . y.

(1 − θ ) , 0 < θ < 1
c (θ ) = 
, d.y
 0
olarak tanımlandığında, f ( x;θ ) olasılık fonksiyonu
f ( x;θ ) = h( x) c(θ ) exp(t ( x) w(θ ))
şeklinde yazılabildiğinden Binom dağılımlar ailesi üstel aile özelliğini sağlar ve f ( x;θ )∈ C
dir. Yani, Binom dağılımlar ailesi üsteldir.
b) X ~ N ( µ , σ 2 ) olsun. µ ∈ ve σ ∈ + olmak üzere normal dağılımın olasılık
yoğunluk fonksiyonu,
f ( x; µ , σ 2 ) =
 ( x − µ )2 
 µ2 
 1 2
1 1
µ
exp  −
=
exp
−
exp
− 2x + 2




2
2


 2σ 
2π σ
2σ 
2σ
2πσ 2
 2σ



1
olarak yazılabilir. Burada,

x


232
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
 µ2 
 x2
1
1
h( x) =
, c µ , σ 2 = exp  −
, t ( x) = ( t1 ( x) , t2 ( x) )′ =  − ,

 2σ 2   2
σ
2π



(
)
′
x


ve
1/ σ 2
w1 ( µ , σ ) = 
 0
2
, σ >0
, d . y.
,
 µ / σ 2
w2 ( µ , σ ) = 
 0
2
, σ >0
, d . y.
fonksiyonları tanımlandığında, normal dağılımın olasılık yoğunluk fonksiyonlarının ailesi,
w ( µ , σ 2 ) = ( w1 ( µ , σ 2 ), w1 ( µ , σ 2 )′ olmak üzere,
f ( x; µ , σ 2 ) = h( x) c( µ , σ 2 ) exp( t ′( x) w ( µ , σ 2 )
olarak yazılabilir. Buradan, f ( x; µ , σ 2 )∈ C olup normal dağılımlar ailesi de üstel aile
özelliğini sağlar ⊕
5.4.2. Konum-Ölçek Aileleri
Üstel aileler ile birlikte, istatistiki sonuç çıkarımlar için çok kullanışlı özelliklere sahip
konum-ölçek ailelerini inceleyelim.
Teorem 5.4.1 X rasgele değişkeninin olasılık veya olasılık yoğunluk fonksiyonu
f ( x) olsun. σ > 0 ve µ ∈ için,
g ( x; µ , σ ) =
 x−µ 
f
σ  σ 
1
olarak tanımlanan g ( x) fonksiyonu da bir olasılık yoğunluk fonksiyonudur.
İspat: σ > 0 ve f ( x) de bir olasılık yoğunluk fonksiyonu olduğundan bütün x ∈ ler
için g ( x) ≥ 0 dır. Ayrıca (sürekli durum için) f ( x) bir olasılık yoğunluk fonksiyonu
∞
olduğundan
∫
f ( x) dx = 1 dir. Buradan, y = ( x − µ ) / σ
denirse, dy = dx / σ
olup
−∞
g ( x; µ , σ ) nın tanım bölgesi üzerinden integrali
∞
∞
∞
−∞
−∞
−∞
∫ g ( x; µ , σ ) dx = ∫ (1/ σ ) f (( x − µ ) / σ ) dx = ∫ f ( y) dy = 1
olup g ( x; µ , σ ) = (1/ σ ) f (( x − µ ) / σ ) fonksiyonu bir olasılık yoğunluk fonksiyonudur ◊
ÖZEL DAĞILIMLAR
Tanım 5.4.2 µ ∈ ve
233
f ( x) de herhangi bir olasılık veya olasılık yoğunluk
fonksiyonu olsun. g ( x; µ ) = f ( x − µ ) özelliğine sahip olasılık veya olasılık yoğunluk
fonksiyonlarının
L = { g ( x; µ ): g ( x) = f ( x − µ )}
şeklindeki bir sınıfına konum (location) ailesi, µ ye de konum (location) parametresi
denir ⊗
Konum ailesine ait olasılık yoğunluk fonksiyonları şekil olarak değişmez. Konum
parametresinin durumuna göre kaymalar gösterir. Bu olasılık yoğunluk fonksiyonlarının
grafikleri aşağıdaki şekilde olur (Şekil (5.4.1)).
Şekil 5.4.1 σ 2 = 1 ve µ = −1, 0,1 için normal dağılımın olasılık yoğunluk fonksiyonları
f ( x; µ ) ∈ L olsun. Bu durumda konum ailesine ait bir olasılık yoğunluk fonksiyonu
x = µ ⇒ f ( x − µ ) = g (0) , x = µ + 1⇒ f ( x − µ ) = g (1) , x = µ + 2 ⇒ f ( x − µ ) = g (2)
gibi özelliklere sahiptir.
Örnek 5.4.2 X rasgele değişkeninin olasılık yoğunluk fonksiyonu,
e− ( x− µ ) , x > µ
f ( x; µ ) = 
, d . y.
 0
şeklinde verilmiş olsun. µ nün aldığı değere göre dağılımın grafiği değişir.
Değişik µ değerleri için olasılık yoğunluk fonksiyonlarının grafikleri yukarıdadır ⊕
f ( x) herhangi bir olasılık yoğunluk fonksiyonu ise, σ > 0 için g ( x; σ ) = (1/ σ ) f ( x / σ )
da bir olasılık yoğunluk fonksiyonudur.
234
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
f (x)
1
µ = 1,5
0,8
0,6
µ = 1,0
0,4
µ = 0,5
0,2
x
0
0,5 1,0 1,5
2
4
6
8
Şekil 5.4.2 µ = 0.5, 1.0, 1.5 için f ( x, µ ) olasılık yoğunluk fonksiyonlarının grafikleri
Tanım 5.4.3 σ ∈ + ve f ( x) herhangi bir olasılık veya olasılık yoğunluk fonksiyonu
olmak üzere, g ( x; σ ) = (1/ σ ) f ( x / σ ) özelliğini sağlayan olasılık veya olasılık yoğunluk
fonksiyonlarının
S = { g ( x; σ ): g ( x; σ ) = (1/ σ ) f ( x / σ ) , σ > 0}
şeklindeki bir sınıfına ölçek (scale) ailesi, σ ya da ölçek (scale) parametresi denir ⊗
Örnek 5.4.3 X ~ N (0, σ 2 ) şeklindeki normal dağılımlar ailesi bir ölçek ailedir.
f(x)
0.4
0.3
σ2=1
0.2
σ2=4
0.1
σ2=9
x
-8
Şekil 5.4.3
-6
-4
-2
0
2
4
6
8
σ 2 = 1 , 4 , 9 için N (0,σ 2 ) normal dağılımının olasılık yoğunluk fonksiyonları
X ~ N (0, σ 2 ) dağılımın olasılık yoğunluk fonksiyonu,
f ( x; σ 2 ) =
 x2 
exp  − 2  , x ∈  2σ 
2π σ 2


1
şeklinde olup σ 2 nin değişik değerleri için olasılık yoğunluk fonksiyonlarının grafikleri
yukarıda Şekil (5.4.3) de verilmiştir. Grafikten de görüldüğü gibi, σ 2 nin değerine göre
ÖZEL DAĞILIMLAR
235
dağılımın şekli değişir. σ 2 nin değeri büyüdükçe, dağılımda yukarıdan aşağıya doğru bir
basıklık gözlenir ⊕
Tanım 5.4.4 σ ∈ + , µ ∈ ve f ( x) de herhangi bir olasılık veya olasılık yoğunluk
fonksiyonu olsun. g ( x; µ , σ ) = (1/ σ ) f (( x − µ ) / σ ) özelliğini sağlayan g ( x; µ , σ ) olasılık
veya olasılık yoğunluk fonksiyonlarının
C * = { g ( x; µ , σ ): g ( x; µ , σ ) = (1/ σ ) f ( ( x − µ ) / σ ) , σ > 0, µ ∈ }
şeklindeki bir sınıfına olasılık yoğunluk fonksiyonlarının konum- ölçek (scale) ailesi, µ ye
konum parametresi, σ ya da ölçek (scale) parametresi denir ⊗
f ( x; µ , σ ) ∈ C * ise olasılık yoğunluk fonksiyonlarının hem konumları hem de ölçekleri
değişir. Örneğin, X ~ N ( µ , σ 2 ) ise bu dağılımın olasılık yoğunluk fonkisyonları µ ve σ 2
ye göre hem konumları hem de ölçekleri değişir. Bu olasılık yoğunluk fonksiyonlarının
grafikleri aşağıdaki gibidir (Şekil (5.4.4)).
Teorem 5.4.2 σ ∈ + , µ ∈ ve f ( x) de herhangi bir olasılık veya olasılık
yoğunluk fonksiyonu olsun. X rasgele değişkeninin olasılık yoğunluk fonksiyonunun
f X ( x; µ , σ ) = (1/ σ ) f (( x − µ ) / σ ) şeklinde olabilmesi için gerek ve yeter koşul, olasılık
yoğunluk fonksiyonu f ( z ) olan öyle bir Z rasgele değişkeni için X = µ + σ Z şeklinde
yazılabilmesidir.
İspat: Z
rasgele değişkeninin olasılık yoğunluk fonksiyonu
f ( z ) ve X
in
X = µ + σ Z şeklinde yazılabildiğini düşünelim. g ( z ) = µ + σ z olmak üzere X = g ( Z )
nin olasılık yoğunluk fonksiyonu için, ters dönüşüm
g −1 ( x) = ( x − µ ) / σ
| dg −1 ( x) / dx |= 1/ σ dır. O halde, X in olasılık yoğunluk fonksiyonu,
f X ( x) = f ( g −1 ( x))| d g −1 ( x) / dx |= (1/ σ ) f (( x − µ ) / σ )
dir.
Diğer taraftan, X rasgele değişkeninin olasılık yoğunluk fonsiyonu
f X ( x; µ , σ ) = (1/ σ ) f ( ( x − µ ) / σ )
şeklinde verilmiş olsun. g ( x) = ( x − µ ) / σ fonksiyonunu tanımlayalım. Buradan,
olup
236
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
g −1 ( z ) = µ + σ z ve | dg −1 ( z ) / dz |= σ
olup, Z = g ( X ) = ( X − µ ) / σ rasgele değişkeninin olasılık yoğunluk fonsiyonu,
f Z ( z ) = f X ( g − 1 ( z )) | d g − 1 ( z ) / dz | = (1 / σ ) f ((σ x + µ − µ ) / σ ) σ = f ( z )
olur. Ayrıca,
µ + σ Z = σ (( X − µ ) / σ ) + µ = σ g ( X ) + µ = X
dir ◊
Şekil 5.4.4 ( µ , σ 2 ) = (0,1) , (1, 4) ve (2,9) için N ( µ ,σ 2 ) dağılımının
olasılık yoğunluk fonksiyonları
Z olasılık veya olasılık yoğunluk fonksiyonu f ( z ) olan herhangi bir rasgele değişken
ve E ( X ) ve Var ( X ) değerleri var olsun. X in olasılık veya olasılık yoğunluk fonksiyonu
f X ( x; µ , σ ) = (1/ σ ) f (( x − µ ) / σ ) özelliğine sahip ise, X in beklenen değer ve varyansı
E ( X ) = µ + σ E ( Z ) ve Var ( X ) = Var ( µ + σ Z ) = σ 2Var ( Z )
şeklinde bulunur.
5.5. Çözümlü Problemler
5.5.1 Bernoulli ve Binom dağılımlarının basıklık katsayılarını hesaplayınız.
Çözüm: X ~ Bern( p ) olsun. Bu durumda E ( X ) = p , Var ( X ) = σ 2 = p q ve k ∈ için E ( X k ) = p olduğunu biliyoruz. µ = p olmak üzere dağılımın dördüncü merkezi
momenti,
ÖZEL DAĞILIMLAR
237
1
E[( X − µ )4 ] = E[( X − p )4 ] = ∑ ( x − p ) 4 P( X = x)
x =0
4
= (0 − p ) P( X = 0) + (1 − p) 4 P( X = 1) = p 4 q + q 4 p = pq ( p3 + q3 )
= pq [( p + q )( p 2 − pq + q 2 )] = pq[( p 2 − pq + q 2 )]
dır. Buradan, Bernoulli dağılımının basıklık kaysayısı
η=
E( X − µ)
4
σ4
−3 =
(
pq p 2 − pq + q 2
p 2q2
) − 3 = ( p2 − pq + q 2 ) − 3 = ( p2 − 4 pq + q 2 )
pq
pq
p 2 − 4 p (1 − p ) + (1 − p )2 ) ( p 2 − 4 p + 4 p 2 + 1 − 2 p + p 2 )
(
=
=
pq
pq
6 p 2 − 6 p + 1 1 − 6 p (1 − p ) 1 − 6 pq
=
=
=
pq
pq
pq
olarak hesaplanmıştır.
k
X ~ Binom(n, p ) olsun. µk = E ( X − E ( X ) ) olmak üzere, Binom dağılımının merkezi
momentleri arasında,

µ k +1 = p q  k n µ k −1 −

d µk 

dq 
şeklinde bir bağıntı vardır (Akdeniz (2006) sayfa 224-225). Ayrıca, µ0 = 1 , µ1 = 0 ve
µ2 = n p q olup üçüncü ve dördüncü merkezi momentler bu eşitlikten ardışık olarak elde
edilir. k = 2 için üçüncü merkezi moment,

µ3 = µ 2+1 = pq  2n µ2−1 −


d µ2 
d (npq ) 
2
 = pq  2 n (0) −
 = pq ( − np ) = − np q
dq 
dq 

ve k = 3 için dördüncü merkezi moment de,


dµ 
d (− n p 2 q ) 
µ4 = µ3+1 = pq  3n µ3−1 − 3  = pq  3 n µ2 −


dq 
dq




d (n p 2 q ) 
2
2
= pq  3 n (npq ) +
 = pq 3 n pq + np

dq


(
dir. Buradan Binom dağılımının basıklık katsayısı da,
)
238
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
η=
E( X − µ)
4
−3 =
σ4
(
pq 3n 2 pq + np 2
n2 p 2q 2
3n 2 pq + np 2 ) − 3n 2 p q
(
=
=
2
n pq
np 2
2
n pq
) − 3 = (3n2 pq + np2 ) − 3
n2 p q
=
p
nq
olarak bulunur.
5.5.2 X ve Y bağımsız geometrik dağılıma ( P( X = x) = p q x−1 , x = 1, 2,3,... ) sahip
rasgele değişkenler olsun. X + Y = n verildiğinde, X in koşullu olasılık fonksiyonunu elde
ediniz.
Çözüm: Önce, X + Y = n ve DY = {1, 2,3,...} olduğundan x = 1, 2, 3,..., n − 1 olur.
Buna göre, P ( X = x | X + Y = n) koşullu olasılığı x = 1, 2, 3,..., n − 1 için
P ( X = x | X + Y = n) =
P ( X = x, X + Y = n )
= n−1
P ( X + Y = n)
P ( X = x, Y = n − x )
∑ P( X = s)P ( X + Y = n | X = s )
s =1
n− x −1
P( X = x) P( Y = n − x)
p q x−1 p q
q n− 2
1
= n −1
= n−1
= n−1
=
n −1
∑ P( X = s)P (Y = n − s ) ∑ p q s −1 p q n−s −1 ∑ q n−2
s =1
s =1
s =1
dir. Buradan, X + Y = n verildiğinde, X in koşullu olasılık fonksiyonunu
P ( X = x | X + Y = n) =
1
, x = 1, 2,3,..., n − 1
n −1
olup koşullu dağılım kesikli düzgün dağılımdır.
5.5.3 X ~ NB (r , p ) olsun. Bu durumda, −∞ < E ( g ( X ) ) < ∞ ve −∞ < E ( g (−1) ) < ∞
X


için E ( (1 − p ) g ( X ) ) = E 
g ( X − 1)  olduğunu gösteriniz (Casella ve Berger,
 r + X −1

2002, sayfa 126).
Çözüm: Negatif Binom dağılımının olasılık fonksiyonu,
 x − 1 r x −r
P( X = x) = 
, x = r , r + 1, r + 2,...
p q
 r −1 
şeklinde olup bu fonksiyon,
 r + x − 1 r x
P( X = x) = 
 p q , x = 0,1, 2,3,...
x 

ÖZEL DAĞILIMLAR
239
olarak da yazılabilir. Buradan, y = x + 1 olmak üzere, E ( g ( X )) değeri
∞
∞
 r + x − 1 r x
E ( g ( X ) ) = ∑ g ( x) P( X = x) = ∑ g ( x) 
p q
x 

x =0
x =0
∞
 r + y − 2 r
y −1
= ∑ g ( y − 1) 
 p (1 − p)
y
−
1


y =1
∞

y  r + y − 1 r
y
= ∑ g ( y − 1) 

 p (1 − p)
 r + y − 1  y

y =1
∞ 

y
g ( y − 1)   r + y − 1 r
X
g ( X − 1) 
y −1
= ∑

 p (1 − p) = E 


y

 r + X −1 1− p 
y =0  r + y − 1 1 − p  
olarak hesaplanır. Eşitliğin her iki tarafı (1 − p ) ile çarpılırsa,
X


E ( (1 − p ) g ( X ) ) = E 
g ( X − 1) 
 r + X −1

şeklinde aranan eşitlik elde edilmiş olur. Bu formül kullanılarak g ( x) = r + x denirse,


X
E ( (1 − p ) ( r + X ) ) = E 
( r + X − 1)  = E ( X )
 (r + X − 1)

bulunur. Eşitliğin biraz düzenlenmesi ile de,
E ((1 − p )(r + X )) = E ( X ) ⇒ qr + qE ( X ) = E ( X )
elde edilir. Buradan da, E ( X )[1 − q ] = qr olup dağılımın beklenen değeri E ( X ) = qr / p
olarak hesaplanmış olur.
5.5.4 a) X ~ Binom(n = 10, p = 1/ 2) olsun. P (3 ≤ X ≤ 5) olasılığını hesaplayınız.
b) Y ∼ N ( µ = 5, σ 2 = 2.5) olmak üzere, P (2.5 ≤ Y ≤ 5.5) olasılığını hesaplayınız. Bu
iki olasılık arasındaki benzerliği yorumlayınız.
Çözüm: a) X rasgele değişkeninin olasılık fonksiyonu,
x
10− x
10   1   1 
P( X = x) =      
 x  2   2 
, x = 0,1, 2,...,10
olup olasılıklar aşağıdadır.
x
0
1
2
3
4
5
6
7
8
9
10
f ( x)
1
1024
10
1024
45
1024
120
1024
210
1024
252
1024
210
1024
120
1024
45
1024
10
1024
1
1024
240
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
Bu tablo değerlerinden P (3 ≤ X ≤ 5) olasılığı
P (3 ≤ X ≤ 5) = P ( X = 3) + P ( X = 4) + P ( X = 5) =
120 210 252
582
+
+
=
≅ 0.5683
1024 1024 1024 1024
olarak hesaplanmıştır.
b) Y ~ N ( µ = 5, σ 2 = 2.5) ise,
 2.5 − 5 X − 5 5.5 − 5 
P (2.5 ≤ Y ≤ 5.5) = P 
≤
≤
 = P (−1.58 ≤ Z ≤ 0.32) = 0.569
2.5
2.5 
 2.5
dir. X kesikli rasgele değişken olduğundan P (3 ≤ X ≤ 5) ile P (2.5 ≤ X ≤ 5.5) olasılıkları
aynıdır. X in beklenen değer ve varyansı E ( X ) = np = 5 , Var ( X ) = npq = 2.5 dır.
Buradan,
(5 + 0.5) − 5 
 (3 − 0.5) − 5
P
<Z <
 = P (−1.58 < Z < 0.32) ≅ 0.569
2.5
2.5


olduğundan, hesaplanan iki değer birbirine çok yakındır. Burada Binom dağılımına
süreklilik düzeltmesi yapılmaktadır. Yani, alt sınırdan 0.5 çıkartılıp üst sınıra 0.5
eklenmektedir.
istendiğinde X
X ~ Binom(n, p )
olduğundan,
P (3 ≤ X ≤ 5)
olasılığı hesaplanmak
in alt ve üst sınırlarını kapsayacak şekilde bir düzeltme yapılır.
X ~ Binom(10,1/ 2) ise P (2.5 ≤ X ≤ 5.5) = P (3 ≤ X ≤ 5) dir. Buradaki 0.5 sayısı
süreklilik düzeltmesidir. Bu düzeltme yapıldıktan sonra, her iki taraftan beklenen değeri
çıkartılıp standart sapmasına bölünerek alt ve üst z − değerleri elde edilir. n değeri ne
kadar büyük ise bu olasılıklar da birbirine o kadar yakındır.
5.5.5 X ~ Geo( p ) olsun. X in, x = 2 m − 1, m = 1, 2,3,... şeklinde tek değerler alması
olasılığını hesaplayınız.
Çözüm: X ~ Geo( p ) ise dağılımın olasılık fonksiyonu, P( X = x) = pq x −1 , x = 1, 2,3,...
dir ( q = 1 − p ). Buradan,
X
in
x = 2 m − 1, m = 1, 2,3,... gibi tek sayıları alması
( x = 1,3,5, 7,... gibi değer alması) olasılığı,
ÖZEL DAĞILIMLAR
 ∞

 m =1
241



 ∞

 m=1



P  ∪ {w : X ( w) = 2m − 1}  = P  ∪ { X = 2m − 1} 
=
∞
∞
∞
m =1
m =1
m =1
∑ P ({ X = 2m − 1}) = ∑ p q 2m−1−1 = ∑ p q 2m−2
∞
∞
= p ∑ q 2( m −1) = p ∑ q 2 k =
m =1
k =0
p
1− q
2
=
p
(1 − q ) (1 + q )
=
1
1+ q
dir.
5.5.6 X ve Y bağımsız standart normal dağılıma sahip rasgele değişkenler olsun.
 1 , x>0

sgn( x) =  0 , x = 0
 −1 , x < 0

olmak üzere, Z =| Y |sgn( X ) rasgele değişkeninin olasılık yoğunluk fonksiyonunu bulunuz.
Çözüm: Standart normal rasgele değişkenin dağılım fonksiyonu φ ( z ) olsun. Ayrıca, X
in (veya Y nin) dağılım fonksiyonu
z
φ ( z) =
∫
−∞
1 − x 2 /2
e
dx
2π
şeklindedir. Z nin dağılım fonksiyonu FZ ( z ) olmak üzere, FZ ( z ) = P ( Z ≤ z ) = φ ( z )
olduğunu göstereceğiz. X standart normal dağılıma sahip bir rasgele değişken olduğundan,
P ( X > 0) = P ( X < 0) = 1/ 2 ve P ( X = 0) = 0 dır. Buradan Z nin dağılım fonksiyonu için,
FZ ( z ) = P ( Z ≤ z ) = P ( | Y |sgn( X ) ≤ z )
= P (| Y | sgn( X ) ≤ z | X < 0 ) P ( X < 0) + P (| Y | sgn( X ) ≤ z | X > 0 ) P ( X > 0)
+ P (| Y | sgn( X ) ≤ z | X = 0 ) P ( X = 0)
= P (| Y | sgn( X ) ≤ z | X < 0) P ( X < 0) + P (| Y | sgn( X ) ≤ z | X > 0)
= 0.5 P (| Y | ≥ − z ) + 0.5 P (| Y | ≤ z )
eşitliği elde edilir. Burada z ≥ 0 ve z < 0 durumları ayrı ayrı incelenmelidir. z ≥ 0 ise,
P (| Y | ≥ − z ) = 1 olup FZ ( z )
FZ ( z ) = 0.5 P (| Y | ≥ − z ) + 0.5 P (| Y | ≤ z ) = 0.5 + 0.5 P(| Y | ≤ z )
= 0.5[1 + P(− z ≤ Y ≤ z )] = 0.5 + 0.5[φ ( z ) − φ (− z )] = 0.5 + 0.5[φ ( z ) − (1 − φ ( z ))]
242
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
= 0.5 + 0.5 [ 2φ ( z ) − 1] = 0.5 + φ ( z ) − 0.5 = φ ( z )
dır. Yani, z ≥ 0 için çözüm tamamlanmıştır. Diğer taraftan z < 0 ise P (| Y | < z ) = 0 ve
φ ( z ) = 1 − φ (− z ) olduğundan FZ ( z ) ,
FZ ( z ) = 0.5 P (| Y | ≥ − z ) + 0.5 P (| Y | ≤ z ) = 0.5 P (| Y | ≥ − z )
= 0.5[ P (Y ≥ − z ) + P (Y ≤ z )] = 0.5[ P (Y ≤ z ) + P (Y ≤ z )] = 0.5[φ ( z ) + φ ( z ) = φ ( z )
dir. Her iki durumda da, FZ ( z ) = P ( Z ≤ z ) = φ ( z ) olduğundan Z =| Y |sgn( X ) rasgele
değişkeni de standart normal dağılıma sahiptir.
Burada, X ve Z nin her ikisi de standart normal rasgele değişkenler olmasına rağmen,
( X , Z )′ iki boyutlu normal değildir.
5.5.7 X ve Y serbestlik dereceleri p ve q olan bağımsız ki-kare dağılımılı rasgele
değişkenler olsun. T p ,q =
( X / p)
rasgele değişkenini tanımlayalım. E (T p,q ) = q / (q − 2)
(Y / q )
olduğunu gösteriniz.
Çözüm: X ~ χ 2p ve Y ~ χ q2 bağımsız olduğundan, E ( X / Y ) = E ( X ) E (1 / Y ) yazılır.
X ~ χ 2p ise E ( X ) = p dir. Y ~ χ q2 olmak üzere E (1 / Y ) beklenen değerini
hesaplayalım. Y nin olasılık yoğunluk fonksiyonu,
 y ( q /2)−1e− y /2

f ( y ) =  Γ ( q / 2 ) 2q /2

0

, x>0
,
d . y.
olup E (1 / Y ) değeri,
∞
∞
∞
1
1 ( q /2 )−1 − y /2
1
y
e
dy =
y ( q /2)−2 e− y /2 dy
∫
∫
 q  q /2 y
 q  q /2
0
Γ   2( ) 0
Γ   2( ) 0
2
2
q 
q 
q 
Γ  − 1 2( q /2)−1
Γ  − 1
Γ  − 1
∞
1
1
1
( ( q /2 )−1)−1 e− y /2 dy =  2 
2  =
2 
=
=
∫y
2
2 q
 q  ( q /2 ) 0
 q  q /2
q

Γ 2
Γ 2
Γ 
Γ  − 1 + 1
2
2
2
2

E (1/ Y ) = ∫
1
f ( y )dy =
y
ÖZEL DAĞILIMLAR
243
q 
Γ  −1
1
1 1
1 2
1
2 
=
=
=
=
2  q   q  2  q  2 q−2 q−2
 −1 Γ  −1
 −1
2  2 
2 
olarak hesaplanmıştır. Buradan, T p ,q rasgele değişkeninin beklenen değeri
(
)
( X / p) 
X
 = E ( X / p ) E (1/ ( Y / q ) ) = E  
 p
 (Y / q ) 
E Tp ,q = E 
q
q p
1
 = q E  =
Y  p
Y  q−2
E
olarak bulunmuş olur.
5.5.8 Y1, Y2 ,… , Yn , Yn+1 bağımsız N (0, σ 2 / 2) dağılımılı rasgele değişkenler olsun.
a) X i = Y i − Y n +1 , i = 1, 2,3,..., n olmak üzere
P ( X1 ≥ 0, X 2 ≥ 0,..., X n ≥ 0) =
1
n +1
olduğunu gösteriniz.
b) X i = Y i − Y i +1 , i = 1, 2,3,..., n olsun. Bu durumda,
P ( X1 ≥ 0, X 2 ≥ 0,..., X n ≥ 0) =
1
(n + 1)!
olduğunu gösteriniz.
Çözüm: a) X1, X 2 ,… , X n rasgele değişkenleri X = ( X1,… , X n )′ şeklinde yazıldığında,
X rasgele vektörü, beklenen değeri µ , varyans-kovaryans matrisi Σ olan n − değişkenli
normal dağılıma sahiptir. Yani, X = MN n ( µ , Σ) dir. Burada,
 σ2 σ2 /2 σ2 /2

σ 2 / 2 σ 2 σ 2 / 2
 2
2
2
µ = 0 ve Σ = σ / 2 σ / 2 σ



 2
σ / 2 σ 2 / 2 σ 2 / 2
dir. Şimdi, P ( X1 ≥ 0, X 2 ≥ 0,..., X n ≥ 0 ) =
.
.
σ 2 / 2

σ 2 / 2

σ 2 / 2




σ 2 
1
olduğunu gösterelim. Bunun için,
n +1
244
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
1 0 0
 X1 
0 1 0
X 

 2
0 0 1
. 

X =
 =
. 

. 

 
0 0 0
 X n  n×1 
0 0 0
−1
.
.
0
.
.
0
−1
0
−1
.
.
0
.
.
1





−1
−1 n×( n +1)
Y 1 
 
Y 2 
. 
 
=MY
. 
 
. 
 
Y n  ( n +1)×1
yazalım. Bu durumda, µY = 0 ise µ X = M µY = 0 ve ΣY = (σ 2 / 2) I olup, X rasgele
vektörünün varyans-kovaryans matrisi
ΣX
2 1
1 2
2 
σ

= M ΣY M ′ =
2 

1 1
.
.
.
.
.
.
1
1 



2 
şeklinde olur. X i = Y i − Y i +1 , i = 1, 2,3,..., n olduğundan aranan olasılık,
P ( X1 ≥ 0, X 2 ≥ 0,..., X n ≥ 0 ) = P (Y1 ≥ Yn+1, Y2 ≥ Yn +1,..., Yn ≥ Yn +1 )
∞
= ∫ P (Y1 ≥ Yn+1 , Y2 ≥ Yn+1,..., Yn ≥ Yn+1 Yn +1 = y ) fYn +1 ( y ) dy
−∞
∞
∞
n
= ∫ P ( Y1 ≥ y, Y2 ≥ y,..., Yn ≥ y ) fYn +1 ( y ) dy = ∫ [1 − FY ( y )] fYn +1 ( y ) dy
−∞
=−
1
[1 − FY ( y)]
n +1
−∞
n+1 ∞
−∞
=
1
n +1
dir.
b) X i = Y i − Y i +1 , i = 1, 2,3,..., n denirse, X = ( X1, X 2 ,… , X n )′ in dağılımı beklenen
değeri µ = 0 varyans kovaryans-matrisi Σ* olan n − değişkenli normaldir. Buradan,
X = MN n ( µ , Σ* ) olup P ( X1 ≥ 0, X 2 ≥ 0,..., X n ≥ 0) olasılığını hesaplayabiliriz. Burada,
ÖZEL DAĞILIMLAR
245
 σ2
−σ 2 / 2
0

 −σ 2 / 2
−σ 2 / 2
σ2

* 
0
σ2 /2
σ2
Σ =



 2
 σ / 2 σ 2 / 2 σ 2 / 2
.
.
0 

0 

0 




σ 2 
olup P ( X1 ≥ 0, X 2 ≥ 0,..., X n ≥ 0) olasılığı için X rasgele vektörünü
1 −1 0
 X1 
 0 1 −1
X 

 2
0 0 1
. 

X =  =
. 

. 

 
0 0 0
 X n  n×1 
0 0 0
.
.
.
.
.
.
.
.
0
0
Y1 

 
0 0

Y 2 
0 0
. 

 
=MY

. 

 

. 
−1 0 
Y 
1 −1 n×( n +1)  n  ( n+1)×1
şeklinde yazalım. Buradan, integrallerin ardışık olarak hesaplanması ile aranan olasılık,
P ( X1 ≥ 0, X 2 ≥ 0,..., X n ≥ 0 ) = P (Y1 ≥ Y2 , Y2 ≥ Y3 ,..., Yn ≥ Yn +1 )
∞
= ∫ P (Y1 ≥ Y2 , Y2 ≥ Y3 ,..., Yn ≥ Yn+1 Y1 = y1 ) fY1 ( y1 ) dy1
−∞
∞
= ∫ P (Y2 ≤ y1, Y2 ≥ Y3 ,..., Yn ≥ Yn +1 ) f ( y1 ) dy1
−∞
∞ y1
= ∫ ∫ P ( Y2 ≤ y1 , Y3 ≤ y2 ,..., Yn ≥ Yn+1 ) f ( y2 ) f ( y1 ) dy2 dy1
−∞ −∞
∞ y1
yn
= ∫ ∫ ... ∫ FYn +1 ( yn+1 ) f ( yn +1 ) f ( yn )... f ( y2 ) f ( y1 ) dyn dyn−1...dy2 dy1
−∞ −∞ −∞
∞ y1 yn −1
= ∫ ∫ ... ∫
−∞ −∞
−∞
1 2
F ( yn +1 ) f ( yn )... f ( y2 ) f ( y1 ) dyn dyn −1...dy2 dy1
2
.
.
∞
1
1
[ F ( y1)]n f ( y1) dy1 =
[ F ( y1)]n+1
(n + 1)!
−∞ n !
= ∫
olarak hesaplanmış olur.
∞
=
−∞
1
(n + 1)!
246
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
5.5.9 Rayleigh dağılımının ve (−π , π ) aralığındaki düzgün dağılımın olasılık yoğunluk
fonksiyonları sırası ile,
r e− r 2 /2
f R (r ) = 
 0
 1

fT (t ) =  2π
 0
, r>0
, d . y.
, −π < t < π
,
d . y.
dir. X = R cos(T ) , Y = R sin(T ) olsun.
a) R ve T bağımsız rasgele değişkenler ise X ve Y nin bağımsız standart normal
dağılımlı rasgele değişkenler olduğunu gösteriniz.
b) Tersine olarak, X ve Y bağımsız standart normal dağılımlı rasgele değişkenler ise,
R = X 2 + Y 2 ve T = arctan(Y / X ) rasgele değişkenlerinin yukarıdaki olasılık yoğunluk
fonksiyonlarına sahip bağımsız rasgele değişkenler olduğunu gösteriniz.
Çözüm:a) R ve T bağımsız olduğundan ortak olasılık yoğunluk fonksiyonu,
 1
− r 2 /2
 re
f R ,T (r , t ) =  2π

0
, r > 0, −π < t < π
,
d . y.
şeklinde yazılabilir. X = R cos(T ) , Y = R sin(T ) ise X ve Y rasgele değişkenlerinin değer
X 2 + Y 2 ve T = arctan(Y / X ) dir. Jacobien matrisi
kümeleri olup ters dönüşümler R =
için türevler,
∂r
=
∂x
x
x2 + y2
,
∂r
=
∂y
y
ve
x2 + y2
∂t
y
∂t
x
=− 2
,
=
∂x
x + y 2 ∂y x 2 + y 2
olup Jacobien matrisi ile determinantı da,
∂ r
 ∂x
J =
∂t
 ∂x

x
∂r 

∂y   x 2 + y 2
=
∂t  
y
−

∂y   x 2 + y 2



x +y 
ve det ( J ) =

x

x 2 + y 2 
y
2
2
1
x2 + y 2
olarak hesaplanmıştır. Buradan X ve Y nin ortak olasılık yoğunluk fonksiyonu,
ÖZEL DAĞILIMLAR
247
f ( x, y ) = det ( J ) f R,T ( r ( x, y ), t ( x, y ) ) =
=
1
2π
1
x2 + y2 e
x2 + y2
(
)
− x 2 + y 2 /2
1 −( x 2 + y 2 )/2
1 − x 2 /2 1 − y 2 /2
e
=
e
e
= f X ( x) fY ( y )
2π
2π
2π
olarak yazılır. Yani, X ve Y bağımsız standart normal dağılıma sahip rasgele değişkenlerdir.
b) X ve Y nin ortak olasılık yoğunluk fonksiyonu,
f ( x, y ) = f X ( x) fY ( y ) =
olup R =
1 − x2 /2 1 − y 2 /2 1 −( x 2 + y 2 ) / 2
e
e
=
e
, x, y ∈ 2π
2π
2π
X 2 + Y 2 ve T = arctan(Y / X ) den ters dönüşümler,
X = R cos(T ) , Y = R sin(T )
şeklindedir. Jacobien matrisi için türevler,
∂x
∂x
∂y
∂y
= cos(t ) ,
= − r sin(t ) ve
= sin(t ) ,
= r cos(t )
∂r
∂t
∂r
∂t
dir. R ve T nin tanım bölgeleri sırası ile + ve (−π , π ) olup Jacobien matrisi ve determinantı,
∂ x
∂r
J =
∂ y
∂r

∂x
∂ t  cos(t ) − r sin(t ) 
=
∂ y   sin(t ) r cos(t ) 
∂ t 
ve det( j ) = r (cos 2 (t ) + sin 2 (t ) ) = r
dir. Buradan, R ve T nin ortak olasılık yoğunluk fonksiyonu r > 0 ve −π < t < π için
r − r 2 cos2 (t ) − r 2 sin 2 (t )
e
e
2π
2
 1 
=  r e− r /2    = f R (r ) fT (t )

  2π 
f R ,T (r , t ) =| det( J ) | f X ,Y ( r ( x, y ), t ( x, y ) ) =
=
r − r 2 (cos2 (t )+sin 2 (t )) /2
e
2π
olarak yazılır. Yani R ve T , olasılık yoğunluk fonksiyonları
r e− r 2 /2
f R (r ) = 
 0
, r>0
, d . y.
olan bağımsız rasgele değişkenlerdir.
 1

fT (t ) =  2π
 0
, −π < t < π
,
d . y.
248
MATEMATİKSEL İSTATİSTİĞE GİRİŞ
5.5.10 X ve Y iki boyutlu standart normal dağılıma sahip rasgele değişkenler olsun.
−1 < ρ < 1 olmak üzere ortak olasılık yoğunluk fonksiyonu x, y ∈ için,
f ( x, y ) =


1
2
2
exp  −
(
x
+
y
−
2
ρ
x
y
)

 2(1 − ρ 2 )

2π 1 − ρ 2


1
dir. Buna göre, U = X / Y rasgele değişkeninin olasılık yoğunluk fonksiyonunu bulunuz.
V = Y yardımcı dönüşümü ile ters dönüşümler X = U V ve Y = V olup
Çözüm:
Jacobien matrisinin determinantı det( J ) = v dir. Buradan U ve V nin ortak olasılık
yoğunluk fonksiyonu u , v ∈ için
fU ,V (u, v) =| det( J ) | f X ,Y ( u( x, y), v( x, y) ) =


1
(u v)2 + v2 − 2 u v v 
exp  −
2
 2(1 − ρ ) 

2π 1 − ρ 2


|v|
olup U nun olasılık yoğunluk fonksiyonu için V nin değer kümesi üzerinden integrali
alınır. fU ,V (u , v) fonksiyonu v ye göre çift olup, çift fonksiyonun simetrik bir bölge
üzerinden integrali,
∞
∫
∞
fU ,V (u , v)dv = 2 ∫ fU ,V (u , v)dv
0
−∞
şeklindedir. Buradan a = [u 2 + 1 − 2 ρ u ] / (1 − ρ 2 ) olmak üzere, U nun olasılık yoğunluk
fonksiyonu,
∞
∞
∫
fU (u ) =
v =−∞
=
 v2 a 
2
fU ,V (u, v) dv = ∫
exp  −
 dv =

2
2π 1 − ρ 2
 2 
−∞ 2π 1 − ρ
1− ρ 2
1
2
π
u + 1 − 2ρu
|v|
=
1− ρ 2
π
1
2
2
u + 1 − 2ρ u + ρ − ρ
2
=
∞
 v2 a 
v
exp
dv
−

∫
 2 


0
1− ρ 2
π
1
2
(u − ρ ) + (1 − ρ 2 )
olarak bulunmuştur. Yani, U nun olasılık yoğunlu fonksiyonu,
fU (u ) =
1− ρ 2
π
1
2
(u − ρ ) + (1 − ρ 2 )
, u∈
dir. Bu olasılık yoğunluk fonksiyonu, Cauchy dağılımının olasılık yoğunluk fonksiyonuna
benzemektedir.
Download