BÖLÜM 1 TEMEL OLASILIK KAVRAMLARI 1.1. Kümeler İstatistik, adına veri (data) denilen sayısal değerlerin derlenmesi, analizlerinin yapılması ve analiz sonuçlarının yorumlanmasında gerekli bilgileri sağlayan bir bilim dalıdır. Aslında istatistik, doğadaki bu üç problemin çözümüne yardımcı olmaktadır. Verilerin derlenmesi, analizlerin ve analiz sonuçlarının yorumlanması ise belli kurallara bağlıdır. Bir paranın atılması deneyinde sonuç, yazı ya da turadır. Ancak hangisinin geleceği hakkında kesin bir şey söylenemez. Yani, deneyin sonucu tamamen rastlantıya bağlıdır. Bu bağlamda istatistik, rasgelelik içeren olaylar, süreçler ve sistemler hakkında modeller kurmada, bu modellerden sonuçlar çıkarmada gerekli bilgileri sağlayan bir bilim dalıdır (Öztürk, 1993). Aşağıda ayrıntılarına girmeden temel olasılık kavramları ile ilgili kısa bilgiler verilecektir. Bir deney yapıldığında, gerçekleşebilecek bütün sonuçların kümesine örnek uzay denir. Örnek uzay, ya da S ile gösterilir. Bir paranın atılması deneyinde örnek uzay, sadece iki elemandan oluşan bir kümedir. Bunu {Y , T } şeklinde gösterebiliriz. Bir zarın atılması deneyi için örnek uzay, {w1, w2 ,..., w6 } şeklindedir. Burada w i , üzerinde i tane nokta bulunan zarı ifade etmektedir. Örnek uzay bir kümedir. Kümenin net bir tanımı olmasa da, hakkında düşündüğümüz ne ise buna küme diyeceğiz. Kümeler büyük harfler ile gösterilecektir. Aşağıda, kümeler ile ilgili bazı temel kavramlar özetlenmiştir. Boş Küme: Elemanı olmayan kümeye boş küme denir ve ile gösterilir. Alt Küme: A ve B iki küme olmak üzere, A nın her elemanı aynı zamanda B nin de bir elemanı ise, A kümesi B kümesinin alt kümesidir denir ve A B ile gösterilir. Matematiksel olarak, A B x A için x B şeklinde ifade edilir. 2 MATEMATİKSEL İSTATİSTİĞE GİRİŞ {a, b, c, d , e, f , g} ve nın iki alt kümesi A {a, b } , B {a, b, c, d , e} olsun. Buna göre, A nın her elemanı aynı zamanda B nin de bir elemanı olup A B dir. A B bağıntısı şematik olarak Şekil (1.1.1) de verilmiştir. Şekil 1.1.1 Altküme bağıntısı A ve B kümeleri için A B ve B A kapsama bağıntıları sağlanıyorsa, A ve B kümeleri eşittir denir ve A B yazılır. Yani, A ve B eşit kümelerdir. Arakesit (kesişim) Kümesi: Her iki kümeye de ait elemanların oluşturduğu kümedir. Arakesit kümesi matemetiksel olarak A B { x : x A ve x B} şeklinde ifade edilir. Yani arakesit kümesi, ortak elemanların oluşturduğu kümedir. Birleşim Kümesi: A ve B gibi iki kümeden en az birine ait elemanların oluşturduğu kümedir. Birleşim kümesi de A B { x : x A veya x B} şeklinde ifade edilir. Tümleme: Evrensel kümede olup da A kümesinde olmayan elemanların kümesi, A nın tümleyen kümesidir ve Ac ile gösterilir. Ac kümesi Ac { x : x A} ile ifade edilir. Ayrıca, ( A B)c Ac B c ve ( A B)c Ac B c dir. Fark Kümesi: Kümelerden birinde olup da diğerinde olmayan elemanların oluşturduğu kümedir ve A \ B ile gösterilir. Fark kümesi bazen A B c şeklinde de ifade edilir. Burada, A \ B A Bc {x : x A ve x B} dir. Simetrik Fark Kümesi:: İki fark kümesinin birleşim kümesidir ve A B ile gösterilir. Simetrik fark kümesi A B ( A \ B ) ( B \ A) veya A B ( A B c ) ( B Ac ) şeklinde de ifade edilebilir. TEMEL OLASILIK KAVRAMLARI 3 {a, b, c, d , e, f } olmak üzere nın A {a, b, c} ve B {c, d , e} alt kümelerini seçelim. Bu alt kümeler kullanılarak yukarıdaki işlemler Şekil (1.1.2) de gösterilmiştir. Bu kümeler, Ac {d , e, f } , A \ B {a, b} , A B {c} , A B {a, b, c, d , e} , A B ( A \ B) ( B \ A) {a, b, d , e} şeklindedir. Şekil 1.1.2 Kümeler ve küme işlemleri (tararı alan ilgili kümeyi göstermektedir) Kümeler üzerindeki bütün işlemler arakesit ve birleşim işlemlerine bağlıdır. Sayılabilir sayıdaki kümelerin bir dizisi n 1 için An olsun. An lerin sayılabilir birleşimkümesi An x : en az bir i için x Ai , n 1 sayılabilir arakesit kümesi ise An x : n1 her i için x Ai şeklinde ifade edilir. Diğer taraftan, kümelerin sayılabilir birleşimlerinin (ve arakesitlerinin) tümleyeni, c c An An n1 n1 c ve An Anc n1 n1 şeklinde olup dağılma kuralları 4 MATEMATİKSEL İSTATİSTİĞE GİRİŞ birleşimin kesişim üzerine dağılma özelliği: A ( B C ) ( A B ) ( A C ) kesişimin birleşim üzerine dağılma özelliği: A ( B C ) ( A B ) ( A C ) şeklindedir. Tanım 1.1.1 Örnek uzayın bazı alt kümelerinin oluşturduğu bir kolleksiyona sınıf denir Sınıflar için , , veya gibi semboller kullanılacaktır. Bir paranın atılması deneyinde örnek uzay {Y , T } olup, 1 {, ,{Y }} ve 2 {,{T }} birer sınıftır. Örnek uzay {a, b, c, d } ise { , ,{a, b},{a, c, d },{b, c}} de bir sınıftır. Tanım 1.1.2 Bir kümenin bütün alt kümelerinin oluşturduğu sınıfa o kümenin kuvvet kümesi denir Kuvvet kümesi ( ) ile gösterilecektir. Bir kümenin n tane elemanı varsa kuvvet kümesindeki alt kümelerin sayısı 2 n dir. A kümesinin elemanlarının sayısı n( A) ile gösterilecektir. Örnek 1.1.1 {a , b , c, d } ise kuvvet kümesinde 16 tane alt küme vardır. Bunlar; () { , , {a}, {b}, {c}, {d }, {a, b}, {a, c}, {a, d }, {b, c}, {b, d }, {c, d }, {a, b, c}, {a, b, d },{a, c, d },{b, c, d } } dir. Örnek uzayın elemanlarının sayısı sonlu sayıda olabilir. Ayrıca, örnek uzayın elemanları sayılabilir sonsuz çoklukta olabileceği gibi, sayılamayan çoklukta da olabilir. Böyle durumlarda, örnek uzayın kuvvet kümesi yukarıda olduğu gibi yazılamaz Tanım 1.1.3 boş olmayan bir küme, da nın bazı alt kümelerinden oluşan bir sınıf olsun. sınıfı, a) b) her A için Ac c) her A, B için A B özelliklerini sağlıyorsa, sınıfına bir cebir denir. sınıfı (c) yerine c*) n olmak üzere An için An n 1 özelliğini sağlıyorsa sınıfına bir cebir (sigma cebir) denir. nun her elemanına bir olay, ( , ) ikilisine de ölçülebilir bir uzay denir TEMEL OLASILIK KAVRAMLARI 5 Tanımdan da anlaşılacağı gibi her cebir aynı zamanda bir cebir olmasına rağmen tersi doğru değildir. Ancak, örnek uzay sonlu elemanlı ise cebir aynı zamanda cebirdir. Örnek 1.1.2 a) Kuvvet kümesi tanımdaki üç koşulu sağladığından bir cebirdir. ( ) denirse, olduğundan dır. Diğer taraftan, A ise A olup, A c olduğundan Ac dur. Son olarak, n 1 için An ise her n için An ve evrensel küme olduğundan An dır. Yani, n 1 An olup kuvvet n 1 kümesi bir sigma cebirdir. b) {a, b, c, d } olsun. a { , , {a}, {b, c, d }} sınıfı bir cebirdir. Bu cebir aynı zamanda cebirdir. Ayrıca, b { , , {b}, {a, c, d }} sınıfı da bir sigma cebirdir. c) sonsuz elemanlı herhangi bir küme olmak üzere 1 sınıfı 1 { A : A veya Ac sonlu elemanlıdır} olarak tanımlansın. Bu sınıf bir cebir olmasına rağmen cebir değildir. Önce 1 sınıfının bir cebir olduğunu gösterelim. c olup, nin eleman sayısı sonludur. O halde, 1 dir. Ayrıca, A 1 ise A ya da A c sonlu elemanlıdır. A sonlu elemanlı ise, ( A c ) c A olup Ac 1 dir. A c sonlu elemanlı ise, sonlu elemanlı kümeler 1 sınıfında olacağından Ac 1 dir. Son olarak, 1 deki herhangi iki küme A ve B olsun. Burada üç farklı durum olabilir: i) kümelerin ikisi de sonlu elemanlı ii) kümelerin her ikisinin de tümleyeni sonlu elemanlı iii) kümelerden birinin kendisi sonlu elemanlı diğerinin tümleyeni sonlu elemanlı olabilir. Her üç durumda da A B veya ( A B ) c sonlu elemanlı olduğunun gösterilmesi gerekir. Şimdi bunları ayrı ayrı inceleyelim. i) A ve B nin her ikiside sonlu elemanlı ise A B de sonlu elemanlıdır. Kendisi sonlu elemanlı kümeler 1 de olduğundan A B 1 dir. ii) A ve B nin her ikisinin de tümleyeli sonlu elemanlı ise A c B c de sonlu elemanlıdır ( ( A B )c Ac B c olup sonlu elemanlı kümelerin arakesiti de sonlu 6 MATEMATİKSEL İSTATİSTİĞE GİRİŞ elemanlıdır). Yani, A B nin tümleyeni sonlu elemanlıdır. Tümleyeni sonlu elemanlı kümeler 1 de olduğundan A B 1 dir. iii) Son olarak A sonlu elemanlı, B nin de tümleyeni sonlu elemanlı olsun. Buna göre, A c B c de sonlu elemanlıdır ( ( A B )c Ac B c B c olup sonlu elemanlı bir kümenin alt kümesi de sonlu elemanlıdır). Yani, A B nin tümleyeni sonlu elemanlıdır. O halde, A B 1 dir. Burada tanımlanan 1 sınıfı cebir olma koşullarını sağladığı için bir cebirdir. Bu sınıf bir cebir olmasına rağmen cebir değildir. Bunu göstermek için tersine bir örnek vermek yeterlidir. Örnek uzay doğal sayılar kümesi ( ) olsun. Her n için, An {2 n } denirse, tek elemanlı kümeler 1 sınıfındadır (kendileri sonlu elemanlı). Bu sınıfın bir cebir olabilmesi için bu kümelerin sayılabilir birleşimlerinin de bu sınıfta olması gerekir. Oysa sayılabilir birleşim kümesi ve tümleyeni An 2, 4, 6, 8, ... n 1 ve An n1 c 1, 3, 5, 7, . . . şeklinde olduğundan, her iki küme de sonlu elemanlı değildir. O halde, 1 sınıfı bir cebir değildir. An 1 olup n 1 d) sayılamayan sonsuzlukta elemanı olan bir küme olsun. nın bazı alt kümelerinden oluşan bir sınıf da 2 { A : A veya Ac sayılabilir elemanlı} şeklinde tanımlansın. Bu sınıf cebirin tanımındaki koşulları sağlar. Önce, c olup nin eleman sayısı sıfırdır. O halde 2 dir. Şimdi A 2 olsun. Buna göre, A ya da A c sayılabilir elemanlı kümelerdir. A sayılabilir ise, ( A c ) c A olduğundan Ac 2 (tümleyeni sayılabilir) dir. A c sayılabilir ise kendisi sayılabilir olan kümeler 2 sınıfına aittir ( Ac 2 ) dir. Son olarak, bütün n 1 için An 2 olsun. Seçilen An ler üç farklı durumda olabilir. Bütün n ler için An ler sayılabilir olabilir. Bu durumda, sayılabilir TEMEL OLASILIK KAVRAMLARI 7 kümelerin sayılabilir birleşimleri de sayılabilir olduğundan An 2 dir. Diğer taraftan, n 1 bütün n ler için An lerin tümleyenleri sayılabilir ise Anc de sayılabilirdir. Buna göre, n 1 c c An An n1 n1 An 2 eşitliğinden dir. Son olarak, seçilen alt kümelerin bazılarının kendileri, n 1 diğerlerinin de tümleyeni sayılabilir olabilir. Kendileri sayılabilen olanları Bn , tümleyenleri sayılabilenleri de C n ile gösterelim. Buna göre, k 1 j 1 An Bk C j n1 C cj olup kümesi sayılabilirdir. Ayrıca, j 1 c c c c An Bk C j C j n 1 k 1 j 1 j 1 olduğundan sayılabilir bir kümenin her alt kümesi de sayılabilirdir. Buradan, An n 1 kümesinin tümleyeni sayılabilir olup An 2 dır. Yani, 2 sınıfı cebir tanımındaki n 1 bütün koşullarını sağladığından bir cebirdir Teorem 1.1.1 boş olmayan bir küme, da üzerinde bir sigma cebir olsun. Buna göre, a) b) her n için An ise An n 1 c) A , B ise A \ B A B c dir. 8 MATEMATİKSEL İSTATİSTİĞE GİRİŞ bir sigma cebir olduğundan ve daki her elemanın tümleyeni İspat: a) de da olacağından c dur. b) bir sigma cebir olduğundan her elemanının tümleyeni de dadır. Yani, bütün c n 1 için An ise An dir. Yine bir sigma cebir olduğundan bunların sayılabilir birleşimleri de dadır. Yani, Anc dir. Yine, sigma cebirin tanımından bu elemanın n 1 tümleyeni de nun bir elemanıdır. Buradan da c An Anc n 1 n1 elde edilir. c) A , B için A , B c olup (b) den A \ B A B c dur Teorem 1.1.2 kümesi üzerindeki iki sigma cebir 1 ve 2 olsun. Bu durumda 1 2 de bir sigma cebirdir. İspat: Sigma cebirlerin arakesitlerinden oluşan sınıfının bir sigma cebir olabilmesi için tanımdaki üç koşulu sağlaması gerekir. 1 ve 2 birer sigma cebir olduğundan 1 ve 2 olup 1 2 dir. Ayrıca, A ise A 1 ve A 2 dir. 1 ve 2 birer sigma cebir olduğundan Ac 1 ve Ac 2 dir. Yani, Ac 1 2 olup, Ac dur. Son olarak, n 1 için An ise arakesitin özelliğinden her n için An 1 ve An 2 olup, 1 ve 2 sigma cebir olduğundan Buradan da An n 1 n 1 An 1 ve An 2 dir. n 1 elde edilir. sınıfı tanımdaki bütün koşulları sağladığından bir sigma cebirdir Teoremin genel hali aşağıda ispatsız olarak verilmiştir. İspat için herhangi bir olasılık teorisi kitabına bakılabilir (Öztürk, 1993). TEMEL OLASILIK KAVRAMLARI 9 Teorem 1.1.3 I bir indis kümesi ve I için lar aynı örnek uzay üzerinde tanımlı sigma cebirler olsun. Buna göre, da bir sigma cebirdir I Tanım 1.1.4 kümesi üzerinde tanımlı iki sigma cebir 1 ve 2 olsun. 1 deki her olay aynı zamanda 2 de bir olay ise 1 sigma cebiri 2 sigma cebirinden daha küçüktür denir Teorem 1.1.4 nın bazı alt kümelerinden oluşan bir sınıf olsun (sigma cebir olmak zorunda değildir). Bu sınıfını kapsayan en küçük bir sigma cebir vardır. İspat: Önce, bu sınıfı kapsayan en az bir sigma cebir vardır. Kuvvet kümesi nın bütün alt kümelerinden oluşan sigma cebir olduğundan bu sınıfı kapsar. Bu sınıfı kapsayan başka sigma cebirler de olabilir. Bunlara, I bir indis kümesi olmak üzere I için diyelim. Bu sigma cebirlerin herbiri sınıfını kapsadığından ların arakesiti de sınıfını kapsar. Diğer taraftan, bu arakesit sigma cebiri sınıfını kapsayan diğer sınıflarından küçüktür. O halde, sınıfını kapsayan en küçük sigma cebir vardır Herhangi bir sınıfını kapsayan en küçük bir sigma cebir ( ) ile gösterilecektir. Bu sınıfını kapsayan en küçük sigma cebire nin ürettiği sigma cebir denir. Örnek uzay reel sayılar kümesi ( ) olsun. Reel sayılar doğrusu üzerindeki bir açık aralık, a , b ve a b olmak üzere, ( a , b ) şeklinde ifade edilir. Buna göre aşağıdaki sınıfları tanımlayalım: 1 (a , b ): a , b ve a b , açık aralıkları sınıfı 2 [a , b ]: a , b ve a b , kapalı aralıklar sınıfı 3 (a , b ]: a , b ve a b , yarı açık aralıklar sınıfı. Bu sınıfların hiçbiri sigma cebir değildir. olduğundan ( , ) olup bir reel sayı değildir. Dolayısı ile, 1 , 2 ve 3 dır. Bu sınıflar birer sigma cebir olmamasına rağmen, Teorem (1.1.4) gereğince, bu sınıfları kapsayan en az bir sigma cebir vardır. Tanım 1.1.5 deki açık aralıkların ürettiği sigma cebire Borel cebiri denir Borel cebiri ( ) ile gösterilecektir. Bu tanıma göre, deki bütün açık aralıklar Borel cebirindedir. deki diğer alt kümeler de Borel cebirindedir. Yani, {a} , {a, b, c} 10 MATEMATİKSEL İSTATİSTİĞE GİRİŞ türündeki tek nokta kümeleri, [ a , b ] gibi kapalı aralıklar, ( a , b ] gibi yarı-açık aralıklar ve ( , b ] gibi aralıklar da Borel cebirindedir. Yani, Borel cebiri deki açık aralıklar tarafından üretilen sigma cebiri olmasına rağmen, deki diğer alt kümeleri de içerir. Şimdi bunu gösterelim. Önce a olmak üzere, An (a (1/ n) , a (1/ n)) açık aralıklar dizisini ele alalım. An ler açık aralıklar olduğundan her n için An ( ) dir. Ayrıca, Borel cebiri aynı zamanda bir sigma cebir olduğundan Teorem (1.1.1b) gereğince sayılabilir arakesitleri de Borel cebirindedir. Yani, {a} An ( ) n 1 olup {a} şeklindeki tek nokta kümeleri Borel cebirindedir. An {n} alınırsa, ( ) bir sigma cebir olduğundan nin de (doğal sayılar kümesi) Borel cebirinde olduğu görülür. Benzer şekilde, rasyonel sayılar kümesi Q , sayılabilir bir küme olduğundan Q ( ) dir. İirrasyonel sayılar kümesi I , rasyonel sayılar kümesinin tümleyeni olduğundan I ( ) dir. Diğer taraftan, a , b ve a b olmak üzere, [ a , b ] {a} ( a , b ) {b} () dir. Bununla birlikte, An [ a n , a ] olarak seçildiğinde, ( , a ] An ( ) n 1 olur. Buradan, deki bütün alt kümelerin Borel cebirinde olduğu izlenimi oluşmaktadır. Oysa, de olup da Borel cebirinde olmayan alt kümeler olabilir. Bir kümenin herhangi bir fonksiyona göre görüntüsü ile ters görüntüsü bir sonraki bölümde inceleyeceğimiz rasgele değişkenler açısından önemlidir. Burada, altkümelerin görüntüleri ile ters görüntülerini kısaca hatırlayalım. ve boş olmayan iki küme ve f : olsun. Herhangi bir A için f ( A) B dir. Ayrıca, B için, B nin f fonksiyonuna göre ters görüntüsü f 1 ( B ) {w : f ( w) B} dir. Burada, f 1 ( B ) olup, f 1 ( B ) alt kümesi, görüntüleri B de olan nın elemanlarının oluşturduğu altkümedir. TEMEL OLASILIK KAVRAMLARI 11 Şekil 1.1.3 Görüntü ve Ters Görüntü Kümeleri Altkümelerin görüntüleri ile ters görüntülerine ilişkin özellikler aşağıdaki teoremde özetlenmiştir. Yukarıda da bahsedildiği gibi, herhangi iki küme birbirinin alt kümeleri ise, bu iki küme eşittir (yani, A B ve B A özellikleri sağlanıyorsa A B dir). Teorem 1.1.5 ve boş olmayan iki küme ve f : olsun. Her i için ve Bi olmak üzere, a) f 1 Bi f 1 ( Bi ) i 1 i 1 b) f 1 Bi f 1 ( Bi ) i 1 i 1 c) f 1 ( A \ B ) ( f 1 ( A)) \ ( f 1 ( B)) , A, B dir. İspat: a) Her x A için x B ise A B ve her x B için x A ise B A dır. Bu iki altküme bağıntısı da geçerli ise A B dir. Buradan, x f 1 Bi f ( x) Bi n0 f ( x) Bn0 x f 1 ( Bn0 ) x f 1 ( Bi ) i 1 i 1 i 1 olduğundan f 1 Bi f 1 ( Bi ) elde edilir. Benzer şekilde, i 1 i 1 x f 1 ( Bi ) n0 x f 1 ( Bn0 ) f ( x ) Bn0 f ( x) Bi x f 1 Bi i 1 i 1 i 1 olup f 1 ( Bi ) f 1 Bi dir. Bu iki alt küme bağıntısından da, i 1 i 1 f 1 Bi f 1 ( Bi ) i 1 i 1 eşitliği elde edilmiş olur. Bu da ispatın (a) kısmını tamamlar. 12 MATEMATİKSEL İSTATİSTİĞE GİRİŞ b) Benzer şekilde, x f 1 Bi f ( x) Bi f ( x) Bi , i x f 1 ( Bi ) , i x f 1 ( Bi ) i 1 i 1 i 1 olduğundan f 1 Bi f 1 ( Bi ) alt küme bağıntısı elde edilir. Diğer taraftan, i 1 i 1 x f 1 ( Bi ) x f 1 ( Bi ) , i f ( x ) Bi , i f ( x) Bi x f 1 Bi i 1 i 1 i 1 eşitliğinden f 1 ( Bi ) f 1 Bi alt küme bağıntısı elde edilir. Bu iki alt küme i 1 i 1 bağıntısından f 1 ( Bi ) f 1 Bi eşitliği elde edilmiş olur. i 1 i 1 c) 4Önce, f 1 ( B c ) [ f 1 ( B)]c olduğunu gösterelim. Bu eşitlik de, x [ f 1 ( B)]c x f 1 ( B ) f ( x) B f ( x) B c x f 1 ( B c ) önermesinden açıktır. Buradan da, f 1 ( A \ B ) f 1 ( A B c ) f 1 ( A) f 1 ( B c ) f 1 ( A) [ f 1 ( B)]c f 1 ( A) \ f 1 ( B ) bulunur Teorem 1.1.6 ve boş olmayan iki küme ve f : olsun. Her i için Ai olmak üzere, a) f Ai f ( Ai ) i 1 i 1 b) f Ai f ( Ai ) , burada eşitlik yoktur i 1 i 1 c) f ( f 1 ( B )) B f () , B dir. İspat: Bu teoremin ispatı da bir önceki gibi iki kümenin birbirlerinin altkümeleri olduğu gösterilerek yapılabilir. a) y f Ai y f ( x) olacak şekilde bir x Ai vardır. Buradan, i 1 i 1 TEMEL OLASILIK KAVRAMLARI 13 i 1 i 1 x Ai n0 x An0 f ( x) f ( An0 ) y f ( x) f ( Ai ) f Ai f ( Ai ) i 1 i 1 dir. Diğer taraftan, y f ( Ai ) n0 y f ( An0 ) y f ( x) olacak şekilde x An0 x Ai i 1 i 1 f ( x) f Ai f ( Ai ) f Ai i 1 i 1 i 1 dir. Bu iki alt küme bağıntısından f Ai f ( Ai ) eşitliği elde edilir. Böylece, ispatın i 1 i 1 (a) kısmı tamamlanmıştır. b) Kolayca görüleceği gibi y f Ai y f ( x ) olacak şekilde bir x Ai vardır i 1 i 1 x Ai , i y f ( x) f ( Ai ), i f ( x) f ( Ai ) i 1 f Ai f ( Ai ) i 1 i 1 dir. Eşitliğin sağlanmadığını göstermek için tersine bir örnek vermek yeterlidir. Bunun için f : fonksiyonu f ( x) x 2 şeklinde verilmiş olsun. A1 {1, 0} ve A2 {0,1} diyelim. A1 A2 {0} olup f ( A1 A2 ) {0} dır. Oysa, f ( A1 ) {0,1} ve f ( A2 ) {0,1} dir. Yani, f ( A1 ) f ( A2 ) {0,1} olup f ( A1 A2 ) f ( A1 ) f ( A2 ) dir. Bu sonuç da, eşitliğin sağlanmadığını göstermek için yeterlidir. Sonuç olarak f ( A1 A2 ) f ( A1 ) f ( A2 ) dir. c) B olsun. Bu durumda, y f ( f 1 ( B)) y f ( x) olacak şekilde bir x f 1 ( B ), x vardır. x ve f ( x) B y f ( x) f () ve y f ( x) B dir. 14 MATEMATİKSEL İSTATİSTİĞE GİRİŞ y B f () f ( f 1 ( B )) B f () dır. Diğer taraftan, y B f () y B ve y f () x y f ( x ) ve f ( x) B, x f 1 ( B) y f ( x) f ( f 1 ( B)) B f () f ( f 1 ( B )) olup, bu iki altküme bağıntısından f ( f 1 ( B )) B f () eşitliği elde edilir 1.2. Olasılık Ölçüsü ve Olasılık Uzayları Bu kısımda, olasılık ölçüsü ve bazı temel özellikleri incelenecektir. Tanım 1.2.1 boş olmayan bir küme, da üzerinde bir sigma cebir olsun. üzerinde tanımlı, P : 0,1 A P ( A) P küme fonksiyonu, a) A için P ( A) 0 b) P ( ) 1 c) An , n ler daki ayrık ( Ak A j , k j ) olayların bir dizisi olmak üzere, P An P( An ) n 1 n 1 özelliklerini sağlıyorsa, P ye bir olasılık ölçüsü, P ( A) sayısına A olayının olasılığı, ( , , P ) üçlüsüne de bir olasılık uzayı denir Aşağıda, olasılık ölçüsü ile ilgili özelliklerden bazıları bir teorem altında toplanmıştır. İspatlar, ifadelerden hemen sonra verilmiştir. Teorem 1.2.1 ( , , P ) bir olasılık uzayı olsun. a) A için, P( Ac ) 1 P( A) dır. İspat: A Ac ve A ile Ac ayrık olaylar ( A Ac ) olduğundan, P( A ) P( Ac ) P( A Ac ) P( ) 1 olup P( Ac ) 1 P( A) dir. b) P ( ) 0 dır. TEMEL OLASILIK KAVRAMLARI 15 İspat: c olup (a) daki sonuca göre P( ) P( c ) 1 P() 0 elde edilir. c) A1 , A2 , An ayrık olaylar ise, n n P Ai P ( Ai ) i 1 i 1 dir. İspat: k 1, 2,3,... için An k alındığında sonuç olasılık ölçüsü tanımından açıktır. Buradan A, B , A ve B ayrık ise, P ( A B ) P ( A) P ( B ) dir. d) A, B ve A B ise P ( A) P ( B ) dir. İspat: B A ( B Ac ) olup, A ile B Ac ayrık olaylar ve P bir olasılık ölçüsü olduğundan P ( A B c ) 0 dır. Buradan aranan sonuç P ( B ) P ( A ( B Ac )) P ( A) P ( B Ac ) P ( A) şeklinde elde edilir. Buradan da, A B ise, P ( B \ A) P ( B ) P ( A) elde edilir. Ayrıca, A için A altküme bağıntısından, P ( ) P ( A) P ( ) olup, 0 P ( A) 1 dir. e) A, B ise, P ( A B ) P ( A) P ( B ) P ( A B ) dir. Bu ifadenin daha genel hali, A n , n için, n n P Ai P( Ai ) P( Ai A j ) P( Ai A j Ak ) 1i j n 1i j k n i 1 i 1 ... (1) n1 P( A1 A 2 ... A n ) şeklindedir. İspat: n 2 alalım (genel hali için matematiksel tümevarım kullanılır). A B kümesi A B A ( B \ A) şeklinde yazılabilir. Buradan da, A ile B \ A kümeleri ayrık olduğundan P( A B) P( A) P( B \ A) dir. Diğer taraftan, A B ile B \ A ayrık olaylar olup B kümesi de B ( A B ) ( B \ A) olarak yazıldığında B olayının olasılığı P( B) P( A B) P( B \ A) olarak yazılabilir. Buradan da B \ A olayının olasılığı P( B \ A) P( B) P( A B) dir. P ( B \ A) nin değeri P ( A B ) eşitliğinde yerine yazıldığında aranan sonuç elde edilir. Yani, 16 MATEMATİKSEL İSTATİSTİĞE GİRİŞ P( A B) P( A) P( B \ A) P( A) P( B) P( A B ) dir. f) n için A n ise, P An P( An ) n 1 n 1 dir. İspat: n için A n olaylarının dizisi ayrık değildir. An kümelerini kullanılarak n 1 B1 A1 ve B n A n \ A i i 1 n 1 n 1 n 1 n 1 ayrık olayların dizisini tanımlayalım. Önce, A n B n ve B n A n alt küme n 1 n 1 bağıntılarının geçerli ise A n B n dir. Şimdi, eşitliğin geçerli olduğunu gösterelim. Bunun için önce, her n için B n A n olduğundan, n 1 n 1 B n An (*) dir. Diğer taraftan, x A n için, n 0 öyleki x An 0 dır. Bu n 0 doğal sayısı n 1 x A1 , x A2 , ..., x An 0 1, x An 0 olacak şekilde seçilebilir ( x A1 ve x A 2 için n 0 2 olup, x A 2 \ A1 B 2 dir). Buradan, n 0 1 x A1 , x A 2 , ..., x A n 0 1 , x A n 0 x A n 0 \ Ai B n 0 i 1 n 1 n 1 n 1 (**) x B n An B n olur. (*) ve (**) daki ifadeler birleştirildiğinde, n 1 n 1 A n B n eşitliği elde edilir. Şimdi bu sonucu kullanarak ispatı yapabiliriz. Bn ler ayrık ve A B ise P ( A) P ( B ) , özellikleri kullanıldığında aranan sonuç, TEMEL OLASILIK KAVRAMLARI P An P B n n 1 n 1 17 n 1 n 1 P(B n ) P( An ) şeklinde elde edilir Şimdi, reel sayılardaki limit kavramını hatırlayalım ve sonra da küme dizilerinde limit tanımını yazalım. Elemanları reel sayılar olan bir dizi an olsun. Her 0 için n 0 öyleki her n n 0 için | a n a | oluyorsa, an dizisinin limiti vardır ve lim a n a dır. n Bir an dizisi için bir çok alt ve üst sınır yazılabilir. Bu alt sınırların en büyüğüne dizinin limit infimumu denir ve lim inf an veya n lim an ile gösterilir. an dizisinin limit x infumunu için, lim inf an lim an lim inf ak sup inf ak supinf ak : k n : n 0 n n n k n n0 k n şeklindeki gösterimlerden herhangi biri kullanılabilir. Benzer şekilde, üst sınırlarının en küçüğüne de dizinin limit supremumu denir ve lim sup an veya lim an ile gösterilir. an n n dizisinin supremumu için de lim sup an lim an lim sup ak inf sup ak inf sup ak : k n : n 0 n n n k n n 0 k n gösterimlerinden biri kullanılabilir. Elemanları reel sayılar olan an dizisinin limit supremumu ve limit infimumu her zaman vardır. Eğer an dizisinin limiti varsa lim inf an lim sup an n n dir. Genel olarak, lim inf an lim sup an dir. n n Reel sayı dizilerindeki kavramlardan biraz farklı olarak küme dizilerinin limiti tanımlanır. Küme dizilerinde büyüklük ve küçüklük gibi kavramlar tanımlı olmadığı için alt küme kavramı kullanılır. A n küme dizisini kapsayan bir çok alt küme bulunabilir. O zaman, A n dizisini kapsayan alt kümelerden her biri A n dizisi için bir üst sınır olarak alınabilir. Benzer şekilde A n küme dizisi için alt sınırlar da yazılabilir. 18 MATEMATİKSEL İSTATİSTİĞE GİRİŞ nın alt kümelerinden oluşan bir dizi A n olsun. Açıkça görüleceği gibi bütün n ler için k n k n Ak An dir. Buna göre Ak kümeleri her n için A n dizisinin bir alt sınırı olarak alınabilir. Bu alt sınırların en büyüğü olarak bu kümelerin birleşimi alınabilir. Benzer şekilde, n için An k n k n Ak olduğundan Ak kümeleri An dizisi için bir üst sınırdır. Bu üst sınırların en küçüğü de bu kümelerin arakesiti olur. Buradan, An küme dizisinin limit infimumu ile limit supremumu, lim inf A n lim A n n n n 1 k n n Ak lim sup A n lim A n Ak , n n 1 k n olarak tanımlanır. Buradaki en büyük alt sınır ve en küçük üst sınır için, lim inf A n n Ak w n 1 k n : n 0 için w An 0 , n n 0 ve lim sup A n n Ak w : n 1 k n sonsuz çoklukta n için w An ifadeleri de kullanılabilir. lim sup An için bazen lim sup A n {w : w A n , i. o} n n ifadesi de kullanılır (“ i. o. infinitely often”). Tanım 1.2.2 Bir A n küme dizisinin limit infimumu ile limit supremumu eşit ise, A n dizisinin limiti vardır denir Bu tanıma göre, lim inf An lim sup An A ise, lim An A dır. Diğer taraftan, n n w lim inf A n w n n 1 k n n Ak n 0 için w k n 0 Ak w A k , k n 0 , n 0 1 , n 0 2,... w k n 0 Ak , her n 0 w n 0 1 k n 0 Ak lim sup A n n TEMEL OLASILIK KAVRAMLARI 19 olduğundan lim inf An lim sup An dir. Buradan, Teorem (1.2.1d) gereğince, ( , , P ) n n bir olasılık uzayı ve n için A n olmak üzere, P lim inf An P lim sup An n n dir. Ayrıca, ispatı bir çok olasılık kitabında bulunan ve Fatou Lemması olarak bilinen eşitsizlik, P lim inf An lim inf P An lim sup P An P lim sup An n n n n şeklindedir (Feller, 1970, sayfa 110-111). Fatou lemmasının ispatı ileride Teorem (1.2.4) de verilmiştir. Örnek 1.2.1 A n {1, 2, 3,..., n} olarak verilen A n küme dizisinin limiti varsa bulalım. Bunun için dizinin limit infimumu ile limit supremumunun hesaplanması gerekir. Önce, A n artan bir dizi ( n için A n A n1 ) olduğundan Ak A n dir. Buradan, k n dizinin limit infimumu lim inf A n n n 1 k n Ak A n n 1 dir. Benzer şekilde A n artan olduğundan, A n olup dizinin limit supremumu da k n lim sup A n Ak n n 1 k n dir. lim inf A n lim sup A n olup A n dizisinin limiti vardır ve lim An dir n n n Küme dizilerinin limitinin bulunması bazen kolaydır. Aşağıdaki teorem artan ya da azalan küme dizisinin limitini bulmak için kullanılabilir. Teorem 1.2.2 An artan ( n için A n A n1 ) ( n için A n1 A n ) kümelerin bir dizisi ise limiti vardır ve a) A n artan ise lim A n n An n 1 b) A n azalan ise lim A n n An n 1 ya da azalan 20 MATEMATİKSEL İSTATİSTİĞE GİRİŞ dir. Ak A n olup dizinin limiti infimumu, İspat: a) Önce A n artan ise k n lim inf A n Ak A n n n 1 k n n 1 dır. Şimdi, dizinin limit supremumunu bulalım. Bunun için A n artan olduğunda, lim sup A n n Ak A n n 1 k n n 1 olduğunu göstermek istiyoruz. Eğer n 1 k n Ak n 1 An ve n 1 An Ak n 1 k n her iki kapsama bağıntısıda gerçekleşirse, dizinin limit supremumu bulunmuş olur. Önce, x n 1 k n k n n 1 A k n için x Ak x A n olduğundan n 1 k n Ak An n 1 elde edilir. Diğer taraftan, x A n x A n0 olacak şekilde bir n 0 doğal sayısı vardır. n 1 A n dizisi artan ise bütün k için x An 0 k dir. Dolayısı ile, bütün k için x An 0 k x k 1 dir. Buradan, An n 1 Ak n 1 k n n0 1 k n0 Ak Ak bulunur. Bu iki sonuç birleştirildiğinde, n 1 k n An n 1 ve A n Ak n 1 n 1 k n alt küme bağıntıları sağlanır. Dolayısı ile, artan An dizisi için eşitliği elde edilir. Buna göre A n dizisinin limit supremumu n 1 k n Ak An n 1 TEMEL OLASILIK KAVRAMLARI 21 Ak A n lim sup A n n n 1 k n n 1 dir. Buradan lim sup A n lim inf A n n n An n 1 olduğundan lim A n n An n 1 bulunur. b) Şimdi A n azalan (yani, n için A n1 A n ) olsun. An azalan ise A nc dizisi artan olup limiti vardır. Buradan, (a) daki sonuç kullanıldığında, Anc artan küme dizisi için lim inf A nc A kc lim sup A nc Akc A nc n olup lim Anc n n 1 k n n n 1 k n n 1 Anc dir. Diğer taraftan, n 1 c c lim inf A c A c A lim sup A k n n n n n1 k n k n1 k n c lim sup A c Ac A lim inf A k k n n n n n1 k n n1 k n eşitlikleri yazılır. Buradan da, An dizisinin limiti için alt ve üst limitler c c c c c c c lim inf An Ak Ak lim sup A n Anc A n n n1 n1 n1 k n n1 k n n c lim sup An Ak Akc lim inf A nc Anc An n n1 n1 n1 k n n1 k n n şeklinde hesaplanmıştır. Dolayısı ile lim inf An lim sup An An n n n1 22 MATEMATİKSEL İSTATİSTİĞE GİRİŞ olduğundan dizinin limiti vardır ve lim An An n n 1 dir Teorem 1.2.3 ( , , P ) bir olasılık uzayı ve n için A n olsun. A n ler daki artan ya da azalan olayların bir dizisi ise, P lim A n lim P( An ) n n dir. İspat: A n dizisi olsun. Teorem (1.2.2) ye göre, A n dizisinin limiti vardır ve lim A n A n dir. A n dizisine bağlı olarak, B n ayrık olayların bir dizisini n n 1 B1 A1 ve n 2 için B n A n \ A n1 şeklinde tanımlayalım. Önce, n 1 n 1 A n B n eşitliğinin doğru olduğunu görelim. Bunun için n için B n A n olduğundan n 1 n 1 B n An yazılır. Diğer taraftan, x A n n0 için x A n 0 ve x A n 0 1 x B n 0 x B n n 1 olduğundan n 1 n 1 n 1 A n B n elde edilir. Bu iki sonuç birleştirildiğinde sayılabilir birleşim kümelerinin eşit olduğu görülür. Yani, n1 n1 A n B n dir. Diğer taraftan, her n için B n A n olduğundan, P( B n ) P( A n ) ve P( B n ) P( A n \ A n1 ) P( A n ) P( A n1 ) dir. Ayrıca, olasılık ölçüsünün tanımından B n ayrık olayları için TEMEL OLASILIK KAVRAMLARI 23 P B n P( B n ) n1 n1 dır. Buradan, n P lim A n P A n P B n P ( B n ) lim P ( B k ) n k 1 n n1 n1 n 1 lim P ( B 1 ) P ( B 2 ) P ( B 3 ) ... P ( B n 1 ) P ( B n ) n lim P( A 1) P( A2 \ A1) P( A3 \ A2 ) ... P( An1 \ An2 ) P( An \ An1) n lim P( A 1) P( A2 ) P( A1) P( A3 ) P( A2 ) ... P( An ) P( An1) n lim P( An ) n elde edilir. Dolayısı ile, A n olaylarının dizisi artan ise, P lim A n lim P( An ) n n dir. Şimdi, A n dizisi azalan (yani, n için A n1 A n ) olsun. O zaman, Anc dizisi c c artandır. Dolayısı ile, P lim A n lim P( A n ) dir. Ayrıca, A n azalan ve Anc artan n n olduğundan, Teorem (1.2.2) ye göre, lim A n n n 1 An , lim A nc n n 1 A nc dir. Buna göre, c c P lim A n P A n P A n 1 P A nc n 1 n n1 n 1 1 lim P ( A nc ) 1 lim 1 P ( A n ) lim P( A n ) n n n olduğu kolayca görülür Şimdi yukarıda ifade edilen ve ispatı birçok olasılık kitabında bulunan(Örneğin, Feller, 1970, sayfa 110-111) Fatou lemmasını ifade ve ispat edelim. Teorem 1.2.4 (Fatou Lemması) ( , , P ) bir olasılık uzayı ve n için A n olsun. Bu durumda, 24 MATEMATİKSEL İSTATİSTİĞE GİRİŞ P lim inf An lim inf P An lim sup P An P lim sup An n n n n dir. İspat: Herhangi bir an reel sayı dizisi için lim inf an lim sup an olduğu açıktır n n (bir dizinin alt sınırlarının en büyüğü üst sınırlarının ek küçüğünden küçük ya da eşittir). Ayrıca, An olaylar dizisi için limit infimum ve limit supremum tanımlarından, lim inf A n n Ak ve lim sup A n n n1 k n Ak n1 k n olup Teorem (1.2.3) den An olaylarının dizisi artan ya da azalan ise limit ile olasılık ölçüsü yer değiştirebilir. Yani An ler artan ya da azalan ise P lim A n lim P ( A n ) dir. n n Bn Ak k n denirse Bn ler artan olup lim Bn lim inf A n dir. Buradan, Bn ler n n artan olduğundan P lim Bn lim P( Bn ) dir. Diğer taraftan, herhangi bir reel sayı n n dizisinin limiti varsa, bu limit aynı zamanda limit infimum (ya da limit supremum) değerine eşittir. Buradan P lim Bn lim inf P( Bn ) yazılabilir. Ayrıca, her n için Bn An n n dir. Yani, P ( Bn ) P ( An ) dir. Bu sonuçlar birleştirildiğinde, elde edilir. Yani, P lim inf A lim inf P ( A ) dir. P lim inf An P lim Bn lim P ( Bn ) lim inf P( Bn ) lim inf P( An ) n n n n Benzer şekilde D n n n Ak k n denirse, Dn n n n ler azalan olup lim Dn lim sup A n ve n n P lim Dn lim P( Dn ) dir. Ayrıca, her n için An Dn olup P( An ) P( Dn ) dir. n n Diğer taraftan, herhangi bir reel sayı dizisinin limiti varsa, bu limit aynı zamanda limit supremum değerine (ya da limit infimum) eşittir. Bu sonuçlar birleştirildiğinde de, TEMEL OLASILIK KAVRAMLARI 25 P lim sup A n P lim D n lim P( D n ) lim sup P( Dn ) lim sup P ( An ) n n n n n eşitliği elde edilir. Buradan da, P lim inf An lim inf P An lim sup P An P lim sup An n n n n şeklinde aranan eşitsizlik elde edilmiş olur 1.3. Bağımsız Olaylar ve Koşullu Olasılık ( , , P ) bir olasılık uzayı ve B için P ( B ) 0 olsun. sigma cebiri üzerinde PB küme fonksiyonu, PB : 0,1 A PB ( A) P ( A B) P( B) şeklinde tanımlanan PB küme fonksiyonu bir olasılık ölçüsüdür. Gerçekten, P bir olasılık ölçüsü olup her A için P ( A) 0 ve A için PB ( A) P ( A B ) / P ( B ) 0 olduğu açıktır. Diğer taraftan, olup PB () P ( B ) / P ( B ) P ( B ) / P ( B ) 1 dir. Son olarak, n için A n için A n ler ayrık olayların bir dizisi olsun. Bu durumda, C n A n B olaylar dizisi de ayrıktır. Buradan, PB An n 1 P An B P ( A n B ) n 1 n 1 P(B) P(B) n 1 P( An B) P(B) P ( An B ) n 1 P(B) PB ( A n ) n 1 elde edilir. Dolayısı ile, PB küme fonksiyonu bir olasılık ölçüsüdür. Bu olasılık ölçüsüne, B olayına göre koşullu olasılık ölçüsü denir. Tanım 1.3.1 ( , , P ) bir olasılık uzayı ve A olsun. Yukarıdaki şekilde tanımlanan PB olasılık ölçüsü için, PB ( A) sayısına B bilindiğinde A nın koşullu olasılığı denir 26 MATEMATİKSEL İSTATİSTİĞE GİRİŞ PB ( A) koşullu olasılığı için genellikle P ( A | B ) gösterimi kullanılır. Tanıma göre, B verildiğinde A olayının koşullu olasılığı P ( A | B ) P ( A B ) / P ( B ) dir. Buradan, A B olayının olasılığı P ( A B ) P ( B ) P ( A | B ) şeklinde hesaplanabilir. A, B olayları A ( A B) ( A B c ) ve B ( A B) ( Ac B) şeklinde yazılabilir (Şekil (1.3.1)). Ayrıca, ( A B) ve ( A B c ) ayrık olaylar olup B ve 0 P ( B ) 1 olmak üzere, P( A) P( A B) P( A Bc ) P( B) P( A | B) P( B c ) P( A | B c ) dir. Şekil: 1.3.1 Bir olayın ayrık olaylar türünden yazılması Daha genel olarak, B1, B 2 , B 3 ,..., B n olayları örnek uzayının bir parçalanması olsun (yani, B j ler ayrık ve B1 B 2 B 3 ... B n ). Eğer i 1, 2,..., n için P ( B i ) 0 ise herhangi bir A olayının olasılığı, n P ( A) P ( B i ) P ( A | B i ) i 1 şeklinde hesaplanır. B1, B 2 , B 3 ,..., B n olayları örnek uzayının bir parçalanması olmak üzere herhangi bir A olayı, n A A A ( B1 B 2 B 3 ... B n ) ( A Bi ) i 1 olarak yazıldığında, Bayes formülü olarak da bilinen P( B1 | A) koşullu olasılığı P ( B1 | A) P( A B1 ) P ( A) P ( B1 ) P ( A | B 1 ) n P( B i ) P( A | B i ) i 1 TEMEL OLASILIK KAVRAMLARI 27 şeklinde hesaplanır. Örnek 1.3.1 İki kavanozdan birincisinde 5 sarı 5 de mavi top vardır. İkinci kavanozda ise 10 sarı 5 mavi top vardır. Birinci kavanozdan rasgele bir top çekilip ikinci kavanoza atılıyor. Daha sonra ikinci kavanozdan bir top çekiliyor. İkinci kavanozdan çekilen topun mavi olduğu verildiğinde, birinci kavanozdan çekilen topun mavi olması olasılığını hesaplayalım. Kavanozlar K1 ve K 2 olsun. A1 {K 1 den Mavi top} , A 2 {K 1 den Sarı top} ve B {K 2 den Mavi top} olaylarını tanımlayalım. Şekil: 1.3.2 Bir olayın ayrık olaylar türünden yazılması A1 ile A2 ayrık ve A1 A 2 olduğundan A1 ve A2 , nın bir parçalanmasını oluşturur. Buradan herhangi bir B kümesi ( B ), B B B ( A1 A 2 ) ( B A1 ) ( B A 2 ) şeklinde yazılabilir (Şekil (1.3.2)). Buna göre B olayının olasılığı da, P ( B ) P ( B A1 ) P ( B A 2 ) P ( A1 ) P ( B | A1 ) P ( A 2 ) P ( B | A 2 ) (1 / 2) (6 / 16) (1 / 2) (5 / 16) (11/ 32) olarak hesaplanmış olur. Dolayısı ile aranan olasılık P ( A1 | B ) P ( A1 B ) P( B) P ( A1 ) P ( B | A1 ) P( B) (1/ 2)(6 /16) (6 / 32) 6 (11/ 32) (11/ 32) 11 dir. Şimdi deneyi değiştirelim. Rasgele bir kavanoz seçip bu kavanozdan bir top çekelim. Çekilen topun mavi olduğu verildiğinde bunun birinci kavanozdan çekilmiş olması olasılığını hesaplayalım. Kavanozlar K1 ve K 2 olmak üzere bu olaylar (Şekil (1.3.2)) 28 MATEMATİKSEL İSTATİSTİĞE GİRİŞ A1 {K 1 'in seçilmesi} , A2 {K 2 ' nin seçilmesi} ve B {Mavi top çekilmesi } şeklinde yazılır. Yine, A1 ile A2 ayrık olaylar olup A1 A 2 dir. A1 ve A2 olayları örnek uzayının bir parçalanması olduğundan herhangi bir B için B olayını B B B ( A1 A 2 ) ( B A1 ) ( B A 2 ) şeklinde yazabiliriz. Buna göre, B olayının olasılığı P( B) P( B A1) P( B A2 ) P( A1) P( B | A1) P( A2 ) P( B | A2 ) 1 5 1 5 5 2 10 2 15 12 olup aranan olasılık bu defa, P ( A1 | B ) P ( A1 B ) P( B) P ( A1 ) P ( B | A1 ) P( B) (1/ 2) (5 /10) (1/ 4) 3 (5 /12) (5 /12) 5 olur Tanım 1.3.1 (,,P) bir olasılık uzayı olsun. A, B olayları için P ( A B ) P ( A) P ( B ) ise A ve B olayları bağımsızdır denir. i 1, 2,..., n için Ai olmak üzere, n n P A i P ( Ai ) i 1 i 1 oluyorsa, A1, A 2 ,..., A n olayları n li bağımsızdır denir Örnek 1.3.2 {a, b, c, d } ve ( ) olsun. sigma cebiri açık olarak , , a , b , c , d , a, b ,a, c , a, d b, c , b, d , c, d a, b, c , a, b, d , a, c, d , b, c, d şeklinde yazılır. A için P ( A) n ( A) / 4 denirse ( , , P ) bir olasılık uzayı olur. A {a, b} ve B {b, d } olayları için P ( A) P ( B ) 1 / 2 dir. A B {b } olup P ( A B ) 1 / 4 dür. Buradan, P ( A B ) 0.25 (0.5) (0.5) P ( A) P ( B ) olup A ve B olayları bağımsızdır. TEMEL OLASILIK KAVRAMLARI 29 Şekil: 1.3.3 Bağımlı ve bağımsız olaylar Ancak K {a, b, c} ile M {b, d } olayları bağımsız değildir. A B {b} olup, P ( A) 3 / 4 , P ( B ) 1/ 2 ve P ( A B ) 1/ 4 dir. Buradan P ( A B ) 0.25 (3 / 4) (1/ 2) P ( A) P ( B ) dir. Yani, K ve M olayları bağımsız değildir Örnek 1.3.3 ( , , P ) bir olasılık uzayı ve A, B olsun. A ve B bağımsız ise, a) Ac ile B b) A ile B c c) Ac ile B c olayları da bağımsızdır. a) B ( A B ) ( B \ A) ve ( A B ) ile ( B \ A) ayrık olaylardır. Dolayısı ile, P( B) P( A B) P( B Ac ) P( A) P( B) P( B Ac ) eşitliği düzenlendiğinde P ( Ac B ) P ( B ) P ( A) P ( B ) P ( B )[1 P ( A)] P ( Ac ) P ( B ) bulunur. Buradan, Ac ile B olayları bağımsızdır. b) Benzer şekilde, A ( A B ) ( A \ B ) olduğundan yine ( A B ) ile ( A \ B ) ayrık olaylar olup P( A) P( A B) P( A Bc ) P( A) P( B) P( B c A) dir. Buradan, P( A Bc ) P( A) P( A) P( B) P( A)[1 P( B)] P( A) P( Bc ) olduğundan, A ile B c olayları bağımsızdır. c) Ac ile B c olaylarının bağımsızlığı için P( Ac B c ) P( Ac ) P( B c ) olduğunun gösterilmesi gerekir. Kolayca görüleceği gibi, P ( Ac B c ) P ( A B )c 1 P ( A B ) 1 P ( A) P ( B ) P ( A B ) 1 P( A) P( B) P( A B ) 1 P( A) P( B) P ( A) P( B) 30 MATEMATİKSEL İSTATİSTİĞE GİRİŞ 1 P( A) 1 P( B) P ( Ac ) P( B c ) dir. Yani, Ac ile B c olayları bağımsızdır Örnek 1.3.4 ( , , P ) bir olasılık uzayı olsun. ile nin herhangi bir A olayı ile bağımsız olduğu P ( A ) P ( A) P ( A).1 P ( A) P ( ) ve P ( A ) P ( ) P ( A) .0 P ( A) P ( ) eşitliklerinden açıktır Teorem 1.3.1 ( , , P ) bir olasılık uzayı ve n için A n olsun. Bu durumda, a) P( A n ) n 1 ise P lim sup An 0 n b) A n olayları bağımsız ve P( An ) n 1 ise P lim sup A n 1 n dir. İspat a) lim sup A n n n 1 k n P lim sup An P n n1 yazılır. Ak Ak olduğundan k n Ak P Ak k n k n n 1 n 1 P( A k ) k n P( A n ) yakınsak ( P( A n ) ) ise serinin kalan terimi sıfıra gider. Yani, n iken, P( A n ) 0 dır. Buradan n iken, k n 0 P lim sup A n P n n1 A P A k k k n k n P( A k ) 0 k n elde edilir. O halde, P lim sup An 0 dır. n b) Önce, 0 x 1 için e x 1 x olduğunu hatırlayalım. Ayrıca, A n dizisinin üst limitinin tanımı ile Cm m Ak k n dizisinin artan olduğu dikkate alındığında, TEMEL OLASILIK KAVRAMLARI 31 m P lim sup A n lim lim P Ak n n m k n yazılır. Diğer taraftan, A n ler bağımsız olaylar ise A nc ler de bağımsızdır. Buradan, c m m m m P A k P A kc P ( A kc ) 1 P ( A k ) k n k n k n k n m m e P ( Ak ) e P ( Ak ) k n k n elde edilir. P ( A n ) olduğundan ıraksak bir serinin kalan terimi sonsuza gider. n 1 m Yani, m iken m P ( A n ) olup e P ( Ak ) k n 0 olur. Buradan, m iken k n c m P Ak 0 k n yazılır. O halde, m P lim sup A n lim lim P Ak n n m k n olduğu dikkate alındığında, m iken, c m m P A k 1 P A k 1 k n k n olup, P lim sup A n 1 elde edilir n 1.4. Permütasyonlar ve Kombinasyonlar 1.4.1 Permütasyonlar Olasılık hesaplarında çok kullanılan kavramlardan biri de hiç şüphesiz nesnelerin tamamının ya da belli bir kısmının farklı sıralanmalarının sayısıdır. Permütasyonun Latince’de “yer değiştirme” anlamına gelen “permütare” sözcüğünden türediği 32 MATEMATİKSEL İSTATİSTİĞE GİRİŞ sanılmaktadır (Oruç, 1982). Örneğin A , B ve C gibi üç nesnenin değişik sıralamaları ABC , ACB , BAC , BCA , CAB ve CBA şeklinde olacaktır. Yani, değişik sıralamaların sayısı 6 dır. Benzer şekilde, bu üç nesnenin ikişerli sıralamaları, AB , AC ve BC şeklinde olabilir. Ancak, önce A sonra B sıralaması ( AB ) ile önce B sonra A sıralamaları farklı ise, sıralamalar; AB , BA , AC , CA , BC ve CB şeklinde olur. Bu durumdaki sıralamaların sayısı ise 6 dır. Dört öğretim üyesi arasında üç kişilik bir jüri oluşturmak istendiğini düşünelim. Bu dört öğretim üyesi A , B , C ve D olarak adlandırılmış olsun. Bu durumda, ABC sıralaması ile ACB aynı olacağından olası jüri üyeleri ABC , ABD , ACD ve BCD şeklinde olabilir. Yani, dört farklı şekilde jüri oluşturulabilir. Ancak, ilk seçilen jüri başkanı olacak denirse, ABC ile BAC farklı olacaktır. Bu durumda, farklı oluşumlar ABC , ABD, ADC , BAC , BAD, BDC , CAB, CAD, CBD , DAB, DAC , DBC şeklindedir (sayısı 12). Burada, sonraki seçilen iki kişi arasındaki sıralama önemli değildir. Bunların uzun uzun yazılması yerine, farklı oluşumların toplam sayılarının formülize edilmesi gerekir. Tanım 1.4.1 a) 1 den n ye kadar pozitif tam sayıların çarpımına n faktöriyel (ya da n çarpansal) denir ve n ! ile gösterilir. b) Nesnelerin kümesinin bir kısmının ya da tamamının belli bir sıralanmasına (ya da düzenlenmesine) permütasyon denir Tümü birlikte kullanılan n nesnenin permütasyonları sayısı n ! dir. Bu sayı P (n, n) ile gösterilmiştir. n nesneden bir defada alınan r nesnenin permütasyonları (sıralanmalarının) sayısı ise P (n, r ) ile gösterilir. n nesneden r tanesi r tane kutucuğa yerleştirilmek istensin. Bu durumda birinci kutucuğa n nesneden herhangi biri yerleştirilebilir (yani ilk kutucuk için n farklı seçim yapılabilir). Sonra ikinci kutucuk, geri kalan n 1 nesneden herhangi biri ile doldurulabilir (yani, ikinci kutucuk için n 1 farklı seçim yapılır). Böyle devam edilirse, son kutucuk için geri kalan n (r 1) nesneden biri ile doldurulur. Buna göre, farklı sıralamaların sayısı n (n 1)( n 2)...(n (r 1)) n(n 1)(n 2)...( n r 1) n(n 1)( n 2)...( n r 1)(n r )! n! P ( n, r ) (n r )! (n r )! TEMEL OLASILIK KAVRAMLARI 33 olur. Elimizde bulunan n nesnenin ya hepsi farklıdır, ya da bazıları aynıdır. Buna göre, n nesnenin permütasyonlarının sayısı için bu iki durum farklı değerlendirilmelidir. a) Birbirinden farklı n nesnenin permütasyonları sayısı: n 1 ise, bu nesne bir tek biçimde yazılabilir ve permütasyon sayısı 1 dir. Yani, 1! 1 dir. Şimdi, n 2 olsun. Bu nesneler A ve B ise, sıralamalar, AB ve BA şeklinde olup, sayısı 2 dir. Yani, 2 nesnenin permütasyonları sayısı 2! 2 dir. n 3 için sıralamalar; ABC , ACB , BAC , BCA , CAB ve CBA şeklinde olur ve sayısı 3! 6 dır. Tümevarım yöntemine göre, n 1 nesnenin permütasyonları sayısı (n 1)! olsun. n .nci nesne geri kalan n 1 nesne arasına n farklı şekilde yerleştirilebilir. O zaman, çarpma kuralı gereğince, bu sıralamaların sayısı da n(n 1)! olur. Bu değer de n ! dir. b) Şimdi, n nesneden n1 tanesi bir tür, geri kalanlardan n2 tanesi başka bir tür olmak üzere, nk tanesi de başka bir türden nesne olsun. Yani, bu n nesne k farklı türden oluşsun. Bu durumda, k n ve n1 n2 ... nk n olduğu açıktır. Buna göre, n1 tane nesne aynı olduğundan sıralanışta n1 ! tane sıralanış aynı, benzer nedenle n2 ! sıralanış aynı olacaktır. Böylece, n nesnenin permütasyonları sayısı n !/ (n1 !n2 !...nk !) olur. Örnek 1.4.1 1, 2,3, 4 ve 5 rakamlarının tümü kullanılarak toplam 5! 120 farklı sayı yazılabilir. Bunlardan; a) Kaç tanesinde çift rakamlar tek rakamlardan önce gelir? Bu rakamlar dizisi içinde 3 tane tek (1,3 ve 5), 2 tane (2 ve 4) de çift rakam vardır. Çift rakamlar kendi aralarında 2! sayıda sıralanır. Sonra tek rakamlar da kendi aralarında 3! farklı şekilde sıralanabilir. O zaman toplam sayı 2!(3!)=12 dir. Bu sayılar, 24135 24153 24315 24351 24513 24531 42135 42153 42315 42351 42513 42531 şeklindedir. b) Kaç tanesinde 2, 1 den hemen sonra gelir? (1,2) ikilisi beraber alınarak, toplam dört rakam varmış gibi düşünüldüğünde, farklı permütasyonların sayısı P (4, 4) 4! 24 dür. c) Kaç tanesinde 2 rakamı 1 den önce gelir? Permütasyonlar içinde, 1 in 2 den önce geldiği sayıda 2 de 1 den önce gelir. O zaman aranan cevap, P (5,5) / 2 5!/ 2 60 dır. 34 MATEMATİKSEL İSTATİSTİĞE GİRİŞ d) kaç tanesinde 1 ve 2 rakamları 3 ve 4 rakamlarından önce gelir? Önce, 1, 2, 3 ve 4 rakamları kendi aralarında 4! Sayıda sıralanır. Oysa, toplam 5 tane rakam vardır. Koşullara uyan sıralamalar 1 2 3 4 1 2 4 3 2 1 3 4 2 1 4 3 olup 5 rakamının nereye geldiği önemli değildir. Buradaki her bir sıralama için 5 rakamı her bir sıralamadaki 5 farklı yere gelebilir. O zaman aranan sıralamaların sayısı 4(5)=20 dir. e) Kaç tanesinde 1, 2 den önce, 2 de 3 den önce gelir? 1,2 ve 3 rakamlarının permütasyonları sayısı 3!=6 dır. O halde toplam sayı (5!/3!)=20 dir. f) Beş basamaklı sayılardan kaç tanesinde ilk iki rakamın toplamı 6 dan küçüktür? Bunun için, Birinci yerde 1 varsa, ikinci yer için 3 seçim (2,3,4) yapılabilir, Birinci yerde 2 varsa, ikinci yer için 2 seçim (1,3) yapılabilir, Birinci yerde 3 varsa, ikinci yer için 2 seçim (1,2) yapılabilir Birinci yerde 4 varsa, ikinci yer için 1 seçim (1) yapılabilir. İlk iki basamağa yazılacak rakamlar önemli olup diğerlerinin sıralaması önemli değildir. İlk iki basamak doldurulduktan sonra geriye kalan 3 rakam (3! faklı şekilde yazılabilir) herhangi bir şekilde doldurulur. O zaman aranan sayı (3+2+2+1)3!=48 dir. g) Rakamlar yinelenmeden 4 basamaklı kaç sayı yazılabilir? Bunun için, birinci yere herhangi bir rakam (5 tanesinden biri) yazılır. Yani, birinci yer 5 farklı şekilde doldurulur. İkinci yer geri kalan 4 tanesinden biri ile, üçüncü yer geri kalan 3 tanesinden biriyle ve son yer de geri kalan 2 rakamdan biri ile doldurulur. Aranan sayı 5.4.3.2=120 dir. h) Rakamlar yinelenebilir ise 4 basamaklı 625 sayı yazılabilir. Yani, birinci yer 5 farklı şekilde doldurulabilir. Aynı şekilde ikinci yer de 5 farklı şekilde doldurulabilir. i) Rakamlar yinelenmeden 4 basamaklı tek sayıların sayısını bulalım. O zaman, elde edilecek sayı tek olacağından son basamak 3 farklı şekilde (1 3 ve 5) doldurulabilir. Birinci yer geri kalan 4 rakamdan biri ile, ikinci yer geri kalan 3 rakamdan biri ile ve üçüncü yer de geri kalan 2 rakamdan biri ile doldurulur. Yani, toplam sayı (4)(3)(2)(3)=72 dir. TEMEL OLASILIK KAVRAMLARI 35 j) A, A, B, B, B , C , C , D, D, D nesneleri kaç farklı şekilde sıralanabilir. Dört faklı türden 10 nesne vardır. Buna göre, farklı sıralamaların sayısı için, n 10, n1 n4 2 ve n2 n3 3 olup permütasyonların sayısı 10!/ (2!3!3!2!) 3628800 / (144) 25200 dür Bir çember üzerindeki n farklı nesnenin permütasyonları sayısı (n-1)! dir. Örneğin, yuvarlak bir masa etrafına 4 kişi (4-1)!=6 farklı şekilde sıralanabilir. Burada, insanların saat yönünde hareket ettiği düşünülürse, bir kişi sabit tutularak diğerlerinin birer kaydırılması ile aranan permnütasyonların sayısı bulunur. 1.4.2 Kombinasyonlar Tanım 1.4.2 Birbirinden farklı n nesne verilmiş olsun. Bu n nesneden k tanesinin farklı çekiliş sayısına n nesnesin k li kombinasyonu denir Tanımdan da anlaşılacağı gibi, burada iki durum vardır. 1) çekilen nesne geri konmadan (iadesiz) yeni bir çekiliş yapılır ya da 2) çekilen yerine konup (iadeli) yeni bir çekiliş yapılır. 1) İadesiz (Yinelemesiz) Kombinasyon: n nesneden k tanesi seçilmek istensin. k 1 ise n nesne içinde n farklı şekilde seçim yapılabilir. k 2 için nesneleri a1 , a2 ,…, an ile gösterelim. Buna göre seçimler, a1a2 , a1a3 ,..., a1an , a2 a1 , a2 a3 ,..., a2 an , a3a1, a3a2 ,..., a3an ,…, an a1 , an a2 ,..., an an1 şeklinde olup sayısı n(n 1) n !/ (n 2)! dir. k 3 olsun. İlk çekilişte a1, a2 ,..., an den biri çekilir. Geriye n 1 nesne kalır. n 1 nesneden 2 -li (n 1) (n 1 1) (n 1)(n 2) kombinasyon yapılabilir. n nesnenin 3 -lü kombinasyon sayısı n(n 1)(n 2) n !/ (n 3)! olur. O halde, n nesnenin (k 1) -li kombinasyonlarının sayısının n! n(n 1)(n 2)...(n (k 2)) (n (k 1))! 36 MATEMATİKSEL İSTATİSTİĞE GİRİŞ olduğunu kabul edelim ve k -li kombinasyonlarının sayısını bulalım. n nesnenin 1 -li kombinasyonlarının sayısı n dir. Geriye n 1 nesne kalır. (n 1) nesnenin (k 1) -li kombinasyonlarının sayısı, (n 1)! (n 1)! ((n 1) (k 1))! ( n k )! dir. Bu son ifadenin her iki tarafı n ile çarpılırsa, n(n 1)! n! (n k )! (n k )! sayısı, n nesnenin k -li kombinasyon sayısı olur. Herhangi bir nesnenin çekiliş sırası önemli değilse, her k ! çekiliş aynı olacağından aranan sayı, n n! k !(n k )! k C (n, r ) dir. 2) İadeli (Yinelemeli) Kombinasyon 1, 2,3 ve 4 rakamları ile kullanılan rakam bir daha kullanılmamak üzere 2 basamaklı sayı yazmak isteyelim. Bunların sayısının P(4, 2) 4! 12 (4 2)! olduğunu biliyoruz. Bu sayılar; 12, 13, 14, 21, 23, 24, 31, 32, 34, 41, 42, 43 dir. Kullanılan rakam bir daha kullanılabilir ise, 11, 22, 33 ve 44 sayıları da buna eklenmelidir. O zaman toplam sayı 16 olur. Yani, 24 tane farklı sayı yazılabilir. Yinelemeli kombinasyonda, iki farklı durum (sıra önemli ve sıra önemsiz) ayrı ayrı değerlendirilmelidir. Birbirinden farklı n nesneden r tanesinin çekiliş sayısı, n nesnenin r li n n! kombinasyonu olup sayısı C (n, r ) veya dir. n nesne r ! yolla r r ! n r ! düzenlenebileceğinden, C (n, r ) olduğundan kombinasyonlarından herbiri için permütasyonların sayısı r ! permütasyon r !C (n, r ) P (n, r ) n !/ (n 1)! olur. Ayrıca, C (n, r ) C (n, n r ) dir. Örnek 1.4.2 a) Dört kişi arasından üç kişiden oluşan bir komisyon seçilmek isteniyor. Bu dört kişi A, B, C ve D olsun. Bu oluşumlar, ABC , ABD, ACD ve BCD şeklinde olur. Bunlar kendi aralarında 3! şekilde sıralanabilir. Örneğin, A, B , C kişileri kendi aralarında TEMEL OLASILIK KAVRAMLARI 37 ABC , ACB , BAC , BCA , CAB ve CBA şeklinde sıralanabilir. Burada ABC ile ACB aynı komisyondur. Bu dört kişiden oluşacak üçlü kombinasyon ve permütasyonlar aşağıdaki şekilde oluşturulabilir. Kombinasyonlar ABC ABD ACD BCD ABC ABD ACD BCD ACB ADB ADC BDC Permütasyonlar BAC BCA CAB CBA BAD BDA DAB DBA CAD CDA DAC DCA CBD CDB DBC DCB Burada, kombinasyonların sayısı, 4 4! C (4,3) 4 3 3!(4 3)! permütasyonların sayısı (yani sıralama önemli) ise, P(4,3) 4! 24 (4 3)! olup, P (4,3) 24 3!4 3!C (4, 3) dir. b) 4 Fizikçi, 4 Kimyacı ve 2 Biyolog arasından 3 kişilik bir komisyon. hiç bir koşul olmadan C (10,3) 120 farklı şekilde seçilebilir. i) Kurulda en az 1 biyolog olacak şekilde kaç farklı seçim yapılabilir. Bunun için önce hiç biyolog bulunmaması durumunu hesaplayalım. Kurulda 3 fizikçi olabilir, 3 kimyacı olabilir, 2 fizikçi 1 kimyacı veya 1 fizikçi 2 kimyacı olabilir. Buna göre, 3 fizikçi C (4,3) 4 3 kimyacı C (4,3) 4 2 fizikçi, 1 kimyacı C (4, 2) C (4,1) 6(4) 24 2 kimyacı 1 fizikçi C (4, 2) C (4,1) 6(4) 24 farklı şekilde seçilebilir. Bunların toplam sayısı 56 olup, en az 1 biyolog bulunduran kombinasyonların sayısı 120 56 64 dür. ii) Kurulda her branştan 1 kişinin olabileceği kombinasyonların sayısı ise C (4,1) C (4,1) C (2,1) 4(4)2 32 dir 38 MATEMATİKSEL İSTATİSTİĞE GİRİŞ n nesnenin r1 tanesi birinci çeşit, r2 tanesi ikinci çeşit ve rk tanesi de k . nci çeşit olsun. Yani, nesnelerim tümü birbirinden farklı olmasın. Bu durumda, r1 r2 ... rk n olmak üzere, tümü birlikte alınan n nesnenin permütasyonları sayısı, P(n; r1 , r2 ,..., rk ) n n! r1 !r2 !...rk ! r1, r2 ,..., rk dir. r ve n pozitif tamsayılar olmak üzere 0 r n için, C (n 1, r ) C (n, r 1) C ( n, r ) dir (Pascal kuralı). Yani, n n n! n! C (n, r 1) C (n, r ) r 1 r (r 1)!(n r 1)! r !(n r )! n! n! n! 1 1 (r 1)!(n r )!(n r 1) (r 1)!r (n r )! (r 1)!(n r )! n r 1 r n 1 n! n 1 n! C (n 1, r ) (r 1)!(n r )! r (n r 1) (r )!(n 1 r )! r dir. Örnek 1.4.3 a) 52 lik bir oyun kağıdı 4 oyuncuya 52 52 39 26 13 52! 13,13,13,13 13!13!13!13! 13 13 13 13 farklı şekilde dağıtılabilir. b) 2 kırmızı, 3 siyah ve 5 beyaz top sıraya dizilmek istensin. Aynı rekli toplar benzer ve aynı büyüklüktedir. Bu toplar, n 10, r1 5, r2 3 ve r3 2 olmak üzere bu toplar, 10 10! 2520 5,3, 2 5!'3!2! farklı şekilde sıraya dizilebilir. c) n tane A ve r tane B ile, her dizide A ların tümü kullanılmak üzere A ve B lerden kaç farklı dizi oluşturulabilir. n dizide n tane A ve 0 tane B ile 1 0 n 1 (n 1)! dizide n tane A ve 1 tane B ile (n 1) n !1! 1 TEMEL OLASILIK KAVRAMLARI 39 n 2 (n 2)! dizide n tane A ve 2 tane B ile 2!n ! 2 …… n r (n r )! dizide n tane A ve r tane B ile r !n ! r farklı dizi oluşturulabilir. Bunların toplam sayısı ise Pascal kuralına göre, n n 1 n 2 n r n r 1 ... 0 1 2 r r dir. d) Bir sınıfta 12 kız ve 10 erkek öğrenci vardır. Sınıf, kızlar ve erkekler boy uzunluklarına göre sıralanacak biçimde kaç farklı yolla düzenlenebilir. Kızlar ve erkekler kendi aralarında permütasyona tabii olmayacağından birbirinin benzeri gibi düşünülebilir. Buna göre 22 nesnenin permütasyonu, 22 22! 646646 12,10 12!10! dir Bir A kümesinde n tane nesne bulunsun. A kümesinin A1, A2 ,..., Ak formunda farklı parçalanmalarının sayısı, A1 de r1 , A2 de r2 ve Ak de rk nesne ve r1 r2 ... rk n olmak üzere, n n! r , r , r ,..., r k r1 ! r2 ! r3 !...rk ! 1 2 3 dir. Şimdi bunu gösterelim. Önce, nesnelerden A1 içine C (n, r1 ) farklı seçim yapılabilir. Sonra, geri kalan n r1 nesneden A2 içine r2 tane nesne C (n r1, r2 ) farklı seçim yapılabilir. Bu şekilde devam ettiğnde, i 1, 2,3,..., k için Ai içine ri tane nesne C (n r1 r2 ... ri 1, ri ) farklı şekilde seçilebilir. O halde, A nın farklı parçalanmalarının sayısı (n r1 r2 ... rk ) 0! 1 olduğundan, 40 MATEMATİKSEL İSTATİSTİĞE GİRİŞ n n r1 n r1 r2 n r1 r2 ... rk 1 ... r rk 1 r2 r3 (n r1 r2 ... rk 1 )! (n r1 )! n! n! ... r1 !(n r1 )! r2 !(n r1 r2 )! rk !(n r1 r2 ... rk )! r1 !r2 !r3 !...rk ! dir. Örnek 1.4.4 a) 10 oyuncak 3 kardeş arasında en küçüğü 4 diğerleri üçer tane olmak üzere 10! 4200 4! 3! 3! farklı şekilde dağıtılabilir. b) Bir kavanozda 1 den 7 ye kadar numaralandırılmış 7 top vardır. Önce 2 sini sonra 3 ünü en sonunda da 2 sini olmak üzere kaç farklı şekilde seçebiliriz. Başka bir ifade ile, 7 top 2 si A1 kutusuna, üçü A2 kutusuna ve geri kalan ikisi de A3 kutusuna kaç farklı şekilde yerleştirilebilir. Burada, ({1, 2},{3, 4,5},{6,7}) ile ({6,7},{3, 4,5},{1, 2}) farklı olduğundan bunlar sıralı parçalanmalardır. Buna göre, 7 toptan 2 si A1 kutusuna C (7, 2) farklı şekilde, geri kalan 5 toptan üçü A2 kutusuna C (5,3) farklı şekilde ve son ikisi de A3 kutusuna C (2, 2) farklı şekilde yerleştirilir. Yani, toplam sayı, 7 5 2 7! 5! 2! 210 2 3 2 2!5! 3!2! 2!0! dur Sırasız Parçalanma a) Bir sınıfta 12 öğrenci vardır. Her takımda 4 öğrenci olacak şekilde 12 öğrenci A1 , A2 ve A3 gruplarına ayrılmak istensin. Öğrencilerin her bir { A1, A2 , A3} parçalanma sayısı 3!=6 dır. Buna göre, farklı parçalanmaların sayısı, 12 8 4 1 12 1 12! 1 5775 4 4 4 3! 4, 4, 4 3! 4!4!4! 3! dir. TEMEL OLASILIK KAVRAMLARI 41 b) 10 öğrenci, biri 4 diğerleri üçer kişilik 3 gruba kaç farklı şekilde ayrılabilir. Burada, { A1, A2 , A3} grubu ile { A1, A3 , A2 } grupları aynıdır. Buna göre farklı parçalanmaların sayısı, 10 6 3 1 10 1 12! 1 2100 4 3 3 4,3,3 2! 2! 4!3!3! 2! dür Binom Teoremi: n pozitif bir tamsayı olmak üzere, n n n n n n (a b)n ai b ni a n a n1b1 a n 2b 2 ... b n 0 1 2 n i 0 i n n n n b n b n1a1 b n 2 a 2 ... a n 0 1 2 n n dir. Buradaki, katsayılarına Binom katsayıları denir. Eşitlikte a b 1 alınırsa, i n n n n 2n ... 0 1 2 n elde edilir. Ayrıca, a 1, b 1 denirse, n n n n n ... (1) 0 0 1 2 n bulunur. Birinci eşitlikten ikinci eşitlik çıkartılırsa ( n tek) n n n n n n n n 2 ... 2n ... 2n 1 n 1 3 5 n 1 3 5 iki terimin taraf tarafa toplanması ile ( n çift) n n n n n n n n 2 ... 2n ... 2n 1 n 0 2 4 n 0 2 4 elde edilir. Burada n nin tek veya çift olması dikkate alınmalıdır. Diğer taraftan, k r k r k r k r k r ... 0 n 1 n 1 2 n 2 n 0 n ya da, 42 MATEMATİKSEL İSTATİSTİĞE GİRİŞ n k r k r i 0 i n i n olup, eşitlikte k r n alındığında 2 2 2 2 n n n n 2n ... 0 1 2 n n eşitliği elde edilmiş olur. 1.5. Çözümlü Problemler 1.5.1 [0,1] , ( ) ve P ( A) " A nın aralık uzunluğu " olsun. Buna göre, ( , , P ) bir olasılık uzayıdır. nın alt kümelerinden oluşan iki dizi A n {x : ( n 1) 1 x 1} , B n { x : 0 x n 1} olarak verildiğinde, P lim An ve P lim B n olasılıklarını hesaplayınız. n n Çözüm: Her n için A n A n1 ve B n1 B n olduğu ( n 1) ( n 2) ( n 2) 1 ( n 1) 1 önermesinden açıktır. Yani, A n { x :( n 1) 1 x 1} { x : ( n 2) 1 x 1} An 1 olup A n dizisi artandır. Benzer şekilde B n dizisi de azalandır. Teorem (1.2.2) ye göre, A n ve B n dizilerinin limitleri vardır ve lim A n (0,1] ve lim B n dir. Buna göre, n n P lim An P An P 0 , 1 1 n n1 ve P lim B n P B n P 0 n n1 elde edilir. 1.5.2 boş olmayan bir küme, da üzerinde bir sigma cebir olsun. B için, B {A : A B C , C } TEMEL OLASILIK KAVRAMLARI 43 şeklinde tanımlanan B sınıfının B üzerinde bir sigma cebir olduğunu gösteriniz. Çözüm: B sınıfının bir sigma cebir olması için Tanım (1.1.3) deki sigma cebir olma koşullarını sağlanması gerekir. Şimdi bu koşulları inceleyelim. (i) B ve B B B olduğundan, B B dir. (ii) Şimdi, B deki her elemanın tümleyeninin de (tümleme B ye göre) B de olduğunun gösterilmesi gerekir. A B ise A B C olacak şekilde bir C vardır. O halde, A nın B ye göre tümleyeni (bunu ABc ile gösterelim) de bu sınıfta olmalıdır. Bunun için, ABc B ( B \ A) B \ A B Ac olup, B \ A olduğundan, ABc B dir. (iii) B deki elemanların sayılabilir birleşimleri de B de olmalıdır. Bunun için n için An B olsun. O zaman A n B C n olacak şekilde Cn küme dizisi vardır. Ayrıca, A ( B C ) B n Cn B C n n1 n1 n1 olarak yazılabildiğinden, An B dir. Dolayısı ile, B sınıfı, B üzerinde bir sigma n 1 cebirdir. 1.5.3 ( , , P ) bir olasılık uzayı, P ( A1 A2 A3 ) 0 olacak şekilde dört olay A1, A2 , A3 ve A4 olsun. Gösteriniz ki, P( A1 A 2 A3 A4 ) P( A1) P( A2 | A1) P( A3 | A1 A2 ) P( A4 | A1 A2 A3 ) dir. Çözüm: B1 A1 A 2 A3 denirse, P ( A1 A 2 A 3 A 4 ) P ( B1 A 4 ) P ( B1 ) P ( A 4 | B1 ) P ( A1 A 2 A 3 ) P ( A 4 | A1 A 2 A 3 ) yazılır. Şimdi B 2 A1 A2 denirse, P ( A1 A 2 A3 ) P( A3 B 2 ) P( B 2 ) P( A3 | B 2 ) P( A1 A 2 ) P( A3 | A1 A 2 ) olur. Son olarak, P( A1 A 2 ) P( A1) P( A 2 | A1 ) olup sonuçlar birleştirildiğinde, 44 MATEMATİKSEL İSTATİSTİĞE GİRİŞ P( A1 A2 A3 A4 ) P( B1 A4 ) P( B1 ) P( A4 | B1 ) P( A1 A2 A3 ) P( A4 | A1 A2 A3 ) P( A1 A2 ) P( A3 | A1 A2 ) P( A4 | A1 A2 A3 ) P( A1 ) P( A2 | A1 ) P( A3 | A1 A2 ) P( A4 | A1 A2 A3 ) şeklinde aranan eşitlik elde edilmiş olur. 1.5.4 a) ( , , P ) bir olasılık uzayı, A ve B bağımsız ve P( A1) 0.6 , P ( A 2 ) 0.3 olsun. P ( A1 A 2 ) , P ( A1 A 2 ) ve P ( A1 Ac2 ) olasılıklarını hesaplayınız. b) ( , , P ) bir olasılık uzayı, P ( A 1) 1/ 2 , P ( A 2 ) 1 / 3 ve P ( A 3) 1 / 4 olacak şekilde A 1, A 2 ve A 3 bağımsız olaylar olsun. Buna göre, P ( A1 A2 A3 ) olasılığını hesaplayınız. c) ( , , P ) bir olasılık uzayı, P( A1 ) P( A 2 ) P( A3 ) 1/ 4 olacak şekilde A1 , A 2 ve A 3 bağımsız olaylar olsun. P[( A1c Ac2 ) A3 ] olasılığını hesaplayınız. Çözüm: a) A1 ve A 2 bağımsız olduğundan Örnek (1.3.3) den A1 ile A2c , A12 ile A2 ve A1c ile A2c bağımsız olaylardır. Buradan aranan olasılıklar P( A1 A 2 ) P( A1 ) P( A2 ) (0.6) (0.3) 0.18 P ( A1 A 2 ) P ( A1 ) P ( A 2 ) P ( A 1 A 2 ) P ( A1 ) P ( A 2 ) P ( A1 ) P ( A 2 ) 0.6 0.3 0.18 0.72 P( A1 Ac2 ) P( A1 ) P( A c2) P( A 1 A c2) P( A 1) P( A c2) P( A 1) P( A c2) 0.6 (1 0.3) (0.6)(1 0.3) 0.6 0.7 0.42 0.88 şeklinde bulunur. b) Bu olasılık doğrudan P ( A 1 A 2 A 3) P ( A 1) P ( A 2 ) P ( A 3) P ( A 1 A 2) P ( A 1 A 3) P ( A 2 A 3) P ( A 1 A 2 A 3) P ( A 1) P ( A 2) P ( A 3) P ( A 1) P ( A 2) P ( A 1) P ( A 3) P ( A 2 ) P ( A 3) P ( A 1) P ( A 2) P ( A 3) 1 1 1 1 1 1 1 1 1 1 1 1 2 3 4 2 3 2 4 3 4 2 3 4 12 8 6 4 3 2 1 18 3 24 24 4 TEMEL OLASILIK KAVRAMLARI 45 olarak hesaplanmıştır. c) Önce P ( A B ) P ( A) P ( B ) P ( A B ) olduğunu hatırlayalım. B A 1c A c2 denirse aranan olasılık P ( B A3 ) haline dönüşür. O zaman aranan olasılık, P[( A 1c A c2) A3 ] P[ A 1c A c2] P( A3 ) P[( A 1c A c2) A3 ] P( A 1c ) P( A c2) P( A3 ) P ( A 1c ) P( A c2 ) P( A3 ) [1 P( A 1)] [1 P ( A 2 )] P( A3 ) [1 P ( A1 )][1 P ( A2 )]P ( A3 ) 3 3 1 3 3 1 9 1 9 36 16 9 43 4 4 4 4 4 4 16 4 64 64 64 dir. 1.5.5 ( , , P ) bir olasılık uzayı ve A, B olsun. P ( A | B ) P ( A) ise A olayı B olayına göre itici olay denir. Ayrıca, P ( A | B ) P ( A) ise A olayı B olayına göre çekici olay denir. a) A olayı B olayına göre çekici ise, B olayının da A olayına göre çekici olduğunu gösteriniz b) A olayı B olayına göre çekici ise, B c olayının A olayına göre itici olduğunu gösteriniz. Çözüm: a) P ( A | B ) P ( A) ise A olayı B ye göre çekicidir. A olayı B ye göre çekici ise P ( A | B ) P ( A) olup, koşullu olasılığın tanımından P ( A | B ) P ( A) P ( A B) P( A B) P ( A) P ( B ) P ( B | A) P ( B ) P ( B) P ( A) yazılır. Yani, B olayı da A ya göre çekicidir. b) A olayı B ye göre çekici ise, P( Bc | A) P( Bc ) olduğunun gösterilmesi gerekir. A olayı B ye göre çekici ise, P ( A | B ) P ( A) dir. Koşullu olasılığın tanımından P ( A | B ) P ( A) P ( A B ) P ( A) P ( B ) dir. Buradan, P ( B c A) P ( A) P ( A B ) P ( A) P ( A) P ( B ) yazılır. Ayrıca, 46 MATEMATİKSEL İSTATİSTİĞE GİRİŞ P ( B c A) P ( A) P ( A) P ( B ) P ( A)[1 P ( B )] P ( A) P ( B c ) P ( B c A) P ( B c ) P ( B c| A) P ( B c ) P ( A) elde edilir. Yani, B c olayı A ya göre iticidir. 1.5.6 ( , , P ) bir olasılık uzayı ve 0 P (C ) 1 olmak üzere, A, B , C olsun. c c P ( A | C ) P ( B | C ) ve P( A | C ) P( B | C ) ise P ( A) P ( B ) olduğunu gösteriniz. Çözüm: A ( A C ) ( A C c ) ve B ( B C ) ( B C c ) olup P( A) P( A C ) P( A C c ) ve P( B) P( B C ) P( B C c ) dir. Diğer taraftan, P( A | C ) P( A C ) P( B C ) P( B | C ) P( A C ) P( B C ) P (C ) P (C ) ve P( A | C c) P( A C c) c P (C ) P( B | C c) P( B C c) c P (C ) P( A C c) P( B C c) olacağından P( A) P( A C ) P( A C c ) P( B C ) P( B C c ) P( B) eşitsizliği elde edilir. Yani P ( A) P ( B ) dir. 1.5.7 ( , , P ) bir olasılık uzayı ve A, B olsun. P( A | B) P( A | B c ) ise A ve B olaylarının bağımsız olduğunu gösteriniz. Çözüm: P( A | B) P( A | B c ) ise P ( A B ) P ( A) P ( B ) olduğunun gösterilmesi gerekir. A ( A B) ( A B c ) olup ( A B ) ile ( A B c ) ayrık olaylardır. Buradan, P ( A B ) P( B ) P ( A | B) P( A B) P( A B c ) P( B ) P( A | B ) P( B c ) P ( A | B c ) c c c P( A B ) P( B ) P( A | B ) elde edilir. Ayrıca, P ( A) P ( B ) P ( A | B ) P ( B c ) P ( A | B c ) P ( A) P ( B ) P ( A | B ) P ( B c ) P ( A | B ) P ( A) P ( A | B ) P ( B ) P ( B c ) P ( A | B ) dir. Buradan da, TEMEL OLASILIK KAVRAMLARI P ( A) P ( A | B ) P ( A) 47 P( A B) P( B) olup P ( A B ) P ( A) P ( B ) elde edilir. Yani, A ve B olayları bağımsızdır. 1.5.8 ( , , P ) bir olasılık uzayı ve P ( A B ) 6 / 25 ve P ( A | B ) P ( B | A) 1 olacak şekilde A, B bağımsız olaylar olsun. P ( A) olasılığını hesaplayınız (Not: P ( A) P ( B ) dir). Çözüm: P ( A | B ) P ( B | A) 1 ise P ( A) P ( B ) 1 olduğu P ( A B ) P ( A B ) P ( A) P ( B ) P ( A) P ( B ) P ( A) P ( B ) P( B) P ( A) P( B) P ( A) eşitliğinden açıktır. Dolayısı ile, P ( A | B ) P ( B | A) P ( A) P ( B ) P ( A | B ) P ( B | A) 1 ve P ( A B ) 6 / 25 ise, ( P( A) P ( B )) 2 ( P ( A) P ( B )) 2 4 P ( A) P ( B ) 1 (24 / 25) 1 / 25 olup ( P( A) P ( B)) (1/ 5) dır. Ayrıca, P ( A) P ( B ) olduğundan, P( A) P( B) (1/ 5) dir. Buna göre, P ( A) P ( B ) 1 ve P ( A) P ( B ) (1/ 5) eşitliklerinden 2 P ( A) 4 / 5 elde edilir. Buradan da, P ( A) (2 / 5) olur. İkinci yol: Bu soruyu başka bir yoldan da çözebiliriz. A ve B olayları bağımsız olduğundan P ( A B ) P ( A) P ( B ) şeklinde yazılır. Ayrıca, P ( A) P( B ) 1 olduğundan da P ( B ) 1 P ( A) dır. Dolayısı ile, 6 P ( A B ) P ( A) P ( B ) P ( A) (1 P ( A)) 25 eşitliğinde x P ( A) denirse, x 2 x (6 / 25) 0 ikinci derece denklemi elde edilir. Bu denklemin çözümleri ise, x 2 / 5 ve x 3 / 5 dir. P ( A) P ( B ) olduğundan dolayı x 2 / 5 sonucu elde edilir. Yani, P ( A) 2 / 5 dir. 1.5.9 ( , , P ) bir olasılık uzayı ve A, B bağımsız olaylar olsun. Bu durumda, P ( A) P ( B ) p ve P ( A B ) ise p olasılığını türünden hesaplayınız. Çözüm: P ( A B ) olasılığı açık olarak, P( A B ) P( A) P( B ) P( A B ) P( A) P( B ) P( A) P( B) p p p 2 48 MATEMATİKSEL İSTATİSTİĞE GİRİŞ şeklinde yazılır. Buradan p , p 2 2 p 0 ikinci dereceden denkleminin çözümüdür. Yani, p 1 1 dir. Ayrıca, p bir olasılık olduğundan 1 den büyük olamaz ve p 1 1 dir. 1.5.10 Bir ürün birbirinin aynısı A , B ve C makineleri tarafından üretiliyor. A makinesi tarafından üretilenlerin %5 nin, B makinesi tarafından üretilenlerin %4 nün ve C makinesi tarafından üretilenlerin %3 nün hatalı olduğu bilinmektedir. Seçilen bir gün içinde üretilen ürünlerin %25 i A makinesinden, %30 u B makinesi tarafından ve %45 i de C makinesi tarafından üretilmiştir. Bu gün içinde üretilen ürünlerden rasgele seçilen bir ürünün hatalı olduğu gözlendiğinde bunun C makinesi tarafından üretilmiş olması olasılığını hesaplayınız. Çözüm: Bunun için, H {seçilen ürün hatalı} olayı ile A Ürün A makinesinde üretilmiştir B Ürün B makinesinde üretilmiştir C Ürün C makinesinde üretilmiştir olaylarını tanımlayalım. Buna göre, A , B ve C olayları örnek uzayın bir parçalanmasını oluşturur. Verilen olasılıklar P ( A) 0.25 , P ( H | A) 0.05 , P ( B ) 0.30 , P ( H | B ) 0.04 , P (C ) 0.45 , P ( H | C ) 0.03 şeklinde yazıldığında H olayının olasılığı P ( H ) P ( A) P ( H | A) P ( B ) P ( H | B ) P (C ) P ( H | C ) 1 1 3 1 9 3 19 4 20 10 25 20 100 500 olup aranan olasılık, P (C | H ) olarak bulunur. P (C H ) P (C ) P ( H | C ) (9 / 20)(3 / 100) 27 500 27 1 27 P(H ) P(H ) (19 / 500) 2000 19 4 19 76 BÖLÜM 2 RASGELE DEĞİŞKENLER VE DAĞILIMLARI 2.1. Rasgele Değişkenler İstatistik rasgelelik içeren olaylar, sistemler ve süreçler hakkında model kurmak ve bu modellerden sonuç çıkarmada gerekli bilgileri sağlayan bir bilim dalıdır (Öztürk, 1993). Bütün bilimlerin ortak amaçlarından biri, gerçek dünya hakkında bilgi sahibi olmaktır. Örneğin, yazı tura oynayan iki kişiden birinin çoğunlukla yazı atması, diğer oyuncuda paranın hileli olabileceği düşüncesi oluşabilir. O zaman, paranın hileli olup olmadığının sınanması gerekir. Böyle bir durumda, para atma deneyi tekrar edilerek düzgün bir paranın atılması halinde beklenen turaların sayısı ile karşılaştırma yapılır. Para havaya atıldığında, yazı ya da tura gelecektir. Ancak deney gerçekleşmeden önce hangisinin geleceği kesinlikle söylenemez. Para atma deneyinde Y paranın yazı gelen yüzünü, T de tura gelen yüzünü göstermek üzere örnek uzay {Y , T } olup, bu gözlemler ile herhangi bir matematiksel işlem yapılamaz. Yani, yazı ile tura ne toplanabilir ne de çıkartılabilir. Bu deney belli sayıda tekrar edildiğinde, kaç defa tura geleceği de söylenemez. Ancak kaç defa tura geleceği beklentisi verilebilir. Yani, deney sonunda gerçekleşen olaylar bilinen bir uzaya (reel sayılar) aktarılabilirse, bu uzayda işlemler yapılabilir. Örneğin para atma deneyinde X fonksiyonu yazı gözlendiğinde 0 tura gözlendiğinde 1 değerini alıyorsa, X in değer kümesi reel sayıların bir altkümesi olup, X in değer kümesinde matematiksel işlemler yapılabilir. Tanım 2.1.1 ( , , P ) bir olasılık uzayı olmak üzere, X : w X ( w) şeklinde tanımlanan X fonksiyonu, a için {w : X ( w) a} özelliğini sağlıyorsa, X fonksiyonuna bir rasgele değişken denir 50 MATEMATİKSEL İSTATİSTİĞE GİRİŞ Buradaki, {w : X ( w) a} kümesi X 1 (, a] şeklinde de ifade edilebilir. Bir rasgele değişkenin değer kümesi nin bir alt kümesidir ve DX ile gösterilir. Şekil 2.1.1 Rasgele değişkenin tanım ve değer kümesi Rasgele değişken, örnek uzaydaki olayları reel sayılara aktaran bir fonksiyondur. Para atma deneyinde, 0 ve 1 değerleri gözlenmez. Gözlenenler yazı veya turadır. Dolayısı ile, analizler X in değer kümesinde yapılır. Örnek 2.1.1 a) Bir paranın üç defa atılması deneyi için örnek uzay, YYY , YYT , YTY , TYY , TTY , TYT , YTT , TTT dir. Sigma cebir de kuvvet kümesi ( ( ) ) olmak üzere, örnek uzaydan reel sayılara giden X fonksiyonu da X : w X ( w) 0 1 2 3 , , , , w YYY w YYT , YTY , TYY w TTY , TYT , YTT w TTT olarak tanımlansın. Fonksiyonun değer kümesi DX {0,1, 2,3} olup DX dir. Şekil 2.1.2 Bir paranın üç defa atılması deneyi için rasgele değişkenin tanımı RASGELE DEĞİŞKENLER VE DAĞILIMLARI 51 Bu fonksiyon, bir para üç defa atıldığında gelen turaları sayan bir fonksiyondur. Şimdi bu fonksiyonun bir rasgele değişken olduğunu gösterelim. Bunun için, her a için X 1 (, a] {w : X ( w) a} olduğunun gösterilmesi gerekir. ( ) olduğu için nın bütün alt kümeleri sigma cebirin bir elemanıdır. Buna göre, a 0 { w : X ( w) a} 0 a 1 { w : X ( w) a} YYY 1 a 2 { w : X ( w) a} YYY , YYT , YTY , TYY 2 a 3 { w : X ( w) a} YYY , YYT , YTY , TYY , TTY , TYT , YTT a 3 { w : X ( w) a} olduğundan, X fonksiyonu bir rasgele değişkendir. b) (, , P ) bir olasılık uzayı ve A olmak üzere, X fonksiyonu X : 1 , w A w X ( w) 0 , w A olarak tanımlansın. Fonksiyonun değer kümesi DX {0,1} dir (fonksiyon gösterge veya indikatör (indicator) fonksiyonu olarak bilinir ve genellikle I A ( w) ile gösterilir). Gösterge fonksiyonunun da bir rasgele değişken olduğunu gösterelim. Bunun için, her a için {w : X ( w) a} olduğunun gösterilmesi gerekir. Kolayca görüleceği gibi, a0 {w : X ( w) a} 0 a 1 {w : X ( w) a} Ac a 1 {w : X ( w) a} dir. Yani, her a için {w : X ( w) a} olup, X bir rasgele değişkendir. c) [ 1,1] , () ve A için P ( A) " A nın aralık uzunluğu " / 2 olarak tanımlandığında (, , P ) bir olasılık uzayıdır. X fonksiyonu, X : w X ( w) w2 olarak tanımlansın. Fonksiyonun değer kümesi DX [0,1] olup bu fonksiyon da bir rasgele değişkendir. Şimdi bunu gösterelim. Önce, X ( w) pozitif bir reel sayı olduğundan a 0 için {w : X ( w) a} olduğu açıktır. Diğer taraftan, 0 a 1 için, 52 MATEMATİKSEL İSTATİSTİĞE GİRİŞ {w : X ( w) a} {w : w2 a} {w : a w a } {w : w a } \{w : w a } dır (Problem 2.7.1). Ayrıca, a 1 için, {w : X ( w) a} olduğu açıktır. Buna göre X fonksiyonu, her a için {w : X ( w) a} koşulunu sağladığından bir rasgele değişkendir Yukarıdaki örnekte de görüldüğü gibi rasgele değişkenlerin değer kümesi, reel sayıların bazen sayılabilir, bazen de sayılamayan bir alt kümesidir. Tanım 2.1.2 Bir X rasgele değişkeninin değer kümesi DX , reel sayıların sayılabilir bir alt kümesi ise X e kesikli bir rasgele değişken, reel sayıların sayılamayan bir alt kümesi ise X e sürekli bir rasgele değişken denir Bu tanıma göre, Örnek (2.1.1) de verilen rasgele değişkelerden, (a) ve (b) dekiler kesikli, (c) deki ise süreklidir. Bir paranın n defa atılması deneyinde gelen turaları sayan rasgele değişken kesikli bir rasgele değişkendir. Ayrıca, bir paranın tura gelinceye kadar atılması deneyinde yapılan denemeleri sayan fonksiyon da kesikli bir rasgele değişkendir. Diğer taraftan, bir kişinin ağırlığı veya boy uzunluğu sürekli rasgele değişkenlerdir. Bir deney sonunda, olabilecek bütün sonuçların kümesi sayılabilir olabilir. Bu küme sonlu elemanlı bir küme de olabilir. Ayrıca, örnek uzay [0 ,1] gibi sayılamayan bir küme olabilir. Böyle bir durumda, dan ye kesikli bir rasgele değişken tanımlanabilir. Örneğin, X : 0 , 0 w 0.5 w X ( w) 1 , 0.5 x 1 şeklinde tanımlanan fonksiyonunun değer kümesi DX {0,1} dir. [0 ,1] , ( ) ve A için P ( A) " A nın aralık uzunluğu" olarak tanımlandığında (, , P ) bir olasılık uzayı olup sayılamayan bir küme olmasına rağmen, X fonksiyonu kesikli bir rasgele değişkendir. Rasgele değişkenin kesikli ya da sürekli olması fonksiyonun tanımı ile ilgili görünse de, örnek uzayın yapısına da bağlıdır. Bir hasta doktora gittiğinde doktor koyduğu teşhisten sonra vereceği ilaçları kullanması ile hastaya ateşinin düşeceğini söyleyebilir. Buna rağmen hastanın ateşi düşmeyebilir veya RASGELE DEĞİŞKENLER VE DAĞILIMLARI 53 beklediği derecede düşmeyebilir. Bu sadece bir beklenti olup ateşin ne kadar düşeceği konusunda kesin bir şey söylenemez. Bu sadece istatistiki bulguların bir sonucudur. Bununla birlikte, ilaçların düzenli bir şekilde kullanılması ile ateşin 2 ile 3 derece arasında düşebileceği söylenebilir. Böyle bir deney için, ölçülen ateşin derecesi sürekli bir rasgele değişkendir. Örnek 2.1.2 X ve Y herhangi iki rasgele değişken ve c ( c ) de sabit bir reel sayı olsun. Buna göre, a) c X b) X Y c) | X | e) X 2 f) max{ X , Y } g) min{ X , Y } d) XY fonksiyonları da birer rasgele değişkendir (Öztürk, 1993) . Bunlardan (c), (d), (e), (f ) ve (g) de verilen fonksiyonların birer rasgele değişken olduğunu gösterelim. c) X bir rasgele değişken olduğundan, her a için {w : X ( w) a } dır. | X | fonksiyonunun bir rasgele değişken olduğunu göstermek için, her a için {w :| X | ( w) a} {w :| X ( w) | a} , a olduğunun gösterilmesi gerekir. Buna göre, a 0 ise {w :| X ( w) | a} olduğu açıktır. Diğer taraftan a 0 için {w : X ( w) a } {w : X ( w) a } olduğundan (Problem (2.7.1)) {w :| X ( w) | a } {w : a X ( w) a} {w : X ( w) a} \{w : X ( w) a} dir. Yani, | X | de bir rasgele değişkendir. d) a 0 ise, {w : X 2 ( w) a} olduğu açıktır. a 0 için {w : X 2 ( w) a} olduğunun da gösterilmesi gerekir. Bunun için, {w : X 2 ( w) a} {w : X ( w) a } \ {w : X ( w) a } olduğundan X bir rasgele değişken ise X 2 de bir rasgele değişkendir. e) Kolayca görüleceği gibi, (a), (b) ve (d) de verilen fonksiyonlar birer rasgele değişken ise XY , X Y (( X Y ) 2 ( X Y ) 2 ) / 4 olarak yazılabildiğinden, X Y de bir rasgele değişkendir. 54 MATEMATİKSEL İSTATİSTİĞE GİRİŞ f) X ve Y nin her ikisi de rasgele değişken olduğundan, her a için {w : X ( w) a} ve {w :Y ( w) a} dır. Buna göre, her a için max{ X , Y }( w) max{ X ( w), Y ( w)} olmak üzere, {w :max{ X , Y }( w) a } {w : X ( w) a} {w :Y ( w) a} olup max{ X , Y } de bir rasgele değişkendir. g) Benzer şekilde, her a için min{ X , Y }( w) min{ X ( w), Y ( w)} olmak üzere, {w :min{ X , Y }( w) a } {w : X ( w) a} {w :Y ( w) a} olduğundan min{ X , Y } de bir rasgele değişkendir 2.2. Dağılım Fonksiyonları Bir rasgele değişkenin özelliklerini incelemek için, o rasgele değişkenin dağılım fonksiyonu bilinmelidir. Dağılım fonksiyonu, rasgele değişkeni en iyi karakterize eden fonksiyondur. Diğer bütün özellikler dağılım fonksiyonu ile ilgilidir. Tanım 2.2.1 (, , P ) bir olasılık uzayı, X de üzerinde tanımlı bir rasgele değişken olmak üzere, P olasılık ölçüsü yardımı ile reel sayılardan [0,1] aralığına, F : [0,1] x F ( x) P({w : X ( w) x}) şeklinde tanımlanan F fonksiyonuna, X rasgele değişkeninin dağılım fonksiyonu (birikimli dağılım fonksiyonu) denir Dağılım fonksiyonu genellikle, F ( x) P ( X x) şeklinde gösterilir. Bir X rasgele değişkeninin dağılım fonksiyonu için öncelikle (, , P ) olasılık uzayının belirli olması gerekir. (, , P ) bir olasılık uzayı, X de üzerinde tanımlı bir rasgele değişken olsun. () reel sayılar üzerindeki Borel cebirini göstermek üzere, X 1 ( ( )) { A : A {w : X ( w) B}, B ( )} şeklinde tanımlanan X 1 ( ( )) sınıfı üzerinde bir sigma cebirdir (Öztürk, 1993). Teorem 2.2.1 (, , P ) bir olasılık uzayı, X bir rasgele değişken, F de X in dağılım fonksiyonu olsun. Buna göre, RASGELE DEĞİŞKENLER VE DAĞILIMLARI 55 a) F azalmayan bir fonksiyondur. b) F sağdan süreklidir. c) lim F ( x) 0 ve lim F ( x) 1 . x x İspat a) x1, x 2 olmak üzere, x1 x 2 ise {w : X ( w) x1} {w : X ( w) x2 } olup Teorem (1.2.1d) ye göre ( A B ise P ( A) P ( B ) dir), F ( x 1) P({w : X ( w) x 1}) P ({w : X ( w) x 2}) F ( x 2) yazılır. Yani, x1 x 2 ise F ( x 1) F ( x 2) dir. Bu da F nin azalmayan olduğunu gösterir. b) Fonksiyonun sağdan sürekli olduğunu göstermek için lim F ( x h) F ( x) h0 olduğunun gösterilmesi yeterlidir. Bunun için, An {w : X ( w) x 1/ n} şeklinde azalan olayların bir dizisini tanımlayalım. Bu durumda Teorem (1.2.2) ye göre An dizisinin limiti vardır ve lim An lim {w : X ( w) x 1/ n} {w : X ( w) x} n n dir. An ler azalan olayların bir dizisi olduğundan limit ile olasılık ölçüsü yer değiştirilebilir (Teorem (1.2.3)). Buna göre h 1/ n için, lim F ( x h) lim F ( x 1/ n) lim P w : X ( w) x 1/ n lim P An h0 n n n P lim An P w : X ( w) x 1/ n P w : X ( w) x F ( x) n n1 olduğundan F dağılım fonksiyonu sağdan süreklidir. c) A n {w : X ( w) n} seçildiğinde, An artan olayların bir dizisi olup limiti vardır (Teorem (1.2.2)). Buna göre lim A n lim {w : X ( w) n} olup limit ile olasılık n n ölçüsü yer değiştirebilir. Buradan da, lim F ( x) lim F ( n) lim P w : X ( w) n x n n lim P ( A n ) P lim A n P() 1 n n elde edilir. B n {w : X ( w) n} azalan bir dizi olup, lim B n dir. Buradan da, n 56 MATEMATİKSEL İSTATİSTİĞE GİRİŞ lim F ( x) lim F ( x) lim F ( n) lim P w : X ( w) n x x n n lim P (B n ) P lim B n P() 0 n n şeklinde aranan sonuç elde edilmiş olur Teorem 2.2.2 X bir rasgele değişken, F de X in dağılım fonksiyonu olsun. Bu durumda, a) a, b ve a b ise P ({w : a X ( w) b}) F (b) F (a ) b) a için, P({w : X ( w) a}) F (a ) F (a ) dır. Burada F (a ) ve F (a ) sırası ile fonksiyonun a noktasındaki sağdan ve soldan limitlerini göstermektedir. İspat a) a, b ve a b için, {w : X ( w) b} kümesi {w : X ( w) b} {w : X ( w) a} {w : a X ( w) b} şeklinde yazılabilir. Ayrıca, {w : X ( w) a} ile {w : a X ( w) b} kümeleri ayrıktır. Buradan, F (b) P ({w : X ( w) b}) P ({w : X ( w) a}) P ({w : a X ( w) b}) F (a ) P ({w : a X ( w) b}) olup aranan eşitlik P ({w : a X ( w) b}) F (b) F (a ) şeklinde bulunur. b) A n {w : a (1/ n) X ( w) a (1 / n)} seçildiğinde A n azalan bir dizi olup Teorem (1.2.2) ye göre lim A n {w : X ( w) a} dır. Ayrıca, Teorem (1.2.3) e göre, n olasılık ölçüsü ile limit yer değiştirebilir. Teoremdeki (a) sonucu kullanıldığında, P w : X (w) a P lim An lim P( An ) n n 1 1 1 1 lim P w : a X ( w) a lim F a F a n n n n n n 1 1 lim F a lim F a F (a ) F (a ) n n n n şeklinde aranan sonuç elde edilir RASGELE DEĞİŞKENLER VE DAĞILIMLARI 57 Örnek 2.2.1 a) Bir paranın üç defa atılması deneyi için Örnek (2.1.1a) daki gelen turaları sayan rasgele değişkenin dağılım fonksiyonunu bulalım. Bu deney için örnek uzay, YYY , YYT , YTY , TYY , TTY , TYT , YTT , TTT olup sigma cebir, kuvvet kümesi ( () ) olsun. A için P ( A) n( A) / 8 olasılık ölçüsü tanımlandığında, (, , P ) bir olasılık uzayıdır. Rasgele değişkenin değer kümesi DX {0,1, 2,3} dir. Bu rasgele değişkenin dağılım fonksiyonunu bulalım. Önce, x 0 için {w : X ( w) x} olduğundan, F ( x) 0 ve x 3 için {w : X ( w) x} olup F ( x) 1 olduğu açıktır. Fonksiyonun diğer değerleri, 0 x 1 için, F ( x) P w : X ( w) x P YYY 1/ 8 1 x 2 için, F ( x) P w : X ( w) x P YYY , YYT , YTY , TYY 4 / 8 2 x 3 için, F ( x) P w : X ( w) x P YYY , YYT , YTY , TYY , TTY , TYT , YTT 7 / 8 şeklindedir. Buna göre, X rasgele değişkeninin dağılım fonksiyonu, 0 1/ 8 F ( x) 4 / 8 7 / 8 1 , , , , , x0 0 x 1 1 x 2 2 x3 x3 grafiği de Şekil (2.2.1) de verildiği gibidir. Şekil 2.2.1 Bir paranın üç defa atılması deneyi için tanımlanan rasgele değişkenin dağılım fonksiyonu Fonksiyonun açık ifadesinden ve grafiğinden görüldüğü gibi, dağılım fonksiyonu azalmayan ve sağdan süreklidir. 58 MATEMATİKSEL İSTATİSTİĞE GİRİŞ Şekil 2.2.2 Bir paranın üç defa atılması deneyi için tanımlanan rasgele değişkenin olasılık fonksiyonu Teorem(2.2.2b) ye göre, rasgele değişkenin 0,1,2 ve 3 değerleri için, P ({w : X ( w) 0}) (1/ 8) 0 1/ 8 , P ({w : X ( w) 2}) (7 / 8) (4 / 8) 3 / 8 , olasılıkları hesaplanır. Bununla birlikte P ({w : X ( w) 1}) (4 / 8) (1 / 8) 3 / 8 P ({w : X ( w) 3}) 1 (7 / 8) 1/ 8 x \ DX için, P ({w : X ( w) x}) 0 olduğu açıktır. Kesikli rasgele değişkenlerde olasılık fonksiyonu bazen x DX için {w : X ( w) x} P ({w : X ( w) x}) 0 1/ 8 1 3/8 2 3/8 3 1/ 8 şeklinde tablo halinde verilir. Örnek 2.2.2 [ 1,1] , sigma cebir de üzerindeki Borel cebiri ( () ) olsun. Olasılık ölçüsü, A için P ( A) " A nın aralık uzunluğu " / 2 olarak tanımlandığında, (, , P ) bir olasılık uzayı olur. Buna göre, a) b) X : Y : w X ( w) | w | w Y ( w) w2 şeklinde tanımlanan X ve Y rasgele değişkenlerinin dağılım fonksiyonlarını bulalım. a) DX [0,1] olup x 0 ise F ( x) 0 ve x 1 ise F ( x) 1 olduğu açıktır. Diğer taraftan, 0 x 1 için, F ( x) P w : X ( w) x P w :| w | x P w : x w x (2 x ) / 2 x dir. Buradan, X rasgele değişkeninin dağılım fonksiyonu RASGELE DEĞİŞKENLER VE DAĞILIMLARI 0 , F ( x) x , 1 , 59 x0 0 x 1 x 1 olup grafiği de Şekil (2.2.3a) de verilmiştir. Şekil 2.2.3a Örnek (2.2.2a) deki dağılım fonksiyonunun grafiği b) Benzer şekilde, DY [0,1] olup, yine y 0 ise F ( y ) 0 ve y 1 ise F ( y ) 1 olduğu açıktır. 0 y 1 ise dağılım fonksiyonunun değeri, F ( y ) P({w :Y ( w) y}) P ({w : w2 y}) P({w : y w y }) (2 y ) / 2 dir. Şekil 2.2.3b Örnek (2.2.2b) deki dağılım fonksiyonunun grafiği Buna göre, rasgele değişkenin dağılım fonksiyonu, 0 F ( y) y 1 , y0 , , 0 y 1 y 1 olup grafiği Şekil (2.2.3b) de verildiği gibidir Örnek 2.2.3 [ 1, 2] ve () olsun. A için olasılık ölçüsü de P ( A) " A nın aralık uzunluğu " / 3 y 60 MATEMATİKSEL İSTATİSTİĞE GİRİŞ olarak tanımlandığında, (, , P ) bir olasılık uzayıdır. X ve Y rasgele değişkenleri a) X : b) Y : w X ( w) w2 w Y ( w) w2 2 w şeklinde tanımlansın. Bu rasgele değişkenlerin dağılım fonksiyonlarını bulalım. Rasgele değişkenlerin değer kümeleri grafiklerden (Şekil 2.2.4a ve 2.2.4b) de görüldüğü gibi, DX [0, 4] ve DY [1, 3] dir. Şimdi bu rasgele değişkenlerin dağılım fonksiyonlarını bulalım. a) x 0 ise FX ( x) 0 ve x 4 ise FX ( x) 1 olduğu açıktır. Fonksiyonun grafiği de dikkate alınarak, fonksiyonunun diğer değerleri 0 x 1 için, FX ( x) P({w : X ( w) x}) P ({w : w2 x}) P({w : x w x }) (2 x ) / 3 ve 1 x 4 için, FX ( x) P({w : X ( w) x}) P ({w : w2 x}) P ({w : 1 w x }) (1 x ) / 3 olarak heaplanmıştır. Buna göre, X in dağılım fonksiyonu 0 2 x 3 FX ( x) 1 x 3 1 , x0 , 0 x 1 , 1 x 4 , x4 olup grafiği rasgele değişkenin değer kümesi ile beraber Şekil (2.2.4a) de verilmiştir. Şekil 2.2.4a Örnek (2.2.3a) da verilen rasgele değişkenin değer kümesi ile dağılım fonksiyonu RASGELE DEĞİŞKENLER VE DAĞILIMLARI 61 b) DY [1,3] olduğundan, y 1 ise FY ( y ) 0 ve y 3 ise FY ( y ) 1 olduğu açıktır. Ayrıca 1 y 0 için fonksiyonun değeri P w : 2 FY ( y ) P w : Y ( w) y P w : w2 2 w y 44 y 2 4 4 y w 2 2 2 2 1 y 2 2 1 y 2 1 y P w : x 2 2 3 ve 0 y 3 için, 2 P w : 2 FY ( y ) P w : Y ( w) y P w : w2 2 w y 44 y w 2 2 2 44 y 1 1 y 2 3 3 olarak bulunmuştur. Şekil 2.2.4b Örnek (2.2.3b) de verilen rasgele değişkenin değer kümesi ile dağılım fonksiyonu Buradan Y rasgele değişkeninin dağılım fonksiyonu da, 2 FY ( y ) 1 0 1 y 3 1 y 3 1 , y 1 , 1 y 0 , 0 y3 , y3 şeklinde olup, grafiği değişkenin tanım bölgesi ile beraber Şekil (2.2.4b) de verilmiştir Rasgele değişkenleri kesikli ve sürekli olmak üzere iki ayrı gruba ayırmıştık. Rasgele değişkenin değer kümesi sayılabilir ise kesikli, aksi halde sürekli rasgele değişken demiştik. 62 MATEMATİKSEL İSTATİSTİĞE GİRİŞ Dağılım fonksiyonunun sağdan sürekli olduğunu biliyoruz (Teorem 2.2.1). Yukarıdaki örneklerde de görüldüğü gibi, rasgele değişken sürekli ise dağılım fonksiyonu da süreklidir. 2.3. Olasılık (Yoğunluk) Fonksiyonu Olasılık ve istatistikte rasgele değişkenin dağılım fonksiyonu yerine, genellikle dağılım fonksiyonundan elde edilen olasılık veya olasılık yoğunluk fonksiyonu kullanılır. Aslında, dağılım fonksiyonu verildiğinde olasılık fonksiyonu, olasılık fonksiyonu verildiğinde de dağılım fonksiyonu bulunabilir. Kesikli bir X rasgele değişkeninin dağılım fonksiyonu F olsun. X in değer kümesi DX olmak üzere, x için Teorem (2.2.2) den {w : X ( w) x} olayının olasılığının P({w : X ( w) x}) F ( x ) F ( x ) şeklinde hesaplandığını biliyoruz (Teorem 2.2.22b). Buna göre, x DX için, P({w : X ( w) x}) F ( x ) F ( x ) veya kısaca P( X x) F ( x ) F ( x ) olasılıkları hesaplanır. x \ DX için de P ( X x) 0 olduğu açıktır. Tanım 2.3.1 Değer kümesi DX olan kesikli bir X rasgele değişkeninin olasılık fonksiyonu, P( X x) , x DX f ( x) 0 , diğer yerlerde dir Bir rasgele değişkenin olasılık fonksiyonu, bütün reel sayılar kümesinde tanımlıdır. Fonksiyon değer kümesi dışında 0 olarak tanımlandığı için, rasgele değişkenin olasılık fonksiyonu bazen P ( X x) olarak da verilir. Ancak, bazı x DX için P ( X x) 0 olabilir. Herhangi bir rasgele değişkenin olasılık fonksiyonu f ( x) aşağıdaki koşulları sağlar. Bu koşullar, i) f ( x) 0 , her x ii) P( X x) 1 xDX RASGELE DEĞİŞKENLER VE DAĞILIMLARI 63 dir. Örnek 2.3.1 a) X rasgele değişkeninin olasılık fonksiyonu, c x , x 1, 2,3, 4,5 f ( x) 0 , diğer yerlerde olarak verilmiş olsun. Bu fonksiyonun bir olasılık fonksiyonu olabilmesi için c sabitinin değerini bulalım. Her x için f ( x) 0 olduğundan c x 0 ve P( X x) 1 xDX olması gerekir. Buradan, c sabitinin değeri 5 5 x 1 x 1 1 P ( X x) P ( X x) cx 15 c c xDX 1 15 olarak bulunur. Yani, X rasgele değişkeninin olasılık fonksiyonu, x /15 , x 1, 2,3, 4,5 f ( x) , diğer yerlerde 0 dir. Buna göre, P ( X 3) olasılığı da P ( X 3) P ( X 3) P ( X 4) P ( X 5) 1 4 3 4 5 15 5 olarak hesaplanmış olur. b) 0 olmak üzere, X rasgele değişkeninin olasılık fonksiyonu, c x / x ! , x 0,1, 2,3,... f ( x) , diğer yerlerde 0 olarak verildiğinde c sabitinin değerini bulalım. Yine, her x için f ( x) 0 olması gerektiğinden c 0 olmalıdır. Ayrıca, e fonksiyonunun Taylor serisi açılımından c sabitinin değeri x x 0 x 0 x! P( X x) P( X x) c xDX c e c e dir. Yani, X rasgele değişkeninin olasılık fonksiyonu, 64 MATEMATİKSEL İSTATİSTİĞE GİRİŞ e x / x ! , x 0,1, 2,3,... f ( x) 0 , diğer yerlerde şeklindedir Kesikli rasgele değişkenlerde, dağılım fonksiyonu verildiğinde, olasılık fonksiyonu P X x F ( x ) F ( x ) eşitliği ile bulunur. Rasgele değişkenin olasılık fonksiyonu verildiğinde dağılım fonksiyonu da, F ( x) P( X t ) t x şeklinde bulunur. Bir önceki örnekte verilen olasılık fonksiyonunu ele alalım. Olasılık fonksiyonu, x /15 , x 1, 2,3, 4,5 f ( x) , diğer yerlerde 0 olup dağılım fonksiyonunu bulmak için olasılık fonksiyonunu, X x P ( X x) 1 1 /15 2 2 /15 3 3 /15 4 4 /15 5 5 /15 şeklinde yazalım. Buradan dağılım fonksiyonunun değerleri x 1 F ( x) P( X t ) 0 , tx 1 x 2 F ( x) P ( X t ) P ( X 1) tx 1 , 15 2 x 3 F ( x) P ( X t ) P ( X 1) P ( X 2) tx 3 , 15 3 x 4 F ( x) P ( X t ) P ( X 1) P ( X 2) P ( X 3) tx 6 , 15 4 x 5 F ( x) P ( X t ) P ( X 1) P ( X 2) P ( X 3) P ( X 4) tx x 5 F ( x) P( X t ) 1 tx olarak bulunur. Buna göre, dağılım fonksiyonu açık olarak, 10 , 15 RASGELE DEĞİŞKENLER VE DAĞILIMLARI 0 1/ 15 3 /15 F ( x) 6 / 15 10 / 15 1 , , , , , , 65 x 1 1 x 2 2 x3 3 x 4 4 x5 x5 şeklinde yazılır. X sürekli ise dağılım fonksiyonu da süreklidir. O halde, X sürekli ise her x için P( X x) F ( x ) F ( x ) 0 dir. Ayrıca X sürekli ise, rasgele değişkenin olasılık fonksiyonunu kesikli olasılık fonksiyonlardan ayırmak için “olasılık yoğunluk fonksiyonu” ifadesi kullanılır. Sürekli rasgele değişkenlerin dağılım fonksiyonları, sürekli olmasına rağmen dağılım fonksiyonunun türevlenemediği yerler olabilir. Tanım 2.3.2 Değer kümesi DX olan sürekli bir X rasgele değişkeninin dağlım fonksiyonu F ( x) olsun. X in olasılık yoğunluk fonksiyonu, d F ( x) , F nin türevlenebildiği yerlerde f ( x) dx 0 , diğer yerlerde dir X rasgele değişkeninin olasılık yoğunluk fonksiyonu f ( x) , i) ii) f ( x) 0, her x f ( x) dx 1 xDX koşullarını sağlar. Diğer taraftan, P ({w : X ( w) A}) olasılığı (veya P ( X A) olasılığı) P ( X A) f ( x) dx A integrali ile hesaplanır. Örnek 2.3.2 [1, 2] , () ve A için P ( A) " A nın aralık uzunluğu" / 3 olmak üzere, (, , P ) bir olasılık uzayıdır. 66 MATEMATİKSEL İSTATİSTİĞE GİRİŞ X : w X ( w) w2 olarak verilen X rasgele değişkeninin dağılım fonksiyonu (Örnek, 2.2.3a) sürekli olmasına rağmen, x 0, x 1 ve x 4 noktalarında türevlenemez. Dolayısı ile, X rasgele değişkeninin değer kümesi D X [0, 4] olup, olasılık yoğunluk fonksiyonu 1 3 x dF ( x) 1 f ( x) dx 6 x 0 , 0 x 1 , 1 x 4 , d . y. olup grafiği Şekil (2.3.1) de verilmiştir. Şekil 2.3.1 Örnek (2.3.2) de verilen rasgele değişkenin olasılık yoğunluk fonksiyonu Bu fonksiyon, her x için f ( x) 0 ve DX 1 1 4 1 2 x f ( x) dx dx dx 3 3 x 6 x 0 1 1 x 0 x 3 4 x1 2 1 3 3 2 1 4 1 1 3 3 özelliklerini sağladığı için bir olasılık yoğunluk fonksiyonudur. P ({w :0 X ( w) 2}) olasılığı ise, P ({w :0 X ( w) 2}) DX 1 1 2 1 2 x f ( x ) dx dx dx 3 3 x 6 x 0 1 1 x 0 x 3 2 x 1 RASGELE DEĞİŞKENLER VE DAĞILIMLARI 2 1 3 3 67 2 1 1 2 0.8047 3 olarak hesaplanmıştır. Sürekli rasgele değişkenlerde, aralık sınırları yazılırken uç noktaların önemi yoktur. Yani, P ({w :0 X ( w) 2}) ile P ({w :0 X ( w) 2}) olasılıkları aynıdır X rasgele değişkeninin olasılık yoğunluk fonksiyonu f ( x) verildiğinde, dağılım fonksiyonu, x F ( x) f (t ) dt integrali ile hesaplanır. Bir rasgele değişkenin dağılım fonksiyonu verildiğinde, bu özelliği sağlayan bir f fonksiyonu varsa, bu fonksiyon rasgele değişkenin olasılık yoğunluk fonksiyonudur. Böyle bir fonksiyon bulunamayabilir veya bulunduğu zaman da fonksiyonu belirlemek kolay olmayabilir. Oysa, bir rasgele değişkenin dağılım fonksiyonu her zaman vardır. Bu nedenle, rasgele değişkenlerin olasılık veya olasılık yoğunluk fonksiyonları dağılım fonksiyonlarından elde edilmeye çalışıldı. Bir rasgele değişkenin aksi söylenmedikçe olasılık veya olasılık yoğunluk fonksiyonunun var olduğu kabul edilecektir. Kesikli dağılımlarda uç noktalar önemlidir. Örneğin, Örnek (2.3.1b) de verilen rasgele değişken için P ( X 2) ve P ( X 2) olasılıkları farklıdır. Olasılık fonksiyonu, 0 için P( X x) e x / x ! , x 0,1, 2,3,... olup olasılıklar, P( X 2) P( X 0) P( X 1) P( X 2) e (1 2 / 2) ve P( X 2) P( X 0) P( X 1) e (1 ) olup, P ( X 2) P ( X 2) dir. Genel olarak, olasılık veya olasılık yoğunluk fonksiyonu verildiğinde olasılıklar P( X x) , xA P ({w : X ( w) A}) P( X A) , f ( x) dx A ile hesaplanır. X kesikli X sürekli 68 MATEMATİKSEL İSTATİSTİĞE GİRİŞ 2.4. Çok Değişkenli Dağılım Fonksiyonları Bu kısımda rasgele vektörler (veya vektör rasgele değişkenler) ve dağılım fonksiyonları ile ortak olasılık (veya ortak olasılık yoğunluk) fonksiyonları üzerinde durulacaktır. Bileşenleri X1, X 2 ,..., X k olan k boyutlu bir rasgele değişken X ( X1, X 2 ,..., X k ) şeklinde gösterilecektir. Böyle bir rasgele değişken (veya rasgele vektör) ( X1 ,..., X k ) : k w ( X1 ( w),..., X k ( w)) şeklinde tanımlanır. k boyutlu rasgele değişkenin ortak dağılım fonksiyonu, F X , X ,..., X 1 2 k : k [0,1] ( x1,...xk ) F( X1, X 2 ,..., X k ) ( x1,...xk ) P({w : X1 ( w) x1 ,..., X k ( w) xk }) şeklinde tanımlanır. Karmaşıklığı önlemek için k 2 alalım. O zaman, bileşenleri X ve Y olan iki boyutlu vektör rasgele değişkenin ortak dağılım fonksiyonu, F ( x, y) P({w : X (w) x, Y (w) y}) P( X x, Y y) şeklinde olur. Çok değişkenli dağılım fonksiyonları tek değişkenli dağılım fonksiyonlarında olduğu gibi benzer özelliklere sahiptir. Bunlardan bazıları aşağıdaki teoremde özetlenmiştir. Teorem 2.4.1 (, , P ) bir olasılık uzayında tanımlı marjinalleri FX ( x) ve FY ( y ) olan X ( X , Y ) iki boyutlu rasgele vektörün dağılım fonksiyonu F ( x, y ) aşağıdaki özellikleri sağlar: i) ii) lim F ( x, y ) FY ( y ) , lim F ( x, y ) FX ( x) x y lim F ( x, y) 0 , x iii) lim lim F ( x, y ) 0 , y lim lim x y F ( x, y ) 0 lim F ( x, y ) 1 . x y İspat: i) lim F ( x, y ) FY ( y ) için x lim F (n, y ) FY ( y ) olduğunun gösterilmesi n yeterlidir. Bunun için, An {w : X ( w) n} ve B {w : Y ( w) y} kümelerini tanımlayalım. Buradaki An dizisi artan olup lim An dır. Dolayısı ile, n RASGELE DEĞİŞKENLER VE DAĞILIMLARI 69 lim F (n, y ) lim P w : X ( w) n, Y ( w) y lim P( An B) n n n P lim An B P ( B ) P( B) P {w : Y ( w) y} FY ( y ) n dir. Bn {w : Y ( w) n} ve A {w : X ( w) x} alınarak lim F ( x, y ) FX ( x) elde y edilir. ii) lim F ( x, y) 0 için lim F ( n, y ) 0 olduğunu göstermek yeterlidir. Bunun x n için de An {w : X ( w) n} ve B {w : Y ( w) y} kümelerini tanımlayalım. An azalan olup lim An dir. Ayrıca, An azalan olduğundan limit ile olasılık yer değiştirebilir. Buradan n lim F ( n, y ) lim P w : X ( w) n, Y ( w) y lim P( An B) n n n P lim An B P ( B ) P() 0 n elde edilir. Yine benzer şekilde, Bn {w : Y ( w) n} ve A {w : X ( w) x} alınarak lim F ( x, y) 0 , An {w : X ( w) n} ve Bn {w : Y ( w) n} küme dizileri kullanılarak y da lim lim x y F ( x, y ) 0 elde edilir. iii) An {w : X ( w) n} ve Bn {w : Y ( w) n} küme dizilerini tanımlayalım. Her iki küme dizisi de artan olup, lim An ve lim Bn dir. Buradan da, n lim lim F ( x, y ) lim x y n lim F (n, n) lim P w : X ( w) n, Y ( w) n n n n lim P( An Bn ) P lim An lim Bn P( ) P () 1 n n n elde edilir Bileşenleri X ve Y olan iki boyutlu vektör rasgele değişkenin dağılım fonksiyonu F ( x, y) verildiğinde, X ve Y nin marjinal dağılım fonksiyonları sırası ile, FX ( x) F ( x , ) ve FY ( y ) F ( , y ) 70 MATEMATİKSEL İSTATİSTİĞE GİRİŞ şeklinde bulunur. Buradaki FX ve FY fonksiyonları, X ve Y nin marjinal dağılım fonksiyonlarıdır. Buradan da, her bir rasgele değişkenin marjinal olasılık veya olasılık yoğunluk fonksiyonu elde edilir. Tek değişkenli dağılım fonksiyonu azalmayan ve sağdan süreklidir. Vektörlerde sıralama bağıntısı olmadığından, çok değişkenli dağılım fonksiyonları azalmayandır veya artandır gibi ifadeler kullanılamaz. Ancak, çok değişkenli dağılım fonksiyonu her bir değişkenine göre sağdan sürekli ve azalmayandır. İki değişkenli dağılım fonksiyonunun bu özellikleri aşağıdaki teoremde ifade edilmiştir. Teorem 2.4.2 (, , P ) bir olasılık uzayında tanımlı marjinalleri FX ( x) ve FY ( y ) olan X ( X , Y ) iki boyutlu rasgele vektörün dağılım fonksiyonu F ( x, y ) değişkenlerine göre sağdan sürekli ve azalmayandır. İspat: Önce, fonksiyonun bileşenlerine göre sağdan sürekli olduğunu gösterelim. F ( x, y) fonksiyonunun x bileşenine göre sağdan sürekliliği için, lim F ( x h, y ) F ( x, y ) h 0 veya lim F ( x (1 / n), y ) F ( x, y ) olduğunun gösterilmesi yeterlidir. Bunun için de n lim F ( x (1 / n), y ) F ( x, y ) 0 n olduğunun gösterilmesi yeterlidir. Ayrıca lim F ( x (1 / n), y ) F ( x, y ) , n lim F ( x (1 / n), y ) F ( x, y ) lim P ( X x (1 / n), Y y ) P ( X x, Y y ) n n lim P( x X x (1 / n), Y y ) n şeklinde yazılabilir. An {w : x X (w) x (1 / n)} ve Bn {w : Y ( w) y} kümeleri için, An küme dizisi azalan olup lim An dir. Buna göre, n lim F ( x (1 / n), y ) F ( x, y ) lim P ( x X x (1 / n), Y y ) lim P ( An B ) n n n P lim ( An B ) lim An B) P ( B) P () 0 n n elde edilir. Bu da, F ( x, y ) fonksiyonunun x değişkenine göre sağdan sürekli olduğunu gösterir. Benzer düşünce ile, fonksiyonun y değişkenine göre de sağdan sürekli olduğu RASGELE DEĞİŞKENLER VE DAĞILIMLARI 71 gösterilir. Şimdi de, fonksiyonun her iki değişkenine göre de sağdan sürekli olduğunu görelim. Bunun için de, lim F ( x (1 / n), y (1 / n)) F ( x, y ) 0 n olduğunun gösterilmesi yeterlidir. Diğer taraftan, lim F ( x (1 / n), y (1 / n)) F ( x, y ) lim P ( X x 1 / n , Y y 1 / n ) P ( X x , Y y n n lim P( x X x 1 / n , y Y y 1 / n ) n şeklinde yazılabilir. An {w : x X (w) x (1 / n)} ve Bn {w : y Y ( w) y (1 / n)} için, her iki küme dizisi de azalan olup, lim An ve lim Bn dir. Buradan, n n lim F ( x (1 / n), y (1 / n)) F ( x, y ) lim P ( x X x 1 / n , y Y y 1 / n ) n n lim P ( An Bn ) P lim ( An Bn ) P lim An lim Bn P () 0 n n n n elde edilir. Bu da fonksiyonun her iki değişkenine göre sağdan sürekli olduğunu gösterir. Şimdi, fonksiyonun her iki bileşenine göre ayrı ayrı azalmayan olduğunu gösterelim. Fonksiyonun x e göre azalmayan olduğunu göstermek için, her y ve x1 x2 için F ( x1, y ) F ( x2 , y ) olduğunun gösterilmesi gerekir. Bunun için de, x1 x2 ise {w : X ( w) x1} {w : X ( w) x2 } {w : X ( w) x1 , Y ( w) y} {w : X ( w) x2 , Y ( w) y} altküme bağıntısı yazılabilir. Buradan da, x1 x2 ise, P ({w : X ( w) x1 , Y ( w) y}) P({w : X ( w) x2 , Y ( w) y}) F ( x1 , y ) F ( x2 , y ) elde edilir. Bu da fonksiyonun, x değişkenine göre azalmayan olduğunu gösterir. Benzer şekilde fonksiyonun y bileşenine göre de azalmayan olduğu gösterilir. Yani, her x ve y1 y2 için F ( x, y1 ) F ( x, y2 ) dir Teorem 2.4.3 (, , P ) bir olasılık uzayında tanımlı marjinalleri FX ( x) ve FY ( y ) olan X ( X , Y ) iki boyutlu rasgele vektörün dağılım fonksiyonu F ( x, y ) olsun. Bu durumda, max{FX ( x) FY ( y ) 1, 0} F ( x, y ) min{FX ( x), FY ( y )} dir (Frechet sınırları). İspat: A {w : X ( w) x} , B {w : Y ( w) y} altkümelerini tanımlayalım. Buradan, 72 MATEMATİKSEL İSTATİSTİĞE GİRİŞ P ( A B ) P ( A) P ( B ) P ( A B ) 1 den P ( A B ) P ( A) P ( B ) 1 yazılır. Buna göre, P ( A B ) P( A) P( B ) 1 P ( X x, Y y ) P ( X x) P (Y y ) 1 F ( x, y ) FX ( x) FY ( y ) 1 elde edilir. FX ( x) FY ( y ) 1 değeri negatif olabileceği göz önüne alındığında, F ( x, y ) max{FX ( x ) FY ( y ) 1 , 0} ifadesi yazılabilir. Diğer taraftan, P ( A B ) P ( A) ve P ( A B ) P ( B ) özelliklerinden, P ( X x, Y y ) P ( X x) ve P ( X x, Y y ) P(Y y ) dir. Yani, F ( x, y ) FX ( x) ve F ( x, y ) FY ( y ) olup, F ( x, y ) min{FX ( x), FY ( y )} dir. Bu iki eşitsizlik birleştirildiğinde, max{FX ( x) FY ( y ) 1, 0} F ( x, y ) min{FX ( x), FY ( y )} şeklinde aranan eşitsizlik elde edilmiş olur Tek değişkenli dağılım fonksiyonlarında, P (a X b) F (b) F (a ) dır. Burada da benzer özellik geçerlidir. Teorem 2.4.4. (, , P ) bir olasılık uzayında tanımlı marjinalleri FX ( x) ve FY ( y ) olan X ( X , Y ) iki boyutlu rasgele vektörün dağılım fonksiyonu F ( x, y ) olsun. x1 x2 için P ( x1 X x2 , Y y ) F ( x2 , y ) F ( x1 , y ) dir. İspat: x1, x2 olmak üzere, x1 x2 ise {w : X ( w) x2 , Y ( w) y} kümesi {w : X ( w) x2 , Y ( w) y} {w : X ( w) x1 , Y ( w) y} {w : x1 X ( w) x2 , Y ( w) y} şeklinde iki ayrık kümenin birleşimi olarak yazılabilir. Buradan da, P ({w : X ( w) x2 , Y ( w) y}) P ({w : X ( w) x1 , Y ( w) y}) P ({w : x1 X ( w) x2 , Y ( w) y}) eşitliğinden F ( x2 , y) F ( x1 , y ) P ( x1 X x2 , Y y ) bulunur. Bu da ispat için yeterlidir (, , P ) bir olasılık uzayında tanımlı marjinalleri FX ( x) ve FY ( y ) olan X ( X , Y ) iki boyutlu rasgele vektörün dağılım fonksiyonu F ( x, y ) olsun. Bu durumda, P ( X x, Y y ) 1 FX ( x) FY ( y ) F ( x, y ) RASGELE DEĞİŞKENLER VE DAĞILIMLARI 73 eşitliği için A {w : X ( w) x} , B {w : Y ( w) y} kümelerini tanımlayalım. FX ( x) P( A) , FY ( y ) P( B ) ve F ( x, y ) P ( A B ) olduğundan, P ( X x, Y y ) P ( Ac B c ) P ( A B)c 1 P ( A B ) 1 P ( A) P ( B) P ( A B) 1 FX ( x) FY ( y ) F ( x, y ) eşitliği elde edilir. Yani, P ( X x, Y y ) 1 FX ( x) FY ( y ) F ( x, y ) dir. Rasgele değişkenler kesikli ve sürekli olmak üzere iki gruba ayrılmıştı. Burada, her iki rasgele değişken kesikli veya sürekli olabildiği gibi biri kesikli diğeri sürekli de olabilir. Her iki rasgele değişken de kesikli ise rasgele vektörün ortak olasılık fonksiyonu için bütün x DX ve y DY için P ( X x, Y y ) olasılıkları hesaplanır. Yani, kesikli X ve Y rasgele değişkenlerinin ortak olasılık fonksiyonu, P( X x, Y y ) , x DX , y DY f ( x, y ) 0 , diğer yerlerde şeklindedir. Rasgele değişkenlerin her ikisi de sürekli ise, ortak dağılım fonksiyonu F ( x, y) olan X ve Y rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu da, 2 F ( x, y ) , F nin türevlenebildiği yerlerde f ( x, y ) x y 0 , diğer yerlerde olarak bulunur. Rasgele değişkenlerden biri kesikli diğeri sürekli ise tek değişkenlilerde olduğu gibi olasılık veya olasılık yoğunluk fonksiyonları bulunur. Marjinal olasılık veya olasılık yoğunluk fonksiyonları ise aşağıdaki gibi bulunur. a) X ve Y rasgele değişkenleri kesikli ve ortak olasılık fonksiyonu P ( X x, Y y ) ise, marjinal olasılık fonksiyonları P ( X x) P ( X x, Y y ) , bütün x DX yD Y P (Y y ) P ( X x, Y y ) , bütün y DY xD X dir. 74 MATEMATİKSEL İSTATİSTİĞE GİRİŞ b) X ve Y rasgele değişkenleri sürekli ve ortak olasılık yoğunluk fonksiyonu f ( x, y ) ise marjinal olasılık yoğunluk fonksiyonları x DX ve y DY için f X ( x) f ( x, y ) dy ve yDY fY ( y ) f ( x, y ) dx xDX integralleri ile hesaplanır. c) X kesikli, Y sürekli rasgele değişkenler ve ortak olasılık fonksiyonu f ( x, y ) ise marjinal olasılık ve olasılık yoğunluk fonksiyonları x Dx ve y D y için, f X ( x ) P ( X x) f ( x, y ) dy ve yDY fY ( y ) f ( x, y ) xDX şeklindedir. Ortak olasılık veya olasılık yoğunluk fonksiyonu verildiğinde, ortak dağılım fonksiyonları da P( X k , Y ) , k x , y F ( x, y ) x y f ( s, t ) d t d s , şeklinde bulunur. X ve Y kesikli X ve Y sürekli Tanım 2.4.1 X ve Y rasgele değişkenlerinin ortak olasılık veya olasılık yoğunluk fonksiyonu f ( x, y ) , marjinal olasılık veya olasılık yoğunluk fonksiyonları da sırası ile f X ( x) ve fY ( y ) olsun. Bütün x DX ve y DY için f ( x, y ) f X ( x) fY ( y ) ise X ve Y rasgele değişkenlerine bağımsızdır denir Tanım 2.4.2 X ve Y rasgele değişkenlerinin ortak olasılık veya olasılık yoğunluk fonksiyonu f ( x, y ) , marjinal olasılık ve olasılık yoğunluk fonksiyonları da sırası ile f X ( x) ve fY ( y ) olsun. Y y verildiğinde X in koşullu olasılık veya olasılık yoğunluk fonksiyonu, P ( X x, Y y ) P (Y y ) f X |Y y ( x | y ) f ( x, y ) fY ( y ) dir , P(Y y ) 0 , kesikli , fY ( y ) 0, sürekli RASGELE DEĞİŞKENLER VE DAĞILIMLARI 75 Örnek 2.4.1 a) Bir çift zarın aynı anda atılması deneyini ele alalım. X1 birinci zarın üzerindeki noktaların sayısını, X 2 de ikinci zarın üzerindeki noktaların sayısını göstersin. Buna göre, örnek uzay ( x ve y zarların üzerindeki nokta sayılarına göre şekilleri göstermek üzere), {( x, y ): x 1, 2,.., 6, y 1, 2,..., 6} olup sigma cebir de kuvvet kümesi ( ()) olsun. A için P ( A) n( A) / 36 denirse (, , P ) bir olasılık uzayı olur. X1 ve X 2 birer rasgele değişken olup Örnek (2.1.2) gereğince X X 1 X 2 ve Y | X 1 X 2 | rasgele değişkendir. X ve Y nin değer kümeleri D X {2, 3, 4,...,12} ve DY {0,1, 2,3, 4,5} olup, ortak olasılık fonksiyonu için olasılıklar ayrı ayrı hesaplanır. Aşağıda bu olasılıklardan birkaç tanesi hesaplanmış diğerleri de benzer şekilde hesaplanarak tablo halinde ortak olasılık fonksiyonu verilmiştir. Önce, P ( X 2, Y 0) olasılığını hesaplayalım. Burada, {w : X ( w) 2} {(1,1)} ve {w : Y ( w) 0} {(1,1), (2, 2), (3, 3), (4, 4) , (5,5) , (6, 6)} olup arakesit kümesi {w : X ( w) 2, Y ( w) 0} {(1,1)} dir. Buradan, P ( X 2, Y 0) olasılığı, P ( X 2, Y 0) P ( w : X ( w) 2, Y ( w) 0}) P ({(1,1)}) 1/ 36 olarak hesaplanır. Benzer şekilde, P ( X 5, Y 3) olasılığı için {w : X ( w) 5} {(1, 4), (2, 3), (3, 2), (4,1)} ve {w : Y ( w) 3} {(1, 4), (2,5), (3, 6), (4,1) , (5, 2) , (6,3)} olup arakesit kümesi, {w : X ( w) 5, Y ( w) 3} {(1, 4), (4,1)} dir. Buradan, P ( X 5, Y 3) olasılığının değeri P ( X 5, Y 3) P ({w : X ( w) 5, Y ( w) 3}) P({(1, 4), (4,1)}) 2 / 36 dır. Diğer olasılıklar benzer şekilde hesaplanarak aşağıda tablo halinde verilmiştir. 76 MATEMATİKSEL İSTATİSTİĞE GİRİŞ X Y 2 3 4 5 6 7 8 9 10 11 12 P (Y y ) 0 1 36 0 1 36 0 1 36 0 1 36 0 1 36 0 1 36 1 0 2 36 0 2 36 0 2 36 0 2 36 0 2 36 0 2 0 0 2 36 0 2 36 0 2 36 0 2 36 0 0 3 0 0 0 2 36 0 2 36 0 2 36 0 0 0 4 0 0 0 0 2 36 0 2 36 0 0 0 0 6 36 10 36 8 36 6 36 4 36 5 0 0 0 0 0 0 0 0 0 0 P ( X x) 1 36 2 36 3 36 4 36 5 36 5 36 4 36 3 36 2 36 1 36 2 36 6 36 2 36 1 X ve Y nin ortak olasılık fonksiyonundan, marjinal olasılık fonksiyonları da P( X x) P( X x, Y y ) , x DX yDY ve P(Y y ) P( X x, Y y ) , y DY xDX formülleri kullanılarak X x P ( X x) 2 1 36 3 2 36 Yy P (Y y ) 4 3 36 0 6 36 5 4 36 6 5 36 1 10 36 7 6 36 2 8 36 8 5 36 3 6 36 9 4 36 10 3 36 4 4 36 11 2 36 12 1 36 5 2 36 şeklinde bulunmuştur. Koşullu olasılık fonksiyonları da koşullu olasılık fonksiyonunun tanımı kullanılarak hesaplanır. Örneğin, X 5 verildiğinde Y nin koşullu olasılık fonksiyonu y DY için P (Y y | X 5) olasılıkları hesaplanarak bulunur. Bu koşullu olasılıklar RASGELE DEĞİŞKENLER VE DAĞILIMLARI 77 P( X 5, Y 0) 0 0 P( X 5) 4 / 36 P( X 5, Y 1) 2 / 36 1 1| X 5) P( X 5) 4 / 36 2 P( X 5, Y 2) 0 2 | X 5) 0 P( X 5) 4 / 36 P( X 5, Y 3) 2 / 36 1 3 | X 5) P ( X 5) 4 / 36 2 P( X 5, Y 4) 0 4 | X 5) 0 P( X 5) 4 / 36 P( X 5, Y 5) 0 5 | X 5) 0 P( X 5) 4 / 36 P(Y 0 | X 5) P(Y P(Y P(Y P(Y P(Y şeklinde hesaplanmış olup koşullu olasılık fonksiyonu, Yy P (Y y | X 5) 0 0 1 0.5 3 0.5 2 0 4 0 5 0 olarak elde edilmiştir. P ( X x, Y y ) P ( X x) P (Y y ) olduğundan X ve Y bağımsız değildir. b) X ve Y rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu, e y f ( x, y ) 0 , 0x y , d . y. olarak verilmiş olsun (Casella ve Berger, 2002, sayfa 150). X ve Y nin marjinal olasılık yoğunluk fonksiyonları, f X ( x) fY ( y ) f ( x, y ) dy e y dy e y f ( x, y ) dx e y dx e y x yDY xDX yx y x 0 yx e x y x 0 ye y integrallerinden e x f X ( x) 0 , x0 , d . y. ve y e y fY ( y ) 0 şeklinde bulunmuştur. Buradan da e y f ( x, y ) f X ( x) fY ( y ) (e x )( y e y ) , y0 , d . y. 78 MATEMATİKSEL İSTATİSTİĞE GİRİŞ olduğundan X ve Y bağımsız değildir. Koşullu olasılık yoğunluk fonksiyonları da yine kesikli rasgele değişkenlerde olduğu gibi bulunur. Y y verildiğinde X in koşullu olasılık yoğunluk fonksiyonu f X |Y y ( x | y ) f ( x, y ) e y 1 y fY ( y ) y e y eşitliğinden, 1 f X |Y y ( x | y ) y 0 şeklinde bulunmuştur. , 0 x y , d . y. c) X ve Y rasgele değişkenlerinin ortak olasılık fonksiyonu, c y e x y f ( x, y ) 0 , x 0, y 1, 2,3 , d . y. olarak verilmiş olsun. Önce, fonksiyonun bir olasılık fonksiyonu olabilmesi için c sabitinin değeri bulunmalıdır. f ( x, y ) bir olasılık fonksiyonu olduğundan toplam olasılık 1 olmalıdır. Yani, 3 3 1 f ( x, y ) dx c y e x y dx c e x 2 e 2 x 3 e3 x dx 3 c x 0 y 1 x 0 y 1 x 0 eşitliğinden c 1/ 3 bulunur. Yani X ve Y nin ortak olasılık fonksiyonu, 1 x y ye f ( x, y ) 3 0 , x 0 , y 1, 2, 3 , d . y. şeklindedir. Marjinal olasılık fonksiyonları için, 3 y 1 3 1 x y 1 x ye e 2 e 2 x 3 e3 x 3 y 1 3 f ( x, y ) ve xDX y 1 1 1 f ( x, y ) dx y e x y dx e x y dx e x y 3 x 0 3 x 0 3 x 0 3 integral ve toplamın sonuçlarından marjinal olasılık fonksiyonları sırası ile RASGELE DEĞİŞKENLER VE DAĞILIMLARI 1 x 2 x 3 e 3 x ) , x 0 (e 2 e f X ( x) 3 0 , d . y. 79 1 , y 1, 2, 3 fY ( y ) 3 0 , d . y. , olarak bulunmuştur. d) Aynı marjinal olasılık (veya olasılık yoğunluk) fonksiyonlarını veren farklı ortak olasılık (veya olasılık yoğunluk) fonksiyonları bulunabilir. Örneğin, X1 ( X1 , Y1 ) nin ortak olasılık yoğunluk fonksiyonu, 0 x, y 1 1 , f1 ( x, y ) 0 , diğer yerlerde ve X 2 ( X 2 , Y2 ) rasgele vektörünün ortak olasılık yoğunluk fonksiyonu da, 1 (2 x 1)(2 y 1) , 0 x, y 1 , 0 1 f 2 ( x, y ) 0 , diğer yerlerde şeklinde verildiğinde her iki ortak olasılık yoğunluk fonksiyonu için marjinal olasılık yoğunluk fonksiyonları aynıdır. X1 ( X1 , Y1 ) rasgele vektörünün ortak olasılık yoğunluk fonksiyonundan marjinallerin, 0 x 1 1 , f1, X1 ( x) 0 , diğer yerlerde ve 0 y 1 1 , f1, X 2 ( x) 0 , diğer yerlerde şeklinde olduğu açıktır. Buradan, her x, y için, f1 ( x, y ) f1, X1 ( x) f1,Y1 ( y ) olduğundan X1 ve Y1 bağımsızdır. Şimdi, X 2 ( X 2 , Y2 ) nin ortak olasılık yoğunluk fonksiyonundan 1 1 0 0 f1, X 2 ( x) 1 (2 x 1) (2 y 1) dy 1 ve f1,Y2 ( x) 1 (2 x 1) (2 y 1) d y 1 olduğundan X 2 ve Y2 nin marjinal olasılık yoğunluk fonksiyonları da, 0 x 1 1 , f 2, X 2 ( x) 0 , diğer yerlerde ve 0 y 1 1 , f 2,Y2 ( x) 0 , diğer yerlerde şeklinde olup, yukarıdaki marjinal olasılık yoğunluk fonksiyonları ile aynıdır. Ancak bu rasgele değişkenler f 2 ( x, y ) f 2, X 2 ( x) f 2,Y2 ( y ) olduğundan bağımsız değildir 80 MATEMATİKSEL İSTATİSTİĞE GİRİŞ Örnek 2.4.2 X ve Y rasgele değişkenlerinin ortak dağılım fonksiyonu F ( x, y) olsun (Öztürk, 1993, sayfa 174). a1, b1 , a2 , b2 olmak üzere, P({w : a1 X ( w) a 2 , b1 Y ( w) b 2 }) F (a1, b1 ) F (a 2 , b2 ) F (a1, b2 ) F (a2 , b1 ) dir. Bunu göstermek için, A {w : a1 X ( w) a 2 , b1 Y ( w) b 2 } B {w : X ( w) a1, Y ( w) b 2 } C {w : X ( w) a2 , Y ( w) b1} D {w : X ( w) a2 , Y ( w) b 2 } olaylarını tanımlayalım. Fonksiyonun tanım kümesi Şekil (2.4.1) de verilmiştir. Şekil 2.4.1 Örnek (2.4.2) de aranan olasılık (taralı alan) Şekildeki taralı alan {w : a1 X ( w) a 2 , b1 Y ( w) b 2 } kümesini göstermektedir. Buna göre, B C {w : X ( w) a1 , Y ( w) b1} ve A ( B C ) ve E A ( B C ) küme ilişkileri yazılabilir. Buradan, P( D) F (a2 , b2 ) P({w : X ( w) a2 , Y ( w) b 2 }) P ( A [ B C ]) P ( A) P( B C ) P( A) [ P( B) P(C ) P( B C )] P({w : a1 X ( w) a2 , b1 Y ( w) b 2 }) P ({w : X ( w) a1, Y ( w) b 2 }) P({w : X ( w) a2 , Y ( w) b1}) P ({w : X ( w) a1 , Y ( w) b1}) olup F ( x, y) P ({w : X ( w) x, Y ( w) y}) tanımı da kullanıldığında, F (a2 , b2 ) P({w : X ( w) a2 , Y ( w) b 2 }) , F (a1 , b2 ) P({w : X ( w) a1, Y ( w) b 2 }) F (a2 , b1 ) P({w : X ( w) a2 , Y ( w) b1}) , F (a1 , b1 ) P({w : X ( w) a1, Y ( w) b1}) eşitlikleri yazılır. Buradan da, F (a2 , b2 ) nin değeri RASGELE DEĞİŞKENLER VE DAĞILIMLARI 81 F (a2 , b2 ) P ({w : X ( w) a2 , Y ( w) b 2 }) P ({w : a1 X ( w) a2 , b1 Y ( w) b 2 }) P({w : X ( w) a1, Y ( w) b 2 }) P ({w : X ( w) a2 , Y ( w) b1}) P({w : X ( w) a1, Y ( w) b1}) P ({w : a1 X ( w) a2 , b1 Y ( w) b 2 }) F (a1, b2 ) F (a2 , b1 ) F (a1, b1 ) olarak bulunur. Bu ifadeler birleştirildiğinde aranan eşitlik, P({w : X ( w) a2 , Y ( w) b1}) F (a2 , b2 ) F (a1, b1 ) F (a1, b2 ) F (a2 , b1 ) şeklinde elde edilmiş olur Örnek 2.4.3 {( x, y ) : 1 x 1 , 1 y 1} , () ve A için P ( A) " A nın alanı "/ 4 olmak üzere, (, , P ) bir olasılık uzayıdır. w ( x, y ) olmak üzere, ( X1 , X 2 ) : 2 w ( X1 , X 2 )( w) ( X1 ( w), X 2 ( w)) ( x 2 ,| y |) şeklinde tanımlanan ( X1 , X 2 ) rasgele vektörünün dağılım fonksiyonunu bulalım. ( X1 , X 2 ) nin değer kümesi şekilde de görüldüğü gibi D ( x1, x2 ) :0 x1, x2 1 dir. Şekil 2.4.2 İki boyutlu rasgele değişkenin tanım ve değer kümesi ( X1 ( x) x1 , X 2 ( x) x2 ) Şimdi, ( X1 , X 2 ) nin dağılım fonksiyonunu bulalım. Dağılım fonksiyonu, F : 2 [0,1] ( x1, x2 ) F ( x1, x2 ) P ({w : X1 ( w) x1, X 2 ( w) x2 }) P( X1 x1, X 2 x2 ) şeklindedir. ( x1, x2 ) D için fonksiyonun değeri, 82 MATEMATİKSEL İSTATİSTİĞE GİRİŞ F ( x1, x2 ) P ({w : X1 ( w) x1 , X 2 ( w) x2 }) P ({( x, y ) : x 2 x1,| y | x2 }) P {( x, y ) : x1 x x1 , x2 y | x2 } (2 x2 )(2 x1 x2 x1 4 dir. D1 {( x1, x2 ) : x1 0 , x2 0} olmak üzere ( x1, x2 ) D1 için F ( x1, x2 ) P ({w : X1 ( w) x1, X 2 ( w) x2 }) P ({( x, y ) : x 2 x1,| y | x2 }) P () 0, D2 ( x1 , x2 ) : x1 1 veya x2 1 olmak üzere ( x1, x2 ) D2 için fonksiyonu değeri, F ( x1, x2 ) P ({w : X1 ( w) x1 , X 2 ( w) x2 }) P ({( x, y ) : x 2 x1,| y | x2 }) P () 1 olarak elde edilmiştir. Şimdi D3 {( x1, x2 ) : x1 1 ve 0 x2 1} kümesini tanımlayalım. ( x1, x2 ) D3 için fonksiyonun değeri yandaki taralı bölgenin alanının dörtle biridir. Yani, F ( x1, x2 ) P {w : X1 ( w) x1 , X 2 ( w) x2 } P {( x, y ) : 0 x 1, x2 y x2 } (2 x2 ) / 4 x2 / 2 dir. Son olarak D4 ( x1 , x2 ) : 0 x1 1 ve x2 1 olmak üzere ( x1, x2 ) D3 için F ( x1 , x2 ) de şekilde gösterilen dikdörtgenin alanının dörtte biridir. Yani, F ( x1 , x2 ) P {w : X1 ( w) x1 , X 2 ( w) x2 } P {( x, y ) : x 2 x1, 0 y 1} P {( x, y ) : x1 x x1 , 0 y 1} 2 x1 x 1 4 2 RASGELE DEĞİŞKENLER VE DAĞILIMLARI 83 dir. Buna göre, ( X1 , X 2 ) rasgele vektörünün dağılım fonksiyonu F : 2 [0,1] 0 x2 x1 ( x1, x2 ) F ( x1, x2 ) x2 / 2 x1 / 2 1 , x1 0 veya x2 0 , 0 x1 1, 0 x2 1 , x1 1, 0 x2 1 , 0 x1 1, x2 1 , x1 1, x2 1 Şekil 2.4.3 Örnek (2.4.3) de verilen iki değişkenli dağılım fonksiyonu şeklinde olup ortak olasılık yoğunluk fonksiyonu, 1 2 F ( x1, x2 ) f ( x1 , x2 ) 2 x1 x1 x2 0 , 0 x1 1, 0 x2 1 , diğer yerlerde şeklinde elde edilir 2.5. Beklenen Değer Bu kısımda, kitlenin önemli özelliklerinden rasgele değişkenlerin momentleri üzerinde durulacaktır. X bir rasgele değişken g de tanım kümesi reel sayılar olan herhangi bir fonksiyon olmak üzere g ( X ) de bir rasgele değişkendir. X in olasılık veya olasılık yoğunluk fonksiyonu verildiğinde g ( X ) in de olasılık veya olasılık yoğunluk fonksiyonu da bulunabilir. Rasgele değişkenlerin dönüşümlerinin dağılımlarının bulunması bir sonraki bölümde incelenecektir. Bu kısımda, X in olasılık veya olasılık yoğunluk fonksiyonu 84 MATEMATİKSEL İSTATİSTİĞE GİRİŞ verildiğinde rasgele değişkenin momentleri üzerinde durulacaktır. Ayrıca, momentler ile ilgili bazı kavramlar da kısaca ele alınacaktır. Tanım 2.5.1 Değer kümesi DX olan X rasgele değişkenin olasılık veya olasılık yoğunluk fonksiyonu f ( x) olsun. g ( X ) rasgele değişkeninin beklenen değeri | g ( x )| f ( x) dx , D X | g ( x )| f ( x) , DX g ( x) f ( x) dx , X sürekli ise E ( g ( X )) DX X kesikli g ( x) f ( x) , X kesikli DX X sürekli dir Rasgele değişkenin beklenen değeri her zaman olmayabilir. Yani, g ( x) f ( x) dx DX g ( x) f ( x) değerleri sonlu olsa bile, | g ( x)| f ( x) dx (veya | g ( x)| f ( x) ) veya DX DX DX integrali (veya toplamı) sonlu olmayabilir. Böyle durumlarda rasgele değişkenin beklenen değeri yoktur diyeceğiz. Şimdi, bunu bir örnek üzerinde görelim. Örnek 2.5.1 X rasgele değişkeninin olasılık fonksiyonu, P( X x) 1/ 2 x , x 1, 2,3,... olarak verilmiş olsun (Öztürk, 1993, sayfa 241). g ( x) (1) x 2 x / x alındığında DX 2x 1 ( 1) x g ( x) f ( x) (1) x ln(2) x 2 x x 1 x x 1 olmasına rağmen, DX | g ( x)| f ( x) (1) x x 1 2x 1 1 x x 2 x1 x olduğundan g ( X ) rasgele değişkeninin beklenen değeri yoktur X herhangi bir rasgele değişken ve x0 olsun. Eğer her x için P( X x0 x) P( X x0 x) ise X rasgele değişkeni x0 noktasına göre simetriktir denir. Herhangi bir X rasgele değişkeni c noktasına göre simetrik ise, E ( X ) c dir (Biswal, sayfa 64). RASGELE DEĞİŞKENLER VE DAĞILIMLARI 85 Tanım 2.5.2 X rasgele değişkeninin olasılık veya olasılık yoğunluk fonksiyonu f ( x) ve her k için E ( X k ) var olsun. E ( X k ) değerine X rasgele değişkeninin k . momenti denir ve k ile gösterilir. Ayrıca, a) k 1 için E ( X ) değerine X in beklenen değeri denir ve ile gösterilir. b) E ( X ) k değerine X in ye göre k . merkezi momenti denir ve mk ile gösterilir. c) m2 E ( X ) 2 değerine X in varyansı denir ve Var ( X ) veya 2 ile gösterilir. d) E ( X ( X 1)( X 2)...( X ( k 1))) değerine X in k . çarpımsal momenti denir Var ( X ) 2 12 olup X rasgele değişkeninin varyansının pozitif kareköküne X in standart sapması denir. X in varyansı 2 ise standart sapması ( 0) dır. Örnek 2.5.2 X rasgele değişkeninin olasılık fonksiyonu 0 için, P( X x) e x / x ! , x 0,1, 2,3,... şeklinde verilmiş olsun. Bu rasgele değişkenin beklenen değeri x 11 e x E ( X ) x P( X x) x P( X x) x e x! x 0 x 1 x 1 x 1 ( x 1)! x 1 e x 1 ( x 1)! y y 0 y! e e e dir. Yani, E ( X ) dir. İkinci moment ise ( y x 2 denirse), 2 E ( X 2 ) x 2 P( X x) ( x x( x 1)) x x 0 e x 0 x x! e x ( x 1) x 0 x 2 2 x 2 ( x 2)! e x 0 x x! E ( X ) x ( x 1) x2 2 e 2 e e 2 e x x! x2 x 2 ( x 2)! e x x! y y 0 y! 2e 86 MATEMATİKSEL İSTATİSTİĞE GİRİŞ şeklinde bulunmuştur. Rasgele değişkenin bu iki momentinden X in varyansı da Var ( X ) 2 12 ( 2 ) 2 olarak bulunmuştur Tanım 2.5.3 X rasgele değişkeninin olasılık veya olasılık yoğunluk fonksiyonu f ( x) ve E ( g ( X )) var olsun. a) t ve g ( x) et x için E (et X ) fonksiyonuna, X in moment çıkaran fonksiyonu denir ve M X (t ) ile gösterilir. b) i 1 olmak üzere, t ve g ( x) eit x için E (eit X ) fonksiyonuna, X in karekteristik fonksiyonu denir ve X (t ) ile gösterilir. c) t ve g ( x) t x için E (t X ) fonksiyonuna, X in çarpımsal moment üreten fonksiyonu denir ve N X (t ) ile gösterilir Bu fonksiyonlar kullanılarak da rasgele değişkenlerin momentleri hesaplanabilir. Örneğin, X in moment çıkaran fonksiyonu M X (t ) varsa, X in momentleri k E ( X k ) dk dt k M X (t ) t 0 şekilde moment çıkaran fonksiyonunun türevinden hesaplanır. Türev ile beklenen değer operatörlerinin yer değiştirebildiği varsayımı altında, moment çıkaran fonksiyonunun k . türevi, dk dt k M X (t ) dk dt k E e tX d k tX E k e dt k tX E X e olup, türevde t 0 yazıldığında rasgele değişkenin k . momentinin dk dt k E X k etX M X (t ) t 0 t 0 E ( X k ) k olduğu görülür. Örnek 2.5.3 a) X rasgele değişkeninin olasılık fonksiyonu 0 için P( X x) e x / x ! , x 0,1, 2,3,... RASGELE DEĞİŞKENLER VE DAĞILIMLARI 87 olarak verilmiş olsun. Bu rasgele değişkenin ilk iki momenti Örnek (2.5.2) de E ( X ) ve E ( X 2 ) 2 olarak hesaplanmıştı. Bu rasgele değişkenin moment çıkaran fonksiyonu ( e x fonksiyonunun Taylor serisi açılımı kullanılarak), M X (t ) E (et X ) t t e x ( et ) x e e e e e ( e 1) x! x! x 0 et x x 0 olup rasgele değişkenin birinci momenti, 1 E ( X ) d M X (t ) dt t 0 d (et 1) e dt t et e (e 1) t 0 t 0 ve ikinci momenti, 2 E ( X 2 ) d 2 M X (t ) d t2 t 0 d2 d t2 t e ( e 1) t t et e ( e 1) 2 e 2 t e ( e 1) t 0 t 0 t d et e ( e 1) dt t 0 2 şeklinde hesaplanabilir. Bu moment çıkaran fonksiyonu kullanılarak, rasgele değişkenin diğer tüm momentleri, k ler için k 1 k d k d şeklinde ardışık olarak bulunabilir. Şimdi, bu bağıntının doğru olduğunu görelim. Bunun için matematiksel tümevarım yöntemi kullanılabilir. Önce, k 1 için eşitliğin sol tarafı 2 E ( X 2 ) 2 dir. Eşitliğin sağ tarafı ise, 1 d 1 d 2 ( 1) d d olup bağıntı k 1 için geçerlidir. Matematiksel tümevarım gereği, eşitliğin k için doğru olduğunu varsayarak k 1 için doğru olduğunu gösterelim. Eşitlik k için doğru ise, moment çıkaran fonksiyonunun türevinde t 0 yazılarak momentlerin elde edildiğini de göz önüne alarak k 1 (t ) k (t ) d k (t ) d 88 MATEMATİKSEL İSTATİSTİĞE GİRİŞ yazalım. Buradan, k 1 için eşitliğin sol tarafı k 2 (t ) d k 2 d t k 2 M X (t ) d d (t ) d d k 1 d k 1 M X (t ) k 1 (t ) k (t ) k dt d t dt d dt d k (t ) d d k (t ) d d k (t ) d k (t ) k 1 (t ) k 1 (t ) dt d d dt d dt şeklinde yazılır. Burada t 0 yazıldığında eşitlik k 1 için, d k 2 k 1 k 1 d olup iddia k 1 için de doğrudur. Yani, iddia her k için doğrudur. b) Negatif değerler almayan kesikli bir X rasgele değişkeninin beklenen değeri varsa, bu beklenen değerin E( X ) P ( X n) n 0 şeklinde hesaplanabileceğini görelim. Sağ taraftaki serinin açık olarak yazılması ile P( X n) P( X 0) P( X 1) P( X 2) P( X 3) ... n 0 P( X 1) P( X 2) P( X 3) P( X 4) ... P( X 2) P( X 3) P ( X 4) P( X 5) ... P( X 3) P( X 4) P( X 5) ... ......... 1 P ( X 1) 2 P ( X 2) 3P ( X 3) 4 P ( X 4) ... x P( X x) x 1 x P( X x) E ( X ) x 0 şeklinde aranan eşitlik elde edilir. Negatif olmayan değerler alan sürekli bir X rasgele değişkeninin dağılım fonksiyonu F ( x) olsun. X rasgele değişkenin beklenen değeri varsa, E ( X ) (1 F ( x)) d x 0 dir (Öztürk, 1993) RASGELE DEĞİŞKENLER VE DAĞILIMLARI 89 Bir rasgele değişkenin varyansı, ortalamadan (beklenen değer) sapmasının karesinin beklenen değeridir. Tanım (2.5.2) de bir rasgele değişkenin varyansı Var ( X ) E ( X )2 olarak tanımlandı.Bu varyans genellikle Var ( X ) E ( X 2 ) ( E ( X ))2 hesaplanır. Yani, 2 Var ( X ) 2 12 E ( X 2 ) E ( X ) E ( X ) 2 dir. a, b olmak üzere g ( x) a x b fonksiyonunu tanımlayalım. Buradan kesikli g ( X ) rasgele değişkeninin beklenen değeri (sürekli durumda toplam sembolleri yerine integraller gelir), E ( g ( X )) E (a X b) (a x b) P( X x) xDX a x P ( X x ) b P ( X x) a E ( X ) b xDX xDX ve 2 Var ( g ( X )) Var (a X b) E (a X b) E (aX b E aX b aE ( X ) b 2 2 E a ( X ) a 2 E ( X )2 a 2Var ( X ) dir. Yani bir rasgele değişkenin lineer birleşiminin beklenen değer ve varyansı a, b olmak üzere, E (aX b) aE ( X ) b ve Var ( aX b) a 2Var ( X ) dir. Buraya kadar bir boyutlu rasgele değişkenlerin beklenen değeri incelendi. Şimdi, bileşenleri X ve Y olan iki boyutlu rasgele vektörün ortak olasılık veya olasılık yoğunluk fonksiyonu f ( x, y ) olsun. Marjinal olasılık fonksiyonlarından E ( X ), E (Y ), Var ( X ) ve Var (Y ) değerleri hesaplanabilir. Ayrıca, X ve Y aynı örnek uzay üzerinde tanımlı rasgele değişkenler, g de 2 den ye tanımlı bir fonksiyon olmak üzere g ( X , Y ) tek boyutlu bir rasgele değişkendir. Buna göre E ( g ( X , Y )) beklenen değeri varsa, bu beklenen değer g ( x, y ) f ( x, y ) dy dx , xD yD X Y E ( g ( X , Y )) g ( x, y ) P ( X x, Y y ) , xDX yDY X sürekli X kesikli şeklinde hesaplanır. Tanım 2.5.4 Bileşenleri X ve Y olan iki boyutlu bir rasgele vektörün ortak olasılık veya olasılık yoğunluk fonksiyonu f ( x, y ) olsun. 90 MATEMATİKSEL İSTATİSTİĞE GİRİŞ a) X ile Y arasındaki kovaryans Cov( X , Y ) E[( X E ( X ))(Y E (Y )] , b) X ile Y arasındaki korelasyon ise, Cov( X , Y ) , Var ( X ) Var (Y ) X ,Y c) Bileşenleri X ve Y olan iki boyutlu bir rasgele vektör X olmak üzere, X rasgele vektörün beklenen değer vektörü ile varyans kovaryans matrisi sırası ile, E ( X ) E (Y ) Cov( X , Y ) Var ( X ) V Cov( X , Y ) Var (Y ) , dir X ile Y arasındaki kovaryans genellikle Cov( X , Y ) E ( XY ) E ( X ) E (Y ) şeklinde hesaplanır. Örnek 2.5.4 a) Bileşenleri X ve Y olan iki boyutlu bir rasgele vektörün ortak olasılık yoğunluk fonksiyonu e y f ( x, y ) 0 , 0x y , d . y. olsun. X ve Y nin marjinal olasılık yoğunluk fonksiyonları, e x f X ( x) 0 , x0 , d . y. y e y fY ( y ) 0 ve , y0 , d . y. dir (Örnek (2.4.1b)). Marjinal olasılık yoğunluk fonksiyonlarından E ( X ) 1 , Var ( X ) 1 , E (Y ) 2 , Var (Y ) 2 elde edilir. Ayrıca, y E ( XY ) x y e y dx dy y 0 x 0 ye y 0 y 0 y y y e y dx dy x 0 y2 1 (4) 3! 3 y 3 dy y e dy 2 2 2 2 y 0 olup X ile Y arasındaki korelasyon X ,Y Cov( X , Y ) E ( XY ) E ( X ) E (Y ) 3 (1) (2) 1 Var ( X ) Var (Y ) Var ( X ) Var (Y ) (1) (2) 2 olarak hesaplanmıştır. RASGELE DEĞİŞKENLER VE DAĞILIMLARI 91 b) X ile Y nin ortak olasılık yoğunluk fonksiyonu, 1 , 0 x 1, x y x 1 f ( x, y ) d . y. 0 , olarak verilmiş olsun (Casella ve Berger, 2002, sayfa 170). DX [0,1] ve DY [0, 2] olmak üzere marjinal olasılık yoğunluk fonksiyonları, , 0 y 1 y ve fY ( y ) 2 y , 1 y 2 0 , d . y. dir. Burada, X rasgele değişkeninin marjinal olasılık yoğunluk fonksiyonu, 1 , 0 x 1 f X ( x) 0 , d . y. x 1 f X ( x) dy 1 y x ve Y nin marjinal olasılık yoğunluk fonksiyonu da, 0 y 1 için fY ( y ) y 1 x 0 x y 1 dx y ve 1 y 2 için fY ( y ) dx 2 y olarak hesaplanmıştır. Marjinal olasılık yoğunluk fonksiyonlarından, X ve Y nin beklenen değer ve varyansı E ( X ) 1/ 2 , Var ( X ) 1/12 , E (Y ) 1 ve Var (Y ) 1/ 6 dır. Diğer taraftan, 1 x 1 E( X Y ) x 0 y x 1 x y dy dx 2 1 x 0 x ( x 1) 2 x 2 dx 7 12 olup, X ile Y arasındaki korelasyon X ,Y 7 1 7 6 (1) Cov( X , Y ) E ( XY ) E ( X ) E (Y ) 12 2 12 12 1 Var ( X ) Var (Y ) Var ( X ) Var (Y ) 1 1 1 1 2 12 6 12 6 dir. c) (, , P ) bir olasılık uzayı olsun. A, B için P ( A) 0.5, P ( B | A) 0.4 ve P ( A B ) 0.8 olmak üzere, X ve Y rasgele değişkenleri 92 MATEMATİKSEL İSTATİSTİĞE GİRİŞ X : Y : 1 , w A w X ( w) 0 , w A 1 , w B w Y ( w) 0 , w B şeklinde tanımlansın. Her iki rasgele değişkenin değer kümesi aynıdır ( DX DY {0,1} ). Buna göre, X in olasılık fonksiyonu, P ( X 1) P ( A) 0.5 ve P( X 0) P( Ac ) 1 0.5 0.5 den, P( X x) (0.5) x (0.5)1 x , x 0,1 şeklinde yazılabilir. Y nin olasılık fonksiyonu için P ( A B ) P ( A) P ( B | A) (0.5) (0.4) 0.2 olduğundan B olayının olasılığı, P ( B ) P ( A B ) P ( A) P ( A B ) 0.8 0.5 0.2 0.5 şeklinde olup, Y nin olasılık fonksiyonu da aynıdır. Yani, P (Y 1) P ( B ) 0.5 ve P(Y 0) P( B c ) 1 0.5 0.5 olasılıklarının hesabından, Y nin olasılık fonksiyonu P(Y y ) (0.5) y (0.5)1 y , y 0,1 şeklinde bulunur. Yani, X ve Y nin olasılık fonksiyonları aynıdır. Ayrıca, P( X 0, Y 0) P( Ac B c ) 1 P( A B) 1 0.8 0.2 P( X 0, Y 1) P( Ac B) P( B) P( A B) 0.5 0.2 0.3 P( X 1, Y 0) P( A B c ) P( A) P( A B) 0.5 0.2 0.3 P ( X 1, Y 1) P ( A B ) 0.2 olasılıklarından ortak olasılık fonksiyonu da, Y/X 0 1 0 0.2 0.3 1 0.3 0.2 RASGELE DEĞİŞKENLER VE DAĞILIMLARI 93 şeklinde bulunmuştur. Buradan, E ( XY ) 1 1 x y P( X x, Y y) P( X 1, Y 1) 0.2 x 0 y 0 olup X ile Y arasındaki korelasyon Cov( X , Y ) E ( XY ) E ( X ) E (Y ) 0.2 (0.5) (0.5) 0.05 1 0.25 5 Var ( X ) Var (Y ) Var ( X ) Var (Y ) (0.25)(0.25) X ,Y dir. X ve Y aynı olasılık fonksiyonlarına sahiptir ancak bağımsız değildir Tanım 2.5.5 Herhangi bir X rasgele değişkeninin beklenen değeri varyansı 2 , dağılım fonksiyonu da F ( x) olsun. Buna göre, a) (Medyan) X in medyanı P( X M ) 1 ve 2 P( X M ) 1 2 özelliğini sağlayan M sayısı, b) Varyasyon katsayısı (Coefficient of Variation): V / , c) Çarpıklık (skewness) katsayısı : E ( X )3 / 3 , d) Basıklık (kürtosis) katsayısı : ( E ( X )4 / 4 ) 3 dür Örnek 2.5.5 X rasgele değişkeninin olasılık fonksiyonu 0 için P( X x) e x / x ! , x 0,1, 2,3,... olarak verilsin. Moment çıkaran fonksiyonu yardımı ile ilk üç moment ve merkezi momentler, E ( X ) , E ( X 2 ) 2 , E ( X )2 , E ( X )3 , E ( X ) 4 3 2 E ( X 3 ) 3 3 2 ve Var ( X ) olarak hesaplanmıştır. Buradan da çarpıklık ve basıklık katsayıları sırası ile, E ( X )3 3 3/2 1 94 MATEMATİKSEL İSTATİSTİĞE GİRİŞ E ( X )4 4 3 3 2 1 3 2 dır Çok değişkenli dağılım fonksiyonlarından (Kısım (2.4)) koşullu olasılık fonksiyonları ve buradan da koşullu beklenen değer bulunabilir. Örneğin, X1, , X k ve Y rasgele değişkenlerinin ortak olasılık veya olasılık yoğunluk fonksiyonu f ( x1, , xk , y ) olsun. X1 x1, , X k xk verildiğinde Y rasgele değişkeninin koşullu olasılık veya olasılık yoğunluk fonksiyonu f ( y | x1, , xk ) olup X1 x1, X 2 x2 , , X k xk verildiğinde Y nin koşullu beklenen değeri E (Y | X1 x1, X 2 x2 ,, X k xk ) yDY y f ( y | x1,, xk ) d y dir ( Y kesikli ise formülde integral yerine toplam sembolü gelir). Bu koşullu beklenen değer x1 , , xk nin bir fonksiyonudur. Yani, E (Y | X1 x1, , X k xk ) h( x1 , , xk ) dir. Bir değişkenin diğer değişkenler üzerine regresyonu (burada Y nin X1, , X k ler üzerine regresyonu) bu koşullu beklenen değerdir. Regresyon konusu kitabın son bölümünde ayrıntılı olarak incelenecektir. Buradaki h( x1, , xk ) fonksiyonu x1 , , xk lerin lineer birleşimi ise regresyon, linner regresyon denklemi, değilse lineer olmayan regresyon denklemi adını alır. Koşullu beklenen değer E (Y | X1 x 1 ) h( x1 ) ve h( x1 ) a b x1 şeklinde ise regresyona basit doğrusal regresyon denir. Teorem 2.5.1 X ve Y rasgele değişkenlerinin ortak olasılık veya olasılık yoğunluk fonksiyonu f ( x, y ) olmak üzere, E ( E ( X | Y )) E ( X ) dir. ve Var ( X ) E (Var ( X |Y )) Var ( E ( X | Y )) RASGELE DEĞİŞKENLER VE DAĞILIMLARI 95 İspat: İspatı sürekli durum için yapalım (kesikli durumda integraller yerine toplamlar gelir). X ve Y nin ortak olasılık yoğunluk fonksiyonu f ( x, y ) ise, Y y verildiğinde X in koşullu olasılık yoğunluk fonksiyonu f ( x | y) olsun. Buradan koşullu beklenen değer, E E ( X | Y ) E X | Y y fY ( y ) dy x f ( x | y )dx fY ( y ) dy yDY yDY xDX f ( x, y ) x f ( x | y ) fY ( y )dy dx x fY ( y )dy dx f ( y) xDX yDY xDX yDY Y x f ( x, y )dy dx x f X ( x)dx E ( X ) xDX yDY xDX şeklinde bulunur. Varyansın tanımından, X in varyansı Var ( X ) E ([ X E ( X )]2 ) E ([ X E ( X | Y ) E ( X | Y ) E ( X )]2 ) E ([ X E ( X | Y )]2 ) E ([ E ( X | Y ) E ( X )]2 ) 2 E ([ X E ( X | Y )])[ E ( X | Y ) E ( X )] olarak yazılabilir. Bu ifadedeki son terim sıfırdır. Bunu görebilmek için, E X E ( X | Y ) E ( X | Y ) E ( X ) E E X E ( X | Y ) E ( X | Y ) E ( X ) eşitliğini yazalım. Koşullu dağılımdaki X | Y ve X rasgele değişkenler olup E ( X | Y ) ve E ( X ) sabittir. Dolayısı ile, E E X E ( X | Y ) E ( X | Y ) E ( X ) E ( X | Y ) E ( X ) E X E ( X | Y ) | Y E ( X | Y ) E ( X ) E ( X | Y ) E ( X | Y ) E ( X | Y ) E ( X ) .0 0 elde edilir. Buradan, E ( X E ( X | Y ))[ E ( X | Y ) E ( X )] E (0) 0 olup E ([ X E ( X | Y )]2 ) E ( E{[ X E ( X |Y )]2 | Y }) E (Var ( X |Y )) ve E ([ E ( X |Y ) E ( X )]2 ) Var ( E ( X |Y )) olduğundan, 96 MATEMATİKSEL İSTATİSTİĞE GİRİŞ Var ( X ) E ([ X E ( X | Y )]2 ) E ([ E ( X | Y ) E ( X )]2 ) E (Var ( X | Y )) Var ( E ( X | Y )) şeklinde aranan eşitlik elde edilir Teorem 2.5.2 X ve Y herhangi iki rasgele değişken, g de tanım kümesi reel sayılar olan herhangi bir fonksiyon olmak üzere, min E ([Y g ( X )]2 ) E ([Y E (Y | X )]2 ) g ( x) dir. İspat: Kolayca görüleceği gibi, E ([Y g ( X )]2 ) E ([Y E (Y | X ) E (Y | X ) g ( X )]2 ) E ([Y E (Y | X )]2 ) E ([ E (Y | X ) g ( X )]2 ) 2 E [Y E (Y | X )] [ E (Y | X ) g ( X )] olup son terim sıfırdır. Dolayısı ile, E ([Y g ( X )]2 ) E ([Y E (Y | X )]2 ) E ([ E (Y | X ) g ( X )]2 ) E ([Y E (Y | X )]2 ) olup g ( X ) E (Y | X ) olduğunda eşitlik sağlanır Örnek 2.5.6 a) X ve Y rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu, e y f ( x, y ) 0 , 0x y , d . y. olsun. X x verildiğinde, Y nin koşullu olasılık yoğunluk fonksiyonu, e ( y x ) f ( y | x) 0 , yx , d . y. şeklinde olup Y nin koşullu beklenen değeri, E (Y | X x) y x e x e y ye y dir. y f ( y | x) dy ye ( y x) yx dy e x y e y dy y x x x x x 1 e e xe y x RASGELE DEĞİŞKENLER VE DAĞILIMLARI 97 b) X ve Y nin ortak olasılık fonksiyonu x 0,1, 2,..., n , y 0,1, 2,..., n ve x y n için, n x y n x y f ( x, y ) 1 2 (1 1 2 ) x , y , n x y olarak verilmiş olsun. Burada, n n! x, y, n x y x ! y !(n x y )! dir. X rasgele değişkeninin marjinal olasılık fonksiyonu x 0, 1, 2, , n için, f X ( x) n x y 0 n n! f ( x, y ) 1x (1 1 )n x 1x (1 1 )n x x ! n x ! x olup X x verildiğinde Y nin koşullu olasılık fonksiyonu da f ( x, y ) n x 2 f ( y | x) f X ( x) y 1 1 y 11 2 11 n x y , y 0,1, 2,..., n x olarak bulunur. Buradan, X x verildiğinde Y nin koşullu beklenen değeri E (Y | X x) n x n x y 0 y 0 y f ( y | x) y P(Y y | X x) n x 2 y y 1 1 y 0 n x y 11 2 11 n x y ( n x) 2 1 1 n 2 2 11 11 x x olur. Burada, n 2 / (1 1 ) ve 2 / (1 1 ) dir. c) X ve Y kesikli iki rasgele değişken ve ortak olasılık fonksiyonları h( x, y ) olsun. E (Y | X x) a b x ise a ve b değerlerini bulmak isteyelim. X ve Y kesikli rasgele değişkenlerinin marjinal olasılık fonksiyonları f ( x) ve g ( y ) olmak üzere, X x verildiğinde Y nin koşullu beklenen değeri E (Y | X x) yDY dir. Başka bir ifade ile, y h( y | x ) yDY h ( x, y ) y a b x f ( x) 98 MATEMATİKSEL İSTATİSTİĞE GİRİŞ y h ( x , y ) ( a b x) f ( x ) yDY dir. Diğer taraftan, E (Y ) yDY y h( x, y ) yDY xD X a b x f ( x) a b E ( X ) y g ( y) xD X y h( x, y ) yD Y xD X dir. Benzer şekilde X ile Y arasındaki korelasyon olmak üzere, Var ( X )Var (Y ) E ( X ) E (Y ) E ( XY ) xDX ( x y) h( x, y) x y h( x, y) yD xD yD Y X Y x a b x f ( x) (ax b x ) f ( x) a E ( X ) b E ( X ) 2 xDX 2 xDX a E ( X ) b (Var ( X ) [ E ( X )]2 ) eşitliği yazılabilir. Bu iki eşitlik, E (Y ) a b E ( X ) ve Var ( X ) Var (Y ) E ( X ) E (Y ) a E ( X ) b Var ( X ) E ( X )2 şeklinde yazıldığında iki bilinmeyenli iki denklemin çözümünden, Var (Y ) Var (Y ) a E (Y ) E ( X ) ve b Var ( X Var ( X bulunur Teorem 2.5.3 X ve Y herhangi iki rasgele değişken ve a, b olsun. Buna göre, a) E (aX bY ) a E ( X ) b E (Y ) b) Var ( aX bY ) a 2Var ( X ) b2Var (Y ) 2 a b Cov( X , Y ) dir. İspat:Kesikli durumu göz önüne alalım (sürekli durumda toplam yerine integral gelir). a) Beklenen değerin tanımından aranan eşitlik RASGELE DEĞİŞKENLER VE DAĞILIMLARI E (aX bY ) 99 ( a x b y ) P ( X x, Y y ) xDX yDY a x P ( X x, Y y ) b xDX yDY y P ( X x, Y y ) xDX yDY a xP( X x) b y P(Y y ) xDX yDY a E ( X ) b E (Y ) şeklinde gösterilmiş olur. Bu da Teoremin (a) kısmını tamamlar. b) Varyansın tanımında E (aX bY ) in yukarıdaki değeri yerine konursa, Var (aX bY ) E [(aX bY ) E ( aX bY )]2 E [ a( X E ( X )) b(Y E (Y ))]2 a 2 E ([ X E ( X )]2 ) b 2 E ([Y E (Y )]2 ) 2 a b E ([ X E ( X )][Y E (Y )]) a 2 Var ( X ) b 2 Var (Y ) 2 a b Cov( X , Y ) şeklinde aranan sonuç elde edilir 2.6. Üretici Fonksiyonlar Bu kısımda, rasgele değişkenlerin beklenen değerine bağlı bazı üretici fonksiyonlar ve bunların kullanıldığı yerler üzerinde durulacaktır. Bunlardan, moment çıkaran fonksiyonu ile karekteristik fonksiyon bir önceki kısımda tanımlanmıştı. 1. Moment Çıkaran Fonksiyonu: Bu fonksiyonun tanımı bir önceki kısımda (Tanım(2.5.3a)) verildi. X in moment çıkaran fonksiyonu, t için M X (t ) E (et X ) dir. Moment çıkaran fonksiyonu yardımı ile var olması halinde herhangi bir rasgele değişkenin bütün momentlerinin hesaplanabileceğini biliyoruz. Ayrıca, rasgele değişkenin bütün momentleri biliniyorsa, rasgele değişkenin olasılık veya olasılık yoğunluk fonksiyonuna ihtiyaç duyulmadan moment çıkaran fonksiyonu da bulunabilir. M X (t ) E (et X ) olduğundan beklenen değer ile sonsuz toplamın yer değiştirebildiği varsayımı altında, et X fonksiyonunun Taylor serisi açılımından moment çıkaran fonksiyonu, ( X t )k M X (t ) E et X E k 0 k ! tk k E ( X ) k 0 k ! 100 MATEMATİKSEL İSTATİSTİĞE GİRİŞ şeklinde de ifade edilebilir. Yani, rasgele değişkenin bütün momentleri ile moment çıkaran fonksiyonu arasında bir ilişki de vardır. Ancak, buradaki geçişin yapılabilmesi için sonsuz toplam ile beklenen değer operatörünün yer değiştirebilir olması gerekir. Benzer durum, moment çıkaran fonksiyonundan momentlere geçiş için de vardır. Orada da beklenen değer operatörü ile türev operatörlerinin yer değiştirebilmesi varsayımı yapılır. Bu yer değiştirebilme varsayımları momentlerin var olmasından dolayı genellikle sağlanır. Örnek 2.6.1 a) X rasgele değişkeninin olasılık yoğunluk fonksiyonu, e x , x 0 f ( x) 0 , d . y. olarak verilmiş olsun. X rasgele değişkeninin moment çıkaran fonksiyonu, t 1 için M X (t ) E (e tX ) e 0 tx f ( x) dx e t x x 0 e dx e 0 x (t 1) 1 x (t 1) dx e 1 t x 0 1 1 t dir. Rasgele değişkenin momentlerinin dk dx k E ( X k etX ) M X (t ) t 0 t 0 E ( X k ) k şeklinde hesaplanabildiğini bir önceki kısımdan biliyoruz. Moment çıkaran fonksiyonunu kullanarak, bu rasgele değişkenin beklenen değer ve varyansını bulalım. Birinci moment, yani rasgele değişkenin beklenen değeri, M X (t ) 1 d 1 d 1 M X (t ) E( X ) M X (t ) 2 2 1 t dt dt (1 t ) t 0 (1 t ) 1 t 0 olup ikinci momenti de 1 d2 2 d2 2 2 M X (t ) 2 M X (t ) E ( X ) 2 M X (t ) 3 1 t dt (1 t ) dt (1 t )3 t 0 2 t 0 dir. Dolayısı ile, rasgele değişkenin varyansı Var ( X ) E ( X 2 ) ( E ( X ))2 2 1 1 dir. b) Herhangi bir X rasgele değişkeninin bütün k için E ( X k ) 2k k ! olarak verilsin. Bu rasgele değişkenin moment çıkaran fonksiyonu için yukarıdaki formülde E ( X k ) 2k k ! yazıldığında moment çıkaran fonksiyonu, t (1 / 2) olmak üzere, RASGELE DEĞİŞKENLER VE DAĞILIMLARI ( X t )k M X (t ) E (et X ) E k 0 k ! 101 tk tk 1 E ( X k ) (2k k !) (2t ) k 1 2t k 0 k ! k 0 k 0 k ! olur. Aslında, bir X rasgele değişkeninin olasılık yoğunluk fonksiyonu 1 x /2 e f ( x) 2 0 , x0 , d .d . şeklinde verilmiş ise, bu rasgele değişkenin k . nci momenti E ( X k ) x k f ( x)dx 0 1 k x /2 1 x e dx (k 1) 2k 1 2k k ! 20 2 ve moment çıkaran fonksiyonu da t (1 / 2) olmak üzere 1 tx x /2 1 x (0.5t ) 1 1 M X (t ) E (e ) e f ( x)dx e e dx e dx 20 20 2 (1/ 2) t 1 2t 0 tX tx dir 2. Kümülant Üreten Fonksiyonu Tanım 2.6.1 X rasgele değişkeninin moment çıkaran fonksiyonu var ve M X (t ) olsun. Buna göre, X in kümülant üreten fonksiyonu, K n (t ) dn d tn ln M X (t ) dir X rasgele değişkeninin moment çıkaran fonksiyonu (dolayısı ile, kümülant üreten fonksiyonu) bilindiğinde X in n. kümülantı Kn dn d tn ln M X (t ) t 0 formülü ile bulunur. Örnek 2.6.2 X rasgele değişkeninin kümülant üreten fonksiyonu K1 (t ) d M X (t ) ln M X (t ) dt M X (t ) olup birinci kümülant değeri 102 MATEMATİKSEL İSTATİSTİĞE GİRİŞ K1 d M (t ) ln M X (t ) X dt M X (t ) t 0 E( X ) t 0 dir. İkinci kümülant değeri de, K2 d2 dt 2 ln M X (t ) M X' (t )M X (t ) M X' (t ) M X (t ) t 0 2 2 E( X 2 ) E( X ) Var( X ) 2 t 0 dir. Türevler ardışık olarak devam ettirildiğinde üçüncü ve dördüncü kümülantların, K3 E ( X 3 ) 3E ( X 2 ) E ( X ) 2 ( E ( X ))3 K 4 E ( X 4 ) 4 E ( X 3 ) E ( X ) 3( E ( X 2 )) 2 12 E ( X 2 ) ( E ( X )) 2 6( E ( X ))4 şeklinde olduğu görülür. X rasgele değişkeninin olasılık fonksiyonu 0 için P( X x) e x / x ! , x 0,1, 2,3,... t şeklinde verildiğinde, X in moment çıkaran fonksiyonu M X (t ) e (e 1) olup kümülant üreten fonksiyonu, K n (t ) dn ln M X (t ) n dn t dt d tn dir. Buradan kümülantlar bütün n ler için, Kn dn dt n ln M X (t ) et t 0 ln e ( e 1) et t 0 dir. Yani, bu rasgele değişkenin bütün kümülantları aynıdır 3. Çarpımsal Moment Üreten Fonksiyonu Bu fonksiyonun tanımı da bir önceki kısımda (Tanım (2.5.3c)) verildi. X rasgele değişkeninin olasılık fonksiyonu, f ( x) olmak üzere, X in çarpımsal moment üreten fonksiyonu t için N X (t ) E (t X ) dir. Rasgele değişkenin çarpımsal üreten fonksiyonu verildiğinde çarpımsal momentler, E X ( X 1)( X 2)...( X ( k 1)) şeklinde hesaplanır. d k N X (t ) d tk t 1 RASGELE DEĞİŞKENLER VE DAĞILIMLARI 103 Örnek 2.6.3 X rasgele değişkeninin olasılık fonksiyonu 0 için P( X x) e x / x ! , x 0,1, 2,3,... olarak verilmiş olsun. Bu rasgele değişkenin çarpımsal moment üreten fonksiyonu, x x 0 x 0 x! N X (t ) E (t X ) t x P( X x) e t x (t ) x e e t e ( t 1) x ! x 0 e olup çarpımsal momentler, E( X ) d N X (t ) dt E ( X ( X 1)) e (t 1) t 1 d2 dt 2 t 1 2 e (t 1) N X (t ) t 1 E ( X ( X 1)( X 2)...( X ( k 1))) dk dt k t 1 2 k e (t 1) N X (t ) t 1 t 1 k şeklindedir 4. Karekteristik Fonksiyon Karekteristik fonksiyonun tanımı da daha önce (Tanım (2.5.3b)) verildi. Karekteristik fonksiyon, üretici fonksiyonlar içinde önemli bir yer tutar. Bir rasgele değişkenin moment çıkaran fonksiyonu bazen olmayabilir. Ancak, karekteristik fonksiyonu her zaman vardır. Ayrıca, karekteristik fonksiyon biliniyorsa, olasılık veya olasılık yoğunluk fonksiyonu bulunabilir. i 1 olmak üzere, X rasgele değişkeninin karekteristik fonksiyonu t için X (t ) E (ei t X ) dir. Daha açık olarak, X in karekteristik fonksiyonu ei t x P ( X x) , xD X X (t ) E (ei t X ) it x e f ( x) dx , xDX X kesikli X sürekli dir. X rasgele değişkeninin karekteristik fonksiyonu X (t ) ise momentler (var olması halinde), k E( X ) dk i k dt k X (t ) formülü ile hesaplanır. t 0 104 MATEMATİKSEL İSTATİSTİĞE GİRİŞ Örnek 2.6.4 X rasgele değişkeninin olasılık yoğunluk fonksiyonu 0 için (1/ ) e x / f ( x) 0 , x0 , d . y. şeklinde verilmiş olsun. X in karekteristik fonksiyonu, X (t ) E (e it X 1 e ) it x x / e dx 0 1 e x (1it ) / dx (1 i t ) 1 0 olup ilk iki moment, d X (t ) i dt E( X ) E( X 2 ) 1 i i (1 it )2 t 0 d2 i dt (t ) 2 X t 0 t 0 1 2 i2 2 i 2 (1 it )3 22 t 0 2 dir. Rasgele değişkenin varyansı da Var ( X ) E ( X 2 ) E ( X ) 2 2 2 2 dir Örnek 2.6.5 X rasgele değişkeninin olasılık yoğunluk fonksiyonu f ( x) 1 1 , x 1 x2 olarak verilmiş olsun. Bu rasgele değişkenin moment çıkaran fonksiyonu tanımlı değildir. Oysa, X in karekteristik fonksiyonu Euler formülü olarak bilinen eit x cos(t x) i sin(t x) eşitliği kullanılarak bulunabilir. X in karekteristik fonksiyonunu, X (t ) E (e 1 it X ) 1 cos(t x ) 1 x2 e dx 1 cos(t x) i sin( tx) dx dx 2 1 x2 1 x it x i 1 sin(t x) 1 x2 dx 1 h1 ( x) dx i h 2 ( x) dx I1 I 2 şeklinde yazılalım ve I1 ve I 2 değerlerini hesaplayalım. Önce, h 2 ( x) sin(t x) 1 ( x) 2 sin(t x) 1 x2 h 2 ( x) olduğundan h 2 ( x) fonksiyonu tektir. Tek bir fonksiyonun simetrik bir bölge üzerinden integrali de sıfırdır. Yani, RASGELE DEĞİŞKENLER VE DAĞILIMLARI I2 i sin(t x) 1 x2 105 dx 0 dır. Benzer şekilde, h1 ( x) cos( t x) X (t ) E (eit X ) cos(t x) h1 ( x) 1 ( x) 1 x2 olduğundan h1 ( x) fonksiyonu çifttir. Buna göre, karekteristik fonksiyon, 2 1 cos(t x) 1 x 2 dx 2 0 cos(t x) 1 x 2 dx e | t | olarak bulunur (Billingsley, 1986) Karekteristik fonksiyonunun olasılık teorisinde önemli olduğunu belirtmiştik. Şimdi, bu fonksiyonun özelliklerinden bazılarını kısaca hatırlayalım. a) herhangi bir X rasgele değişkeni, örnek uzaydan reel sayılara giden reel değerli bir fonksiyondur. Reel değerli bir X rasgele değişkeninin karekteristik fonksiyonu, eit X cos(t X ) i sin(t X ) gibi kompleks değerli bir rasgele değişkenin beklenen değeridir. Ayrıca, | eit X | | cos(t X ) i sin(t X )| 1 ve dir. it x | e | f ( x) dx f ( x) dx 1 b) X ( 0 ) 1 olduğu açıktır. c) | X (t )| | E (ei t X ) | E (| eit X |) 1 olup her t için | X (t )| X ( 0 ) dır. d) z kompleks bir sayı olsun ( yani a, b için z a i b ve z nin kompleks konjugesi z a i b dir). Herhangi bir X rasgele değişkeninin karekteristik fonksiyonu X (t ) olmak üzere, X (t ) E (e i t X ) E (cos(t X ) i sin(t X )) E (cos(t X )) i E (sin(t X )) X (t ) dir. Yani, X (t ) karekteristik fonksiyonu Hermitian özelliğine sahiptir. e) X rasgele değişkeninin karekteristik fonksiyonu X ( t ) ise a, b olmak üzere Y b a X nin karekteristik fonksiyonu da 106 MATEMATİKSEL İSTATİSTİĞE GİRİŞ Y ( t ) E (eit Y ) E (ei t (b a X ) ) eit b X ( a t ) şeklindedir. f) Bir rasgele değişkenin karekteristik fonksiyonu X ( t ) biliniyorsa, dağılım fonksiyonu da bulunabilir. Aşağıdaki teorem bunu ifade etmektedir. Teorem 2.6.1 Herhangi bir X rasgele değişkeninin dağılım fonksiyonu F ( x) , karekteristik fonksiyonu da X (t ) olsun. h pozitif bir sayı olmak üzere F ( x) nin sürekli olduğu yerlerde, F ( x h) F ( x ) 1 h 2 e it x e it ( x h) X (t ) dt it h ve 1 f ( x) 2 e it x (t ) dt dir (Billingsley, 1986, sayfa 357) Örnek 2.6.6 a) Karekteristik fonksiyonu, X (t ) e | t | olan X rasgele değişkeninin olasılık yoğunluk fonksiyonunu bulalım. Bunun için, cos( x ) (ei x ei x ) / 2 eşitliğinden X in olasılık yoğunluk fonksiyonu (Teorem (2.6.1)) f ( x) 1 it x 1 it x |t | 1 0 it x t it x t e ( t ) dt e e dt e e dt e e dt X 2 2 2 0 1 i t x t 1 t it x i t x it x t e dt dt e e dt e e e e 2 0 0 2 0 1 t e cos(t x) dx 0 x t 1 t e cos( t x ) e sin(t x) dx t 0 0 x2 e t 0 1 e sin(t x) dx x sin( t x cos( t x ) 0 1 x 2 t 0 1 x t 1 x2 1 1 1 1 1 x2 1 1 x 2 1 x 2 1 x 2 1 şeklinde bulunur. Yani, X rasgele değişkeninin olasılık yoğunluk fonksiyonu x için, RASGELE DEĞİŞKENLER VE DAĞILIMLARI f ( x) dir. 1 107 1 1 x2 b) X rasgele değişkeninin karekteristik fonksiyonu ve 0 için, X (t ) e i t t 2 2 /2 exp(i t t 2 2 / 2) olarak verildiğinde yine Teorem (2.6.1) den olasılık yoğunluk fonksiyonu için f ( x) 1 i t x 1 i t x t 2 2 e ( t ) dt e exp i t dt X 2 2 2 t 2 2 t 2 2 1 exp ( i x i ) dt 2 2 2 2 2 1 exp 2 2 2 2 i x i i x i 2 i x i t 2 2 t dt 2 2 2 2 2 2 i x i 2 1 1 exp exp 2 2 2 2 2 i x i t 2 2 dt ifadesi elde edilir. Bu son ifade, i x i du u t dt 2 dönüşümü ile, ( x )2 1 1 f ( x) exp 2 2 2 2 e u 2 /2 du ( x )2 1 exp 2 2 2 haline gelir. Yani, X in olasılık yoğunluk fonksiyonu, x için f ( x) ( x )2 1 exp 2 2 2 dir. 2.7. Çözümlü Problemler 2.7.1 X bir rasgele değişken ise, aşağıdaki önermelerin denk olduğunu gösteriniz. a) a için {w : X ( w) a} b) a için {w : X ( w) a} c) a için {w : X ( w) a} d) a için {w : X ( w) a} 108 MATEMATİKSEL İSTATİSTİĞE GİRİŞ Çözüm: bir sigma cebir olduğundan her A için Ac dur. Buradan, (a) ile (b) önermeleri ve (c) ile (d) önermeleri denktir. Buna göre, (b) ile (c) önermeleri denk ise bütün önermeler denk olur. Önce, a için w : X ( w) a olsun. O zaman her n için A n w : X ( w) a (1/ n) küme dizisini tanımlayalım. bir sigma cebir olduğundan A n kümelerinin sayılabilir arakesitleri de dadır. O halde, 1 A n w : X ( w) a w : X ( w) a n1 n1 n olur. Yani, (b) (c) önermesi doğrudur. Şimdi, a için {w : X ( w) a} olsun. Buradan her n için, B n {w : X ( w) a (1/ n)} yazıldığında, bir sigma cebir olduğundan B n lerin sayılabilir birleşimleri de nun elemanıdır. Buradan, n1 1 n B n w : X ( w) a w : X ( w) a n1 elde edilir. Buna göre, (c) (b) önermesi sağlanmış olur. Dolayısı ile, (b) (c) ve (c) (b) olduğundan iki önerme denktir. 2.7.2 [ 1, 2] , () ve A için P ( A) " A nın aralık uzunluğu "/3 olmak üzere, (, , P ) bir olsılık uzayıdır. X : w X ( w) w2 3 w 2 şeklinde tanımlanan X rasgele değişkeninin beklenen değerini bulunuz. Çözüm: X in değer kümesinin DX [0.25, 6] olduğu fonksiyonun aşağıda (Şekil (2.7.1)) verilen grafiğinden görülmektedir. X in değer kümesi nin bir alt kümesi olup en küçük ve en büyük alabileceği değerlerini bulabilmek için fonksiyonun türevinden yararlanabiliriz ( X , w nın türevlenebilen bir fonksiyonudur). Yani, dX ( w) 2w3 0 w 3/ 2 dw olduğundan X rasgele değişkeni en küçük değerini w 3 / 2 noktasında alır. Bu noktadaki değeri ise 0.25 dir. Rasgele değişkenin değer bölgesini gösteren grafik Şekil (2.7.1) de verilmiştir. Yani X rasgele değişkeninin değer kümesi DX [0.25, 6] dır. RASGELE DEĞİŞKENLER VE DAĞILIMLARI 109 Şekil 2.7.1 Problem (2.7.2) de tanımlanan rasgele değişkenin değer bölgesi Şimdi, X in dağılım fonksiyonunu bulalım. Önce, x 0.25 ise F ( x) 0 ve x 6 için F ( x) 1 olduğu açıktır. 0.25 x 0 için dağılım fonksiyonunun değeri F ( x) P({w : X ( w) x}) P({w : w2 3 w 2 x}) P({w : w2 3 w 2 x 0}) 3 1 4 x 3 1 4 x 1 4 x P w : w 2 2 3 0 x 6 için fonksiyonun değeri de, F ( x) P({w : X ( w) x}) P({w : w2 3 w 2 x}) P({w : w2 3 w 2 x 0}) 3 1 4 x P w : w 2 1 1 4 x 2 6 olarak hesaplanmıştır. Buna göre, X in dağılım fonksiyonu ile olasılık yoğunluk fonksiyonu (dağılım fonksiyonu x 0.25, 0 ve 6 noktalarında türevlenemez) sırası ile, 0 1 4x 3 F ( x) 1 1 4 x 6 1 , x 0.25 , 0.25 x 0 , , 0 x6 , x6 3 f ( x) 3 2 1 4x 1 1 4x 0 , 0.25 x 0 , 0 x6 , d . y. şeklindedir. Ayrıca, xDX 0 6 2 1 1 2 dx dx 1 3 3 0.25 3 1 4 x 0 3 1 4x f ( x) dx olduğundan bu fonksiyon bir olasılık yoğunluk fonksiyonudur. Rasgele değişkenin beklenen değeri de 110 MATEMATİKSEL İSTATİSTİĞE GİRİŞ 0 6 2x x dx dx xf ( x) dx xDX 0.25 3 1 4 x 0 3 1 4x (1 4x)3/ 2 1 4x 36 12 0 (1 4x)3/ 2 1 4x 72 24 x0.25 6 x0 1 14 3 18 9 2 olarak hesaplanmıştır. 2.7.3 X ve Y rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu c x y 2 f ( x, y ) 0 , 0 x 1, 0 y 1 , d . y. olarak verilmiş olsun. a) c sabitinin değerini bulunuz. b) P ( X Y 1) ve P (0 X 0.75) olasılıklarını hesaplayınız. Çözüm: a) c 6 olduğu, 1 1 x 0 y 0 x y 2 dy dx 1 6 çift katlı integralinin sonucundan açıktır. b) P ( X Y 1) olasılığına karşılık gelen bölge Şekil (2.7.2) de gösterilmiştir. Bu bölgenin alanı (aranan olasılık), 1 1 y3 P( X Y 1) 6 x y dy dx 6 x dy 2 x(1 x3 ) dx 3 x 0 y x x 0 x 0 y x 1 1 2 1 x 2 x5 3 2 ( x x ) dx 2 5 5 x 0 2 1 4 dir. Şekil 2.7.2 Problem (2.7.3) de aranan olasılığa ait bölge RASGELE DEĞİŞKENLER VE DAĞILIMLARI 111 Diğer olasılık için, X in marjinal olasılık yoğunluk fonksiyonuna ihtiyacımız vardır. 1 6 x y 2 dy 2 x y 0 integralinin sonucundan X rasgele değişkeninin marjinal olasılık yoğunluk fonksiyonu, 2 x , 0 x 1 f X ( x) d.y 0 , şeklinde bulunmuştur. Dolayısı ile aranan olasılık, 0.75 P(0 X 0.75) 2 xdx x 2 0 0.75 x 0 9 16 dır. 2.7.4 a) X ve Y rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu c e 2 x f ( x, y ) 0 , 0 y x , d.y olarak verilmiş olsun. a) c sabitinin değerini, P ( X Y ) olasılığını ve X ile Y arasındaki korelasyonu hesaplayınız. b) X ve Y rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu 2 e2 x y f ( x, y ) 0 , x 0, y 0 , d . y. olarak verildiğinde P ( X Y ) olasılığını hesaplayınız. Çözüm: a) Önce, x e 2 x dy dx x 0 y 0 x 0 e 1 dy dx x e 2 x dx 4 x 0 y 0 2 x x olduğundan, c 4 dür. Yani, X ve Y in ortak olasılık yoğunluk fonksiyonu, 4 e2 x f ( x, y ) 0 dir. Ayrıca, , 0 y x , d.y 112 MATEMATİKSEL İSTATİSTİĞE GİRİŞ x x f ( x, y ) dy f ( x, y ) dx f X ( x) y 0 fY ( y ) 4 e2 x dy 4 x e2 x 4 e 2 x dx 2 e 2 x y 0 x y x y x y 2 e2 y integrallerinden X ve Y rasgele değişkenlerinin marjinal olasılık yoğunluk fonksiyonları, 4 x e2 x f X ( x) 0 2 e2 y fY ( y ) 0 , x0 , d . y. , y0 , d . y. olarak yazılır. Marjinal olasılık yoğunluk fonksiyonlarından beklenen değer ve varyanslar, E ( X ) 1 , E ( X 2 ) 3 / 2 , Var ( X ) 1/ 2 ve E (Y ) 1/ 2 , E (Y 2 ) 1/ 2 , Var (Y ) 1/ 4 olarak hesaplanmıştır. Marjinaller hesaplandıktan sonra, aranan olasılık P( X Y ) P( X Y |Y y ) fY ( y ) dy P( X y ) fY ( y ) dy yDY y 0 P( X y) 2 e y 0 2 y dy 2 e 2 y f ( x) dx dy x y X y 0 3 2 e 2 y 4 x e2 x dx dy 2 e2 y 2 y e 2 y e 2 y dy x y 4 y 0 y 0 olarak elde edilir. Ayrıca, E ( XY ) x xy f ( x, y ) dy dx x 0 y 0 x 4 xy e 2 x dy dx 2 x 0 y 0 x3 e2 x dx x 0 olup X ve Y rasgele değişkenleri arasındaki korelasyon da 3 1 (1) Cov( X , Y ) E ( XY ) E ( X ) E (Y ) 4 2 2 1 XY 2 Var ( X ) Var (Y ) Var ( X ) Var (Y ) 11 2 24 olarak bulunmuştur. b) X ve Y rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu 2 e2 x y f ( x, y ) 0 , x 0, y 0 , d . y. 3 4 RASGELE DEĞİŞKENLER VE DAĞILIMLARI 113 şeklinde verildiğinde marjinaller 2 e 2 x f X ( x) 0 e y fY ( y ) 0 , x0 , d . y. , y0 , d . y. şeklinde olur. Ayrıca, her x, y için f ( x, y ) f X ( x) fY ( y ) olup X ve Y bağımsız rasgele değişkenlerdir. Buna göre P ( X Y ) olasılığı, P( X Y ) P( X Y | Y y ) fY ( y ) dy yDY P( X y ) fY ( y ) dy y 0 2 e 2 x dx e y dy y 0 x y e 2 y y e dy y 0 e3 y dy y 0 1 3 olarak bulunmuştur. 2.7.5 X rasgele değişkeninin olasılık yoğunluk fonksiyonu, (1/ ) e x / , x 0 f ( x) 0 , d . y. olarak verildiğinde, bu rasgele değişkenin momentleri arasında, E ( X n 1 ) E ( X n ) 2 d E( X n ) d şeklinde bir bağıntının olduğunu gösteriniz. Çözüm: Türev ile integral operatörlerinin yer değiştirebildiği varsayımı altında, çarpım şeklindeki iki fonksiyonun türevi kullanılarak eşitliğin sağ tarafındaki ikinci terim d d n 1 x / d n x e E ( X ) dx d d d 0 1 x ne x / dx 0 d 1 n x / 1 d dx xne x/ dx x e d d 0 0 d d 1 1 n x / 1 dx x e 0 x 0 n 1 e x / dx şeklinde yazılabilir. Buradan da 1 2 n x 0 x 0 n1 d x / 1 e dx 2 d 1 e x / dx 1 n x / x e dx 0 E ( X n ) 1 2 1 3 x n 1 x / 0 E ( X n1 ) e dx 114 MATEMATİKSEL İSTATİSTİĞE GİRİŞ d 1 1 d E ( X n ) E ( X n ) 2 E ( X n1 ) E ( X n 41 ) E ( X n ) 2 E ( X n ) d d şeklinde aranan eşitlik elde edilmiş olur. 2.7.6 X ve Y rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu, c x 2 y , x 2 y 1 f ( x, y ) , d . y. 0 olarak verilmiş olsun. a) c sabitinin değerini bulunuz. b) P ( X Y ) olasılığını hesaplayınız. c) X ve Y nin marjinal olasılık yoğunluk fonksiyonlarını bulunuz. d) P (Y 3 / 4 | X 1 / 2) koşullu olasılığını hesaplayınız. e) X ile Y arasındaki korelasyonu hesaplayınız. f) X x verildiğinde, Y nin koşullu beklenen değerini hesaplayınız. Çözüm: a) x 2 1 olduğundan, X in sınırları 1 x 1 dir. Yani, DX [1, 1] dir. Buradan c sabitinin değeri, 1 1 1 4 1 1 4c 2 2 1 x f ( x, y )dydx c ydy x dx c x 2 dx 21 x 1 y x 2 x 1 1 x 1 y x2 eşitliğinden c 21 / 4 olarak bulunmuş olur. b) P ( X Y ) olasılığı için A { X ( w) Y ( w)} {( x, y ) :0 x 1, x 2 y x } kümesini göz önüne alalım. Buradan aranan olasılık, 21 P( X Y ) 4 1 x 21 2 x y dydx 3 x 0 y x 2 x 1 4 2 21 3 2 x x x y dy dx x dx 2 2 4 20 x 0 x 0 y x 1 2 olarak hesaplanır. c) X ve Y nin marjinal olasılık yoğunluk fonksiyonlarını bulalım. Önce, RASGELE DEĞİŞKENLER VE DAĞILIMLARI yDY 1 21 f ( x, y ) dy x 2 4 y dy y x2 115 21 2 x (1 x 4 ) 8 olup X in marjinal olasılık yoğunluk fonksiyonu, 21 2 4 x (1 x ) , 1 x 1 f X ( x) 8 0 , d . y. dir. x 2 y ise y x xDX 21 f ( x, y ) dx y 4 y olduğundan 21 2 x dx 4 y 2 y y y 0 3 y 21 x 7 x 2 dx y y5 / 2 2 3 x 0 2 integralinden sonucu olarak, Y nin marjinal olasılık yoğunluk fonksiyonu da, 7 5/2 y fY ( y ) 2 0 , 0 y 1 , d . y. olarak bulunur. d) P (Y 3 / 4 | X 1 / 2) olasılığı için X x verildiğinde Y nin koşullu olasılık yoğunluk fonksiyonuna ihtiyaç vardır. x 2 y 1 için f ( y | x) f ( x, y ) (21/ 4) x 2 y 2y f X ( x) (21 / 8) x 2 (1 x 4 ) 1 x 4 olduğundan X x verildiğinde Y nin koşullu olasılık yoğunluk fonksiyonu, 2 y / (1 x 4 ) , x 2 y 1 fY | X x ( y | x) 0 , d . y. dir. Diğer taraftan, 1 x 2 2y 1 x4 dy y2 1 1 x4 1 y x 2 olduğundan fY | X x ( y | x ) bir olasılık yoğunluk fonksiyonudur. Buradan aranan olasılık da, 1 P(Y 3 / 4 | X 1 / 2) 3/ 4 1 2y 32 7 dy 3 / 4 (1 (1 / 2) 4 ) 15 3/ 4y dy 15 1 f ( y | 1 / 2) dy olarak hesaplanmıştır. e) Marjinal olasılık yoğunluk fonksiyonlarından beklenen değer ve varyanslar 116 MATEMATİKSEL İSTATİSTİĞE GİRİŞ E( X ) 0 , E( X 2 ) 7 7 7 7 28 , Var ( X ) , E (Y ) , E (Y 2 ) , Var (Y ) 15 15 9 11 891 şeklinde bulunmuştur. Ayrıca, 21 1 1 21 1 1 2 3 71 3 E( X Y ) xy f ( x, y) dydx y dy x dx x (1 x6 )dx 0 4 x1 y x2 4 x1 y x2 4 1 dır. Dolayısı ile, X ile Y arasındaki kolerasyon X Y Cov( X , Y ) E ( XY ) E ( X ) E (Y ) 0 0 (7 / 9) 0 Var ( X ) Var (Y ) Var ( X ) Var (Y ) (7 /15)(28 / 891) dır. X ve Y rasgele değişkenleri bağımsız olmamasına rağmen, aralarındaki korelasyon sıfırdır. f) X x verildiğinde, Y nin koşullu beklenen değeri, E Y | X x 1 yDY y fY | X x ( y | x) dy 2 y 2 / (1 x 4 ) dy y x2 2(1 x 6 ) 3(1 x 4 ) dir. 2.7.7 X ve Y rasgele değişkenlerinin ortak olasılık fonksiyonu, P ( X x, Y y ) cx / y , x 1, 2 , y 1, 2 olarak verilmiş olsun. c sabitinin değerini bulunuz. X ile Y bağımsız mıdır? Çözüm: Önce, 2 2 ( x / y) 9 / 2 y 1 x 1 olduğundan c 2 / 9 dur. Marjinal olasılık fonksiyonları da P ( X x) x / 3, x 1, 2 , P (Y y ) 2 /(3 y) , y 1, 2 şeklindedir. Buradan, Y y verildiğinde X in koşullu olasılık fonksiyonu, x 1, 2 için P( X x |Y y) P ( X x, Y y ) 2 x / 9 y x P ( X x) P (Y y ) 2 / (3 y ) 3 olup X ve Y rasgele değişkenleri bağımsızdır. 2.7.8 (, , P ) bir olasılık uzayı ve A, B olsun. X ve Y rasgele değişkenleri RASGELE DEĞİŞKENLER VE DAĞILIMLARI X : 117 Y : 1 , w A w X ( w) 0 , w A 1 , w B w Y ( w) 0 , w B olarak tanımlansın. Buna göre, Cov( X , Y ) 0 P (Y 1| X 1) P(Y 1) önermesini ispat ediniz. Çözüm: DX DY {0,1} olduğundan, E ( X ) P ( X 1) , E (Y ) P (Y 1) olup, E ( XY ) 1 1 x y P( X x, Y y ) P( X 1, Y 1) x 0 y 0 dir. Buradan, Cov( X , Y ) E ( XY ) E ( X ) E (Y ) P( X 1, Y 1) P ( X 1) P (Y 1) yazılır. Dolayısı ile, Cov( X ,Y ) 0 P( X 1,Y 1) P( X 1)P(Y 1) 0 P( X 1,Y 1) P( X 1)P(Y 1) P( X 1,Y 1) P(Y 1) P(Y 1| X 1) P(Y 1) P( X 1) elde edilir. 2.7.9 Dağılım fonksiyonu, 1 e x x e x F ( x) , x0 , d . y. şeklinde verilen bir X rasgele değişkenin modunu bulunuz. Çözüm: Bir rasgele değişkenin olasılık yoğunluk fonksiyonu dağılım fonksiyonunun türevi olduğundan X in olasılık yoğunluk fonksiyonu, x e x f ( x) , x0 , d . y. dir. Bir rasgele değişkenin modu ise olasılık fonksiyonunu maksimum yapan değerdir. Buradan, X in modu olasılık yoğunluk fonksiyonunun türevini sıfır yapan noktadır. O halde, f ( x) e x xe x 0 x 1 olduğundan rasgele değişkenin modu x 1 dir. 2.7.10 X ve Y rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu, 118 MATEMATİKSEL İSTATİSTİĞE GİRİŞ 1/ y , 0 x y 1 f ( x, y ) d . y. 0 , olarak verilmiş olsun. a) Marjinal olasılık yoğunluk fonksiyonlarını bulunuz. b) P ( X 1/ 2) , P ( X 1/ 4 , Y 1 / 2) ve P ( X 1 / 4 veya Y 1/ 4) olasılıklarını hesaplayınız. Çözüm: a) Önce, 1 f X ( x) yx 1 1 dy ln( y ) y x ln( x) ve fY ( x) y y x 0 1 dx 1 y integral değerleri kullanılarak marjinal olasılık yoğunluk fonksiyonları sırası ile ln( x) , 0 x 1 f X ( x) , d . y. 0 1 , 0 y 1 fY ( y ) d . y. 0 , ve şeklinde bulunmuştur. b) Şimdi olasılıkları hesaplayalım. Önce, P ( X 1/ 2) olasılığı, 1/2 P( X 1/ 2) 0 1/2 ln( x) dx x ln( x) 0 1/2 1/2 dx x ln( x) 0 0 1/2 x0 1 1 1 ln 0.847 2 2 2 dir. Burada, L’Hospital kuralı iki defa uygulandığında (limit ifadesinde 0 / 0 veya / ifadeleri geldiği zaman uygulanır), 1/ x 2 / (1/ x) ln(1/ x) lim x ln( x) lim lim lim x 0 x 0 x0 1/ x x0 x 0 1/ x 2 olduğunu belirtmek gerekir. P ( X 1/ 4 , Y 1 / 2) olasılığı ise, 1/4 1/2 P( X 1/ 4, Y 1/ 2) 0 1/4 1 dy dx y ln(1/ 2) ln( x) dx x 0 1/4 1/4 0 0 ln(1 / 2) dx ln( x) dx 1 1 1/4 ln ( ln( x) ) dx 4 2 0 1 1 1 1 1 1 1 1/4 ln x ln( x) x 0 ln ln 4 2 4 4 4 4 2 RASGELE DEĞİŞKENLER VE DAĞILIMLARI 119 1 1/ 2 1 1 1 ln ln(2) 0.423 4 1/ 4 4 4 4 dür. Son olarak, P ( X 1 / 4 veya Y 1/ 4) olasılığını hesaplayalım. Bunun için, 1 P( X 1/ 4) ln( x) dx x ln( x) x x1/4 0.403 , 1/4 1 P(Y 1/ 4) 1 1 3 1 y dy 1 4 4 1/4 ve P( X 1/ 4 , Y 1/ 4) 1/ 4 1 1 1 3 1 1 dx dy y 1 4 y dy 4 4 ln 4 0.403 1/ 4 1/ 4 olduğundan aranan olasılık, P( X 1/ 4 veya Y 1/ 4) P( X 1/ 4) P(Y 1/ 4) P( X 1/ 4, Y 1/ 4) 3 3 0.403 0.403 4 4 şeklinde bulunmuştur. Burada integrallerin analitik hesabı için Mapple VIII programından yararlanılmıştır. BÖLÜM 3 RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ VE DAĞILIM FONSİYONLARI 3.1. Tek Değişkenli Dönüşümler Bir önceki bölümde, rasgele değişkenlerin dağılım fonksiyonları, olasılık veya olasılık yoğunluk fonksiyonları ve momentlerine ilişkin bazı özellikleri incelendi. X bir rasgele değişken ise, X in herhangi bir fonksiyonu da bir rasgele değişkendir. (, , P ) bir olasılık uzayı, X de üzerinde tanımlı bir rasgele değişken olsun. Reel sayılardan reel sayılara giden bir fonksiyon da g ( g : ) olmak üzere, g X fonksiyonu da dan ye giden bir fonksiyondur ( g X : ). Yani, X bir rasgele değişken ise, g X bileşke fonksiyonu da aynı örnek uzay üzerinde tanımlı bir rasgele değişkendir (Öztürk, 1993, sayfa 139 ve Ash, 1970 sayfa 58). X : , g : ise g X : olup, ( g X )( w) g ( X ( w)) dir. Bu bileşke fonksiyon şematik olarak aşağıda Şekil (3.1.1) de gösterilmiştir. Şekil 3.1.1 Rasgele değişkenin dönüşümü İkinci bölümde, rasgele değişkenleri kesikli ve sürekli olmak üzere iki gruba ayırmıştık. g X de bir rasgele değişken olduğuna göre, bu rasgele değişken de kesikli ya da sürekli olabilir. Ancak, X kesikli ise, g X kesikli veya sürekli olabilir. Benzer şekilde, X sürekli ise g X de kesikli veya sürekli olabilir. Örneğin X , değer kümesi DX [0, 2] olan sürekli bir rasgele değişken, den ye bir g fonksiyonu da 122 MATEMATİKSEL İSTATİSTİĞE GİRİŞ 1 , x [ 0,1) g ( x) 2 , x [1, 2 ] şeklinde tanımlandığında g X , değer kümesi Dg X {1, 2} olan kesikli bir rasgele değişkendir. Bu kitapta aksi belirtilmedikçe, X kesikli ise g X de kesikli, X sürekli ise g X de sürekli rasgele değişken olarak ele alınacaktır. Ayrıca, g X rasgele değişkeni kısaca g ( X ) ile gösterilecektir. Bu bölümde, herhangi bir X rasgele değişkeninin olasılık veya olasılık yoğunluk fonksiyonu verildiğinde g ( X ) gibi rasgele değişkenlerin olasılık veya olasılık yoğunluk fonksiyonlarının bulunma yöntemleri tartışılacaktır. Kesikli rasgele değişkenlerin dönüşümlerinin olasılık fonksiyonlarının bulunması kolaydır. X kesikli ise, g ( X ) in de kesikli olduğunu düşünürsek, Y g ( X ) rasgele değişkeninin olasılık fonksiyonu için, her y DY için P (Y y ) olasılıklarının doğrudan hesaplanması en kolay yoldur. Bunu aşağıdaki örnek üzerinde açıklayalım. Örnek 3.1.1 X rasgele değişkeninin olasılık fonksiyonu, X x P ( X x) 2 1/ 5 1 1/ 5 0 1/ 5 1 1/ 5 2 1/ 5 şeklinde verilmiş olsun. DX {2, 1,0, 1, 2} olup Y X 2 rasgele değişkeninin olasılık fonksiyonunu bulalım. Y nin değer kümesinin DY {0, 1, 4} olduğu açıktır. y DY için P (Y y ) olasılıkları, P (Y 0) P ( X 0) 1/ 5 , 1 1 2 5 5 5 P (Y 1) P ( X 2 1) P ( X 1 veya X 1) P ( X 1) P( X 1) 1 1 2 5 5 5 P(Y 4) P( X 2 4) P( X 2 veya X 2) P ( X 2) P( X 2) şeklinde hesaplanmıştır. Buna göre, y \ DY için P (Y y ) 0 ve y DY içinde olasılıklar yukarıda verildiği gibidir. Buna göre, Y nin olasılık fonksiyonunu Yy P (Y y ) şeklinde yazabiliriz 0 1/ 5 1 2/5 4 2/5 RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ 123 Dağılım fonksiyonu FX ( x) , olasılık veya olasılık yoğunluk fonksiyonu da f ( x) olan X rasgele değişkenini göz önüne alalım. Y g ( X ) rasgele değişkeninin dağılım fonksiyonu FY ( y ) , X in dağılım fonksiyonu türünden FY ( y ) P(Y y ) P( g ( X ) y ) P( X g 1 ( y )) FX ( g 1 ( y )) şeklinde yazılabilir. Buradan da, Y kesikli bir rasgele değişken ise olasılık fonksiyonu, y DY için olasılıklar P(Y y ) FY ( y ) FY ( y ) şeklinde hesaplanabilir. Y sürekli ise olasılık yoğunluk fonksiyonu y DY için, d FY ( y ) , FY ( y ) nin türevlenebildiği yerlerde fY ( y ) dy 0 , d.y şeklindedir. Ayrıca, Y nin dağılım fonksiyonu FY ( y ) FX ( g 1 ( y )) olup, bileşke fonksiyonun türevi ( Y nin olasılık yoğunluk fonksiyonu), fY ( y ) d FY ( y ) dy d dy FX ( g 1 ( y )) f X ( g 1 ( y )) d g 1 ( y ) dy şeklindedir. g ( x) fonksiyonu monoton artan ise birinci türevi pozitif, monoton azalan ise negatiftir. Ancak, fonksiyon, bazı yerlerde artan, bazı yerlerde azalan olabilir (Şekil (3.1.2)). Şekil 3.1.2 Monoton artan ve azalan dönüşümler Buradan, fonksiyon monoton artan ve türevlenebilir ise fonksiyon monoton azalan ve türevlenebilir ise d g 1 ( y ) 0 dy d g 1 ( y ) 0 dy 124 MATEMATİKSEL İSTATİSTİĞE GİRİŞ olup seçilen fonksiyonun durumuna göre, Y in olasılık yoğunluk fonksiyonu, fY ( y ) d FY ( y ) d FX ( g 1 ( y )) f X g 1 ( y ) dy dy d g 1 ( y ) dy şeklinde yazılmalıdır. Örnek 3.1.2 X rasgele değişkeninin olasılık yoğunluk fonksiyonu, 2 x , 0 x 1 f ( x) d . y. 0 , olarak verilmiş olsun. Y 3 X 1 ve Z 3 X 1 rasgele değişkenlerinin olasılık yoğunluk fonksiyonlarını bulalım. DY (1, 4 ) olup g ( x) 3x 1 fonksiyonu monoton artandır. Ayrıca, g 1 ( y ) y 1 d 1 1 ve g ( y) 3 dy 3 olup 1 y 4 için Y nin olasılık yoğunluk fonksiyonu, 1 fY ( y ) f X g ( y ) d g 1 ( y ) y 1 1 2 2 ( y 1) dy 3 3 9 şeklindedir. Yani, Y nin olasılık yoğunluk fonksiyonu, 2 ( y 1) , 1 y 4 fY ( y ) 9 0 , d . y. şeklindedir. Diğer taraftan, Z nin değer kümesi DZ ( 2, 1) olup h( x) 3x 1 fonksiyonu monoton azalandır. Ters dönüşüm ve türevi, g 1 ( z ) 1 z d 1 1 ve g (z) 3 dz 3 olup, f Z ( z ) f X g 1 ( z ) d g 1 ( z ) 1 y 1 2 2 (1 y ) dz 3 3 9 eşitliğinden Z rasgele değişkeninin olasılık yoğunluk fonksiyonu da, 2 (1 z ) , 2 z 1 fZ ( z) 9 0 , d . y. RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ 125 olarak bulunmuştur Herhangi bir X rasgele değişkeninin olasılık yoğunluk fonksiyonu f ( x) , dağılım fonksiyonu da FX ( x) olsun. Y | X | rasgele değişkeninin dağılım fonksiyonu y DY için, FY ( y ) P(Y y ) P(| X | y ) P ( y X y ) FX ( y ) FX ( y ) ve dağılım fonksiyonunun türevinden de Y nin olasılık yoğunluk fonksiyonu, f ( y ) f X ( y ) , fY ( y ) X 0 , y0 d . y. dir. Z X 2 rasgele değişkeninin olasılık yoğunluk fonksiyonu ise, FZ ( z ) P( Z z ) P( X 2 z ) P( z X z ) FX ( z ) FX ( z ) şeklindeki dağılım fonksiyonunun türevinden f X ( z ) f X ( z ) , z0 f Z ( z) 2 z 0 , d . y. şeklinde olur. Örnek 3.1.3 Herhangi bir X rasgele değişkeninin olasılık yoğunluk fonksiyonu, 1/ 3 , 1 x 2 f ( x) d . y. 0 , olsun. Y X 2 nin olasılık yoğunluk fonksiyonunu bulalım. Şekil 3.1.3 g ( x) x 2 dönüşümünün [1, 2] aralığındaki grafiği Y nin değer kümesi Şekil (3.1.3) deki grafikten de görüldüğü gibi D Y (0, 4) dür. Buna göre, g ( x) x 2 fonksiyonu (1, 0 ) aralığında azalan, (1, 2 ) aralığında ise artandır. 126 MATEMATİKSEL İSTATİSTİĞE GİRİŞ Y nin dağılım fonksiyonu için D Y (0 , 4) olduğundan, y 0 ise FY ( y ) 0 ve y 4 ise FY ( y ) 1 olduğu açıktır. Diğer taraftan, 0 y 1 için y 2 FY ( y ) P(Y y ) P( X y ) P( y X y) y 2 y 1 dx 3 3 ve 1 y 4 için y 2 FY ( y ) P(Y y ) P( X y ) P(1 X y) 1 1 y 1 dx 3 3 dir. Buradan Y nin dağılım fonksiyonu ile olasılık yoğunluk fonsiyonu, 0 2 y 3 FY ( y ) 1 y 3 1 , y0 , 0 y 1 ve , 1 y 4 , y4 1 3 y d FY ( y ) 1 fY ( y ) dy 6 y 0 0 y 1 1 y 4 , d . y. şeklindedir Örnek 3.1.4 Dağılım fonksiyonu F olan X rasgele değişkenini göz önüne alalım. U F ( X ) rasgele değişkeninin olasılık yoğunluk fonksiyonunu bulalım. F dağılım fonksiyonu olduğundan azalmayandır. Ayrıca, DU [0,1] olup u 0 için FU (u ) 0 ve u 1 için FU (u ) 1 olduğu açıktır. Fonksiyon kesin artan ise, 0 u 1 için fonksiyonun değeri FU (u ) P(U u ) P( F ( X ) u ) P( X F 1 (u )) F ( F 1 (u )) u dur. Ancak, F dağılım fonksiyonu olduğundan azalmayan olup fonksiyon bazı yerlerde sabit olabilir (Şekil 3.1.4). Örneğin, seçilen bir [ x1 , x2 ] aralığında, her x [ x1 , x2 ] için F ( x) u olabilir. Yani, seçilen bir u değerine karşılık bir çok x değeri vardır. Yani, F 1 (u ) iyi tanımlı değildir. Bunun için, F 1 (u ) fonksiyonu, F 1 (u ) inf{x : F ( x ) u} olarak tanımlandığında problem giderilmiş olur. RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ 127 Şekil 3.1.4 F Dağılım fonksiyonunun ters dönüşümü Dağılım fonksiyonunun sabit olduğu aralıkta her x değerine karşılık bir u , her u değerine karşılık da bir x değeri vardır. Yani, F 1 (u ) iyi tanımlıdır. Bu durum dikkate alındığında, U nun dağılım fonksiyonu ile olasılık yoğunluk fonksiyonu, u0 0 , FU (u ) u , 0 u 1 1 , 1 ve fU (u ) dFU (u ) 1 , 0 u 1 d . y. du 0 , şeklindedir 3.2. Çok Değişkenli Dönüşümler Bu kısımda, X ve Y ortak olasılık veya olasılık yoğunluk fonksiyonu f ( x, y ) olan herhangi iki rasgele değişken olmak üzere, U g ( X , Y ) gibi bir rasgele değişkenin olasılık fonksiyonunun elde edilmesi üzerinde durulacaktır. Burada, g fonksiyonu, 2 den ye giden bir fonksiyondur. İşlemlerin kolay yürütülebilmesi için, ağırlıklı olarak iki değişkenli dönüşümler ele alınacaktır. Burada g fonksiyonu sürekli olabildiği gibi, X ve Y nin sürekli olmayan bir fonksiyonu da olabilir. Ayrıca, X1, X 2 , , X k ortak olasılık veya olasılık yoğunluk fonksiyonu f ( x1 , x2 , , xk ) olan rasgele değişkenler olmak üzere, U g ( X1, X 2 , , X k ) şeklindeki bir rasgele değişkenin olasılık veya olasılık yoğunluk fonksiyonuna da ihtiyaç duyulabilir. Diğer taraftan, X ve Y nin ortak olasılık veya olasılık yoğunluk fonksiyonu verildiğinde, U g1 ( X , Y ) ve V g 2 ( X , Y ) şeklinde tanımlanan U ve V rasgele değişkenlerinin ortak olasılık veya olasılık yoğunluk fonksiyonu da bulunabilir. 128 MATEMATİKSEL İSTATİSTİĞE GİRİŞ Şekil 3.2.1 İki boyutlu dönüşüm U g ( X , Y ) rasgele değişkeninin dağılımı değişik yollardan elde edilebilir. U tek değişkenli bir rasgele değişken olduğundan bazen doğrudan dağılım fonksiyonu bulunabilir. Dağılım fonksiyonundan da olasılık yoğunluk fonksiyonu bulunur. Bazen, başka tekniklerin denenmesi gerekebilir. Bunu aşağıdaki örnek üzerinde açıklamaya çalışalım. Örnek 3.2.1 Bağımsız aynı f ( x) olasılık yoğunluk fonksiyonuna sahip iki rasgele değişken X ve Y olsun. Olasılık yoğunluk fonksiyonları e x f X ( x ) fY ( x ) 0 , x0 , d . y. şeklinde verildiğinde, U max( X , Y ) ve V min( X , Y ) rasgele değişkenlerinin olasılık yoğunluk fonksiyonlarını bulalım. Burada olasılık yoğunluk fonksiyonlarını bulmak için dağılım fonksiyonu tekniği kullanılabilir. u 0 ise, FU (u ) 0 ve u 0 için, FU (u ) P(U u ) P(max( X , Y ) u ) P ( X u , Y u ) P( X u ) P( Y u ) [ P( X u )]2 (1 e u )2 olup U nun dağılım fonksiyonu 0 FU (u ) u 2 (1 e ) , u0 , u0 şeklindedir. Dağılım fonksiyonunun türevinden U nun olasılık yoğunluk fonksiyonu, fU (u ) dFU (u ) 2 eu (1 e u ) , u 0 du , d . y. 0 olarak bulunur. V rasgele değişkeninin dağılım fonksiyonu da benzer şekilde bulunur. Yani, V nin dağılım fonksiyonu, v 0 ise FV (v) 0 ve v 0 için de FV (v) P(V v) P(min( X , Y ) v) 1 P (min( X , Y ) v) 1 P ( X v, Y v) 1 P ( X v) P( Y v) 1 [ P ( X v)]2 1 e 2v olup V nin dağılım fonksiyonu da RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ 0 FV (v) 2 v 1 e , v0 , v0 129 şeklindedir. Yine dağılım fonksiyonunun türevinden V nin olasılık yoğunluk fonksiyonu da fV (v) dFV (v) 2 e2v dv 0 , v0 , d . y. olarak elde edilir Kesikli rasgele değişkenlerde, dağılım fonksiyonuna ihtiyaç duyulmadan olasılık fonksiyonu bulunabilir. Örnek 3.2.2 Bağımsız X ve Y rasgele değişkenlerinin olasılık fonksiyonu 0 için P( X x) P(Y x ) e x / x ! , x 0,1, 2,... olarak verilsin. U X Y rasgele değişkeninin olasılık fonksiyonunu bulalım. U nun değer kümesi ile X ve Y nin değer kümeleri aynı olup olasılık fonksiyonu u 0,1, 2, 3,... için, P(U u) P( X Y u) u u y0 y 0 P( X Y u | Y y) P(Y y) P( X y u) P(Y y) P( X u y) P(Y y) y 0 u e2 u! e u y e y u u ! e u y e y (u y)! y ! u ! (u y)! y ! y 0 y0 u y u y e2 u! y!(u y)! u ! y 0 u 2 u y u y e2 (2 )u u e ( ) y u! u! y0 u şeklinde doğrudan hesaplanabilir. U nun olasılık fonksiyonu, X (veya Y nin) nin olasılık fonksiyonuna benzemektedir. X ve Y nin olasılık fonksiyonlarında yerine 2 gelmiştir. Yani, U nun olasılık fonksiyonu P(U u ) e 2 (2 )u / u ! , u 0,1, 2,... dir Örnek 3.2.3 a) Birim uzunluğundaki düzgün bir çubuk üzerinde rasgele iki nokta işaretlensin. Bu iki nokta arasındaki uzaklığa Z diyelim. Z nin moment çıkaran fonksiyonunu bulup E ( Z n ) beklenen değerini hesaplayalım. 130 MATEMATİKSEL İSTATİSTİĞE GİRİŞ Birim uzunluğundaki çubuk üzerindeki noktalar X ve Y olsun. Rasgele seçilen bu iki nokta arasındaki uzaklık (şekilde de görüldüğü gibi) Z | X Y | dir. X ve Y rasgele değişkenleri bağımsız olup aynı olasılık yoğunluk fonksiyonuna sahiptir. Buna göre, X ve Y nin ortak olasılık yoğunluk fonksiyonu ile marjinal olasılık yoğunluk fonksiyonları, 1 f X ,Y ( x, y ) 0 , 0 x, y 1 , d . y. 1 , f X ( x ) fY ( x ) 0 , 0 x 1 , d . y. olarak yazılabilir. DZ [0,1] olup aşağıdaki grafik bilgileri de dikkate alındığında Z nin dağılım fonksiyonu, z 0 için FZ ( z ) 0 , z 1 için FZ ( z ) 1 ve 0 z 1 için FZ ( z ) P( Z z ) 1 (1 z ) 2 şeklinde yazılır (Şekil (3.2.3)). Dağılım fonksiyonunun türevinden olasılık yoğunluk fonksiyonu, 2(1 z ) , 0 z 1 fZ ( z) , d . y. 0 olarak bulunur. Şekil 3.2.2 Örnek (3.2.3a) da aranan olasılık (alan) Buradan, Z nin moment çıkaran fonksiyonu, M Z (t ) E (et Z ) 1 z 0 et z f Z ( z ) dz 1 z 0 et z 2(1 z ) dz 2 t 2 (et t 1) şeklinde hesaplanmıştır. Moment çıkaran fonksiyonunun sıfır noktası komşuluğundaki Taylor serisi açılımı, RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ M Z (t ) E (et Z ) tn t2 131 t3 tn n! E (Z n ) 1 t E ( Z ) 2! E (Z 2 ) 3! E ( Z 3 ) ... n! E (Z n ) ... n 0 2 olup M Z (t ) E (et Z ) (et t 1) olduğundan, bu fonksiyonun Taylor serisi açılımı, t2 2 2 t 2 tn t 2 t3 tn ( e t 1) t 1 1 t 1 t ... .. t2 2! 3! n ! t2 t 2 n 0 n ! 2 t2 t3 tn t 2t 2 2t 3 2t 4 2t n ... .. 1 ... ... n ! 3 4! 5! 6! (n 2)! t 2 2! 3! şeklinde yazılabilir. Buradan, t2 t3 tn 2 3 M Z (t ) 1 t E ( Z ) E ( Z ) E ( Z ) ... E ( Z n ) ... 2! 3! n! ve t 2t 2 2t 3 2t 4 2t n M Z (t ) 2 (e t 1) 1 ... ... 3 4! 5! 6! (n 2)! t 2 t eşitlikleri elde edilir. Buradaki polinomlarının katsayıları eşitlendiğinde, E (Z ) 2 1 , 3! 3 1 2 4 1 1 E(Z 2 ) E(Z 2 ) 2! 4! 4! 3! 2(3) ve n 2 için diğer momentler tn 2t n 2 n! 2 E (Z n ) E (Z n ) n! ( n 2)! (n 2)! (n 1)(n 2) dir. Dolayısı ile, Z rasgele değişkeninin bütün momentleri E(Z n ) 2 (n 1)(n 2) olarak hesaplanmış olur. b) İki kişi saat 12:00 ile 13:00 arasında belli bir yerde görüşmek üzere anlaşıyorlar. Görüşme yerine önce gelen a saat ( 0 a 1 ) bekleyecektir. Her ikisinin de anlaştıkları yere varmaları birbirinden bağımsız olup (a) da verilen olasılık yoğunluk fonksiyonuna sahiptir. Bu iki kişinin karşılaşma olasılıklarını ( p diyelim) bulalım. Ayrıca, p 0.84 olarak verildiğinde a yı (ne kadar bekleyeceğini) bulalım. X ve Y kişilerin belirlenen yere gelme saatini göstersin. İki kişinin karşılaşabilmesi için Z | X Y | a olması gerekir. Buna göre, aranan olasılık (a) daki sonuçtan 132 MATEMATİKSEL İSTATİSTİĞE GİRİŞ p P ( Z a) P | X Y | a 1 (1 a ) 2 dir. p 0.84 ise bekleme süresi 1 (1 a) 2 0.84 eşitliğinden a 0.6 saat veya a 36 dakika olarak bulunur. Yani, önce gelen kişi en fazla 36 dakika bekleyecektir. c) Birim uzunluğundaki düzgün bir çubuk üzerinde rasgele bir nokta işaretleyelim (bu nokta X olsun). Buna göre, elimizde uzunlukları X ve 1 X olan iki doğru parçası vardır. Daha sonra, (0, X ) aralığından rasgele bir nokta (buna Y diyelim), ( X ,1) aralığından da ikinci bir nokta (buna da Z diyelim) işaretleyelim. Y ve Z nin ortak olasılık yoğunluk fonksiyonu ile U Z Y nin olasılık yoğunluk fonksiyonunu bulalım. Bu noktalar aşağıda şematik olarak gösterilmiştir. X in olasılık yoğunluk fonksiyonu ile X x verildiğinde Y ve Z nin koşullu olasılık yoğunluk fonksiyonları 1 fY | X x ( y | x) x 0 1 , 0 x 1 f X ( x) d . y. 0 , 1 f Z | X x ( z | x) 1 x 0 , 0 yx , d . y. , 0 x z 1 , d . y. şeklindedir. Buradan, X , Y , Z nin ortak olasılık yoğunluk fonksiyonu, f ( x, y , z ) f X ( x ) f Y | X x ( y | x ) f Z | X x ( z | x ) 1 x(1 x) 1 , 0 y x z 1 f ( x, y, z ) x(1 x) 0 , d . y. olarak bulunur. Y ve Z nin ortak olasılık yoğunluk fonksiyonu ise, z x y 1 dx x(1 x) z x y integralinin sonucundan, 1 dx x z x y 1 dx ln( x) (1 x) z x y ln(1 x) z x y z (1 y ) ln y (1 z ) RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ 133 z (1 y ) , 0 y z 1 ln fY ,Z ( y, z ) y (1 z ) 0 , d . y. olarak elde edilir. Şimdi, U Z Y rasgele değişkeninin olasılık yoğunluk fonksiyonunu bulalım. Önce, 0 u z 1 ve fU (u ) 1 f ( z , y ) dz zDZ z (1 ( z u )) ln dz 2 u ln(u ) ((1 u ) ln(1 u ) ( z u ) (1 z ) z u olduğundan, U rasgele değişkeninin olasılık yoğunluk fonksiyonu 2 u ln(u ) ((1 u ) ln(1 u ) , 0 u 1 fU (u ) , d . y. 0 olarak bulunur Buraya kadar, X ve Y rasgele değişkenlerinin ortak olasılık veya olasılık yoğunluk fonksiyonu verildiğinde, g : 2 olmak üzere, g ( X , Y ) tek boyutlu rasgele değişkeninin olasılık fonksiyonu elde edilmeye çalışıldı. Şimdi, X1, , X k rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu verildiğinde, i 1, 2,3,..., k , gi : k reel değerli fonksiyonları için Y1 g 1 ( X1, , X k ) , Y 2 g 2 ( X1, , X k ) ,…, Y k g k ( X1 , , X k ) rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonunu bulalım. Burada verilen dönüşümlerden i 1, 2,3,..., k için X i lerin X 1 h1 (Y1 , , Yk ) , X 2 h 2 (Y1, , Yk ) ,…, X k h k (Y1 , , Yk ) şeklinde ters dönüşümlerinin bulunduğunu ve h i , i 1, 2,3,..., k fonksiyonlarının her bir bileşenine göre türevlenebildiğini varsayalım. Buradan, Jacobien matrisi 134 MATEMATİKSEL İSTATİSTİĞE GİRİŞ h1 (Y1, , Yk ) Y1 h (Y , , Y ) k 2 1 Y1 J . . . h k (Y1 , , Yk ) Y1 h1 (Y1 , , Yk ) Y2 h 2 (Y1, , Yk ) Y2 . . . h k (Y1, , Yk ) Y2 . . . . . . . . . h1 (Y1, , Yk ) Yk h 2 (Y1 , , Yk ) Yk . . . h k (Y1, , Yk ) Yk olarak yazılır. X1, X 2, , X k rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu f ( x1 , , xk ) ise Y1, Y 2, , Y k rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu, | J | | det( J ) | olmak üzere, y 1, , y k DY1,,Y k için fY1,,Y k ( y1, , yk ) | J | f X 1 ,, X k (h1 ( y1, , yk ), h 2 ( y1, , yk ),..., h k ( y1, , yk )) şeklindedir. Örnek 3.2.4 a) X ve Y aynı dağılımlı bağımsız rasgele değişkenlerinin olasılık yoğunluk fonksiyonu, f ( x) 2 1 e x /2 , x 2 şeklinde verilmiş olsun. U X Y ve V X Y rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonunu bulalım. Ters dönüşümler X (U V ) / 2 ve Y (U V ) / 2 olup Jacobien matrisi ve determinantı, X U J Y U X 1 V 2 Y 1 V 2 1 2 1 2 ve det( J ) 1 2 dir. X ve Y bağımsız olduğundan ortak olasılık yoğunluk fonksiyonu x, y için, f ( x, y ) f X ( x) fY ( y ) 1 x 2 /2 1 y 2 /2 1 ( x 2 y 2 )/2 e e e 2 2 2 dir. Buradan U ve V nin ortak olasılık yoğunluk fonksiyonu, u , v için RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ 135 1 u v 2 u v 2 1 1 exp 2 2 2 2 2 1 1 exp (u v )2 (u v) 2 4 8 1 1 (u 2 v 2 ) / 4 1 exp 2u 2 2v 2 e 4 4 8 J f X ,Y x(u, v), y (u , v) fU ,V (u, v) şekildedir. Ayrıca bu ortak olasılık yoğunluk fonksiyonu fU ,V (u, v) 1 (u 2 v 2 )/4 e 4 1 u 2 /4 e 4 1 v 2 /4 e fU (u ) fV (v) 4 şeklinde yazılabildiğinden, fU ,V (u , v) fU (u ) fV (v ) eşitliği sağlanır. Yani, U ve V rasgele değişkenleri bağımsızdır. b) Şimdi de U X / Y rasgele değişkeninin olasılık yoğunluk fonksiyonunu bulalım. Bunun için, V Y şeklinde bir yardımcı dönüşüm tanımlayalım. Buradan, U X / Y ve V Y rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu elde edildiğinde U nun marjinal olasılık yoğunluk fonksiyonu bulunur. Ters dönüşümler X U V ve Y V olup Jacobien matrisi ve determinantı, X U J Y U X V v u Y 0 1 V ve det( J ) v şeklindedir. Buna göre, U ve V nin ortak olasılık yoğunluk fonksiyonu u , v DU ,V için fU ,V (u , v) | J | f X ,Y ( x(u , v), y (u, v)) |v| 1 exp [(uv )2 v 2 )] 2 2 v2 |v| exp [u 2 1] 2 2 dir. Herhangi bir h( x) fonksiyonu çift ( h( x) h( x) ) ise, a için, a a a 0 h( x) dx 2 h( x) dx 136 MATEMATİKSEL İSTATİSTİĞE GİRİŞ dir. Buna göre, U ve V nin ortak olasılık yoğunluk fonksiyonu v ye göre çifttir. Ortak olasılık yoğunluk fonksiyonunun DV üzerinden integrali ( a u 2 1 diyelim), fU (u ) fU ,V (u, v) dv 1 e at dt , 1 a at e 1 2 t 0 | v | e a v 2 /2 dv 2 2 ve a v2 / 2 dv 0 v2 dönüşümü ile 2 1 1 1 t 0 a 1 u2 olup U rasgele değişkeninin olasılık yoğunluk fonksiyonu, fU (u ) 1 1 1 u2 , u olarak bulunmuştur Örnek 3.2.5 a) X ve Y aynı dağılımlı bağımsız rasgele değişkenlerinin olasılık yoğunluk fonksiyonu, e x f ( x) 0 olsun. U X Y , x0 , d . y. ve V X / ( X Y ) rasgele değişkenlerinin olasılık yoğunluk fonksiyonlarını bulalım. Ters dönüşümler, X U V ve Y U (1 V ) olup Jacobien matrisi ile determinantı, X U J Y U X u V v Y (1 v) u V ve det( J ) uv u (1 v) u dir. X ve Y bağımsız olduğundan ortak olasılık yoğunluk fonksiyonu, e ( x y ) f ( x, y ) 0 , x 0, y 0 , d . y. RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ 137 dır. U ve V nin ortak olasılık yoğunluk fonksiyonu ise 0 v 1 ve u 0 için, uv (u (1 v ) fU ,V (u, v) | J | f X ,Y ( x(u, v), y (u , v)) | u | e u eu şeklindedir. Daha açık olarak ortak olasılık yoğunluk fonksiyonu, u eu fU ,V (u , v) 0 , 0 v 1, u 0 , d . y. dir. Bu ortak olasılık yoğunluk fonksiyonundan U ve V nin marjinal olasılık yoğunluk fonksiyonları da, 1 1 fU ,V (u, v) dv v 0 u u e dv u e u ve v 0 fU ,V (u, v) du u 0 u eu du 1 u 0 integrallerinin sonucundan u eu fU (u ) 0 , u 0 , d . y. olarak bulunmuştur. Ayrıca, 1 , fV (v) 0 , 0 v 1 d . y. fU ,V (u , v) fU (u ) fV (v ) olduğundan U ve V rasgele değişkenleri bağımsızdır (bu sonuç Teorem (7.4.2) den de elde edilebilirdi). b) X , Y aynı dağılımlı bağımsız rasgele değişkenlerinin olasılık yoğunluk fonksiyonu, 1 , 0 x 1 f ( x ) fY ( x ) d . y. 0 , olarak verildiğinde, U X Y rasgele değişkeninin olasılık yoğunluk fonksiyonunu bulalım. V X yardımcı dönüşümü ile ters dönüşümler, X V ve Y U / V olup Jacobien matrisi ile determinantı, X U J Y U X 1 0 V 1 u 2 Y v v V , det( J ) 1 v şeklinde hesaplanmıştır. Buradan, U ve V nin ortak olasılık yoğunluk fonksiyonu, 1 , 0 u v 1 fU ,V (u , v) v 0 , d . y. 138 MATEMATİKSEL İSTATİSTİĞE GİRİŞ olup U nun marjinal olasılık yoğunluk fonksiyonu, 1 fU ,V (u, v) dv vDV v u dv ln(u ) v den, ln(u ) , 0 u 1 fU (u ) , d . y. 0 olarak bulunur. c) X1, X 2 , X 3 rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu, 6 e x1 x2 x3 f X1 , X 2 , X 3 ( x1, x2 , x3 ) 0 , 0 x1 x2 x3 , d . y. olarak verilmiş olsun. U1 X1 , U 2 X 2 X1 ve U 3 X 3 X 2 rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonunu bulalım. Ters dönüşümler, X1 U1 X 2 U1 U 2 , X 3 U1 U 2 U 2 olup Jacobien matrisi ve determinantı X1 U1 X2 J U1 X 3 U1 X1 U 2 X2 U 2 X3 U 2 X1 U 3 1 0 0 X2 1 1 0 U 3 1 1 1 X3 U 3 , det( J ) 1 dir. Buradan, U1 , U 2 , U 3 rasgele değişkenlerinin ortak olasılık fonksiyonu, 6 e3u1 2u2 u3 fU1 ,U 2 ,U 3 (u1, u2 , u3 ) 0 , ui 0 , i 1, 2,3 , d . y. şeklinde bulunmuş olur. Diğer taraftan, marjinaller hesaplandığında, X1, X 2 , X 3 rasgele değişkenleri bağımsız olmamasına rağmen, fU1,U 2 ,U 3 (u1, u2 , u3 ) fU1 (u1 ) fU 2 (u2 ) fU 3 (u3 ) eşitliği sağlandığından, U1 , U 2 , U 3 rasgele değişkenleri bağımsızdır RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ 139 3.3. Üretici Fonksiyonlar Tekniği İkinci bölümde, bazı üretici fonksiyonlardan söz edildi. Bu fonksiyonlar genellikle rasgele değişkenlerin momentlerinin hesaplanmasında kullanılmakla birlikte bazen rasgele değişkenlerin dönüşümlerinin olasılık fonksiyonlarının bulunmasında da kullanılır. Dönüşümün moment çıkaran fonksiyonu (varsa) bilinen bir dağılımın moment çıkaran fonksiyona benzeyebilir. X ve Y bağımsız rasgele değişkenler olmak üzere, U X Y rasgele değişkeninin moment çıkaran fonksiyonu, X ve Y nin moment çıkaran fonksiyonlarının çarpımı olarak yazılabildiğini ( MU (t ) M X Y (t ) M X (t ) M Y (t ) ) biliyoruz. Benzer şekilde, U nun karekteristik fonksiyonu da U (t ) X Y (t ) X (t ) Y (t ) dir. U nun moment çıkaran fonksiyonu (veya karekteristik fonksiyonu) bazen olasılık fonksiyonuna ihtiyaç duyulmadan bulunabilir. U nun moment çıkaran fonksiyonu (veya karekteristik fonksiyonu) bilinen bir dağılımın (genellikle beşinci bölümde bahsedilecek dağılımlar) moment çıkaran fonksiyonu ile aynı ise U nun olasılık veya olasılık yoğunluk fonksiyonu, o dağılımın olasılık veya olasılık yoğunluk fonksiyonu olur. Var olması halinde genellikle moment çıkaran fonksiyonu kullanılır. Moment çıkaran fonksiyonunun olmadığı hallerde karekteristik fonksiyon kullanılabilir. Örnek 3.3.1 a) X rasgele değişkeninin olasılık yoğunluk fonksiyonu, f ( x) 1 1 1 x2 , x olsun. Bu rasgele değişkenin moment çıkaran fonksiyonu yoktur, karekteristik fonksiyonu ise t için X (t ) e | t | dir (Örnek (2.6.5)). Bu olasılık yoğunluk fonksiyonuna sahip bağımsız rasgele değişkenler X1, X 2 , , X n olsun. X i lerin örneklem ortalaması olarak bilinen X n ( X1 X n ) / n rasgele değişkenini tanımlayalım. Bu rasgele değişkenin karekteristik fonksiyonu, X (t ) E (ei t X n ) E (ei t X1 X n / n ) n n E (e(i t / n ) X k ) [ X (t / n)]n [e |t / n| ]n e | t | X (t ) k 1 140 MATEMATİKSEL İSTATİSTİĞE GİRİŞ olduğundan, X n ile X i rasgele değişkenlerinin karekteristik fonksiyonları aynıdır. O halde, her ikisi de aynı olasılık yoğunluk fonksiyonuna sahiptir. Yani, X n nin olasılık yoğunluk fonksiyonu, f X ( y) n 1 1 , y 1 y2 dir. b) X rasgele değişkeninin olasılık yoğunluk fonksiyonu, 1 1 e 2 x , x 0 f ( x) 2 x3 0 , d . y. olsun. X in karekteristik fonksiyonu (Maple VIII paket programı yardımı ile), X (t ) E (e it X ) 0 e 2 i t 1 2 x3 e 1 i t x 2x dx 1 1 1 2 i t 2 i t 1 e 2 i t e 2 i t e 2 it 1 1 2 i t 2 i t olarak hesaplanmıştır. Bu olasılık yoğunluk fonksiyonuna sahip bağımsız rasgele değişkenler X1, X 2 , , X n olmak üzere, X n ( X1 X n ) / n örneklem ortalamasının olasılık yoğunluk fonksiyonunu bulalım. X n nin karekteristik fonksiyonu it X n X (t ) E (e n e ) E (e n 2 it / n it X1 X n / n n ) E (e (it / n) X k k 1 e 2 it / n ) ( X (t / n)) e n 2 i t / n n X (t / n) olup, X n ile X / n rasgele değişkeninin olasılık yoğunluk fonksiyonları aynıdır. Buradan, X n nin olasılık yoğunluk fonksiyonu y 0 için f X ( y ) n f X (n y ) n veya daha açık olarak, n n 2 (ny ) 3 e 1/(2 ny ) 1 2 n y 3 e 1/(2 ny ) RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ 1 1 2n y e f X ( y) 3 2 n y n 0 , y0 , d . y. 141 şeklindedir Bir X rasgele değişkeninin moment çıkaran fonksiyonu M X (t ) , karekteristik fonksiyonu da X (t ) olsun. Y a X b rasgele değişkeninin moment çıkaran fonksiyonu, M Y (t ) M b a X (t ) E (e(b a X ) t ) ebt E (e at X ) ebt M X (a t ) ve karekteristik fonksiyonu da, Y (t ) ba X (t ) E (ei (b a X ) t ) eibt E (ei at X ) eibt X (a t ) şeklindedir. Örnek 3.3.2 a) X ve Y aynı olasılık fonksiyonuna sahip bağımsız rasgele değişkenler olsun. Olasılık fonksiyonu 0 için P( X x) e x / x ! , x 0,1, 2,... olarak verildiğinde, U X Y rasgele değişkeninin olasılık fonksiyonunu bulalım. t X in moment çıkaran fonksiyonunun M X (t ) e (e 1) (Örnek (2.5.3a)) olduğunu biliyoruz. Buradan, U rasgele değişkeninin moment çıkaran fonksiyonu, t t t MU (t ) M X Y (t ) M X (t ) M Y (t ) (e (e 1) )(e (e 1) ) e2 ( e 1) olup, X in moment çıkaran fonksiyonunda yerine 2 gelmiştir. Buradan, U nun olasılık fonksiyonu X in olasılık fonksiyonunda yerine 2 yazılması ile elde edilir. Yani, U nun olasılık fonksiyonu, P(U u ) e2 (2 )u / u ! , u 0,1, 2,... dir (Örnek (3.2.2) ile karşılaştırınız). b) 0 p 1 ve q 1 p olmak üzere bağımsız X ve Y rasgele değişkenlerinin olasılık fonksiyonları, 142 MATEMATİKSEL İSTATİSTİĞE GİRİŞ P( X x) P(Y x) p x q1 x , x 0,1 olarak verilmiş olsun. Dolayısı ile, X ve Y nin moment çıkaran fonksiyonları da aynıdır. X in moment çıkaran fonksiyonu, 1 M X (t ) E (et X ) et x P( X x) q p et x 0 olup U X Y rasgele değişkeninin moment çıkaran fonksiyonu da, MU (t ) M X Y (t ) M X (t ) M Y (t ) (q p et )(q p et ) (q p et ) 2 dir. Olasılık fonksiyonu, 2 P( Z x) p x q 2 x , x 0,1, 2 x olan bir Z rasgele değişkenin moment çıkaran fonksiyonu (beşinci bölümde bahsedilecek olan özel dağılımlardan biridir) 2 2 2 2 M Z (t ) E (et Z ) et x p x q 2 x ( pet ) x q 2 x (q pet )2 x x 0 x 0 x dir. Buradan, U X Y rasgele değişkeninin moment çıkaran fonksiyonu ile Z nin moment çıkaran fonksiyonu aynıdır. O halde, U nın olasılık fonksiyonu 2 P(U u ) pu q 2u , u 0,1, 2 u dir. c) Bağımsız X ve Y rasgele değişkenlerinin olasılık yoğunluk fonksiyonları x , y ve x 0 , y 0 için, f X ( x) 1 exp 2 ( x x )2 , x 2 2 x2 x fY ( y ) 1 exp 2 ( y y )2 , y 2 y 2 2y 1 1 olarak verilmiş olsun. Bu rasgele değişkenlerin moment çıkaran fonksiyonları, RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ 143 t 2 y2 t 2 x2 M X (t ) exp t x ve M Y (t ) exp t y 2 2 olup U X Y nin moment çıkaran fonksiyonu x y ve 2 x2 y2 olmak üzere, t 2 x2 t 2 x2 MU (t ) M X Y (t ) M X (t ) M Y (t ) exp t x exp t x 2 2 t 2 ( x2 x2 ) t 2 2 exp t ( x y ) exp t 2 2 dir. Buna göre, U nun moment çıkaran fonksiyonu ile, X in moment çıkaran fonksiyonu aynı yapıdadır ( x yerine , x2 yerine 2 gelmiştir). Buna göre, U nun olasılık yoğunluk fonksiyonu, fU (u ) 1 exp 2 (u ) 2 , u 2 2 2 1 şeklinde yazılabilir. Benzer şekilde, V X Y rasgele değişkeninin moment çıkaran fonksiyonu da, MV (t ) M X Y (t ) E et ( X Y ) E et X ) E et Y ) M X (t ) M Y (t ) t 2 y2 t 2 x2 exp t x exp t y 2 2 t 2 ( x2 x2 ) t 2 2 exp t ( x y ) exp t 2 2 olup olasılık yoğunluk fonksiyonu, x y ve 2 x2 y2 olmak üzere, fV (v) şeklindedir 1 exp 2 (v ) 2 , v 2 2 2 1 144 MATEMATİKSEL İSTATİSTİĞE GİRİŞ 3.4. Çözümlü Problemler 3.4.1 Bağımsız aynı dağılımlı X1 ve X 2 rasgele değişkenlerinin olasılık yoğunluk fonksiyonu 1/ f ( x) 0 , 0 x , d . y. olmak üzere Y1 min( X1, X 2 ) ve Y2 max( X1, X 2 ) rasgele değişkenlerini tanımlayalım. E (Y1 ) , E (Y 2 ) ve E (Y1 / Y 2 ) değerlerini hesaplayınız. Çözüm: Y1 ve Y 2 rasgele değişkenlerinin marjinal olasılık yoğunluk fonksiyonları, 2 y1 2 y2 2 1 , 0 y1 fY1 ( y1 ) , f ( y ) Y2 2 0 0 , d . y. ve Y1 ve Y 2 nin ortak olasılık yoğunluk fonksiyonu da , 0 y2 , d . y. 2 2 , 0 y1 y2 fY1 ,Y2 ( y1 , y2 ) , d . y. 0 dir (Casella ve Berger, 2002, sayfa 230). Marjinal olasılık yoğunluk fonksiyonlarından beklenen değerler E (Y1 ) / 3 ve E (Y 2 ) (2 ) / 3 olarak hesaplanmıştır. U Y1 / Y 2 rasgele değişkeninin olasılık yoğunluk fonksiyonu için V Y2 yardımcı dönüşümünü tanımlayalım. Ters dönüşümler Y1 UV ve Y2 V olup Jacobien matrisi ve determinantı Y1 U J Y2 U Y1 V v u , Y2 0 1 V det( J ) v şeklinde hesaplanmıştır. U ve V nin sınırları, 0 u 1 ve 0 v olup ortak olasılık yoğunluk fonksiyonu, 2 v 2 , 0 u 1, 0 v fU ,V (u , v) , d . y. 0 dir. Ortak olasılık yoğunluk fonksiyonunun V nin değer kümesi üzerinden integrali v 0 fU ,V (u, v) dv 2 v 2 dv 1 v 0 olduğundan U nun marjinal olasılık yoğunluk fonksiyonu, RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ 145 1 , 0 u 1 fU (u ) d . y. 0 , olup, E (U ) 1/ 2 dır. Ayrıca, E (Y1 ) / 3 ve E (Y 2 ) (2 ) / 3 olduğundan, E (Y1 ) E (Y 2 ) /3 1 E (U ) E (Y1 / Y 2 ) 2 / 3 2 elde edilir. Genel olarak E (Y1 ) / E (Y 2 ) E (Y1 / Y 2 ) dir. 3.4.2 X1, , X n bağımsız aynı olasılık yoğunluk fonksiyonuna sahip rasgele değişkenler olsun. i 1, 2,3,..., n için X i lerin olasılık yoğunluk fonksiyonu ek f X k ( xk ) k 0 x , x0 , d . y. olarak verildiğinde Y min( X1, , X n ) olmak üzere P (Y X k ) olasılığını hasaplayınız. Çözüm: Önce, Y nin olasılık yoğunluk fonksiyonunu bulalım. Y nin dağılım fonksiyonu, 1 2 ... n olmak üzere, FY ( y ) P(Y y ) P(min{ X1 , X 2 ,..., X n } y ) 1 P (min{ X1 , X 2 ,..., X n } y ) n n 1 P X1 y, X 2 y,..., X n y 1 P( X i y ) 1 i ei x dx i 1 i 1 y n n ( ... n ) y 1 ei x 1 ei y 1 e 1 2 1 e y x y i 1 i 1 olup, olasılık yoğunluk fonksiyonu, e y fY ( y ) 0 , y0 , d . y. olarak elde edilmiştir. Buradan da P (Y X k ) olasılığı da, P Y X k P( X1 X k , X 2 X k ,..., X k 1 X k , X k 1 X k ,..., X n X k ) P( X1 X k , X 2 X k ,..., X k 1 X k , X k 1 X k ,..X n X k | X k t ) f X k (t )dt 0 P( X1 t , X 2 t ,..., X k 1 t , X k 1 t ,..X n t ) f X k (t )dt 0 146 MATEMATİKSEL İSTATİSTİĞE GİRİŞ n n t ei t k e k dt k ei t dt k e(1 2 ...n ) t dt 0 i 1, i k 0 i 1 0 k (1 2 ...n ) t e (1 2 ... n ) k t 0 (1 2 ... n ) olarak bulunmuştur. 3.4.3 Beklenen değeri , varyansı 2 olan bağımsız aynı dağılımlı rasgele değişkenlerin dizisi { X n , n } olsun. Ayrıca, X i rasgele değişkenlerinden bağımsız, negatif değerler almayan sonlu beklenen değer ve varyansa sahip kesikli bir rasgele değişken de N olsun. S0 0 ve S n X1 X 2 X n olacak şekilde S N rasgele 2 değişkenini tanımlayalım. E ( S N ) , E ( S N ) ve Var ( S N ) değerlerini hesaplayınız. Çözüm: Önce, E ( S N ) değerini hesaplayalım. N n verildiğinde, E ( S n ) E ( X1 X 2 X n ) n olduğundan E ( S N ) beklenen değeri n1 n 1 n 1 E ( S N ) E S N | N n P ( N n) E Sn P ( N n) n P ( N n) E ( N ) olarak bulunur. Benzer şekilde N n verildiğinde, Var ( Sn ) ve E ( S n2 ) değerleri de Var ( Sn ) Var ( X1 X 2 X n ) n 2 ve E ( Sn2 ) Var ( S n ) ( E ( S n )) 2 2 olup, E ( S N ) beklenen değeri E ( S N2 ) E S N2 | N n P( N n) E S n2 P( N n) n1 n1 n1 Var ( Sn ) ( E ( Sn ))2 P( N n) n 2 n 2 2 P ( N n) n 1 n1 n 1 2 n P ( N n) 2 n2 P ( N n) 2 E ( N ) 2 E ( N 2 ) şeklinde bulunmuştur. Son olarak varyansın tanımından, Var ( S N ) E ( S N2 ) ( E ( S N )) 2 2 E ( N ) 2 E ( N 2 ) 2 ( E ( N ))2 2 E ( N ) 2 [ E ( N 2 ) ( E ( N ))2 ] 2 E ( N ) 2 Var ( N ) RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ 147 elde edilir. 3.4.4 X ve Y nin ortak olasılık yoğunluk fonksiyonu, 0 1 için f ( x, y ) 1 x 2 y 2 2 x y , x, y exp 2 2 1 2 2(1 ) 1 şeklinde verilmiş olsun. a) U X Y ve V Y nin ortak olasılık yoğunluk fonksiyonunu bulunuz. b) U X Y ve V X Y nin ortak olasılık yoğunluk fonksiyonunu bulunuz. Çözüm: a) Ters dönüşümler X U V ve Y V olup Jacobien matrisi ve determinantı, X1 V 1 Y 0 1 V X U J Y U ve det( J ) 1 şeklinde hesaplanmıştır. Buradan U ve V nin ortak olasılık yoğunluk fonksiyonu, fU ,V (u , v) 1 exp (u v)2 v 2 2 (u v)v 2 2 1 2 2(1 ) 1 1 2 exp u v 2 (1 2 ) 2(1 2 ) 2 1 2 1 u 2 1 v 2 exp exp f (u ) fV (v) 2(1 2 ) 2 2 U 2 (1 2 ) 1 dir. Görüldüğü gibi, U ve V bağımsız rasgele değişkenlerdir. b) Ters dönüşümler X (U V ) / 2 ve Y (U V ) / 2 olup Jacobien matrisi ve determinantı X U J Y U X 1 V 2 Y 1 V 2 1 2 1 2 ve det( J ) 1 2 dir. Buradan, U ve V nin ortak olasılık yoğunluk fonksiyonu 148 MATEMATİKSEL İSTATİSTİĞE GİRİŞ u v 2 u v 2 1 u v u v fU ,V (u, v) exp 2 2(1 2 ) 2 2 2 2 4 1 2 1 1 (u v) 2 (u v )2 2 (u v)(u v) exp 2 4 1 2 8(1 ) 1 1 u 2 (1 2 ) v 2 (1 2 ) exp 2 4 1 2 4(1 ) 1 olarak bulunur. Ayrıca, fU ,V (u , v) fU (u ) fV (v ) olması için gerek ve yeter koşul 0 olmasıdır. 3.4.5 Bağımsız X1 ve X 2 rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu, 1 , 0 x1 1 , 0 x2 1 f ( x1, x2 ) d . y. 0 , olarak verilsin. Y1 (2 ln( X1 ))1/2 cos(2 X 2 ) ve Y2 (2 ln( X1 ))1/2 sin(2 X 2 ) rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonunu bulunuz. Çözüm: Ters dönüşümler, 2 Y12 Y22 2 ln( X1 ) X1 e (Y1 Y22 ) / 2 ve Y Y1 1 tan(2 X 2 ) X 2 arctg 1 Y2 2 Y2 olup kısmi türevler, 2 2 2 2 X1 X1 Y1 e (Y1 Y2 )/2 , Y2 e (Y1 Y2 )/2 Y1 Y2 Y1 X2 1 Y2 X2 1 , Y1 2 Y12 Y22 Y 2 2 Y12 Y22 şeklindedir. Buradan Jacobien matrisi ve determinantı ise Y e (Y12 Y22 )/2 1 J 1 Y2 2 2 Y1 Y22 2 Y2 e(Y1 Y22 )/2 Y1 1 2 Y12 Y22 , det( J ) olup Y1 ve Y 2 nin ortak olasılık yoğunluk fonksiyonu, 1 (Y12 Y22 )/2 e 2 RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ fY1 ,Y2 ( y1, y2 ) 149 1 ( y12 y22 )/2 e , y1, y2 2 olarak elde edilmiştir. Ayrıca, her y1 , y2 için 1 fY1 ,Y2 ( y1, y2 ) 2 1 2 y1 e 2 1 2 1 2 y2 e fY1 ( y1 ) fY2 ( y2 ) 2 olduğundan Y1 ve Y 2 bağımsızdır. Bu dönüşümler (literatürde Box-Müller metodu olarak bilinir) normal dağılımdan veri üretmek için kullanılmaktadır. Monte-Carlo yöntemi tamamen bu dönüşüme dayanır. 3.4.6 X1, , X n bağımsız aynı dağılıma sahip rasgele değişkenleri (1/ ) e x / f ( x) 0 , x0 , d . y. olasılık yoğunluk fonksiyonuna sahip olsun. Y1 min{ X1 , , X n } , Y 2 İkinci en küçük{ X1, , X n } , Y 3 Üçüncü en küçük{ X1, , X n } … Y n max{ X1, , X n } olmak üzere, Y i ve Y j rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu, y i y j için fYi ,Y j ( yi , y j ) n! i 1 f X ( yi ) f X ( y j ) F ( yi ) (i 1)!( j i 1)!(n j )! *[ F ( y j ) F ( yi )] j i 1[1 F ( y j )] n j ve Y1, Y2 , Yn rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu da, n n ! f ( y ) , fY1,,Yn ( y1, , yn ) i 1 X i i 0 , şeklindedir. Buna göre, y1 y2 yn d . y. a) R Y n Y1 rasgele değişkeninin olasılık yoğunluk fonksiyonunu bulunuz. b) U1 Y1 , U 2 Y2 Y1, U 3 Y3 Y2 , ..., U n Y n Y n1 rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonunu bulunuz. 150 MATEMATİKSEL İSTATİSTİĞE GİRİŞ Çözüm: a) X in dağılım fonksiyonu, x 0 için F ( x) 1 e x / olup Y 1 ve Y n rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu (Teorem 6.4.1), fY1 ,Yn ( y1, yn ) n! f X ( y1 ) f X ( yn )[ F ( yn ) F ( y1 )] n 2 , y1 yn (n 1 1)! şeklinde yazılır. Daha açık olarak, Y1 ve Y n rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu y1 yn için, fY1 ,Yn ( y1, yn ) n(n 1) f X ( y1 ) f X ( yn )[ F ( yn ) F ( y1 )] n2 n(n 1) 2e ( y1 yn )/ [(1 e yn / ) (1 e y1 / )]n 2 n(n 1) 2e ( y1 yn )/ [e y1 / e yn / ]n2 şeklindedir. Buradan, R nin olasılık yoğunluk fonksiyonu r 0 için, f R (r ) n(n 1) n2 F (u r ) F (u) f (u ) f (u r ) du n(n 1) eu / e (u r ) / n2 2e u / e (u r ) / du 0 1 e r / n2 n(n 1) e r / 1 e r / n2 n(n 1) e r / 2 e ( n 2)u / 2u / e du 0 2 e nu / du (n 1) 1 e r / [1 e r / ]n2 0 integralinin sonucundan, n2 (n 1) 1 e r / 1 e r / f R (r ) 0 , r0 , d . y. şeklinde bulunmuştur. b) Ters dönüşümler, Y1 U1 , Y2 U1 U 2 , Y3 U1 U 2 U 3 , ..., Yn U1 U 2 ... U n şeklinde olup Jacobien matrisi ve determinantı, RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ 1 1 1 J . . 1 0 1 1 . . 0 0 1 . . . . . . . 1 1 1 1 151 0 0 . ve det( J ) 1 . . 1 . . . . . dir. Dolayısı ile, U i , i 1, 2,3,..., n rasgele değişkenlerinin ortak olasılık yoğunluk fonksiyonu, n fU 1 ,,U n (u1,, u n ) n! f Xi ( yi (u1,, u n )) n! f X (u1) f X (u1 u 2 )... f X (u1 u 2 ... u n ) i1 n! 1 n nu1/ (n1) u 2 / (n2) u 3 / e e e u n / ... e n nu / (n 1) (n1) u 2 / (n 2) (n2) u 3 / 1 u n / e 1 e e ... e fU1 (u1) fU2 (u 2 ) fU3 (u 3 )... fUn (u n ) şeklindedir. Burada, (n k 1) ( nk 1) u / e f U k (u ) 0 , u0 , d . y. olup, U 1, ,U n rasgele değişkenleri bağımsızdır. 3.4.7 X ve Y rasgele değişkenlerinin ortak dağılım fonksiyonu, 0 x2 y 1 F ( x, y ) min( x, y ) 2 2 1 olarak verilmiş olsun. , x, y 0 , 0 x, y 1 , x, y 1 a) X ve Y nin marjinal olasılık yoğunluk fonksiyonlarını bulunuz b) P (Y 1 / 2 | X 1 / 2) koşullu olasılığını hesaplayınız. c) Z min{ X , Y } rasgele değişkeninin olasılık yoğunluk fonksiyonunu bulunuz. Çözüm: a) X ve Y rasgele değişkenlerinin marjinal dağılım fonksiyonları sırası ile, 152 MATEMATİKSEL İSTATİSTİĞE GİRİŞ 1 1 FX ( x) lim FX ,Y ( x, y ) ( x x 2 ) , FY ( y ) lim FX ,Y ( x, y ) ( y y ) y 2 2 y x olup marjinal olasılık yoğunluk fonksiyonları da, x (1/ 2) , 0 x 1 f X ( x) , 0 , d . y. 1 , 0 y 1 fY ( y ) d . y. 0 , dir. b) P (Y 1 / 2 | X 1 / 2) olasılığı X in marjinal olasılık yoğunluk fonksiyonundan, P(Y 1/ 2 , X 1/ 2) P(Y 1/ 2 ) P(Y 1/ 2, X 1/ 2) P( X 1 / 2) 1 P( X 1/ 2) 3 1 1 1 (1/ 4) (1 / 2) 1 1 1 3 2 2 22 2 4 16 16 0.3 3 5 10 1 11 1 1 8 8 2 42 P(Y 1/ 2 | X 1/ 2) şeklinde hesaplanmıştır. c) Z min( X , Y ) rasgele değişkeninin değer kümesi, DZ [0,1] olup, dağılım fonksiyonu z 0 için FZ ( z ) 0 ve z 1 için FZ ( z ) 1 olduğu açıktır. Ayrıca, 0 z 1 için dağılım fonksiyonunun değeri de FZ ( z ) P( Z z ) P(min( X , Y ) z ) P ( X z veya Y z ) P( X z ) P( X z ) P( X z, Y z ) z z2 z z3 1 z z 2 z 1 z 2 2 2 olduğundan Z nin dağılım fonksiyonu ve türevinden olasılık yoğunluk fonksiyonu , z0 0 1 FZ ( z ) z (2 z )(1 z ) , 0 z 1 , 2 , z0 1 2 z (2 z ) 1 z fZ ( z) 2 0 , 0 z 1 , d . y. şeklindedir. 3.4.8 Bağımsız X ve Y sürekli rasgele değişkenlerinin dağılım fonksiyonu F ( x) , olasılık yoğunluk fonksiyonu f ( x) olsun. a) P ( X Y ) olasılığını hesaplayınız. RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ 153 b) X ve Y rasgele değişkenlerinin olasılık yoğunluk fonksiyonları sırası ile, 1 1 , 0 xa , 0 xb f X ( x) a fY ( y ) b 0 , 0 , d . y. d . y. şeklinde verildiğinde P ( X Y ) olasılığını hesaplayınız. c) b a ise Z X Y rasgele değişkeninin olasılık yoğunluk fonksiyonunu bulunuz. Çözüm: a) Bu olasılık doğrudan, P ( X Y ) P ( X Y | Y y ) f ( y ) dy P ( X y ) f ( y ) dy (1 F ( y )) f ( y ) dy 2 1 F ( y ) f ( y ) dy 1 F ( y) 1 2 y 1 1 2 2 şeklinde bulunmuştur. Rasgele değişkenlerinin dağılım fonksiyonları farklı ise, P( X Y ) P( X Y |Y y) fY ( y) dy P( X y) fY ( y) dy (1 FX ( y)) fY ( y) dy 1 1 1 FX ( y) fY ( y) dy 1 EY FX (Y ) 1 2 2 olup P ( X Y ) olasılığı her iki durumda da aynıdır. Y sürekli rasgele değişken ise, U FX (Y ) rasgele değişkeninin olasılık yoğunluk fonksiyonu, 1 , 0 u 1 fU (u ) d . y. 0 , olup E (U ) 1/ 2 dır (Örnek 3.1.4). b) a b ise (b, a ) aralığında, fY ( y ) 0 olup, a b için P ( X Y ) olasılığı b b b 1 b y1 P( X Y ) 1 FX ( y ) fY ( y ) dy 1 dy 1 y dy 1 ab 2a ab 0 0 0 dir. Şimdi, a b olsun. Bu durumda (a, b) aralığında FX ( x) 1 olup, a b için 154 MATEMATİKSEL İSTATİSTİĞE GİRİŞ b a b y1 y1 P( X Y ) 1 FX ( y ) fY ( y ) dy 1 dy 1 dy 1. fY ( y ) dy 0 0 a b 0 a b a 1 b 1 a 1b a y dy dy ab 0 ba 2b dir. c) b a ise bağımsız X ve Y değişkenlerinin ortak olasılık yoğunluk fonksiyonu, 1 f X ,Y ( x, y ) a 2 0 , 0 x, y a , d . y. şeklindedir. Buradan, DZ [ a, a ] olup Z nin dağılım fonksiyonu z a için FZ ( z ) 0 ve z a için FZ ( z ) 1 dir. Ayrıca, FZ ( z ) P ( Z z ) P ( X Y z ) olup iki durum ayrı ayrı incelenmelidir. a z 0 için FZ ( z ) değeri (şekildeki taralı alan) a y z FZ ( z ) P( Z z ) P( X Y z ) z 0 1 a2 dx dy 1 a (a z ) 2 a2 z 2 a2 ( y z ) dy olur. Şekil 3.4.1 Problem (3.4.8) için fonksiyonun tanım bölgeleri 0 z a aralığında dağılım fonksiyonunun değeri için Şekil (3.4.1) de gösterilen Ai bölgelerinin alanlarının bulunması gerekir. Şekilden de görüldüğü gibi, dağılım fonksiyonu aşağıda belirtilen alanların toplamıdır. Yani, FZ ( z ) P( Z z ) P( X Y z ) ( A1 A2 A3 ) / a 2 dir. Şekildeki bölgelerin alanları ( A1 , A2 ve A3 bölgeleri) Alan( A1 ) a 2 / 2 , Alan( A 2 ) z 2 / 2 ve Alan( A3 ) 1 z 2(a z )2 z (a z ) 2 olarak hesaplanmıştır. FZ ( z ) ( A1 A2 A3 ) / a 2 olasılığından FZ ( z ) nin değeri 0 z a için, RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ 155 FZ ( z ) P ( Z z ) P ( X Y z ) ( A1 A2 A3 ) / a 2 1 a 2 (a2 / 2) ( z 2 / 2) z(a z) 1 a z 2 z (a z ) (a z ) 2 z 2 2 a 2 a2 dir. İki sonuç birleştirildiğinde, Z nin dağılım fonksiyonu ve olasılık yoğunluk fonksiyonu 2 2 2 0 2 (a z ) 2a 2 FZ ( z ) 2 2 (a z ) 2 z 2a 2 1 , 2 z a , a z 0 , , 0 za , za (a z ) 2 a (a z ) fZ ( z) 2 a 0 , a z 0 , 0 za , d . y. şeklinde elde edilmiştir. 3.4.9 X1, X 2 , , X n dağılım fonksiyonu F ( x) olan aynı dağılımlı bağımsız rasgele değişkenler olsun. 1 , I ( Xi t) 0 , olmak üzere, Xi t d . y. n Fˆn (t ) I ( X i t ) i 1 şeklinde verilen Fˆn (t ) rasgele değişkeninin olasılık fonksiyonunu bulunuz. Çözüm: Fˆn (t ) , değer kümesi {0,1, 2,3,..., n} olan kesikli bir rasgele değişkendir. I ( X i t ) ler sadece 0 ve 1 değerlerini alan bağımsız rasgele değişkenler olup, P( I ( X i t ) 1) P( X i t ) F (t ) ve P( I ( X i t ) 0) P( X i t ) 1 P( X i t ) 1 F (t ) dir. p F (t ) ve Y i I ( X i t ) denirse, Y i rasgele değişkenlerinin olasılık fonksiyonu, P(Yi y ) p y (1 p )1 y , y 0,1 156 MATEMATİKSEL İSTATİSTİĞE GİRİŞ şeklinde olup moment çıkaran fonksiyonu da q 1 p olmak üzere M Y (t ) q p et dir. n n i 1 i 1 Buradan, Yi ler bağımsız ve Fˆn (t ) I ( X i t ) Y i olduğundan, Fˆn (t ) rasgele değişkeninin moment çıkaran fonksiyonu, M Fˆ n n n i 1 i 1 (t ) M Y1 Y 2 ...Y n (t ) M Yi (t ) (q pet ) (q pet )n (t ) dir. Bu fonksiyon da olasılık fonksiyonu, n P( X x) p x q n x , x 0,1, 2,..., n x olan bir X rasgele değişkeninin moment çıkaran fonksiyonudur. O halde, Fˆn (t ) nin olasılık fonksiyonu ile, X in olasılık fonksiyonu aynıdır. 3.4.10 X1, X 2 , , X n olasılık fonksiyonu, 0 p 1 ve q 1 p için, P( X x) p q x1 , x 1, 2,3,... olan bağımsız aynı dağılıma sahip rasgele değişkenler olsun. U X1 X 2 X r rasgele değişkeninin olasılık fonksiyonunu bulunuz. Çözüm: X i lerin moment çıkaran fonksiyonu q e t için x 1 x 1 M X (t ) E (et X ) et x P( X x) et x p q x 1 p ( q et ) x q x 1 p qet p 1 p p et t x (q e ) 1 1 t q x 0 q 1 qet 1 qet q 1 qe olup X i ler bağımsız olduğundan, U nun moment çıkaran fonksiyonu da r MU (t ) E (etU ) E (et ( X1 X r ) ) M X i (t ) [ pet / (1 q et )]r i 1 şeklindedir. Şimdi herhangi bir Y rasgele değişkeninin olasılık fonksiyonu, y r 1 r y P(Y y ) p q , y 0,1, 2,3,... r 1 olarak verilsin. Bu olasılık fonksiyonu, y 1 r y r P(Y y ) , y r , r 1, r 2,... p q r 1 RASGELE DEĞİŞKENLERİN DÖNÜŞÜMLERİ 157 olarak yazıldığında, Y nin moment çıkaran fonksiyonu, M Y (t ) E et Y p q r et y P(Y y) y r y 1 r 1 qet y r y y 1 t y y 1 r y r r e p q p r 1 et y r 1 q y r y r y r p q r qet t 1 qe r p et t 1 qe r şeklinde olup, U rasgele değişkeninin moment çıkaran fonksiyonu ile aynıdır. Buradan, U X1 X 2 X r ile Y nin olasılık fonksiyonları aynıdır. Yani, U rasgele değişkeninin olasılık fonksiyonu, u 1 r u r , u r , r 1, r 2,... p q r 1 P(U u ) dır (bu olasılık fonksiyonu beşinci bölümde bahsedilecek olan özel dağılımlardan biridir). BÖLÜM 4 EŞİTSİZLİKLER Olasılık ve istatistikte eşitsizlikler önemli bir yer tutar. Bazen, olasılıkların ve rasgele değişkenin momentlerinin hesaplanması güç olabilir. Böyle durumlarda, olasılık ve momentler için bir alt veya üst sınır verilir. Bu bölümde, olasılık ve momentlere ilişkin bazı eşitsizliklerden bahsedilecektir. 4.1. Markov ve Chebyshev Eşitsizlikleri 4.1.1. Markov Eşitsizliği Teorem 4.1.1 (Markov Eşitsizliği) X bir rasgele değişken g de g : şeklinde tanımlı negatif değerler almayan bir fonksiyon olsun. Bu durumda, r için P g(X ) r E g( X ) r dir. İspat: X sürekli olsun (kesikli durumda integral yerine toplam gelir). X in olasılık yoğunluk fonksiyonu f ( x) olmak üzere, g ( X ) in beklenen değeri doğrudan yazıldığında E g ( X ) g ( x) f ( x) dx g ( x) f ( x) dx {g ( x ) r} g ( x) f ( x) dx r { g ( x ) r} g ( x) f ( x) dx { g ( x ) r } f ( x) dx r P ( g ( X ) r ) {g ( x ) r} şeklinde bir eşitsizlik elde edilir. Burada, g ( x) negatif olmayan değerler aldığından, g ( x) r { g ( x )r} g ( x) f ( x) dx r f ( x) dx { g ( x ) r} dir. Buradan da, r için E ( g ( X )) r P( g ( X ) r ) şeklinde aranan eşitsizlik ispat edilmiş olur 160 MATEMATİKSEL İSTATİSTİĞE GİRİŞ 4.1.2. Chebyshev Eşitsizliği Markov eşitsizliğinin bir sonucu olan Chebyshev eşitsizliği olasılık ve istatistikte en çok kullanılan eşitsizliklerden biridir. Herhangi bir X rasgele değişkeninin beklenen değeri , varyansı 2 olsun. g fonksiyonunu g ( x) ( x ) 2 / 2 şeklinde tanımlayalım. Buna göre, E ( g ( X )) 1 olup, Markov eşitsizliğinden P (| X | k ) P (| X |2 k 2 2 ) P(| X |2 / 2 k 2 ) E ( g ( X )) 1 P(( X ) 2 / 2 k 2 ) P( g ( X ) k 2 ) 2 k2 k 2 elde edilir. Yani, beklenen değeri , varyansı olan bir X rasgele değişkeni için P (| X | k ) 1/ k 2 eşitsizliği yazılır. Bu eşitsizlik bazen, P (| X | k ) 1 (1/ k 2 ) olarak da ifade edilir ve literatürde Chebyshev eşitsizliği olarak bilinir. Chebyshev eşitsizliği genellikle olasılıklar için bir alt veya üst sınır belirlemek için kullanılır. Örnek 4.1.1 Düzgün bir paranın 10 defa atılması deneyi için X rasgele değişkeni gelen turaların sayısı olsun. X in olasılık fonksiyonu, 10 x x 10 1 1 P ( X x) x 2 2 , x 0,1, 2,...,10 olup E ( X ) 5 , Var ( X ) 2 2.5 dır. P (| X | k 2.5) olasılığı ise P (| X | k 2.5 ) P(| X | k ) P (5 k 2.5 X 5 k 2.5 ) P(k1 X k2 ) şeklinde yazılılabilir. Chebyshev sınırı 1 1/ k 2 olmak üzere, k nin bazı değerleri için bu olasılıklar hesaplanarak aşağıda verilmiştir. k 1 1.5 2 2.5 3 3.5 k1 k2 P (| X | k 2.5) Chebyshev Sınırı 3.42 2.63 1.84 1.05 0.26 0.53 6.58 7.37 8.16 8.95 9.74 10.53 0.656250 0.890625 0.978516 0.978516 0.998047 1.000000 0.000000 0.555556 0.750000 0.840000 0.888889 0.918367 EŞİTSİZLİKLER 161 Tablodaki olasılık değerlerinden k 2 durumu için P (| X | k 2.5) olasılığı, pP X k 2.5 P 5 2 2.5 X 5 2.5 P(1.84 X 8.16) 8 P( X x) x 2 10 x x 8 10 1 1 x 2 2 x 2 0.978515625 0.978516 dır. Diğer olasılıklar benzer şekilde hesaplanır Markov eşitsizliğinde rasgele değişkenin olasılık veya olasılık yoğunluk fonksiyonu ve g fonksiyonunun özel seçimi ile birçok eşitsizlik üretilebilir. Örneğin, negatif değerler almayan X in olasılık yoğunluk fonksiyonu f ( x) olsun. Ayrıca, E ( X k ) varsa, 0 a a E ( X k ) x k f ( x) dx x k f ( x) dx a k f ( x) dx a k P( X a) olup P ( X a ) E ( X k ) / a k eşitsizliği yazılır. Örneğin, X in olasılık yoğunluk fonksiyonu, e x f ( x) 0 , x0 , d . y. olarak verildiğinde, P( X a ) olasılığı ile E ( X k ) değeri P( X a) e a k ve E ( X ) x k 0 f ( x) d x x k e x d x (k 1) k ! 0 şeklindedir. Bu eşitsizlikte k n a alınırsa, e n n ! / n n elde edilir. Bu eşitsizlik biraz düzenlendiğinde, n ! n n e n veya n ! (n / e) n şeklinde bir eşitsizlik de elde edilebilir. , , P bir olasılık uzayı ve üzerinde tanımlı bir X rasgele değişkeninin her w için | X ( w) | M özelliğini (sınırlılık) sağladığını varsayalım. X in ikinci momenti kullanılarak E( X 2 ) x2 f ( x) dx c2 M 2 x c x c x2 f ( x) dx f ( x) dx, c 2 M 2 P( X c) x c x2 f ( x) dx c2 f ( x) dx 1 x c f ( x) dx x c x2 f ( x) dx 162 MATEMATİKSEL İSTATİSTİĞE GİRİŞ şeklinde bir eşitsizlik yazılabilir. Buradan da, P ( X c) E( X 2 ) c2 M2 eşitsizliği elde edilmiş olur. 4.2. Hölder, Minkowsky ve Jensen Eşitsizlikleri Bu eşitsizliklere geçmeden önce, rasgele değişkenler için norm kavramını hatırlayalım. Tanım 4.2.1. X bir rasgele değişken ve p için E ( X p ) varsa, X in p. normu, X | x | p f ( x) dx p 1/ p dir X ve Y herhangi iki rasgele değişken ve p 1 için E (| X | p ) ve E (| Y | p ) olsun. Kolayca görüleceği gibi (basit aritmetik işlemlerden sonra), | X Y | p (| X | p | Y | p ) (2 max{| X |,| Y |}) p 2 p (| X | p | Y | p ) dir (Balcı, 2000, sayfa 93). E (| X | p ) ve E (| Y | p ) ise E (| X Y | p ) dir. : sürekli ve artan fonksiyonu (0) 0 ve lim ( x) özelliklerine x x x 0 0 sahip olsun. 1 olmak üzere, ( x) (u) d u ve ( x) (u) d u diyelim. Şekil 4.2.1 a b (a) (b) eşitsizliğinin görsel ifadesi EŞİTSİZLİKLER 163 Grafiklerden de görüldüğü gibi, a b (a ) (b) dir (Balcı, 2000). b (a ) için eşitlik sağlanır. Grafiksel olarak da desteklenen bu bağıntı kullanılarak aşağıdaki eşitsizliği yazabiliriz. 4.2.1. Yardımcı Eşitsizlik Teorem 4.2.1 a, b ve p, q ve (1/ p ) (1/ q ) 1 olmak üzere, a p bq ab p q dir. İspat Değişik ispat teknikleri olmakla birlikte, bu eşitsizliğin ispatını iki farklı şekilde (u ) u p 1 denirse (u ) u1/ ( p 1) yapacağız. olur. Ayrıca, (1/ p) (1/ q) 1 olduğundan q p / ( p 1) olup fonksiyondaki integral değerleri a a 0 0 (a) (u ) d u u p 1 ap du p b 1/( p 1) ve (b) u 0 u p /( p 1) du p / ( p 1) b u 0 bq q şeklinde hesaplanır. Bu değerler a b (a) (b) eşitsizliğinde yerine konursa, a p bq ab p q eşitsizliği elde edilir. b (a) için (yani b u p 1 ) eşitlik sağlanır. İkinci ispat için, a p bq g (a) ab p q fonksiyonunu tanımlayalım. g (a) 0 ise ispat tamamlanmış olur. Fonksiyonun birinci türevinin sıfıra eşitlenmesi ile d g (a ) p a p 1 b a p 1 b 0 a b1/ ( p 1) da p bulunur. İkinci türev bu noktada pozitiftir. Yani, fonksiyonu minimum yapan değer a b1/ ( p 1) dir. p q( p 1) olmak üzere fonksiyonun minimum değeri, 1 1 a p a q ( p 1) ap ap p 1 aa a p a p 1 0 p q p q p q dır. Yani, g (a) 0 olup ispat tamamlanır 164 MATEMATİKSEL İSTATİSTİĞE GİRİŞ 0 p için rasgele değişkenlerin bir sınıfı p { X : E (| X | p ) , 0 p } ve p, q için X p ve Y q olsun. (1/ p ) (1/ q ) 1 ise X Y 1 dir. Şimdi bunun doğru olduğunu gösterelim. Önce, | Y | | X | p 1 ise | XY | | X | p olup XY 1 olduğu açıktır. Diğer taraftan, | Y | | X | p 1 ise | Y |1/( p 1) | X | | Y |1/( p 1) | Y | | X || Y | | Y |q | XY | X Y 1 dir. Yani, her iki durumda da X p ve Y q ise X Y 1 dir. 4.2.2. Hölder Eşitsizliği Teorem 4.2.2 p, q için (1/ p) (1/ q) 1 olsun. X p ve Y q ise XY 1 X p Y q dir. X İspat: Önce, eşitsizlik sağlanır. b | Y | / Y X Y p 0 veya Y p 0 ve Y 0 ise ifadenin her iki tarafı da sıfır olacağından q q 0 olsun. Yardımcı eşitsizlikte, a | X | / X p ve alınırsa, X ve Y rasgele değişkenleri için q X X p Y q XY X p Y p X p q p p X q Y q Y q q eşitsizliği elde edilir. Her iki tarafın beklenen değeri alınıp aşağıdaki şekilde düzenlenirse, XY E X p Y E X Y X p Y q q X E p X E X p p X p p p p p q E Y q Y q q E Y q q Y q q p p X p X p p den XY E X p Y E X Y X p Y q q X Y X p 1 Y 1 q Y q Y q q q q 1 1 1 p q EŞİTSİZLİKLER 165 elde edilir. Buradan da, X Y 1 X p Y q şeklinde aranan eşitsizlik elde edilmiş olur Hölder eşitsizliğinde rasgele değişkenlerin özel seçimleri ile olasılık ve istatistikte kullanılan bazı eşitsizlikler türetilebilir. Bunlardan bazıları aşağıdadır. a) Cauchy Schwartzd Eşitsizliği: Hölder eşistsiliği p q 2 için, XY 1 X 2 Y 2 şeklinde yazılır. X ve Y rasgele değişkenleri için beklenen değerleri E ( X ) x ve E (Y ) y olsun. Hölder eşitsizliği X yerine X x ve Y yerine de Y y yazılarak uygulandığında, | Cov( X , Y )| | E (( X x )(Y y )) | E (| ( X x )(Y y ) |) E ( X x ) 2 E (Y y ) 2 Var ( X ) Var (Y ) elde edilir. Buradan, Cauchy-Schwartzd eşitsizliği, | Cov( X , Y )| Var ( X ) Var (Y ) veya Cov X , Y 2 Var ( X ) Var (Y ) şeklinde yazılır. Bu eşitsizlikten, korelasyon katsayısı ile ilgili X2 ,Y Cov X , Y 2 1 veya 1 X ,Y 1 Var ( X ) Var (Y ) eşitsizliği de elde edilir. b) Hölder eşitsizliğinde Y 1 alalım. Bu durumda, p için X 1 X p E (| X |) ( E (| X | p ))1/ p eşitsizliği elde edilmiş olur. X 1 X p olup, 166 MATEMATİKSEL İSTATİSTİĞE GİRİŞ c) Hölder eşitsizliğinde Y 1 ve X yerine de X r yazalım. Bu durumda, Hölder eşitsizliği E (| X r |) ( E (| X r | p ))1/ p veya E (| X |r ) ( E (| X |rp ))1/ p şekline dönüşür. Her iki tarafın 1/ r kuvveti alındığında Hölder eşitsizliği, [ E (| X |r )]1/ r [ E (| X |rp ))1/( rp ) olur. p 1 olduğundan, s p r denirse, s r dir. Dolayısı ile s r için, [ E (| X |r )]1/ r [ E (| X |rp ))1/( rp ) veya X r X s eşitsizliği elde edilir. Bu eşitsizlik literatürde Liaponov eşistsizliği olarak bilinir. Örnek 4.2.1 Cauchy-Schwartzd eşitsizliği, vektörler için benzer şekilde yazılır. a ve b vektörleri, a (a1, a2 ,..., an ) ve b (b1, b2 ,..., bn ) olarak verildiğinde Cauchy 2 Schwartzd eşitsizliği, (a b) (a a ) (b b) şeklinde ifade edilir (herhangi bir lineer cebir kitabına bakılabilir). Son eşitsizlikte, a (1,1,...,1) ve b ( x1, x2 ,..., xn ) alındığında, vektör çarpımları n n (ab) x i , (aa) n ve (bb) x i2 i 1 i 1 şeklinde olur. Cauchy-Schwartzd eşitsizliğinden, n xi i 1 2 n n x i2 i 1 n veya x i2 i 1 1 n n xi i 1 2 eşitsizliği elde edilir. Her i için xi 0 , a ve b vektörleri de a ( x1, x2 ,..., xn )' , b ( x 1 1, x 2 1,..., x n 1 )' olarak seçildiğinde ise vektör çarpımları, n n 1 (aa) x i2 , (bb) 2 ve (ab) n i 1 xi i 1 olur. (ab)2 (aa ) (bb) eşitsizliğinde bu değerler yerine yazıldığında ise 1 n 2 n 2 n 1 1 n 1 n xi 2 veya xi 2 2 n i 1 xi i 1 i 1 xi i 1 2 eşitsizliği elde edilir EŞİTSİZLİKLER 167 4.2.3. Minkowsky Eşitsizliği Aşağıda ifadesi verilen bu eşitsizlik, Hölder eşitsizliğine benzer. Literatürde, değişik ispat teknikleri vardır (Chow ve Teicher (1988), sayfa 111, Bauer (1981), sayfa 65). Teorem 4.2.3 X , Y p olsun. Bu durumda, X Y p X p Y p dir. İspat: Önce, a, b ve p için, | a b | p (| a | p | b | p ) (2 max{| a |,| b |}) p 2 p (| a | p | b | p ) olduğunu hatırlayalım. E (| X | p ) ve E (| Y | p ) ise, E (| X Y | p ) dir. Yani, X , Y p ise X Y p dir. Ayrıca X Y 1 E X Y E X E Y X 1 Y 1 olduğundan p 1 için eşitsizlik sağlanır. Şimdi, p 1 olsun. Buradan, X Y p X Y X Y p 1 X X Y p 1 Y X Y p 1 olup eşitsizlikte her iki tarafın da beklenen değeri alınırsa, X Y p p E (| X Y | p ) E (| X || X Y | p 1 ) E (| Y || X Y | p 1 ) eşitsizliği elde edilir. (1/ p ) (1/ q ) 1 olacak şekilde q sayısı seçildiğinde, p q ( p 1) olup, X Y q olur. Hölder eşitsizliğinden, E(| X || X Y | p1) [ E(| X | p )]1/ p [ E(| X Y |q( p1) )]1/ q X X p X p [ E(| X Y | p )] yazılır. Yani, E Y X Y dir. Buradan da, p 1 X Y p/q p 1p pq X p X Y p p/ q p [ E(| X Y |q( p1) )]1/ q 168 MATEMATİKSEL İSTATİSTİĞE GİRİŞ p p X Y p E X Y X X X Y eşitsizliği elde edilir. p p p/q p p X p Y X Y X Y X Y X Y p p p p/q p p p / q p p Y p p/q p Y X Y p X Y p/q p p/q p 0 ise eşitsizlik sağlanır. eşitsizliğin her iki tarafı X Y p X Y X Y p p 0 ise, son ile bölündüğünde, p ( p / q ) 1 olduğundan, X Y X X X Y p/q p p p X Y X Y X p Y p Y Y p/q p p/q p p p elde edilir 4.2.4. Jensen Eşitsizliği Jensen eşitsizliğini yazmadan önce konveks fonksiyonları hatırlayalım. Bir g : fonksiyonu, 0 1 ve her x, y için g ( x (1 ) y ) g ( x) (1 ) g ( y ) özelliğini sağlıyorsa, konvekstir, aksi halde konkavdır denir. Konveks g ( x) fonksiyonun grafiği aşağıda Şekil (4.2.2) de verildiği gibidir. g(x) g(x) g(y) )g –λ λ g(x) x (1 )+ x ( g g(x) g(x) (y) l(x)=a+bx y x x g(x) Şekil 4.2.2 Konveks fonksiyon Türevlenebilir bir fonksiyonun ikinci türevi pozitif ise konveks, negatif ise konkavdır. Örneğin, g ( x) x 2 fonksiyonu g ( x) 2 0 olduğundan konvekstir. Benzer şekilde, EŞİTSİZLİKLER 169 g ( x) 1/ x fonksiyonunu için g ( x) 2 / x3 olup, x 0 için fonksiyon konveks, x 0 için de konkavdır. Şimdi, Jensen eşitsizliğini yazabiliriz. Teorem 4.2.4 (Jensen Eşitsizliği): X herhangi bir rasgele değişken, g de den ye herhangi bir konveks fonksiyon olmak üzere, E g ( X ) g E( X ) dir. Fonksiyon konkav ise eşitsizlik yön değiştirir. P ( g ( X ) a bX ) 1 ise eşitlik vardır. İspat: g fonksiyonu sürekli ve türevlenebilir olsun. Bu durumda herhangi bir I aralığında, x0 I için x0 değerine bağlı en az bir ( ( x0 ) ) vardır ve her x I için g ( x) g ( x0 ) ( x x0 ) dir. g nin x0 noktası komşuluğundaki birinci dereceden Taylor serisi açılımı 1 g ( x) g ( x0 ) g ( x0 ) ( x x0 ) ( x x0 ) 2 g ( ) 2 olup g konveks olduğundan g ( ) 0 ve 0.5 ( x x0 ) 2 g ( ) 0 dır. Böylece ( x0 ) g ( x0 ) için g ( x) g ( x0 ) ( x x0 ) dır. Eşitsizlikte x0 E ( X ) alınırsa, g ( X ) g ( E ( X )) ( X E ( X )) elde edilir. Her iki tarafın da beklenen değeri alınırsa ( E ( X E ( X )) 0 ), E[ g ( X ) g ( E ( X ))] E ( g ( X )) g ( E ( X )) 0 bulunur. Yani, E ( g ( X )) g ( E ( X )) şeklinde Jensen eşitsizliği elde edilmiş olur. g fonksiyonu yukarıda verildiği gibi sürekli ve türevlenebilir olmayabilir. Bu durumda teoremin ispatı farklıdır. g ( x) konveks olduğundan, fonksiyonun E ( X ) noktasındaki tanjant doğrusu Şekil (4.2.2) de görüldüğü gibidir. Bu doğruya (şekilde görüldüğü gibi) ( x) diyelim. Bazı a, b için bu tanjant doğrusu ( x) a bx şeklinde yazılabilir. g ( x) fonksiyonu konveks olduğundan, g ( x) ( x) dir. Buradan, g ( X ) ( X ) E ( g ( X )) E (( X )) E ( a bX ) a bE ( X ) ( E ( X ) yazılır. ( x) a bx doğrusu g ( x) fonksiyonunun E ( X ) noktasındaki tanjant değeri olduğundan, ( E ( X )) g ( E ( X )) dir. O halde, E ( g ( X )) ( E ( X )) g ( E ( X )) veya E ( g ( X )) g ( E ( X )) 170 MATEMATİKSEL İSTATİSTİĞE GİRİŞ olur. g ( x) fonksiyonu lineer ise eşitlik sağlanır Örnek 4.2.2 a) g ( x) x 2 olsun. g ( x) 2 0 olduğundan g ( x) x 2 fonksiyonu konvekstir. Jensen eşitsizliğine göre, E ( g ( X )) E ( X 2 ) g ( E ( X )) ( E ( X )) 2 2 dir. Yani, E ( X 2 ) E ( X ) veya Var ( X ) E ( X 2 ) ( E ( X )) 2 0 dır. b) x 0 için g ( x) 1/ x konveks ( g ( x) 2 / x3 0 ) olup Jensen eşitsizliğinden, E ( g ( X )) E (1/ X ) g ( E ( X )) 1/ E ( X ) yazılır. Yani, E (1/ X ) 1/ E ( X ) dir. c) g ( x) | x | fonksiyonu, 0 1 ve x, y için, g ( x (1 ) y ) | x (1 ) y | | x | (1 ) | y | g ( x) (1 ) g ( y ) olduğundan konvekstir. Jensen eşitsizliğine göre, E ( g ( X )) E (| X |) g ( E ( X )) | E ( X ) | dir. Yani, E (| X |) | ( E ( X ) | dir Örnek 4.2.3 Hölder eşitsizliği Jensen eşitsizliği yardımı ile ispat edilebilir. Önce, g ( x) ln( x) fonksiyonu g ( x) 0 ( g ( x) 1/ x 2 ) olduğundan konkavdır. x, y ve [0,1] olsun. Jensen eşitsizliğine göre ( E ( g ( X )) g ( E ( X )) ) ln( x) (1 ) ln( y ) ln( x (1 ) y ) eşitsizliği yazılabilir. Bununla birlikte, h( x) e x fonksiyonu kesin artan olduğundan, e ln( x )(1 )ln( y ) eln( x (1 ) y ) olup logaritma ve üstel fonksiyonun özelliklerinden ( ln( x) ln( x ) ve eln( a ) a ) eln( x ) ln( y (1 ) ) eln( x (1 ) y ) eln( x ) eln( y (1 ) ) eln( x (1 ) y ) x y (1 ) x (1 ) y eşitsizliğini yazabiliriz. Son eşitsizlik yardımı ile Hölder eşitsizliğinin ispatını yapabiliriz. Teorem (4.2.2) de 1/ p ve 1 1/ q alındığında (1/ p) (1/ q ) 1 dir. Eşitsizlikte, X ve Y rasgele değişkenler olmak üzere 1/ p , 1 1/ q , x | X | p / E (| X | p ) ve y | Y |q / E (| Y |q ) diyelim. Buna göre, EŞİTSİZLİKLER 171 x y (1 ) x (1 ) y |X| |Y | ( E (| X | p )1/ p ( E (| Y |q )1/ q 1 | X |p 1 | Y |q p ( E (| X | p ) q ( E (| Y |q ) dir. Her iki tarafın beklenen değeri alındığında ( (1/ p) (1/ q ) 1 dir) E (| X |) E (| Y |) ( E (| X | p )1/ p ( E (| Y |q )1/ q 1 E (| X | p ) 1 E (| Y |q ) 1 1 1 p ( E (| X | p ) q ( E (| Y |q ) p q eşitsizliği elde edilir. Buradan da, E (| X |) p 1/ p ( E (| X | ) E (| Y |) q 1/ q ( E (| Y | ) 1 E (| X Y |) p 1/ p ( E (| X | ) ( E (| Y |q )1/ q 1 E (| X Y |) ( E (| X | p )1/ p ( E (| Y |q )1/ q XY 1 X p Y q şeklinde Hölder eşitsizliği elde edilir. Burada, Hölder eşitsizliği doğrudan Jensen eşitsizliğinin bir sonucu değildir. Ancak, yukarıdaki logaritma fonksiyonunun konkav olmasından dolayı elde edilen eşitsizliğin bir sonucudur X ve Y beklenen değerleri mevcut herhangi iki rasgele değişken olsun. Genellikle E ( X / Y ) E ( X ) / E (Y ) dir. Ancak, Cov( X / Y , Y ) 0 ise E ( X / Y ) E ( X ) / E (Y ) eşitliği yazılabilir. Kovaryansın tanımından, X X X 0 Cov , Y E Y E Y Y Y X E (Y ) E X E Y E (Y ) eşitliğinden X X X E( X ) 0 E X E E (Y ) E E (Y ) E ( X ) E Y Y Y E (Y ) elde edilir. 4.3. Çözümlü Problemler 4.3.1 a1, a2 ,..., an olmak üzere, bu ai reel sayılarının aritmetik, geometrik ve harmonik ortalamaları 1 n a A ai , n i 1 1/ n n aG ai i 1 , aH 1 n 1 n i 1 ai 1 172 MATEMATİKSEL İSTATİSTİĞE GİRİŞ şeklinde hesaplanır. aH aG a A olduğunu gösteriniz (Casella ve Berger (2002), sayfa 191). Çözüm: Değer kümesi {a1, a2 ,..., an } olan herhangi bir X rasgele değişkeninin olasılık fonksiyonu 1 , i 1, 2,3,..., n n olarak verilmiş olsun. g ( x) log( x) fonksiyonu konkavdır ( g ( x) 1/ x 2 olup her P ( X ai ) zaman negatiftir). Bu durumda, X rasgele değişkeninin beklenen değeri n E ( X ) ai P( X ai ) i 1 1 n ai a A n i 1 olup n 1/ n 1 n log(aG ) log ai log(a i ) E log( X ) i 1 n i 1 ve 1 n log E ( X ) log a i log(a A ) n i 1 dir. Jensen eşitsizliğine göre, E (log( X )) log( E ( X )) olduğundan, log(aG ) 1 n 1 n a E X E X log( ) (log( )) log( ( )) log a i log(a A ) i n i 1 n i 1 yazılabilir. Yani, log aG log(a A ) eşitsizliği elde edilir. Logaritma fonksiyonunun özelliğinden ise aG a A dir. Yine g ( x) log( x) fonksiyonunun konkav olduğundan, 1 n 1 log(1/ aH ) log n i 1 a i 1 log E X 1 E log X E (log( X )) Eşitsizliği yazılır. log aG E log( X ) olup E (log( X )) log(aG ) log(1/ aG ) dir. Yani, log(1/ aH ) log(1/ aG ) olup logaritmanın özelliğinden, (1/ aH ) (1/ aG ) yani, aH aG elde edilir. Bu iki eşitsizlik birleştirildiğinde aH aG a A elde edilir. 4.3.2 Sonlu beklenen değere sahip bir rasgele değişken X olsun. E ( X ) ve g de azalmayan konveks bir fonksiyon ise, E ( g ( X ) ( X )) 0 olduğunu gösteriniz. EŞİTSİZLİKLER 173 Çözüm: X in olasılık yoğunluk fonksiyonu f ( x) olsun (kesikli ise integral yerine toplam gelir). g ( x) konveks olduğundan Jensen eşitsizliğine göre, E g ( X ) g E ( X ) dir. Ayrıca, g ( x) azalmayan ( x y ise, g ( x) g ( y ) ) olduğundan, E g ( X ) ( X ) g ( x) ( x ) f ( x) dx 0 0 0 0 g ( x) ( x ) f ( x) dx g ( x) ( x ) f ( x) dx g ( ) ( x ) f ( x) dx g ( ) ( x ) f ( x) dx g ( ) ( x ) f ( x) dx g ( ) E ( X ) 0 şeklinde aranan eşitsizlik elde edilir. X 1 olacak şekilde bir rasgele değişken için, E ( X n 1 ) E ( X ) E ( X n ) eşitsizliği E g ( X ) ( X ) 0 nin bir sonucu olarak elde edilir. Bunun için g ( x) x n denirse, g ( x) n(n 1) x n2 0 olup g ( x) x n konveks ve x 1 için azalmayandır. Yukarıdaki eşitsizlik g ( x) x n fonksiyonuna uygulandığında, 0 E ( g ( X ) ( X )) E ( X n ( X )) E ( X n1 ) E ( X n ) E ( X n1 ) E ( X ) E ( X n ) elde edilir. Buradan her n için, 0 E ( X n1 ) E ( X ) E ( X n ) E ( X n1 ) E ( X ) E ( X n ) eşitsizliği yazılır. Yani, E ( X n 1 ) E ( X ) E ( X n ) dir. 4.3.3 X sürekli bir rasgele değişken ve E ( X ) 0 , Var ( X ) 2 olsun. Buna göre, a) 0 ise P X 2 / ( 2 2 ) b) 0 ise P X 1 2 / ( 2 2 ) eşitsizliklerinin doğru olduğunu gösteriniz. Çözüm: Sorunun çözümüne geçmeden önce , t 0 olmak üzere önce 174 MATEMATİKSEL İSTATİSTİĞE GİRİŞ P X E ( X t )2 / t 2 eşitsizliğinin doğru olduğunu gösterelim. Buradaki beklenen değer E ( X t ) 2 ( x t ) 2 f ( x) dx ( x t ) 2 f ( x) dx ( t ) 2 f ( x) dx ( t )2 f ( x) dx ( t )2 P( X ) şeklinde yazılabildiğinden, P ( X ) E ( X t ) 2 / ( t ) 2 bulunur. Bu eşitsizlik yardımı ile istenen eşitsizlikler kolayca gösterilir. a) 0 ise 0 olup, 2 P X P X E X t / t 2 eşitsizliği yazılır. Buradan, t 2 / için E ( X ) 0 ve Var ( X ) 2 olduğundan, P X P X E ( X 2 / )2 ( 2 / ) 2 E ( X 2 ) 2 E ( X ) / ( 4 / 2 ) ( 2 2 ) 2 / 2 2 2 4 2 ( 2 2 ) 2 ( 2 2 ) 2 ( 2 2 ) 2 ( 2 2 ) şeklinde aranan eşitsizlik elde edilmiş olur. b) 0 olsun. X sürekli olduğundan P( X ) P ( X ) dir (kesikli ise P ( X ) P( X ) dir). Buradan, P X 1 P X 1 P( X ) 1 E ( X t ) 2 /(t ) 2 eşitsizliğinde t 2 / yazıldığında aranan eşitsizlik, P X 1 E X 2 2E( X ) / 4 / 2 2 2 2 / 2 1 2 2 4 1 2 2 2 2 2 2 ( ) şeklinde elde edilir. Burada, t 2 / alınmasının nedeni, E ( X t ) 2 / (t ) 2 oranının bu noktada minimum olmasıdır. Yani, E ( X t ) 2 / (t ) 2 fonksiyonu ( t fonksiyonudur) t 2 / noktasında minimumdur. E ( X ) 0 ve Var ( X ) 2 olduğundan, E ( X t ) 2 / ( t ) 2 ( 2 t 2 ) / ( t ) 2 EŞİTSİZLİKLER 175 olup, d E X t d t t 2 2 d 2 t 2 2 t 2 2 0 t dt t 2 t 2 bulunur. İkinci türev bu noktada 2 d2 E X t d t 2 t 2 d2 2 d t2 t 2 t2 t 2 0 2 t pozitif olup, E ( X t ) 2 / (t ) 2 oranının t 2 / noktasında minimum olduğu görülür. 4.3.4 Markov eşitsizliğini kullanılarak, 0 p 1 için (1 p ) n 1/ (np ) olduğunu gösteriniz. Çözüm: Kesikli bir X rasgele değişkeninin olasılık fonksiyonu q 1 p olmak üzere, P ( X x) p q x 1 , x 1, 2,3,... şeklinde verilmiş olsun. Bu durumda, E ( X ) 1/ p ve P( X n) olasılığı, n n n1 x 1 x 1 x 0 P ( X n) 1 P ( X n) 1 P ( X x) 1 p q x 1 1 p q x 1 p 1 qn 1 qn 1 p q n (1 p) n 1 q p dir. Markov eşitsizliğinden, (1 p )n P( X n) E ( X ) / n 1/(np) veya (1 p ) n 1/ (np ) şeklinde aranan eşitsizlik elde edilir. Aynı olasılık fonksiyonu kullanılarak Jensen eşitsizliğine göre 0 p 1 için log( p) ( p 1) eşitsizliği de yazılabilir. Bunun için x 0 için g ( x) 1/ x fonksiyonu konveks olup, Jensen eşitsizliğine göre E (1/ X ) 1/ E ( X ) dir. g ( X ) 1/ X in beklenen değeri 1 E X x 1 pq 1 P ( X x ) x x1 x x 1 q x1 x 1 x p log(1 q ) p p log( p ) q q olup, E ( X ) 1/ p dir. Yani, Jensen eşitsizliğinden E (1/ X ) 1/ E ( X ) olup, 176 MATEMATİKSEL İSTATİSTİĞE GİRİŞ 1 E X p 1 1 p log( p) q E ( X ) 1/ p elde edilir. Buradan da, ( p / q) log( p) p dir. Ayrıca, ( p / q) log( p) p log( p) q log( p) q (1 p) p 1 olduğundan log( p) ( p 1) elde edilir. 4.3.5 a) Her n için (n 1) 2 en / n olduğunu gösteriniz. b) Her n için (1/ 2n 1) (1/ n) olduğunu gösteriniz. Çözüm: a) X rasgele değişkeninin olasılık yoğunluk fonksiyonu, x e x f ( x) 0 , x0 , d . y. olarak verilmiş olsun. Buna göre, P ( X n) x e x dx ( x e x e x ) xn xn n e n e n dir. Ayrıca, E ( X ) (3) 2 olup Markov eşitsizliğinden, n e n e n P ( X n) E ( X ) / n 2 / n eşitsizliği yazılır. Eşitsizlik biraz daha düzenlendiğinde e n (n 1) 2 / n veya (n 1) 2 e n / n şeklinde aranan eşitsizlik elde edilir. b) X rasgele değişkeninin olasılık fonksiyonu, P ( X x) 1/ 2 x , x 1, 2,3,... şeklinde verilmiş olsun. P( X n) olasılığı, P ( X n) P ( X x) 1 x n 1 2 x n 1 dir. Ayrıca, x 1 x 1 2 E ( X ) x P( X x) olup yine Markov eşitsizliğinden, x x 2 x 1 2n EŞİTSİZLİKLER 177 1/ 2n P( X n) E ( X ) / n 2 / n veya (1/ 2n1 ) (1/ n) eşitsizliği elde edilir. 4.3.6 Sonlu beklenen değere sahip herhangi iki rasgele değişken X ve Y olsun. Buna göre, a) E (min{ X , Y }) min{E ( X ), E (Y )} b) E (max{ X , Y }) max{E ( X ), E (Y )} c) E (min{ X , Y } max{ X , Y }) E ( X ) E (Y ) eşitsizliklerinin doğru olduğunu gösteriniz. Çözüm: Önce, min{ X , Y } 0.5[( X Y ) | X Y |] ve max{ X , Y } 0.5[( X Y ) | X Y |] olduğunu hatırlayalım. g ( x) | x | fonksiyonu konveks olup Jensen eşitsizliğinden, | E ( X Y ) | E (| X Y |) dir. Buradan da E (| X Y |) | E ( X Y )| olup E X Y E ( X Y ) E ( X ) E (Y ) eşitsizliği yazılabilir. Şimdi eşitsizliklerin ispatına geçebiliriz. a) min{ X , Y } nin ifadesi Jensen eşitsizliği ile beraber kullanıldığında ( g ( x) | x | fonksiyonu konvekstir), E (min{ X , Y }) 0.5 E ( X Y ) E (| X Y |) 0.5[ E ( X ) E (Y ) | E ( X ) E (Y ) |] min{E ( X ), E (Y )} elde edilir. Yani, E (min{ X , Y }) min{E ( X ), E (Y )} dir. b) Benzer şekilde max{ X , Y } nin yukarıdaki ifadesi Jensen eşitsizliği ile beraber kullanıldığında, E (max{ X , Y }) 0.5[ E ( X Y ) E (| X Y |)] 0.5[ E ( X ) E (Y ) | E ( X ) E (Y ) | max{E ( X ), E (Y )} bulunur. Dolayısı ile, E (max{ X , Y }) max{E ( X ), E (Y )} dir. c) min{ X , Y } max{ X , Y } X Y olduğundan, kolayca görüleceği gibi E (min{ X , Y } max{ X , Y }) E ( X Y ) E ( X ) E (Y ) dir. 178 MATEMATİKSEL İSTATİSTİĞE GİRİŞ 4.3.7 Değer kümesi DX {x1, x2 ,..., xn } olan X herhangi bir kesikli rasgele değişken, f ve g azalmayan fonksiyonlar olsun. Bu durumda E[ f ( X )] E[ g ( X )] E[ f ( X ) g ( X )] olduğunu gösteriniz. Çözüm: X in olasılık fonksiyonu, x1 x2 ... xn için P( X xi ) pi olsun. Buradan eşitsizliğin ispatı için, n n n f ( x ) P ( X x ) g ( x ) P ( X x ) k k k k f ( xk ) g ( xk ) P ( X xk ) k 1 k 1 k 1 olduğunun gösterilmesi gerekir. f ve g azalmayan fonksiyonlar olduğundan 1 j n ve 1 k n için 0 { f ( xk ) f ( x j )}{g ( xk ) g ( x j )} dir. Buradan da, f ( xk ) g ( x j ) f ( x j ) g ( xk ) f ( x j ) g ( x j ) f ( xk ) g ( xk ) yazılabilir. P ( X xi ) pi 0 olduğundan, eşitsizliğin sol tarafı P ( X x j ) P ( X xk ) ile çarpılıp toplandığında n n [ f ( xk ) g ( x j ) f ( x j ) g ( xk )] P( X x j ) P( X xk ) j 1 k 1 n n 2 f ( xk ) g ( x j ) P( X x j ) P( X xk ) j 1 k 1 n n 2 f ( x j ) P( X xk ) g ( xk ) P( X xk ) E ( f ( X )) E ( g ( X )) j 1 k 1 eşitliği elde edilir. Benzer şekilde, yukarıdaki eşitsizliğin sağ tarafı kullanıldığında n n [ f ( x j ) g ( x j ) f ( xk ) g ( xk )] P( X xk )P( X x j ) k 1 j 1 n n n n k 1 j 1 j 1 k 1 [ f ( xk ) g ( xk )] P( X xk ) P( X x j ) [ f ( x j ) g ( x j )] P( X x j ) P( X xk ) n 2 [ f ( x j ) g ( x j )] P( X x j ) 2 E[ f ( X ) g ( X )] j 1 eşitliği elde edilir. Buradan da, bu iki eşitlik f ( xk ) g ( x j ) f ( x j ) g ( xk ) f ( x j ) g ( x j ) f ( xk ) g ( xk ) EŞİTSİZLİKLER 179 eşitsizliğinde kullanıldığında, E[ f ( X )] E[ g ( X )] E[ f ( X ) g ( X )] eşitsizliği elde edilir. Bu eşitsizlik literatürde, Chebyshev Lemması olarak bilinir (Chebyshev eşitsizliği ile karıştırılmasın). Fonksiyonlardan biri azalmayan diğer artmayan ise eşitsizlik yön değiştirir. 4.3.8. Beklenen değeri sıfır, varyansı 2 olan bağımsız rasgele değişkenler e1, e2 ,..., en olsun ( E (ei ) 0 ve Var (ei ) 2 ). x i , i 1, 2,3,..., n rasgele olmayan değişkenler olmak üzere, Y i x i ei , i 1, 2,3,..., n modelini göz önüne alalım. Buradan, n ˆ1 xi2 i 1 1 n n ˆ2 xi i 1 x i Yi i 1 1 n ˆ3 Yi i 1 1 n (Y i / x i ) n i 1 rasgele değişkenlerinin varyansları sırası ile, 1 n n Var ˆ1 2 x i2 , Var ˆ 2 n 2 x i i 1 i 1 2 2 n 1 , Var ˆ 3 n 2 i 1 x i2 dir. Bu varyansları küçükten büyüğe doğru sıralayınız. Çözüm: Cauchy-Schwartz eşitsizliğinden n 2 xi i 1 1 n n xi i 1 2 n ve xi2 i 1 1 1 n 1 n 2 i 1 xi2 olduğunu biliyoruz (Örnek (4.2.1)). Buradan Var ( ˆ 1 ) Var ( ˆ 2 ) ve Var ( ˆ 1 ) Var ( ˆ 3 ) dir. Yani, Var ( ˆ 1 ) diğer iki varyansdan da küçüktür. Var ( ˆ 2 ) ve Var ( ˆ 3 ) arasındaki sıralamaya bakalım. X rasgele değişkeninin olasılık fonksiyonu, P ( X xi ) 1 , i 1, 2,3,..., n n olarak verilmiş olsun. Buna göre, g ( x) 1/ x 2 fonksiyonu konvekstir. Jensen eşitsizliğinden E ( g ( X )) g ( E ( X )) olup beklenen değerler, n E g ( X ) g ( xi ) P( X xi ) i 1 1 n 1 n i 1 x i2 n ve E ( X ) x i P( X xi ) şeklinde hesaplanmıştır. Jensen eşitsizliğine göre, i 1 1 n xi n i 1 180 MATEMATİKSEL İSTATİSTİĞE GİRİŞ 1 n 1 n 1 E g ( X ) 2 g E ( X ) xi n i 1 x i n i 1 2 2 n xi i 1 n 2 eşitsizliği yazılabilir. Buradan, n 1 n 1 2 n2 xi n i 1 x i i 1 2 n n xi i 1 2 1 n n 2 1 2 i 1 x i bulunur. Yani, Var ( ˆ 2 ) Var ( ˆ 3 ) dır. Bu eşitsizlikler birleştirildiğinde, 2 n Var ˆ1 i 1 x i2 1 Var ˆ 2 n 2 n x i i 1 2 2 n 2 n x 2 Var ˆ 3 1 i 1 i sıralaması elde edilir. Yani, Var ( ˆ1 ) Var ( ˆ 2 ) Var ( ˆ 3 ) dir. 4.3.9 X ve Y rasgele değişkenleri için E ( X ) E (Y ) 0 , Var ( X ) Var (Y ) 1 ve X ile Y arasındaki korelasyon olsun. Bu durumda, E (max{ X 2 , Y 2 }) 1 1 2 olduğunu gösteriniz (Öztürk, 1993, sayfa 298). Çözüm: Önce, Problem (4.3.7) de verilen max{ X , Y } 0.5 [( X Y ) | X Y |] ifadesi X 2 ve Y 2 rasgele değişkenleri için max{ X 2 , Y 2 } 0.5[( X 2 Y 2 ) | X 2 Y 2 |] şeklinde düzenlendiğinde, X 2 Y 2 X Y X Y olup Cauchy-Schwartz eşitsizliği de X 2 ve Y 2 rasgele değişkenleri için, [ E (| X 2 Y 2 |)]2 [ E (| X Y |) 2 ][ E (| X Y |) 2 ] şeklinde yazılır. Buradan da, 1 E (max{ X 2 , Y 2 }) [ E ( X 2 Y 2 ) E (| X 2 Y 2 |)] 2 1 1 [ E (| X 2 Y 2 |) 2] 1 E (( X Y ) 2 ) E (( X Y ) 2 2 2 eşitsizliğine ulaşılmış olur. Ayrıca, EŞİTSİZLİKLER 181 E (( X Y )2 ) E (( X Y ) 2 ) [ E ( X 2 ) 2 E ( XY ) E (Y 2 )][ E ( X 2 ) 2 E ( XY ) E (Y 2 )] 2 2 2 2 4(1 2 ) dir. Dolayısı ile aranan eşitsizlik, E max X 2 , Y 2 1 1 1 E ( X Y )2 E ( X Y )2 1 4 1 2 1 1 2 2 2 den E (max{ X 2 , Y 2 }) 1 1 2 olarak bulunmuş olur. 4.3.10 X ve Y aralarındaki korelasyon olan herhangi iki rasgele değişken olsun. 0 için E ( X ) x , E (Y ) y , Var ( X ) x2 ve Var (Y ) y2 olmak üzere, P | X x | x veya |Y y | y 1 1 1 2 2 olduğunu gösteriniz (Öztürk, 1993, sayfa 299). Çözüm: Eşitsizliğin sol tarafındaki olasılık açık olarak P X x x veya Y y y 2 X x P 2 veya x 2 2 2 Y y X x Y y 2 2 P max , y x y şeklinde yazılır. Markov eşitsizliğinden de, 2 X x Y y P max , x y 2 2 1 X x Y y 2 E max , x y 1 2 1 1 2 2 bulunur. Böylece, P (| X x | veya | Y y | y (1 1 2 ) / 2 eşitsizliği elde edilmiş olur. 2 BÖLÜM 5 ÖZEL DAĞILIMLAR Bu bölümde, olasılık ve istatistikte öne çıkan bazı dağılımlar ele alınacaktır. Öncelikle, olasılık dağılımlarının burada bahsedilen dağılımlarla sınırlı olmadığını belirtelim. Johnson ve Kotz (1970) dağılımlar ile ilgili dört ciltlik bir kitap yayınlamıştır. Bunlardan birinci cildi tek değişkenli kesikli dağılımlar, ikinci ve üçüncü ciltleri tek değişkenli sürekli dağılımlardan oluşmaktadır. Dördüncü cilt çok değişkenli istatistik dağılımları içermektedir. Olasılık dağılımları da rasgele değişkenlerde olduğu gibi kesikli ve sürekli dağılımlar olarak ayrı ayrı incelenecektir. Rasgele değişkenler ve dağılımları ikinci bölümde ayrıntılı olarak incelendiğinden, burada seçilen özel dağılımların bazı özellikleri üzerinde durulacaktır. Ayrıca, çok değişkenli normal dağılım, özellikle iki değişkenli normal dağılım üzerinde de durulacaktır. Bazı dağılım aileleri (üstel aileler) de bu bölümde yer verilecek konular arasındadır. 5.1. Tek Değişkenli Kesikli Dağılımlar 5.1.1. Bernoulli Dağılımı Sadece iki sonucu (başarı-başarısız, doğru-yanlış gibi) bulunan deneylere Bernoulli deneyi denir. Bir Bernoulli deneyinin örnek uzayı iki elemandan oluşan bir kümedir. Yani, örnek uzay Ω = {w1 , w2 } olup X :Ω → 0 , w = w0 w → X ( w) = 1 , w = w1 olarak tanımlanan X fonksiyonuna Bernoulli rasgele değişkeni denir ve değer kümesi D X = {0,1} dir. Bu fonksiyonun bir rasgele değişken olduğu ikinci bölümde gösterildi. Genellikle, {Başarı} yerine {w : X ( w) = 1} ve P ({Başarı}) veya P ({w : X ( w) = 1}) yerine de kısaca P ( X = 1) yazılır. P ( X = 1) başarı olasılığına p denirse, q = 1 − p olmak üzere Bernoulli rasgele değişkeni için olasılıklar, 184 MATEMATİKSEL İSTATİSTİĞE GİRİŞ P( X = x) = p x q1− x , x = 0,1 formülü ile hesaplanır. D X = {0,1} ve x ∈ DX için P( X = x) = p x q1− x olmak üzere, Bernoulli rasgele değişkeninin olasılık fonksiyonu, P ( X = x ) , x ∈ DX f ( x) = 0 , d . y. dir. Dağılımın olasılık fonksiyonu ile dağılım fonksiyonunun grafikleri Şekil (5.1.1) de verilmiştir. 1 P(X=x) F(x) 0,6 0,4 0,4 x 0 1 x 0 1 Şekil 5.1.1 Bernouilli dağılımının olasılık fonksiyonu ve dağılım fonksiyonu (p=0.6) Bu olasılık fonksiyonu kısaca, P( X = x) = p x q1− x , x = 0,1 şeklinde ifade edilecektir. 0 < p < 1 için p başarı olasılığını göstermek üzere, Bernoulli dağılımı için X ~ Bern( p ) gösterimi kullanılacaktır. Bernoulli dağılımının bütün momentleri başarı olasılığına eşittir. Yani, k sonlu bir tamsayı ( k ∈ ) olmak üzere, 1 E ( X k ) = ∑ x P( X = x) = 0.P( X = 0) + 1. P( X = 1) = P( X = 1) = p x =0 dir. Buradan, dağılımın varyansı Var ( X ) = E ( X 2 ) − [ E ( X )]2 = p − p 2 = p(1 − p) = p q ve moment çıkaran fonksiyonu da t ∈ için 1 M X (t ) = E (et X ) = ∑ et x P ( X = x) = q + p et x =0 dir. Benzer şekilde, karekteristik fonksiyonu ϕ X (t ) = q + p eit , çarpımsal moment çıkaran fonksiyonu da N X (t ) = E (t X ) = q + p t dir. X ~ Bern( p ) dağılımı için, ÖZEL DAĞILIMLAR E( X ) = 185 d N X (t ) =p d t t =1 olup diğer bütün çarpımsal momentler sıfırdır. Yani, E ( X ( X − 1) ) = 0 , E ( X ( X − 1)( X − 2) ) = 0 ,…, E ( X ( X − 1)( X − 2)...( X − k ) ) = 0 dır. Kümülant üreten fonksiyonu K X (t ) = ln( M X (t )) olup, kümülantlardan ilk üç tanesi K1 = K2 = K3 = d p et (ln(q + p et ) | t =0 = |t =0 = p = E ( X ) dt q + pet d2 p q et dt (q + p e t ) 2 (ln(q + p et ) | t =0 = 2 d3 dt (ln(q + pet ) | t =0 = 3 | t =0 = pq = Var ( X ) p qet (q + pet ) − 2(q + pet ) pet pqet t 4 (q + pe ) | t =0 = pq − 2qp2 = pq(1 − 2 p) şeklinde hesaplanmıştır. Diğerleri ardışık olarak hesaplanır. 5.1.2. Binom Dağılımı Bir Bernoulli deneyi, her denemede başarı olasılığı aynı olacak şekilde birbirinden bağımsız olarak n kez tekrarlansın. Böyle bir deneye Binom deneyi denir. X rasgele değişkeni Binom deneyindeki başarıların sayısı olarak tanımlandığında, X in değer kümesi D X = {0,1, 2,3,..., n} olur. Bernoulli denemesinde başarıyı B , başarısızlığı da B c ile gösterirsek, Binom deneyinde x tane başarı, B B c B B B c Bc B ..... B B c B c 1. başarı 2. başarı 3. başarı x. başarı şeklinde gözlenebilir. Bu x tane başarı, şekilde de görüldüğü gibi C (n, x) farklı şekilde dizilebilir. Her bir denemede başarı olasılığı aynı ise, başarısızlık olasılığı da aynıdır. Buna göre, başarı olasılığı p ( P ( B ) = p , q = 1 − p ) olmak üzere, Binom deneyinde x tane başarı elde etme olasılığı x = 0,1, 2, 3,..., n için, n P( X = x) = p x q n− x x 186 MATEMATİKSEL İSTATİSTİĞE GİRİŞ ile hesaplanır. Buradan, X in olasılık fonksiyonu, D X = {0,1, 2,3,..., n} olmak üzere, P( X = x) , x ∈ DX f ( x) = 0 , d . y. dir. Binom dağılımı için X ~ Binom(n, p ) gösterimi kullanılacaktır. X ~ Binom(3, 0.6) dağılımının olasılık fonksiyonu ile dağılım fonksiyonunun grafiği aşağıdadır (Şekil (5.1.2)). P(X=x) F(x) 0,432 1 0,288 0,784 0,216 0,352 0,064 0,064 x 0 1 2 3 x 0 1 2 3 Şekil 5.1.2 Binom dağılımının olasılık fonksiyonu ve dağılım fonksiyonu (n=3 ve p=0.6) Bir Bernoulli deneyi birbirinden bağımsız olarak n defa tekrarlansın. X1 birinci denemedeki başarıların sayısı, X 2 ikinci denemedeki başarıların sayısı ve X n de n. denemedeki başarıların sayısı olsun. Bu rasgele değişkenlerin toplamı, Bernoulli deneyinin n kez tekrarlanmasında gözlenen başarıların sayısı olur. Bu rasgele değişkenlerin her biri bağımsız Bernoulli rasgele değişkenidir. Bernoulli deneyinin n kez tekrarlanmasında gözlenen başarıların sayısı X olsun. Her i için X i ler 0 ya da 1 değerlerini aldığından X i lerin toplamı X in değer kümesi olur. Yani bir Binom rasgele değişkeni, bağımsız Bernoulli rasgele değişkenlerinin toplamıdır. Düzgün bir paranın üç defa atılması deneyini göz önüne alalım. Burada örnek uzay, Ω = {YYY , YYT , YTY , TYY , TTY , TYT , YTT , TTT } olup, Ω üzerinde tanımlanan sigma cebir Ω nın kuvvet kümesi ( U = σ (Ω) ) olsun. Ayrıca A ∈ U için P ( A) = n( A) / 8 denirse, (Ω, U , P ) bir olasılık uzayı olur. Bu deneyde, X gelen turaları (veya yazıları) sayan bir rasgele değişkendir. Buna göre, deneme sayısı sabit olup her bir denemede tura gelmesi olasılığı aynıdır. Denemeler birbirinden bağımsız ise X , Binom rasgele değişkenidir. Yani, X ~ Binom( n = 3, p = 1/ 2) olup olasılık fonksiyonu, x 3− x 3 1 1 P( X = x) = x 2 2 dır. Bu olasılık fonksiyonu bazen , x = 0,1, 2,3 ÖZEL DAĞILIMLAR 187 0 1/ 8 X =x P ( X = x) 1 3/8 3 1/ 8 2 3/8 şeklinde de ifade edilir. X ~ Binom( n, p ) olmak üzere olasılık fonksiyonu, n P( X = x) = p x q n − x , x = 0,1, 2,3,..., n x şeklinde verildiğinde fonksiyonun bir olasılık fonksiyonu olduğu n n n ∑ P( X = x) = ∑ p x q n− x = ( p + q) n = 1 x =0 x =0 x şeklindeki Binom açılımından ( p + q = 1 ) açıktır. Dağılımın momentlerinin doğrudan hesabı biraz karmaşıktır. Örneğin, dağılımın birinci momenti, yani beklenen değeri n n n n x n! E ( X ) = ∑ x P ( X = x) = ∑ x p x q n− x = ∑ p x q n− x x=0 x =0 x x =0 x !( n − x )! n n np (n − 1)! x −1 n − x (n − 1)! p q p x −1q n − x = ∑ = np ∑ x =0 ( x − 1)!( n − x)! x =0 ( x − 1)!( n − x )! n−1 = np ∑ y =0 n −1 n (n − 1)! p y q n−1− y = np ∑ p y q n −1− y y !(n − 1 − y )! y =0 y = np ( p + q ) n−1 = n p dir. Binom rasgele değişkeni bağımsız Bernoulli rasgele değişkenlerinin toplamı olarak düşünüldüğünde dağılımın beklenen değeri daha kolay hesaplanır. X1, X 2 ,… , X n aynı p başarı olasılığına sahip bağımsız Bernoulli rasgele değişkenleri olmak üzere X = X1 + X 2 + … + X n rasgele değişkeni de başarı olasılığı p olan Binom dağılımına sahiptir. Her i için E ( X i ) = p olduğundan X ~ Binom(n, p ) dağılımının beklenen değeri, E ( X ) = E ( X1 + X 2 + … + X n ) = E ( X1 ) + E ( X 2 ) + … + E ( X n ) = p + p + ... + p = n p dir. Beklenen değerlerin var olması halinde, rasgele değişkenlerin toplamının beklenen değeri, beklenen değerlerinin toplamına eşittir. Eğer rasgele değişkenler bağımsız ise, rasgele değişkenlerin toplamının varyansı da varyanslarının toplamıdır. Yani, X ve Y sonlu beklenen değer ve varyansa sahip iki rasgele değişkenler ise, E ( X ± Y ) = E ( X ) ± E (Y ) dir. Var ( X ± Y ) = Var ( X ) + Var (Y ) ± 2 Cov( X , Y ) 188 MATEMATİKSEL İSTATİSTİĞE GİRİŞ Şimdi, bu eşitliklerin doğru olduğunu gösterelim. X , Y kesikli ve olasılık fonksiyonu (sürekli ise toplam yerine integral gelir) P ( X = x, Y = y ) olmak üzere E ( X ± Y ) beklenen değeri E( X ± Y ) = ∑ ∑ ( x ± y )P( X = x, Y = y ) x∈DX y∈DY = ∑ ∑ [ x P ( X = x , Y = y ) ± y P ( X = x, Y = y ) ] x∈DX y∈DY = ∑ x ∑ P ( X = x, Y = y ) ± ∑ y ∑ P ( X = x , Y = y ) x∈DX y∈DY y∈DY x∈DX = ∑ x P( X = x) ± ∑ y P(Y = y ) = E ( X ) ± E (Y ) x∈DX y∈DY olur. Yani, E ( X ± Y ) = E ( X ) ± E (Y ) dir. Benzer şekilde varyans da, Var ( X ± Y ) = E[( X ± Y )2 ] − [ E( X ± Y )]2 = E[ X 2 + Y 2 ± 2 XY ] − [( E( X ))2 + ( E(Y ))2 ± 2 E( X ) E (Y )] = [ E( X 2 ) − ( E( X ))2 ] + [ E(Y 2 ) − ( E (Y ))2 ] ± 2[ E ( XY ) − E ( X ) E(Y )] = Var ( X ) + Var (Y ) ± 2 Cov( X , Y ) dir. X1, X 2 ,… , X n bağımsız Bernoulli rasgele değişkenleri olduğundan, i ≠ j için Cov( X i , X j ) = 0 dır. Dolayısı ile Binom dağılımının varyansı, Var ( X ) = Var ( X1 + X 2 + … + X n ) = Var ( X1 ) + Var ( X 2 ) + … + Var ( X n ) = pq + pq + ... + pq = n p q dir. Diğer taraftan, Bernoulli dağılımının moment çıkaran fonksiyonu M X i (t ) = q + pet olduğundan Binom dağılımının moment çıkaran fonksiyonu da, n n ( i =1 ) ( M X (t ) = M X1 +…+ X n (t ) = ∏ M X i (t ) = ∏ q + pet = q + pet i =1 olarak bulunur. Kümülant üreten fonksiyonu, K X (t ) = (t ) = ln( K X (t )) = ln[(q + pet )n ] = n ln(q + pet ) olup kümülantlar Kn = d n K X (t ) d tn t =0 ) n ÖZEL DAĞILIMLAR 189 eşitliği ile hesaplanır. Kümülantlardan ilk dört tanesi, K1 = K2 = d K X (t ) dt ( q + p et ) t =0 d 2 K X (t ) dt n p et = = 2 t =0 = n p = E( X ) t =0 n p et t (q + p e ) − n p 2 e2 t = n p − np 2 t 2 (q + p e ) t =0 = np (1 − p ) = n p q = Var ( X ) K3 = d 3 K X (t ) n p et = d t3 (q + p et ) t =0 − 3n p 2 e2 t ( q + p et ) 2 + 2n p 3 e3 t ( q + p et )3 t =0 = n p − 3np 2 + 2n p 3 K4 = d 4 K X (t ) d t4 = t =0 n p et (q + p et ) 2 − 3 = n p − 7 np + 12 n p − 6 n p 3n p 2 e2 t ( q + p et ) 2 + 2n p 3 e3 t ( q + p et )3 t =0 4 olarak hesaplanmıştır. Dağılımın çarpımsal moment üreten fonksiyonu ise, n n n n n N X (t ) = E (t X ) = ∑ t x P( X = x) = ∑ t x p x q n− x = ∑ (t p) x qn− x = (q + p t )n x=0 x=0 x x=0 x olup dağılımın çarpımsal momentlerinden ilk üç tanesi ( p + q = 1 ) E( X ) = d N X (t ) dt E ( X ( X − 1)) = = n(q + p t ) n−1 p t =1 d 2 N X (t ) dt t =1 = n p (n − 1) p (q + p t ) n− 2 p 2 t =1 E ( X ( X − 1)( X − 2)) = =np, d 3 N X (t ) dt t =1 = n (n − 1) p 2 , = n p3 (q + p t ) n−3 (n 2 − 3n + 2) 3 t =1 t =1 = n (n 2 − 3n + 2) p3 olarak hesaplanmıştır. n ∈ için X n rasgele değişkenlerinin moment çıkaran fonksiyonu M X n (t ) , sıfır noktasının her komşuluğunda bir X rasgele değişkeninin moment çıkaran fonksiyonuna ( M X (t ) diyelim) yakınsıyorsa, X n lerin dağılım fonksiyonlarının dizisi de X in dağılım fonksiyonuna yakınsar. Yani, 190 MATEMATİKSEL İSTATİSTİĞE GİRİŞ lim M X n (t ) = M X (t ) ise lim FX n ( x) = FX ( x) n→∞ n→∞ dir. Rasgele değişkenlerin moment çıkaran fonksiyonu bazen olmayabilir. Böyle durumlarda karekteristik fonksiyonu kullanılır. n ∈ için X n rasgele değişkenlerinin karekteristik fonksiyonları ( ϕ X n (t ) ) bir X rasgele değişkenin karekteristik fonksiyonuna ( ϕ X (t ) ) yakınsıyorsa, dağılım fonksiyonları da yakınsar. Yani, lim ϕ X n (t ) = ϕ X (t ) ise lim FX n ( x) = FX ( x) n→∞ n→∞ dir. 5.1.3. Çok Terimli Dağılım (Multinomial Distribution) Bernoulli deneyinde sadece iki sonuç vardır. Olabilir sonuçlarının sayısı ikiden fazla olan deneyler Bernoulli deneyi değildir. Örneğin, bir kavanozun içinde k farklı renkte top bulunsun. Bu kavanozdan çekilen topun tekrar yerine konulması koşulu ile n tane top çekelim. Buna göre, her bir denemede siyah top gelmesi olasılığı aynıdır. Kırmızı veya sarı top gelmesi olasılıkları da aynıdır. Dolayısı ile, deneyin birbirinden ayrık k farklı sonucu vardır. Siyah top gelmesi olayı E1 ise X 1 de gelen siyah topların sayısı olur. Kırmızı top gelmesi olayı E2 ise X 2 kırmızı topların sayısını, E3 de sarı top gelmesi olayı ise X 3 , sarı topların sayısı olarak tanımlanabilir. Denemeler birbirinden bağımsız ve herbir denemede siyah top gelmesi olasılığı ( E1 olayının gerçekleşmesi olasılığı) aynıdır. Buna göre, X 1 rasgele değişkeninin değer kümesi DX1 ile X 2 rasgele değişkeninin değer kümesi aynıdır ( DX1 = DX 2 = {0,1, 2,3,..., n} ). E1, E2 ,..., Ek ler bir deneyin ayrık sonuçları olsun. ( X 1 , X 2 ,… , X k ) bağımsız rasgele değişkenleri de Ei olaylarının kaç defa gözlendiğini saysın. Yani, n bağımsız denemede X1 rasgele değişkeni E1 olayının kaç defa gözlendiğini, X 2 de E2 olayının kaç defa gözlendiğini saysın. P ( Ei ) = pi olmak üzere, ( X 1 , X 2 ,… , X k ) rasgele vektörünün olasılık fonksiyonu x1 + x2 + ... + xk = n , p1 + p2 + ... + pk = 1 , için xi = 0,1, 2,..., n ve i = 1, 2,..., k ÖZEL DAĞILIMLAR 191 P ( X1 = x1, X 2 = x2 ,… , X k = xk ) = n! x x x p1 1 p2 2 ... pk k x1 ! x2 !... xk ! dir. Şimdi bunun bir olasılık fonsiyonu olduğunu gösterelim. i = 1, 2,3,.., k için pi , xi ∈ ve x1 + x2 + ... + xk = n olmak üzere çok terimli Binom açılımı, n n − x1 n− x1 −...− xk −1 x1 =0 x2 =0 xk =0 n ( p1 + p2 + ... + pk ) = ∑ ∑ ... ∑ n! x x x p1 1 p2 2 ... pk k x1 ! x2 !...xk ! şeklindedir. Bunun için, n n x ( p1 + p2 + ... + pk ) n = ( p1 + ( p2 + ... + pk ))n = ∑ p1 1 ( p2 + ... + pk )n − x1 x1 =0 x1 n − x1 n − x 1 x2 n− x − x ( p2 + ... + pk ) n− x1 = ( p2 + ( p3 + ... + pk )) n− x1 = ∑ p2 ( p3 + ... + pk ) 1 2 x 2 x2 =0 olup, böyle devam ederse, n − x1 n − x1 − ... − xk −1 x1 x2 xk p1 p2 ... pk ... x x x 1 2 k n − x1 −...− xk −1 n n n − x1 ( p1 + p2 + ... + pk ) n = ∑ ∑ ... ∑ x1 = 0 x2 =0 xk =0 elde edilir. Bununla birlikte, n n − x1 n − x1 − x2 n − x1 − x2 − ... − xk −1 ... x xk 1 x2 x3 (n − x1 − x2 − ... − xk −1 )! (n − x1 )! n! n! = ... = x1 !(n − x1 )! x2 !(n − x1 − x2 )! xk !(n − x1 − x2 − ... − xk )! x1 ! x2 ! x3 !...xk ! olduğundan n − x1 −...− xk −1 n n n− x1 ( p1 + p2 + ... + pk )n = ∑ ∑ ... x1=0 x2 =0 ∑ xk =0 n n − x1 n − x1−...− xk −1 = ∑ ∑ ... ∑ x1=0 x2 =0 xk =0 n − x1 n − x1 − .. − xk −1 x1 x2 xk p1 p2 .. pk ... x xk 1 x2 n! x p1x1 p2x2 ... pk k x1 ! x2 !..xk ! şeklinde çok terimli Binom açılımı elde edilmiş olur. p1 + p2 + ... + pk = 1 olduğundan, n n − x1 n − x1 −...− xk −1 ∑ ∑ ... x1 =0 x2 =0 ∑ xk =0 P ( X 1 = x1 , X 2 = x2 ,… , X k = xk ) 192 MATEMATİKSEL İSTATİSTİĞE GİRİŞ n n − x1 n − x1 −...− xk −1 = ∑ ∑ ... ∑ x1 =0 x2 =0 xk =0 n! p1x1 p2x2 ... pkxk = ( p1 + p2 + ... + pk )n = 1 x1 ! x2 !...xk ! olup x1 + x2 + ... + xk = n , p1 + p2 + ... + pk = 1 , xi = 0,1, 2,..., n ve i = 1, 2,..., k olmak üzere P ( X1 = x1, X 2 = x2 ,… , X k = xk ) = n! x x x p1 1 p2 2 ... pk k x1 ! x2 !... xk ! şeklinde verilen fonksiyon bir olasılık fonksiyonudur. Örnek 5.1.1 Bir kavanozda 5 siyah, 4 kırmızı ve 3 sarı top vardır. Çekilen topları tekrar yerine koyarak kavanozdan 6 top çekelim. Çekilen topların 3 siyah, 2 kırmızı ve 1 sarı olması olasılığını hesaplayalım. Burada olaylar her bir deneme için E1 = {siyah top çekilmesi} , E2 = {kırmızı top çekilmesi} , E3 = {sarı top çekilmesi} olarak yazıldığında E1 , E2 ve E3 olayları örnek uzayın bir parçalanmasını oluşturur. Her bir olayın gerçekleşme olasılıkları ( n = 6 ) p1 = P ( E1 ) = 5 /12 , p2 = P ( E2 ) = 4 / 12 , p3 = P ( E3 ) = 3 / 12 şeklinde olup aranan olasılık, 3 P ( X1 = 3, X 2 = 2, X 3 = 1) = 2 1 6! 5 4 3 6!(53 )(42 )(3) 625 = ≅ 0.121 = 3! 2!1! 12 12 12 5184 3!2!1!(12)6 dır ⊕ 5.1.4. Geometrik Dağılım Bağımsız Bernoulli denemelerine ilk başarıyı elde edinceye kadar devam edelim. X ilk başarıyı elde edinceye kadar yapılan denemelerin sayısı olsun. Bu durumda denemeler B c B c Bc . . . . B c Bc x −1 tane başarısız deneme B son deneme şeklinde olacaktır. Binom deneyinde n deneme sayısı sabit olup bu n denemedeki başarıların sayısı ile ilgileniyoruz. Oysa, geometrik deneyde başarı sayısı sabir (bir) olup bu başarıyı elde edinceye kadar yapılan denemelerin sayısı ile ilgileniyoruz. x . denemede başarı elde etmek için x − 1 defa başarısız denemenin gerçekleşmiş olması gerekir. Buna göre, X in olasılık fonksiyonu, p başarı olasılığını göstermek üzere q = 1 − p için, ÖZEL DAĞILIMLAR 193 P( X = x) = p q x −1 , x = 1, 2,3,... şeklinde olur. Bu olasılık fonksiyonuna sahip X rasgele değişkenine Geometrik dağılıma sahiptir denir ve X ~ Geometrik ( p ) veya X ~ Geo( p ) ile gösterilir. Bu fonksiyon, ∞ ∞ ∞ ∞ x =1 x =1 x =1 y =0 ∑ P( X = x) = ∑ p q x−1 = p ∑ q x−1 = p ∑ q y = p p = =1 1− q p olduğundan bir olasılık fonksiyonudur. Dağılımın ilk iki momenti, ∞ ∞ x =1 x =1 ∞ d x d ∞ x q =p ∑q dq x =1 x =1 dq ( ) E ( X ) = ∑ x P ( X = x) = ∑ x p q x −1 = p ∑ =p d 1 d 1 −1 + q d q − 1 = p = p = dq 1 − q dq 1 − q dq 1 − q 1− q + q p 1 p = = (1 − q )2 p 2 p ve ∞ ∞ ∞ x =1 x =1 x =1 E ( X 2 ) = ∑ x 2 P( X = x) = p ∑ x 2 q x −1 = p ∑ x d x d ∞ q =p ∑ x qx dq dq x =1 ( ) d ∞ d ∞ d x d d ∞ x = p ∑ x q x −1+1 = p q ∑ q = p q ∑ q dq x=1 dq dq dq x =1 dq x=1 d d 1 d q 1+ q = p q − 1 = p = 2 dq dq 1 − q dq (1 − q ) 2 p olarak hesaplanmıştır. Buradan dağılımın varyansı da, 2 Var ( X ) = E ( X 2 ) − ( E ( X ) ) = 1+ q p 2 − 1 p 2 = q p2 şeklinde bulunur. F(x) P(X=x) 1,0 0,9 0,8 0,7 0,3 0,25 0,6 0,5 0,20 0,4 0,3 0,2 0,15 0,10 0,05 x 1 2 3 4 5 6 7 x 0,1 1 2 3 4 5 6 7 8 Şekil 5.1.3 Geometrik dağılımının olasılık fonksiyonu ve dağılım fonksiyonu(p=0.3) Dağılımın moment çıkaran fonksiyonu ise et < (1/ q ) ve t ∈ için, 194 MATEMATİKSEL İSTATİSTİĞE GİRİŞ ∞ ∞ x =1 x =1 M X (t ) = E (et X ) = ∑ et x P( X = x) = ∑ et x p q x−1 = p ∞ p et ∑ (qet ) x = q x=1 1 − q et şeklinde hesaplanmıştır. Örnek 5.1.2 X ~ Geometrik ( p ) olsun. P ( X > n) olasılığı, n n −1 x =1 y =0 P ( X > n) = 1 − P ( X ≤ n) = 1 − p ∑ q x −1 = 1 − p ∑ q y = 1 − p (1 − q n ) = qn 1− q ve s > t > 0 için {w : X ( w) > s} ⊂ {w : X ( w) > t} olup P ( X > s | X > t ) koşullu olasılığı P( X > s | X > t) = olduğundan P ( X > s, X > t ) P ( X > s ) q s = = = q s −t = P( X > s − t ) P( X > t ) P( X > t ) qt P( X > s | X > t ) = P( X > s − t ) özelliğine sahiptir. Kesikli dağılımlar içerisinde bu özelliğe (memoryless) sahip tek dağılım Geometrik dağılımdır ⊕ Teorem 5.1.1 Negatif değerler almayan kesikli X rasgele değişkeninin geometrik dağılıma sahip olması için gerek ve yeter koşul bütün n ler için, P ( X > x + n | X > x ) = P ( X > n) özelliğinin sağlanmasıdır. İspat: X ~ Geometrik ( p ) olsun. X in olasılık fonksiyonu P( X = x) = p q x −1 , x = 1, 2,3,... olup Örnek (5.1.2) den P( X > s ) = q s dir. Buradan, P ( X > x + n | X > x) = P ( X > x + n , X > x ) P ( X > x + n ) q x+n = = x = q n = P( X > n) P ( X > x) P( X > x) q elde edilir. Böylece, ispatın gerek koşulu ispatlanmış olur. Şimdi, negatif değerler almayan kesikli X rasgele değişkeni bütün n ler için P ( X > x + n | X > x ) = P ( X > n) özelliğini sağlasın. Buradan P ( X ≥ 1) = 1 olduğu açıktır. Bununla birlikte, P ( X = x + 1) = P ( X > x) − P ( X > x + 1) ve P ( X > x) = P ( X > x − 1) − P ( X = x) eşitlikleri de sağlanır. P ( X > 1) = q diyelim. Diğer taraftan ÖZEL DAĞILIMLAR 195 P( X = x + 1) P( X > x) − P( X > x + 1) P( X > x + 1) P( X > x + 1, X > x) = = 1− = 1− P( X > x) P ( X > x) P( X > x) P( X > x) = 1 − P ( X > x + 1| X > x ) = P( X > 1) = 1 − q olduğundan, P ( X = x + 1) = (1 − q ) P ( X > x) eşitliği elde edilir. Benzer şekilde, P ( X = x + 1) = (1 − q ) P ( X > x) = (1 − q ) [ P ( X > x − 1) − P ( X = x)] = (1 − q ) [ P ( X > x − 1) − (1 − q ) P ( X > x − 1)] = (1 − q ) q P ( X > x − 1) = (1 − q ) q [ P ( X > x − 2) − P ( X = x − 2)] = (1 − q ) q [ P ( X > x − 2) − (1 − q ) P ( X > x − 2)] = (1 − q ) q 2 P ( X > x − 2) = . . . . . = (1 − q ) q x = p q x dir. Dolayısı ile, X rasgele değişkeni, P( X = x) = p q x −1 , x = 1, 2,3,... şeklinde bir olasılık fonksiyonuna sahip olduğundan Geometrik dağılıma sahiptir ◊ Teoremin ispatı (özellikle yeter koşul) matematiksel tümevarımla da yapılabilirdi (birinci baskıda yapıldığı gibi). Teoremden aşağıdaki sonucu yazabiliriz. Sonuç: Negatif değerler almayan kesikli X rasgele değişkeninin geometrik dağılıma olması için gerek ve yeter koşul bütün k ≥ 0 için P ( X = k + n | X ≥ n) = P ( X = k ) özelliğini sağlamasıdır. İspat: P ( X = k + n | X ≥ n) koşullu olasılığı P ( X = k + n | X ≥ n) = P ( X = k + n , X ≥ n) P ( X ≥ n) = P( X = k + n ) P ( X ≥ n) olup X Geometrik dağılıma sahip ise olasılık fonksiyonu P( X = x) = p q x −1 , x = 1, 2,3,... veya P( X = x) = p q x , x = 0,1, 2,3,... şeklindedir. P( X = k + n) = p q k + n ve P( X ≥ n) = q n olduğundan bu koşullu olasılık için P ( X = k + n | X ≥ n) = P( X = k + n ) P ( X ≥ n) = p q k +n q n = p q k = P( X = k ) elde edilir. Dolayısı ile teoremin gerek kısmı ispatlanmıştır. Diğer taraftan, negatif değerler almayan kesikli X rasgele değişkeni P ( X = k + n | X ≥ n ) = P ( X = k ) özelliğine sahip ise, X in olasılık fonksiyonunun P( X = x) = p q x , x = 0,1, 2,3,... 196 MATEMATİKSEL İSTATİSTİĞE GİRİŞ şeklinde olduğununun gösterilmesi gerekir. Önce, P ( X = k + n | X ≥ n ) = P( X = k ) ise P ( X = k + n ) = P ( X = k ) P ( X ≥ n) (*) olduğu açıktır. Şimdi bu özelliğe sahip kesikli X rasgele değişkeninin geometrik dağılıma sahip olduğunu tümevarım ile gösterelim. n = 1 için (*) eşitliği P ( X = k + 1) = P ( X = k ) P ( X ≥ 1) şeklinde yazılabilir. p = P ( X = 0) ve q = 1 − p olsun. k = 1 için olasılık fonksiyonu, P ( X = 1) = p q olur. (*) ifadesinde P ( X = 1) olasılığı P( X = 1) = P( X = 0) P( X ≥ 1) = P( X = 0) [1 − P( X < 1)] = P( X = 0) [1 − P( X = 0)] = p q olup iddia k = 1 için doğrudur. İddia k = m için doğru olsun. Yani, P( X = m) = p q m olsun. Bu durumda, P( X = m + 1) = p q m+1 olduğunun gösterilmesi gerekir. Bunun için (*) eşitliği m + 1 için tekrar yazıldığında, P( X = m + 1) = P( X = m) P( X ≥ 1) = P( X = m)[1 − P( X < 1)] = P( X = m)[1 − P( X = 0)] = pq m [1 − P] = pq m +1 elde edilir. Yani, negatif değerler almayan kesikli bir X rasgele değişkeni, P ( X = k + n | X ≥ n ) = P( X = k ) özelliğine sahipse, olasılık fonksiyonu P( X = x) = p q x , x = 0,1, 2,... şeklindedir. Bu da ispatı tamamlar ◊ Bilindiği gibi, bağımsız Bernoulli denemeleri tekrarlandığında, deneme sayısının sabit ve her denemede başarı olasılığının aynı olduğu varsayıldı. Gözlenen başarıların sayısı X Binom dağılımına sahiptir. Bağımsız Bernoulli denemelerinde başarı sayısı sabit (ilk başarı) ise, yapılan denemelerin sayısı ( Y ), Y ~ Geo( p ) dir. Buna göre, bu iki dağılım arasında bir ilişkinin olması beklenir. X ~ Binom(n, p ) ise, X in olasılık fonksiyonu n P( X = x) = p x q n − x , x = 0,1, 2,3,..., n x dir. Geometrik dağılımda başarı sayısı 1 olup denemelerin sayısı Y in olasılık fonksiyonu g ( x) = P(Y = x) = p q x −1, x = 1, 2,3,... dir. Binom dağılımında, 1 başarı elde etme olasılığı ÖZEL DAĞILIMLAR 197 P( X = 1) = n p q n−1 olup n = x için bu olasılık P( X = 1) = x p q x−1 dir. O halde, X ~ Binom(n, p ) ve n = x için olasılık fonksiyonu f ( x) ise, g ( x) = f ( x) / x = p q x −1, x = 1, 2,3,... şeklinde Geometrik dağılımın olasılık fonksiyonuna dönüşür. 5.1.5. Negatif Binom Dağılımı Bağımsız Bernoulli denemelerine k başarı elde edinceye kadar devam edelim. Burada, k tane başarı elde edinceye kadar denemelere devam edileceği için, denemelerin en az k defa tekrarlanması gerekir. Böylece denemeler, B i ler başarıları ( B1 birinci başarı, B2 ikinci başarı gibi) Bic de başarısız denemeleri göstermek üzere, 1 denem e ve k −1 başarı x − c c c c c c c c c c B B ... B B1 B B ... B B 2 B B ... B B3 B .... B c B k x denemede k başarı biçiminde olabilir. Buna göre, k . başarıyı elde edinceye kadar yapılan Bernoulli denemelerinin sayısı X olmak üzere, x. denemede k . başarıyı elde etme olasılığı, x − 1 k x −k P( X = x) = , x = k , k + 1, k + 2,... p q k − 1 şeklinde olur. Bu olasılık fonksiyonuna sahip X rasgele değişkenine Negatif Binom dağılımına sahiptir denir ve p başarı olasılığını, k de başarıların sayısını göstermek üzere, X ~ NB (k , p ) ile gösterilir. Şimdi 0 < a < 1 için ∞ ( x + k − 1)! x (k − 1)! a = x! (1 − a )k x =0 ∑ eşitliğini hatırlayalım. Bu eşitlikte y = x − k yazıldığında, ∞ x − 1 k x−k ( x − 1)! p k ∞ ( x − 1)! x −k k x −k p q = p q = q ∑ ∑ ∑ k − 1 ( k − 1)!( x − k )! ( k − 1)! ( x − k )! x =k x =k x =k ∞ = p k ∞ ( y + k − 1) y p k (k − 1)! p k q = = =1 ∑ (k − 1)! y =0 y! (k − 1)! (1 − q )k p k bulunur. Yani, verilen fonksiyon bir olasılık fonksiyonudur. 198 MATEMATİKSEL İSTATİSTİĞE GİRİŞ Negatif Binom dağılımına sahip X rasgele değişkeni k . başarıyı elde edinceye kadar yapılan bağımsız Bernoulli denemelerinin sayısıdır. X1 birinci başarıyı elde edinceye kadar yapılan denemelerin sayısı, birinci başarıyı elde ettikten sonra ikinci başarıyı elde edinceye kadar yapılan denemelerin sayısı X 2 ve k − 1 başarıdan sonra k . başarıyı elde edinceye kadar yapılan denemelerin sayısı da Xk olmak üzere X rasgele değişkeni X = X1 + X 2 + … + X k şeklinde yazılır. Burada, her i için X i ler bağımsız X i ~ Geo( p ) olup X = X1 + X 2 + … + X k ~ NB (k , p ) dir. Yani, Negatif Binom rasgele değişkeni, bağımsız geometrik rasgele değişkenlerin toplamıdır. Buradan, Negatif Binom dağılımın beklenen değeri ve varyansı E ( X ) = E ( X1 + X 2 + … + X k ) = E ( X1 ) + X 2 + … + E ( X k ) = k / p ve Var ( X ) = Var ( X1 + X 2 + … + X k ) = Var ( X1 ) + Var ( X 2 ) + … + Var ( X k ) = kq / p 2 şeklinde hesaplanır. X ~ NB (k , p ) ise X in moment çıkaran fonksiyonu, Geometrik dağılımın moment çıkaran fonksiyonu yardımı ile p et M X (t ) = M X1 +…+ X k (t ) = ∏ M X i (t ) = ∏ t i =1 i =1 1 − qe k k p et = t 1 − qe k , et < (1/ q ) şeklinde bulunmuştur. Momentlerin doğrudan hesaplanması biraz karmaşıktır. Örneğin, dağılımın birinci momenti, ∞ x − 1 ∞ x ( x − 1)! pk ∞ x! k x −k k x −k E( X ) = ∑ x p q = p q = q x −k ∑ ∑ k − 1 ( k − 1)!( x − k )! ( k − 1)! ( x − k )! x=k x =k x =k = pk ∞ ( y + k ) y pk k! k pk k q = = = ∑ 1 1 k + k + (k − 1)! y =0 y ! (k − 1)! (1 − q ) p p dir. Daha yüksek mertebeden momentler daha da karmaşıktır. Onun için, Negatif Binom dağılımının özellikleri incelenirken, Negatif Binom rasgele değişkenini bağımsız geometrik rasgele değişkenlerin toplamı olarak almak, işlemlerin kolay yürütülmesine olanak sağlar. Negatif Binom rasgele değişkeni, bağımsız Geometrik rasgele değişkenlerinin toplamıdır. Ancak bu dağılım, herhangi bir şekilde Binom dağılımı ile ilişkilendirilmektedir. Bunu açıklamak için X ~ Binom(n, p ) ve Y ~ NB (k , p ) olsun. Burada, X rasgele değişkeni n denemedeki başarıların sayısını gösterirken, Y rasgele ÖZEL DAĞILIMLAR 199 değişkeni k başarı elde edinceye kadar yapılan denemelerin sayısıdır. Bu rasgele değişkenler arasında, P (Y ≤ n) = P ( X ≥ k ) ve P (Y > n) = P ( X < k ) şeklinde bir ilişki vardır. Burada, a) İlk n denemede k ya da daha fazla başarı gözlenmiş ise, ilk k başarıyı elde etmek için n ya da daha fazla deneme yapılması gerekir. b) İlk n denemede k den az başarı gözlenmiş ise, k başarıyı elde etmek için n den çok deneme yapılması gerekir. 5.1.6. Hipergeometrik Dağılım Bir kavanozun içinde iki farklı renkte (sarı ve lacivert diyelim) toplam N tane top bulunduğunu düşünelim. Bunlardan a tanesi sarı geri kalan N − a tanesi lacivert olsun. Kavanozdan aynı anda n tane top çekelim (bir çeşit iadesiz çekiliş yapıyoruz). X bu n tane top içindeki sarı topların sayısı olsun. O zaman, x tane sarı top gelmesi olasılığı (dağılımın olasılık fonksiyonu), a N − a x n − x , x = 0,1, 2,..., n P ( X = x) = N n şeklinde olur. Böyle bir deneme için, X rasgele değişkeninin olasılık fonksiyonu bu şekilde verilmiş ise, X e Hipergeometrik dağılıma sahiptir denir ve X ~ HYP (n, a, N ) ile gösterilir. Şimdi bu fonksiyonun bir olasılık fonksiyonu olduğunu gösterelim. Bunun için, n N ∑ P( X = x) = n x =0 −1 n a N − a ∑ = 1 veya x =0 x n − x n a N − a N ∑ = x =0 x n − x n olduğunun gösterilmesi gerekir. Bunun için tümevarım yöntemini kullanabiliriz. Önce iddianın n = 1 için doğru olduğunu gösterelim. n = 1 ise eşitliğin sağ tarafı N dir. Eşitliğin sol tarafı ise, 1 a N − a a N − a a N − a ∑ = + = ( N − a) + a = N x =0 x n − x 0 1 − 0 1 1 − 1 200 MATEMATİKSEL İSTATİSTİĞE GİRİŞ olup iddia n = 1 için doğrudur. Şimdi, iddianın n için doğru olduğunu varsayalım ve n + 1 için doğru olduğunu gösterelim. İşlemlerde, m = n + 1 denirse n = m − 1 olup, m .nci terimin eklenip çıkartılması ile, n+1 a N n −a a N − a a N − a n a N − a a ∑ = ∑ + = ∑ + x =0 x n + 1 − x x =0 x n + 1 − x n + 1 0 x =0 x n + 1 − x n + 1 m−1 a N − a a m a N − a a N − a a = ∑ + = ∑ − + x =0 x m − x n + 1 x =0 x m − x m m − m n + 1 N a a N N = − + = = m m n + 1 m n + 1 sonucu elde edilir. Yani, iddia her n için doğrudur. Başka bir deyişle, verilen fonksiyon bir olasılık fonksiyonudur. Hipergeometrik dağılımın beklenen değer ve varyansının hesabı biraz karmaşıktır. X in beklenen değeri, n N E ( X ) = ∑ x P( X = x) = n x=0 N = n −1 n a N − a N ∑ x = x =0 x n − x n −1 n N = a n N − a N a! ∑ = x =1 ( x − 1)!( a − x)! n − x n −1 n −1 −1 n ∑x x =1 N −a a! x !(a − x)! n − x −1 n−1 a (a − 1)! N − a x =0 y !(( a − 1) − y )! ( n − 1) − y ∑ −1 a − 1 N − a N N − 1 ∑ = a n n −1 x =0 y ( n − 1) − y ( N − 1)! n !( N − n)! na =a = (n − 1)!( N − n)! N ! N N olarak hesaplanmıştır. Benzer şekilde (biraz daha karmaşık olmakla birlikte) rasgele değişkenin varyansı da hesaplanabilir. Hipergeometrik dağılımın beklenen değer ve varyansı sırası ile E( X ) = na , N Var ( X ) = N −n na a 1 − N −1 N N dir. X ~ HYP (n, a, N ) olsun. Bu durumda N → ∞ ve a → ∞ için p pozitif sabit bir sayı olmak üzere (a / N ) → p ise her bir x = 0,1, 2,..., n için ÖZEL DAĞILIMLAR 201 −1 N a N − a n x n− x lim , x = 0,1, 2,3,..., n = p (1 − p ) N →∞ n x n − x x dir (Bain ve Engelhardt, 1992, sayfa 97). Yani, Hipergeometrik dağılım N → ∞ iken Binom dağılımına yaklaşır. Bazen sonlu elemanlı bir kitleden iadesiz çekiliş yapılmak istenebilir. Bir deneyin sadece iki sonucu varsa (sarı ve lacivert topların bulunduğu bir kavanozdan aynı anda ya da iadesiz çekiliş yapılması), çekilen örnek sayısı n sabit ve denemeler bağımlı (deneylerde birinin sonucu diğerini etkiliyorsa) ise böyle durumlarda Hipergeometrik dağılım kullanılır. Örnek 5.1.3 Bir kavanozda 3 kusurlu, 7 kusursuz parça vardır. Bu kavanozdan aynı anda 3 parça rasgele seçilsin. Çekilen kusurlu parçaların olasılık fonksiyonunu bulalım. X çekilen kusurlu parçaların sayısı olup, N = 10 , a = 3 , n = 3 dür. X in değer kümesi DX = {0,1, 2,3} olup, olasılıklar 3 7 x3− x P( X = x) = , x = 0,1, 2,3 10 3 formülü ile hesaplanır. X kusurlu parçaların sayısı olmak üzere olasılıklar, X =x P ( X = x) 0 35 / 120 1 63 / 120 2 21 /120 3 1/ 120 şeklinde tablo halide yazılabilir ⊕ 5.1.7. Kesikli Düzgün Dağılım Değer kümesi D X = {x1 , x2 ,..., xN } olan X rasgele değişkeninin olasılık fonksiyonu, P( X = x) = 1 , x = x1 , x2 ,..., xN N şeklinde ise X kesikli düzgün dağılıma sahiptir denir. Dağılımın beklenen değer ve varyansı, 202 MATEMATİKSEL İSTATİSTİĞE GİRİŞ E( X ) = N +1 N 2 −1 , Var ( X ) = 2 12 dir. 5.1.8. Poisson Dağılımı Bir çok deney sürekli bir zaman aralığında yapılır. Böyle bir ortamda gözlenen sonuçlar kesikli olabilir. Birim zaman aralıkları (dakika, saat, gün, ay, yıl gibi) veya birim uzunluk (alan veya hacim gibi) sürekli ortamlardır. Örneğin, bir mağazaya belli bir saat dilimi içinde gelen müşterilerin sayısı, böyle bir deneye örnektir. Bu tür deneylere Poisson deneyleri denir. X sürekli ortamdaki kesikli sonuçların sayısını göstermek üzere, X in (Poisson dağılımının) olasılık fonksiyonu, λ > 0 için, P( X = x) = e− λ λ x / x ! , x = 0,1, 2,3,... şeklindedir. X rasgele değişkeni bu olasılık fonksiyonuna sahipse, X Poisson dağılımına sahiptir denir ve X ~ Poisson(λ ) ile gösterilir. eλ fonksiyonunun sıfır noktası komşuluğundaki Taylor serisi açılımı ∞ λx e−λ λ x −λ =e ∑ = e − λ eλ = 1 ∑ P( X = x) = ∑ x =0 x =0 x ! x =0 x ! ∞ ∞ olup verilen fonksiyon bir olasılık fonksiyonudur. İkinci ve üçüncü bölümlerde dağılımın ismi verilmeden bu olasılık fonksiyonuna sahip bir rasgele değişkenin momentleri elde edildi. Ayrıca, dağılımın üretici fonksiyonları ve özellikleri ikinci ve üçüncü bölümlerde incelendi. Bunları tekrar hatırlayalım. Dağılımın ilk iki momenti ile varyansı Örnek (2.5.2) de E ( X ) = λ , E ( X 2 ) = λ + λ 2 ve Var ( X ) = λ olarak elde edilmişti. Dağılımın moment t çıkaran fonksiyonu da M X (t ) = eλ ( e −1) dir (Örnek (2.5.3a)). Örnek (2.6.2) de dağılımın kümülant üreten fonksiyonu, K X (t ) = λ (et − 1) olarak bulunmuş ve bütün kümülantların aynı olduğu ( K n = λ ) görülmüştü. Dağılımın çarpımsal moment üreten fonksiyonu N X (t ) = eλ (t −1) olup çarpımsal momentlerin bütün n ler için, d n N X (t ) dt = n t =1 dn dt n ( eλ (t −1) ) = λn t =1 ÖZEL DAĞILIMLAR 203 şeklinde olduğunu biliyoruz ((Örnek (2.6.3)). Yani, E ( X ) = λ , E ( X ( X − 1) ) = λ 2 , E ( X ( X − 1)( X − 2) ) = λ 3 , E ( X ( X − 1)( X − 2)( X − 3) ) = λ 4 , ... ( X ( X − 1)( X − 2)...( X − n + 1) ) = λ n dir. Binom dağılımı ile Poisson dağılımı arasında bir benzerlik kurulabilir. Örneğin, belirli bir saat dilimi içinde bir mağazaya giren müşterilerin sayısı Poisson rasgele değişkenidir. Oysa, mağazaya giren (maksimum müşteri sayısı sabit) her müşteriyi başarı olarak değerlendirirsek, mağazaya giren müşterilerin sayısı Binom dağılımına sahip olur. X ~ Binom(n, p ) ise dağılımın olasılık fonksiyonunun, n P ( X = x ) = p x q n − x , x = 0,1, 2,..., n x olduğunu biliyoruz. Bu dağılımın beklenen değeri µ = n p ( p = µ / n ) dir. Buradan, P ( X = x) olasılığı için x n n! µ µ P ( X = x) = Pn ( x) = p x q n − x = 1 − x !(n − x)! n n x = n (n − 1) (n − 2) (n − 3) . . . (n − x + 1) x! nx x n− x n µ µ −x µ 1 − 1 − n n 1 2 3 x −1 1 1 − 1 − 1 − . . . 1 − n −x n x µ µ n n n = µ 1 − 1 − x! n n eşitliği elde edilir. Ayrıca, n yeterince büyük ( µ = n p sabit kalacak şekilde p sabit) ise, 1 2 3 x −1 lim 1 1 − 1 − 1 − . . . 1 − =1 n n n n n→∞ ve µ lim 1 − n n→∞ −x n µ = 1 , lim 1 − = e − µ n n→∞ dir. Yani, X ~ Binom(n, p ) ve Y ~ Poisson( µ ) olmak üzere, n yeterince büyük ( µ = n p sabit kalacak şekilde p sabit) ise 204 MATEMATİKSEL İSTATİSTİĞE GİRİŞ n e− µ µ x Pn ( x) = p x q n − x ≅ = P (Y = x) x! x yaklaşımı elde edilir. Yani, Binom dağılımına Poisson dağılımı olarak yaklaşılabilir. Bunun tersi de olabilir. 1 n µ P ( X = 1) = 1 n n = 20 n = 30 0.3774 0.3741 0.2702 0.2705 0.1368 0.1413 0.0576 0.0631 0.0211 0.0253 n = 10 µ =1 µ=2 µ =3 µ=4 µ =5 0.3874 0.2684 0.1211 0.0403 0.0098 n −1 µ 1 − n n = 40 0.3726 0.2706 0.1434 0.0657 0.0274 P (Y = 1) = n = 50 n = 100 0.3716 0.2706 0.1447 0.0672 0.0286 0.3697 0.2707 0.1471 0.0703 0.0312 e − µ µ1 1! 0.3679 0.2707 0.1494 0.0733 0.0337 Yukarıda, değişik µ değerleri için Y ~ Poisson( µ ) ve X ~ Binom(n, p ) olmak üzere, p = µ / n alınarak P ( X = 1) ve P (Y = 1) olasılıkları hesaplanarak (değerler dördüncü basamaktan sonra yuvarlatılmıştır) tablo halinde verilmiştir. Tablodaki değerlerden de görüldüğü gibi, n değeri büyüdükçe, P ( X = 1) Binom olasılıkları P (Y = 1) olasılıklarına yaklaşmaktadır. Örnek 5.1.4 X ~ Poisson(λ ) olsun. E ( X ) = Var ( X ) = λ olduğunu biliyoruz. a) X rasgele değişkeninin çarpıklık ve basıklık katsayılarını hesaplayalım. Üçüncü ve dördüncü merkezi momentler E ( X − λ )3 = λ ve E ( X − λ )4 = λ + 3λ 2 olup Poisson dağılımının çarpıklık ve basıklık katsayıları γ = 1/ λ ve η = 1/ λ dir (Örnek (2.5.5). b) E ( g ( X )) ve g (−1) sonlu olacak şekilde herhangi bir g fonksiyonu için, E (λ g ( X )) = E ( X g ( X − 1)) olduğunu gösterelim (Casella ve Berger, 2002, sayfa 126). E ( X g ( X − 1)) ifadesi y = x − 1 ve x / x ! = 1/ ( x − 1)! olduğu göz önüne alındığında, ∞ ∞ E ( X g ( X − 1) ) = ∑ xg ( x − 1) P( X = x) = ∑ xg ( x − 1) x =0 ∞ = ∑ g ( x − 1) x=1 x =1 e −λ λ x x! e λ e−λ λ y +1 ∞ e −λ λ y = ∑ g ( y) = ∑ λ g ( y) = E ( λ g( X )) ( x − 1)! y =0 y! y! y =0 −λ x şeklinde aranan eşitlik elde edilir. ∞ ÖZEL DAĞILIMLAR 205 c) Bu sonuç kullanılarak, Poisson dağılımının momentleri ardışık olarak hesaplanabilir. Önce, E ( X ) = λ ve Var ( X ) = λ olduğunu biliyoruz. Aslında, dağılımın ikinci momentinin E ( X 2 ) = λ + λ 2 olduğunu da biliyoruz. g ( x) = x denirse ikinci moment E ( X 2 ) = E ( XX ) = E ( X ( X − 1 + 1)) = E ( X ( X − 1) ) + E ( X ) = E (λ g ( X )) + E( X ) = E (λ X ) + E( X ) = λ 2 + λ olarak da hesaplanır. Benzer şekilde, g ( x) = x 2 için dağılımın üçüncü momenti de E ( X 3 ) = E ( XX 2 ) = E ( X ( X − 1 + 1)2 ) = E ( X ( X − 1) 2 ) + 2 E ( X ( X − 1) ) + E ( X ) = E ( λ g ( X ) ) + 2 E ( X ( X − 1) ) + E ( X ) = E (λ X 2 ) + 2λ 2 + λ = λ (λ 2 + λ ) + 2λ 2 + λ = λ 3 + 3λ 2 + λ şeklinde hesaplanır ⊕ Bu kısma son vermeden önce, burada verilen dağılımlar arasındaki ilişkileri özetleyelim. 1) X1, X 2 ,… , X n bağımsız Bernoulli dağılımına sahip rasgele değişkenler ise, X = X1 + X 2 + … + X n ∼ Binom ( n , p ) dir. 2) X i , i = 1, 2,..., k için bağımsız ve X i ∼ Binom(ni , p ) ise n = n1 + n2 + ... + nk için, X = X1 + X 2+ ... + X k ∼ Binom(n, p ) dir. 3) i = 1, 2,..., k için bağımsız ve X i ∼ Geo( p ) ise X = X1 + ... X k ∼ NB (k , p ) dir. 4) X i , i = 1, 2,..., k için bağımsız ve Poisson (λi ) ise, λ = λ1 + ... + λk olmak üzere X = X1 + ... + X k ∼ Poisson(λ ) dır. 5.2. Tek Değişkenli Sürekli Dağılımlar 5.2.1. Sürekli Düzgün Dağılım Olasılık yoğunluk fonksiyonu a, b ∈ ve a < b olmak üzere, 1 f ( x) = b − a 0 , a< x<b , d . y. 206 MATEMATİKSEL İSTATİSTİĞE GİRİŞ şeklinde olan bir X rasgele değişkenine (a , b ) aralığında sürekli düzgün dağılıma sahiptir denir ve X ~ U (a, b) ile gösterilir. Sürekli düzgün dağılım yerine genellikle sadece düzgün dağılım ifadesi kullanılır. F(x) f(x) 1 b-a x x 0 a 0 b a b Şekil 5.2.1 Düzgün dağılımın olasılık yoğunluk fonksiyonu ve dağılım fonksiyonu Olasılık yoğunluk fonksiyonu ile dağılım fonksiyonunun grafikleri Şekil (5.2.1) de verildiği gibi olup dağılımın ilk iki momenti ile varyansı b b a a 1 a+b E ( X ) = ∫ x f ( x) dx = x dx = , ∫ 2 b−a Var ( X ) = E ( X 2 ) − ( E ( X ))2 = (b − a) 12 b 1 a 2 + b 2 + ab 2 E( X ) = x dx = b−a ∫ 3 2 a 2 şeklinde hesaplanmıştır. Ayrıca, a < c1 < c2 < b olmak üzere P (c1 < X < c2 ) olasılığı, c2 c2 P(c1 < X < c2 ) = ∫ f ( x)dx = ∫ c1 c1 f(x) c −c 1 dx = 2 1 b−a b−a P(c 1 <x c 2 ) 1 b-a dir. x 5.2.2. Gamma Dağılımı 0 a c1 Bu dağılımın özelliklerine geçmeden Gamma dağılımı ile ilgili, ∞ Γ(α ) β α = ∫ xα −1e− x / β d x , Γ(n + 1) = n !, Γ(α + 1) = α Γ(α ) , 0! = 1 0 eşitliklerini hatırlayalım. Buradan, xα −1e− x / β , x>0 f ( x) = Γ(α ) β α 0 , d . y. şeklinde tanımlanan f fonksiyonunun tanım kümesi üzerinden integrali c2 b ÖZEL DAĞILIMLAR 207 ∞ ∫ f ( x)dx = 1 0 olduğundan f ( x) fonksiyonu bir olasılık yoğunluk fonksiyonudur. X rasgele değişkeni böyle bir olasılık yoğunluk fonksiyonuna sahip ise X Gamma dağılımına sahiptir denir ve X ~ Gamma (α , β ) ile gösterilir. X ~ Gamma (α , β ) ise n ∈ için n E( X ) = ∫ ∞ n α −1 − x/ β n x f ( x) dx = ∫ x x Γ(α ) β α 0 x∈DX e dx = ∞ n+α −1 − x/ β 1 Γ(α ) β α ∫ 0 x e Γ(α ) β α Γ(α + n) β n dx = Γ(α ) olup dağılımın bütün momentleri E ( X n ) = Γ(α + n) β n / Γ(α ) eşitliğinden elde edilir. Buradan dağılımın ilk iki momenti ve varyansı, E( X ) = Γ(α + 1) β α Γ(α ) β = =α β Γ(α ) Γ(α ) E( X 2 ) = Γ(α + 2) β 2 (α + 1) Γ(α ) β 2 α (α + 1)Γ(α ) β 2 = = = α (α + 1) β 2 Γ(α ) Γ(α ) Γ(α ) 2 2 Var ( X ) = E ( X 2 ) − ( E ( X ) ) = α (α + 1) β 2 − (α β ) = α β 2 dir. X ~ Gamma (α , β ) ise dağlımın moment çıkaran fonksiyonu da Gamma fonksiyonunun özelliklerinden t < 1/ β için M X (t ) = E (et X ) = tx ∫ e f ( x) dx = x∈DX ∞ ∞ 1 Γ(α ) β α t x α −1 − x / β dx ∫e x e 0 α Γ(α ) ( β / (1 − t β ) ) α 1 x e dx = = = α ∫ α Γ(α ) β 0 Γ(α ) β 1− tβ şeklinde bulunmuştur. a, b ∈ ve a < b olmak üzere P ({w : a < X ( w) < b}) veya kısaca 1 α −1 − x (1−t β )/ β b P (a < X < b) olasılığı ∫ f ( x) dx integrali ile hesaplanır. Örneğin, X ~ Gamma(3, 2) için a P (2 < X < 4) = 0.243 olarak hesaplanmıştır. Bu olasılık aşağıda (Şekil (5.2.2)) gösterilen taralı alandır. Olasılık ve istatistikte çok karşılaşılan dağılımların bazıları (Üstel ve Ki-kare gibi) Gamma dağılımının özel halidir. Şimdi, bu özel durumları inceleyelim. 208 MATEMATİKSEL İSTATİSTİĞE GİRİŞ Şekil 5.2.2 α = 3 , β = 2 için Gamma dağılımının olasılık yoğunluk fonksiyonu 2a Üstel Dağılım X ~ Gamma (α , β ) olsun. α = 1 için X in olasılık yoğunluk fonksiyonu, (1/ β ) e− x / β f ( x) = 0 , x>0 , d . y. şeklinde olup X rasgele değişkeni üstel dağılıma sahiptir ve X ~ Üstel ( β ) ile gösterilir. Dağılımın momentleri ve varyansı Gamma dağılımının momentlerinde α = 1 yazılarak bulunur. Yani, E ( X ) = β , E ( X 2 ) = 2 β 2 ve Var ( X ) = αβ 2 dir. X ~ Gamma (α , β ) dağılımının bütün momentlerinin E ( X k ) = β k Γ(α + k ) / Γ(α ) şeklinde olduğundan α = 1 için Γ(k + 1) = k ! olup üstel dağılımın bütün momentleri E ( X k ) = k ! β k şeklindedir. Dağılımın moment çıkaran fonksiyonu da Gamma dağılımının moment çıkaran fonksiyonunda α = 1 yazılarak bulunur. Yani, X ~ Üstel ( β ) dağılımının moment çıkaran fonksiyonu t < 1/ β için M X (t ) = 1/ (1 − t β ) dir. Üstel dağılımın olasılık yoğunluk fonksiyonu ile dağılım fonksiyonunun grafikleri β = 5 için Şekil (5.2.3) de verildiği gibidir. Şekil 5.2.3 β = 5 için üstel dağılımın olasılık yoğunluk fonksiyonu ve dağılım fonksiyonu Bir X rasgele değişkeninin ortancası (medyanı) P ( X ≥ m) ≥ 1/ 2 ve P ( X ≤ m) ≥ 1/ 2 koşullarını sağlayan bir m sayısıdır. Bu olasılıklar ÖZEL DAĞILIMLAR 209 P( X ≥ m) = e− m / β ve P( X ≤ m) = 1 − e− m / β olup dağılımın medyanı e− m / β = 1 − e− m / β eşitliğinden m = − β ln(1/ 2) = β ln(2) olarak elde edilir. Yani, Üstel dağılımın medyanı m = β ln(2) dir. 2b Ki-Kare Dağılımı X ~ Gamma (α , β ) olsun. α = p / 2 ve β = 2 için olasılık yoğunluk fonksiyonu, x ( p /2)−1e − x /2 f ( x) = Γ( p / 2) 2 p /2 0 , x>0 , d . y. olur. Olasılık yoğunluk fonksiyonu bu şekilde olan X rasgele değişkenine serbestlik derecesi p olan ki-kare dağılımına sahiptir denir ve X ~ χ 2p ile gösterilir. Dağılımın momentleri Gamma dağılımının momentlerinde α = p / 2 ve β = 2 yazılarak bulunur. Yani, E ( X ) = α β = ( p / 2) 2 = p ve Var ( X ) = α β 2 = ( p / 2) 22 = 2 p dir. Ki-kare dağılımının beklenen değeri serbestlik derecesine, varyansı da serbestlik derecesinin iki katına eşittir. Bu dağılım, ileride göreceğimiz normal dağılan bir rasgele değişkenin fonksiyonu (karesi) olarak da karşımıza çıkmaktadır ve istatistikte çok kullanılan dağılımlardan biridir. Dağılımın olasılık yoğunluk fonksiyonunun grafiği, p = 6 için aşağıdadır. Ayrıca, X ~ χ 62 olmak üzere P (10 < X < 14) olasılığı Şekil (5.2.4) de belirtilen taralı alandır. Şekil 5.2.4 p = 6 için ki-kare dağılımının olasılık yoğunluk fonksiyonu X ~ χ 62 olmak üzere P(10 < X < 14) olasılığı, Γ(6 / 2) 26/2 = 16 olup 14 14 1 2 − x /2 x e dx = 0.0950158556 ≅ 0.095 16 10 P(10 < X < 14) = ∫ f ( x)dx = ∫ 10 210 MATEMATİKSEL İSTATİSTİĞE GİRİŞ olarak hesaplanmıştır. Bu dağılım istatistikte çok kullanılan dağılımlardan biri olduğu için değişik serbestlik dereceleri için olasılıklar hesaplanmış ve tablolaştırılmıştır. Bu tablolar hemen hemen birçok istatistik kitabında bulunmaktadır. Örneğin, X ~ χ 62 dağılımı için P (10.64 < X < 14.45) olasılığı (Maple VIII) 14.45 P(10.64 < X < 14.45) = ∫ 14.45 1 2 − x /2 x e dx = 0.07516647661 ≅ 0.075 10.64 16 f ( x)dx = ∫ 10.64 olarak hesaplanmıştır. Tablo değerleri (ki-kare dağılım tabloları) kullanılarak aynı olasılık, P (10.64 < X < 14.45) = FX (14.45) − FX (10.64) = 0.975 − 0.900 = 0.075 olarak bulunmuştur. 2c Weibull Dağılımı X ~ Üstel ( β ) olsun. γ > 0 için Y = X γ dönüşümünün olasılık yoğunluk fonksiyonu, ( γ / β ) yγ −1e− yγ / β f ( y) = 0 , y > 0 , β > 0, γ > 0 , d . y. dir. Olasılık yoğunluk fonksiyonu bu şekilde olan Y rasgele değişkenine Weibull dağılımına sahiptir denir. Dağılımın ilk iki momenti E (Y ) = (1/ β ) −1/ γ E (Y 2 ) = (1/ β ) Γ (1 + (1/ γ ) ) = β 1/ γ Γ ( (γ + 1) / γ ) −2/γ , γ +1 1 γ +2 Γ + = ( β )2/γ Γ γ γ γ dır. Burada, δ = 1/ γ denirse momentler Eδ (Y ) = β δ Γ(δ + 1) ve Eδ (Y 2 ) = β 2δ Γ(2δ + 1) şeklinde yazılır. Buradan, Varδ (Y ) = β 2δ [Γ(2δ + 1) − (Γ(δ + 1)) 2 ] olup δ nın değişik değerleri için dağılımın varyansı δ Var (Y ) 1/ 2 β (1 − π / 4 ) 1 β 2 2 20 β 4 şeklinde hesaplanmıştır. Weibull dağılımının olasılık yoğunluk fonksiyonunun grafiği de γ = 2 ve β = 4 için Şekil (5.2.5) de verilmiştir. ÖZEL DAĞILIMLAR 211 γ = 2 , β = 4 için dağılımın olasılık yoğunluk fonksiyonu, 0.5 y e− y 2 /4 f ( y) = 0 , y>0 , d . y. şeklinde olup P (3 < Y < 4) olasılığı, 4 4 P(3 < Y < 4) = ∫ f ( x)dx = ∫ 0.5 y e − y 3 2 /4 dy = 0.08708358567 ≅ 0.087 3 olarak hesaplanmıştır. Bu olasılık da, Şekil (5.2.5) de gösterilen taralı alandır. Şekil 5.2.5 γ = 2 , β = 4 için Weibull dağılımının olasılık yoğunluk fonksiyonu 5.2.3. Beta Dağılımı Matematikte Beta fonksiyonu, 1 Beta (α , β ) = ∫ xα −1 (1 − x) β −1 dx 0 olarak tanımlanır ve Beta ve Gamma fonksiyonları arasında Beta (α , β ) = Γ(α )Γ( β ) Γ(α + β ) şeklinde bir ilişki vardır. Buradan, Γ(α + β ) α −1 x (1 − x) β −1 , 0 < x < 1 f ( x) = Γ(α )Γ( β ) 0 , d . y. şeklinde tanımlanan fonksiyonun tanım bölgesi üzerinden integrali 1 dir. Yani, bu fonksiyon bir olasılık yoğunluk fonksiyonudur. Böyle bir olasılık yoğunluk fonksiyonuna sahip X rasgele değişkenine Beta dağılımına sahiptir denir ve X ~ Beta (α , β ) ile gösterilir. Bütün n ∈ için 212 MATEMATİKSEL İSTATİSTİĞE GİRİŞ 1 Γ (α + β ) 1 n +α −1 E ( X ) = ∫ x f ( x)dx = x (1 − x) β −1 dx Γ (α ) Γ ( β ) ∫ n n 0 = 0 Γ (α + β ) Γ (α + n ) Γ ( β ) Γ (α ) Γ ( β ) Γ (α + n + β ) = Γ (α + n ) Γ (α + β ) Γ (α + n + β ) Γ (α ) olduğundan dağılımın momentleri E( X n ) = Γ (α + n ) Γ (α + β ) Γ (α + n + β ) Γ (α ) formülü ile hesaplanır. Bu formülden dağılımın ilk iki momenti, E( X ) = Γ (α + 1) Γ (α + β ) Γ (α + 1 + β ) Γ (α ) E( X 2 ) = = Γ (α + 2 ) Γ (α + β ) Γ (α + 2 + β ) Γ (α ) α Γ (α ) Γ (α + β ) α = ( α + β ) Γ ( α + β ) Γ (α ) (α + β ) = α (α + 1) (α + β )(α + β + 1) olup dağılımın varyansı da, Var ( X ) = αβ (α + β ) (α + β + 1) 2 dir. X ~ Beta (α , β ) dağılımı α = β = 1 için X ~ U (0,1) dir. Yani düzgün dağılım, Beta dağılımının özel halidir. X ~ Beta (2, 2) dağılımının olasılık yoğunluk fonksiyonunun grafiği aşağıda Şekil (5.2.6) da vwerilmiştir. f (x) f (x) 1,4 1,4 1,2 1 1,2 1 0,8 0,8 0,6 0,4 0,2 0,6 0,4 0,2 0 0,2 0,4 0,6 0,8 1 ,5 =0 ) 0,5 X< < 0 P( 0 0,2 0,4 0,5 0,6 0,8 Şekil 5.2.6 Beta (2, 2) dağılımının olasılık yoğunluk fonksiyonu X ~ Beta (2, 2) ise olasılık yoğunluk fonksiyonu, 6 x(1 − x) , 0 < x < 1 f ( x) = 0 , d . y. şeklinde olup P (0 < X < 0.5) olasılığı 1 ÖZEL DAĞILIMLAR 213 0.5 0.5 P(0 < X < 0.5) = ∫ 6 x(1 − x) dx = (2 x3 − 3x 2 ) = 0.5 x =0 0 olarak hesaplanmıştır. Örnek 5.2.1 Yukarıda, Beta (α , β ) fonksiyonu ile Gamma (α , β ) fonksiyonu arasındaki ilişki verildi. Beta ve Gamma dağılımları arasında da benzer bir ilişki beklenebilir. X ve Y bağımsız X ~ Gamma (n, θ ) , Y ~ Gamma (m, θ ) olsun. U = X / ( X + Y ) dönüşümünün dağılımı U ~ Beta (n, m) dir. Şimdi bunu gösterelim. X ve Y bağımsız olduğundan ortak olasılık yoğunluk fonksiyonu, f ( x, y ) = 1 Γ(n)Γ(m)θ n+ n x n −1 y m−1e− ( x+ y )/θ , x > 0, y > 0 şeklinde yazılır. V = X + Y yardımcı dönüşümü ile ters dönüşümler X = U V ve Y = V (1 − U ) olur. Ayrıca, DU = (0,1) ve DV = + olduğu açıktır. Jacobien matrisi ve determinantı, ∂ x ∂u J = ∂ y ∂u ∂x ∂v v u = ⇒ det ( J ) = v ∂ y −v 1 − u ∂ v olup U ile V nin ortak olasılık yoğunluk fonksiyonu, , v > 0 , 0 < u < 1 için fU ,V (u, v) = v ( uv ) n−1 m −1 v (1 − u ) m−1 e −v /θ Γ(n)Γ(m)θ n + m = u n−1 (1 − u ) m−1 v n + m−1e −v /θ Γ(n)Γ(m)θ n+ m olarak elde edilir. Buradan U nun marjinal olasılık yoğunluk fonksiyonu, ortak olasılık yoğunluk fonksiyonunun DV üzerinden integrali ile bulunur. Gamma fonksiyonunun özelliğinden faydalanılarak U nun olasılık yoğunluk fonksiyonu 0 < u < 1 için, ∞ fU (u ) = ∫ fU ,V (u , v) dv = v=0 n −1 = u (1 − u ) u n−1 (1 − u )m−1 Γ(n)Γ(m)θ m−1 n + m θ Γ(n)Γ(m)θ Γ ( n + m) n+ m n+ m = ∞ ∫ v n + m −1e −v /θ dv v=0 Γ(n + m) n −1 u (1 − u ) m−1 Γ ( n )Γ ( m ) 214 MATEMATİKSEL İSTATİSTİĞE GİRİŞ olarak bulunmuştur. Bu fonksiyon da U ~ Beta (n, m) dağılımının olasılık yoğunluk fonksiyonudur ⊕ 5.2.4. Cauchy Dağılımı X rasgele değişkeninin olasılık yoğunluk fonksiyonu, f ( x) = 1 1 π 1 + ( x − θ )2 , x∈ şeklinde ise, X Cauchy dağılımına sahiptir denir ve X ~ Cauchy (θ ) ile gösterilir. Bu fonksiyon, ∞ ∫ −∞ ∞ f ( x)dx = 1 ∫ −∞ 1 π 1 + ( x − θ )2 dx = 1 π ( arctan(∞) − arctan(−∞) ) = 1 π π 2 π − − = 1 2 olduğundan bir olasılık yoğunluk fonksiyonudur. Cauchy dağılımının en belirgin özelliği hiçbir momentinin olmamasıdır. Dağılım θ ya göre simetrik olup θ = 3 için olasılık yoğunluk fonksiyonunun grafiği aşağıda Şekil (5.2.7) de verilmiştir. Şekil 5.2.7 θ = 3 için Cauchy dağılımının olasılık yoğunluk fonksiyonu X rasgele değişkeni Cauchy dağılımına sahip olsun. P (4 < X < 6) olasılığı, 6 P(4 < X < 6) = ∫ f ( x) dx = 4 = 1 π 16 1 1 6 dx = arctan( x − 3) x= 4 ∫ π 4 1 + ( x − 3) 2 π ( arctan(3) − arctan(1) ) ≅ 1 2π π 3 − = = 0.15 π 5 4 20 olarak hesaplanmıştır. Bu olasılık Şekil (5.2.7) de belirtilen taralı bölgenin alanıdır. Benzer şeklde, P(3 < X < 4) = 16 1 1 4 dx = arctan( x − 3) x =3 ∫ π 4 1 + ( x − 3)2 π ÖZEL DAĞILIMLAR = 1 π 215 ( arctan(1) − arctan(0) ) = 1 π 1 − 0 = = 0.25 π4 4 dir. 5.2.5. Normal Dağılım İstatistikte ve bir çok bilim alanında kuşkusuz en çok kullanılan normal dağılımdır. Bunun nedenlerinden biri, bir sonraki bölümde inceleyeceğimiz merkezi limit teoremi ile ilgilidir. Merkezi limit teoremine göre, ortalamada hemen hemen bütün dağılımlar normal dağılıma yakınsar. Kitlelerin bilinmeyenleri hakkında istatistiki sonuç çıkarım için verilerin normallik varsayımı olmazsa olmaz koşullardan biridir. Normallik özelliğinin sağlanmadığı durumlarda değişik teknikler ile normallik varsayımı sağlatılmaya çalışılır. Normallik varsayımı sağlandıktan sonra analizlerin ve devamında istatistiki sonuç çıkarımların yapılması gerekir. Normal dağılımın uygulamada önemi hakkında ne yazılırsa yazılsın yine de eksik kalan bir şeyler mutlaka olacaktır. X rasgele değişkeninin olasılık yoğunluk fonksiyonu µ ∈ , ve σ ∈ + için, f ( x) = 1 2 π σ2 − e 1 2σ 2 ( x−µ ) 2 , x∈ şeklinde ise X e beklenen değeri µ , varyansı σ 2 olan normal dağılıma sahiptir denir ve X ~ N ( µ , σ 2 ) ile gösterilir. X ~ N ( µ , σ 2 ) ise Z = ( X − µ ) / σ rasgele değişkeni beklenen değeri 0 , varyansı 1 olan standart normal dağılıma sahiptir ve Z ~ N (0,1) şeklinde ifade edilir. Standart normal dağılımın olasılık yoğunluk fonksiyonu da, f ( z) = 2 1 e− z /2 2π , z∈ şeklindedir. Standart normal dağılımın olasılıkları için tablolar düzenlenmiştir. Bu tablolar hemen hemen bütün istatistik kitaplarında bulunmaktadır. Örneğin Z ~ N (0,1) için P (0 < Z < 1) olasılığı normal dağılım tablosundan 0.3413 olarak bulunur. Bu olasılık Şekil (5.2.8) de gösterilen taralı bölgenin alanıdır. 216 MATEMATİKSEL İSTATİSTİĞE GİRİŞ f(z) 0.4 0.4 0.2 0.3 0.2 0.4 )= 413 0.1 75 0.1 .96 <1 <Z P(0 .3 )=0 <1 <Z P(0 0.3 f(z) z -3 -4 -2 -1 0 1 3 2 z 4 1.96 Şekil 5.2.8 Standart normal dağılımın olasılık yoğunluk fonksiyonu Standart normal dağılımın olasılık yoğunluk fonksiyonu sıfır noktasına göre simetriktir. Dolayısı ile, P (−1 < Z < 0) ile P (0 < Z < 1) olasılıkları aynıdır. Bir h fonksiyonu tanımlı olduğu her x için h(− x) = h( x) özelliğini sağlıyorsa çift, h(− x) = −h( x) ise tektir. İki çift fonksiyonun çarpımı çift, iki tek fonksiyonun çarpımı da çift olup, tek bir fonksiyon ile çift bir fonksiyonun çarpımı tektir. Buna göre, h( z ) = e − z 2 /2 = e−( − z ) 2 /2 = h(− z ) 2 olduğundan h( z ) = e− z / 2 fonksiyonu çifttir. Ayrıca, g ( z ) = z fonksiyonu ise g (− z ) = − z = − g ( z ) olduğundan tektir. Buradan a > 0 olmak üzere herhangi bir f fonksiyonu için a ∫ −a , 0 a f ( z ) dz = 2 ∫ f ( z ) dz , 0 f tek bir fonksiyon f çift bir fonksiyon 2 eşitliği yazılabilir. f ( z ) = z e− z /2 fonksiyonu tek olduğundan, ∞ ∫ E(Z ) = z f ( z ) dz = −∞ 1 2π ∞ z e− z ∫ 2 /2 dz = 0 −∞ dır. Dağılımın ikinci momenti ise, E(Z 2 ) = ∞ ∫ z 2 f ( z ) dz = −∞ 1 2π ∞ ∫ −∞ z 2 e− z 2 /2 dz = 2 2π ∞ 2 −z ∫z e 0 2 /2 dz = 2 2π 2π =1 2 dir (Maple VIII). Buradan standart normal dağılımın varyansı da, Var ( Z ) = E ( Z 2 ) − ( E ( Z )) 2 = 1 olur. Z = ( X − µ ) / σ ise X = µ + σ Z olduğundan, X ~ N ( µ , σ 2 ) dağılımının beklenen değer ve varyansı, ÖZEL DAĞILIMLAR 217 E ( X ) = E ( µ + σ Z ) = µ + σ E ( Z ) = µ ve Var ( X ) = Var ( µ + σ Z ) = σ 2 Var ( Z ) = σ 2 şeklinde bulunur. X ~ N ( µ , σ 2 ) ise olasılıklar standart normal dağılıma dönüştürülerek standart normal dağılım tablosundan bulunur. Örneğin, X ~ N ( µ = 100, σ 2 = 100) ise µ = 100 ve σ = 10 olup Z = ( X − 100) /10 ~ N (0,1) dir. Buradan P (100 < X < 110 ) olasılığı, 100 − 100 X − 100 110 − 100 P (100 < X < 110 ) = P < < = P ( 0 < Z < 1) = 0.3413 10 10 10 şeklinde standart normal dağılım tablosundan bulunur. Şimdi, Z ~ N (0,1) olmak üzere olasılık yoğunluk fonksiyonu z ∈ için 2 1 f ( z) = e − z /2 2π fonksiyonun olasılık yoğunluk fonksiyonu olduğunu gösterelim. f ( z ) fonksiyonu çift olup, ∞ ∫ −∞ 1 f ( z ) dz = 2π ∞ dir. Ayrıca, ∫ e− z 2 /2 ∞ ∫ e −z2 / 2 −∞ 2 dz = 2π ∞ ∫ e − z2 / 2 ∞ 2 dz = ∫ π 0 e− z 2 /2 dz 0 dz integralinin doğrudan hesaplanması zordur. İntegralin çift katlı 0 integrale dönüştürülmesi integral hesabını kolaylaştırır. ∞ 1= ∫ ∞ f ( z ) dz ⇔ ∫ e − z 2 /2 ⇔ 2 π dz = 0 −∞ ∫ denkliklerinden, ∫ −∞ ∞ ∞ f ( z ) dz = 1 için ∫ −( z ∫e 0 0 2 e − z 2 /2 0 ∞ ∞ ∞ π − z 2 /2 −u 2 /2 ⇔∫ e dz ∫ e du = ⇔∫ 2 0 0 0 ∞ 2 ∞ ∞ −( z ∫e π dz = 2 2 +u 2 )/2 dz = 0 +u 2 ) / 2 dzdu = π 2 π 2 olduğunu göstermek yeterlidir. r > 0 ve 0 < θ < π / 2 için z = r cos(θ ) ve u = r sin(θ ) kutupsal koordinat dönüşümlerinden dz du = r dr dθ olup yukarıdaki çift katlı integral, 218 MATEMATİKSEL İSTATİSTİĞE GİRİŞ ∞ ∞ ∫ ∫e 0 − ( z 2 +u 2 )/2 ∞ ∫ dz du = 0 π /2 ∫ e−r r =0 θ =0 ∞ − r 2 /2 ∫ = re 2 /2 r dr dθ π /2 ∫ dr r =0 dθ = θ =0 π 2 ∞ r e−r ∫ 2 /2 dr = r =0 π 2 olarak hesaplanır. Yani, f ( z ) bir olasılık yoğunluk fonksiyonudur. Z ~ N (0,1) dağılımının moment çıkaran fonksiyonu, M Z (t ) = e t 2 /2 dir. Buradan da, X ~ N ( µ , σ 2 ) dağılımının moment çıkaran fonksiyonu X = µ + σ Z eşitliğinden, M X (t ) = M µ +σ Z (t ) = E (e( µ + σ Z ) t ) = e µ t M X (σ t ) = e µ t + σ 2 2 t /2 olarak bulunur. Örnek 5.2.2 a) Z ~ N (0,1) ise Z nin bütün momentlerinin 2n /2 Γ ( (n + 1) / 2 ) , n çift E(Z n ) = π 0 , n tek formülü ile hesaplanabilir. Şimdi bunu gösterelim. n ∈ için ∞ ∞ 1 n −z ∫ z e 2π −∞ E ( Z n ) = ∫ z n f ( z ) dz = −∞ 2 2 ∞ n − z 2 /2 dz , n çift ∫z e /2 dz = 2π 0 0 , n tek olup çift n ler için u = z 2 / 2 dönüşümü ile z = 2 u ve du = z dz olduğundan E ( Z n ) , 2 ∞ n − z 2 /2 dz = ∫z e 2π 0 E (Z n ) = = = 2 ∞ π 0 ∫ ( 2u ) ( n−1)/2 −u e 2 π du = ∞ n −z ∫z e 2 /2 dz = 0 2 ∞ π 0 2 ∞ ∫z π 0 ( n−1)/2 ( n−1)/2 −u ∫2 u e n−1 − z 2 /2 e du = z dz 2n/2 ∞ π ∫ n+1 −1 u 2 e−u du 0 2n/2 Γ((n + 1) / 2) π 2 olarak elde edilir. n tek ise z n e− z /2 fonksiyonu tek olduğundan E ( Z n ) = 0 dır. b) X ~ N ( µ = 100, σ 2 = 100) dağılımı için bazı olasılıklar aşağıda hesaplanmıştır. ÖZEL DAĞILIMLAR 219 X − 100 110 − 100 90 − 100 P (9 0 < X < 1 1 0 ) = P < < 10 10 10 = P ( − 1 < Z < 1 ) = 2 P (0 < Z < 1) = 2 (0 .3 4 1 3) = 0 .6 8 2 6 Bu olasılık Şekil (5.2.9a) da belirtilen taralı bölgenin alanıdır. Ayrıca, 110 − 100 X − 100 120 − 100 P (110 < X < 120 ) = P < < 10 10 10 = P (1 < Z < 2) = P(0 < Z < 2) − P(0 < Z < 1) = 0.4772 − 0.3413 = 0.1359 olup, bu olasılık da yine Şekil (5.2.9b) de gösterilen taralı alana eşittir. Diğer taraftan, 80 − 100 X − 100 95 − 100 P ( 80 < X < 95 ) = P < < = P ( −2 < Z < −0.5 ) 10 10 10 = P(0.5 < Z < 2) = P(0 < Z < 2) − P(0 < Z < 0.5) = 0.4772 − 0.1915 = 0.2857 dir. Bu olasılık da Şekil (5.2.9c) de belirtilen bölgenin alanıdır. Son olarak da, P (| X − 100 |≤ 20 ) = P ( −20 ≤ X − 100 ≤ 20 ) = P ( −2 ≤ Z ≤ 2 ) = 2 P ( 0 ≤ Z ≤ 2 ) = 2(0.4772) = 0.9544 olup, bu olasılık da Şekil (5.2.9d) de gösterilmiştir. f(z) 0.4 (a) f(z) 0.4 (b) P (1 <Z <2 )=0 .13 P (- 826 z -2 0 -1 2 3 4 -3 -4 -3 2 3 4 2 3 4 44 .95 Z< 2 )=0 -2 -1 P(- 2< 0.2857 2< P(- 1 0 f(z) 857 -4 -1 (d) 0. 2 5)= -0. Z< -2 f(z) 0.4 (c) 1 z 0.9544 -3 -4 59 0.1359 0.6826 1< Z< 1)= 0.6 z z 0 1 2 3 4 -4 -3 -2 -1 0 1 Şekil 5.2.9 Normal dağılımda bazı olasılıklar (Örnek (5.2.2.b)) 220 MATEMATİKSEL İSTATİSTİĞE GİRİŞ c) Bir dersten sınava giren öğrencilerin notları, beklenen değeri 70 varyansı 100 olan normal dağılıma sahip olsun. Sınavdan 4 öğrencinin 90 ve üzerinde not aldığı bilindiğine göre, sınava giren öğrenci sayısını yaklaşık olarak bulmak isteyelim. Bunun için P ( X > 90) olasılığının hesaplanması yeterlidir. Şekil 5.2.9a Normal dağılımda olasılık hesabı (Örnek (5.2.2.c)) Bu olasılık, X − 70 90 − 70 P ( X > 90) = P > = P ( Z > 2 ) = 0.0228 10 10 olup öğrencilerin yaklaşık olarak %2.5 ’i 90 ve üzerinde not almıştır. Buna göre, sınava giren öğrencilerin yaklaşık %2.5 ’i 4 kişi ise sınava giren öğrencilerin tamamı 400 /(2.5) = 160 dır ⊕ X1, X 2 ,..., X k bağımsız N ( µi , σ i2 ) dağılımlı rasgele değişkenler ise µ = µ1 + ... + µk ve σ 2 = σ i2 + ... + σ k2 olmak üzere X = X 1 + X 2 + ... + X k ∼ N ( µ , σ 2 ) dir. Yani, bağımsız normal dağılıma sahip rasgele değişkenlerin toplamı da normal dağılıma sahiptir. b b Örnek 5.2.3 Z ~ N (0,1) olsun. Bazen, E−∞ ( Z ) = ∫−∞ z f ( z ) dz gibi beklenen değerlere (truncated expectation) ihtiyaç duyulabilir. Şimdi bunlardan bazılarını göstermeye çalışalım. b a) Önce, E−∞ (Z ) = b 2 ∫ z f ( z ) dz integrali için z / 2 = u ise zdz = du dur. Buradan −∞ bir defa kısmi integrasyon sonucunda, b E−∞ (Z ) = b 1 b −1 − z 2 /2 b −1 −b2 /2 − z 2 /2 dz = e = e = − f (b) ∫ z f ( z ) dz = ∫ ze 2π −∞ 2π 2π z =−∞ −∞ b ( Z ) = − f (b) dir. elde edilir. Yani, E−∞ ÖZEL DAĞILIMLAR 221 b) Benzer şekilde, 1 ∞ − z 2 /2 −1 − z 2 /2 ∞ 1 −b 2 /2 = = = f (b) z e dz e e ∫ 2π b 2π 2π z =b Eb∞ ( Z ) = b b dir. Yani, Eb∞ ( Z ) = f (b) dir. Genel olarak, E−∞ ( Z n ) = −bn −1 f (b) + (n − 1) E−∞ ( Z n− 2 ) b eşitliği yazılabilir. Şimdi bu eşitliğin doğru olduğunu gösterelim. E−∞ ( Z n ) değeri, b b ( Z n ) = ∫ z n f ( z ) dz = E−∞ −∞ 1 b n − z 2 /2 1 b n −1 − z 2 /2 z e dz = z dz ∫ ∫ z e 2π −∞ 2π −∞ şeklinde yazılabilir. Burada, u = z n −1 denirse du = (n − 1) z n −2 olur. Ayrıca, 1 − z 2 /2 1 − z 2 /2 e z dz = dv ⇒ v = − e 2π 2π olduğundan ∫ udv = uv − ∫ v du kısmni integrasyon formülü uygulanırsa, b E−∞ (Z n ) = 1 b n−1 − z 2 /2 z dz ∫ z e 2π −∞ z n −1 − z 2 /2 =− e 2π b b + (n − 1) z =−∞ n−2 ∫ z −∞ 1 − z 2 /2 e dz 2π b = −b n −1 f (b) + (n − 1) E−∞ ( Z n−2 ) b b bulunur. Sonuç olarak, E−∞ ( Z n ) = −bn −1 f (b) + (n − 1) E−∞ ( Z n− 2 ) şeklinde aranan eşitlik elde edilir ⊕ 5.2.6. Log-Normal Dağılım Bir X rasgele değişkeninin olasılık yoğunluk fonksiyonu µ ∈ ve σ ∈ + için f ( x) = 1 2π σ 2 1 e x − 1 2σ2 ( log( x ) − µ ) 2 , x ∈ + şeklinde ise X log-normal dağılıma sahiptir denir ve X ~ log N ( µ , σ 2 ) ile gösterilir. X ~ log N ( µ , σ 2 ) ise Y = log( X ) ~ N ( µ , σ 2 ) dir. Bu dağılım için önemli uygulama alanları vardır. Örneğin, iktisadi veriler analiz edilmeden önce verilerin logaritmaları alınır. Bunun nedenlerinden biri iktisadi verilerin log-normal dağılıma uygun olduğu varsayımıdır. 222 MATEMATİKSEL İSTATİSTİĞE GİRİŞ İstatistiki sonuç çıkarım için normallik varsayımı önemlidir. Normallik varsayımının sağlanması için verilerin logaritmaları alınır. Dağılımın olasılık yoğunluk fonksiyonunun grafiği, µ = 0 ve σ = 1 için Şekil (5.2.10) da verilmiştir. Şekil 5.2.10 µ = 0 ve σ = 1 için log-normal dağılımın olasılık yoğunluk fonksiyonu Şimdi, X ~ log N (0,1) olsun. P (0 < X < 1) olasılığını hesaplamak isteyelim. Bu olasılık Z ~ N (0,1) olmak üzere doğrudan 1 P (0 < X < 1) = ∫ f ( x)dx = 0 = 1 1 1 −(log( x ))2 /2 1 dx , log( x) = u ⇒ dx = du ∫ xe x 2π 0 1 0 −u 2 /2 du = P (−∞ < Z < 0) = 0.5 ∫e 2π −∞ olarak hesaplanır. Benzer şekilde P (0 < X < 2) olasılığı 2 P(0 < X < 2) = ∫ f ( x)dx = 0 = 1 2π log(2) −u ∫ e 2 /2 1 2 1 − (log( x ))2 /2 1 dx , log( x) = u ⇒ dx = du ∫ xe x 2π 0 du = P(−∞ < Z < log(2)) ≅ P (−∞ < Z < 0.3) = 0.6179 −∞ olarak bulunmuştur. Bu olasılık da, Şekil (5.2.10) da belirtilen taralı alandır. Dağılımın beklenen değeri ve varyansı, 2 2 2 E ( X ) = e µ + σ / 2 ve Var ( X ) = e 2( µ +σ ) − e 2 µ +σ dir. 5.3. İki Boyutlu Normal Dağılım Bu kısımda, çok değişkenli normal dağılımı kısaca tanıdıktan sonra iki değişkenli normal dağılımın bazı özellikleri ele alınacaktır. µ , x ∈ k ve Σ da k × k boyutlu ÖZEL DAĞILIMLAR 223 varyans-kovaryans matrisi olsun. Buna göre | Σ | =| det(Σ)| olmak üzere, k -değişkenli normal dağılımın ortak olasılık yoğunluk fonksiyonu, 1 1 exp − ( x − µ )′ Σ −1( x − µ ) f ( x) = (2π )k /2 | Σ |1/2 2 , x , µ ∈ k şeklindedir ve X ~ MN k ( µ , Σ) ile gösterilir. X ~ MN k ( µ , Σ) ve A uygun boyutlu sabit bir matris olmak üzere, Y = A X de çok değişkenli normal dağılıma sahiptir. Yani, Y = A X ~ MN rank ( A) ( A µ , A Σ A′) dır. Burada, E (Y ) = E ( A X ) = A E ( X ) = A µ ve Var (Y ) = Var ( A X ) = A Var ( X ) A′ = A Σ A′ dır. Buna göre, X ~ MN k ( µ , Σ) ise A matrisinin özel seçimi ile marjinallerin de normal olduğu görülür. Şimdi, k = 2 için iki değişkenli normal dağılımı ele alalım. İki boyutlu rasgele değişkenin bileşenleri X ve Y olsun. µ x , µ y ∈ , σ x > 0 , σ y > 0 ve −1 < ρ < 1 olmak üzere, iki değişkenli normal dağılımın olasılık yoğunluk fonksiyonu x, y ∈ için, f ( x, y ) = 1 2π σ x σ y 1 − ρ 2 1 2(1− ρ 2 ) e 2 2 x−µ x y−µ y x−µ x + −2 ρ σx σy σx y −µ y σ y şeklindedir. Bu ortak olasılık yoğunluk fonksiyonu, σ 2x µx µ = ve Σ = ρ σ σ µ y x ρσ xσ y y σ 2y olmak üzere, yukarıda verilen çok değişkenli normal dağılımın olasılık yoğunluk fonksiyonu ile aynıdır. Bunu, µ σ 2 x x X X = ~ MN 2 , µ y ρ σ σ Y x y ρσ xσ y σ 2y olarak ifade edebiliriz. İki değişkenli normal dağılımın bazı özellikleri aşağıdaki teoremde özetlenmiştir. 224 MATEMATİKSEL İSTATİSTİĞE GİRİŞ Teorem 5.3.1 Bileşenleri X ve Y olan iki boyutlu X rasgele vektörü X ~ MN 2 ( µ , Σ) olsun. Buna göre, a) Marjinaller normaldir. Yani, X ~ N ( µ x , σ x2 ) ve Y ~ N ( µ y , σ y2 ) dir. b) ρ X ,Y = ρ dir. Yani aralarındaki korelasyon ρ dur. c) a, b ∈ için, aX + bY ~ N (a µ x + bµ y , a 2σ x2 + b 2σ 2y + 2 a b ρ σ xσ y ) dir. d) Koşullu dağılımlar normaldir. Yani, µ y | x = µ y + ρ (σ y / σ x )( x − µ x ) , σ 2y | x = σ 2y (1 − ρ 2 ) µ x | y = µ x + ρ (σ x / σ y )( y − µ y ) , , σ 2x | y = σ 2x (1 − ρ 2 ) olmak üzere, Y | X = x ~ N ( µ y| x , σ 2y| x ) ve X |Y = y ~ N ( µ x| y , σ 2x| y ) dir. İspat: İşlemlerin basit yürütülebilmesi için µ x = µ y = 0 ve σ x2 = σ y2 = 1 alalım. Buna göre, iki boyutlu normal dağılımın olasılık yoğunluk fonksiyonu x ∈ 2 için 1 f ( x) = 2π | Σ | 1/ 2 1 − x′ Σ −1 / 2 x e 2 olup x = ( x, y )′ ve 1 Σ= ρ ρ det ( Σ ) = 1 − ρ 2 ve , 1 Σ −1 = 1 1 − ρ 2 −ρ 1 −ρ 1 olmak üzere, 1 1 x ′ Σ −1 x = ( x , y ) −ρ 1− ρ 2 = dir. 1 1− ρ 2 −ρ x x 1 ρ ρ = x − y , − x + y ( ) 1 y 1− ρ 2 y ( x2 + y 2 − 2 ρ x y) ÖZEL DAĞILIMLAR 225 Şekil 5.3.1 ρ = 0.4 için iki değişkenli normal dağılımın olasılık yoğunluk fonksiyonu Yani, X ve Y nin ortak olasılık yoğunluk fonksiyonu, − 1 f ( x, y ) = 2π 1− ρ 2 e 1 ( x2 + y 2 −2 ρ x y ) 2(1− ρ 2 ) şeklinde yazılabilir. Şimdi ispata geçelim. a) X ∼ MN 2 ( µ , Σ) olduğundan uygun bir a vektörü için a′ X ~ N (a′µ , a′ Σ a ) olduğunu biliyoruz. a = (1, 0)′ için a′ X = X olup a′µ = µ x ve a′ Σ a = σ x2 dir. Buradan, X 2 a′ X = ( 1, 0 ) = X ~ N a′µ = µ x , a′ Σ a = σ x Y ( ) olup X normal dağılıma sahiptir. Benzer şekilde a = (1, 0)′ için Y nin dağılımının da normal olduğu görülür. Aynı sonuç, ortak olasılık yoğunluk fonksiyonunun Y nin değer kümesi üzerinden integrali ile de elde edilir. X in marjinal olasılık yoğunluk fonksiyonu x ∈ için, ∞ f X ( x) = −1 f ( x, y ) dy = exp ∫ 2 1− ρ 2 2 π 1 − ρ 2 y =−∞ ∞ 1 ∫ y =−∞ ( ) ( x + y − 2 ρ x y dy 2 2 ) ∞ − x2 −1 = exp exp y2 − 2 ρ x y + ρ 2 x2 − ρ 2 x2 ∫ 2 1 − ρ 2 2 1 − ρ 2 2 2π 1− ρ y =−∞ 2 ∞ 1 − x + ρ 2 x2 −1 2 = exp exp y − ρ x ) dy 2 1 − ρ 2 ∫ 2 1 − ρ 2 ( 2π 1 − ρ 2 y=−∞ 1 ( ( ) ( ) ( − x2 ∞ −1 = exp exp ∫ 2 2 1 − ρ 2 2π 1 − ρ 2 y=−∞ ( ) 1 ( ) ) ( y − ρ x) 2 dy ) dy 226 MATEMATİKSEL İSTATİSTİĞE GİRİŞ − x2 ∞ 1 1 −1 = exp exp ∫ 2π 2 1− ρ 2 2 y =−∞ 2 π 1 − ρ 2 ( ) ( y − ρ x) 2 dy = − x2 1 exp 2 2π dir. Bu da, standart normal dağılımın olasılık yoğunluk fonksiyonudur. b) µ x = µ y = 0 ve σ x2 = σ y2 = 1 olduğundan, X ile Y arasındaki korelasyon, ρ X ,Y = Cov ( X , Y ) Var ( X ) Var (Y ) = E ( X Y ) − E ( X ) E (Y ) Var ( X ) Var (Y ) = E ( XY ) dir. Buna göre c −1 = 2π 1 − ρ 2 olmak üzere E ( XY ) değeri, ∞ ∞ E ( XY ) = c 1 x 2 + y 2 − 2 ρ x y dx dy x y exp − 2(1 − ρ 2 ) −∞ −∞ ∫ ∫ şeklinde yazılabilir. t = x , s = x y dönüşümleri altında ters dönüşümler x = t ve y = s / t olup Jacobien matrisi ile determinantı ∂x ∂t J = ∂y ∂t ∂x 1 ∂s = s ∂x − 2 t ∂s 0 1 1 , det ( J ) = t t dir. | det( J ) | = 1/ t olup bunu | det( J ) | = 1/ t 2 şeklinde yazalım. Bu dönüşüm altında E ( XY ) nin değeri, ∞ ∞ E ( XY ) = c 1 t 2 + ( s / t ) 2 − 2 ρ s 1 dt ds s exp − 2 2 2(1 − ρ ) t −∞ −∞ ∫ ∫ şekline dönüşür. Ayrıca, 2 t 2 + ( s / t ) 2 − 2 ρ s = s − ρ t + (1 − ρ 2 ) t 2 t olduğundan integralin değeri, yani X ile Y arasındaki korelasyon ∞ ∞ E ( XY ) = c 1 x 2 + y 2 − 2 ρ x y dx dy x y exp − 2 2(1 − ρ ) −∞ −∞ ∫ ∫ ∞ ∞ =c ∫ ∫ −∞ −∞ s − ρ t 2 1 2 2 exp − + 1 − t ρ ds dt 2 2 t 2(1 − ) ρ t s ( ) ÖZEL DAĞILIMLAR ∞ ∞ 2 2 t2 1 s − ρ t exp − exp − ds dt 2 t 2(1 − ρ ) t2 2 s ∫ ∫ =c 227 −∞ −∞ t2 ∞ 1 s ( s − ρ t 2 exp − exp − ds dt ∫ 2π 2 ∫ 2(1 − ρ 2 )t 2 2 2 −∞ 2π (1 − ρ ) t −∞ ∞ = ∞ t2 1 exp − [ E ( S )] dt , E ( S ) = ρ t 2 2 2π ∫ = −∞ ∞ =ρ ∫ −∞ t2 t2 exp − dt 2 2π , T ~ N (0,1) =ρ olarak hesaplanmış olur. c) X ~ MN 2 ( µ , Σ) ise a′ X ~ N (a′µ , a′ Σ a ) olduğunu biliyoruz. a′ = (a, b) için, µx a′µ = (a, b ) = a µ x + bµ y µy ve 1 a′Σa = (a, b) ρ ρa 2 2 2 2 = a σ x + b σ y + 2 a b ρ σ xσ y 1 b olduğundan, a, b ∈ için, aX + bY ~ N (aµ x + bµ y , a 2σ x2 + b2σ 2y + 2 a b ρ σ xσ y ) bulunur. d) Marjinal dağılımların da normal olduğunu biliyoruz. Koşullu olasılık yoğunluk fonksiyonunun tanımından, Y = y verildiğinde X in koşullu olasılık yoğunluk fonksiyonu 1 x2 + y 2 − 2ρ x y exp − 2 1 − ρ 2 2 f ( x, y) 2π 1 − ρ f X |Y = y ( x | y ) = = 2 fY ( y) y 1 exp − 2 2π 1 ( = 1 ( 2π 1 − ρ 2 ) ) 1 2 2 2 2 exp − x + y − 2 ρ x y − (1 − ρ ) y 2 1 − ρ 2 ( ) 228 = MATEMATİKSEL İSTATİSTİĞE GİRİŞ 2 x −ρ y 1 1 2 2 2 exp − x + ρ y − 2ρ x y = exp − 2 2 2 1 − ρ 2 2 1− ρ π ρ 2 1 − ( 1 ( 2π 1 − ρ 2 ) ( ) ( ) ( ) ) 2 olarak bulunur. Bu fonksiyon da, beklenen değeri ρ y , varyansı 1 − ρ 2 olan normal dağılımın olasılık yoğunluk fonksiyonudur. Yani, E ( X | Y = y ) = ρ y ve Var ( X | Y = y ) = 1 − ρ 2 dir. Bu sonuç, µ x = µ y = 0 ve σ x2 = σ y2 = 1 olması halinde elde edildi. X1 = µ x + σ x X ve Y1 = µ y + σ yY dönüşümleri altında koşullu beklenen değer ile koşullu varyans σ y (x − µx ) σx σx σ y µ x| y = µx + ρ µ y| x = µ y + ρ , σ 2y | x = σ 2y (1 − ρ 2 ) , σ 2x | y = σ 2x (1 − ρ 2 ) ( y − µy ) , olarak bulunur ◊ Örnek 5.3.1 İki değişkenli standart normal dağılımı göz önüne alalım. Yani, X ve Y nin ortak olasılık yoğunluk fonksiyonu, x, y ∈ için f ( x, y ) = 1 2 2 exp − ( x + y − 2 ρ x y ) 2 (1 − ρ 2 ) 2π 1 − ρ 2 1 olarak verilmiş olsun. Buna göre P ( X > 0, Y > 0 ) olasılığını hesaplayalım. Bunun için, U=X , V= 1 1− ρ 2 (Y − ρ X ) dönüşümlerinden ters dönüşümler, X = U , Y = 1 − ρ 2 V + ρ U olup Jacobien matrisi ve determinantı, ∂X ∂U J = ∂Y ∂U ∂X ∂V 1 = ∂Y 0 ∂V , det ( J ) = 1 − ρ 2 2 1 − ρ 0 dir. Ayrıca, x 2 + y 2 − 2 ρ x y = (1 − ρ 2 ) (u 2 + v 2 ) olup U ve V yoğunluk fonksiyonu, nin ortak olasılık ÖZEL DAĞILIMLAR 229 ( )( 1 − ρ 2 u 2 + v2 fU ,U (u, v) = exp − 2 2 1− ρ 2 2π 1 − ρ = fU (u ) fV (v) 1− ρ 2 ( ) ) = u 2 1 v2 1 exp − exp − 2π 2 2π 2 şeklinde elde edilir. Ortak olasılık yoğunluk fonksiyonu marjinal olasılık yoğunluk fonksiyonlarının çarpımı şeklinde yazılabildiğinden U ve V bağımsızdır. Diğer taraftan, { X > 0, Y > 0} = {U > 0 , V > −ρ U / 1− ρ 2 } eşitliği yardımı ile P ( X > 0, Y > 0) olasılığı, −ρ U P ({ X > 0, Y > 0} ) = P U > 0 , V > 1− ρ 2 1 = 2π ∞ ∞ ∫ ∫ 0 −ρ u u 2 + v2 exp − dv du 2 1− ρ 2 şeklinde yazılabilir. 0 < θ < π / 2 ve r > 0 olmak üzere, u = r cos(θ ) ve v = r sin(θ ) kutupsal koordinatları için du dv = r dr dθ dir. tan(θ ) = v / u olduğundan θ = arctan(v / u ) yazılır. Buradan integralin alt sınırı ρ u ρ arctan − = arctan − u 1− ρ 2 1− ρ 2 olup aranan olasılık, 1 P ({ X > 0, Y > 0} ) = 2π ∞ ∞ u 2 + v2 exp − dv du ∫ ∫ 2 − ρ u 0 1− ρ 2 π /2 = ∫ θ =arctan π /2 ∞ 1 r2 1 ∫ exp − r dr dθ = ∫ 2 2π 0 2π −ρ −ρ θ =arctan 1− ρ 2 2 1− ρ −ρ 1 π = − arctan 2π 2 1− ρ 2 olarak bulunur. Ayrıca, dθ = 1 − 1 arctan − ρ 2 4 2π 1− ρ = 1 + 1 arctan ρ 2 4 2π 1− ρ 230 MATEMATİKSEL İSTATİSTİĞE GİRİŞ ρ arctan 1− ρ 2 = arcsin( ρ ) trigonometrik eşitliğinden aranan olasılık P ({ X > 0, Y > 0} ) = ρ 1 1 arctan + 4 2π 1− ρ 2 = 1 + 1 ar c sin ( ρ ) 4 2π olarak hesaplanmış olur ⊕ 5.4. Dağılım Aileleri 5.4.1. Üstel Aileler Kitlenin bilinmeyenleri aynı zamanda dağılımın bilinmeyenleridir. Bu bilinmeyenlere parametre denir. Bir rasgele değişkenin olasılık veya olasılık yoğunluk fonksiyonu bu parametrelere bağlıdır. Bu parametreler genellikle rasgele değişkenin beklenen değeri ve varyansıdır. Bazen kitle başka parametreler de içerebilir. Rasgele değişkenin olasılık veya olasılık yoğunluk fonksiyonu da parametre olarak alınabilir. Dolayısı ile, bir rasgele değişkenin olasılık veya olasılık yoğunluk fonksiyonu yerine, bu olasılık veya olasılık yoğunluk fonksiyonlarının bir ailesinden söz etmek daha anlamlıdır. Parametre değiştikçe olasılık veya olasılık yoğunluk fonksiyonu da değişir. Bundan böyle, rasgele değişkenin olasılık veya olasılık yoğunluk fonksiyonunu f ( x;θ ) ile göstereceğiz. Parametrelerin sayısı birden fazla ise f ( x;θ ) gösterimi kullanılacaktır. Θ parametre kümesini göstermek üzere ( Θ ⊂ olup bazen parametre sayısına bağlı olarak k nin bir alt kümesi de olabilir) olasılık veya olasılık yoğunluk fonksiyonlarının ailesini, C = { f ( x;θ ) : θ ∈ Θ} ile gösterelim. Tanım 5.4.1 Her f ( x;θ ) ∈ C için f ( x;θ ) fonksiyonu, k f ( x;θ ) = h( x) c(θ ) exp ∑ ti ( x) wi (θ ) i =1 şeklinde yazılabiliyorsa, C = { f ( x;θ ) : θ ∈ Θ} sınıfına bir üstel aile denir ⊗ ÖZEL DAĞILIMLAR 231 Burada, h( x) ve i = 1, 2,3,..., k için ti ( x) ler x in bir fonksiyonu, wi (θ ) ler ve c(θ ) ise sadece parametrenin bir fonksiyonudur. Ayrıca, h( x) > 0 ve c(θ ) > 0 olması gerektiği açıktır. Bilinen bir çok dağılım üstel aile özelliğine sahip olmasına rağmen, bu özelliğe uymayan bir çok dağılım vardır. Düzgün dağılım gibi olasılık yoğunluk fonksiyonunun tanım kümesi parametreye bağlı olan olasılık yoğunluk fonksiyonları üstel aile özelliğini sağlamaz. Parametre tahmini ve istatistiki sonuç çıkarımlar açısından olasılık fonksiyonlarının üstel aileye ait olması önemli kolaylıklar sağlar. Örnek 5.4.1 a) X ~ Binom(n, θ ) olsun. X in olasılık fonksiyonu, 0 < θ < 1 için n f ( x) = P ( X = x) = θ x (1 − θ )n − x , x = 0,1, 2,..., n x şeklindedir. Bu olasılık fonksiyonu, x n n θ f ( x;θ ) = θ x (1 − θ ) n− x = (1 − θ )n 1−θ x x n θ = (1 − θ )n exp x ln = h( x) c(θ ) exp(t ( x) w(θ )) 1−θ x şeklinde yazılabildiği için üstel aile özelliğini sağlar. Burada, t ( x) = x olmak üzere h ve c fonksiyonları n , x = 0,1, 2,..., n h( x) = x , 0 , d . y. (1 − θ ) , 0 < θ < 1 c (θ ) = , d.y 0 olarak tanımlandığında, f ( x;θ ) olasılık fonksiyonu f ( x;θ ) = h( x) c(θ ) exp(t ( x) w(θ )) şeklinde yazılabildiğinden Binom dağılımlar ailesi üstel aile özelliğini sağlar ve f ( x;θ )∈ C dir. Yani, Binom dağılımlar ailesi üsteldir. b) X ~ N ( µ , σ 2 ) olsun. µ ∈ ve σ ∈ + olmak üzere normal dağılımın olasılık yoğunluk fonksiyonu, f ( x; µ , σ 2 ) = ( x − µ )2 µ2 1 2 1 1 µ exp − = exp − exp − 2x + 2 2 2 2σ 2π σ 2σ 2σ 2πσ 2 2σ 1 olarak yazılabilir. Burada, x 232 MATEMATİKSEL İSTATİSTİĞE GİRİŞ µ2 x2 1 1 h( x) = , c µ , σ 2 = exp − , t ( x) = ( t1 ( x) , t2 ( x) )′ = − , 2σ 2 2 σ 2π ( ) ′ x ve 1/ σ 2 w1 ( µ , σ ) = 0 2 , σ >0 , d . y. , µ / σ 2 w2 ( µ , σ ) = 0 2 , σ >0 , d . y. fonksiyonları tanımlandığında, normal dağılımın olasılık yoğunluk fonksiyonlarının ailesi, w ( µ , σ 2 ) = ( w1 ( µ , σ 2 ), w1 ( µ , σ 2 )′ olmak üzere, f ( x; µ , σ 2 ) = h( x) c( µ , σ 2 ) exp( t ′( x) w ( µ , σ 2 ) olarak yazılabilir. Buradan, f ( x; µ , σ 2 )∈ C olup normal dağılımlar ailesi de üstel aile özelliğini sağlar ⊕ 5.4.2. Konum-Ölçek Aileleri Üstel aileler ile birlikte, istatistiki sonuç çıkarımlar için çok kullanışlı özelliklere sahip konum-ölçek ailelerini inceleyelim. Teorem 5.4.1 X rasgele değişkeninin olasılık veya olasılık yoğunluk fonksiyonu f ( x) olsun. σ > 0 ve µ ∈ için, g ( x; µ , σ ) = x−µ f σ σ 1 olarak tanımlanan g ( x) fonksiyonu da bir olasılık yoğunluk fonksiyonudur. İspat: σ > 0 ve f ( x) de bir olasılık yoğunluk fonksiyonu olduğundan bütün x ∈ ler için g ( x) ≥ 0 dır. Ayrıca (sürekli durum için) f ( x) bir olasılık yoğunluk fonksiyonu ∞ olduğundan ∫ f ( x) dx = 1 dir. Buradan, y = ( x − µ ) / σ denirse, dy = dx / σ olup −∞ g ( x; µ , σ ) nın tanım bölgesi üzerinden integrali ∞ ∞ ∞ −∞ −∞ −∞ ∫ g ( x; µ , σ ) dx = ∫ (1/ σ ) f (( x − µ ) / σ ) dx = ∫ f ( y) dy = 1 olup g ( x; µ , σ ) = (1/ σ ) f (( x − µ ) / σ ) fonksiyonu bir olasılık yoğunluk fonksiyonudur ◊ ÖZEL DAĞILIMLAR Tanım 5.4.2 µ ∈ ve 233 f ( x) de herhangi bir olasılık veya olasılık yoğunluk fonksiyonu olsun. g ( x; µ ) = f ( x − µ ) özelliğine sahip olasılık veya olasılık yoğunluk fonksiyonlarının L = { g ( x; µ ): g ( x) = f ( x − µ )} şeklindeki bir sınıfına konum (location) ailesi, µ ye de konum (location) parametresi denir ⊗ Konum ailesine ait olasılık yoğunluk fonksiyonları şekil olarak değişmez. Konum parametresinin durumuna göre kaymalar gösterir. Bu olasılık yoğunluk fonksiyonlarının grafikleri aşağıdaki şekilde olur (Şekil (5.4.1)). Şekil 5.4.1 σ 2 = 1 ve µ = −1, 0,1 için normal dağılımın olasılık yoğunluk fonksiyonları f ( x; µ ) ∈ L olsun. Bu durumda konum ailesine ait bir olasılık yoğunluk fonksiyonu x = µ ⇒ f ( x − µ ) = g (0) , x = µ + 1⇒ f ( x − µ ) = g (1) , x = µ + 2 ⇒ f ( x − µ ) = g (2) gibi özelliklere sahiptir. Örnek 5.4.2 X rasgele değişkeninin olasılık yoğunluk fonksiyonu, e− ( x− µ ) , x > µ f ( x; µ ) = , d . y. 0 şeklinde verilmiş olsun. µ nün aldığı değere göre dağılımın grafiği değişir. Değişik µ değerleri için olasılık yoğunluk fonksiyonlarının grafikleri yukarıdadır ⊕ f ( x) herhangi bir olasılık yoğunluk fonksiyonu ise, σ > 0 için g ( x; σ ) = (1/ σ ) f ( x / σ ) da bir olasılık yoğunluk fonksiyonudur. 234 MATEMATİKSEL İSTATİSTİĞE GİRİŞ f (x) 1 µ = 1,5 0,8 0,6 µ = 1,0 0,4 µ = 0,5 0,2 x 0 0,5 1,0 1,5 2 4 6 8 Şekil 5.4.2 µ = 0.5, 1.0, 1.5 için f ( x, µ ) olasılık yoğunluk fonksiyonlarının grafikleri Tanım 5.4.3 σ ∈ + ve f ( x) herhangi bir olasılık veya olasılık yoğunluk fonksiyonu olmak üzere, g ( x; σ ) = (1/ σ ) f ( x / σ ) özelliğini sağlayan olasılık veya olasılık yoğunluk fonksiyonlarının S = { g ( x; σ ): g ( x; σ ) = (1/ σ ) f ( x / σ ) , σ > 0} şeklindeki bir sınıfına ölçek (scale) ailesi, σ ya da ölçek (scale) parametresi denir ⊗ Örnek 5.4.3 X ~ N (0, σ 2 ) şeklindeki normal dağılımlar ailesi bir ölçek ailedir. f(x) 0.4 0.3 σ2=1 0.2 σ2=4 0.1 σ2=9 x -8 Şekil 5.4.3 -6 -4 -2 0 2 4 6 8 σ 2 = 1 , 4 , 9 için N (0,σ 2 ) normal dağılımının olasılık yoğunluk fonksiyonları X ~ N (0, σ 2 ) dağılımın olasılık yoğunluk fonksiyonu, f ( x; σ 2 ) = x2 exp − 2 , x ∈ 2σ 2π σ 2 1 şeklinde olup σ 2 nin değişik değerleri için olasılık yoğunluk fonksiyonlarının grafikleri yukarıda Şekil (5.4.3) de verilmiştir. Grafikten de görüldüğü gibi, σ 2 nin değerine göre ÖZEL DAĞILIMLAR 235 dağılımın şekli değişir. σ 2 nin değeri büyüdükçe, dağılımda yukarıdan aşağıya doğru bir basıklık gözlenir ⊕ Tanım 5.4.4 σ ∈ + , µ ∈ ve f ( x) de herhangi bir olasılık veya olasılık yoğunluk fonksiyonu olsun. g ( x; µ , σ ) = (1/ σ ) f (( x − µ ) / σ ) özelliğini sağlayan g ( x; µ , σ ) olasılık veya olasılık yoğunluk fonksiyonlarının C * = { g ( x; µ , σ ): g ( x; µ , σ ) = (1/ σ ) f ( ( x − µ ) / σ ) , σ > 0, µ ∈ } şeklindeki bir sınıfına olasılık yoğunluk fonksiyonlarının konum- ölçek (scale) ailesi, µ ye konum parametresi, σ ya da ölçek (scale) parametresi denir ⊗ f ( x; µ , σ ) ∈ C * ise olasılık yoğunluk fonksiyonlarının hem konumları hem de ölçekleri değişir. Örneğin, X ~ N ( µ , σ 2 ) ise bu dağılımın olasılık yoğunluk fonkisyonları µ ve σ 2 ye göre hem konumları hem de ölçekleri değişir. Bu olasılık yoğunluk fonksiyonlarının grafikleri aşağıdaki gibidir (Şekil (5.4.4)). Teorem 5.4.2 σ ∈ + , µ ∈ ve f ( x) de herhangi bir olasılık veya olasılık yoğunluk fonksiyonu olsun. X rasgele değişkeninin olasılık yoğunluk fonksiyonunun f X ( x; µ , σ ) = (1/ σ ) f (( x − µ ) / σ ) şeklinde olabilmesi için gerek ve yeter koşul, olasılık yoğunluk fonksiyonu f ( z ) olan öyle bir Z rasgele değişkeni için X = µ + σ Z şeklinde yazılabilmesidir. İspat: Z rasgele değişkeninin olasılık yoğunluk fonksiyonu f ( z ) ve X in X = µ + σ Z şeklinde yazılabildiğini düşünelim. g ( z ) = µ + σ z olmak üzere X = g ( Z ) nin olasılık yoğunluk fonksiyonu için, ters dönüşüm g −1 ( x) = ( x − µ ) / σ | dg −1 ( x) / dx |= 1/ σ dır. O halde, X in olasılık yoğunluk fonksiyonu, f X ( x) = f ( g −1 ( x))| d g −1 ( x) / dx |= (1/ σ ) f (( x − µ ) / σ ) dir. Diğer taraftan, X rasgele değişkeninin olasılık yoğunluk fonsiyonu f X ( x; µ , σ ) = (1/ σ ) f ( ( x − µ ) / σ ) şeklinde verilmiş olsun. g ( x) = ( x − µ ) / σ fonksiyonunu tanımlayalım. Buradan, olup 236 MATEMATİKSEL İSTATİSTİĞE GİRİŞ g −1 ( z ) = µ + σ z ve | dg −1 ( z ) / dz |= σ olup, Z = g ( X ) = ( X − µ ) / σ rasgele değişkeninin olasılık yoğunluk fonsiyonu, f Z ( z ) = f X ( g − 1 ( z )) | d g − 1 ( z ) / dz | = (1 / σ ) f ((σ x + µ − µ ) / σ ) σ = f ( z ) olur. Ayrıca, µ + σ Z = σ (( X − µ ) / σ ) + µ = σ g ( X ) + µ = X dir ◊ Şekil 5.4.4 ( µ , σ 2 ) = (0,1) , (1, 4) ve (2,9) için N ( µ ,σ 2 ) dağılımının olasılık yoğunluk fonksiyonları Z olasılık veya olasılık yoğunluk fonksiyonu f ( z ) olan herhangi bir rasgele değişken ve E ( X ) ve Var ( X ) değerleri var olsun. X in olasılık veya olasılık yoğunluk fonksiyonu f X ( x; µ , σ ) = (1/ σ ) f (( x − µ ) / σ ) özelliğine sahip ise, X in beklenen değer ve varyansı E ( X ) = µ + σ E ( Z ) ve Var ( X ) = Var ( µ + σ Z ) = σ 2Var ( Z ) şeklinde bulunur. 5.5. Çözümlü Problemler 5.5.1 Bernoulli ve Binom dağılımlarının basıklık katsayılarını hesaplayınız. Çözüm: X ~ Bern( p ) olsun. Bu durumda E ( X ) = p , Var ( X ) = σ 2 = p q ve k ∈ için E ( X k ) = p olduğunu biliyoruz. µ = p olmak üzere dağılımın dördüncü merkezi momenti, ÖZEL DAĞILIMLAR 237 1 E[( X − µ )4 ] = E[( X − p )4 ] = ∑ ( x − p ) 4 P( X = x) x =0 4 = (0 − p ) P( X = 0) + (1 − p) 4 P( X = 1) = p 4 q + q 4 p = pq ( p3 + q3 ) = pq [( p + q )( p 2 − pq + q 2 )] = pq[( p 2 − pq + q 2 )] dır. Buradan, Bernoulli dağılımının basıklık kaysayısı η= E( X − µ) 4 σ4 −3 = ( pq p 2 − pq + q 2 p 2q2 ) − 3 = ( p2 − pq + q 2 ) − 3 = ( p2 − 4 pq + q 2 ) pq pq p 2 − 4 p (1 − p ) + (1 − p )2 ) ( p 2 − 4 p + 4 p 2 + 1 − 2 p + p 2 ) ( = = pq pq 6 p 2 − 6 p + 1 1 − 6 p (1 − p ) 1 − 6 pq = = = pq pq pq olarak hesaplanmıştır. k X ~ Binom(n, p ) olsun. µk = E ( X − E ( X ) ) olmak üzere, Binom dağılımının merkezi momentleri arasında, µ k +1 = p q k n µ k −1 − d µk dq şeklinde bir bağıntı vardır (Akdeniz (2006) sayfa 224-225). Ayrıca, µ0 = 1 , µ1 = 0 ve µ2 = n p q olup üçüncü ve dördüncü merkezi momentler bu eşitlikten ardışık olarak elde edilir. k = 2 için üçüncü merkezi moment, µ3 = µ 2+1 = pq 2n µ2−1 − d µ2 d (npq ) 2 = pq 2 n (0) − = pq ( − np ) = − np q dq dq ve k = 3 için dördüncü merkezi moment de, dµ d (− n p 2 q ) µ4 = µ3+1 = pq 3n µ3−1 − 3 = pq 3 n µ2 − dq dq d (n p 2 q ) 2 2 = pq 3 n (npq ) + = pq 3 n pq + np dq ( dir. Buradan Binom dağılımının basıklık katsayısı da, ) 238 MATEMATİKSEL İSTATİSTİĞE GİRİŞ η= E( X − µ) 4 −3 = σ4 ( pq 3n 2 pq + np 2 n2 p 2q 2 3n 2 pq + np 2 ) − 3n 2 p q ( = = 2 n pq np 2 2 n pq ) − 3 = (3n2 pq + np2 ) − 3 n2 p q = p nq olarak bulunur. 5.5.2 X ve Y bağımsız geometrik dağılıma ( P( X = x) = p q x−1 , x = 1, 2,3,... ) sahip rasgele değişkenler olsun. X + Y = n verildiğinde, X in koşullu olasılık fonksiyonunu elde ediniz. Çözüm: Önce, X + Y = n ve DY = {1, 2,3,...} olduğundan x = 1, 2, 3,..., n − 1 olur. Buna göre, P ( X = x | X + Y = n) koşullu olasılığı x = 1, 2, 3,..., n − 1 için P ( X = x | X + Y = n) = P ( X = x, X + Y = n ) = n−1 P ( X + Y = n) P ( X = x, Y = n − x ) ∑ P( X = s)P ( X + Y = n | X = s ) s =1 n− x −1 P( X = x) P( Y = n − x) p q x−1 p q q n− 2 1 = n −1 = n−1 = n−1 = n −1 ∑ P( X = s)P (Y = n − s ) ∑ p q s −1 p q n−s −1 ∑ q n−2 s =1 s =1 s =1 dir. Buradan, X + Y = n verildiğinde, X in koşullu olasılık fonksiyonunu P ( X = x | X + Y = n) = 1 , x = 1, 2,3,..., n − 1 n −1 olup koşullu dağılım kesikli düzgün dağılımdır. 5.5.3 X ~ NB (r , p ) olsun. Bu durumda, −∞ < E ( g ( X ) ) < ∞ ve −∞ < E ( g (−1) ) < ∞ X için E ( (1 − p ) g ( X ) ) = E g ( X − 1) olduğunu gösteriniz (Casella ve Berger, r + X −1 2002, sayfa 126). Çözüm: Negatif Binom dağılımının olasılık fonksiyonu, x − 1 r x −r P( X = x) = , x = r , r + 1, r + 2,... p q r −1 şeklinde olup bu fonksiyon, r + x − 1 r x P( X = x) = p q , x = 0,1, 2,3,... x ÖZEL DAĞILIMLAR 239 olarak da yazılabilir. Buradan, y = x + 1 olmak üzere, E ( g ( X )) değeri ∞ ∞ r + x − 1 r x E ( g ( X ) ) = ∑ g ( x) P( X = x) = ∑ g ( x) p q x x =0 x =0 ∞ r + y − 2 r y −1 = ∑ g ( y − 1) p (1 − p) y − 1 y =1 ∞ y r + y − 1 r y = ∑ g ( y − 1) p (1 − p) r + y − 1 y y =1 ∞ y g ( y − 1) r + y − 1 r X g ( X − 1) y −1 = ∑ p (1 − p) = E y r + X −1 1− p y =0 r + y − 1 1 − p olarak hesaplanır. Eşitliğin her iki tarafı (1 − p ) ile çarpılırsa, X E ( (1 − p ) g ( X ) ) = E g ( X − 1) r + X −1 şeklinde aranan eşitlik elde edilmiş olur. Bu formül kullanılarak g ( x) = r + x denirse, X E ( (1 − p ) ( r + X ) ) = E ( r + X − 1) = E ( X ) (r + X − 1) bulunur. Eşitliğin biraz düzenlenmesi ile de, E ((1 − p )(r + X )) = E ( X ) ⇒ qr + qE ( X ) = E ( X ) elde edilir. Buradan da, E ( X )[1 − q ] = qr olup dağılımın beklenen değeri E ( X ) = qr / p olarak hesaplanmış olur. 5.5.4 a) X ~ Binom(n = 10, p = 1/ 2) olsun. P (3 ≤ X ≤ 5) olasılığını hesaplayınız. b) Y ∼ N ( µ = 5, σ 2 = 2.5) olmak üzere, P (2.5 ≤ Y ≤ 5.5) olasılığını hesaplayınız. Bu iki olasılık arasındaki benzerliği yorumlayınız. Çözüm: a) X rasgele değişkeninin olasılık fonksiyonu, x 10− x 10 1 1 P( X = x) = x 2 2 , x = 0,1, 2,...,10 olup olasılıklar aşağıdadır. x 0 1 2 3 4 5 6 7 8 9 10 f ( x) 1 1024 10 1024 45 1024 120 1024 210 1024 252 1024 210 1024 120 1024 45 1024 10 1024 1 1024 240 MATEMATİKSEL İSTATİSTİĞE GİRİŞ Bu tablo değerlerinden P (3 ≤ X ≤ 5) olasılığı P (3 ≤ X ≤ 5) = P ( X = 3) + P ( X = 4) + P ( X = 5) = 120 210 252 582 + + = ≅ 0.5683 1024 1024 1024 1024 olarak hesaplanmıştır. b) Y ~ N ( µ = 5, σ 2 = 2.5) ise, 2.5 − 5 X − 5 5.5 − 5 P (2.5 ≤ Y ≤ 5.5) = P ≤ ≤ = P (−1.58 ≤ Z ≤ 0.32) = 0.569 2.5 2.5 2.5 dir. X kesikli rasgele değişken olduğundan P (3 ≤ X ≤ 5) ile P (2.5 ≤ X ≤ 5.5) olasılıkları aynıdır. X in beklenen değer ve varyansı E ( X ) = np = 5 , Var ( X ) = npq = 2.5 dır. Buradan, (5 + 0.5) − 5 (3 − 0.5) − 5 P <Z < = P (−1.58 < Z < 0.32) ≅ 0.569 2.5 2.5 olduğundan, hesaplanan iki değer birbirine çok yakındır. Burada Binom dağılımına süreklilik düzeltmesi yapılmaktadır. Yani, alt sınırdan 0.5 çıkartılıp üst sınıra 0.5 eklenmektedir. istendiğinde X X ~ Binom(n, p ) olduğundan, P (3 ≤ X ≤ 5) olasılığı hesaplanmak in alt ve üst sınırlarını kapsayacak şekilde bir düzeltme yapılır. X ~ Binom(10,1/ 2) ise P (2.5 ≤ X ≤ 5.5) = P (3 ≤ X ≤ 5) dir. Buradaki 0.5 sayısı süreklilik düzeltmesidir. Bu düzeltme yapıldıktan sonra, her iki taraftan beklenen değeri çıkartılıp standart sapmasına bölünerek alt ve üst z − değerleri elde edilir. n değeri ne kadar büyük ise bu olasılıklar da birbirine o kadar yakındır. 5.5.5 X ~ Geo( p ) olsun. X in, x = 2 m − 1, m = 1, 2,3,... şeklinde tek değerler alması olasılığını hesaplayınız. Çözüm: X ~ Geo( p ) ise dağılımın olasılık fonksiyonu, P( X = x) = pq x −1 , x = 1, 2,3,... dir ( q = 1 − p ). Buradan, X in x = 2 m − 1, m = 1, 2,3,... gibi tek sayıları alması ( x = 1,3,5, 7,... gibi değer alması) olasılığı, ÖZEL DAĞILIMLAR ∞ m =1 241 ∞ m=1 P ∪ {w : X ( w) = 2m − 1} = P ∪ { X = 2m − 1} = ∞ ∞ ∞ m =1 m =1 m =1 ∑ P ({ X = 2m − 1}) = ∑ p q 2m−1−1 = ∑ p q 2m−2 ∞ ∞ = p ∑ q 2( m −1) = p ∑ q 2 k = m =1 k =0 p 1− q 2 = p (1 − q ) (1 + q ) = 1 1+ q dir. 5.5.6 X ve Y bağımsız standart normal dağılıma sahip rasgele değişkenler olsun. 1 , x>0 sgn( x) = 0 , x = 0 −1 , x < 0 olmak üzere, Z =| Y |sgn( X ) rasgele değişkeninin olasılık yoğunluk fonksiyonunu bulunuz. Çözüm: Standart normal rasgele değişkenin dağılım fonksiyonu φ ( z ) olsun. Ayrıca, X in (veya Y nin) dağılım fonksiyonu z φ ( z) = ∫ −∞ 1 − x 2 /2 e dx 2π şeklindedir. Z nin dağılım fonksiyonu FZ ( z ) olmak üzere, FZ ( z ) = P ( Z ≤ z ) = φ ( z ) olduğunu göstereceğiz. X standart normal dağılıma sahip bir rasgele değişken olduğundan, P ( X > 0) = P ( X < 0) = 1/ 2 ve P ( X = 0) = 0 dır. Buradan Z nin dağılım fonksiyonu için, FZ ( z ) = P ( Z ≤ z ) = P ( | Y |sgn( X ) ≤ z ) = P (| Y | sgn( X ) ≤ z | X < 0 ) P ( X < 0) + P (| Y | sgn( X ) ≤ z | X > 0 ) P ( X > 0) + P (| Y | sgn( X ) ≤ z | X = 0 ) P ( X = 0) = P (| Y | sgn( X ) ≤ z | X < 0) P ( X < 0) + P (| Y | sgn( X ) ≤ z | X > 0) = 0.5 P (| Y | ≥ − z ) + 0.5 P (| Y | ≤ z ) eşitliği elde edilir. Burada z ≥ 0 ve z < 0 durumları ayrı ayrı incelenmelidir. z ≥ 0 ise, P (| Y | ≥ − z ) = 1 olup FZ ( z ) FZ ( z ) = 0.5 P (| Y | ≥ − z ) + 0.5 P (| Y | ≤ z ) = 0.5 + 0.5 P(| Y | ≤ z ) = 0.5[1 + P(− z ≤ Y ≤ z )] = 0.5 + 0.5[φ ( z ) − φ (− z )] = 0.5 + 0.5[φ ( z ) − (1 − φ ( z ))] 242 MATEMATİKSEL İSTATİSTİĞE GİRİŞ = 0.5 + 0.5 [ 2φ ( z ) − 1] = 0.5 + φ ( z ) − 0.5 = φ ( z ) dır. Yani, z ≥ 0 için çözüm tamamlanmıştır. Diğer taraftan z < 0 ise P (| Y | < z ) = 0 ve φ ( z ) = 1 − φ (− z ) olduğundan FZ ( z ) , FZ ( z ) = 0.5 P (| Y | ≥ − z ) + 0.5 P (| Y | ≤ z ) = 0.5 P (| Y | ≥ − z ) = 0.5[ P (Y ≥ − z ) + P (Y ≤ z )] = 0.5[ P (Y ≤ z ) + P (Y ≤ z )] = 0.5[φ ( z ) + φ ( z ) = φ ( z ) dir. Her iki durumda da, FZ ( z ) = P ( Z ≤ z ) = φ ( z ) olduğundan Z =| Y |sgn( X ) rasgele değişkeni de standart normal dağılıma sahiptir. Burada, X ve Z nin her ikisi de standart normal rasgele değişkenler olmasına rağmen, ( X , Z )′ iki boyutlu normal değildir. 5.5.7 X ve Y serbestlik dereceleri p ve q olan bağımsız ki-kare dağılımılı rasgele değişkenler olsun. T p ,q = ( X / p) rasgele değişkenini tanımlayalım. E (T p,q ) = q / (q − 2) (Y / q ) olduğunu gösteriniz. Çözüm: X ~ χ 2p ve Y ~ χ q2 bağımsız olduğundan, E ( X / Y ) = E ( X ) E (1 / Y ) yazılır. X ~ χ 2p ise E ( X ) = p dir. Y ~ χ q2 olmak üzere E (1 / Y ) beklenen değerini hesaplayalım. Y nin olasılık yoğunluk fonksiyonu, y ( q /2)−1e− y /2 f ( y ) = Γ ( q / 2 ) 2q /2 0 , x>0 , d . y. olup E (1 / Y ) değeri, ∞ ∞ ∞ 1 1 ( q /2 )−1 − y /2 1 y e dy = y ( q /2)−2 e− y /2 dy ∫ ∫ q q /2 y q q /2 0 Γ 2( ) 0 Γ 2( ) 0 2 2 q q q Γ − 1 2( q /2)−1 Γ − 1 Γ − 1 ∞ 1 1 1 ( ( q /2 )−1)−1 e− y /2 dy = 2 2 = 2 = = ∫y 2 2 q q ( q /2 ) 0 q q /2 q Γ 2 Γ 2 Γ Γ − 1 + 1 2 2 2 2 E (1/ Y ) = ∫ 1 f ( y )dy = y ÖZEL DAĞILIMLAR 243 q Γ −1 1 1 1 1 2 1 2 = = = = 2 q q 2 q 2 q−2 q−2 −1 Γ −1 −1 2 2 2 olarak hesaplanmıştır. Buradan, T p ,q rasgele değişkeninin beklenen değeri ( ) ( X / p) X = E ( X / p ) E (1/ ( Y / q ) ) = E p (Y / q ) E Tp ,q = E q q p 1 = q E = Y p Y q−2 E olarak bulunmuş olur. 5.5.8 Y1, Y2 ,… , Yn , Yn+1 bağımsız N (0, σ 2 / 2) dağılımılı rasgele değişkenler olsun. a) X i = Y i − Y n +1 , i = 1, 2,3,..., n olmak üzere P ( X1 ≥ 0, X 2 ≥ 0,..., X n ≥ 0) = 1 n +1 olduğunu gösteriniz. b) X i = Y i − Y i +1 , i = 1, 2,3,..., n olsun. Bu durumda, P ( X1 ≥ 0, X 2 ≥ 0,..., X n ≥ 0) = 1 (n + 1)! olduğunu gösteriniz. Çözüm: a) X1, X 2 ,… , X n rasgele değişkenleri X = ( X1,… , X n )′ şeklinde yazıldığında, X rasgele vektörü, beklenen değeri µ , varyans-kovaryans matrisi Σ olan n − değişkenli normal dağılıma sahiptir. Yani, X = MN n ( µ , Σ) dir. Burada, σ2 σ2 /2 σ2 /2 σ 2 / 2 σ 2 σ 2 / 2 2 2 2 µ = 0 ve Σ = σ / 2 σ / 2 σ 2 σ / 2 σ 2 / 2 σ 2 / 2 dir. Şimdi, P ( X1 ≥ 0, X 2 ≥ 0,..., X n ≥ 0 ) = . . σ 2 / 2 σ 2 / 2 σ 2 / 2 σ 2 1 olduğunu gösterelim. Bunun için, n +1 244 MATEMATİKSEL İSTATİSTİĞE GİRİŞ 1 0 0 X1 0 1 0 X 2 0 0 1 . X = = . . 0 0 0 X n n×1 0 0 0 −1 . . 0 . . 0 −1 0 −1 . . 0 . . 1 −1 −1 n×( n +1) Y 1 Y 2 . =MY . . Y n ( n +1)×1 yazalım. Bu durumda, µY = 0 ise µ X = M µY = 0 ve ΣY = (σ 2 / 2) I olup, X rasgele vektörünün varyans-kovaryans matrisi ΣX 2 1 1 2 2 σ = M ΣY M ′ = 2 1 1 . . . . . . 1 1 2 şeklinde olur. X i = Y i − Y i +1 , i = 1, 2,3,..., n olduğundan aranan olasılık, P ( X1 ≥ 0, X 2 ≥ 0,..., X n ≥ 0 ) = P (Y1 ≥ Yn+1, Y2 ≥ Yn +1,..., Yn ≥ Yn +1 ) ∞ = ∫ P (Y1 ≥ Yn+1 , Y2 ≥ Yn+1,..., Yn ≥ Yn+1 Yn +1 = y ) fYn +1 ( y ) dy −∞ ∞ ∞ n = ∫ P ( Y1 ≥ y, Y2 ≥ y,..., Yn ≥ y ) fYn +1 ( y ) dy = ∫ [1 − FY ( y )] fYn +1 ( y ) dy −∞ =− 1 [1 − FY ( y)] n +1 −∞ n+1 ∞ −∞ = 1 n +1 dir. b) X i = Y i − Y i +1 , i = 1, 2,3,..., n denirse, X = ( X1, X 2 ,… , X n )′ in dağılımı beklenen değeri µ = 0 varyans kovaryans-matrisi Σ* olan n − değişkenli normaldir. Buradan, X = MN n ( µ , Σ* ) olup P ( X1 ≥ 0, X 2 ≥ 0,..., X n ≥ 0) olasılığını hesaplayabiliriz. Burada, ÖZEL DAĞILIMLAR 245 σ2 −σ 2 / 2 0 −σ 2 / 2 −σ 2 / 2 σ2 * 0 σ2 /2 σ2 Σ = 2 σ / 2 σ 2 / 2 σ 2 / 2 . . 0 0 0 σ 2 olup P ( X1 ≥ 0, X 2 ≥ 0,..., X n ≥ 0) olasılığı için X rasgele vektörünü 1 −1 0 X1 0 1 −1 X 2 0 0 1 . X = = . . 0 0 0 X n n×1 0 0 0 . . . . . . . . 0 0 Y1 0 0 Y 2 0 0 . =MY . . −1 0 Y 1 −1 n×( n +1) n ( n+1)×1 şeklinde yazalım. Buradan, integrallerin ardışık olarak hesaplanması ile aranan olasılık, P ( X1 ≥ 0, X 2 ≥ 0,..., X n ≥ 0 ) = P (Y1 ≥ Y2 , Y2 ≥ Y3 ,..., Yn ≥ Yn +1 ) ∞ = ∫ P (Y1 ≥ Y2 , Y2 ≥ Y3 ,..., Yn ≥ Yn+1 Y1 = y1 ) fY1 ( y1 ) dy1 −∞ ∞ = ∫ P (Y2 ≤ y1, Y2 ≥ Y3 ,..., Yn ≥ Yn +1 ) f ( y1 ) dy1 −∞ ∞ y1 = ∫ ∫ P ( Y2 ≤ y1 , Y3 ≤ y2 ,..., Yn ≥ Yn+1 ) f ( y2 ) f ( y1 ) dy2 dy1 −∞ −∞ ∞ y1 yn = ∫ ∫ ... ∫ FYn +1 ( yn+1 ) f ( yn +1 ) f ( yn )... f ( y2 ) f ( y1 ) dyn dyn−1...dy2 dy1 −∞ −∞ −∞ ∞ y1 yn −1 = ∫ ∫ ... ∫ −∞ −∞ −∞ 1 2 F ( yn +1 ) f ( yn )... f ( y2 ) f ( y1 ) dyn dyn −1...dy2 dy1 2 . . ∞ 1 1 [ F ( y1)]n f ( y1) dy1 = [ F ( y1)]n+1 (n + 1)! −∞ n ! = ∫ olarak hesaplanmış olur. ∞ = −∞ 1 (n + 1)! 246 MATEMATİKSEL İSTATİSTİĞE GİRİŞ 5.5.9 Rayleigh dağılımının ve (−π , π ) aralığındaki düzgün dağılımın olasılık yoğunluk fonksiyonları sırası ile, r e− r 2 /2 f R (r ) = 0 1 fT (t ) = 2π 0 , r>0 , d . y. , −π < t < π , d . y. dir. X = R cos(T ) , Y = R sin(T ) olsun. a) R ve T bağımsız rasgele değişkenler ise X ve Y nin bağımsız standart normal dağılımlı rasgele değişkenler olduğunu gösteriniz. b) Tersine olarak, X ve Y bağımsız standart normal dağılımlı rasgele değişkenler ise, R = X 2 + Y 2 ve T = arctan(Y / X ) rasgele değişkenlerinin yukarıdaki olasılık yoğunluk fonksiyonlarına sahip bağımsız rasgele değişkenler olduğunu gösteriniz. Çözüm:a) R ve T bağımsız olduğundan ortak olasılık yoğunluk fonksiyonu, 1 − r 2 /2 re f R ,T (r , t ) = 2π 0 , r > 0, −π < t < π , d . y. şeklinde yazılabilir. X = R cos(T ) , Y = R sin(T ) ise X ve Y rasgele değişkenlerinin değer X 2 + Y 2 ve T = arctan(Y / X ) dir. Jacobien matrisi kümeleri olup ters dönüşümler R = için türevler, ∂r = ∂x x x2 + y2 , ∂r = ∂y y ve x2 + y2 ∂t y ∂t x =− 2 , = ∂x x + y 2 ∂y x 2 + y 2 olup Jacobien matrisi ile determinantı da, ∂ r ∂x J = ∂t ∂x x ∂r ∂y x 2 + y 2 = ∂t y − ∂y x 2 + y 2 x +y ve det ( J ) = x x 2 + y 2 y 2 2 1 x2 + y 2 olarak hesaplanmıştır. Buradan X ve Y nin ortak olasılık yoğunluk fonksiyonu, ÖZEL DAĞILIMLAR 247 f ( x, y ) = det ( J ) f R,T ( r ( x, y ), t ( x, y ) ) = = 1 2π 1 x2 + y2 e x2 + y2 ( ) − x 2 + y 2 /2 1 −( x 2 + y 2 )/2 1 − x 2 /2 1 − y 2 /2 e = e e = f X ( x) fY ( y ) 2π 2π 2π olarak yazılır. Yani, X ve Y bağımsız standart normal dağılıma sahip rasgele değişkenlerdir. b) X ve Y nin ortak olasılık yoğunluk fonksiyonu, f ( x, y ) = f X ( x) fY ( y ) = olup R = 1 − x2 /2 1 − y 2 /2 1 −( x 2 + y 2 ) / 2 e e = e , x, y ∈ 2π 2π 2π X 2 + Y 2 ve T = arctan(Y / X ) den ters dönüşümler, X = R cos(T ) , Y = R sin(T ) şeklindedir. Jacobien matrisi için türevler, ∂x ∂x ∂y ∂y = cos(t ) , = − r sin(t ) ve = sin(t ) , = r cos(t ) ∂r ∂t ∂r ∂t dir. R ve T nin tanım bölgeleri sırası ile + ve (−π , π ) olup Jacobien matrisi ve determinantı, ∂ x ∂r J = ∂ y ∂r ∂x ∂ t cos(t ) − r sin(t ) = ∂ y sin(t ) r cos(t ) ∂ t ve det( j ) = r (cos 2 (t ) + sin 2 (t ) ) = r dir. Buradan, R ve T nin ortak olasılık yoğunluk fonksiyonu r > 0 ve −π < t < π için r − r 2 cos2 (t ) − r 2 sin 2 (t ) e e 2π 2 1 = r e− r /2 = f R (r ) fT (t ) 2π f R ,T (r , t ) =| det( J ) | f X ,Y ( r ( x, y ), t ( x, y ) ) = = r − r 2 (cos2 (t )+sin 2 (t )) /2 e 2π olarak yazılır. Yani R ve T , olasılık yoğunluk fonksiyonları r e− r 2 /2 f R (r ) = 0 , r>0 , d . y. olan bağımsız rasgele değişkenlerdir. 1 fT (t ) = 2π 0 , −π < t < π , d . y. 248 MATEMATİKSEL İSTATİSTİĞE GİRİŞ 5.5.10 X ve Y iki boyutlu standart normal dağılıma sahip rasgele değişkenler olsun. −1 < ρ < 1 olmak üzere ortak olasılık yoğunluk fonksiyonu x, y ∈ için, f ( x, y ) = 1 2 2 exp − ( x + y − 2 ρ x y ) 2(1 − ρ 2 ) 2π 1 − ρ 2 1 dir. Buna göre, U = X / Y rasgele değişkeninin olasılık yoğunluk fonksiyonunu bulunuz. V = Y yardımcı dönüşümü ile ters dönüşümler X = U V ve Y = V olup Çözüm: Jacobien matrisinin determinantı det( J ) = v dir. Buradan U ve V nin ortak olasılık yoğunluk fonksiyonu u , v ∈ için fU ,V (u, v) =| det( J ) | f X ,Y ( u( x, y), v( x, y) ) = 1 (u v)2 + v2 − 2 u v v exp − 2 2(1 − ρ ) 2π 1 − ρ 2 |v| olup U nun olasılık yoğunluk fonksiyonu için V nin değer kümesi üzerinden integrali alınır. fU ,V (u , v) fonksiyonu v ye göre çift olup, çift fonksiyonun simetrik bir bölge üzerinden integrali, ∞ ∫ ∞ fU ,V (u , v)dv = 2 ∫ fU ,V (u , v)dv 0 −∞ şeklindedir. Buradan a = [u 2 + 1 − 2 ρ u ] / (1 − ρ 2 ) olmak üzere, U nun olasılık yoğunluk fonksiyonu, ∞ ∞ ∫ fU (u ) = v =−∞ = v2 a 2 fU ,V (u, v) dv = ∫ exp − dv = 2 2π 1 − ρ 2 2 −∞ 2π 1 − ρ 1− ρ 2 1 2 π u + 1 − 2ρu |v| = 1− ρ 2 π 1 2 2 u + 1 − 2ρ u + ρ − ρ 2 = ∞ v2 a v exp dv − ∫ 2 0 1− ρ 2 π 1 2 (u − ρ ) + (1 − ρ 2 ) olarak bulunmuştur. Yani, U nun olasılık yoğunlu fonksiyonu, fU (u ) = 1− ρ 2 π 1 2 (u − ρ ) + (1 − ρ 2 ) , u∈ dir. Bu olasılık yoğunluk fonksiyonu, Cauchy dağılımının olasılık yoğunluk fonksiyonuna benzemektedir.