T.C. SELÇUK ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ MARSHALL-OLKİN İKİ DEĞİŞKENLİ DAĞILIMLARI VE İSTATİSTİKSEL SONUÇ ÇIKARIMI Umut ÖKSÜZ YÜKSEK LİSANS İstatistik Anabilim Dalını Nisan-2014 KONYA Her Hakkı Saklıdır. TEZ BİLDİRİMİ Bu tezdeki bütün bilgilerin etik davranış ve akademik kurallar çerçevesinde elde edildiğini ve tez yazım kurallarına uygun olarak hazırlanan bu çalışmada bana ait olmayan her türlü ifade ve bilginin kaynağına eksiksiz atıf yapıldığını bildiririm. DECLARATION PAGE I hereby declare that all information in this document has been obtained and presented in accordance with academic rules and ethical conduct. I also declare that, as required by these rules and conduct, I have fully cited and referenced all material and results that are not original to this work. Umut ÖKSÜZ Tarih: ÖZET YÜKSEK LİSANS TEZİ MARSHALL-OLKIN İKİ DEĞİŞKENLİ DAĞILIMLARI VE İSTATİSTİKSEL SONUÇ ÇIKARIMI Umut ÖKSÜZ Selçuk Üniversitesi Fen Bilimleri Enstitüsü İstatistik Anabilim Dalı Danışman: Doç. Dr. Coşkun KUŞ 2014, 51 Sayfa Jüri Doç. Dr. Coşkun KUŞ Doç.Dr.Murat ERİŞOĞLU Yrd.Doç.Dr.İsmail KINACI Bu tez çalışmasında, Sahran ve Apaloo (2013) tarafından önerilen Genelleştirilmiş Chen dağılımı ve Marshall ve Olkin (1967) nin yöntemi kullanılarak İki değişkenli Marshall-Olkin Genelleştirilmiş Chen dağılımı önerilmiştir. Bu dağılımın olasılık yoğunluk fonksiyonu, dağılım fonksiyonu ve yaşam fonksiyonu gibi dağılımsal özellikleri incelenmiştir. ML tahmin edicileri NelderMaid yöntemiyle elde edilmiştir. EM algoritması da geliştirilerek ML tahminlerine ulaşılmıştır. Önerilen iki değişkenli dağılımın modelleme yeteneği gerçek örnek verilerek gösterilmiştir. Anahtar Kelimeler: Genelleştirilmiş Chen dağılımı, Marshall-Olkin iki değişkenli dağılım, EM algoritması, En çok olabilirlik tahmin edicisi iv ABSTRACT MS THESIS BIVARIATE MARSHALL-OLKIN DISTRIBUTIONS AND STATISTICAL INFERERNCE Umut ÖKSÜZ THE GRADUATE SCHOOL OF NATURAL AND APPLIED SCIENCE OF SELÇUK UNIVERSITY THE DEGREE OF MASTER OF SCIENCE IN DEPARTMENT OF STATISTICS Advisor: Doç. Dr. Coşkun KUŞ 2014, 51 Pages Jury Doç. Dr. Coşkun KUŞ Doç.Dr.Murat ERİŞOĞLU Yrd.Doç.Dr.İsmail KINACI In this thesis, Bivariate Marshall-Olkin generalized Chen distribution is obtained with generalized Chen distribution introduced by Sahran ve Apaloo (2013) using the same approach as was adopted to obtain the Marshall-Olkin bivariate exponential distribution. Some distributional properties such as probability density function, cumulative distribution function and survival function are investigated. Maximum likelihood estimates (MLEs) are obtained using Nelder-Maid method. EM algorithm is also provided to get the MLEs. A real example is also given to show the ability of the moddeling of new introduced distribution. Keywords: Generalized Chen distribution, Bivariate Marshall-Olkin distribution, EM algorithm, Maximum likelihood estimate. v ÖNSÖZ Çalışmamın not için değil, öğrenmek için olduğunu idrak ettiren ve aramızda mesafeler olmasına rağmen benden yardımlarını, desteğini, sabrını ve bilgisini esirgemeyen değerli danışman hocam Doç.Dr. Coşkun KUŞ’a, bu tez çalışmasında bana her zaman destek olan, komutanlarım Binbaşı Serkan ERDOĞMUŞ ve Albay Adil SARAÇ’a, sevgili Anneme ve Havva'ya teşekkürlerimi sunarım. Umut ÖKSÜZ KONYA–2014 vi İÇİNDEKİLER ÖZET ......................................................................................................................... iv ABSTRACT.................................................................................................................v ÖNSÖZ ...................................................................................................................... vi İÇİNDEKİLER ........................................................................................................ vii 1. GİRİŞ .......................................................................................................................1 2. TEMEL KAVRAMLAR .........................................................................................3 2.1. Olasılık Teorisi ...................................................................................................3 2.2. İki Değişkenli Dağılım Fonksiyonları .................................................................4 2.3 Literatürdeki Yeni Dağılımlar ............................................................................17 2.3.1 İki Değişkenli Üstelleştirilmiş Doğrusal Bozulma Oranlı Dağılım...............17 2.3.2 İki Değişkenli Genelleştirilmiş Üstel Dağılım .............................................18 2.4. Asimptotik Normallik .......................................................................................19 2.5. Olabilirlik Fonksiyonu ......................................................................................20 2.6. Fisher Bilgi Matrisi...........................................................................................20 2.7. En Çok Olabilirlik Tahmin Edicileri .................................................................21 2.8. Asimptotik Güven Aralıkları.............................................................................21 3. İKİ DEĞİŞKENLİ ÜSTELLEŞTİRİLMİŞ CHEN DAĞILIMI .........................23 4. PARAMETRE TAHMİNİ ....................................................................................27 5. UYGULAMA.........................................................................................................32 5.1. Gerçek Örnek Üzerinde İstatistiksel Sonuç Çıkarımı.........................................32 5.2. MOBEC Dağılımından Üretilen Veri İçin İstatistiksel Sonuç Çıkarımı .............36 6. SONUÇ VE ÖNERİLER.......................................................................................39 EKLER ......................................................................................................................43 ÖZGEÇMİŞ...............................................................................................................52 vii 1 1. GİRİŞ İki parametreli Chen dağılımı Chen (2000) tarafından önerilmiştir ve bu dağılım yaşam zamanı verilerini modellemede kullanılmaktadır. Sahran ve ark.(2012), Rastogi ve Tripathi (2012) Chen dağılımını reel datayı modellemede kullanmışlar ve Weibull, üstel ve genelleştirilmiş üstel gibi göstermişlerdir. Wu ve ark. (2011) popular dağılımlara aday olabileceğini ve Wu (2008), ilerleyen tür tip-II sansürlü örnekleme dayalı parametrelerin güven aralıklarını ve hipotez testlerini önermişleridir. Rastogi ve ark. (2012), ilerleyen tür tip-II sansürlü örnekleme dayalı ML ve Bayes tahmin edicilerini elde etmişler. 2013 yılında Sahran ve Apaloo (2013) Chen dağılımını genelleştirerek Genelleştirilmiş Chen dağılımını elde etmiş, dağılımsal özellikleri incelemiş ve parametre tahmini problemi üzerinde çalışmıştır. Reel data üzerinde de dağılımın modellemede başarılı olduğunu göstermiştir. 1960 lı yıllarda Marshall-Olkin (1967), iki değişkenli üstel marjinalli MarshallOlkin (MOBE) dağılımı önermişlerdir. Son zamanlarda, Marshall ve Olkin’in MOBE dağılımını elde etme yöntemi kullanılarak yeni iki değişkenli dağılımlar önerilmiştir. Kundu ve Gupta (2009), iki değişkenli genelleştirilmiş üstel marjinalli Marshall-Olkin dağılımı, Sahran ve ark. (2011) iki değişkenli genelleştirilmiş linear failure rate marjinalli Marshall-Olkin dağılımını önermişlerdir. Bu tez çalışmasında, Sahran ve Apaloo (2013) tarafından önerilen Genelleştirilmiş Chen dağılımı ve Marshall ve Olkin (1967) nin yöntemi kullanılarak İki değişkenli Marshall-Olkin Genelleştirilmiş Chen dağılımı önerilmiştir. Bu dağılımın oyf, df ve yaşam fonksiyonu gibi dağılımsal özellikleri incelenmiştir. ML tahmin edicileri Nelder-Maid yönetmiyle elde edilmiştir. EM algoritması da geliştirilerek ML tahminlerine ulaşılmıştır. Önerilen iki değişkenli dağılımın modelleme yeteneği, reel ve simulatif bir örnek verilerek gösterilmiştir. Bu tez çalışmasının 1. Bölümü giriş kısmından oluşmaktadır. 2. Bölümde, temel kavramlar verilmiştir. 3. Bölümde, Genelleştirilmiş Chen dağılımı kullanılarak İki değişkenli Marshall-Olkin Genelleştirilmiş Chen dağılımı önerilmiştir. Bu dağılımın oyf, df ve yaşam fonksiyonu gibi dağılımsal özellikleri incelenmiştir. 4. Bölümde ise, ML tahmin edicileri Nelder-Maid yöntemiyle elde edilmiştir. EM algoritması da geliştirilerek ML tahminlerini ulaşılmıştır. Bölüm 5’de, elde edilen sonuçlar için 2 örnekler verilmiş ve sonuçlar yorumlanmıştır. 6. Bölüm’de ise sonuç ve önerilere yer verilmiştir. 3 2. TEMEL KAVRAMLAR Bu bölümde iki değişkenli rasgele vektörler, iki değişkenli dağılım fonksiyonları,bazı olasılık teorisi kavramları ve literatürdeki bazı dağılımlara yer verilmiştir. Bu bölümdeki verilen Tanımlar ve Teoremler tezde kullanıldığı için Öztürk (1993) ve Rohatgi ve Ehsanes Saleh (2001) den derleme olarak verilmiştir. 2.1. Olasılık Teorisi Tanım 2.1: W ¹ Æ, olmak üzere B1, B2 , K , Bn Ì W n UB i (n Î N ) kümeleri = W, (2.1) i =1 Bi Ç B j = f , 1 £ i < j £ n olacak biçimde belirlendiğinde B1, B2 , K, Bn 'lere W 'nın bir parçalanması denir. Teorem 2.1 ÝI, U, PÞ olasılık uzayı, P( Bi ) > 0 ( Bi Î U , i = 1, 2,..., n ) B1, B2 , K, Bn ler W 'nın bir parçalanması ve olmak üzere A Î U için n P( A) = å P( A | Bi ) P( Bi ) (2.2) i =1 eşitliği yazılır. İspat B1 , B2 , K , Bn 'ler W 'nın bir parçalanması olduğundan n W = U Bi i =1 yazılabilir. Buradan (2.3) 4 n ì AVI = AV 4 Bi i=1 n ì PÝAÞ = P 4 A V Bi i=1 n ì PÝAÞ = > PÝA V Bi Þ i=1 n ì PÝAÞ = > PÝA|Bi ÞPÝBi Þ i=1 (2.4) şeklinde ispat tamamlanır. 2.2. İki Değişkenli Dağılım Fonksiyonları ÝI, U, PÞ tanımlı bir X rasgele vektörü iki değişkenli olduğunda X rasgele vektörünün dağılım fonksiyonu F aşağıda verilen teoremlerdeki özellikleri sağlar. Teorem 2.2 0 £ FX , Y ( x, y ) £ 1 Teorem 2.3 X = ( X , Y ) , ¢ marjinalli FX ,Y ( x, y ) (2.5) ÝI, U, PÞ olasılık uzayında tanımlı FX ( x ) ve FY ( y ) dağılım fonksiyonuna sahip 2 boyutlu rasgele vektör olmak üzere; lim FX , Y ( x, y ) = FX ,Y ( ¥, y ) = FY ( y ) (2.6) lim FX , Y ( x, y ) = FX ,Y ( x, ¥ ) = FX ( x ) (2.7) x ®¥ ve y ®¥ dir. İspat lim n ®¥ FX ,Y ( n, y ) = FY ( y ) eşitliğinin doğruluğu, lim x ®¥ FX , Y ( x, y ) = FY ( y ) eşitliğinin doğru olduğunu gösterir. Bu düşünceden hareketle An = ( X £ n ) = {w : X (w ) £ n} , n = 1, 2, K (2.8) B = (Y £ y ) = {w : Y ( w ) £ y} (2.9) ve için A1 Ì A2 Ì L eşitliğinin doğruluğu olup ¥ lim An = U An = W n ®¥ n =1 olduğu göz önüne alındığında (2.6) 5 lim FX ,Y ( n, y ) = lim P ( X £ n, Y £ y ) n ®¥ n ®¥ ( = lim P {w : X ( w ) £ n, Y (w ) £ y} n ®¥ ) = lim P ( An Ç B ) n ®¥ ( = P lim ( An Ç B ) n ®¥ (( ) ) ) = P lim An Ç B n ®¥ (2.10) = P (W Ç B) = P (B) ( = P {w : Y (w ) £ y} ) = P (Y £ y ) = FY ( y ) şeklinde gösterilebilir. Yukarıdaki düşünce ile lim y ®¥ FX ,Y ( x, y ) = FX ( x ) eşitliği kolayca gösterilebilir. ¢ Teorem 2.4 X = ( X , Y ) , ÝI, U, PÞ olasılık uzayında tanımlı FX ,Y ( x, y ) dağılım fonksiyonuna sahip 2 boyutlu rasgele vektör olmak üzere lim FX ,Y ( x, y ) = 0 (2.11) lim FX ,Y ( x, y ) = 0 (2.12) x ®-¥ ve y ®-¥ dır. İspat lim n ®¥ FX ,Y ( - n, y ) = 0 eşitliğinin doğruluğu, lim x ®-¥ FX ,Y ( x, y ) = 0 eşitliğinin doğru olduğunu gösterir. Bu düşünceden hareketle An = ( X £ - n ) = {w : X (w ) £ - n} , n = 1, 2,K (2.13) B = (Y £ y ) = {w : Y ( w ) £ y} (2.14) ve için A1 É A2 É L olup ¥ lim An = I An = Æ n ®¥ n =1 olduğu göz önüne alındığında (2.11) eşitliğinin doğruluğu (2.15) 6 lim FX ,Y ( -n, y ) = lim P ( X £ -n, Y £ y ) n ®¥ n ®¥ ( = lim P {w : X (w ) £ - n, Y ( w ) £ y} n ®¥ ) = lim P ( An Ç B ) n ®¥ ( = P lim ( An Ç B ) n ®¥ (( ) (2.16) ) ) = P lim An Ç B n ®¥ = P (Æ Ç B ) = P (Æ ) = 0 şeklinde gösterilebilir. Yukarıdaki düşünce ile lim y ®-¥ FX ,Y ( x, y ) = 0 eşitliği kolayca gösterilebilir. Teorem 2.5 X = ( X ,Y ) , ¢ ÝI, U, PÞ olasılık uzayında tanımlı FX ,Y ( x, y ) dağılım fonksiyonuna sahip 2 boyutlu rasgele vektör olmak üzere lim FX , Y ( x, y ) = 1 (2.17) x , y ®¥ dır. İspat lim FX ,Y ( n, n ) = 1 eşitliğinin doğruluğu, n ®¥ lim FX ,Y ( x, y ) = 1 eşitliğinin doğru x , y ®¥ olduğunu gösterir. Bu düşünceden hareketle An = ( X £ n ) = {w : X (w ) £ n} , n = 1, 2, K (2.18) Bn = ( Y £ n ) = {w : Y ( w ) £ n} , n = 1, 2,K (2.19) ve için A1 Ì A2 Ì L olup ¥ lim An = UAn = W n ®¥ (2.20) n =1 ve B1 Ì B2 Ì L olup ¥ lim Bn = UBn = W n ®¥ n =1 olduğu göz önüne alındığında (2.17) eşitliğinin doğruluğu (2.21) 7 lim FX ,Y ( n, n ) = lim P ( X £ n, Y £ n ) n ®¥ n ®¥ ( = lim P {w : X ( w ) £ n, Y (w ) £ n} n ®¥ ) = lim P ( An Ç Bn ) n ®¥ ( ) = P ( lim A Ç lim B ) = P lim ( An Ç Bn ) (2.22) n ®¥ n ®¥ n n ®¥ n = P (W Ç W) = P ( W) =1 şeklinde gösterilebilir. Teorem 2.6 X = ( X ,Y ) , fonksiyonuna sahip ¢ ÝI, U, PÞ olasılık uzayında tanımlı FX ,Y ( x, y ) dağılım boyutlu rasgele vektör olmak üzere F ( x, y ) , x ’e ve y 'ye göre sağdan süreklidir. Yani lim F ( x + h, y ) = F ( x + , y ) = F ( x, y ) (2.23) lim F ( x, y + h ) = F ( x, y + ) = F ( x, y ) (2.24) h ®0+ ve h ®0+ dir. İspat lim n ®¥ F ( x + 1n , y ) = F ( x, y ) lim h®0+ F ( x + h, y )= F ( x + , y )= F ( x, y ) eşitliğinin doğruluğu, eşitliğinin doğru olduğunu gösterir. Bu düşünceden hareketle 1 ö æ lim F ç x + , y ÷ = F ( x, y ) n ®¥ n ø è (2.25) olduğu gösterildiğinde F ( x, y ) in x 'e göre sağdan sürekli olduğu gösterilmiş olur. 1 ö æ lim F ç x + , y ÷ - F ( x, y ) = 0 n ®¥ n ø è (2.26) 1 ö ì æ ü lim í F ç x + , y ÷ - F ( x, y ) ý = 0 n ®¥ n ø î è þ (2.27) olup (2.25) eşitliğinin doğruluğu (2.27) eşitliğinin doğruluğunu gerektirir. (2.25) eşitliği ì æ 1 ö ü ì æ 1 ü ö lim í F ç x + , y ÷ - F ( x, y ) ý = lim í P ç X £ x + , Y £ y ÷ - P ( X £ x, Y £ y ) ý n ®¥ n ø n ø î è þ n®¥ î è þ ì æ 1 öü = lim í P ç x < X £ x + , Y £ y ÷ ý n ®¥ n øþ î è (2.28) 8 şeklinde yazılabilir. 1ö ì 1ü æ An = ç x < X £ x + ÷ = íw : x < X ( w ) £ x + ý nø î nþ è (2.29) B = (Y £ y ) = {w : Y ( w ) £ y} (2.30) ve için A1 É A2 É L olup ¥ lim An = I An = Æ n ®¥ (2.31) n =1 dir. (2.27) eşitliği kullanılarak 1 ö 1 ì æ ü ì æ öü lim í F ç x + , y ÷ - F ( x, y ) ý = lim í P ç x < X £ x + , Y £ y ÷ ý n ®¥ n ®¥ n ø n øþ î è þ î è = lim P ( An Ç B ) n ®¥ ( = P lim ( An Ç B ) n ®¥ (( ) ) ) = P lim An Ç B n ®¥ (2.32) = P (Æ Ç B ) = P (Æ ) =0 elde edilir. Burada gösterilmiş oldu ki 1 ö ì æ ü lim í F ç x + , y ÷ - F ( x, y ) ý = 0 n ®¥ n ø î è þ 1 ö æ Þ lim F ç x + , y ÷ = F ( x, y ) n ®¥ n ø è Þ F ( x, y ) in x e göre sağdan süreklidir Yukarıdaki düşünce ile lim h®0+ F ( x, y + h ) = F ( x, y + ) = F ( x, y ) eşitliği yani F ( x, y ) in y 'ye göre sağdan sürekli olduğu kolayca gösterilebilir. lim n ®¥ F ( x + 1n , y + 1n ) = F ( x, y ) lim h®0+ F ( x + h, y + h ) = F ( x + , y + ) = F ( x, y ) eşitliğinin doğruluğu, eşitliğinin doğru olduğunu gösterir. Bu düşünceden hareketle 1 1ö æ lim F ç x + , y + ÷ = F ( x, y ) n ®¥ n nø è (2.33) 9 olduğu gösterildiğinde F ( x, y ) in x 'e ve y 'ye göre sağdan sürekli olduğu gösterilmiş olur. 1 1ö æ lim F ç x + , y + ÷ = F ( x, y ) n ®¥ n nø è 1 1ö æ Þ lim F ç x + , y + ÷ - F ( x, y ) = 0 n ®¥ n nø è (2.34) ì æ 1 1ö ü Þ lim í F ç x + , y + ÷ - F ( x, y ) ý = 0 n ®¥ n nø î è þ (2.35) olup (2.33) eşitliğinin doğruluğu (2.35) eşitliğinin doğruluğunu gerektirir. (2.33) eşitliği ì æ ü 1 1ö lim í F ç x + , y + ÷ - F ( x, y ) ý n ®¥ n nø î è þ 1 1ö ì æ ü = lim í P ç X £ x + , Y £ y + ÷ - P ( X £ x, Y £ y ) ý n ®¥ n nø î è þ (2.36) 1 1 öü ì æ = lim í P ç x < X £ x + , y < Y £ y + ÷ ý n ®¥ n n øþ î è şeklinde yazılabilir. 1ö ì 1ü æ An = ç x < X £ x + ÷ = íw : x < X (w ) £ x + ý , n = 1, 2,K nø î nþ è (2.37) 1ö ì 1ü æ B = ç y < Y £ y + ÷ = íw : y < Y ( w ) £ y + ý , n = 1, 2, K nø î nþ è (2.38) ve için A1 É A2 É L olup ¥ lim An = I An = Æ n ®¥ (2.39) n =1 ve B1 É B2 É L olup ¥ lim Bn = I Bn = Æ n ®¥ n =1 (2.40) 10 dir. (2.35) ve (2.36) eşitlikleri kullanılarak ì æ 1 1ö ü ì æ 1 1 öü x, y ) ý lim í P ç x < X £ x + , Y £ y + ÷ ý lim í F ç x + , y + ÷ - F (= n ®¥ n ®¥ n nø n n øþ î è þ î è = lim P ( An Ç Bn ) n ®¥ ( ) P ( lim A Ç lim B ) = P lim ( An Ç Bn ) n ®¥ = n ®¥ n (2.41) n n ®¥ = P (Æ Ç Æ ) = P (Æ ) = 0 elde edilir. Burada gösterilmiş oldu ki 1 lim F x + 1 n ,y + n ? FÝx, yÞ n¸K = 0 1 ì n¸K lim F x + 1 n ,y + n = FÝx, yÞ ì FÝx, yÞ in x e ve y ye göre sağdan süreklidir Teorem 2.7 X = ( X ,Y ) , ¢ ÝI, U, PÞ olasılık uzayında tanımlı FX ,Y ( x, y ) dağılım fonksiyonuna sahip 2 boyutlu rasgele vektör olmak üzere F ( x, y ) , göre azalmayandır. Yani "y Î R ve x1 < x2 x 'e ve y 'ye için F ( x1 , y ) £ F ( x2 , y ) (2.42) "x Î R ve y1 < y2 için F ( x, y1 ) £ F ( x, y2 ) (2.43) dir. İspat. Gerçekten x 1 < x 2 için ( X £ x1 ) Ì ( X £ x2 ) Þ ( X £ x1 , Y £ y ) Ì ( X £ x2 , Y £ y ) Þ P ( X £ x1 , Y £ y ) £ P ( X £ x2 , Y £ y ) Þ F ( x1 , y ) £ F ( x2 , y ) olup F ( x, y ) , F ( x, y1 ) £ F ( x, y2 ) gösterilebilir. x 'e göre azalmayandır. Yukarıdaki düşünce ile olduğu yani F ( x, y ) 'in (2.44) y1 < y2 için y 'e göre azalmayan olduğu kolayca 11 Teorem 2.8 (Frechet Sınırları) X = ( X , Y ) , ¢ FX ( x ) ve FY ( y ) marjinalli FX ,Y ( x, y ) ÝI, U, PÞ olasılık uzayında tanımlı dağılım fonksiyonuna sahip p boyutlu rasgele vektör olmak üzere FX ,Y ( x, y ) max { FX ( x ) + FY ( y ) - 1, 0} £ F ( x, y ) £ min {FX ( x ) , FY ( x )} (2.45) eşitsizliğini sağlar. (http://mathworld.wolfram.com/FrechetBounds.html) İspat. A = ( X £ x ) ve B = (Y £ y ) olaylar olmak üzere P ( A È B ) = P ( A) + P ( B ) - P ( A Ç B ) £ 1 (2.46) ifadesi göz önüne alındığında P ( A Ç B ) ³ P ( A) + P ( B ) - 1 Þ P ( X £ x, Y £ y ) ³ P ( X £ x ) + P (Y £ y ) - 1 (2.47) Þ F ( x, y ) ³ FX ( x ) + FY ( y ) - 1 elde edilir. P ( A ) + P ( B ) - 1 = FX ( x ) + FY ( y ) - 1 (2.48) ifadesinin pozitif olup olmadığı belli olmadığından (ki negatif çıkabilir), Kolmogorovun i. aksiyomu gereği max { FX ( x ) + FY ( y ) - 1, 0} (2.49) dir. Diğer taraftan P ( A Ç B ) £ P ( A) (2.50) P ( A Ç B) £ P ( B) (2.51) ve olduğundan P ( X £ x, Y £ y ) £ P ( X £ x ) Þ F ( x, y ) £ FX ( x ) (2.52) P ( X £ x, Y £ y ) £ P ( Y £ y ) Þ F ( x, y ) £ FY ( y ) (2.53) ve olup buradan F ( x, y ) £ min { FX ( x ) , FY ( x )} yazılabilir. (2.54) 12 Teorem 2.9 X = ( X , Y ) , ¢ marjinalli FX ,Y ( x, y ) üzere x1 < x2 ÝI, U, PÞ olasılık uzayında tanımlı FX ( x ) ve FY ( y ) dağılım fonksiyonuna sahip p boyutlu rasgele vektör olmak için P ( x1 < X £ x2 , Y £ y ) = F ( x2 , y ) - F ( x1 , y ) (2.55) ( X £ x2 , Y £ y ) = ( X £ x1 , Y £ y ) È ( x1 < X £ x2 , Y £ y ) (2.56) dir. İspat eşitliği kullanılarak (2.55) eşitliği Þ P ( X £ x2 , Y £ y ) = P ( X £ x1 , Y £ y ) È ( x1 < X £ x2 , Y £ y ) Þ P ( X £ x2 , Y £ y ) = P ( X £ x1 , Y £ y ) + P ( x1 < X £ x2 , Y £ y ) (2.57) Þ F ( x2 , y ) = F ( x1 , y ) + P ( x1 < X £ x2 , Y £ y ) Þ P ( x1 < X £ x2 , Y £ y ) = F ( x2 , y )( x1 , y ) şeklinde gösterilebilir. ( X ,Y ) ¢ Teorem 2.10 her x1 < x2 rasgele vektörünün dağılım fonksiyonu F ( x, y ) olmak üzere ve y1 < y2 için P ( x1 < X £ x2 , y1 < Y £ y2 ) = F ( x2 , y2 ) - F ( x2 , y1 ) - F ( x1 , y2 ) + F ( x1 , y1 ) (2.58) eşitliği vardır. İspat 2.10.1 A = ( X £ x1 ) , B = ( X £ x2 ) , C = ( Y £ y1 ) , D = ( Y £ y2 ) olaylar olmak üzere P ( x1 < X £ x2 , y1 < Y £ y2 ) = P {( B - A ) Ç ( D - C )} (2.59) olarak yazılabilir. Buradan { } P ( x1 < X < x2 , y1 < Y < y2 ) = P éë B Ç ( D - C ) ùû - éë A Ç ( D - C ) ùû yazılabilir. Burada BÉ A olduğundan (2.60) B Ç ( D - C ) É A Ç ( D - C ) 'dır. Böylece (2.59) eşitliğinden { } P {( B - A) Ç ( D - C )} = P éë B Ç ( D - C ) ùû - éë A Ç ( D - C ) ùû = P {B Ç ( D - C )} - P { A Ç ( D - C )} yazılabilir. Buradan (2.61) 13 P {B Ç ( D - C )} - P { A Ç ( D - C )} = P {B Ç D - B Ç C} - P { A Ç D - A Ç C} yazılabilir. Burada DÉC olduğundan BÇ D É BÇC ve (2.62) A Ç D É A Ç C 'dir. Böylece P ( x1 < X £ x2 , y1 < Y £ y 2 ) = P ( B Ç D ) - P ( B Ç C ) - P ( A Ç D ) + P ( A Ç C ) (2.63) elde edilir. Yukarda tanımlanan A, B, C , D olaylarının eşiti cd5 eşitliğinde yazılırsa P ( x1 < X £ x2 , y1 < Y £ y2 ) = F ( x2 , y2 ) - F ( x2 , y1 ) - F ( x1 , y2 ) + F ( x1 , y1 ) (2.64) eşitliği elde edilir. İspat 2.10.2 : ( x1 < X £ x2 , Y £ y2 ) = ( x1 < X £ x2 , Y £ y1 ) È ( x1 < X £ x2 , y1 < Y £ y2 ) (2.65) eşitliğinde P ( x1 < X £ x2 , Y £ y2 ) = P ( x1 < X £ x2 , Y £ y1 ) + P ( x1 < X £ x2 , y1 < Y £ y2 ) (2.66) yazılabilir. Teorem 2.10 (2.58) eşitliğine uygulandığında F ( x2 , y2 ) - F ( x1 , y2 ) = F ( x2 , y1 ) - F ( x1 , y1 ) + P ( x1 < X £ x2 , y1 < Y £ y2 ) (2.67) olup buradan P ( x1 < X £ x2 , y1 < Y £ y2 ) = F ( x2 , y2 ) - F ( x2 , y1 ) - F ( x1 , y2 ) + F ( x1 , y1 ) (2.68) elde edilebilir. Sonuç: Olasılık ölçüsünün tanımı ve Teorem 2.10'dan F ( x2 , y2 ) - F ( x2 , y1 ) - F ( x1 , y2 ) + F ( x1 , y1 ) ³ 0 (2.69) dır. Bu özellik Poincar´e's Teoremi(içerme dışlama prensibi) kullanılarak 3 ve daha büyük boyutlu rasgele vektörlerin ortak dağılım için genelleştirilebilir. Teorem 2.11 ( X ,Y ) , marjinalli FX ,Y ( x, y ) 2 üzere her Ýx, yÞ 5 § ¢ ÝI, U, PÞ olasılık uzayında tanımlı FX ( x ) FY ( y ) dağılım fonksiyonuna sahip p boyutlu rasgele vektör olmak için P { X > x, Y > y} = F ( x, y ) = 1 - FX ( x ) - FY ( y ) + F ( x, y ) eşitliği vardır. ve (2.70) 14 İspat A = ( X £ x ) ve B = (Y £ y ) olaylar olmak üzere P { X > x, Y > y} = P ( Ac Ç Bc ) yazılabilir. Eşitlik (2.70) ve daha sonra De Morgan kanunu uygulanırsa ( P { X > x, Y > y} = 1 - P ( Ac Ç B c ) c ) = 1- P ( A È B) = 1 - éë P ( A) + P ( B ) - P ( A Ç B ) ùû (2.71) = 1 - P ( X £ x ) - P (Y £ y ) + P ( X £ x , Y £ y ) = 1 - FX ( x ) - FY ( y ) + F ( x, y ) ispat tamamlanır. İkinci bir yol olarak, ortak dağılım fonksiyonu için verilen 2. özellik ve Teorem 2.10' dan P { X > x, Y > y} = P ( x < X < ¥, y < Y < ¥ ) = F ( ¥ , ¥ ) - F ( ¥ , y ) - F ( x , ¥ ) + F ( x, y ) (2.72) = 1 - FY ( y ) - FX ( x ) + F ( x, y ) ispat kolayca yapılabilir. Teorem 2.12 F , R2 de tanımlı iki boyutlu bir fonksiyon olsun. F , X ve Y rasgele değişkenlerinin ortak dağılım fonksiyonudur ancak ve ancak 1. 2. 3. F azalmayan ve lim x ®-¥ F ( x, y ) =0, x1 < x2 her değişken lim y ®-¥ F ( x, y ) =0 için ve sağdan sürekli lim x , y ®¥ F ( x, y ) =1 ve y1 < y2 için F ( x2 , y2 ) - F ( x2 , y1 ) - F ( x1 , y2 ) + F ( x1 , y1 ) ³ 0 Yukarıdaki iki boyutlu dağılım fonksiyonu ile ilgili elde edilen sonuçlar p > 2 boyutlu dağılım fonksiyonlar için de kolayca genelleştirilebilir. 1. 0 £ F ( x ) £ 1, x Î R p 2. lim F ( x ) = F ( ¥, ¥, K , ¥ ) =1 3. x ®¥ En az bir xi için i = 1, 2,K , p lim F ( x ) =0 xi ®-¥ 15 4. F fonksiyonu sağdan süreklidir, yani lim F ( x1 + h1 , x2 + h2 , K , x p + hp ) = F ( x ) hi ®-¥ i =1,2,K, p (Öztürk, 1993). 5. F azalmayandır, yani x1 £ x2 için F ( x1 ) £ F ( x2 ) 'dir. Bir başka deyişle F , x 'in her bir elemanına göre azalmayandır. Örnek 2.1 : İki değişkenli 0 , x < 0 veya x + y < 1 veya y < 0 1 , diğer yerlerde FÝx, yÞ = fonksiyonu ele alınsın. F ( x, y ) 1-5 özelliklerini sağlar. 1 æ1 ö P ç < X £ 1, < Y £ 1÷ 3 è3 ø olasılığı, Teorem 2.10' dan P ( x1 < X < x2 , y1 < Y < y2 ) = F ( x2 , y2 ) - F ( x2 , y1 ) - F ( x1 , y2 ) + F ( x1 , y1 ) 1 æ1 ö æ1 1ö æ 1ö æ1 ö P ç < X £ 1, < Y £ 1÷ = F (1,1) + F ç , ÷ - F ç1, ÷ - F ç ,1÷ 3 è3 ø è 3 3ø è 3ø è3 ø = 1 + 0 - 1 - 1 = -1 < 0 olduğundan F ( x, y ) dağılım fonksiyonu değildir. (Rohatgi, V.K. 1976, syf:106: An Introduction to Probability Theory and Mathematical Statistics) Not: F ( x1 , x2 ,K , xn ) ortak dağılım fonksiyonundan F1 ( x1 ) , F2 ( x2 ) ,K , Fn ( xn ) marjinal dağılım fonksiyonlar tek biçimde belirlenir. Fakat tersi doğru değildir. Yani, aynı marjinal dağılım fonksiyonları farklı ortak dağılım fonksiyonunu verebilir. Örnek 2.2: Aşağıda tanımlanan f1 ve f2 olasılık yoğunluk fonksiyonlar farklı olmasına rağmen aynı marjinallere sahiptir. f1 ( x, y ) = {1 , 0 < x, y < 1 f 2 ( x, y ) = {1 + a ( 2 x - 1)( 2 y - 1) , 0 < x, y < 1, - 1 < a < 1 16 Sonuç: Örnek 2.1 ve Örnek 2.2 den görüldüğü gibi aynı marjinallere sahip birden çok ortak dağılım fonksiyonu olabilir. 17 2.3 Literatürdeki Yeni Dağılımlar 2.3.1 İki Değişkenli Üstelleştirilmiş Doğrusal Bozulma Oranlı Dağılım Doğrusal Bozulma Oranlı Dağılımın (Linear Failure Rate Distribution, LFR) dağılım fonksiyonu g ü ì FLFR ( x; b , g ) = 1 - exp í- bx - x 2 ý 2 þ î b > 0, g > 0 (2.79) şeklinde tanımlanır. Sahran ve Kundu (2009) bu dağılımı genelleştirmişlerdir. Sahran ve Kundu (2009)’un önerdiği dağılım olan Üstelleştirilmiş Doğrusal Bozulma Oranlı Dağılımın (GLFR) dağılım ve olasılık yoğunluk fonksiyonu, sırasıyla, a æ g üö ì FGLFR ( x;a , b , g ) = çç1 - exp í- bx - x 2 ý ÷÷ 2 þø î è fGLFR ( x; a , b , g ) = a (b + gx )e g ö æ - ç bx + x 2 ÷ 2 ø è a > 0, b > 0, g > 0 (2.80) a -1 g üö æ ì çç1 - exp í- bx - x 2 ý ÷÷ 2 þø î è , a > 0, b > 0, g > 0 (2.81) şeklindedir. X ~ GLFR(a , b , g ) ile gösterilir. İki Değişkenli Üstelleştirilmiş Doğrusal Bozulma Oranlı Dağılımı (Bivariate Generalized Linear Failure Rate, BGLFR) için; U 1 , U 2 ve U 3 bağımsız 3 rasgele değişken ve her biri GLFR dağılımına sahip olsun. Burada X 1 = max (U 1 ,U 3 ) ve X 2 = max (U 2 , U 3 ) dönüşümleri tanımlansın. Bu durumda ( X 1, X 2 )¢ BGLFR dağılımının, dağılım fonksiyonu, olasılık yoğunluk fonksiyonu ve marjinal olasılık yoğunluk fonksiyonları sırasıyla aşağıda verilmiştir. ( X 1, X 2 )¢ ~ BGLFR(a1, a 2 , a 3 , b , g ) olmak üzere ( X 1, X 2 )¢ nin dağılım fonksiyonu aşağıdaki gibi yazılabilir. (Sarhan ve ark.) 3 FX1 ,X 2 (x1 , x2 ) = P (X 1 ≤ x1 , X 2 ≤ x2 ) = ∏ FGLFR (xi ; αi , β , γ ) , x3 = min{x1 , x2 } i =1 (2.82) 18 ( X 1, X 2 )¢ nin olasılık yoğunluk fonksiyonu aşağıdaki gibi yazılabilir: ì f1 ( x1 , x2 ) ï f X 1 , X 2 ( x1 , x2 ) = í f 2 ( x1 , x2 ) ï f (x ) î 0 0 < x1 < x2 < ¥ 0 < x1 < x2 < ¥ (2.83) 0 < x1 = x 2 = x < ¥ , burada f1 ( x1 , x2 ) = f GLFR ( x1; a1 + a 3 , b , g ) f GLFR ( x2 ; a 2 , b , l ) f 2 ( x1, x2 ) = fGLFR ( x1; a1 , b , g ) f GLFR ( x2 ; a 2 + a 3 , b , l ) f 0 (x ) = (2.84) a3 fGLFR ( x; a1 + a 2 + a 3 , b , g ) a1 + a 2 + a 3 X 1 ve X 2 'nin marjinal dağılım fonksiyonları sırasıyla GLFR (α1 + α3 , β , γ) ve GLFR (α 2 + α3 , β , γ) şeklindedir. 2.3.2 İki Değişkenli Genelleştirilmiş Üstel Dağılım Tek değişkenli genelleştirilmiş üstel dağılımın dağılım fonksiyonu ve olasılık yoğunluk fonksiyonu, sırasıyla, aşağıdaki gibidir: FGE (x; α , λ) = (1 - e - λx ) α (2.85) f GE (x ; α , λ) = αλe - λx (1 - e- λx ) α-1 (2.86) U1 ~ GE (a1, l ), U 2 ~ GE (a 2 , l ) ve U 3 ~ GE (a 3 , l ) birbirinden bağımsız değişkenler olduğu varsayılsın ve aşağıdaki dönüşüm tanımlansın. X 1 = max (U 1 ,U 3 ) ve Buna göre, X 2 = max (U 2 , U 3 ) ( X 1, X 2 )¢ ~ BVGE (a1, a 2 , a 3 ) olmak genelleştirilmiş üstel dağılımın ortak dağılım fonksiyonu z = min{x1 , x2 } olmak üzere üzere İki değişkenli x1 > 0, x2 > 0 için ve 19 ( FX 1 , X 2 (x1, x2 ) = 1 - e - x1 ) (1 - e ) (1 - e ) a1 - x2 a 2 -z a3 (2.87) şeklindedir. (Kundu ve Gupta, 2009). ( X 1, X 2 ) ~ BVGE (a1 , a 2 , a 3 ) olmak üzere İki değişkenli genelleştirilmiş üstel dağılımın olasılık yoğunluk fonksiyonu x1 > 0, x2 > 0 için ve z = min{x1 , x2 } olmak üzere aşağıdaki gibidir:(Kundu ve Gupta, 2009) f1 (x1 , x2 ) = f GE (x1 ; α1 + α3 ) f GE (x2 ; α2 ) = (α1 + α3 )α 2 (1 - e -x1 ) 1 α +α3 -1 (1 - e x )α -1 e- x -x 2 2 1 2 f 2 (x1 , x2 ) = f GE (x1 ; α1 ) f GE (x2 ; α2 + α3 ) = (α2 + α3 )α1 (1 - e -x1 ) 1 (1 - e -x2 ) 2 α -1 f 0 (x) = α +α3 -1 - x - x 1 2 e α3 f (x; α1 + α2 + α3 ) α1 + α2 + α3 GE = α3 (1 - e ) (2.88) (2.89) (2.90) - x α1 +α2 +α3 -1 - x e ( X 1, X 2 ) ~ BVGE (a1 , a 2 , a 3 ) dağılımın marjinal dağılımları olmak üzere iki değişkenli genelleştirilmiş üstel X 1 ~ GE (a1 + a3 ) ve X 2 ~ GE (a 2 + a 3 ) şeklindedir (Kundu ve Gupta, 2009). ( X 1, X 2 ) ~ BVGE (a1 , a 2 , a 3 ) olmak üzere iki değişkenli genelleştirilmiş üstel dağılımın ortak yaşam fonksiyonu aşağıdaki gibidir (Kundu ve Gupta, 2009): S X1 ,X 2 (x1 , x2 ) = 1 - FX1 (x1 ) - FX 2 (x2 ) + FX1 ,X 2 (x1 , x2 ) (2.91) 2.4. Asimptotik Normallik (X n ) rasgele değişkenlerin bir dizisi , Z , standart normal dağılıma sahip bir d rasgele değişken ve ¾¾ ® , dağılımda yakınsamayı göstermek üzere, X n - an d ¾¾ ®Z bn olacak şekilde reel sayıların (an ) ve pozitif reel sayıların (bn ) dizileri varsa, ( X n ) dizisine asimptotik normal veya daha açık olarak “ an ortalaması” ve “ bn2 varyansı” ile 20 ( ) asimptotik normal dizisi denir ve X n ~ AN an , bn2 biçiminde gösterilir. Buradaki an sayısı X n ’in beklenen değeri ve bn2 sayısı X n nin varyansı olmayabilir. Bu değerler sırasıyla X n ’in asimptotik ortalama ve asimptotik varyans değerleridir (Öztürk 2010). 2.5. Olabilirlik Fonksiyonu X 1 , X 2 ,..., X n örneklemi, olasılık (yoğunluk) fonksiyonu f ( x; γ ), γ Î ¡ p olan kitleden alınan n birimlik bir örneklem olsun. Örneklemin ortak olasılık yoğunluk fonksiyonu f (x; γ ), x Î ¡ n olmak üzere bu fonksiyona parametrenin bir fonksiyonu gözü ile bakıldığında L ( γ ; x ) = f ( x; γ ) , γ Î G Ì ¡ p (2.92) şeklinde tanımlanan fonksiyona X 1 , X 2 ,..., X n örneklemine dayalı olabilirlik fonksiyonu denir. Burada x = ( x1 , x2 ,K , xn )¢ ve γ = ( g 1 , g 2 , K , g n )¢ şeklinde olup G parametre uzayıdır. Olabilirlik fonksiyonu L ( γ ; x ) in logaritması alınarak l ( γ ) = log ( L ( γ; x ) ) , γ Î G Ì ¡ p (2.93) şeklinde elde edilen fonksiyona log-olabilirlik fonksiyonu denir. 2.6. Fisher Bilgi Matrisi X 1 , X 2 ,..., X n örneklemi, olasılık (yoğunluk) fonksiyonu f ( x; γ ), γ Î ¡ p olan kitleden alınan n birimlik bir örneklem olsun. Bu örneklem için Fisher bilgi matrisi(Fisher information matrix) 21 ìæ ¶ öü I ( γ ) = - E íç log ( L ( γ; X ) ) ÷ ý øþ îè ¶γ ìæ ¶ öü = - E íç l ( γ ) ÷ ý øþ îè ¶γ æ ¶2l ( γ ) ç 2 ç ¶g 1 ç ¶2l γ ( ) ç = - ç ¶g 2 ¶g 1 ç ç M ç ¶2l γ ( ) ç ç ¶g ¶g è p 1 ¶ 2l ( γ ) ¶ 2l ( γ ) ö L ÷ ¶g 1¶g 2 ¶g 1¶g p ÷ ¶ 2l ( γ ) ¶ 2 l ( γ ) ÷÷ L ¶g 2 2 ¶g 2¶g p ÷ ÷ M O M ÷ ¶ 2l ( γ ) ¶ 2 l ( γ ) ÷÷ L ¶g p ¶g 2 ¶g p 2 ÷ø (2.94) şeklinde tanımlanır, burada L ( γ ; X ) ve l ( γ ) sırasıyla eşitlik (2.92) ve (2.93) de verilen olabilirlik ve log-olabilirlik fonksiyonlarıdır (Wu ve Kuş, 2009). 2.7. En Çok Olabilirlik Tahmin Edicileri Olabilirlik veya log-olabilirlik fonksiyonunu maksimum yapan γ değeri γˆ = arg max ( L ( γ; x ) ) = arg max ( l ( γ ) ) (2.95) γ nın en çok olabilirlik tahmin edicisi (Maximum Likelihood Estimator, MLE) olarak adlandırılır. 2.8. Asimptotik Güven Aralıkları Eşitlik (1.17) de tanımlanan en çok olabilirlik tahmin edicisi γ̂ bazı düzgünlük şartları altında d n ( γˆ - γ ) ¾¾ ® N ( 0, I -1 ( γ ) ) olmak üzere asimptotik normaldir, burada I -1 ( γ ) , (2.94) eşitliğinde tanımlı Fisher Bilgi Matrisidir. Fisher Bilgi matrisinin tersi γ̂ nın asimptotik varyans-kovaryans matrisidir. 22 Bu matrisin bilinmesi, büyük örneklemler için gˆ1 , gˆ2 ,K , gˆn tahmin edicilerinin ayrı ayrı asimptotik varyanslarının bilinmesi anlamına gelmektedir. I -1 ( γ ) nın tutarlı bir tahmin edicisi æ ¶ 2l ( γ ) ç 2 ç ¶g 1 ç ¶ 2l γ ( ) ç $I -1 ( γ ) = - ç ¶g ¶g 2 1 ç ç M ç ¶ 2l γ ( ) ç ç ¶g p ¶g 1 è ¶2l ( γ ) L ¶g 1¶g 2 ¶2l ( γ ) ¶g 2 2 M ¶ l(γ) ¶g p ¶g 2 2 -1 ¶ 2l ( γ ) ö ÷ ¶g 1¶g p ÷ ¶ 2l ( γ ) ÷÷ L ¶g 2¶g p ÷ ÷ O M ÷ ¶ 2 l ( γ ) ÷÷ L ¶g p 2 ÷ø ˆ g =g (2.95a) dır (Adamidis ve Loukas 1998). Buradan g i , i = 1, 2,K , p için gˆi ’ya dayalı asimptotik güven aralığı æ ö P ç gˆi - z a Vii < g i < gˆi + z a Vii ÷ @ 1 - a 112 2 è ø (2.95b) şeklinde oluşturulabilir. Burada Vii , eşitlik (2.95a)’da verilen matrisin i. diogonal elemanıdır ve a Î ( 0,1) için za , standart normal dağılımın a. kuantilidir (Wu ve Kuş 2009). 23 3. İKİ DEĞİŞKENLİ ÜSTELLEŞTİRİLMİŞ CHEN DAĞILIMI X , üstelleştirilmiş Chen yani EC (a , l , b ) dağılımına sahip olduğunda olasılık yoğunluk fonksiyonu ve dağılım fonksiyonu sırasıyla (( f EC ( x ) = alb x b -1 exp l 1 - e x ( {( FEC ( x ) = 1 - exp l 1 - e x b b ) + x ) (1 - exp {l (1 - e )}) xb b a -1 (3.1) )}) a (3.2) olarak verilir. (Sarhan ve Apaloo, 2013). X 1 , X 2 , X 12 bağımsız ve EC (a1 , l , b ) , sırasıyla EC (a 2 , l , b ) ve EC (a12 , l , b ) dağılımına sahip rasgele değişkenler olsun. Burada T 1 = maxÝX 1 , X 12 Þ ve T 2 = maxÝX 2 , X 12 Þ æ T1 ö dönüşümleri tanımlansın. T = ç ÷ è T2 ø rasgele vektörüne Marshal-Ollkin iki değişkenli üstelleştirilmiş Chen dağılımı denilecektir ve T ~ MOBEC (a1 , a 2 , a12 , l , b ) ile gösterilecektir. T ~ MOBEC (a1 , a 2 , a12 , l , b ) Teorem 3.1: T1 ve T2 'nin marjinal dağılım fonksiyonlar sırasıyla EC (a1 + a12 , l , b ) ve EC (a 2 + a12 , l , b ) olacaktır. İspat. F1 (t1 ) = P(T1 < t1 ) = P(max ( X 1, X 12 ) < t1 ) F1 (t1 ) = P( X1 < t1, X 12 < t1 ) F1 (t1 ) = P( X1 < t1 )P( X12 < t1 ) ( { ( )}) .(1 - exp{l (1 - e )}) F (t ) = (1 - exp{l (1 - e )}) F1 (t1 ) = 1 - exp l 1 - et1 b 1 1 t1b a1 a1 + a12 t1b a12 24 F2 (t2 ) = P(T2 < t2 ) = P(max ( X 2 , X 12 ) < t2 ) F2 (t2 ) = P( X 2 < t2 , X 12 < t2 ) F2 (t2 ) = P( X 2 < t2 )P( X 12 < t2 ) ( { ( )}) (1 - exp{l (1 - e )}) F (t ) = (1 - exp{l (1 - e )}) a2 F2 (t2 ) = 1 - exp l 1 - et 2 b 2 t 2b 2 t 2b a12 a 2 +a 12 Teorem 3.2 : T ~ MOBEC (a1 , a 2 , a12 , l , b ) ise a) T 'nin dağılım fonksiyonu 3 FT ( t ) = Õ FEC ( xi , a i , l , b ) , (3.3) i =1 burada x3 = min { x1 , x2 } 'dir b) Ti ~ EC (a i + a 3 , l , b ) 'dır. (Kundu ve Gupta, 2009) İspat. P (T1 ≤t1 ,T2 ≤t 2 ) = P(max (X 1 , X 12 ) ≤t1 , max (X 2 , X 12 ) ≤t 2 ) P (T1 ≤t1 ,T2 ≤t 2 ) = P(X 1 ≤t1 , X 12 ≤t1 , X 2 ≤t 2 , X 12 ≤t2 ) = P (X 1 ≤t1 , X 2 ≤t2 , X 12 ≤t1 ) = P(X 1 ≤t1 , X 2 ≤t 2 , X 12 ≤t2 ) ,t1 < t2 (3.4) ,t 2 < t1 = P (X 1 ≤t1 ).P(X 2 ≤t 2 ).P(X 12 ≤t1 ) = P(X 1 ≤t1 ).P (X 2 ≤t2 ).P (X 12 ≤t 2 ) ,t1 < t2 , t2 < t1 Sonuç 3.1: T 'nin dağılım fonksiyonu 0 < t1 < t2 < ¥ ì FEC ( t1 , a1 + a3 ) FEC (t2 , a 2 ) , ï FT ( t ) = í FEC ( t1 , a1 ) FEC (t2 , a 2 + a3 ) , 0 < t2 < t1 < ¥ , ï F (t,a + a + a ) , 0 < t1 = t2 = t < ¥ 1 2 3 EC î (3.5) olup eşitlik (3.2) kullanılarak ( ( {( {( )}) ( { ( )}) )}) ( { ( )}) { ( )}) a1 +a 3 b ì t1b e 1 exp 1 1 - exp l 1 - et2 l ï ï a1 b b ï FT ( t ) = í 1 - exp l 1 - et1 1 - exp l 1 - et2 ï a1+a 2 +a3 ï tb e 1 exp 1 l ï î ( şeklinde de yazılabilir. a2 a 2 +a 3 , 0 < t1 < t2 < ¥ , 0 < t2 < t1 < ¥ , 0 < t1 = t2 = t < ¥ (3.6) 25 Sonuç 3.2 : T 'nin yaşam fonksiyonu teorem 2.11 gereği S ( t1 , t2 ) = 1 - FT1 ( t1 ) - FT2 ( t2 ) + F ( t1 , t2 ) (3.7) eşitliği kullanılarak açık bir biçimde ifade edilebilir. Sonuç 3.3 : T 'nin olasılık yoğunluk fonksiyonu 0 < t1 < t2 < ¥ ì f1 ( t1 , t2 ) , ï f T ( t ) = í f 2 ( t1 , t2 ) , 0 < t2 < t1 < ¥ , ï , 0 < t1 = t2 = t < ¥ î f0 (t ) (3.8) burada f1 ( t1 , t2 ) = f EC ( t1 ;a1 + a3 , l , b ) f EC ( t2 ;a 2 , l , b ) f 2 ( t1 , t2 ) = f EC ( t1 ;a1 , l , b ) f EC ( t2 ; a 2 + a 3 , l , b ) f0 (t ) = (3.9) a3 f EC ( t; a1 + a 2 + a 3 , l , b ) a1 + a 2 + a 3 olup burada ) ) (( ) ) ´ (1 - exp {l (1 - e )}) (1 - exp{l (1 - e )}) f ( t , t ) = a (a + a ) l b ( t t ) exp ( l (1 - e ) + t ) exp ( l (1 - e ) + t ) ´ (1 - exp {l (1 - e )}) (1 - exp {l (1 - e )}) f ( t ) = a lb t exp ( l (1 - e ) + t ) (1 - exp {l (1 - e )}) f1 ( t1 , t2 ) = a 2 (a1 + a3 ) l 2 b 2 ( t1t2 ) 2 1 2 1 2 a1 -1 tb b -1 b b t2b b 1 t2b b a 2 -1 t 2b t1b 1 2 t1b 0 b -1 2 3 (( exp l 1 - et1 + t1b exp l 1 - et2 + t2b a1 +a 3 -1 t1b 2 b -1 b 2 (3.10) a 2 +a3 -1 tb a1 +a 2 +a3 -1 3 dır. Teorem 3.2 T ~ MOBEC (a1 , a 2 , a12 , l , b ) ise max (T1,T2 ) ~ EC (a1 + a 2 + a12 , l , b ) Teorem 3.3 (T1 , T2 ) ~ EC (a1 , a 2 , a 3 , l , b ) ise aşağıdaki eşitlik yazılabilir:(Kundu ve Gupta, 2009) FT1 ,T2 ( t1 , t2 ) = a3 a1 + a 2 Fa ( t1 , t2 ) + Fs ( t1 , t2 ) , a1 + a 2 + a 3 a1 + a 2 + a 3 burada z = min {t1 , t2 } , (3.11) 26 ( {( Fs ( t1 , t2 ) = 1 - exp l 1 - e z b )}) a1 +a 2 +a3 (3.12) ve Fa ( t1 , t2 ) = ( ( {( ´ 1 - exp l 1 - e dır. { ( )}) ( { ( )}) )}) - a a+ a (1 - exp {l (1 - e )}) b a1 + a 2 + a 3 1 - exp l 1 - et1 a1 + a 2 zb a3 a1 zb 3 1 b 1 - exp l 1 - et2 2 a2 a1 +a 2 +a 3 (3.13) 27 4. PARAMETRE TAHMİNİ æ T11 ö æ T21 ö æ Tn1 ö ç ÷ , ç ÷ ,K , ç ÷ , è T12 ø è T22 ø è Tn 2 ø MOBEC (a1 , a 2 ,a12 , l , b ) dağılımından bağımsız n birimlik bir örneklem olsun. Bu örnekleme dayalı log-olabilirlik fonksiyonu l (a1 , a 2 ,a 3 , l , b ) = å ln f1 ( ti1, ti 2 ) + å ln f 2 ( ti1,ti 2 ) + å ln f 0 ( ti ) iÎI1 iÎI 2 (4.1) iÎI 0 ve buradan l (a1 , a 2 , a 3 , l , b ) = ( 2n1 + 2n2 + n0 ) {log ( l ) + log ( b )} + n1 log (a 2 ) + n1 log (a1 + a 3 ) å + ( b - 1) iÎI1 È I 2 ( {( log ( t1it2 i ) + (a1 + a3 - 1) å log 1 - exp l 1 - et1i iÎl1 ( b )}) { ( )}) + n log (a ) + n log (a + a ) + (a - 1) å log (1 - exp {l (1 - e )} ) + (a + a - 1) å log (1 - exp {l (1 - e )}) + n log (a ) + (a + a + a - 1) å log (1 - exp {l (1 - e )} ) + (a 2 - 1) å 1 - exp l 1 - et2 i iÎl1 b 2 1 2 2 3 t1bi 1 iÎl2 2 3 1 2 t2bi 0 iÎl2 3 tib 3 iÎl0 æ b b b + ( b - 1) å log ( ti ) + l ç å 1 - et1i + å 1 - et2 i + å 1 - eti ç iÎI È I iÎI 0 iÎI1 È I 2 iÎI 0 è 1 2 + å t1bi + å t2bi + åtib ( iÎI1 È I 2 iÎI1 È I 2 iÎl0 ) ( ) ( ö ) ÷÷ø (4.2) şeklinde yazılabilir, burada I1 = {i; ti1 < ti 2 } I 2 = {i; ti1 > ti 2 } I 0 = {i; ti1 = ti 2 = ti } I = I 0 È I1 È I 2 = {1, 2,K , n} ve n0 = I 0 , n1 = I1 , n2 = I 2 'dır. Bilinmeyen parametrelerin MLE'leri (4.2) maksimize edilerek elde edilebilir. Bu beş boyutlu bir optimizasyon problemidir. MLE'leri hesaplamak için aynı anda 5 tane non-lineer denklem çözümüne ihtiyaç olacaktır. 28 5-boyutlu optimizasyon sürecinin çözümüne göre 2-boyutlu optimizasyon sürecinin çözümünde daha fazla yakınsama olacağından (T1 ,T2 ) rasgele vektörü ( l1 , l2 ) rasgele vektörüyle aşağıdaki gibi ilişkilendirilir: ì1, X 1 > X 12 ise L1 = í î3, X 1 < X 12 ise ve ì2, X 2 > X 12 ise L2 = í î3, X 2 < X 12 ise T1 = T2 olduğunda l1 = l2 = 3 olur. ∋T1 ,T2 ( Î I1 ise (L1 , L 2 ) ’nin muhtemel değerleri (3,2) ya da (2,1)’dir. Eğer ∋T1 ,T2 ( Î I 2 ise (L1 , L 2 ) ’nin muhtemel değerleri (1,3) ya da (1,2)’dir. EM algoritması, I 0 için tüm gözlem değerlerine uygulanacaktır. Eğer gözlemler I1 ve I 2 ’den elde edilmişse EM algoritması kayıp gözlemler göz önünde ∋T1 ,T2 ( Î I1 ise ∋t1 ,t2 ( ’nin bir kısmı sırasıyla bulundurularak uygulanacaktır. ∋t1 ,t2 ,u1 ∋θ (( ve ∋t1 ,t2 ,u2 ∋θ (( formunda ifade edilir. Buradaki q , q = (a1 , a 2 , a 3 , b , g ) şeklinde bir parametre vektörüdür. u1 (q ) ve u 2 (q ) , T1 ; T2 durumunda şartlı olasılıkları gösterir ve bu olasılıklar aşağıdaki gibidir: u1 (q ) = P ( L1 = 3 T1 < T2 ) = a3 a1 , u2 (q ) = P ( L1 = 1 T1 < T2 ) = a1 + a 3 a1 + a 3 Benzer şekilde, ∋T1 ,T2 ( Î I 2 ise ∋t1 ,t2 ( ’nin bir kısmı sırasıyla ∋t1 ,t2 ,w1 ∋θ (( ve ∋t1 ,t2 ,w2 ∋θ (( formunda ifade edilir. Buradaki q , q = (a1 , a 2 , a 3 , b , g ) şeklinde bir parametre vektörüdür. w1 (q ) ve w2 (q ) , T1 = T2 durumunda şartlı olasılıkları gösterir ve bu olasılıklar aşağıdaki gibidir: w1 (q ) = P ( L 2 = 3 T1 > T2 ) = a3 a2 , w2 (q ) = P ( L 2 = 1 T1 > T2 ) = a2 + a3 a2 + a3 u1 (q ) , u 2 (q ) , w1 (q ) , w2 (q ) sırasıyla u1 , u 2 , w1 , w2 şeklinde kısaltılmış olarak gösterilecektir. 29 EM algoritmasının uygulanabilmesi için “pseudo data” log-olabilirlik fonksiyonu aşağıdaki gibi yazılır: I 0 < ζt1i < t2i < ti için| T1 < max ζ X1 , X12 | < t1i < ti T2 < max ζ X 2 , X 12 | < t2i < ti X 12 < ti Þ f ∋ti ,θ3 ( ve buradan X 1 ; ti Þ F ∋ti ,θ1 ( olmak üzere X 2 ; ti Þ F ∋ti ,θ2 ( f 0 < f ∋ti ,θ3 ( F ∋ti ,θ3 ( F ∋ti ,θ2 ( (4.3) I1 < ζt1i ; t2 i için| T1 < max ζ X 1 , X 12 | < t1i T2 < max ζ X 2 , X 12 | < t2 i olmak üzere X 1 < t1i Þ f ∋t1i ,θ1 ( X 12 < t1i Þ f ∋t1i ,θ3 ( X 12 ; t1i Þ F ∋t1i ,θ3 ( X 1 ; t1i Þ F ∋t1i ,θ1 ( ve buradan X 2 < t2i Þ f ∋t2 i ,θ2 ( veya X 2 < t2i Þ f ∋t2 i ,θ2 ( f1 < u2 ∋θ ( .ζ f ∋t1i ,θ1 ( . f ∋t2 i ,θ2 ( .F ∋t1i ,θ3 (| ∗ u1 ∋θ ( .ζ f ∋t1i ,θ3 ( . f ∋t2 i ,θ2 ( .F ∋t1i ,θ1 (| (4.4) I 2 < ζt1i = t2 i için| T1 < max ζ X 1 , X 12 | < t1i T2 < max ζ X 2 , X 12 | < t2 i olmak üzere X 1 < t1i Þ f ∋t1i ,θ1 ( X 1 < t1i Þ f ∋t1i ,θ1 ( X 12 ; t2 i Þ F ∋t2 i ,θ3 ( X 12 ; t2 i Þ F ∋t2 i ,θ2 ( ve buradan X 2 < t2 i Þ f ∋t2i ,θ2 ( veya X 3 < t2i Þ f ∋t2i ,θ3 ( f 2 < w1 ∋θ ( .ζ f ∋t1i ,θ1 ( . f ∋t2 i ,θ3 ( .F ∋t2 i ,θ2 (| ∗ w2 ∋θ ( .ζ f ∋t1i ,θ1 ( . f ∋t2i ,θ2 ( .F ∋t2 i ,θ3 (| (4.5) 'E'-adımlı EM algoritmasını gerçekleştirebilmek için qi = (a i , b , g ) ; i = 1, 2,3 notasyonu kullanılacaktır. f ( .;q i ) ve F (.;qi ) sırasıyla MOEC (a i , b , g ) ; i = 1, 2, 3 için OYF ve DF' nu göstermektedir. 'pseudo data' ('E'-adım) log-olabilirlik fonksiyonu aşağıdaki gibi yazılır: 30 I pseudo (q ) = å ln f ( ti ;q 3 ) + å ln F ( ti ;q1 ) + å ln F ( ti ;q 2 ) + iÎI 0 iÎI0 iÎI 0 æ ö u1 ç å ln f ( ti1 ;q3 ) + å ln f ( ti 2 ;q 2 ) + å ln F ( ti1;q1 ) ÷ + iÎI1 iÎI1 è iÎI1 ø æ ö u2 ç å ln f ( ti1;q1 ) + å ln f ( ti 2 ;q 2 ) + å ln F ( ti1;q3 ) ÷ + iÎI1 iÎI1 è iÎI1 ø æ ö w1 ç å ln f ( ti1 ;q1 ) + å ln f ( ti 2 ;q 3 ) + å ln F ( ti 2 ;q 2 ) ÷ + iÎI 2 iÎI 2 è iÎI2 ø æ ö w2 ç å ln f ( ti1 ;q1 ) + å ln f ( ti 2 ;q 2 ) + å ln F ( ti 2 ;q 3 ) ÷ iÎI 2 iÎI 2 è iÎI 2 ø = I1 (q1 ) + I 2 (q 2 ) + I 3 (q3 ) {( Burada a ( x ; b , g ) = ln é1 - exp l 1 - e t ëê b (4.6) )}ùûú olmak üzere; I1 (q1 ) = å ln F ( ti ;q1 ) + u1 å ln F ( ti1 ;q1 ) + u2 å ln f ( ti1;q1 ) + å ln f ( ti ;q1 ) iÎI0 iÎI1 iÎI1 iÎI 2 I 2 (q 2 ) = å ln F ( ti ;q 2 ) + w1 å ln F ( ti 2 ;q 2 ) + w2 å ln f ( ti 2 ;q 2 ) + å ln f ( ti 2 ;q 2 ) iÎI 0 iÎI 2 iÎI 2 (4.7) iÎI1 I 3 (q3 ) = å ln f ( ti ;q3 ) + u1 å ln f ( ti1 ;q 3 ) + u2 å ln F ( ti1;q3 ) + w1 å ln f ( ti 2 ;q 3 ) + w2 å ln F ( ti 2 ;q3 ) iÎI0 iÎI1 iÎI1 iÎI 2 iÎI 2 Şimdi ‘M’-adımda bilinmeyen parametrelerle ilgili olarak (4.6)’nın maksimize edilmesi gerekir. a1 , a 2 , a 3 parametreleri I1 (q1 ), I 2 (q 2 ), I 3 (q 3 ) maksimize edilerek tahmin edilir ve tahmin değerleri I pseudo (q ) denkleminde yerine yazılarak b ve g için model kurulmuş olur ve aşağıdaki gibi gösterilir: a%1 ( b , g ) = - u2 n1 + n2 å a ( ti ; b , g ) + å a ( ti1 ; b , g ) + å a ( ti1; b , g ) iÎI 0 a% 2 ( b , g ) = - iÎI 2 w2 n2 + n1 å a ( ti ; b , g ) + å a ( t i 2 ; b , g ) + å a ( t i 2 ; b , g ) iÎI 0 a% 3 ( b , g ) = - iÎI1 iÎI1 iÎI 2 n0 + u1n1 + w1n2 å a ( ti ; b , g ) + å a ( ti1; b , g ) + å a ( ti 2 ; b , g ) iÎI 0 iÎI1 iÎI 2 Son olarak q ile ilgili olarak I pseudo (q ) ’nın maksimizasyonu, pseudo profil (4.8) log-olabilirlik fonksiyonu b ve g 'nın I pseudo (a~1 (b , g ), a~2 (b , g ), a~3 (b , g ), b , g ) 31 ~ maksizimize edilerek elde edilmesiyle gerçekleştirilmiş olur. b ve g~ pseudo profil log~ olabilirlik fonksiyonuyla maksimize edilirse, a~1 (b , g ), a~2 (b , g ), a~3 (b , g ), b , g~ parametre tahminleri EM algoritmasında sonraki iterasyonda kullanılmaya başlanır. EM algoritması tarafından bilinmeyen parametrelerin MLE’lerinin hesaplanmasında kullanılan algoritma aşağıda verilmiştir. EM Algoritması: ( Adım 2; u (q ( ) ) , u (q ( ) ) , w (q ( ) ) ve w (q ( ) ) hesaplanır. Adım 3; u (q ( ) ) , u (q ( ) ) , w (q ( ) ) ve w (q ( ) ) için b ve g Adım 1; q başlangıç değerleri alır; q ( 0 ) = a1( 0) , a 2( 0 ) , a 3( 0 ) , b ( 0) , g ( 0) 0 0 1 0 2 0 0 1 2 0 1 0 2 ) 0 1 2 ilgili olarak pseudo log-olabilirlik fonksiyonu I pseudo (a%1 ( b , g ) ,a% 2 ( b , g ) , a% 3 ( b , g ) , b , g ) maximize edilerek b (1) ve g (1) elde edilir. ( ) ( ) ( ) Adım 4; a1(1) = a%1 b (1) , g (1) , a 2(1) = a% 2 b (1) , g (1) ve a 3(1) = a%3 b (1) , g (1) bulunur ve ( ) bu sayede q (1) = a1(1) , a 2(1) , a 3(1) , b (1) , g (1) elde edilir. Adım 5; q ( 0 ) 'ın yerine q (1) konularak 1.adıma dönülür ve yakınsama meydana gelene kadar süreç bu şekilde devam eder. 32 5. UYGULAMA 5.1. Gerçek Örnek Üzerinde İstatistiksel Sonuç Çıkarımı Veri seti Meintanis (2007)’den elde edilmiştir. Futbol verileri ev sahibi takımın attığı en az bir gol ve herhangi bir takımın penaltı atışı, faul atışı veya diğer serbest vuruşlardan attığı gollerin dakikasını temsil eder. T1 ; herhangi bir takımın ilk duran toptan attığı golün dakikasını, T2 ; ev sahibi takımın attığı ilk golün dakikasını göstermektedir. Bu durum T1 ; T2 ,T1 = T2 ,T1 < T2 gibi tüm olasılıklara açıktır. MOBEC modeli kullanılarak veriler analiz edilecektir. Tablo 1. UEFA Şampiyonlar Ligi Verisi 2005-2006 T1 T2 2004-2005 T1 T2 Lyon-Real Madrid 26 20 Internazional-Bremen 34 34 Milan-Fenerbahçe 63 18 Real Madrid-Roma 53 39 Chelsea-Anderlect 19 19 Man. United-Fenerbahçe 54 7 Club Brugge-Juventus 66 85 Bayern-Ajax 51 28 Fenerbahçe-PSV 40 40 Moscow-PSG 76 64 Internazionale-Rangers 49 49 Barcelona-Shakhtar 64 15 Panathinaikos-Bremen 8 8 Leverkusen-Roma 26 48 Ajax-Arsenal 69 71 Arsenal-Panathinaikos 16 16 Man. united-Benfica 39 39 Dynamo Kyiv-Real Madrid 44 13 Real Madrid-Rosenborg 82 48 Man. United-Sparta 25 14 Villarreal-Benfica 72 72 Bayern-M.telaviv 55 11 Juventus-Bayern 66 62 Bremen-Internazional 49 49 Club Brugge-Rapid 25 9 Anderlect-valencia 24 24 Olimpiacos-Lyon 41 3 Panathinakios-PSV 44 30 Internazionale-Porto 16 75 Arsenal-Rosenborg 42 3 Schalke-PSV 18 18 Liverpool-Olympiacos 27 47 Barcelona-Bremen 22 14 M. Tel Aviv-Juventus 28 28 Milan-Schalke 42 42 Bremen-Panathinaikos 2 2 Rapid-Juventus 36 52 33 Tablo 2. Uyum İyiliği Testi Model T1 T2 Log (L ) GLFR -162.676 GC -162.0294 AIC BIC KS Log (L ) p değe ri AIC BIC KS 336.3091 344.3637 0.0962 p değe ri -162.938 334.0587 342.1133 0.1030 0.8270 -163.1545 0.8836 T1 değişkenine ait ölçümlere dayalı GC dağılımının parametre tahminleri aˆ = 1.2069 , lˆ = 0.0078 , bˆ = 0.4165 , T2 değişkenine ait ölçümlere dayalı GC dağılımının aˆ= 1.7262 lˆ= 0.0551 bˆ= 0.3308 parametre tahminleri olarak bulunmuştur. Tablo 2’de GLFR ve GC dağılımlarının T1 ve T2 rasgele değişkenlerinin marjinal dağılımlarını modelleme de en uygun olanın seçimi için kullanılan bazı kriterler, Kolmogorov-Smirnov test istatistiği ve p değerleri verilmiştir. Tablo 2’ye göre, GC dağılımı Tablo 1’ deki veriyi modellemek için kullanılabilir. Tablo 3. Hipotez Testi Null T1 MLEs H0 lˆ = 0.0047 bˆ = 0.4340 Log (L ) L -162.071 0.9591 -2 log (L ) p değe ri 0.0835 0.6191 T2 MLEs lˆ = 0.0184 bˆ = 0.3794 Log (L ) L -163.472 0.7283 -2 log (L ) p değe ri 0.6342 0.6948 Tablo 4. En Çok Olabilirlik Tahminleri, Olabilirlik, AIC ve BIC değerleri Model En Çok Olabilirlik Tahminleri L AIC BIC MO lˆ1 = 0.0012 , lˆ2 = 0.014 , lˆ3 = 0.022 -339.006 684.012 688.845 BVGE aˆ1 = 1.351 , aˆ 2 = 0.465 , aˆ 3 = 1.153 , bˆ = 0.039 -296.935 601.870 611.925 -293.379 596.757 604.813 -292.7794 595.5588 603.6134 BGLFR MOBEC aˆ1 = 0.492 , aˆ 2 = 0.166 , aˆ 3 = 0.411 , bˆ = 2.013 ´ 10 -4 , gˆ = 8.051´ 10 -4 ˆ 0.3996 ˆ 0.0104 b= aˆ1= 0.6817 aˆ 2= 0.2441 aˆ12= 0.5980 l= 34 Şekil 1. EM iterasyonlarındaki parametrelerin yakınsamaları (Parametre tahminleri için grafikte log ölçek kullanılmıştır.) EM algoritmasıyla elde edilen tahminler (Tüm tahminler için ardışık tahminler arası fark 10 -6 dan küçük olduğunda yakınsama sağlanmıştır.), Nelder-Maid yöntemiyle(Termination tolerance, 10 -5 olarak alınmıştır) elde edilen tahminlere çok yakın olduğu gözükmektedir (Noktadan sonra ilk dört basamak aynı). Ayrıca EM algoritması içinde kullanılan Nelder-Maid yöntemi için Termination tolerance, 10-10 olarak alınmıştır. EM algoritması 248 iterasyon sonucunda yakınsama sağlamış olup EM iterasyonlarındaki parametrelerin yakınsamaları Şekil 1’de verilmiştir. Gözlenen Fisher Bilgi Matrisi (Observed Fisher Information Matrix) æ 40.24436 ç ç 2.54 ´ 10- 7 Iˆ = ç 3.664008 ç ç - 2195.46 ç è - 313.946 2.54 ´ 10-7 124.6846 23.97621 - 2497.9 - 282.538 3.664008 - 2195.46 - 313.946 ö ÷ 23.97621 - 2497.9 - 282.538 ÷ ÷ 66.79531 - 2660.73 - 292.269 ÷ - 2660.73 541805.6 113399.3 ÷ ÷ - 292.269 113399.3 26944.06 ø şeklindedir. Nelder-Maid yöntemiyle elde edilen En Çok Olabilirlik Tahmin Edicilerin asimptotik varyans-kovaryans matrisi 35 æ 0.163751 ç ç 0.045489 ˆI -1 = S = ç 0.109644 ç ç 0.005571 ç è - 0.01987 0.045489 0.023375 0.033184 0.001826 - 0.00655 0.109644 0.033184 0.105442 0.004495 - 0.01615 0.005571 0.001826 0.004495 0.000228 - 0.00083 - 0.01987 ö ÷ - 0.00655 ÷ - 0.01615 ÷ ÷ - 0.00083 ÷ ÷ 0.003034 ø seklindedir. a1 , a 2 , a12 , l , b parametrelerinin %95 lik asimptotik güven aralıkları, sırasıyla, (- 0.1114,1.4748) , (- 0.0556, 0.5437 ) , (- 0.0385,1.2344) , (- 0.0192,0.0399) ve (0.2917,0.5076) şeklindedir. Burada bütün parametrelerin sıfırdan büyük değerler almak zorunda olduğu göz önüne alındığında %95 'lik güven aralıkları (0,1.4748) , (0, 0.5437) , (0,1.2344) , (0,0.0399) ve (0.2917,0.5076) biçiminde de yazılabilir. Sürü Algoritması kullanılarak da parametre tahminleri 1000 iterasyon sonucunda aˆ1 = 0.6814 aˆ 2 = 0.2442 aˆ12 = 0.6001 lˆ = 0.0104 bˆ = 0.3994 olarak bulunmuştur. Bu sonuçla, EM algoritması, Nelder-Maid ve Sürü algoritmasının hemen hemen aynı sonuçları verdiği görülmektedir. Sürü algoritması için iterasyon grafiği Şekil 2. de verilmiştir. Şekil 2. Sürü Algoritması iterasyonlarındaki parametrelerin yakınsamaları 36 5.2. MOBEC Dağılımından Üretilen Veri İçin İstatistiksel Sonuç Çıkarımı Tablo 5. MOBEC ( a 1 = 0.5 a 2 = 1 a 12 = 2 l = 0.5 b = 3 ) dağılımından simule edilen data T1 T2 T1 T2 1.3005 0.9741 1.2603 0.9549 1.2305 1.2397 1.2286 0.8664 1.2458 1.2152 0.8463 0.6003 1.0798 1.1753 1.0502 1.3005 1.3074 1.2603 0.9333 1.2305 1.2397 1.2286 0.8664 1.1987 1.2152 0.9898 0.9271 1.0959 0.8997 0.8870 0.7523 1.3004 0.9708 0.9319 1.2272 1.0916 0.9566 1.1098 0.9569 1.1787 0.9456 1.1241 1.0411 1.0883 0.8710 0.7970 1.3004 1.0034 0.9319 1.2272 1.0916 0.9566 1.1098 0.9569 1.1919 1.0616 1.1241 1.2714 0.9080 0.8710 Başlangıç değeri : [1,3,0.5,0.4,0.5] olduğunda Nelder Maid ile parametre tahminleri aˆ1 = 0.8098 , aˆ 2 = -2.1255 , aˆ12 = 0.6122 , lˆ = 0.7024 , bˆ = 1.1378 olarak bulunmuştur. Görüldüğü gibi parametre tahminlerinden biri negatif çıkmıştır. Her bir parametrenin sıfırdan büyük değer alabileceği düşünüldüğünde tahminler yanlıştır. MOBEC( α1 = 0.5 , α2 = 1 , α12 = 2 , λ = 0.5 , β = 3 ) dağılımından sayı üretildiğinden tahminlerin tutarsız olduğu da gözükmektedir. Başlangıç değeri : [0.5,1,2,0.5,0.3] olduğunda Nelder Maid ile elde edilen α̂1 = 0.5163 , α̂ 2 = 0.8784 , α̂12 = 1.6811 , λ̂ = 0.5267 , β̂ = 2.8624 ML tahminleri olarak bulunmuştur. Bu da EM algoritması ile elde edilen tahminlerle aynı olduğundan tahminlerin doğru olduğu sonucu çıkarılabilir. Tahminler de datanın üretildiği dağılımın parametrelerine yakın olduğu görülmektedir. Görüldüğü gibi Nelder-Maid yöntemi başlangıç değerlerinin seçimine göre duyarlıdır. Bu nedenle tahminlerde EM algoritmasının kullanılması daha iyi olacağı açıktır. Tablo 6. En Çok Olabilirlik Tahminleri, Olabilirlik, AIC ve BIC değerleri Model En Çok Olabilirlik Tahminleri MOBEC α̂1 = 0.5163 , α̂ 2 = 0.8784 , α̂12 = 1.6811 , λ̂ = 0.5267 , β̂ = 2.8624 L AIC BIC 0.4563 9.0872 16.0932 37 Şekil 3. EM iterasyonlarındaki parametrelerin yakınsamaları EM algoritmasıyla elde edilen tahminler (Tüm tahminler için ardışık tahminler arası fark 10 -6 dan küçük olduğunda yakınsama sağlanmıştır.), Nelder-Maid yöntemiyle(Termination tolerance, 10 -5 olarak alınmıştır) elde edilen tahminlere çok yakın olduğu gözükmektedir (Noktadan sonra ilk dört basamak aynı). Ayrıca EM algoritması içinde kullanılan Nelder-Maid yöntemi için Termination tolerance, 10-10 olarak alınmıştır. EM algoritması 254 iterasyon sonucunda yakınsama sağlamış olup EM iterasyonlarındaki parametrelerin yakınsamaları Şekil 3’de verilmiştir. Gözlenen Fisher Bilgi Matrisi (Observed Fisher Information Matrix) 0.0000 1.8638 æ 20.6195 ç 12.4273 0.7632 ç 0.0000 Î = ç 1.8638 0.7632 8.2885 ç ç - 27.0742 - 25.8171 - 29.0251 ç 0.2767 - 0.1055 0.8360 è 0.2767 ö ÷ - 25.8171 - 0.1055 ÷ - 29.0251 0.8360 ÷ ÷ 294.6148 46.4236 ÷ 46.4236 20.0246 ÷ø - 27.0742 şeklindedir. Nelder-Maid yöntemiyle elde edilen En Çok Olabilirlik Tahmin Edicilerin asimptotik varyans-kovaryans matrisi æ 0.2018 0.2709 0.4771 0.1460 - 0.3597 ö ÷ ç ç 0.2709 0.5601 0.8582 0.2589 - 0.6367 ÷ Iˆ -1 = S = ç 0.4771 0.8582 1.6892 0.4678 - 1.1571 ÷ ÷ ç ç 0.1460 0.2589 0.4678 0.1398 - 0.3444 ÷ ÷ ç è - 0.3597 - 0.6367 - 1.1571 - 0.3444 0.8982 ø 38 seklindedir. a1 , a 2 , a12 , l , b parametrelerinin %95 lik asimptotik güven aralıkları, sırasıyla, şeklindedir. (0,1.3968) , (0, 0.3452) , (0,1.2284) , (0,1.2596) ve (1.0047,4.7199) 39 6. SONUÇ VE ÖNERİLER İki değişkenli Marshal-Olkin dağılımından esinlenerek iki değişkenli Genelleştirilmiş Chen dağılımı elde edilmiş ve bazı dağılımsal özellikleri bulunmuştur. Elde edilen dağılımın parametrelerinin ML tahminleri için EM algortitması geliştirilmiştir. Reel bir örnek üzerinde de önerilen dağılımın literatürde bulunan dağılımlara modellemede alternatif olacağı gösterilmiştir. Genelleştirilmiş Chen dağılımı dışındaki genelleştirilmiş (üstelleştirimiş) dağılımlar kullanılarak Marshall-Olkin yöntemiyle farklı iki değişkenli dağılımlar elde edilebilir. Hatta bu tez çalışmasındaki sonuçlar üstelleştirilmiş dağılımlar için genelleştirilebilir. 40 7. KAYNAKLAR Aarset, M.V., 1987, "How to identify a bathtub failure rate?", IEEE Transactions on Reliability, vol. 36, 106-108. Akaike, H., 1969, "Fitting autoregressive model for regression", Annals of the Institute of Statistical Mathematics, vol. 21, 243 - 247. Bain, L. J., 1974, "Analysis of the linear failure rate distribution", Technometrics, vol. 15, 875 - 887. Barlow, R.E. and Proschan, F.,1981, Statistical Theory of Reliability and Life Testing, Probability Models, Silver Spring, Maryland. Blomqvist, N., 1950, “On a measure of dependence between two random variables", Annals of Mathematical Statistics, vol. 21, 593 - 600. Chen Z., 2000, “A new two-parameter lifetime distribution with bathtub shape or increasing failure rate function”, Stat. Prob. Lett. 49 155–161. Domma, F., 2009, “Some properties of the bivariate Burr type III distribution", Statisics, to appear, DOI:10.1080/02331880902986547. Franco, M. and Vivo, J-M, 2009, “A multivariate extension of Sarhan and Balakrishnan’s bivariate distribution and its aging and dependence properties", Journal of Multivariate Analysis, to appear DOI:10.1016/j/jmva.2009.08.008. Joe, H., 1997 Multivariate model and dependence concept, Chapman and Hall, London. Kim, G., Silvapulle, M.J. and Silvapulle, P., 2006, “Comparison of semiparametric and parametric methods for estimating copulas", Computational Statistics and Data Analysis, vol. 51, 2836 – 2850. Kundu, D. and Gupta, R.D., 2009, “Bivariate generalized exponential distribution", Journal of Multivariate Analysis, vol 100, 581 - 593. Lehmann, E.L., 1966, “Some concepts of dependence", Ann. Math. Statist., 37, 1137 1153. Lin, C.T., Wu, S.J.S., Balakrishnan, N., 2003, “Parameter estimation for the linear hazard rate distribution based on records and inter-record times", Communications in Statistics - Theory and Methods, vol. 32, 729 – 748. Lin, C.T., Wu, S.J.S., Balakrishnan, N., 2006, “Monte Carlo methods for Bayesian inference on the linear hazard rate distribution", Communications in Statistics – Theory and Methods, vol. 35, 575 - 590. Marshall, A.W. and Olkin, I., 1967, "A multivariate exponential model", Journal of the American Statistical Association, vol. 62, 30 - 44. 41 Meintanis, S.G., 2007, "Test of fit for Marshall-Olkin distributions with applications", Journal of Statistical Planning and Inference, vol. 137, 3954 - 3963. Mudholkar, G.S., Srivastava, D.K. and Freimer, M., 1995, "The exponentiated Weibull family; a reanalysis of the bus motor failure data", Technometrics, 37, 436 - 445. Nelsen, R.B., 1999, An introduction to copulas, 2nd edition, Springer, New York. Öztürk, F. (1993). Matematiksel İstatistik, AÜFF Basımevi. Pandey, A., Singh, A. and Zimmer, W.J. (1993), \Bayes estimation of the linear hazard model", IEEE Transactions on Reliability, vol. 42, 636 - 640. Rastogi M.K., Tripathi Y.M, Wu S.J., 2012, Estimating the parameters of a bathtubshaped distribution under progressive type-II censoring, Journal of Applied Statistics, 39:11, 2389-2411. Rastogi M.K., Tripathi Y.M, 2013, “Estimation using hybrid censored data from a twoparameter distribution with bathtub shape” Computational Statistics & Data Analysis 67, 268–281. Rohatgi , V. K., Ehsanes Saleh, A. K. Md. 2001. An introduction to probability and statistics, Wiley. Sarhan, A. and Balakrishnan, N., 2007, "A new class of bivariate distributions and its mixture", Journal of Multivariate Analysis, vol. 98, 1508 - 1527. Sarhan, A. and Kundu, D., 2009, "Generalized linear failure rate distribution", Communications in Statistics - Theory and Methods, vol. 38, 642 - 660. Sarhan, A.M., Hamilton, D.C., Smith, B., 2012, Parameter estimation for a twoparameter bathtub-shaped lifetime distribution. Applied Mathematical Modelling 36, 5380–5392. Sarhan A.M., Apaloo J., 2013, Exponentiated modified Weibull extension distribution, Reliability Engineering and System Safety 112(4):137–44. Schwarz, G., 1978, "Estimating the dimension of a model", Annals of Statistics, vol. 6, 461 - 464. Tamer , Seçkin, Karakuzu , Cihan. Parçacık Sürüsü Optimizasyon Algoritması ve Benzetim ÖrnekleriWeb: http://Www.Emo.Org.Tr/Ekler/E5d75028d92047a_Ek. Pdf. Sen, A. and Bhattacharyya, G.K., 1995, "Inference procedures for linear failure rate model", Journal of Statistical Planning and Inference, vol. 46, 59 - 76. Wu S.J., 2008, Estimation of the two-parameter bathtub-shaped lifetime distribution with progressive censoring, Journal of Applied Statistics 35,10, 1139-1150 42 Wu S.F., Wu C.C., Chou C.H., Lin H.M., 2011, Statistical inferences of a twoparameter distribution with the bathtub shape based on progressive censored sample, Journal of Statistical Computation and Simulation, 81, 3, 315-329. Wu, S.-J., Kuş, C., 2009. On estimation based on progressive first-failure-censored sampling. Computational Statistics and Data Analysis 53, 3659–3670. 43 EKLER Kullanılan Matlab Kodları EK-1. Sürü Algoritması için Matlab Kodu clear all; close all; clc D=5; %vektor_boyut; N=20; %population size (total function evaluations will be itmax*N) itmax=1000; c1=2; c2=2.5; wmax=0.9; wmin=0.1; %set to same value for constant w w=linspace(wmax,wmin,itmax); %linear variation of w ag_bas_min=0; % 0 ile 100 arasında başlangıç ağırlıklarının belirlenmesi ag_bas_max=10;% x= rand(N,D).*(ag_bas_max-ag_bas_min)+ ag_bas_min ; %Problem and velocity bounds ub=ones(1,D)*100; %/*lower bounds of the parameters. */ lb=ones(1,D)*0;%/*upper bound of the parameters.*/ vlb=ones(1,D)*-20; vub=ones(1,D)*20; % vmin=0; % vmax=5; Range = repmat((ub-lb),[N 1]); Lower = repmat(lb, [N 1]); % x = rand(N,D).* Range + Lower; q=Range/4; % vmax=2; vmin=0; v=q.*rand(N,D); %v=zeros(N,D); objfun='objfun'; ObjVal=feval(objfun,x);% maliyet fonkuna gönderilen de?erler %Find gbest and pbest (in this case coincides with x) [fgbest,igbest]=min(ObjVal); gbest=x(igbest,:); pbest=x; fpbest=ObjVal; %Iterate for it=1:itmax; %Update velocities and positions v(1:N,1:D)=w(it)*v(1:N,1:D)+c1*rand*(pbest(1:N,1:D)x(1:N,1:D))+c2*rand*(repmat(gbest,N,1)-x(1:N,1:D)); % % % % if v>vmax v=vmax; end 44 % % % if v<vmin v=vmin; end for ii=1:N ind=find(v(ii,:)<vlb); v(ii,ind)=vlb(ind); ind=find(v(ii,:)>vub); v(ii,ind)=vub(ind); end x(1:N,1:D)=x(1:N,1:D)+v(1:N,1:D); for ii=1:N ind=find(x(ii,:)<lb); x(ii,ind)=lb(ind); ind=find(x(ii,:)>ub); x(ii,ind)=ub(ind); end %Evaluate objectives ObjVal=feval(objfun,x); %Find gbest and pbest [minf,iminf]=min(ObjVal); if minf<= fgbest fgbest=minf; gbest=x(iminf,:); end inewpb=find(ObjVal<=fpbest); pbest(inewpb,:)=x(inewpb,:); fpbest(inewpb)=ObjVal(inewpb); fprintf('İter=%d ObjVal=%g\n',it,fgbest); gbest_grafik(it,:)=gbest(1,:); end %end loop on iterations 45 EK-2 Örnek 1 için Nelder-Maid, EM Algoritması ve Güven Aralıklarını veren Matlab Kodu clc;clear; rand('seed',sum(100*clock)); format long alpha1=0.5; alpha2=1; alpha0=2; lambda=0.5; beta=3; n=37; ds=1; eps=0.000001; alp1say=0; alp2say=0; alp0say=0; lambsay=0; betsay=0; %mat=[]; tt1=[0,0,0,0,0;0,0,0,0,0;0,0,0,0,0;0,0,0,0,0;0,0,0,0,0]; tt2=[0,0,0,0,0;0,0,0,0,0;0,0,0,0,0;0,0,0,0,0;0,0,0,0,0]; for j=1:ds j u1=log((lambda-log(-rand(n,1).^(1/alpha1)+1))/lambda).^(1/beta); u2=log((lambda-log(-rand(n,1).^(1/alpha2)+1))/lambda).^(1/beta); u12=log((lambda-log(-rand(n,1).^(1/alpha0)+1))/lambda).^(1/beta); t1=max(u1,u12); t2=max(u2,u12); t1=[26;63;19;66;40;49;8;69;39;82;72;66;25;41;16;18;22;42;36;34;53;54;5 1;76;64;26;16;44;25;55;49;24;44;42;27;28;2;]; t2=[20;18;19;85;40;49;8;71;39;48;72;62;9;3;75;18;14;42;52;34;39;7;28;6 4;15;48;16;13;14;11;49;24;30;3;47;28;2;]; t=[t1 t2]; n1=0;n2=0;n0=0; for i=1:n if (t1(i)==t2(i)) n0=n0+1; x0(n0,1)=t1(i); x0(n0,2)=t1(i); end if (t1(i)<t2(i)) n1=n1+1; x1(n1,1)=t1(i); x1(n1,2)=t2(i); end if (t1(i)>t2(i)) n2=n2+1; x2(n2,1)=t1(i); x2(n2,2)=t2(i); end end save x1; save x2; save x0; 46 %%Nelder&Mead pp0 = [1,3,0.5,0.4,0.5]; % Starting guess options = optimset('TolX',1e-5); [p,fval1] = fminsearch(@objfun,pp0,options); pa=p; [H,err] = hessian(@objfun,p); c1(j,1:5)=p; kov=inv(H); clear p; %%EM algorithm alp1=1; alp2=3; alp0=.5; lam=0.4; bet=0.5; u1=alp0/(alp1+alp0); u2=alp1/(alp1+alp0); w1=alp0/(alp2+alp0); w2=alp2/(alp2+alp0); a0=0; for i=1:n0 a0=a0+log(1-exp(lam*(1-exp(x0(i,1)^bet)))); end a1=0; a12=0; for i=1:n1 a1=a1+log(1-exp(lam*(1-exp(x1(i,1)^bet)))); a12=a12+log(1-exp(lam*(1-exp(x1(i,2)^bet)))); end a2=0; a22=0; for i=1:n2 a2=a2+log(1-exp(lam*(1-exp(x2(i,1)^bet)))); a22=a22+log(1-exp(lam*(1-exp(x2(i,2)^bet)))); end alp1=-(u2*n1+n2)/(a0+a1+a2); alp2=-(w2*n2+n1)/(a0+a12+a22); alp0=-(n0+u1*n1+w1*n2)/(a0+a1+a22); alp10=0; alp20=0; lam0=0; bet0=0; alp00=0; h=0; while (abs(alp1-alp10)>eps || abs(alp2-alp20) >eps || abs(lam-lam0) >eps || abs(bet-bet0) >eps || abs(alp0-alp00) >eps) alp10=alp1; alp20=alp2; lam0=lam; bet0=bet; alp00=alp0; u1=alp0/(alp1+alp0); u2=alp1/(alp1+alp0); w1=alp0/(alp2+alp0); w2=alp2/(alp2+alp0); obj2=@(est)-(sum(alp1*log(1-exp(est(1)*(1exp(x0(:,1).^est(2))))))+u1*sum(alp1*log(1-exp(est(1)*(1exp(x1(:,1).^est(2))))))+u2*sum(log(alp1*est(1)*est(2))+(est(2)1)*log(x1(:,1))+est(1)*(1-exp(x1(:,1).^est(2)))+x1(:,1).^est(2)+(alp11)*log(1-exp(est(1)*(1- 47 exp(x1(:,1).^est(2))))))+sum(log(alp1*est(1)*est(2))+(est(2)1)*log(x2(:,1))+est(1)*(1-exp(x2(:,1).^est(2)))+x2(:,1).^est(2)+(alp11)*log(1-exp(est(1)*(1-exp(x2(:,1).^est(2))))))+sum(alp2*log(1exp(est(1)*(1-exp(x0(:,1).^est(2))))))+w1*sum(alp2*log(1exp(est(1)*(1exp(x2(:,2).^est(2))))))+w2*sum(log(alp2*est(1)*est(2))+(est(2)1)*log(x2(:,2))+est(1)*(1-exp(x2(:,2).^est(2)))+x2(:,2).^est(2)+(alp21)*log(1-exp(est(1)*(1exp(x2(:,2).^est(2))))))+sum(log(alp2*est(1)*est(2))+(est(2)1)*log(x1(:,2))+est(1)*(1-exp(x1(:,2).^est(2)))+x1(:,2).^est(2)+(alp21)*log(1-exp(est(1)*(1exp(x1(:,2).^est(2))))))+sum(log(alp0*est(1)*est(2))+(est(2)1)*log(x0(:,1))+est(1)*(1-exp(x0(:,1).^est(2)))+x0(:,1).^est(2)+(alp01)*log(1-exp(est(1)*(1exp(x0(:,1).^est(2))))))+u1*sum(log(alp0*est(1)*est(2))+(est(2)1)*log(x1(:,1))+est(1)*(1-exp(x1(:,1).^est(2)))+x1(:,1).^est(2)+(alp01)*log(1-exp(est(1)*(1-exp(x1(:,1).^est(2))))))+u2*sum(alp0*log(1exp(est(1)*(1exp(x1(:,1).^est(2))))))+w1*sum(log(alp0*est(1)*est(2))+(est(2)1)*log(x2(:,2))+est(1)*(1-exp(x2(:,2).^est(2)))+x2(:,2).^est(2)+(alp01)*log(1-exp(est(1)*(1-exp(x2(:,2).^est(2))))))+w2*sum(alp0*log(1exp(est(1)*(1-exp(x2(:,2).^est(2))))))); options = optimset('TolX',1e-10); [est,fval2] = fminsearch(obj2,[lam, bet],options); lam=est(1); bet=est(2); a0=0; for i=1:n0 a0=a0+log(1-exp(lam*(1-exp(x0(i,1)^bet)))); end a1=0; a12=0; for i=1:n1 a1=a1+log(1-exp(lam*(1-exp(x1(i,1)^bet)))); a12=a12+log(1-exp(lam*(1-exp(x1(i,2)^bet)))); end a2=0; a22=0; for i=1:n2 a2=a2+log(1-exp(lam*(1-exp(x2(i,1)^bet)))); a22=a22+log(1-exp(lam*(1-exp(x2(i,2)^bet)))); end alp1=-(u2*n1+n2)/(a0+a1+a2); alp2=-(w2*n2+n1)/(a0+a12+a22); alp0=-(n0+u1*n1+w1*n2)/(a0+a1+a22); h=h+1; pariter(h,1:5)=[alp1,alp2,alp0,lam,bet]; end p2=[alp1 alp2 alp0 est]; c2(j,1:5)=p2; aic=2*5+2*fval1; bic=5*log(n)+2*fval1; aicbic(j,1:2)=[aic bic] obj4=@(est2)(sum(est2(1)*log(1-exp(est2(4)*(1exp(x0(:,1).^est2(5))))))+u1*sum(est2(1)*log(1-exp(est2(4)*(1exp(x1(:,1).^est2(5))))))+u2*sum(log(est2(1)*est2(4)*est2(5))+(est2(5) -1)*log(x1(:,1))+est2(4)*(1exp(x1(:,1).^est2(5)))+x1(:,1).^est2(5)+(est2(1)-1)*log(1exp(est2(4)*(1exp(x1(:,1).^est2(5))))))+sum(log(est2(1)*est2(4)*est2(5))+(est2(5)1)*log(x2(:,1))+est2(4)*(1exp(x2(:,1).^est2(5)))+x2(:,1).^est2(5)+(est2(1)-1)*log(1- 48 exp(est2(4)*(1-exp(x2(:,1).^est2(5))))))+sum(est2(2)*log(1exp(est2(4)*(1-exp(x0(:,1).^est2(5))))))+w1*sum(est2(2)*log(1exp(est2(4)*(1exp(x2(:,2).^est2(5))))))+w2*sum(log(est2(2)*est2(4)*est2(5))+(est2(5) -1)*log(x2(:,2))+est2(4)*(1exp(x2(:,2).^est2(5)))+x2(:,2).^est2(5)+(est2(2)-1)*log(1exp(est2(4)*(1exp(x2(:,2).^est2(5))))))+sum(log(est2(2)*est2(4)*est2(5))+(est2(5)1)*log(x1(:,2))+est2(4)*(1exp(x1(:,2).^est2(5)))+x1(:,2).^est2(5)+(est2(2)-1)*log(1exp(est2(4)*(1exp(x1(:,2).^est2(5))))))+sum(log(est2(3)*est2(4)*est2(5))+(est2(5)1)*log(x0(:,1))+est2(4)*(1exp(x0(:,1).^est2(5)))+x0(:,1).^est2(5)+(est2(3)-1)*log(1exp(est2(4)*(1exp(x0(:,1).^est2(5))))))+u1*sum(log(est2(3)*est2(4)*est2(5))+(est2(5) -1)*log(x1(:,1))+est2(4)*(1exp(x1(:,1).^est2(5)))+x1(:,1).^est2(5)+(est2(3)-1)*log(1exp(est2(4)*(1-exp(x1(:,1).^est2(5))))))+u2*sum(est2(3)*log(1exp(est2(4)*(1exp(x1(:,1).^est2(5))))))+w1*sum(log(est2(3)*est2(4)*est2(5))+(est2(5) -1)*log(x2(:,2))+est2(4)*(1exp(x2(:,2).^est2(5)))+x2(:,2).^est2(5)+(est2(3)-1)*log(1exp(est2(4)*(1-exp(x2(:,2).^est2(5))))))+w2*sum(est2(3)*log(1exp(est2(4)*(1-exp(x2(:,2).^est2(5))))))); [H2,err2,g2] = hessian(obj4,pa); [g1,err3]=gradest(obj4,pa); H3=-H2-g1'*g1; H4=inv(H3); tt2=tt2+H4; %} lam=4; bet=5; clear x1; clear x2; clear x0; alp1alt=pa(1)-sqrt(kov(1,1))*1.96; alp1ust=pa(1)+sqrt(kov(1,1))*1.96; if alp1alt<alpha1 && alp1ust>alpha1 alp1say=alp1say+1; end [alp1alt alp1ust] alp2alt=pa(2)-sqrt(kov(2,2))*1.96; alp2ust=pa(2)+sqrt(kov(2,2))*1.96; if alp2alt<alpha2 && alp2ust>alpha2 alp2say=alp2say+1; end [alp2alt alp2ust] alp0alt=pa(3)-sqrt(kov(3,3))*1.96; alp0ust=pa(3)+sqrt(kov(3,3))*1.96; if alp0alt<alpha0 && alp0ust>alpha0 alp0say=alp0say+1; end [alp0alt alp0ust] lambalt=pa(4)-sqrt(kov(4,4))*1.96; lambust=pa(4)+sqrt(kov(4,4))*1.96; if lambalt<lambda && lambust>lambda 49 lambsay=lambsay+1; end [lambalt lambust] betalt=pa(5)-sqrt(kov(5,5))*1.96; betust=pa(5)+sqrt(kov(5,5))*1.96; if betalt<beta && betust>beta betsay=betsay+1; end [betalt betust] end; tt1/ds tt2/ds alp1say/ds alp2say/ds alp0say/ds lambsay/ds betsay/ds 50 Ek 3. Tablo 2 için Matlab Kodu clear all;clc; rand('seed',sum(100*clock)); format long alp=1; lamb=4; bet=5; eps=0.00001; n=37; ds=1; rs=0; for ii=1:ds %y=log((lamb-log(-rand(n,1).^(1/alp)+1))/lamb).^(1/bet); y=[26;63;19;66;40;49;8;69;39;82;72;66;25;41;16;18;22;42;36;34;53;54;51 ;76;64;26;16;44;25;55;49;24;44;42;27;28;2;]; %y=[20;18;19;85;40;49;8;71;39;48;72;62;9;3;75;18;14;42;52;34;39;7;28;6 4;15;48;16;13;14;11;49;24;30;3;47;28;2;]; ii n=length(y); x=sort(y); nx=length(x); hx=sort(x); yx=[]; for i=1:nx-1 if hx(i)~=hx(i+1) yx=[yx;hx(i)]; end end if hx(nx-1)~=hx(nx) yx=[yx;hx(nx)]; end yn=length(yx); a1=ecdf(x); obj3=@(par)-(n*log(par(1)*par(2)*par(3))+(par(3)1)*sum(log(x))+sum(par(2)*(1-exp(x.^par(3)))+x.^par(3))+(par(1)1)*sum(log(1-exp(par(2)*(1-exp(x.^par(3))))))); pp0 = [1.2,0.7,0.4]'; % Starting guess options = optimset('TolX',1e-5, 'Algorithm', 'active-set'); A=[ -1 0 0;0 -1 0;0 0 -1]; b=[0; 0; 0]; [par,fval1,exitflag,output,lambda,grad,He]= fmincon(obj3,pp0,A,b,[],[],[],[],[],options); -fval1; aic=2*5+2*fval1; bic=5*log(n)+2*fval1; aicbic(ii,1:2)=[aic bic]; a2=(1-exp(par(2)*(1-exp(yx.^par(3))))).^par(1); for i=1:yn b1(i,1)=a1(i+1)-a2(i); b2(i,1)=a2(i)-a1(i); end a=max(b1); b=max(b2); ks=max(a,b); t1=0; for i=1:10000 t1=t1+(-1)^(i-1)*exp(-2*i^2*n*ks^2); 51 end pval=2*t1; par obj5=@(par2) -(n*log(par2(1)*par2(2))+(par2(2)1)*sum(log(x))+sum(par2(1)*(1-exp(x.^par2(2)))+x.^par2(2))); p0=[0.05,0.33]; [par2,fval2] = fminsearch(obj5,p0); par2; -fval2 a2=(1-exp(par2(1)*(1-exp(yx.^par2(1))))); for i=1:yn b1(i,1)=a1(i+1)-a2(i); b2(i,1)=a2(i)-a1(i); end a=max(b1); b=max(b2); ks2=max(a,b); t1=0; for i=1:10000 t1=t1+(-1)^(i-1)*exp(-2*i^2*n*ks^2); end kspval2=2*t1; wilks=exp(-obj5(par2))/exp(-obj3(par)); logwilks=-2*log(exp(-obj5(par2))/exp(-obj3(par))); wilkspval2=1-chi2cdf(wilks,2); rs=rs+1; end par2; rs/ds 52 ÖZGEÇMİŞ KİŞİSEL BİLGİLER Adı Soyadı Uyruğu Doğum Yeri ve Tarihi Telefon Faks e-mail : : : : : : Umut ÖKSÜZ T.C ZONGULDAK 09.09.1987 05378281024 oksuz6728@gmail.com EĞİTİM Derece Adı, İlçe, İl Fener Lisesi (Yabancı Dil Ağırlıklı Lise), Merkez, Lise : Zonguldak Üniversite : Selçuk Üniversitesi Yüksek Lisans : Doktora : Bitirme Yılı 2005 2010 İŞ DENEYİMLERİ Yıl 2011- Kurum Türk Silahlı Kuvvetleri UZMANLIK ALANI: İSTATİSTİK YABANCI DİLLER: İNGİLİZCE Görevi Öğretim Görevlisi