Markov Zinciri Monte Carlo Yaklaşımı ve Aktüeryal Uygulamaları ŞİRZAT ÇETİNKAYA Ak ü Aktüer |Sistem Araştırma Geliştirme Bölümü AKTÜERLER DERNEĞİ 21 10 2008 - İSTANBUL 21.10.2008 Sunum Planı 1. Giriş 2. Bayesci Metodun Temelleri 3 Markov Zinciri Monte Carlo (MZMC) Yaklaşımı 3. 3.1 Monte Carlo İntegrallemesi ve Markov Zinciri 3.2 Gibbs Örneklemesi 4. MZMC Yönteminin Aktüeryal Uygulamaları 4.1 Hasar Sıklığı İçin Hiyerarşik Poisson Modeli 4 2 Hasar Büyüklüğü Dağılımının Modellenmesi 4.2 4.3 Gruplandırılmış Hasar Büyüklüğü Dağılımının Modellenmesi 21.10.2008 MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya 2 1 Giriş 1. Markov Zinciri Monte Carlo (MZMC) yaklaşımı markov zinciri kullanarak Monte Carlo integrasyonunun yapıldığı bir yöntemdir. Çoğu zaman uygulamacılar ya da bayes yaklaşımı ile problemleri çözmeye çalışan kişiler yüksek boyutlu olasılık dağılımlarının model parameterelerini bulmak ya da tahmin yapmak için integrallemek isterler. Monte Carlo integrasyonunda dağılımdan örneklemler çekilir ve daha sonra bu örneklemlerin ortalamaları beklenen değerin yaklaşık değerini bulmak için kullanılır. MZMC yönteminde bu çekilişler markov zinciri sistematiğine uygun olarak çekilir. Zincirleri oluşturmanın değişik yolları vardır Gibbs (Geman and Geman, 1984), Metropolis et al. (1953) ve Hastings (1970). 21.10.2008 MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya 3 2 Bayesci Metodun Temelleri 2. Önsel dağılım, π ( θ ) , belirsiz θ parametrisi -bu parametre yeni veriye ait olasılık dağılımı ş sonsal dağılımı ğ elde etmek için ç kullanılır - hakkında bilgileri g gösterir. g ile birleştirilerek Model dağılımı, belirlenen parametrelere göre toplanan verilere ilişkin olasılık dağılımıdır. Olasılık yoğunluk fonksiyonu, f X |Θ ( x | θ ) ile gösterilip, bazen olabilirlik fonksiyonu olarakta isimlendirilebilinir. x = ( x1 ,x2 ,...,xn )T , birbirlerinden bağımsız ve aynı dağılımlı iseler; f X |Θ ( x | θ ) = f X |Θ ( x1 | θ )... ) f X |Θ ( xn | θ ) 21.10.2008 MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya 4 2 Bayesci Metodun Temelleri 2. Birleşik dağılım, f X ,Θ ( x,θ ) = f X|Θ ( x | θ )π ( θ ) olasılık yoğunluk fonksiyonuna sahiptir. x’in ’i marjinal ji l dağılımı d ğl ; f X ( x ) = ∫ f X|θ ( x | θ )π ( θ )dθ olasılık yyoğunluk ğ fonksiyonuna y sahiptir. p Sonsal dağılım gözlenen değerler verildiğinde gözlenen değerlerin parametreleri üzerine koşullu olasılık dağılımıdır ve π Θ |X ( θ | x ) ile gösterilir. Öngörü dağılımı x verildiğinde yeni gözlem yy’nin nin koşullu olasılık dağılımıdır ve fY|X ( y | x ) ile gösterilir. 21.10.2008 MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya 5 2 Bayesci Metodun Temelleri 2. π Θ |X ( θ | x ) = f X |Θ ( x | θ )π ( θ ) ∫f X |Θ ( x | θ )π ( θ )dθ 21.10.2008 MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya 6 2 Bayesci Metodun Temelleri 2. D gözlenen veriler, teta model parametreleridir. P( D,θ ) = P( D | θ )P( θ ) D gözlemi elde edildiğinde, Bayes teoremi D koşulu altında kullanılabilir. P( θ | D ) = θ ’nın dağılımını bulmada P( θ )P( D | θ ) ∫ P( θ )P( D | θ )dθ Sonsal dağılıma ilişkin momentler, yüzdelikler vs. bulunabilir. θ ’nın fonksiyonunun beklenen değerleri değeri f ( θ ) fonksiyonunun sonsal beklenen değeri, f ( θ )P( θ )P( D | θ )dθ ∫ E[ f ( θ )| D ] = ∫ P( θ )P( D | θ )dθ 21.10.2008 MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya 7 3. Markov Zinciri Monte Carlo Yaklaşımı 3 1 Monte Carlo İntegrallemesi ve Markov Zinciri 3.1 Monte Carlo integrallemesinde, E[ f ( X )] beklenen değerine π (.) dağılımından çekilen rasgele { X t ,t = 1,...,n } değerleri çekilerek, 1 n E[ f ( X )] ≈ ∑ f ( X t ) n t =1 ile yaklaşılır. n 1 f ≈ f ( Xt ) ∑ n − m t = m +1 Markov Zinciri;; 21.10.2008 MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya 8 3. Markov Zinciri Monte Carlo Yaklaşımı 3 2 Gibbs Örneklemesi 3.2 Algoritmanın adımları aşağıdaki gibidir: θ ( 0 ) ’ın verilmesi durumunda, 1 Çekiliş: 1. θ1( 1 ) ~ q( θ1 | θ 2( 0 ) ,...,θ r( 0 ) ) 2. Çekiliş: θ 2( 1 ) ~ q( θ 2 | θ1( 1 ) ,θ 3( 0 ) ,...,θ r( 0 ) ) . . . r. Çekiliş: Ardından θ r( 1 ) ~ q( θ r | θ1( 1 ) ,θ 2( 1 ) ,...,θ r(−11) ) q( X | θ ) ’dan X değeri çekilir. (Geman ve Geman (1984)) 21.10.2008 MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya 9 4 Aktüeryal Uygulamaları 4. The BUGS (Bayesian inference Using Gibbs Sampling) http://www mrc bsu cam ac uk/bugs/ http://www.mrc-bsu.cam.ac.uk/bugs/ 21.10.2008 MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya 10 4. Aktüeryal Uygulamaları 4 1 Hasar Sıklığı İçin Hiyerarşik Poisson Modeli 4.1 Tablo 1: Poliçe ve hasar sayıları G Grup 1 YIL 1 2 3 4 5 Poliçe Sayısı 285 325 270 345 ? G Grup 2 Hasar Sayısı 9 7 6 13 ? Poliçe Sayısı 265 270 240 265 295 G Grup 3 Hasar Sayısı 6 5 3 8 ? Poliçe Sayısı ? 140 115 110 125 Hasar Sayısı ? 8 4 5 ? (Scollnik (2000)) 21.10.2008 MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya 11 4. Aktüeryal Uygulamaları 4 1 Hasar Sıklığı İçin Hiyerarşik Poisson Modeli 4.1 • X ij , hasar sayısını, Pij ise kesilen poliçe sayısını göstersin, i = 1,2,3, j = 1,...,5 . • X ij ~ Pois( λij ) ve λij = Pijθi olsun. • • θi ~ Gamma( α , β ) α ~ Gamma( 5,5 ) β ~ Gamma( 25,1 25 1 ) • Pij ~ Gamma( ai ,bi ) • ai ~ U Uniform( f ( 0,100 , ) • bi ~ Uniform( 0,100 ) • 21.10.2008 MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya 12 4. Aktüeryal Uygulamaları 4 1 Hasar Sıklığı İçin Hiyerarşik Poisson Modeli 4.1 X ,α ,θ , β değişkenlerinin bileşik dağılımı, 4 ∏ f(X j =1 1j 4 4 3 j =1 j =2 j =1 | P1 jθ1 )∏ f ( X 2 j | P2 jθ 2 )∏ f ( X 3 j | P3 jθ 3 )∏ f ( θ j | α , β ) f ( α ) f ( β ) Veri gözlendikten sonra sonsal dağılım, göre f ( θ ,α , β | X ) , hesaplanabilir. Bayes teoremine f ( θ ,α , β | X ) ∝ f ( θ ,α , β , X ) olarak yazılabilir. Yukarıda verilenlere göre örnek sonsal dağılım, 4 f ( θ1 | α , β , X ,θ 2 ,θ 3 ) ∝ ∏ f ( X 1 j | P1 jθ1 ) f ( θ1 | α , β ) j =1 4 4 j =1 j =1 ~ Gamma( α + ∑ X 1 j , β + ∑ P1 j ) 21.10.2008 MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya 13 4. Aktüeryal Uygulamaları 4 1 Hasar Sıklığı İçin Hiyerarşik Poisson Modeli 4.1 3 f ( α | β , X ,θ ) ∝ ∏ f ( α ) f ( θ i | α , β ) i =1 3 f ( β | α , X ,θ ) ∝ ∏ f ( β ) f ( θ i | α , β ) i =1 f ( θi | X ) = ∫ ∫ f ( θi | X ,α , β ) f (α , β | X )d β dα α β n 1 ≈ f ( θi | X ,α ( t ) ,β ( t ) ), ) i = 1,2,3 ∑ n − m t = m +1 f ( X i5 | X ) = ∫ f ( X i5 | Pi5θi ) f ( θi | X )dθi θi n 1 ≈ f ( X i5 | Pi5θi( t ) ), i = 1,2,3 ∑ n − m t = m +1 21.10.2008 MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya 14 4. Aktüeryal Uygulamaları 4 1 Hasar Sıklığı İçin Hiyerarşik Poisson Modeli 4.1 x[1,5] x[2,5] x[3,1] x[3,5] 21.10.2008 Mean SD MC error 2.5% 8.921 6.378 5.676 5.844 3.638 2.856 2.878 2.774 0.03265 0.02899 0.02843 0.02898 3.0 2.0 1.0 1.0 Median 97.5% 9.0 6.0 5.0 6.0 17.0 13.0 12.0 12.0 MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya Start 1 1 1 1 Sample 10000 10000 10000 10000 15 4. Aktüeryal Uygulamaları 4 2 Hasar Büyüklüğü Dağılımının Modellenmesi 4.2 21.10.2008 MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya 16 4. Aktüeryal Uygulamaları 4 2 Hasar Büyüklüğü Dağılımının Modellenmesi 4.2 1. Rasgele, 2 i=0; 2. i 0 başlangıç değerleri seçilir, 3. , 500 iterasyon sonunda; 21.10.2008 MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya 17 4. Aktüeryal Uygulamaları 4 2 Hasar Büyüklüğü Dağılımının Modellenmesi 4.2 21.10.2008 MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya 18 4. Aktüeryal Uygulamaları 4 2 Hasar Büyüklüğü Dağılımının Modellenmesi 4.2 Marjinal j dağılım-X ğ Marjinal j dağılım-Teta ğ 21.10.2008 MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya 19 4. Aktüeryal Uygulamaları 4 3 Gruplandırılmış Hasar Büyüklüğü Dağılımının Modellenmesi 4.3 • X, hasar büyüklüğü, gruplandırılmış, • Gruplar: (0,1000], (0 1000] (1000,2000], (1000 2000] (2000,3000], (2000 3000] (3000,∞], (3000 ∞] • Gruplara ilişkin sıklıklar: 12, 8, 3 ve 2’dir. , Lambda=5000 21.10.2008 MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya 20 4. Aktüeryal Uygulamaları 4 3 Gruplandırılmış Hasar Büyüklüğü Dağılımının Modellenmesi 4.3 21.10.2008 MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya 21 4. Aktüeryal Uygulamaları 4 3 Gruplandırılmış Hasar Büyüklüğü Dağılımının Modellenmesi 4.3 10 iterasyondaki 10. değeri alınmak üzere 1000 farklı değeri Örneklem Ortalaması:4,5097 21.10.2008 MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya 22 Bazı Kaynaklar • Gilks, W. Gilk W R., R Richardson, Ri h d S Spiegelhalter, S., S i lh lt D 1996, D., 1996 Markov M k Ch i Chain Monte Carlo In Practice, Chapman&Hall. • Klugman, S., Klugman S Panjer, Panjer H. H H., H Willmot G.E., G E 2004, 2004 Loss Models: From Data to Decisions, John Wiley & Sons, New York. • Scollnik D.P.M., D P M 2000, 2000 Actuarial Modeling with MCMC and BUGS: Additional Worked Examples, Actuarial Research Clearing House, 2000.2, 433-585. • Scollnik, D.P.M., 2001, Actuarial Modeling with MCMC and BUGS, North American Actuarial Journal, 5 (2), 96-124. 21.10.2008 MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya 23