Markov Zinciri Monte Carlo Yaklaşımı ve

advertisement
Markov Zinciri Monte Carlo Yaklaşımı
ve
Aktüeryal Uygulamaları
ŞİRZAT ÇETİNKAYA
Ak ü
Aktüer
|Sistem Araştırma Geliştirme Bölümü
AKTÜERLER DERNEĞİ
21 10 2008 - İSTANBUL
21.10.2008
Sunum Planı
1. Giriş
2. Bayesci Metodun Temelleri
3 Markov Zinciri Monte Carlo (MZMC) Yaklaşımı
3.
3.1 Monte Carlo İntegrallemesi ve Markov Zinciri
3.2 Gibbs Örneklemesi
4. MZMC Yönteminin Aktüeryal Uygulamaları
4.1 Hasar Sıklığı İçin Hiyerarşik Poisson Modeli
4 2 Hasar Büyüklüğü Dağılımının Modellenmesi
4.2
4.3 Gruplandırılmış Hasar Büyüklüğü Dağılımının Modellenmesi
21.10.2008
MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya
2
1 Giriş
1.
Markov Zinciri Monte Carlo (MZMC) yaklaşımı markov zinciri kullanarak Monte
Carlo integrasyonunun yapıldığı bir yöntemdir. Çoğu zaman uygulamacılar
ya da bayes yaklaşımı ile problemleri çözmeye çalışan kişiler yüksek
boyutlu olasılık dağılımlarının model parameterelerini bulmak ya da
tahmin yapmak için integrallemek isterler. Monte Carlo integrasyonunda
dağılımdan örneklemler çekilir ve daha sonra bu örneklemlerin ortalamaları
beklenen değerin yaklaşık değerini bulmak için kullanılır. MZMC yönteminde bu
çekilişler
markov
zinciri
sistematiğine
uygun
olarak
çekilir.
Zincirleri
oluşturmanın değişik yolları vardır Gibbs (Geman and Geman, 1984), Metropolis
et al. (1953) ve Hastings (1970).
21.10.2008
MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya
3
2 Bayesci Metodun Temelleri
2.
Önsel dağılım,
π ( θ ) , belirsiz θ
parametrisi -bu parametre yeni veriye ait olasılık dağılımı
ş
sonsal dağılımı
ğ
elde etmek için
ç kullanılır - hakkında bilgileri
g
gösterir.
g
ile birleştirilerek
Model dağılımı, belirlenen parametrelere göre toplanan verilere ilişkin olasılık dağılımıdır.
Olasılık yoğunluk fonksiyonu,
f X |Θ ( x | θ ) ile gösterilip, bazen olabilirlik fonksiyonu olarakta
isimlendirilebilinir.
x = ( x1 ,x2 ,...,xn )T , birbirlerinden bağımsız ve aynı dağılımlı iseler;
f X |Θ ( x | θ ) = f X |Θ ( x1 | θ )...
) f X |Θ ( xn | θ )
21.10.2008
MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya
4
2 Bayesci Metodun Temelleri
2.
Birleşik dağılım,
f X ,Θ ( x,θ ) = f X|Θ ( x | θ )π ( θ )
olasılık yoğunluk fonksiyonuna sahiptir.
x’in
’i marjinal
ji l dağılımı
d ğl ;
f X ( x ) = ∫ f X|θ ( x | θ )π ( θ )dθ
olasılık yyoğunluk
ğ
fonksiyonuna
y
sahiptir.
p
Sonsal dağılım gözlenen değerler verildiğinde gözlenen değerlerin parametreleri üzerine
koşullu olasılık dağılımıdır ve
π Θ |X ( θ | x )
ile gösterilir.
Öngörü dağılımı x verildiğinde yeni gözlem yy’nin
nin koşullu olasılık dağılımıdır ve
fY|X ( y | x )
ile gösterilir.
21.10.2008
MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya
5
2 Bayesci Metodun Temelleri
2.
π Θ |X ( θ | x ) =
f X |Θ ( x | θ )π ( θ )
∫f
X |Θ
( x | θ )π ( θ )dθ
21.10.2008
MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya
6
2 Bayesci Metodun Temelleri
2.
D gözlenen veriler, teta model parametreleridir.
P( D,θ ) = P( D | θ )P( θ )
D gözlemi elde edildiğinde, Bayes teoremi D koşulu altında
kullanılabilir.
P( θ | D ) =
θ ’nın dağılımını bulmada
P( θ )P( D | θ )
∫ P( θ )P( D | θ )dθ
Sonsal dağılıma ilişkin momentler, yüzdelikler vs.
bulunabilir.
θ ’nın fonksiyonunun beklenen değerleri
değeri
f ( θ ) fonksiyonunun sonsal beklenen değeri,
f ( θ )P( θ )P( D | θ )dθ
∫
E[ f ( θ )| D ] =
∫ P( θ )P( D | θ )dθ
21.10.2008
MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya
7
3. Markov Zinciri Monte Carlo Yaklaşımı
3 1 Monte Carlo İntegrallemesi ve Markov Zinciri
3.1
Monte Carlo integrallemesinde, E[ f ( X )] beklenen değerine π (.) dağılımından çekilen
rasgele { X t ,t = 1,...,n } değerleri çekilerek,
1 n
E[ f ( X )] ≈ ∑ f ( X t )
n t =1
ile yaklaşılır.
n
1
f ≈
f ( Xt )
∑
n − m t = m +1
Markov Zinciri;;
21.10.2008
MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya
8
3. Markov Zinciri Monte Carlo Yaklaşımı
3 2 Gibbs Örneklemesi
3.2
Algoritmanın adımları aşağıdaki gibidir:
θ ( 0 ) ’ın verilmesi durumunda,
1 Çekiliş:
1.
θ1( 1 ) ~ q( θ1 | θ 2( 0 ) ,...,θ r( 0 ) )
2. Çekiliş:
θ 2( 1 ) ~ q( θ 2 | θ1( 1 ) ,θ 3( 0 ) ,...,θ r( 0 ) )
.
.
.
r.
Çekiliş:
Ardından
θ r( 1 ) ~ q( θ r | θ1( 1 ) ,θ 2( 1 ) ,...,θ r(−11) )
q( X | θ ) ’dan X değeri çekilir.
(Geman ve Geman (1984))
21.10.2008
MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya
9
4 Aktüeryal Uygulamaları
4.
The BUGS (Bayesian inference Using Gibbs Sampling)
http://www mrc bsu cam ac uk/bugs/
http://www.mrc-bsu.cam.ac.uk/bugs/
21.10.2008
MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya
10
4. Aktüeryal Uygulamaları
4 1 Hasar Sıklığı İçin Hiyerarşik Poisson Modeli
4.1
Tablo 1: Poliçe ve hasar sayıları
G
Grup
1
YIL
1
2
3
4
5
Poliçe
Sayısı
285
325
270
345
?
G
Grup
2
Hasar
Sayısı
9
7
6
13
?
Poliçe
Sayısı
265
270
240
265
295
G
Grup
3
Hasar
Sayısı
6
5
3
8
?
Poliçe
Sayısı
?
140
115
110
125
Hasar
Sayısı
?
8
4
5
?
(Scollnik (2000))
21.10.2008
MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya
11
4. Aktüeryal Uygulamaları
4 1 Hasar Sıklığı İçin Hiyerarşik Poisson Modeli
4.1
•
X ij , hasar sayısını, Pij ise kesilen poliçe sayısını göstersin, i = 1,2,3, j = 1,...,5 .
•
X ij ~ Pois( λij ) ve λij = Pijθi olsun.
•
•
θi ~ Gamma( α , β )
α ~ Gamma( 5,5 )
β ~ Gamma( 25,1
25 1 )
•
Pij ~ Gamma( ai ,bi )
•
ai ~ U
Uniform(
f
( 0,100
,
)
•
bi ~ Uniform( 0,100 )
•
21.10.2008
MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya
12
4. Aktüeryal Uygulamaları
4 1 Hasar Sıklığı İçin Hiyerarşik Poisson Modeli
4.1
X ,α ,θ , β değişkenlerinin bileşik dağılımı,
4
∏ f(X
j =1
1j
4
4
3
j =1
j =2
j =1
| P1 jθ1 )∏ f ( X 2 j | P2 jθ 2 )∏ f ( X 3 j | P3 jθ 3 )∏ f ( θ j | α , β ) f ( α ) f ( β )
Veri gözlendikten sonra sonsal dağılım,
göre
f ( θ ,α , β | X ) , hesaplanabilir. Bayes teoremine
f ( θ ,α , β | X ) ∝ f ( θ ,α , β , X ) olarak yazılabilir.
Yukarıda verilenlere göre örnek sonsal dağılım,
4
f ( θ1 | α , β , X ,θ 2 ,θ 3 ) ∝ ∏ f ( X 1 j | P1 jθ1 ) f ( θ1 | α , β )
j =1
4
4
j =1
j =1
~ Gamma( α + ∑ X 1 j , β + ∑ P1 j )
21.10.2008
MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya
13
4. Aktüeryal Uygulamaları
4 1 Hasar Sıklığı İçin Hiyerarşik Poisson Modeli
4.1
3
f ( α | β , X ,θ ) ∝ ∏ f ( α ) f ( θ i | α , β )
i =1
3
f ( β | α , X ,θ ) ∝ ∏ f ( β ) f ( θ i | α , β )
i =1
f ( θi | X ) = ∫ ∫ f ( θi | X ,α , β ) f (α , β | X )d β dα
α β
n
1
≈
f ( θi | X ,α ( t ) ,β ( t ) ),
) i = 1,2,3
∑
n − m t = m +1
f ( X i5 | X ) = ∫ f ( X i5 | Pi5θi ) f ( θi | X )dθi
θi
n
1
≈
f ( X i5 | Pi5θi( t ) ), i = 1,2,3
∑
n − m t = m +1
21.10.2008
MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya
14
4. Aktüeryal Uygulamaları
4 1 Hasar Sıklığı İçin Hiyerarşik Poisson Modeli
4.1
x[1,5]
x[2,5]
x[3,1]
x[3,5]
21.10.2008
Mean
SD
MC error
2.5%
8.921
6.378
5.676
5.844
3.638
2.856
2.878
2.774
0.03265
0.02899
0.02843
0.02898
3.0
2.0
1.0
1.0
Median 97.5%
9.0
6.0
5.0
6.0
17.0
13.0
12.0
12.0
MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya
Start
1
1
1
1
Sample
10000
10000
10000
10000
15
4. Aktüeryal Uygulamaları
4 2 Hasar Büyüklüğü Dağılımının Modellenmesi
4.2
21.10.2008
MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya
16
4. Aktüeryal Uygulamaları
4 2 Hasar Büyüklüğü Dağılımının Modellenmesi
4.2
1. Rasgele,
2 i=0;
2.
i 0
başlangıç değerleri seçilir,
3.
,
500 iterasyon sonunda;
21.10.2008
MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya
17
4. Aktüeryal Uygulamaları
4 2 Hasar Büyüklüğü Dağılımının Modellenmesi
4.2
21.10.2008
MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya
18
4. Aktüeryal Uygulamaları
4 2 Hasar Büyüklüğü Dağılımının Modellenmesi
4.2
Marjinal
j
dağılım-X
ğ
Marjinal
j
dağılım-Teta
ğ
21.10.2008
MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya
19
4. Aktüeryal Uygulamaları
4 3 Gruplandırılmış Hasar Büyüklüğü Dağılımının Modellenmesi
4.3
• X, hasar büyüklüğü, gruplandırılmış,
• Gruplar: (0,1000],
(0 1000] (1000,2000],
(1000 2000] (2000,3000],
(2000 3000] (3000,∞],
(3000 ∞]
• Gruplara ilişkin sıklıklar: 12, 8, 3 ve 2’dir.
, Lambda=5000
21.10.2008
MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya
20
4. Aktüeryal Uygulamaları
4 3 Gruplandırılmış Hasar Büyüklüğü Dağılımının Modellenmesi
4.3
21.10.2008
MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya
21
4. Aktüeryal Uygulamaları
4 3 Gruplandırılmış Hasar Büyüklüğü Dağılımının Modellenmesi
4.3
10 iterasyondaki
10.
değeri alınmak üzere 1000 farklı
değeri
Örneklem Ortalaması:4,5097 21.10.2008
MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya
22
Bazı Kaynaklar
•
Gilks, W.
Gilk
W R.,
R Richardson,
Ri h d
S Spiegelhalter,
S.,
S i
lh lt
D 1996,
D.,
1996 Markov
M k
Ch i
Chain
Monte Carlo In Practice, Chapman&Hall.
•
Klugman, S.,
Klugman
S Panjer,
Panjer H.
H H.,
H Willmot G.E.,
G E 2004,
2004 Loss Models: From
Data to Decisions, John Wiley & Sons, New York.
•
Scollnik D.P.M.,
D P M 2000,
2000 Actuarial Modeling with MCMC and BUGS:
Additional Worked Examples, Actuarial Research Clearing House,
2000.2, 433-585.
•
Scollnik, D.P.M., 2001, Actuarial Modeling with MCMC and BUGS,
North American Actuarial Journal, 5 (2), 96-124.
21.10.2008
MZMC Yaklaşımı ve Aktüeryal Uygulamaları Şirzat Çetinkaya
23
Download