BAŞKENT ÜNİVERSİTESİ TİCARİ BİLİMLER FAKÜLTESİ SİGORTACILIK VE RİSK BÖLÜMÜ Ankara / TÜRKİYE Prof.Dr. Serpil CULA DERS4 Olasılık Dağılımları / Olasılık Modelleri Sigortacılık alanında karşılaşılan fiziksel ya da fiziksel olmayan rasgele değişken büyüklüklerin olasılık dağılımları için, model alınabilecek çok sayıda sürekli ve kesikli fonksiyon bulunmaktadır. Sürekli X rasgele değişkenine ilişkin f(x) fonksiyonunun yalnızca biçiminin tahmin edilmiş olmasının, fonksiyona ilişkin eğrinin altında kalan alanlarla belirlenen olasılıkların hesaplanmasını sağlamayacağı göz önünde bulundurulmalıdır. Çünkü söz konusu alanların hesaplanabilmesi için anılan eğrinin denkleminin de belirlenmiş olması gerekir. Olasılıksal problemlerin çözümünde ise, model (fonksiyon) belirlendikten sonra, modele ilişkin parametreler, örnekleme sonucu sağlanan istatistiksel verilerle tahmin edilir; ortalaması, standart sapması gibi. Bu bağlamda en uygun modelin seçimi, var olan fonksiyonların özelliklerinin çok yakından bilinmesini gerektirir. Sigortacılık alanında karşılaşılan rasgele değişkenlerin deneysel dağılımlarının çoğunu çok yakından betimleyen çözümsel modellerin bazıları: Normal dağılım, Üssel dağılım, • t tağılımı, Lognormal dağılım, Gamma dağılımı, • F dağılımı, Binom dağılımı, Khi-kare dağılımı, • Üniform dağılım, Poisson dağılımı Geometrik dağılım • Beta dağılım vb.dir. Bazı Kesikli Olasılık Dağılımları Binom Dağılımı (İki Terimli Dağılım): X raslantı değişkeni aşağıdaki koşulları sağlıyorsa, bu raslantı değişkeni binom raslantı değişkenidir: Deneyde iki sonuç vardır. Başarılı olma olasılığı p, başarısız olma olasılığı (1-p)=q olarak tanımlanır. Deney boyunca yapılan n deneme, aynı koşullar altında gerçekleştirilir. Bir tek deneme için başarılı olma olasılığı p ve başarısızlık olasılığı q her deneme için aynıdır. Denemeler birbirinden bağımsızdır. Deney boyunca n sabit kalır. n Binom dağılımının olasılık fonksiyonu; P( X x) p x (1 p) n x , x 0,1,2,3,..., n x olarak yazılır. Burada, örneklem büyüklüğü n, ilgilenilen olayın olasılığı p, p+q=1’dir. Binom Dağılımının Ortalaması, Varyansı ve Standart Sapması: Binom dağılımının ortalaması, varyansı ve standart sapması sırasıyla aşağıda verilmiştir: E(X) np 2 . npq npq dır. Bazı Kesikli Olasılık Dağılımları Örnek: A şirketinde bir poliçeyi tekrar yenileme olasılığı 0,40’dır. Seçilen 5 poliçeden; 2’sinin yenilenme olasılığı nedir? 5 P(X 2) 0,402 0,603 0,3456 2 En çok 2’sinin yenilenmesi olasılığı nedir? P(X 2) P(X 0) P(X 1) P(X 2) 0,0778 0,2592 0,3456 0,6826 En az 3 poliçenin yenilenmesi olasılığı nedir? P(X 3) P(X 3) P(X 4) P(X 5) 5 5 5 = 0,403 0,602 0,404 0,601 0,405 0,600 0,2304 0,0768 0,0102 0,3174 3 4 5 Bazı Kesikli Olasılık Dağılımları Poisson Dağılımı: Belli bir zaman aralığında, belli bir alanda ya da hacimde nadir rastlanan olayların olasılık dağılımları Poisson dağılımı ile modellenebilir. Aşağıda Poisson dağılımı ile modellenebilecek örnekler verilmiştir: Bir iş kolunda belli bir sözleşme döneminde gerçekleşen grev sayısı Bir dakikada bir kasaya gelen müşterilerin sayısı Bir bölgede yapılan taramada, kanser hastalığı yaşanmış bireylerin sayısı Poisson dağılımının ortalaması ve varyansı aynı olup, tek bir parametresi vardır ve bu parametre ile gösterilir. X Poisson raslantı değişkeninin olasılık fonksiyonu, (t ) x et olarak tanımlanır. P( X x ) x! Burada, e=2,71828 x= ilgilenilen olay sayısı, t=t birim zaman içinde ilgilenilen olayın ortalama oluş sayısıdır. Genellikle t= 1 alınır. Bu durumda Poisson dağılımının olasılık fonksiyonu; ( ) x e P( X x ) x! olur. Dağılıma ilişkin E(X)= = ; 2= ve standart sapma, dır. Bazı Kesikli Olasılık Dağılımları Örnek: Bir sigorta şirketine 9.00-14.00 saatleri arasında gelen telefonların ortalama sayısı =3 olan Poisson dağılımı göstermektedir. Bu şirkete bu saatler arasında, Hiçbir müşterinin gelmemesi olasılığını, 3 0 e 3 P(X 0) 0,0498 0! 2’den az müşterinin gelmesi olasılığını, P(X<2)=P(X=0)+P(X=1)=0,0498+0,1494=0,1992 2 ve daha fazla müşterinin gelmesi olasılığını bulunuz. P(X2)=1-P(X<2) =1-0,1992=0,8008 Sürekli Raslantı Değişkenlerinin Olasılık Dağılımları Normal Dağılım: Olasılık yoğunluk fonksiyonlarından biri olan ve istatistikte çok yaygın kullanılan normal dağılım, istatistik bilimi için büyük önem taşır. X sürekli raslantı değişkeninin olasılık yoğunluk fonksiyonu normal dağılım gösteriyorsa, aşağıda belirtilen özelliklere sahiptir: Tek tepeli bir dağılımdır. Ortalamasına (X=) göre simetriktir. Ortalama, ortanca, tepe değeri birbirine eşittir. X raslantı değişkeni - ile + arasında değerler alır. Daha önce de belirtildiği gibi gözlemlerin yaklaşık olarak; %68’i, 1 %95’i, 2 %99,7’si, 3 %100’ü 4 arasındadır. Normal dağılımın olasılık yoğunluk fonksiyonu f (x) 1 2 e 1 x 2 2 , - <x< dır. Sürekli Raslantı Değişkenlerinin Olasılık Dağılımları Burada; raslantı değişkeninin herhangi bir değeri, =Kitlenin standart sapması, =Kitlenin ortalaması ve e2,76183’dir. Aşağıda normal dağılımın grafiği verilmiştir. f(x) σ μ x Yukarıda verilen ifade bir olasılık yoğunluk fonksiyonu olduğu için integralinin değeri 1’e eşittir. Yani, 1 2 e x 2 2 2 dx 1 dır. Dağılımı tanımlayabilmek için ve ’yı bilmek gerekir. İntegral ile bulunan belli sınırlar arasında eğrinin alanı, belli bölgelerde bulunma olasılıklarını verir. P(aXb) olasılığı, b 1 x 2 22 dx integralinin alınması ile bulunur. 2 a Bu integralin alınması pratik ve kolay bir iş değildir. Bunun için dağılımın standartlaştırılması işlemi uygulanır. Bu uygulama, olasılık yoğunluk fonksiyonunun belli sınırlar arasındaki alan hesaplamasında kolaylık sağlar. Tanım: Bir dağılımın standartlaştırılması, alanı değişmemek şartı ile ortalamanın sıfıra kaydırılması, varyansın 1’e eşitlenmesidir. Tüm normal dağılımlar standart normal dağılıma dönüştürülebilir. e Sürekli Raslantı Değişkenlerinin Olasılık Dağılımları Standart Normal Dağılım (SND): Standart normal dağılımda ortalama 0, varyans 1’dir. Ortalamaya göre tam simetrik bir dağılımdır. SND’ın olasılık yoğunluk fonksiyonu f (z) 1 2 e z2 2 , - <z< dur. Z X dönüşümü ile, Bu dağılım, X raslantı değişkenlerinin belli bölgelerde bulunma olasılığını bulmak için kullanılır. Örneğin bir standart normal dağılımda, Z=0,00 ile Z=1,45 arasında bulunma olasılığı, P (0 Z 1,45) 1, 4 5 0 1 e 2 z2 2 dz integrali alınarak elde edilir. Ancak uygulamada, bu alanlar için daha önce oluşturulmuş tablolar kullanılır. Ek 3’de verilmiş tablo, bir SND tablosudur ve Z’nin sıfırdan, 3,09’a kadar olan değerleri için çeşitli alanları vermektedir. Simetrik bir dağılım olduğu için, sol tarafa ait bilgiler verilmemiştir. Çünkü dağılım simetrik olup sağ taraf ile aynı değerlere sahiptir. Örneğin, P(0<Z<0,52)=P(-0,52<Z<0) dır. Bazı kaynaklar Ek 3’de verilen tablo yerine, z F( Z) f (z)dz ile tanımlanan standart normal dağılımın birikimli olasılıklarını veren tabloları kullanırlar (Ek 4). Sürekli Raslantı Değişkenlerinin Olasılık Dağılımları Ortalaması, ve Varyansı, 2, Bilinen Normal Dağılımlarda Olasılık Hesabı: Normal dağılım ND(;2) ya da N(;2 ) ile gösterilir. Gösterimin anlamı, ortalaması ve varyansı 2 olan dağılım demektir. Her ND(;2) dağılım, standart dağılım olan SND(0;1)’e dönüştürülebilir. Bu dönüştürme işlemi kitle için; X dir. Z örneklem için; Z XX S ile gerçekleştirilir. Standart normal dağılım (SND) grafiği verilmiştir. Şekil Standart Normal Dağılım SND tablosunu kullanmak için; dağılımında, Z değerlerinin tam sayı kısmı ve virgülden sonra gelen ilk hane satırdan okunur. Virgülden sonra gelen ikinci hane ise, sütundan okunur, ikisinin kesiştikleri yerde olan rakam, sıfır ile o, Z değeri arasında bulunma olasılığıdır. Sürekli Raslantı Değişkenlerinin Olasılık Dağılımları Örnek: Haftalık hasar ortalaması =3000 TL ve standart sapması =1000 TL olan bir sigorta şirketinin gerekli işlemlerde iş hacmini belirleyebilmek için aşağıdaki olasılıklara ihtiyacı vardır. Aşağıdaki olasılıkları hesaplayınız. Bu şirkette haftalık hasarın 2500 TL ve daha fazla olma olasılığı nedir? 1. Adım: İstenen olasılık bölgesi yazılır. P(X>2500)=P(X2500) 2. Adım: ND(3000;10002) da verilen X değerinin SND(0;1)da karşıtı bulunur. Z 2500 3000 0,5 1000 3. Adım: Bu olasılığın SND’da karşıtı yazılır ve tablodan bulunabilecek şekle getirilir. Yani P(Z>-0,5) olarak yazılır. Grafik çizilerek istenen bölge belirlenir. 4. Adım: 3. adımda taranarak gösterilen olasılıklar tablodan bakılıp yazılır. P(-0,5<Z<0)=0,1915’dir. P(0<Z<)=0,5’dir. Taralı alanın olasılığı 0,5+0,1915=0,6915 olacaktır. P(-0,5<Z<)=0,6915’dir. Sürekli Raslantı Değişkenlerinin Olasılık Dağılımları Haftalık hasarın 2500 TL’den az olma olasılığı nedir? P(X<2500)= X 2500 3000 P P( Z 0,5) 1000 Şekil çizerek istenen bölge bulunabilir. İstenen bölge; P(Z<-0,5)=0,5-0,1915=0,3085’dir. Haftalık hasarın 4000 TL ile 5000 TL arasında olma olasılığı nedir? P(4000<X<5000)= 4000 3000 X 5000 3000 P P(1 Z 2) 1000 1000 P(1<Z<2)=P(0<Z<2)-P(0<Z<1)=0,4772-0,3413=0,1359 Sürekli Raslantı Değişkenlerinin Olasılık Dağılımları Haftalık hasarın 2000 TL ile 5000 TL arasında olma olasılığı nedir? P(2000<X<5000)= 2000 3000 X 5000 3000 P P( 1 Z 2) 1000 1000 P(-1<Z<2)=P(-1<Z<0)+P(0<Z<2)=0,3413+0,4772=0,8185 Haftalık hasarın1000 TL ile 2000 TL arasında olma olasılığı nedir? 1000 3000 X 2000 3000 P( 2 Z 1) 1000 1000 P(1000<X<2000)= P P(-2<Z<-1)=P(-2<Z<0)-P(-1<Z<0)=0,4772-0,3413=0,1359 olacaktır. Sürekli Raslantı Değişkenlerinin Olasılık Dağılımları Örnek : Başkent radyosunda dinlenen bir müzik programının haftalık dinlenme süresi μ=4 saat ve σ=1 saat parametrelerine sahip olan bir normal dağılım gösterdiği bilinmektedir. Haftalık müzik dinleme süresinin üç saatten az olma olasılığı nedir? 3 4 P(X 3) P Z P( Z 1) 1 =0,5-0,3413=0,1587 Bu sürenin 3,5 saat ile 4,5 saat arasında gerçekleşme olasılığı nedir? 4,5 4 3,5 4 P(3,5 X 4,5) P Z P(0,5 Z 0,5) 1 1 =0,1915+0,1915=0,3830