BAYES YAKLAŞIMI… Kesikli Olaylar için Bayes Kuralı Anakütlenin üç kategoriye göre sınıflandırıldığı varsayılsın. İlk grup sağlıklı olanlar, ikinci grup astımı olanlar ve üçüncü grupta tüberküloz (TB) hastası olanlar olsun. Bu anakütlede %90 bireyin sağlıklı, %9’unun astım ve %1’in de tüberküloz hastası olduğu bilinsin. Rastsal seçilen bir birey için aşağıdaki olaylar tanımlanabilir: A1: Bireyin sağlıklı olması olayı P A1 0.90 A2: Bireyin astımı olması olayı P A2 0.09 A3: Bireyin tüberküloz hastası olma olayı (A.1) P A3 0.01 …BAYES YAKLAŞIMI… Seçilen birey tüberküloz hastası olup olmadığını anlamak için röntgen çektirsin.Sağlık araştırmalarından alınan bilgiye göre, röntgen cihazlarının sağlıklı insan için tüberküloz teşhisi koyma olasılığı 0.03dür. Astımı olan bir hastaya tüberküloz teşhisi koyma olasılığı 0.2 ve gerçekte tüberküloz hastası olan bir kişiye tüberküloz teşhisi koyma olasılığı 0.95dir. B olayı seçilen bir kişi için röntgen cihazıyla konan teşhisin pozitif olma olayı olsun. (A.2) P B A2 0.2 P B A3 0.95 P B A1 0.03 olasılıklar “şartlı olasılıklar” dır. Bireyin sağlıklı iken röntgen cihazının TB teşhisi koyma olasılığı 0.03dür. Bu olasılıklar birey röntgen çektirmeden önce verilmektedir. Röntgen 2 cihazına bağlı elde edilen sonuçlardır. …BAYES YAKLAŞIMI… P A3 B P B A3 .P A3 =P A 3 B .P B P B A3 .P A 3 P A3 B P B (A.3) Örnek bilgisi Ön bilgi Bayes kuralı (A.4) Röntgen cihazından önce bireyin TB olma olasılığı P A3 0.01 (ön bilgi) örnek bilgisi P B A3 0.95 Bireyin tüberküloz hastası iken röntgen cihazının TB teşhisi koyma olasılığı 0.95dir.(örnek bilgisi) Bu olasılık birey röntgen çektirmeden önce verilmektedir. Birey TB iken, röntgen çektirdikten sonra birey için TB lu çıkma olasılığı örnek sonrası olasılıkdır. 3 …BAYES YAKLAŞIMI… P A3 Ön olasılıkdan örnek sonrası olasılığa geçiş (röntgen cihazı sonrası) nasıl olacaktır. Ön olasılıkdan Örnek sonrası olasılığa geçiş P B P B A1 P B A 2 P B A 3 = P B A1 .P A1 P B A 2 .P A 2 P B A 3 .P A 3 = 0.03 0.9 0.2 0.09 0.95 0.01 =0.0545 P B A3 .P A3 0.95 0.01 (A.5) P A3 B 0.17 P B 0.0545 Birey TB iken, röntgen cihazının birey için TB teşhisi koyma olasılığı 0.17dir. Olasılık 0.01’den 0.17’ye yükseldiği için birey daha da endişe edebilir. 4 …BAYES YAKLAŞIMI… Sürekli Dağılımlarda Bayes Kuralı (Varyansın Bilindiği Durum) Hanehalkı gıda harcaması örneği ile çalışılsın. yt et ,hakkında bilgi harcamasıdır. et N 0, 2 edinmeye (B.1) çalışılan ortalama gıda Bireyin TB olup olmaması ile değil de ’nın olası değerleri için olasılıklar ile ilgilenilsin. 2 bilinmektedir. 5 …BAYES YAKLAŞIMI… •Tecrübelerden veya uzmanlardan elde edilen ön bilgiler; ’nın ön bilgiye dayalı olasılık yoğunluk fonksiyonu f() ile özetlenebilir. Bu yoğunluk fonksiyonu, örnek alınmadan önceki düşünceleri ifade etmektedir. f() ile ilgili farklı iki ön bilgi incelensin. İlk olarak, örnek bilgisi nasıl ifade edilebilir? Röntgen ile hastalığın teşhisi örneğine dönülürse P B Ai olasılığı; anakütle özellikleri verildiğinde röntgen cihazının hastalık için pozitif teşhis koyma olasılığıdır. Burada, anakütle özellikleri ile özetlenmektedir ve verilen ’ya göre örnek verileri için gıda harcaması olasılık yoğunluk fonksiyonu bulunur. 6 …BAYES YAKLAŞIMI… f y t 2 2 1 2 2 1 exp 2 y t 2 (B.2) Fonksiyon(B.2), verildiğinde belli bir aralıkta hanehalkı gıda harcamasının olasılığını bulmak için kullanılabilir. f yt sabitken anlamına gelir .f yt yerine daha çok tercih edilmektedir. sabit iken bütün gözlemler için (benzerlik fonksiyonu) olasılık yoğunluk fonksiyonu; f y f y1, y 2 ,...., y T = f y1 .f y 2 ......f y T = 2 2 T 2 2 1 T exp 2 y t 2 t 1 (B.3) 7 …BAYES YAKLAŞIMI… (B.3) eşitliğindeki ikinci satır, örneğin gözlemlerinin y1 , y 2 ,...., yT bağımsız olduğunu ifade etmektedir. Örnek sürecinde β sabitken f() yoğunluk fonksiyonu ile β nın belirsizliği ifade edilmektedir. [f()] ön yoğunluk fonksiyonu ’nın rastsal olduğu olasılık yoğunluk fonksiyonu [f( /y)] de ’nın belirsizliğini ifade etmektedir. (Örnek sonrası yoğunluk fonksiyonu) 8 …BAYES YAKLAŞIMI… f y örnek sonrası yoğunluk fonksiyonu nasıl elde edilebilir? f y kesikli olaylardaki P A3 B olasılığına benzemektedir. Röntgen cihazının TB teşhisi koyma olasılığı idi. B örnek bilgisi ve A3 ilgilenilen bilinmeyen kısımdır (birey TB hastası). Benzer şekilde; (B4) 9 …BAYES YAKLAŞIMI… f y i bulmak için Bayes kuralı ile sürekli olasılık yoğunluk fonksiyonu kullanılırsa: P A3 B f y P B A 3 .P A 3 P B Y’ler gözlenen değerler olduğu için fonksiyon değildir, sabittir. f y f f y yoğunluk fonksiyonu =f y f = x örnek bilgisi x ön bilgi f y 1 Örnek bilgisi ile ortak yoğunluk fonksiyonu 10 …BAYES YAKLAŞIMI… Örnek alındıktan sonra f y fonksiyonu artık fonksiyon değil sabit bir sayı olmaktadır. 1 f y şeklinde yazılabilir. Eşitlik hesaplanırken ilk olarak f y ile f yoğunluk fonksiyonları çarpılır. Bu çarpım sonucu, örnek sonrası yoğunluk fonksiyonu f y ’nin şeklini verir. değeri, olasılık yoğunluk fonksiyonunun değerini bir yapacak bir değer olarak seçilmelidir. normalleştirme sabitidir. f y f y f f y (B4) =f y f = x örnek bilgisi x ön bilgi Son olasılık yoğunluk fonksiyonu; ön oyf ile benzerlik fonksiyonun 11 çarpımının bir oranıdır. …BAYES YAKLAŞIMI… Bilgi Verici Olmayan Ön Dağılım Ortalama harcama ile ilgili ön bilgiye sahip olmayalım. Herhangi bir değeri ve aralığında olabilir. Ortalama harcama negatif olamaz ve ortalama harcamanın değeri için üst bir sınır konulabilir. Buda kısaca dur. Tam bilgisizliği ifade eden bir yoğunluk fonksiyonu elde edilmek istenirse ile ilgili tam belirsizliği göstermek için, örneklem öncesi uniform yoğunluk fonksiyonu kullanılmaktadır. f 1 (B.5) Ön bilgi 12 …BAYES YAKLAŞIMI… Fonksiyon(B.2), verildiğinde belli bir aralıkta hanehalkı gıda harcamasının olasılığını bulmak için kullanılabiliyordu. f y t 2 2 1 2 1 exp 2 y t 2 2 (B.2) f y f y1, y 2 ,...., y T = f y1 .f y 2 ......f y T = 2 f y 2 T 2 (B.3) 2 1 T exp 2 y t 2 t 1 f y f f y =f y f = x örnek bilgisi x ön bilgi (B.4) …BAYES YAKLAŞIMI… Bayes kuralını uygulamak için eşitlik (B.6) da, (B.2) ve (B5) yerine konulursa: f | y f y | f 2 2 T /2 f 1 1 T 2 exp 2 yt .1 2 t 1 f y 2 2 T 2 2 1 T exp 2 y t 2 t 1 (B.6) (B.5) (B.2) 14 …BAYES YAKLAŞIMI… Bir sonraki adım (B.6) eşitliğini için yoğunluk fonksiyonu olarak yeniden yazmaktır. e’nin üzerinde yer alan ifade aşağıdaki gibi yazabilir: örneklem ortalaması y bir eklenip bir çıkarılırsa T T y y y y t 1 2 t t 1 T 2 0 t (B.7) T T yt y y 2 y yt y 2 t 1 T t 1 yt y T y t 1 2 2 t 1 2 Gözlemlerin örnek ortalamasından farkı sıfır olduğu için Bu ifade eşitlik (B.6)’da f | y fonksiyonunda yerine konulursa; 15 …BAYES YAKLAŞIMI… Tekrar yazarsak; f | y f y | f 2 T 2 T /2 T 1 2 exp 2 yt .1 2 t 1 y y y t 1 2 t t 1 T 2 t T y 2 (B.6) (B.7) Yerine koyarsak İfadeyi 1 T 2 2 2 exp 2 yt y T y ayrıştırdık 2 t 1 (B.8) T T /2 1 2 2 T 2 2 exp 2 yt y exp 2 y 2 2 t 1 2 T /2 2 T c1 exp 2 y 2 16 …BAYES YAKLAŞIMI… c1 2 f y t 2 T /2 1 1 exp 2 2 yt y t 1 T 2 (B.9) 1 1 2 1 2 2 2 exp 2 y t y 2 Eşitlik (B.8)’deki yoğunluk fonksiyonu ne çeşit bir yoğunluk fonksiyonudur? İlk olarak c1, ’a bağlı değildir.f | y fonksiyonudur. için olasılık yoğunluk …BAYES YAKLAŞIMI… Bu olasılık yoğunluk fonksiyonunun şekli aşağıdadır: 2 T exp 2 y 2 Bu ifade ile tanımlanan yoğunluk fonksiyonu ve 2/T varyanslı bir normal dağılımdır. 2 N y, T (B.10) y ortalamalı (B.11) c1 sabiti yoğunluk fonksiyonunun altındaki alanı 1’e eşit yapmak zorunda olan bir ölçeklendirme sabitidir. Normal dağılımın altındaki alan 1 olduğu için sabit düzenlenip (B9) da yerine konduğunda c1 2 2 / T 1/2 olarak elde edilir 18 …BAYES YAKLAŞIMI… f x t 2 2 1 2 2 1 exp 2 x t 2 x N , 2 idi. Benzer şekilde; 2 T f y c1 exp 2 y 2 c1 2 / T 2 1/2 2 N y, T 19 …BAYES YAKLAŞIMI… c1 2 / T 2 için örnek sonrası yoğunluk fonksiyonu; f | y 2 / T 2 1/2 2 T exp 2 y 2 1/2 (B.12) Bu bölümün amaçlarından biri örnekten önce ve sonra bir normal dağılımın ortalaması ile ilgili belirsizliği ifade etmenin yolunu bulmaktır. Kısım 1 de, ortalama ( ile ilgili belirsizlik olmasına karşın varyans (2) biliniyordu. Örnek bilgisi mevcut olduğunda belirsizlik ile ilgili ifadenin değiştirilmesinde ve ile ilgili tam belirsizliğin ifade edilmesinde bir yöntem bulunmaya çalışıldı. Kısım 1 de, eşitlik (B.12)’da verilen f | y ’nin elde edilmesi ile örnek sonrası belirsizlik ifadesini tanımlamak için sezgisel 20 yaklaşımlar kullanıldı. …BAYES YAKLAŞIMI… Bilgi Verici Ön Dağılım Bir pilot araştırması şeklindeki örnek öncesi bilgisinin mevcut olduğu Bayes kuralının uygulamasına dönülsün. 2’nin bilindiği varsayımı burada da geçerlidir. Örnek öncesi bilgisinin normal yoğunluk fonksiyonu: 2 N y0 , T0 (18) y0 pilot çalışmadan elde edilen örnek ortalaması T0 pilot çalışmasındaki örnek hacmidir. y0 ’a bağlı olan örnek öncesi bilgisi için aşağıdaki eşitlik ele alınmaktadır yt et (B.1) 21 …BAYES YAKLAŞIMI… Bu yoğunluk fonksiyonu aşağıdaki gibi yazılabilmektedir: f f | y0 2 / T0 2 1/2 2 T0 exp 2 y0 2 (B.14) Örnek öncesi (ön bilgi) yoğunluk fonksiyonundan, örnek sonrası yoğunluk fonksiyonunu elde etmek için; (B.14) nolu eşitlik ve eşitlik (B.3)’de verilen f y | örnek bilgisi, eşitlik (B.4)’de Bayes kuralı formülü içerisinde yerine yazılmaktadır. Bu işlem aşağıdaki gibi sonuçlanmaktadır 1/2 c1 2 2 / T f | y f | y0 , y1 f y | f 2 2 T /2 1 exp 2 2 T yt t 1 2 2 T 2 2 / T0 exp 0 2 y0 2 1 T0 T1 2 2 / T0 T1 exp 2 2 (B.15) 1/2 2 22 …BAYES YAKLAŞIMI… (B.15)’de elde edilen fonksiyon, örnek sonrası yoğunluk fonksiyonudur. Kısım 3.1 de sezgisel yolla elde edilmiştir. 2 N , T T 0 1 (B.16) Kısım 3.1 de sezgisel yolla elde edilen argüman, temel örnekten hareketle yapılan pilot çalışması ile elde edilen bilginin ağırlıklandırılması için uygun bir plan yapmaya dayanmaktadır. Eşitlik (B.15)’in de gerekli işlemler yapılarak eşitlik (B.16)’de verilen sonuç elde edilebilir. h 0 y0 h1y1 T0 y0 T1y1 h 0 h1 T0 T1 Örneklemin ortalaması y1 ve ön bilgi dağılımın ortalaması y0 nın ağırlıklı ortalamasıdır. 23 …BAYES YAKLAŞIMI… Varyans Bilinmediği Durumda Sürekli Dağılımlar için Bayes Kuralı: Varyansın bilindiği durumdan çok, varyansın bilinmediği durumlarla daha sık karşılaşılmaktadır. Bu durumda Bayes Kuralı ’nın bilinmeyen ortalaması türünden yazılmamaktadır. Gerçekte 2 bilinmeyendir ve Bayes kuralının ifadesine dahil edilmelidir. Bu durumda Bayes kuralı aşağıdaki gibi yazılabilir: f , 2 | y f y | , 2 f , 2 f y (C.1) f y | , 2 f , 2 24 …BAYES YAKLAŞIMI… f , 2 | y f y | , 2 f , 2 f y f y | , 2 f , 2 Örnek sonrası (C.2) İlk olarak, f , 2 fonksiyonu; ve 2 için örnek öncesi olasılık yoğunluk fonksiyonunu göstermektedir. Örnek alınmadan önce ve 2 ile ilgili bilginin, bu örnek öncesi yoğunluk fonksiyonu ile elde edilebileceği varsayılmaktadır. 2 için örnek öncesi bilginin nasıl elde edilebileceği sorusuna yanıt aranmalıdır. 2 değerinin hanehalkı gıda harcamalarının yer alacağı uygulanabilir aralığı belirlediği hatırlanmalıdır. 25 …BAYES YAKLAŞIMI… Normal dağılımdan gelen çoğu gözlem, ortalamanın 3 aralığında yer almaktadır. Böylece, normal dağılım olduğu varsayılarak, haftalık gıda harcamalarının güven aralığı bilgisine sahip olunursa, 2 varyans bilgisine de sahip olunmaktadır. f , 2 için örnek öncesi gösterim verildiğinde, bir sonraki adım örnek bilgisi f y | , 2 ’i ifade etmektir. Böyle bir ifade eşitlik (9)’de yer alan ifade ile özdeş olmaktadır. Burada tek fark 2’in önemli olduğunu belirtmek için f y| yerine f y | , 2 ’in yazılmasıdır. f y | , 2 2 2 T /2 1 exp 2 2 yt t 1 T 2 (C.3) 26 …BAYES YAKLAŞIMI… sabiti önceki gibi aynı anlamı taşımaktadır. Bu sabit, örnek sonrası olasılık yoğunluk fonksiyonu altında toplam alanın 1’e eşit olmasını gerektirmektedir. (C.1) eşitliğindeki son ifade f , 2 | y dir. Bu fonksiyon ortak örnek sonrası yoğunluk fonksiyonu olmaktadır. Örnek alındıktan sonra ve 2 ile ilgili bilgi durumunu ifade etmektedir. Eğer asıl ilgilenilen 2 yerine ile ilgili bilgiyi tanımlamak ise, o zaman 2’i, ortak örnek sonrası yoğunluk fonksiyonundan çıkarmak gerekmektedir. Böylece f | y elde edilmektedir 27 TAHMİN VE YORUMLAMA İÇİN BAYES YAKLAŞIMI: BAZI TEMEL TANIMLAR, KAVRAMLAR VE UYGULAMALAR[1] Bu bölümde ve izleyen bölümde, bilinmeyen parametresi hakkında belirsizliği ifade etmek ve yorumlar yapabilmek için alternatif yaklaşımlarla ilgilenilecektir. Bayes yaklaşımı olarak bilinen alternatif yaklaşımının önemli özelliği parametreye ilişkin belirsizliğin ifadesinde, bilinmeyen parametresine ilişkin olasılık hesapları kullanılmasıdır. Bu konu, Griffiths, W., Hill, R.C., Judge, G.G., (1993), Learning and Practicing Econometrics kitabı Bölüm 25’ten alınmıştır. [1] Giriş… Bayes yaklaşımında olasılık hesapları, sadece örnek sonuçları için değil aynı zamanda bilinmeyen sabit parametreler için de kullanılmaktadır Olasılık yoğunluk fonksiyonlarının farklı türleri: 1) örnek alınmadan önce parametre hakkındaki belirsizliği ifade etmek (örnek öncesi olasılık yoğunluk fonksiyonu), 2) belirli örnek sonuçlarının olabilirliğini tanımlamak, 3) örnek alındıktan sonra parametre hakkındaki belirsizliği ifade etmek(örnek sonrası olasılık yoğunluk fonksiyonu) için kullanılabilir. 29 …Giriş… Klasik regresyon modellerinde hakkında yorumlama … yapmak için sadece örnek bilgisi kullanılır. Bu iki bölümde kesin olmayan veya belirsiz örnek dışı bilgi ele alınacaktır. Parametre hakkındaki belirsizlik örnek dışı bilginin olması ve kayıplardan herhangi birinin hesaba katılmasından kaynaklanan yanlış bir kararın alınmasına sebep olabilecektir. Bu bölümde, tahmin ve yorumlama ele alınacaktır. Bir ekonomik problem kapsamında aşağıdaki sorular ele alınabilir: 1. Örnek alınmadan önce ve sonra, hipotezler veya parametreler hakkındaki belirsizlik ifade edilebilir mi? 2. Örnek öncesi bilgi, örnek almadan veya deneylere dayanan bilgi ile nasıl birleştirilir? 30 3. Karar sonuçlarını göz önünde tutan bir çerçeve var mıdır? …Giriş… Örnek toplamadan önce: Örneğin ortalama gıda harcamasının ne olabileceği konusunda bir bilgiye sahip olunmadığı varsayılsın. ’nın değeri hakkında tam anlamıyla belirsizlik olduğu söylenebilir. y1 , y 2 ,, y 40 gibi 40 tane gözlem içeren örnek olsun. Örnek ortalaması y için nokta tahmini olsun. Bu durumda hakkında belirsizlik azalmıştır . Ana kütlenin tamamı gözlenmemiş, sadece 40 gözlemden oluşan bir örnek ele alınmıştır . 31 …Giriş… Örnek gözlendikten sonra elde edilen bilgi, örnekten önce sahip olunan bilgiye göre daha kesin veya daha belirgindir. İlk soru: Örnekten önce ve sonra hakkındaki belirsizliği ifade edebilir miyiz? Yorum için ne kullanılmalıdır? İkinci soru; Örnek ile sağlanan bilgiden başka bilgi var mıdır? Örnek alınmadan önce; Haftalık ortalama gıda harcaması hakkında tam anlamıyla belirsizlik olmadığını ve onun değeri hakkında bir bilgiye sahip olunduğu varsayılsın: 32 …Giriş… Ön bilgi (apriori bilgi), daha önce alınan örneklerden elde edilen bilgiler ve edindiğimiz deneyimlerdir. Ön bilgi nasıl gösterilebilir? Örnek alındıktan ve hakkında ek bir bilgi elde ettikten sonra bilgi nasıl güncellenebilir? Bilgi toplama süreci nasıl tanımlanıp, kullanıma hazır hale getirilebilir? Ekonomik teori araştırmacıya bu konuda birçok ön bilgi sağlamaktadır . Eğer bir bilgiye sahip olmadan çalışmaya başlanırsa, örnekten önce ve sonra ortalama harcama hakkındaki belirsizlik nasıl ifade edilecektir? 33 Ortalama Harcamaya İlişkin Belirsizliğin İfade Edilmesi… Hanehalkı gıda harcaması verisi için istatistiksel model veya örnekleme süreci : yt et . yt t 1,2, ,T (1) t.nci hanehalkı için yapılmış gıda harcaması bilinmeyen parametre , et ise gözlemlenemeyen rastsal değişkendir et’nin ortalaması “0” ve varyansı 2 ile gösterilmektedir. Herbir yt’nin çekimi diğer çekimlerden bağımsızdır ve herhangi iki çekim arasındaki kovaryans sıfırdır (yt ve ys). Benzer şekilde et ve es arasındaki kovaryans da sıfıra eşittir. 34 …Ortalama Harcamaya İlişkin Belirsizliğin İfade Edilmesi… y x e E e 0 y ~ N ( x , 2 I T ) veya E ee' 2IT e ~ N (0, 2 I T ) (2) (3) x tüm elemanları bire eşit olan T boyutlu bir vektördür. x = (1, 1, ….,1) Bayesçi yorumlamanın temelinde varyans parametresi 2’nin bilindiği varsayılmaktadır. Örnek Sonrası Bilgi hakkında bir bilgiye sahip olunmadığı ve belirsizlik içinde olunduğu varsayılsın. 40 tane rasgele hanehalkı seçerek haftalık gıda harcamaları 35 gözlensin. …Ortalama Harcamaya İlişkin Belirsizliğin İfade Edilmesi… y1 , y 2 ,, y 40 ) y 23.5945 Tablo 1 s.77 den görüldüğü gibi y 23.5945 y örnek ortalaması örnek bilgisidir. Örnek bilgisi elde edildikten sonra hakkındaki belirsizlik durumu olasılıkla ifade edilir: ’ nın olasılık yoğunluk fonksiyonu: Örnek alınmadan önce örnek ortalaması y olasılık yoğunluk fonksiyonunun bir tahmincisidir y ~ N , 2 / T (4) 36 …Ortalama Harcamaya İlişkin Belirsizliğin İfade Edilmesi… Tablo 1: Haftalık Hanehalkı Gıda Harcamaları Örneği 9.46 10.56 14.81 21.71 22.79 18.19 22.00 18.12 23.13 19.00 19.46 17.83 32.81 22.13 23.46 16.81 21.35 14.87 33.00 25.19 17.77 22.44 22.87 26.52 21.00 37.52 21.69 27.40 30.69 19.56 30.58 41.12 15.38 17.87 25.54 39.00 20.44 30.10 20.90 48.71 37 …Ortalama Harcamaya İlişkin Belirsizliğin İfade Edilmesi… y ~ N , 2 / T (4) bilgisi ile yoğunluk fonksiyonu, örnek ortalamasının olasılığını belirli herhangi aralık içinde tanımlamaktadır. (4)’den ( y ) ~ N (0, 2 / T ) olduğu bilinmektedir. Bu nedenle; ve 2 y z ~ N (0,1) / T y (5) rastsal değişkendir z değişkeni rastsal değişken z veya y ’nın olasılık ifadeleri, için hipotez testleri veya aralık tahminleri oluşturmak için kullanılmaktadır. parametresi sabit olarak ele alınmıştır. 38 …Ortalama Harcamaya İlişkin Belirsizliğin İfade Edilmesi… ’nın olasılık yoğunluk fonksiyonunu hesaplarken (5) eşitliği ile başlanır: y (5) z ~ N (0,1) / T y z T z T y z T y z T T y y T T z 39 …Ortalama Harcamaya İlişkin Belirsizliğin İfade Edilmesi… sabittir. / T ve , z’nin doğrusal fonksiyonudur. y Normal rastsal değişkenlerin doğrusal fonksiyonları, normal rastsal değişkenlerdir. normal dağılıma sahiptir. Ortalaması: y z T E y Ez y T 2 2 var( ) var( z ) T y z ~ N (0,1) / T T ~ N ( y, / T ) 2 nın olasılık yoğunluk fonksiyonu (6) 40 …Ortalama Harcamaya İlişkin Belirsizliğin İfade Edilmesi… Bu fonksiyon örnek alındıktan sonra hakkındaki belirsizliği ifade etmek için kullanılmaktadır. Çünkü eşitlik (6) normal olasılık yoğunluk fonksiyonudur ve aşağıdaki gibi gösterilebilir: T f ( / y) 2 2 1/ 2 T 2 y exp 2 2 (7) f ( / y ) örnek bilgisi y gözlemlendikten sonra hakkındaki belirsizliğin ifadesini gösterir. f () kullanılmaktadır. Örnek sonrası yoğunluk fonksiyonu yerine 41 …Ortalama Harcamaya İlişkin Belirsizliğin İfade Edilmesi… Örnek Öncesi Bilginin Güncellenmesi f ( )’nın dağılımı hakkındaki bilgisizliği ifade etmek için spesifikasyon seçimi ve örnek öncesi yoğunluk fonksiyonu olarak bilinmektedir. Bu yoğunluk fonksiyonu ve aralığında uniform yoğunluk fonksiyonudur. Thomas Bayes, f ( ) yoğunluk fonksiyonunu örnekten bilgi sağlamak şartı ile güncellemiştir. Güncellenen dağılım f ( / y ) fonksiyonudur ve “örnek sonrası yoğunluk fonksiyonu” olarak isimlendirilir ve (7) eşitliğindeki normal dağılım olasılık yoğunluk fonksiyonuna sahiptir. 42 …Ortalama Harcamaya İlişkin Belirsizliğin İfade Edilmesi… Örnek seçildikten sonra y 23.5945 2 57.6 bilindiği varsayılsın. Bu durumda dağılım tam olarak belirlenebilir. / T 57.6 / 40 1.44 2 hakkındaki bilgi aşağıdaki gibidir: ~ N ( y, 2 / T ) ~ N (23.5945, 1.44) (8) …Ortalama Harcamaya İlişkin Belirsizliğin İfade Edilmesi… Ortalama Harcama İçin Olasılık İfadeleri Yaklaşık olarak , 21$ ve 26$ değerleri arasında yer almaktadır. Ortalama harcamanın ne kadar olduğu hakkında herhangi bir fikre sahip olunmadığında bir örnek alınması önem taşımaktadır. y 23.5945 21 23.5945 26 23.5945 P(21 26) P z 1.44 1.44 P(2.1621 z 2.0046) 2 / T 57.6 / 40 1.44 0.962 Bu sonuç, haftada ortalama gıda harcamasının 21$ ve 26$ arasında olma olasılığının %96.2 olduğunu 44 göstermektedir …Ortalama Harcamaya İlişkin Belirsizliğin İfade Edilmesi… f y 0. 4 0. 3 0. 2 0. 1 20 22 24 26 28 Şekil 1: örnek sonrası yoğunluk fonkisyonu 45 …Ortalama Harcamaya İlişkin Belirsizliğin İfade Edilmesi… Aralık Tahmini Belirli bir olasılık değeri ile ’yı kapsayacak güven aralığı ne olacaktır? P(a1 a2 ) 0.95 ifadesini sağlayan bir çok aralık vardır. Seçilecek aralık en çok bilgiyi ifade etmeli ve en dar olmalıdır. 23.5945 P 1.96 1.96 0.95 1.44 P 23.5945 1.96 1.44 23.5945 1.96 1.44 0.95 P(21.24 25.95) 0.95 46 …Ortalama Harcamaya İlişkin Belirsizliğin İfade Edilmesi… Bu sonuca göre haftalık gıda harcaması 0.95 olasılıkla 21.24$ ile 25.95$ arasında yer almaktadır. Elde edilen bu aralık tekrarlı örneklem teorisi ile aynıdır. Bu bölümde farklı yorumlar gösterilecektir: Örneğin gözlendiği ve bir olasılık yoğunluk fonksiyonu açısından ile ilgili belirsizliğin söz konusu olduğu durumda %95 olasılıkla ’i içeren aralık ne şekilde olacaktır? Aralığın sınırları verilmiş ve bilinmemektedir. Bu bölümdeki fark, sonuçların olasılık ifadesi olarak açıklanmasıdır. Güven aralıkları ile birlikte olasılık 47 teknikleri kullanılmaktadır. …Ortalama Harcamaya İlişkin Belirsizliğin İfade Edilmesi… Hipotezlerin Karşılaştırılması CEO, kuruluştan ve yeni perakende mağaza yönetiminden, maliyetler ve gelir ile ilgili bilgileri toplamış olsun. Eğer ortalama gıda harcaması hafta başına 22$ ise, yeni bir perakende mağaza açmanın faydalı olacağına karar verecektir. Bu durumda hipotezler: H 0 : 22 H 1 : 22 Örnek alındıktan fonksiyonu (9) sonra, ~ N (23.5945, 1.44) olarak örnek her hesaplamak için kullanılacaktır. bir sonrası yoğunluk hipotezin olasılığını 48 …Ortalama Harcamaya İlişkin Belirsizliğin İfade Edilmesi… 22 23.5945 P( H 0 ) P( 22) P z 1.44 P( z 1.3288) 0.092 PH 1 P 22 1 P 22 0.908 Hafta başına ortalama, en az 22$ harcama olasılığı 0.908 dir. Fark oranı K 10 P( H 1 ) 0.908 K10 9.87 P( H 0 ) 0.092 (10) H1 hipotezi, H0 hipotezine göre yaklaşık olarak 10 kat daha fazla olasılıkla doğrudur. 49 …Ortalama Harcamaya İlişkin Belirsizliğin İfade Edilmesi… İstatistiksel karar teorisi, eşitlik (10) da verilen fark oranına bağlı olarak H0 ve H1 i seçmekle ve yanlış karar verilmesiyle ortaya çıkan kayıplarla ilgilenmektedir. Daha önceki konularda H0 hipotezinin kabul yada red kuralları tanımlanmıştı. Bu kurallar örnek ortalaması y ’nın H0 hipoteziyle uyumlu olup olmamasına bağlıdır. Bu yaklaşım yanlış karar ile ortaya çıkan kayıpları açıkça önlememektedir. 50 …Ortalama Harcamaya İlişkin Belirsizliğin İfade Edilmesi… Kayıp Fonksiyonu: İyi bir tahminci, • Bir parametreyi gerçek değerine yakın olarak tahmin etmelidir. • İyi bir tahmin edici için, tahmin hatası ortalama seviyede 0’a yakın olmalıdır. Herhangi bir parametresinin tahmini ̂ olsun. Böyle bir tahmin ve dolayısıyla tahmin hatası yapmaktan dolayı ortaya çıkan kaybı önlemek için bir fonksiyona ihtiyaç vardır. L ˆ , Bu fonksiyon kayıp fonksiyonu olarak adlandırılsın. 51 Kayıp Fonksiyonu: L ˆ , Doğal olarak, ve ˆ arasındaki uzaklık ne kadar büyükse, L ˆ , ’nın değeri de o kadar büyük olacaktır. Bir tahmincinin iyi olup olmadığını test etmek için istatistiksel bir ölçüye gereksinim vardır. Eldeki her farklı y örneğinden hareketle elde edilecek kayıp fonksiyonlarının ortalaması ( ya da beklenen değeri) böyle bir ihtiyaca cevap verebilir. 52 Kayıp Fonksiyonu: Risk fonksiyonu, kayıp fonksiyonunun beklenen değeri olarak tanımlanır ve aşağıdaki gibi hesaplanır ˆ b olduğu durum için 2 L , b c b 2 2 E L , b E c b L , b f y d c b f y d c sabittir ve ilgilenilen duruma göre farklılık göstermektedir. Bir istatistikçinin yukarıdaki beklenen değeri minimum kılacak şekilde bir tahminde bulunması gerekmektedir. Bu şekilde elde edilecek tahmin edici, literatürde ’nın bir Bayes tahmin edicisi olarak ifade edilmektedir. 53 Kayıp Fonksiyonu: ˆ olduğunda L(ˆ , ) 0 olur. Kayıp Fonksiyon Türleri: 1. Karesel Kayıp Fonksiyonu: 2 ˆ L(, ) c b 2. Mutlak Kayıp Fonksiyonu: L(ˆ , ) b 3. Sıfır – Bir Kayıp Fonksiyonu: 0, Eğer b a ˆ L(, ) 1, Eğer b a 54 Nokta Tahmini … ˆ, ’nın bir tahmini olsun: ’nın aşırı tahmini: ̂ ’nın eksik tahmini: ̂ durumlarında ortaya çıkar. 55 Nokta Tahmini … ’nın örnek sonrası yoğunluk fonksiyonu E ortalamalı ’lı var lı olsun. Bu durumda en iyi nokta tahmini, kayıp fonksiyonundan elde edilen beklenen kaybı minimum yapan tahmindir. ˆ E a.var 2 örnek sonrası ortalama artık en iyi değildir. Çünkü E eksik tahminleme, aşırı tahminlemeden daha az risklidir. 56 …Nokta Tahmini… a = 2, E y 23.5945 ve var 2 T 1.44 olsun. Ortalama gıda harcamasının en iyi nokta tahmini ˆ E a.var 2 ˆ 23.5945 2x1.44 22.1545 2 57 …Bilgi Toplama… Belirsizlik altındaki karar problemlerinde, geçerli olan tüm bilgiden yararlanmalı ve bu bilgiler toplanmalıdır. Örneğin, örnek öncesi elde edilen sonuçlar geçerli olabilir ve basitçe ortalama harcama hakkında fikirlere sahip olunabilir. Örneklem alınmadan önce ile ilgili belirsizlik düzeyi veya bilgi durumu nasıl ifade edilir? Örneklemi gözlemledikten sonra, sahip olunan bilgi nasıl güncellenebilir veya belirsizlik düzeyindeki azalış nasıl tanımlanabilir? Diğer bir değişle bilgi süreci için ne uygulanır? 58 …Bilgi Toplama… Ön Bilginin Dahil Edilmesi İstatistiksel model yt et . Gözlemleri kullanarak gıda üzerindeki ortalama harcama hakkında bilgi edinmeye devam edilsin. Burada et lar bağımsız et ~ N (0, 2 ) dağılışı göstermektedir. 2 bilinmektedir. 59 …Bilgi Toplama… hakkındaki örnek öncesi veya başlangıç bilgisi; örnek öncesinden, sahip olunan bilgiden veya uzmanların görüşünden elde edilebilmektedir. Bu kısımda da küçük bir örnek ile pilot çalışması yapılarak ön bilgi elde edilmeye çalışılacaktır. (T0) 60 …Bilgi Toplama… 40 gözlem içeren örneklemden önce altı hanehalkını içeren küçük bir pilot çalışması yapılsın. s.87. Tablo 2 Örnek bilgisi 1 6 y 0 y t 25.475 6 t 1 1 6 ˆ ( y t y 0 ) 2 53.27187 5 t 1 y1 23.5945 ˆ 12 66.84738 2 0 Sıfır indisi altı haneyi, bir indisi 40 haneyi göstermektedir. To pilot çalışma örnek büyüklüğü ; T1 büyük örnek büyüklüğüdür. 61 …Bilgi Toplama… Tablo 2 pilot çalışmasındaki altı hane için haftalık gıda harcaması 30.00 23.69 29.04 11.48 30.83 27.81 62 …Bilgi Toplama… 2 nin bilindiği varsayılsın. İlk olarak pilot çalışmadan elde edilen bilgi (ön bilgi), örnek sonrası yoğunluk fonksiyonu tarafından kullanılabilmektedir. 2 ~ N y0 , T0 2 / T0 57.6 / 6 9.6 ~ N(25.475, 9.6) İkinci olarak bir sonraki adım örneklemi büyütmektir. Yani, bilgiyi arttırmak-güncellemek için, 40 gözlem içeren örnek alınırsa; 40 gözlem ele alındığında, 2 / T1 57.6 / 40 1.44 y1 23.5945 63 …Bilgi Toplama… Ön bilgi ihmal edilirse, olasılık yoğunluk fonksiyonu ile ilgili yeni örnek bilgisi: 2 ~ N y1 , T1 ~ N(23.5945, 1.44) Üçüncü olarak iki bilgi nasıl birleştirilecektir. Say.89 Şekil 4 . 64 …Bilgi Toplama… f y Şekil 4: biliniyorken iki örnekten için yoğunluk fonksiyonları 65 …Bilgi Toplama… Pilot çalışmadan elde edilen yoğunluk fonksiyonu, T1 f ( / y1) gözlemli örnekten elde edilen yoğunluk fonksiyonuna göre daha fazla yayılmaktadır. İlave yayılma, hakkındaki ilave belirsizliği göstermektedir. f ( / y0 ) dan elde edilen %95 güven aralığı P 19.40 31.55 0.95 f ( / y1) dan elde edilen %95 güven aralığı P 21.24 25.95 0.95 İkinci güven aralığı daha dardır. …Bilgi Toplama… Yukarıdaki iki bilgi Bayes kuralı ile birleştirilebilir. Örnek sonrası yoğunluk fonksiyonu için notasyon f ( / y0 , y1 ) Bu fonksiyon ortalama ve 2 varyans ile normal dağılmaktadır. Burada ön bilgi, örnek bilgisi ile güncellenerek örnek sonrası yoğunluk fonksiyonu elde edilir. 67 …Bilgi Toplama… ~ N ( , ) 2 2 ve y0 ve y1 T0 ve T1 den hareketle nasıl hesaplanır Örnek sonrası örnek ortalaması y0 ve ,, y1 ortalamalarına bağlıdır. üzerindeki bilginin güvenirlik hesaplamaları, duyarlılıkları ile yapılabilir. Bu duyarlılık, yoğunluk fonksiyonundaki varyansın tersidir. 68 …Bilgi Toplama… Her bir bilgi kaynağının duyarlılığı aşağıdadır: 1 T0 6 h0 0.10417 2 57.6 T0 2 1 T1 40 h1 0.69444 2 57.6 T1 2 Büyük örnek daha fazla duyarlılığa sahiptir. h0 ve h1 duyarlılıkları ile y 0 ile y1 in ağırlıklı ortalamasıdır. h0 y0 h1 y1 T0 y0 T1 y1 6(25.475) 40(23.5945) 23.8398 h0 h1 T0 T1 6 40 69 …Bilgi Toplama… 23.8398, almaktadır. y0 25.475 ve y1 y1 23.5945 arasında yer e yakındır. 2 ele alındığında birleştirilmiş bilginin duyarlılığı h , basit olarak her bilgi kaynağının duyarlılığının toplamına eşittir. h h0 h1 0.10417 0.69444 0.79861 2 1 1 2 57.6 1.25217 T0 T1 T0 T1 6 40 h h0 h1 2 2 1 Duyarlılık h , örnek sonrası yoğunluk fonksiyonunun varyansının tersidir. Varyans azaldıkça duyarlılık 1’e yaklaşmaktadır. 70 …Bilgi Toplama… Örnek sonrası yoğunluk fonksiyonundan sağlanan bilgi; ~ N (23.8398,1.25217) Şekil 5 (sayfa 90).Örnek sonrası yoğunluk fonksiyonu diğer iki dağılımdan daha az varyansa yani yayılıma sahiptir. Örnek sonrası yoğunluk fonksiyonunun, her iki örneği birleştirerek elde edilen birleştirilmiş örnek sonuçları ile aynı olduğu görülecektir (46 gözlemli). 71 …Bilgi Toplama… f ( | y) f( | y0 , y1 ) f ( | y1 ) f( | y0 ) 20 y1 y0 30 35 Şekil 5: 2 biliniyorken, iki kaynaktan bilginin birleştirilmesi 72 …Bilgi Toplama… h0 y0 h1 y1 T0 y0 T1 y1 6(25.475) 40(23.5945) 23.8398 h0 h1 T0 T1 6 40 idi. Yukarıdaki eşitlik aşağıdaki gibi yeniden yazılırsa T0 y0 T1y1 T0 T1 T0 T1 2 T0 T1 t 1 s 1 y t ys T0 T1 örnek hacminden elde edilen örnek sonrası yoğunluk fonksiyonun varyansı 2 / (T0 T1 ) olacaktır.Yani 1 1 2 57.6 1.25217 T T T0 T1 6 40 0 1 h h0 h1 2 2 1 ile aynı olacaktır. 73 …Bilgi Toplama Bu bölümdeki amaç; 2 biliniyorken nın normal populasyon ortalaması hakkında bilgi edinmektir. için y0 ortalamalı ve 2 T0 varyanslı örnek öncesi ya da örnek bilgisi ile y1 ortalamalı ve 2 T1 varyanslı normal yoğunluk fonksiyonlu örnek bilgisi varsa için normal yoğunluk fonksiyonu T0 y0 T1y1 T0 T1 2 T0 T1 ortalamalı varyanslı olacaktır. (Şekil 5) 74 İkinci Problem İçin Bayesçi Yorumlama… İkinci soru grubu, ön bilginin tanımlanması ve kullanılması ile ilgilidir: Ön bilgi nasıl gösterilebilir? Örnek alındıktan ve hakkında ek bir bilgi elde ettikten sonra bilgi durumu nasıl güncellenebilir? Bilgi toplama süreci nasıl tanımlanıp, kullanıma hazır hale getirilebilir? 75 … İkinci Problem İçin Bayesçi Yorumlama… Louisiana Fried Chicken’da (LCF) haftalık satışların ortalama ve 2 =4 varyans ile normal dağıldığı varsayılsın. Haftalık satışlar: y y ~ N ( , 4) 2 Ön bilgi LFC satış mağazasının haftalık satışları ile ilgilenilmektedir. Bu nedenle, haftalık satışların ortalaması hakkında bilgi toplasın. Örnekleme teorisine göre, haftalık satışlara ait örnek alınır. Böylece burada 10 gözlemli örnek alınsın. (Örnek Bilgisi) 76 …İkinci Problem İçin Bayesçi Yorumlama… y' (y1, y2 , , y10 ) (4.74, 7.11, 5.31, 6.28, 6.09, 8.52, 2.78, 7.38, 5.44, 5.72) Örneklem ortalaması nokta tahmini olarak kullanılırsa: 10 y y t / 10 5.937 t 1 %95 güvenle aralık tahmini: y 1.96 / T 5.937 1.96 2 / 10 (4.697, 7.177) Haftalık satışların ortalaması (5900$); 4700$ ile 7200$ arasındadır. 77 …İkinci Problem İçin Bayesçi Yorumlama… Ön Bilgi Tavuk üzerine hazır gıda satışı yapan bir mağazada daha önceden haftalık tavuk satışları ile ilgili bazı fikirlerin olduğu varsayılsın. %95 olasılıkla ortalama haftalık satışların 5000$ ile 11000$ arasında olduğuna inanılmaktadır: P(5 11) 0.95 Olası değerleri ile ilgili subjektif ön yoğunluk fonksiyonu, ortalama ve 2 varyansa sahip ve normal dağılım göstermektedir. ~ N ( , 2 ) 78 …İkinci Problem İçin Bayesçi Yorumlama… 2 ? ? Normal dağılımın yazılabilir: özelliğini kullanarak aşağıdaki eşitlik 5 11 0.95 P(5 11) P standart normal dağılımdır. N(0,1) dir. z P 1.96 1.96 0.95 5 11 1.96 ve 1.96 8 1.5306 ve 2 2.3427 79 …İkinci Problem İçin Bayesçi Yorumlama… LFC örneğinde ön bilgi aşağıdaki gibidir: ~ N , 2 N 8, 2.3427 Slayt 79 Eğer normal dağılım hakkındaki ön bilgiyi ifade etmek için uygunsa, ön bilgiye dayalı yoğunluk fonksiyonu f () olur. Daha önceden yapılmış pilot çalışması için ön bilgi ise aşağıdaki gibi yazılmaktaydı: 2 ~ N y0 , T0 Slayt 64 80 …İkinci Problem İçin Bayesçi Yorumlama… Bu olayda pilot çalışması yoktur. Bununla beraber bir önceki hipotetik örnekten geliyormuş gibi ~ N , 2 ifadesindeki bilgi kullanılır. y0 2 2 T0 Bu değerleri hesaplayabilmek için y0 ve T0 a ihtiyaç vardır. y0 8 slayt 79 2 4 2 2.3427 T0 T0 4 T0 1.7074 2.3427 Varsayılan örneklemin hacmi 1.7074 tür. Bu değer tam değer olmayıp işlem için geçerli değildir. 81 …İkinci Problem İçin Bayesçi Yorumlama… Ön Bilginin Güncellenmesi Kısım 3’te, normal olasılık yoğunluk fonksiyonu biçiminde ifade edilen örnek öncesi bilgi ile normal olasılık yoğunluk fonksiyonundan gelen örnek bilgisi birleştirildiğinde, elde edilen sonucun, ortalama ve varyans ile birlikte normal örnek sonrası olasılık yoğunluk fonksiyonu olduğu ifade edilmişti. T0 y0 T1 y1 T0 T1 2 2 T0 T1 Sonuçlar; T0 1.7074 T1 10 slayt.76-77 y0 8 y y1 5.937 10 y t 1 t / 10 5.937 2 4 82 …İkinci Problem İçin Bayesçi Yorumlama… T0 y0 T1 y1 T0 T1 2 2 T0 T1 (1.7074)(8) (10)(5.937) 6.238 1.7074 10 2 4 0.3417 1.7074 10 Haftalık ortalama satışlar için yoğunluk fonksiyonu örnek sonrası olasılık ~ N (6.238, 0.3417) Örnek öncesi ve sonrası olasılık yoğunluk fonksiyonları Şekil 6 dadır. Grafikler incelendiğinde örnek bilgisinin etkisi görülmektedir. Örnek bilgisi, dağılımı sola kaydırmıştır. 83 f () f ( | y) f ( | y) f () 3 4 5 6 7 8 9 10 11 12 13 Şekil 6: biliniyorken için ön ve örnek sonrası yoğunluk fonksiyonları 84 …İkinci Problem İçin Bayesçi Yorumlama… Aralık Tahmini Örnek sonrası olasılık fonksiyonundan ~ N (6.238, 0.3417) haftalık ortalama satışlar için aralık tahmini gerçekleştirilmektedir. 6.238 0.3417 ~ N (0,1) %95 olasılıkla aralık tahmini; 6.238 P 1.96 1.96 0.95 0.3417 veya P(5.092 7.384) 0.95 85 …İkinci Problem İçin Bayesçi Yorumlama… Hipotez Testi Tek yönlü hipotez testi: H0 : 5 Mağazayı satın almak karlı değildir. H1 : 5 Mağazayı satın almak karlıdır. LFC örneği kapsamında hipotez tavuk ürünleri satış mağazasının satın alınıp alınmayacağı ile ilgili olsun. Eğer H1 hipotezi doğru ise mağazayı satın almak karlı olacaktır. Tam tersi ise satın almak yanlış olacaktır. Yapılacak ilk adım ilgili test istatistiğini hesaplamaktır. ˆ 5 5.937 5 z 1.482 / T 2 / 10 Bkz. Sayfa 82 86 …İkinci Problem İçin Bayesçi Yorumlama… %5 anlamlılık düzeyinde kritik tablo değeri z 0.05 1.645 z 1.482 1.645 tir. olduğu için H0 reddedilemez. Bu nedenle satış mağazasını satın almak karlı olmayacaktır. Örnek sonrası yoğunluk fonksiyonu kullanıldığında; ~ N (6.238, 0.3417) P( H 0 ) P( 5) 5 6.238 P z 0.3417 P( z 2.12) 0.017 P( H1 ) P( 5) 0.983 87 …İkinci Problem İçin Bayesçi Yorumlama… H0 ın fark oranı: K 01 P( H 0 ) / P( H1 ) 0.017 / 0.983 0.0173 H1 ın fark oranı: K10 P( H1 ) / P( H 0 ) 0.983 / 0.017 57.8 H1 hipotezi H0 hipotezine göre 57 kat olabilirlikle daha doğrudur. Bu örnek iki çıkarsamaya ilişkin sonuçların nasıl farklı olduğunu göstermektedir. Bu farklılık için elde edilen ön bilgiye bağlı olmaktadır. 88