TOBİT MODEL 1 Sansürlenmiş ve Kesikli Regresyon Modelleri… Sınırlı bağımlı değişkenler: • sansürlenmiş (censored) ve • kesikli (truncated) regresyon şeklinde iki gruba ayrılır. modelleri 2 …Sansürlenmiş ve Kesikli Regresyon Modelleri… • Sansürlenmiş örneklem, bağımsız değişkenin bilinen değerlerine karşılık, bağımlı değişkenin gözlemlerinin bazılarının gözlenememesidir. • Örneğin ücret haddini belirleyen etkenler ile ilgili bir araştırmada çalışan bireylere ait açıklayıcı veriler tanımlanabilirken, • çalışmayan bireylerin için herhangi bir ücret haddi gözlenemez. 3 …Sansürlenmiş ve Kesikli Regresyon Modelleri… Orijinal Gözlemler Birey yas eglence 1 49 129.0968 2 39 919.3548 3 52 0 4 60 48.3871 5 75 0 6 42 7047.009 7 26 0 8 65 0 9 40 4380.906 10 50 0 11 67 4577.039 12 42 830.7553 13 31 0 14 29 211.5408 15 61 0 16 50 279.5166 17 35 1480.242 18 36 1631.42 19 44 1812.689 20 54 2009.003 Sansürlü Gözlemler Kesikli Gözlemler yas eglence yas eglence 52 0 75 0 26 0 65 0 50 0 31 0 61 0 60 48.3871 60 48.3871 49 129.0968 49 129.0968 29 211.5408 29 211.5408 50 279.5166 50 279.5166 42 830.7553 42 830.7553 39 919.3548 39 919.3548 35 1480.242 35 1480.242 36 1631.42 36 1631.42 44 1812.689 44 1812.689 54 2009.003 54 2009.003 40 4380.906 40 4380.906 67 4577.039 67 4577.039 42 7047.009 42 7047.009 Orijinal Gözlemler Birey 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 yas 49 39 52 60 75 42 26 65 40 50 67 42 31 29 61 50 35 36 44 54 eglence 129.0968 919.3548 0 48.3871 0 7047.009 0 0 4380.906 0 4577.039 830.7553 0 211.5408 0 279.5166 1480.242 1631.42 1812.689 2009.003 Probit modeli için bağımlı değişken 1 1 0 1 0 1 0 0 1 0 1 1 0 1 0 1 1 1 1 1 Eğer eglence>0, bağımlı değişken 1 değerini almaktadır. Orijinal Gözlemler Sansürlü Gözlemler Kesikli Gözlemler egitim telefon ceptel bilgisay egitim telefon ceptel bilgisay egitim telefon ceptel bilgisay 8 0 0 0 0 0 1 0 8 1 0 0 0 1 0 0 0 0 1 0 0 1 1 0 8 1 4 0 0 1 2 1 8 1 0 0 0 1 1 1 0 1 0 0 0 0 0 1 0 1 1 0 0 0 0 1 8 1 1 0 0 1 1 0 0 1 2 1 0 1 2 0 0 1 1 1 8 0 0 0 11 1 1 0 8 1 0 0 8 1 0 0 8 1 2 0 8 1 4 0 8 1 4 0 0 0 0 1 8 1 0 0 8 1 0 0 0 0 0 1 8 1 1 0 8 1 1 0 11 1 1 0 8 1 2 0 8 1 2 0 8 1 1 0 8 1 1 0 8 1 1 0 0 1 1 0 8 1 2 0 8 1 2 0 11 1 1 0 11 1 1 0 11 1 1 0 8 1 2 0 11 1 1 0 11 1 1 0 0 1 2 0 11 1 1 0 11 1 1 0 Orijinal Gözlemler egitim 8 8 0 8 8 0 0 8 0 0 11 8 0 0 11 8 0 11 8 0 telefon 0 1 0 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 ceptel 0 0 1 4 0 0 1 1 2 1 1 2 0 0 1 1 1 1 2 2 bilgisay 0 0 0 0 0 0 0 0 1 1 0 0 1 1 0 0 0 0 0 0 Probit modeli için bağımlı değişken 1 1 0 1 1 0 0 1 0 0 1 1 0 0 1 1 0 1 1 02 Eğer egitim>0 ise, bağımlı değişken 1 değerini almaktadır. …Sansürlenmiş ve Kesikli Regresyon Modelleri… • Kesikli örneklem, bağımsız değişkenin değerlerinin ancak bağımlı değişken gözlenebilir iken tanımlanmasıdır. • Kesikli örnekte bağımlı değişkenin verisinin örneğin 100’den küçük olduğu tüm durumlar çıkarılır. Kesme işlemi örneklemi değiştirirken, sansürleme örneklemi değiştirmez. • Örneğin tamamındaki bağımsız değişkenler gözlendiğinde sansür ortaya çıkmaktadır. Sansürlü regresyon modeline Tobit model denir. 8 …Tobit Modeli… Belirli bir dönemde bireylerin dayanıklı tüketim malları veya otomobil üzerine harcamalarının sıfır değeri aldığı görülebilir. Sadece, pozitif değerler alan bağımlı değişkenli doğrusal regresyon modelleri probit modellere benzerliğinden dolayı tobit modeller olarak bilinmektedir. Bağımlı değişkenin, değişim aralığının herhangi bir şekilde sınırlandırıldığı regresyon modellerinde eğer belirli bir aralığın dışındaki gözlemler tamamen kaybediliyorsa kesikli model, ancak en azından bağımsız değişkenler gözlenebiliyorsa sansürlü model söz konusu olmaktadır. …Tobit Modeli… • Bir konserin biletlerine olan talebi modellemede sahip olunan veri: • satılan biletlerin sayısı kadardır, • eğer konser kapalı gişe oynarsa talep, mevcut maksimum bilet sayısını aşar ve biletlere olan talep, mevcut biletlerin maksimum sayısı ile sansürlenir. Bu gibi durumlarda Tobit model kullanılır. 10 …Tobit Modeli… Probit ve logit modellerde gözlenen bir kukla değişken, 1 , y i 0 ise yi 0, y 0 ise i (1) şeklindedir. y xt ut * i i =1,…,T biçimindeki regresyon modelinde, 11 …Tobit Modeli… yi , βx i u i 0 yi 0 , βx i u i 0 (2) βx i u i 0 olduğunda y i üzerinde bazı gözlemler sıfır değerini almaktadır. yi X i ui (2) no’lu Tobit Modelinde modelinde negatif veya sıfır değerini alan yi gözlemleri ihmal edildiğinde, ui>-Xi için gözlemlerin modele katılması ile ui hata terimi sıfır ortalamaya sahip olamaz. 12 …Tobit Modeli… Bu nedenle ui ortalaması sıfırdan farklı bir kesikli normal dağılıma sahiptir. Böylece ui IN (0, 2 ) olur ve bu ifadeTobit modelini verir. 13 …Tobit Modeli… yt X t e t (3) Yt max{ yt , L} • (3) nolu Tobin’in Tobit Modelinde • yt bir görünmeyen değişken, • Xt açıklayıcı değişkenlerin bir vektörü, parametreler vektörüdür. et, normal özdeş ve bağımsız olarak dağılmış rassal kalıntı değişkenidir. • Yt gözlenen bağımlı değişken ve L sansürlenen noktadır. 14 …Tobit Modeli… • Veriler belirli bir limitin altında veya üstünde sınırlandırıldığında, uygulanan dağılım, örneklem sürekli verilerine ve süreksiz dağılımların bir karması olur. • Bağımlı değişken kesikli hale getirildiğinde, belirli bir aralıktaki değerler tamamen tek bir değere dönüştürülür. 15 …Tobit Modeli… • Tobit modeller için hata terimlerinin normal dağıldığı (veya genel olarak parametrik biçimli dağılım fonksiyonuna sahip olduğu) bilindiğinde maksimum benzerlik ve diğer benzerlik bazlı süreçler, tutarlı ve asimptotik olarak normal dağılımlı tahmin edicileri verir. Bununla beraber, benzerlik fonksiyonunun varsayılan parametrik biçimi yanlış belirlendiğinde tahmin ediciler tutarsız olur. Tobit model, belirli bir değerde sansürlenmiş normal sürekli bir bağımlı değişkeni kullanır. 16 …Tobit Modeli… • Tobit analizde katsayılarının yorumu şöyledir: Sürekli bağımsız değişken için tüm değişkenler sabit iken x’deki bir birim artış y’de kadar beklenen bir değişme yapar. • Bağımsız değişken kukla değişkenli ise; “diğer tüm değişkenler sabit iken x değişkenine sahip olma, y’nin beklenen değerini kadar değiştirir” denir. 17 …Tobit Modeli… • Harcamanın negatif olamayacağı gerçeğinden hareketle dayanıklı tüketim malları üzerinde çalışan Tobin, hanehalkı harcamalarını analiz etmiştir. • Çalışmada dayanıklı tüketim malları harcaması, hanehalkı geliri belirli bir düzeyi aşana kadar sıfır kabul edilmiştir. • Başka bir örnek emek arzı, ücret oranı belirli bir düzeyi geçene kadar sıfır olarak alınmıştır. 18 …Tobit Modeli… • Bir ailenin tatile çıkması durumunda ailede bulunan birey sayısı ne kadar fazla ise yapılan harcamanın da o kadar büyük olması beklenir. • Buna karşılık, aileyi oluşturan birey sayısı ne kadar fazla ise ailenin tatile çıkma olasılığı da o kadar azdır. 19 …Tobit Modeli… • Kısacası, tatile çıkıp çıkmamayı belirleyen denklem ile yapılacağını tatilde belirleyen ne kadar harcama denklem birbirinin aynısı değildir. • Ampirik modelleme süreci bu farklı iki durumu yakalamalıdır. Bunlardan bir tanesi tatile çıkıp çıkmama ve diğeri de tatilde ne kadar harcama yapılacağı ile ilgilidir. Tobit modelinin bu durumu yansıtacak şekilde genelleştirilmesi gerekir. 20 Teorik Olarak Sansürleme Sorunu… • y*, sansürlenmemiş bağımlı değişken olsun. Şekil 1’in A paneli: • y*’ın verilen değerinin sıklık oranını gösteren eğrinin yüksek olduğu yerdeki y* dağılımını göstermektedir. • y* 1 olduğunda, taralı bölgeye karşılık gelen y* değeri bilinmiyorsa, o zaman, y* gözlemlenemeyen ancak görülmez olarak var olduğu bilinen bir değişken (latent variable) olarak kabul edilir. Sansürlü y değişkeni (1) denkleminde gösterilen şekilde tanımlanır. 21 Teorik Olarak Sansürleme Sorunu… yi * i y yi* 1 0 yi* 1 y* 1 y*, sansürlenmemiş bağımlı değişken 22 Teorik Olarak Sansürleme Sorunu… • B Paneli: • Sıfırda yığılmış sansürlü durumlardaki sansürlü y değişkenini göstermektedir. • Buradaki çubuk, Panel A’daki gölgelendirilmiş bölgedeki durumları içermektedir. • C Paneli : • Panel A’daki gölgeli bölgenin basitçe silinmiş hali olan kesikli y|y>1 (yani verilen y, 1’den büyük, y>1) değişkeninin şemasıdır. 23 Teorik Olarak Sansürleme Sorunu… • Sansür ve kesmenin doğrusal regresyon modelini etkileyip nasıl değiştirdiğini görmek için, doğrusal regresyon modelinin Şekil 2’de A Paneli sansürsüz 200 örneği göstermiş olsun. 24 Teorik Olarak Sansürleme Sorunu… sansürsüz 200 örnek yˆ * 1.18 0.08x EKKY • Şekil 2 X Şekil 2 Buradaki kalın çizgi en küçük kareler ile tahmin edilen modeldir. Sansür çizgisinin altındaki verilerinde dahil olduğu tüm veriler ile çalışılmaktadır. 25 Teorik Olarak Sansürleme Sorunu… Şekil 3 26 Teorik Olarak Sansürleme Sorunu… Panel B’de: 1’e eşit ya da 1’den düşük olan y* değerleri, sansürlü durumlarda y=0 ile sansürlenmiştir. Panel A’da sansür çizgisinin altındaki değerler bilinirken, burada söz konusu değerler sıfırla sansürlenmiştir. Bunlar küçük üçgenlerle gösterilmiştir. Parametreleri tahmin etmenin bir yolu sıfırlı bilgilerin de olduğu sansürlü verilerle y’nin x’e göre regresyonuna en küçük kareler yöntemi uygulamaktır. Teorik Olarak Sansürleme Sorunu… Ortaya çıkan sonuç, yˆ 0.95 0.11x. • Şekil 3’de görülen Panel B’deki uzun atılımlı çizgidir. Burada sabit terimin eksik ve eğimin ise aşırı tahminlenmesi durumu ortaya çıkmaktadır. Bu tür yaklaşım tutarsız tahmincilere yol açmaktadır. 28 Teorik Olarak Sansürleme Sorunu… • Sansürlü gözlemler problemlere yol açtığından, sansürlenmiş bağımlı değişken durumlarından kaçınmak için örneklemin kesildikten sonraki regresyonunu tahmin etmek için yine en küçük kareler kullanılabilir. • Bu durumda sansür sorunu, kesikli örnek sorununa dönüşmektedir. 29 Teorik Olarak Sansürleme Sorunu… y=0 olduğu durumları attıktan sonra kesikli model en küçük kareler ile yˆ 1.41 0.06 x olarak tahminlenmektedir. Bu tahmin sabit terimi aşırı, eğim katsayısını eksik tahmin eder. Bu durum Şekil 3’de kısa eğimli çizgiyle görülmektedir. Kesikli modelde x ile e arasındaki ilişki tutarsız tahminlere yol açar. 30 Tobit Modellerde Sansürleme Sorunu… • Tobit modeli tahmin etmede üçüncü yaklaşım, sansürlü regresyon modelidir. Tobit modeli, sansürlü bilgiyi kullanmakta ve de içeren tutarlı tüm verileri parametrelerin tahminlenmesini sağlamaktadır. Tobit modelde en çok benzerlik tahminleri koyu çizgiyle gösterilmiştir(Şekil 3). Bu çizgi sansürün olmadığı Panel A’daki tahminlere (onları belirten çizgiden) benzerdir. 31 Sansürlü Sonuçlarda Tobit Modeli… • Tobit modelde ei ~ N (0, 2) olduğunda denklem yapısı şöyledir: y xi e i * i (4) t:eşik değeri x’ler her durumda gözlemlenmektedir. y* ise; eşik değeri olan t’dan daha büyük değerlerde görülen, t’ya eşit yada daha küçük değerlerde sansürlenen, görünmeyen bir değişkendir. 32 Sansürlü Sonuçlarda Tobit Modeli… Gözlemlenen y, aşağıdaki denklem ile tanımlanır: * * y , y i i t yi * t , y y i t (5) (4) ve (5) denklemlerinin birleştirilmesi ile: * * y x e , y ise i i i i t yi * , yi t ise. t y Yukarıdaki modellerde bir sansürleme durumunda Tobit modeli kullanılabilir. (6) olması 33 …Sansürlü Sonuçlarda Tobit Modeli… Örnek: 100.000 $ ve fazla olan gelirlere sansür konursa bu durumda Tobit modeli şöyle gerçekleşecektir: t 100000$ * * yi xi e i , yi t ise yi * , yi t ise. t y (7) 34 Tobit ve Probit Arasındaki Bağlantı • Tobit ve Probitin yapısal modelleri benzer ancak modeller birbirinden farklıdır. • Tobit modelinde y*> t iken bağımlı değişkenin gözlenen değerleri bilinmektedir. Probit modelinde sadece y*> t ise y bir değerini almaktadır. Ancak veriler eşiğin (t) altında ise bilinmemektedir ve y sıfır kabul edilmektedir. • Tobit modeli hakkında mevcuttur.Tobit modelden daha elde fazla edilen bilgi katsayı tahminlerinin, Probit modelden elde edilenden daha etkin çıkması beklenmektedir. 35 Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… • Bir Monte Carlo deneyi için elde edilen regresyon modeli aşağıdadır: Y 40 1.2 X u (8) • Burada X, 11 ile 60 arasında değişen tam sayılardan oluşmaktadır. Hata terimi u ise, ortalaması 0, standart sapması 10 olan normal dağılmış bir şans değişkenidir. • Eğer Y sınırlanmamış ise, tüm gözlemler Şekil 4’deki gibidir. 36 …Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… Şekil 4 37 …Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… •Y değişkeni için negatif değerler alınmaz ve sıfır sınırı konursa, gözlemler Şekil 5’deki gibi değişikliğe uğrar. Şekil 5 38 …Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… • EKKY ile elde edilen regresyon modelinde, Y değişkeni için negatif değerler alınmadığı ve bunun yerine 0 değerleri alındığı için tutarsız tahminler elde edilir. Böylece tahminci aşağı doğru eğim gösteren bir sapmaya sahip olurken, sabit terim de yukarı doğru sapmalı elde edilecektir. • Bunun çözümü, sadece sınırlandırılmamış gözlemlerin bir alt örneklemi ile mümkün olmaktadır. Fakat bu durumda bile EKK tahmincileri 39 sapmalı olacaktır. …Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… • Yi>0 olduğu durumda model: –40 + 1.2Xi + ui > 0 şeklinde elde edilir. (9) Buradan; ui > 40 – 1.2Xi bulunur. (10) 40 …Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… ui’nin dağılımı kesikli bir dağılımdır. ui’nin beklenen değeri pozitif ve Xi’nin negatif bir fonksiyonu olacaktır. ui ile Xi arasında negatif bir ilişki olduğundan Gauss-Markov teoremi çiğnenecek ve EKK tahmincileri tutarsız olacaktır. Şekil 6 41 Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… Şekil 7’de bu ilişkinin etkisi açıkça görülmektedir. X’in en düşük dört gözlem değerine karşılık gelen hata terimlerinin (dört hata terimi) değerleri pozitiftir. Y’yi pozitif yapmak için yeterli büyüklükte olacaklardır. Ancak, stokastik olmayan Y bileşimini pozitif yapacak kadar büyük değerlerin bulunduğu aralıkta, büyük negatif değerlere gözlemler atılmıştır. sahip olan hata terimli 42 …Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… Şekil 7’de bu üç negatif hata teriminin değerleri daire şeklinde görülmeltedir. Bunun EKK’deki etkileri, sabit terimin olduğundan büyük ve eğimin olduğundan küçük tahminlenmesi şeklinde olacaktır Şekil 7 43 …Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… • Eğer normal dağılıma sahip bir hata terimi elde edildiği varsayılırsa, bu problemin tek çözümü, regresyon analizi ile probit analizinin birleşiminden oluşan en çok benzerlik tahmin tekniği olarak bilinen tobit analizini kullanmaktır. • Hanelerin harcamalar, ihtiyaçları Tüketici için yapmış Harcamaları olduğu Anketi veri setinden bir örnek alınarak incelenecektir. 44 …Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… • Şekil 8’de hanehalkı ihtiyaç harcamaları (HEQ) ile toplam hanehalkı harcamaları (EXP) grafik olarak gösterilmiştir. • 869 haneden 86 hanenin hanehalkı ihtiyaçları harcaması sıfır değerini almıştır, yani bu haneler hanehalkı ihtiyaçları için hiçbir harcamada bulunmamışlardır. 45 Hanehalkı İhtiyiaçları Harcaması ($) …Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… Hanehalkı Harcaması ($) Şekil 8 46 …Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… Aşağıda bu verilere uygulanan tobit regresyon sonucu verilmiştir: HEQ= -661,8156 + 0,0520828 EXP s(bi) (97,95977) (0,0027023) t (-6,756) (19,273) Prob (0,0000) (0,0000) (11) N: 869 chi2 (Prob): 315,41 (0,0000) Pseudo R2: 0,0223 Log Likelihood: -6911,0175 Gözlemler için özet sonuç: HEQ<=0’da soldan-sansürlü 86 gözlem Sansürlenmiş 783 gözlem 47 …Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… • Eğer bu verilerden önce sıfır değerli gözlemleri içeren (N=869) modele EKKY uygulanırsa eğim katsayısı 0.0472 • sonrasında da sıfır değerli gözlemleri içermeyen veri seti (N=783) alınıp EKKY uygulanırsa, eğim katsayısı 0.0468 olarak bulunacaktır. • Tobit modelde eğim katsayısını 0.052 bulmuştu. 48 …Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… • Her iki tahmin edilen eğim katsayıları beklendiği şekilde tobit tahmini ile bulunan eğim katsayılarından daha düşük değerli elde edilmiştir. • Bu durumda aradaki fark sadece %10 kadar bir sınırdadır. • Bu da Tobit ve EKKY tahminleri arasında çok düşük bir fark olduğunu gösterir. 49 …Tobit Model ile EKKY’nin Bir Örnekle Karşılaştırılması… •Eğer hata terimi normal dağılımlı değilse ve değişen varyans varsa Tobit regresyon uygulandığında tutarsız tahminciler elde edilecektir. •Şekil 8’den de görüldüğü üzere, örnekteki gözlemler değişen varyansa neden olmaktadır. Bu da bağımlı değişkenin hanehalkı ihtiyaçları harcamasının, hanehalkı toplam harcamasının oranı olarak uygulanmasıyla kaldırılabilir. muhtemelen ortadan Seçim Yanlılığı… • Regresyon modelleri tahminlerinde örneklemenin yaklaşık olarak tesadüfi yapıldığı varsayılmaktadır. Bu konuda yakın geçmiş literatür incelendiğinde tesadüfi olmadan seçilen örneklemler için regresyon model tahminlemenin önemli bir yer oluşturduğu görülmektedir. • Örneklem tesadüfi olsa bile bağımlı değişken kayıp değerler içeriyorsa seçim yanlılığından bahsedilebilir. 51 …Seçim Yanlılığı… •Ekonometride ihmal edilen değişkenler veya spesifikasyon hatası için alışılmış analizlerin aksine örnek seçim yanlılığı analizinde, spesifikasyon hatasını arttıran değişkenlerin tahmin edilmesi bazen mümkündür. •Uygulamada, seçim yanlılığı iki nedenle ortaya çıkabilir. Birincisi, kişilerin bireysel seçimlerinden veya incelenen veri birimlerinden, ikincisi ise analistlerin ya da veri işlemcilerin kişisel örnek seçim kararlarından kaynaklanabilir. … Seçim Yanlılığı… •Bireysel seçim sapması konusunda bir çok örnek vardır. •Evli kadınların işgücüne katılımlarında, kadınların bazıları piyasa ücretleri, ev ücretlerini (rezervasyon ücretlerini) geçtiği zaman işgücüne katılmayı tercih edecektir. Eğer sadece çalışan evli kadınların ücretleri incelemeye alınırsa burada seçim yanlılığı yapılmış olacaktır. … Seçim Yanlılığı… • Benzer olarak, sendikalı ve sendikasız çalışan bireylerin olduğu veri grubunda sendikanın ücretlere olan etkisini tahminlemede de seçim yanlılığı söz konusudur. Eğer sadece sendikalı bireylerin ücretleri incelemeye alınırsa burada da seçim yanlılığı yapılmış olacaktır. • Ayrıca sadece göç edenlerin ücretleri analiz edildiğinde, göç etmemiş olanların göç etmiş olmaları durumunda kazanabilecekleri ücretlerin güvenilir bir tahmini olamaz. 54