˙ISTAT˙IST˙IK I KAVRAMLARININ G¨OZDEN GEC¸˙IR˙ILMES˙I

YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
1
$
İSTATİSTİK I KAVRAMLARININ
GÖZDEN GEÇİRİLMESİ
Hüseyin Taştan
Yıldız Teknik Üniversitesi,
İktisat Bölümü,
email: tastan@yildiz.edu.tr
&
YTÜ-İktisat İstatistik II
'
%
İstatistik I Gözden Geçirme
2
$
İSTATİSTİK BİLİMİNİN UĞRAŞI ALANLARI
• Veriden anlam çıkarılması, özetlenmesi
• Belirsizlik: neyin olduğu değil, neyin olası olduğu
• Örnekleme (sampling): anakütlenin (population) tümüne ait bilgi
toplamak çoğu zaman imkansızdır. Bunun yerine anakütleye ilişkin
analiz bu anakütleyi en iyi temsil eden bir örnekleme dayandırılabilir.
• İktisadi ilişkilerin analizi: Ekonometrinin alanı
• Kestirim (Prediction)
• Belirsizlik altında karar alma
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
3
$
İSTATİSTİK
İSTATİSTİK I
İSTATİSTİK II
Olasılık Teorisi
Örnekleme ve Örneklem Dağılımları
Rassal Değişkenler
Nokta ve Aralık Tahmini
Kesikli ve Sürekli R.D.
Hipotez Testi
Olasılık Fonksiyonu
Regresyon ve Korelasyon
Beklenen Değer, Moment
Parametrik Olmayan Testler
Normal Dağılım
Varyans Analizi
Merkezi Limit Teoremi
&
YTÜ-İktisat İstatistik II
'
%
İstatistik I Gözden Geçirme
4
$
RASSAL DEĞİŞKENLER ve OLASILIK DAĞILIMLARI
• Rassal (Stokastik) Değişken (r.d.) : Alacağı değer belli bir rassal
denemenin sonucuna bağlı olan, bu değere ilişkin kesinlik bulunmayan
değişken. Büyük harflerle göstereceğiz.
• x: rassal değişken X’in aldığı belli bir değer.
• Kesikli r.d. : Alacağı değerler sayılabilir (sonlu ya da sonsuz) olan
rassal değişkenler. Örneğin, iki zar atımında üste gelen sayıların
toplamı, belli bir üretim bandında bir çalışanın yaptığı hata sayısı,
bir bankaya 15 dk içinde gelen müşteri sayısı, vb.
• Sürekli r.d.: Belli bir aralıkta her hangi bir değeri alabilen rassal
değişken. Bir çok iktisadi değişken bu gruba girer, örneğin, bir
şehirdeki ortalama harcanabilir gelir, belli bir dönemdeki enflasyon
oranı, İMKB100 endeksinin kapanış değeri, bir yılda yapılan toplam
ihracat tutarı, vb.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
5
$
OLASILIK DAĞILIMLARI - KESİKLİ
• f (x) ile göstereceğiz,
• f (x) ≥ 0,
• f (x) = P (X = x),
P
•
x f (x) = 1, Bu toplam x’in alabileceği tüm değerler üzerinedir,
P
• Birikimli dağılım fonksiyonu: P (X ≤ x0 ) = F (x0 ) = x≤x0 f (x)
&
YTÜ-İktisat İstatistik II
'
%
İstatistik I Gözden Geçirme
6
$
KESİKLİ OLASILIK DAĞILIMLARI
• Örnek: 3 para atılıyor ve tura (T) gelme sayısı X ile gösteriliyor.
• Bu deneyde ortaya çıkabilecek sonuçlar şunlardır: (TTT), (TTY),
(TYT), (YTT), (TYY), (YTY), (YYT), ve (YYY). Bu 8 sonuç
karşılıklı olarak bağdaşmazdır ve herbirinin gelme olasılığı aynıdır.
Olasılık: 1/8.
• X’in alabileceği değerler: 0, 1, 2, and 3.
• X rassal değişkeninin dağılımını bulalım.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
Sonuçlar
x
f (x)
YYY
0
1/8
YYT
1
YTY
1
TYY
1
YTT
2
TYT
2
TTY
2
TTT
3
7
$
3/8
3/8
1/8
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
8
$
X’in olasılık dağılımı:
•
P
x
x
0
1
2
3
f (x) = P (X = x)
1
8
3
8
3
8
1
8
f (x) = 1
• P (X ≤ 1) =?
• P (1 ≤ X ≤ 3) =?
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
9
$
X’in birikimli olasılık dağılımı


0,





1


 8,
1
F (x) = P (X ≤ x) =
2,



7


8,



 1,
x < 0;
0 ≤ x < 1;
1 ≤ x < 2;
2 ≤ x < 3;
x ≥ 3.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
10
$
OLASILIK FONKSIYONU
0.4
0.35
0.3
f(x)
0.25
0.2
0.15
0.1
0.05
0
−1
−0.5
0
0.5
1
1.5
x
2
2.5
3
3.5
4
2.5
3
3.5
4
BIRIKIMLI OLASILIK FONKSIYONU
1
0.8
F(x)
0.6
0.4
0.2
0
−1
&
−0.5
0
0.5
1
1.5
x
2
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
11
$
Kesikli r.d.’lerin BEKLENEN DEĞERLERİ
• Kesikli r. d. X’in beklenen değeri
E(X) =
X
xf (x)
x
• g(x), X’in bir fonksiyonu olsun, g(x)’in beklenen değeri
X
E(g(X)) =
g(x)f (x)
x
&
YTÜ-İktisat İstatistik II
'
%
İstatistik I Gözden Geçirme
12
$
ÖRNEK
• Önceki örnekte X’in beklenen değerini bulun.
1
3
3
1
3
E(X) = 0 + 1 + 2 + 3 =
8
8
8
8
2
• (i) g(x) = x2 ’nin beklenen değerini bulun.
1
3
3
1
E(X 2 ) = 0 + 1 + 4 + 9 = 3
8
8
8
8
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
13
$
Kesikli r.d.’lerin VARYANSları
• Tanım:
V ar(X)
h
=
2
i
E (X − E(X))
E (X 2 − 2XE(X) + (E(X))2 )
E X 2 − 2E (XE(X)) + E (E(X))2 )
2
E X 2 − 2E(X)2 + (E(X))
E X 2 − E(X)2
=
=
=
=
• µx = E(X) dersek varyans
V ar(X) = E X 2 − µ2x
olarak yazılabilir.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
14
$
Kesikli r.d.’lerin MOMENTLERİ
• Tanım: Kesikli r.d. X’in knci momenti
X
µk = E(X k ) =
xk f (x) k = 0, 1, 2, ...
x
1. moment
µ1
=
E(X)
=⇒ populasyon ortalaması
2. moment
µ2
=
E(X 2 )
= V ar(X) + µ21
3. moment
µ3
=
E(X 3 )
4. moment
µ4
=
E(X 4 )
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
15
$
Kesikli r.d.’lerin MERKEZİ MOMENTLERİ
• Tanım: Kesikli r.d. X’in knci merkezi momenti
X
mk = E((X − µ1 )k ) =
(x − µ1 )k f (x) k = 0, 1, 2, ...
x
1. merkezi moment
m1
=
0
2. merkezi moment
m2
=
3. merkezi moment
m3
=
E((X − µ1 )2 )
4. merkezi moment
m4
=
= V ar(X)
E((X − µ1 )3 )
E((X − µ1 )4 )
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
16
$
Kesikli r.d.’lerin STANDART MOMENTLERİ
• Tanım: Kesikli r.d. X’in knci standart momenti
mk
γk = k k = 0, 1, 2, ...
σ
Burada σ populasyon standart sapmasıdır:
r h
i
p
2
σ = V ar(X) = E (X − µ1 )
1. standart moment
γ1
=
0
2. standart moment
γ2
=
1
neden?
3. standart moment
γ3
=
çarpıklık (skewness)
4. standart moment
γ4
=
m3
σ3
m4
σ4
&
basıklık (kurtosis)
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
17
$
Bazı Kesikli Dağılımlar
• Bernoulli
• Binom
• Hipergeometrik
• Poisson
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
18
$
Bernoulli(p) Dağılımı:
Beklenen Değer:

 p,
f (x) =
 1 − p,
E(X) =
if X = 1
if X = 0
X
xf (x) = p · 1 + (1 − p) · 0 = p
X
x2 f (x) = p · 1 + (1 − p) · 0 = p
x
İkinci Moment:
E(X 2 ) =
x
Varyans (ikinci merkezi moment):
V ar(X) = E(X 2 ) − (E(X))2 = p − p2 = p(1 − p)
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
19
$
BİNOM DAĞILIMI
X, n bağımsız Bernoulli denemesinde 1 değerini alma (başarı) sayısı
P
olsun. Yani eğer Y Bernoulli(p) ise X = (Y ), Binom(n, p) dağılımına
uyar. X toplam başarı sayısı.


n
n!
 px (1 − p)n−x =
px (1 − p)n−x , x = 0, 1, 2, . . . , n
f (x) = 
x!(n
−
x)!
x
E(X) = np
V ar(X) = np(1 − p)
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
20
$
HİPERGEOMETRİK DAĞILIM
Eğer Bernoulli denemeleri birbirinden bağımsız değilse, toplam başarı
sayısı Binom dağılımına uymaz. İçinde B tane başarı bulunan N nesneli
rassal bir örneklemde, toplam başarı sayısı X’in olasılık dağılımı

f (x) =

B
x




N
n
N −B
n−x




Burada x max(0, n − (N − B)) ve min(n, B) arasında tamsayı değerler
alabilir
E(X) = np,
&
V ar(X) =
N −n
np(1 − p),
N −1
p=
B
N
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
21
$
POISSON DAĞILIMI
Bir olayın belli bir zaman diliminde gerçekleşme sayısı
Notasyon: X ∼ P oisson(λ), pmf:
λx e−λ
f (x, λ) =
,
x!
x = 0, 1, 2, . . .
E(X) = λ
V ar(X) = λ
1
skewness = √
λ
excess kurtosis =
1
λ
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
22
$
Kesikli r.d. için ORTAK DAĞILIMLAR
ORTAK OLASILIK FONKSİYONU: Birden fazla r.d.’in ortak
davranışını betimlemek istiyoruz. Önce iki değişkenli durumu inceleyelim.
X ve Y iki r.d. olsun. Bunların ortak olasılık fonksiyonu
f (x, y) = P (X = x ∩ Y = y)
Daha genel olarak X1 , X2 , . . . , Xk k tane kesikli r.d. ise bunların ortak
olasılık fonksiyonu şöyle olur:
f (x1 , x2 , . . . , xk ) = P (X1 = x1 ∩ X2 = x2 , ∩, . . . , ∩Xk = xk )
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
23
$
X: Bir bankada 1 nolu gişede sırada bekleyen müşteri sayısı, Y : Bir
bankada 2 nolu gişede sırada bekleyen müşteri sayısı. Bu iki r.d. için
ortak olasılık fonksiyonu aşağıdaki tabloda verilmiştir.
y\x
0
1
2
3
Toplam
0
0.05
0.21
0
0
0.26
1
0.20
0.26
0.08
0
0.54
2
0
0.06
0.07
0.02
0.15
3
0
0
0.03
0.02
0.05
Toplam
0.25
0.53
0.18
0.04
1.00
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
24
$
MARJİNAL OLASILIK FONKSİYONU
Ortak olasılık fonksiyonu biliniyorsa, bundan hareketle marjinal ya da
tekil olasılık fonksiyonları elde edilebilir.
X’in marjinal olasılık fonksiyonu:
f (x) =
X
f (x, y)
X
f (x, y)
y
Y ’nin marjinal olasılık fonksiyonu:
f (y) =
x
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
25
$
KOŞULLU OLASILIK FONKSİYONU
Ortak olasılık fonksiyonu biliniyorsa, bundan hareketle koşullu olasılık
fonksiyonları elde edilebilir.
Y = y verilmişken X’in koşullu olasılık fonksiyonu:
f (x|y) =
f (x, y)
f (y)
X = x verilmişken Y ’nin koşullu olasılık fonksiyonu:
f (y|x) =
f (x, y)
f (x)
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
26
$
BAĞIMSIZLIK
X ve Y r.d.’lerinin istatistik bakımından bağımsız olduğunu
söyleyebilmemiz için aşağıdaki koşulun sağlanması gerekir:
f (x, y) = f (x)f (y)
Başka bir deyişle
f (x|y) = f (x),
&
vef (y|x) = f (y)
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
27
$
KOVARYANS
g(X, Y ), X ve Y r.d.’lerinin herhangi bir fonksiyonunu ifade etsin. Bu
fonksiyonun beklenen değeri:
XX
E [g(X, Y )] =
g(x, y)f (x, y)
x
y
g(X, Y ) = (X − µx )(Y − µy ) olsun. Bu fonksiyonun beklenen değerine
KOVARYANS denir:
XX
Cov (X, Y ) =
(x − µx )(y − µy )f (x, y)
x
y
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
28
$
SÜREKLİ RASSAL DEĞİŞKENLER ve OLASILIK DAĞILIMLARI
X sürekli bir r.d. ise verilmiş bir aralıkta herhangi bir değeri alabilir. Bir
sürekli rassal değişkenin belli bir değere eşit olma olasılığından (kesikli
r.d. gibi) bahsedemeyiz. Ancak verilmiş bir aralık içine düşme
olasılıklarını bulabiliriz.
f (x): olasılık yoğunluk fonksiyonu. Özellikleri:
• f (x) ≥ 0
R∞
• −∞ f (x)dx = 1
• P r(a < X < b) =
&
Rb
a
f (x)dx
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
29
$
f(x)
P(a <X <b) =
0
a
Rb
a
b
f(x)dx
x
&
YTÜ-İktisat İstatistik II
'
%
İstatistik I Gözden Geçirme
30
$
BİRİKİMLİ OLASILIK FONKSİYONU
X sürekli r.d. için birikimli olasılık fonksiyonu, ya da dağılım fonksiyonu,
X’in belli bir x değerini aşmama olasılığı olarak tanımlanır ve F (x) ile
gösterilir.
Z
x
F (x) = P (X ≤ x) =
f (t)dt
−∞
oyf ile dağılım fonksiyonu arasındaki ilişki:
f (x) =
&
dF (x)
dx
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
31
$
BİRİKİMLİ OLASILIK FONKSİYONU
F (x)’in özellikleri:
F (−∞) = 0,
F (+∞) = 1
Buna göre F (x), x’in azalmayan bir fonksiyonudur. x1 ≤ x2 olmak üzere
F (x1 ) ≤ F (x2 ).
Z b
f (x)dx
P (a < X < b) = F (b) − F (a) =
a
P (−∞ < X < +∞) = P (−∞ < X < a)+P (a < X < b)+P (b < X < +∞)
Z +∞
Z b
Z a
Z ∞
f (x)dx
f (x)dx +
f (x)dx +
f (x)dx =
b
a
−∞
−∞
F (+∞) − F (−∞) = [F (a) − F (−∞)] + P (a < X < b) + [F (+∞) − F (b)]
1 = F (a) − 0 + P (a < X < b) + 1 − F (b)
P (a < X < b) = F (b) − F (a)
&
YTÜ-İktisat İstatistik II
'
%
İstatistik I Gözden Geçirme
32
$
f(x)
F (+∞
) −F (b ) = 1 −F (b )
F (a) −F (−∞
) = F (a)
Rb
a
0
&
a
f(x)dx = F (b ) −F (a)
b
x
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
33
$
SÜREKLİ r.d.’lerin BEKLENEN DEĞERLERİ
Z ∞
xf (x)dx
E(X) ≡ µx =
−∞
g(x), X’in bir fonksiyonu ise,
Z
E(g(X)) =
∞
g(x)f (x)dx
−∞
V ar(X) =
Z
∞
−∞
(x − µx )2 f (x)dx
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
34
$
İntegral özellikleri kullanılarak V ar(X) aşağıdaki gibi yazılabilir:
Z ∞
2
V ar(X) = E (X − E(X)) ≡
(x − µx )2 f (x)dx
=
Z
∞
2
x f (x)dx +
−∞
=
Z
=
−∞
∞
−∞
∞
−∞
µ2x
Z
2
x f (x)dx −
2
E(X ) −
µ2x
Z
∞
−∞
f (x)dx − 2µx
2
xf (x)dx
Z
∞
xf (x)dx
−∞
R∞
R∞
Burada −∞ f (x)dx = 1 ve −∞ xf (x)dx = E(X) ≡ µx özelliklerini
kullandık. Bunu kesikli r.d.ler için de göstermiştik.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
35
$
Sürekli r.d.’lerin MOMENTLERİ
• Tanım: Sürekli r.d. X’in knci momenti
Z
k
µk = E(X ) =
xk f (x)dx
k = 0, 1, 2, ...
x∈X
1. moment
µ1
=
E(X)
=⇒ populasyon ortalaması
2. moment
µ2
=
E(X 2 )
= V ar(X) + µ21
3. moment
µ3
=
E(X 3 )
4. moment
µ4
=
E(X 4 )
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
36
$
Sürekli r.d.’lerin MERKEZİ MOMENTLERİ
• Tanım: Sürekli r.d. X’in knci merkezi momenti
Z
k
mk = E((X − µ1 ) ) =
(x − µ1 )k f (x)dx
k = 0, 1, 2, ...
x∈X
1. merkezi moment
m1
=
0
2. merkezi moment
m2
=
3. merkezi moment
m3
=
E((X − µ1 )2 )
4. merkezi moment
m4
=
&
= V ar(X)
E((X − µ1 )3 )
E((X − µ1 )4 )
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
37
$
BEKLENTİ İŞLEMCİSİNİN ÖZELLİKLERİ
• Doğrusallık: X rassal değişkeninin doğrusal bir fonksiyonu
Y = a + bX olsun. Y ’nin beklenen değeri:
E[Y ] = E[a + bX] = a + bE(X)
• X1 , X2 , . . . , Xn rassal değişkenlerinin aşağıdaki gibi bir fonksiyonu
tanımlanıyor:
Y = b 1 X 1 + b n X 2 + . . . + bn X n
Y ’nin beklenen değeri:
E[Y ] = b1 E[X1 ] + b2 E[X2 ] + . . . + bn E[Xn ]
ya da kısaca
E(Y ) = E
n
X
bi X i
i=1
&
YTÜ-İktisat İstatistik II
'
!
=
n
X
bi E(Xi )
i=1
İstatistik I Gözden Geçirme
%
38
$
BEKLENTİ İŞLEMCİSİNİN ÖZELLİKLERİ
• X’in doğrusal olmayan bir fonksiyonu için genellikle
E[h(X)] 6= h(E(X))
• Örneğin, E(X 2 ) 6= (E(X))2 , E(ln(X)) 6= ln(E(X))
• X ve Y gibi iki r.d. için
E
&
X
Y
6=
E(X)
E(Y )
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
39
VARYANSIN ÖZELLİKLERİ
$
• Herhangi bir c sabit sayısı için
V ar(c) = 0
• Y = bX’in varyansı, b sabit
V ar(Y ) = V ar(bX) = b2 V ar(X)
• Y = a + bX’in varyansı
V ar(Y ) = V ar(a + bX) = b2 V ar(X)
• X ve Y iki bağımsız r.d. ise
V ar(X + Y ) = V ar(X) + V ar(Y )
V ar(X − Y ) = V ar(X) + V ar(Y )
Bu kural n r.d. için genelleştirilebilir.
&
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
%
40
$
Sürekli Standart Uniform (Tekdüze) Dağılım: Notation: X ∼ U (0, 1), oyf:

 1, if 0 < x < 1,
f (x) =
(1)
 0, otherwise.
E(X) =
V ar(X) =
&
1
2
1
12
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
41
$
(Genel) Uniform (Tekdüze) Dağılım: Notation: X ∼ U (a, b), oyf:

 1
if a < x < b,
b−a
f (x; a, b) =
 0,
otherwise.
b−a
2
b−a
M edian =
2
(b − a)2
V ar(X) =
12
Skewness = 0
E(X) =
Excess kurtosis = −
6
5
&
YTÜ-İktisat İstatistik II
'
%
İstatistik I Gözden Geçirme
42
$
X ∼ U (a, b) için beklenen değer ve varyans:
Z b
x
dx
E(X) =
a b−a
2
b − a2
1
=
b−a
2
(b − a)(b + a)
=
2(b − a)
a+b
=
2
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
43
$
X ∼ U (a, b) için g(x) = x2 fonksiyonunun beklenen değerini bulalım.
Z b
1
x2
E[g(x)] =
b−a
a
=
=
=
b3 − a3
3(b − a)
(b − a)(b2 + ab + a2 )
3(b − a)
a2 + ab + b2
= E[X 2 ].
3
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
44
$
X ∼ U (a, b) için varyans:
V ar(X) =
=
=
&
E[(X − E(X))2 ] = E(X 2 ) − [E(X)]2
(a2 + ab + b2 ) (a + b)2
−
3
4
2
(b − a)
12
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
45
$
U ∼ (a, b) için dağılım fonksiyonu:
F (x)
= P (X ≤ x)
Z x
1
dt
=
a b−a
x
t =
b − a
a
=
x−a
,
b−a
a ≤ x ≤ b aralığı için
yazılabilir. Öyleyse X ∼ U (a, b)’nin



 0,
x−a
F (x) =
b−a ,



1,
bof’nu şöyle olur:
x < a için;
a ≤ x ≤ b için;
x > b için.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
f(x)
&
$
F (x)
1
b −a
0
46
1
a
b
x
0
a
b
x
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
47
$
ÖRNEK: Aşağıda verilen fonksiyonu düşünelim.

 e−x , 0 < x < ∞ ise;
f (x) =
 0,
değilse.
1. Bunun bir oyf olduğunu gösterin.
2. Bu fonksiyunun grafiğini çizin ve X > 1 olasılığı ile ilgili alanı
işaretleyin.
3. P (X > 1) olasılığını hesaplayın.
4. Birikimli olasılık fonksiyonunu bulun.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
48
$
CEVAP:
1. Olasılık yoğunluk fonksiyonları özelliklerini sağlayıp sağlamadığına
bakalım:
(a) (i) İlk olarak, f (x) ≥ 0 koşulunun 0 < x < ∞ aralığındaki her x
değeri için sağlandığı açıktır.
(b) (ii) Ayrıca, x’in değerler aralığında oyf’nin integralinin 1 olması
gerekir.
Z ∞
e−x dx = 1
0
∞
−e−x 0 = 1
−e−∞ − (−e0 )
=
1
0+1 =
1
−e−∞ = limx→∞ −e−x = 0 olarak düşünülmelidir. Bu koşul da
sağlandığına göre fonksiyon bir oyf’dir.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
49
$
1. P (X > 1) olasılığı grafikte gösterilmiştir.
2.
P (X > 1)
Z
∞
e−x dx
1
∞
−e−x =
=
1
−1
=
e
≈
0.36787
3.
F (x)
=
=
Z
x
e−t dt
0
x
−e−t = −e
&
YTÜ-İktisat İstatistik II
'
0
−x
+ e0
= 1 − e−x
İstatistik I Gözden Geçirme
%
50
$
Buradan birikimli olasılık fonksiyonu

 0,
x < 0;
F (x) =
 1 − e−x , 0 < x < ∞.
olarak bulunur.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
oyf : f( x) =e−x
f ( 1x )
0.9
0.9
0.8
0.8
0.7
0.7
0.6
P ( X > 1) =
R∞
1
0.5
0.6
e−x dx
0.5
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0.1
0
0
1
2
$
bof : f( x) =1 −e−x
1x )
F (
51
3
4
0
5
0
1
2
3
x
4
5
x
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
52
$
ORTAK OLASILIK YOĞUNLUK FONKSİYONU
X ve Y , sırasıyla, −∞ < X < +∞ ve −∞ < Y < +∞ aralıklarında
tanımlı iki sürekli r.d. olsun. Bu iki r.d. için ortak olasılık yoğunluk
fonksiyonu, f (x, y) ile gösterilir ve aşağıdaki gibi tanımlanır.
f (x, y) ≥ 0,
Z
∞
−∞
Z
∞
f (x, y)dxdy = 1,
−∞
P r(a < X < b, c < Y < d) =
Z
c
&
d
Z
b
f (x, y)dxdy.
a
%
YTÜ-İktisat İstatistik II
'
2
f (x, y) = xye−(x
fonksiyonu
İstatistik I Gözden Geçirme
+y 2 )
53
$
, x > 0, y > 0, için ortak olasılık yoğunluk
f(x,y)
0.2
0.18
0.16
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
3
2.5
3
2
2.5
1.5
y
2
1.5
1
1
0.5
0.5
0
x
0
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
54
$
Örnek: Aşağıda verilen iki değişkenli fonksiyonun bir ortak olasılık
yoğunluk fonksiyonu olmasını sağlayacak k sabit sayısını bulun. Elde
ettiğiniz ooyf’nu kullanarak
P 0 < X < 12 , 1 < Y < 2 olasılığını bulun.

 k(x + y), 0 < x < 1, 0 < y < 2 ise;
f (x, y) =
 0,
değilse.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
55
$
Öncelikle f (x, y) > 0 koşulunun sağlanabilmesi için k > 0 olmalı. İkinci
koşuldan hareketle
Z 2Z 1
k(x + y)dxdy = 1
0
0
= k
Z
2
0
= 3k = 1
k=
1
3
2
1
y 2 1
+ y dy = k
y+
2
2
2 0
bulunur. Öyleyse ooyf
f (x, y) =


1
3 (x
 0,
+ y), 0 < x < 1, 0 < y < 2 ise;
değilse.
&
YTÜ-İktisat İstatistik II
'
%
İstatistik I Gözden Geçirme
56
$
İstenen olasılık ooyf’nun altındaki hacim olarak bulunur:
Z 2 Z 12
1
1
P 0<X< , 1<Y <2
=
(x + y) dxdy
2
1
0 3
2
Z 1 2 1 1
1 1
y 2 =
+ y dy =
y+
3 1
8 2
3 8
4 1
7
=
24
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
57
$
MARJİNAL YOĞUNLUK FONKSİYONU
X’in myf:
f (x) =
∞
Z
f (x, y)dy
−∞
İntegralin sınırları y’nin tanım aralığıdır.
Y ’nin myf:
f (y) =
∞
Z
f (x, y)dx
−∞
İntegralin sınırları x’in tanım aralığıdır.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
58
$
Önceki örnekteki ooyf’nu kullanarak X ve Y rassal değişkenlerinin
marjinal olasılık yoğunluk fonksiyonlarını bulalım.
f (x)
=
=
=
&
2
1
(x + y)dy
0 3
2
1
y 2 xy +
3
2 0
2
(x + 1)
3
Z
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
59
$
Böylelikle X için moyf’nu şöyle yazılır:

 2 (x + 1), 0 < x < 1 ise;
3
f (x) =
 0,
degilse.
Benzer şekilde Y ’nin moyf’nu

 1 (y + 1 ), 0 < y < 2 ise;
3
2
g(y) =
 0,
degilse.
olur.
&
YTÜ-İktisat İstatistik II
'
%
İstatistik I Gözden Geçirme
60
$
KOŞULLU OLASILIK YOĞUNLUK FONKSİYONU
Y = y değeri verilmişken X’in koşullu yoğunluk fonksiyonu:
f (x|y) =
f (x, y)
f (y)
Benzer şekilde X = x verilmişken Y ’nin koşullu yoğunluk fonksiyonu
f (y|x) =
&
f (x, y)
f (x)
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
61
$
BAĞIMSIZLIK
Hatırlarsak aşağıdaki koşul sağlanıyorsa A ve B bağımsız olaylardır denir:
P (A ∩ B) = P (A)P (B)
Benzer şekilde X ve Y iki bağımsız sürekli r.d. ise
f (x, y) = f (x)f (y)
koşulu sağlanmalıdır.
i.e., ortak yoğunluk fonksiyonu, marjinal yoğunlukların çarpımı olarak
yazılabiliyorsa bu iki r.d. birbirinden bağımsızdır.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
62
$
BAĞIMSIZLIK: önceki koşul genelleştirilebilir.
X1 , X2 , . . . , Xn rassal değişkenlerinin ortak olasılık yoğunluk fonksiyonu
marjinal yoğunluk fonksiyonlarının çarpımı olarak yazılabiliyorsa
f (x1 , x2 , . . . , xn )
=
=
f1 (x1 ) · f2 (x2 )·, . . . , ·fn (xn )
n
Y
fj (xj )
j=1
bu rassal değişkenler birbirinden bağımsızdır denir. Bu özellik
kullanılarak Maksimum Olabilirlik (Maximum Likelihood) tahmin
edicileri türetilebilmektedir. Bu konuya Tahmin Yöntemleri başlığı
altında değineceğiz.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
63
$
BAĞIMSIZLIK
ÖRNEK: Önceki örnekteki ortak oyf ve marjinal oyf’nı kullanarak X ve
Y ’nin bağımsız olup olmadığını bulalım.
1
1
2
(x + 1) (y + )
3
3
2
6= f (x, y)
f (x)g(x) =
olduğundan X ve Y rassal değişkenleri bağımsız değildir.
&
YTÜ-İktisat İstatistik II
'
%
İstatistik I Gözden Geçirme
64
$
BAĞIMSIZLIK
ÖRNEK: Aşağıda verilen ooyf’nu kullanarak moyf’nı bularak bağımsız
olup olmadıklarına karar verelim.

 1 , 1 < x < 4, 1 < y < 4 ise;
9
f (x, y) =
 0, degilse.
Marjinal olasılık yoğunluk fonksiyonları
Z 4
1
dy =
f (x) =
1 9
Z 4
1
dx =
g(y) =
1 9
Buradan
1
f (x, y) = = f (x)g(y) =
9
1
3
1
3
1
1
3
3
koşulu sağlandığı için X ve Y rassal değişkenleri bağımsızdır.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
65
$
NORMAL DAĞILIM:
Notasyon: X ∼ N (µ, σ 2 )
1
1
2
f (x; µ, σ ) = √ exp − 2 (x − µ) ,
2σ
σ 2π
2
−∞ < x < ∞
E(X) = µ
V ar(X) = σ 2
skewness = 0
kurtosis = 3
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
66
Normal Dağılım oyf, σ 2 = 1, farklı lokasyon parametreleri (µ)
$
Normal Dagilim, σ2=1
0.4
µ=2
µ=0
µ=5
0.35
µ = −2
0.3
µ = −5
φ(x)
0.25
0.2
0.15
0.1
0.05
0
−10
&
−8
−6
−4
−2
0
x
2
4
6
8
10
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
67
$
Normal Dağılım oyf, µ = 0, farklı varyans (scale) parametreleri
Normal Dagilim, µ=0
0.4
0.35
2
σ = 1, µ = 0
0.3
φ(x)
0.25
0.2
2
σ = 2, µ = 0
0.15
0.1
2
σ = 3, µ = 0
0.05
0
−10
−8
−6
−4
−2
0
x
2
4
6
8
10
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
STANDART NORMAL DAĞILIM:
Z = X−µ
σ ,
1
1 2
φ(z) = √ exp − z ,
2
2π
68
$
−∞ < z < ∞
E(Z) = 0
V ar(Z) = 1
Birikimli dağılım fonksiyonu:
Φ(z) = P (Z ≤ z) =
&
Z
z
−∞
1 2
1
√ exp − t dt
2
2π
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
STANDART NORMAL DAGILIM φ(z)
69
$
STANDART NORMAL DAGILIM Φ(z)
0.4
1
0.9
0.35
0.8
0.3
0.7
0.25
0.6
0.2
0.5
0.4
0.15
0.3
0.1
0.2
0.05
0.1
0
−4
−3
−2
−1
0
1
2
3
4
0
−4
−3
−2
−1
0
1
2
3
4
&
YTÜ-İktisat İstatistik II
'
%
İstatistik I Gözden Geçirme
70
$
NORMAL DAĞILIM OLASILIKLARININ HESAPLANMASI
X ∼ N (µ, σ 2 ) olsun. Aşağıdaki olasılığı hesaplamak istiyoruz:
Z b
1
1
2
√ exp − 2 (x − µ) dx
P (a < X < b) =
2σ
a σ 2π
Bu integralin açık bir çözümü yoktur. Ancak nümerik yöntemlerle istenen
kesinlik düzeyinde hesaplanabilir. Bunun için her seferinde bilgisayarda
hesap yapmak yerine, standart normal dağılım tablolarını kullanabiliriz.
İstenen olasılığı aşağıdaki gibi yazalım:
a−µ
X −µ
b−µ
b−µ
a−µ
<
<
<Z<
=P
P
σ
σ
σ
σ
σ
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
71
$
NORMAL DAĞILIM OLASILIKLARININ HESAPLANMASI
P
b−µ
a−µ
<Z<
σ
σ
=Φ
b−µ
σ
−Φ
a−µ
σ
Burada Φ(z) = P (Z ≤ z) standart normal dağılımın z’deki değeridir.
Kitaptaki notasyonda Φ(z) yerine F (z) kullanıldığına dikkat edin.
Standart Normal olasılık tablosu: Ek Çizelge 3
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
72
$
NORMAL DAĞILIM OLASILIKLARININ HESAPLANMASI
Bu tabloda sadece pozitif değerler için dağılım fonksiyonu değerleri
verilmiştir. Negatif değerler için Φ(z) = P (Z ≤ z)’nin simetri özelliği
kullanılabilir:
Φ(−z)
= P (Z ≤ −z)
= P (Z ≥ z)
= 1 − P (Z ≤ z)
= 1 − Φ(z)
e.g.:
P (Z ≤ −1.25)
&
=
Φ(−1.25)
=
1 − Φ(1.25)
=
1 − 0.8944 = 0.1056
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
73
$
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
−4
−3
−2
−1
0
1
2
3
4
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
74
$
0.4
0.35
P(−1.25<Z<1.25) = Φ(1.25) −
Φ(−1.25)
= Φ(1.25) − (1−Φ(1.25))
= 0.8944 − 0.1056 = 0.7888
0.3
0.25
0.2
0.15
1 − Φ(1.25) = 0.1056
0.1
Φ(−1.25) = 0.1056
0.05
0
−4
&
−3
−2
−1
0
1
2
3
4
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
75
$
MERKEZİ LİMİT TEOREMİ (CENTRAL LIMIT THEOREM)
X1 , X2 , . . . , Xn herbirinin ortalaması µ ve varyansı σ 2 olan ve aynı
dağılıma uyan n tane bağımsız r.d. olsun. Başka bir şekilde ifade
etmek istersek:
Xi ∼ i.i.d (µ, σ 2 ),
i = 1, 2, . . . , n
iid: türdeş (identical), ve bağımsız (independent) dağılımlı
Burada dağılımın ne olduğunu belirtmediğimize dikkat edin. Bu r.d.’lerin
toplamlarının beklenen değeri ve varyansı:
E[X1 + X2 + . . . + Xn ] = E[X1 ] + E[X2 ] + . . . + E[Xn ] = nµ
V ar[X1 + X2 + . . . + Xn ] = V ar[X1 ] + V ar[X2 ] + . . . + V ar[Xn ] = nσ 2
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
76
$
MERKEZİ LİMİT TEOREMİ (CENTRAL LIMIT THEOREM)
Bu r.d.’lerin toplamına X diyelim. Yani, X = X1 + X2 + . . . + Xn
Z
=
=
=
X − nµ
X − E(X)
p
= √
V ar(X)
nσ 2
X
n −µ
n1/2
n σ
X −µ
√ ∼ N (0, 1)
σ/ n
MLT’ye göre gözlem sayısı arttıkça, yani, n → ∞, yukarıdaki ifade
standart normal dağılıma yakınsar, yani, Z → N (0, 1)
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
n= 1
n= 2
4000
4000
1500
3000
3000
1000
2000
2000
500
1000
1000
0
0.2
0.4
0.6
0.8
1
0
0
0.2
0.4
n= 10
0.6
0.8
1
0
0
0.2
0.4
n= 30
6000
$
n= 3
2000
0
77
0.6
0.8
1
n= 50
5000
6000
4000
4000
4000
3000
2000
2000
2000
1000
0
0
0.2
0.4
0.6
0.8
1
0
0.2
0.3
n= 75
0.4
0.5
0.6
0.7
0
n= 1000
6000
6000
6000
4000
4000
4000
2000
2000
2000
0
0.35 0.4 0.45 0.5 0.55 0.6 0.65
n= 100
0
0.35 0.4 0.45 0.5 0.55 0.6 0.65
0.35 0.4 0.45 0.5 0.55 0.6 0.65
0
0.44
0.46
0.48
0.5
0.52
0.54
0.56
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
78
$
BÜYÜK SAYILAR KANUNU (LAW of LARGE NUMBERS)
Merkezi Limit Teoremi, Büyük Sayılar Kanunu ile yakından ilişkilidir.
Büyük Sayılar Kanununa göre, türdeş dağılımlı (aynı anakütle beklenen
değeri µ ve varyansına σ 2 sahip), birbirinden bağımsız ve sonlu varyanslı
n r.d.’in aritmetik ortalaması (örneklem ortalaması) n büyüdükçe
anakütle ortalamasına yakınsar. X n = n1 (X1 + X2 + . . . + Xn ) örneklem
ortalaması olsun. Büyük sayılar yasasına göre
n −→ ∞,
X n −→ µ
Başka bir deyişle, istediğimiz kadar küçük seçebileceğimiz ǫ gibi pozitif
herhangi bir sayı için:
lim P |X n − µ| < ǫ = 1
n→∞
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
79
$
MERKEZİ LİMİT TEOREMİ
ÖRNEK: X1 , X2 , . . . , X12 birbirinden bağımsız ve herbiri U ∼ (0, b),
b > 0 dağılımına sahip rassal değişkenler olsun. Merkezi Limit Teoremini
kullanarak P ( 4b < X < 3b
4 ) olasılığının yaklaşık 0.9973 olduğunu
gösterelim.
CEVAP: Bu 12 bağımsız r.d. uniform anakütleden geldiğine göre önce
anakütledeki ortalama ve varyansı bulmamız gerekir. Uniform(a, b)
dağılım için beklenen değer ve varyans
µx =
b+a
,
2
σx2 =
(b − a)2
12
olduğuna göre, örneğimizde
µx =
b
,
2
σx2 =
b2
12
olur.
&
%
YTÜ-İktisat İstatistik II
'
İstatistik I Gözden Geçirme
80
$
MERKEZİ LİMİT TEOREMİ
b2
σx2
=
n
144
CEVAP (devam): MLT’yi kullanarak:
V ar(X) =
P
&
b
3b
<X<
4
4
b
4
−
b
2
X − µx
< p
<
σx2 /n
3b
4
−
b
2
!
=
P
=
P (−3 < Z < 3) = Φ(3) − (1 − Φ(3))
=
0.99865 − (1 − 0.99865) = 0.9973
b
12
b
12
%

Download

˙ISTAT˙IST˙IK I KAVRAMLARININ G¨OZDEN GEC¸˙IR˙ILMES˙I

Products

Support

˙ISTAT˙IST˙IK I KAVRAMLARININ G¨OZDEN GEC¸˙IR˙ILMES˙I

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib