Đst102 Olasılık ve Đstatistiğe Giriş GĐRĐŞ

advertisement
Đst102 Olasılık ve Đstatistiğe Giriş
DERSĐN TÜRÜ
DERSĐN DÖNEMĐ
DERSĐN KREDĐSĐ
DERSĐN VERĐLDĐĞĐ
Zorunlu
Bahar
Ulusal Kredi: (4, 0, 0 ) 4
Bölüm: Đstatistik
AKTS: 7
2007/2008 Öğretim Yılı
Yardımcı Kitaplar
1
2
3
Larson, H. J. (1982). Introduction to Probability Theory and Statistical Inference,
John Wiley&Sons.
Akdeniz, F. (2007). Olasılık ve Đstatistik, Nobel Kitabevi.
Öztürk, F. (1993). Matematiksel Đstatistik, Ankara Üniversitesi Fen Fakültesi
Yayınları, No.10.
Sınavlar
En az bir ara sınav ve dönem sonu sınavı yazılı olarak yapılacaktır.
Dönem içi verilen ödevler ara sınav notu ile birlikte
değerlendirmeye alınıp vize notunu oluşturacaktır.
Geçme notu=0.4xVize notu+0.60xDönem sonu notu.
GĐRĐŞ
“Đstatistik, rasgelelik içeren olaylar, süreçler, sistemler hakkında modeller
kurmada, gözlemlere dayanarak bu modellerin geçerliliğini sınamada ve bu
modellerden sonuç çıkarmada gerekli bazı bilgi ve yöntemleri sağlayan bir bilim
dalıdır” diyebiliriz.
Gerçek Dünya
Olgu
Rasgelelik
Örnekleme
Ölçme
Aklımız
Model
Veri (Data)
Đstatistik çözümleme
Sonuç çıkarım
Ω
A⊂ Ω
∩ (kesişim)
∪ (birleşim)
\ (tümleme)
σ -cebir
P(A)
Deney-Örnek Uzay
olay
ve
veya
değil
ilgilendiğimiz olaylar
bir olayın olasılığı
Olasılık Uzayı
(Ω, U , P )
Tanım: Ω ≠ ∅ ve U , Ω ’da bir sınıf olmak üzere
i) Ω ∈ U
ii) A ∈ U
iii) (
⇒ A ∈U
An ), U ‘daki kümelerin bir dizisi ⇒
∞
∪A ∈U
n
n =1
özellikleri sağlandığında U ’ya Ω ’da σ -cebir denir.
Kümelerden (olaylardan) oluşan σ -cebir ∪ , ∩ ,\ küme işlemlerinin sonlu veya sayılabilir sonsuz kez uygulanmasına
göre kapalıdır.
Tanım: U , Ω ’da bir σ -cebir olsun. Bir
P :U → ℝ
A → P ( A)
fonksiyonu,
∀A ∈ U için P ( A) ≥ 0
ii) P (Ω) = 1
i)
iii)
∞
∞
n =1
n =1
A1 , A2 ,..., An ,...ler U 'da ayrık olaylar ⇒ P (∪ An ) = ∑ P ( An )
özelliklerine sahip olduğunda, P fonksiyonuna olasılık ölçüsü denir. P ( A) değerine A olayının olasılık ölçüsü ya da
kısaca A’nın olasılığı denir.
Tanım: U , Ω ’da bir σ -cebir ve P , U ’da bir olasılık ölçüsü olmak üzere (Ω, U , P ) üçlüsüne olasılık uzayı denir.
(Ω, U , P ) bir olasılık uzayı olsun:
a) Ρ(∅) = 0
b) A1 , A2 ,…, An , U da ayrık kümeler ⇒ Ρ( A1 ∪ A2 ∪ ... ∪ An ) = Ρ( A1 ) + ... + Ρ( An )
Teorem:
P ( A) = 1 − P ( A)
d) A ⊂ B ⇒ P ( A) ≤ P ( B )
e) 0 ≤ P ( A) ≤ 1
f) P ( A ∪ B ) = P ( A) + P ( B ) − P ( A ∩ B )
c)
n
Ρ ( A1 ∪ A2 ∪ ... ∪ An ) =
∑ Ρ( A ) − ∑
i
i =1
g)
1≤ i < j ≤ n
∑
Ρ ( Ai ∩ Aj ) +
n −1
Ρ ( Ai ∩ Aj ∩ Ak ) − ... + ( −1) Ρ ( A1 ∩ A2 ∩ ... ∩ An )
1≤ i < j < k ≤ n
Ρ( A1 ∪ A2 ∪ ... ∪ An ) ≤ Ρ( A1 ) + Ρ( A2 ) + ... + Ρ( An )
n
 n

P
(
A
)
≤
P ( Ai ) 
∪
∑
i

i =1
 i =1

∞
 ∞

Ρ( A1 ∪ A2 ∪ ... ∪ An ∪ ...) ≤ Ρ( A1 ) + Ρ( A2 ) + ... + Ρ( An ) + ...  P (∪ Ai ) ≤ ∑ P ( Ai ) 
i =1
 i =1

∞
h)
A1 ⊂ A2 ⊂ ⋯ ⊂ An ⊂ ⋯ ⇒ lim P ( An ) = P (∪ An )
n →∞
A1 ⊃ A2 ⊃ ⋯ ⊃ An ⊃ ⋯
n =1
∞
⇒ lim P ( An ) = P (∩ An )
n →∞
n =1
(Ω, U , P ) bir olasılık uzayı olsun.
A1 , A2 ,..., An olayları Ω nın bir sonlu parçalanması ve B ∈ U , P ( B ) ≠ 0 olmak üzere,
P( Aj ∩ B)
P( Aj ) P( B / Aj )
P( Aj / B) =
= n
, j = 1, 2,..., n
P( B)
∑ P( Ai ) P( B / Ai )
Bayes Teoremi:
i =1
dır.
Tanım
(Ω, U , P ) bir olasılık uzayı ve
olmak üzere,
oluyorsa,
Tanım
∀ a ∈ R için,
X: Ω
→
R
ω
→
X (ω )
{ω ∈ Ω : X (ω ) ≤ a} ∈ U
X fonksiyonuna bir Rasgele Değişken denir.
(Ω, U , P ) bir olasılık uzayı ve
X : Ω →
R
ω
→
X (ω )
bir rasgele değişken olmak üzere,
F : R → [0,1]
x → F ( x) = P ( X ≤ x )
fonksiyonuna
Tanım
X rasgele değişkenin dağılım fonksiyonu (birikimli olasılık fonksiyonu) denir.
DX = X (Ω) = {x : x ∈ R , ∃ω ∈ Ω için X (ω ) = x}
DX kümesi sonlu veya sayılabilir sonsuz elemanlı olduğunda X e kesikli rasgele değişken (discrete random
variable) denir.
Tanım X kesikli bir rasgele değişken olmak üzere,
f ( x ) = P ( X = x ) , x ∈ DX
fonksiyonuna X in olasılık fonksiyonu denir.
Kesikli bir X rasgele değişkenin dağılım fonksiyonu F ve olasılık fonksiyonu f olmak üzere,
F : R → [0,1]
x → F ( x) = P( X ≤ x) =
∑
xi ∈DX , xi ≤x
f ( xi )
f ( x ) = P ( X = x ) = F ( x ) − F ( x− ) , x ∈ D X
1) f ( x) ≥ 0 , x ∈ DX


2) ∑ f ( x) = 1
 x∈DX
dır.
Tanım Bir X rasgele değişkenin
F : R → [0,1] dağılım fonksiyonu,
∞
1) f ( x) ≥ 0 , x ∈ R
2)
∫
−∞
f ( x)dx = 1
özelliklerine sahip bir
f fonksiyonu yardımıyla,
x
F ( x) = ∫ f ( x)dx , x ∈ R
−∞
biçiminde yazılabiliyorsa, X rasgele değişkenine sürekli rasgele değişken (mutlak sürekli rasgele değişken) ve f
fonksiyonuna X rasgele değişkeninin olasılık yoğunluk fonksiyonu denir.
Sürekli bir X rasgele değişkeninin F dağılım fonksiyonu sürekli bir fonksiyondur. Ayrıca, a < b , a, b ∈ R için
P({a}) = F (a) − lim+ F (a − h) = F (a ) − F (a − ) =0
h →0
b
P ((a, b]) = F (b) − F (a ) = ∫ f ( x)dx
a
x
F ( x) = ∫ f ( x)dx , x ∈ R
−∞
ve F fonksiyonunun türevlenebildiği noktalarda,
f ( x) =
dır.
Tanım
i)
dF ( x)
dx
X bir rasgele değişken ve g : R → R bir fonksiyon olmak üzere,
X kesikli ve
∑ g ( x ) f ( x ) < ∞ olduğunda,
x∈DX
ii)
X sürekli ve
E ( g ( X )) =
∑ g ( x) f ( x)
x∈DX
∞
∞
−∞
−∞
∫ g ( x ) f ( x ) dx < ∞ olduğunda, E ( g ( X ) ) = ∫ g ( x ) f ( x ) dx
g ( X ) in beklenen değeri denir.
Tanım X bir rasgele değişken, c ∈ R ve k bir doğal sayı olmak üzere:
k
a) E ( X − c )  değerine X ‘in c ye göre k ‘inci momenti,


k 

b) E  X  değerine X ‘in k ‘inci momenti,


sayısına
c)
E ( X ) değerine X ‘in beklenen değeri,
2
E ( X − EX )  değerine X ‘in varyansı,


e) E  X ( X − 1)( X − 2 )⋯ ( X − k + 1)  değerine X ‘in k ‘inci çarpımsal momenti
tX
f) M X (t ) = E (e ) , − h < t < h (h > 0) fonksiyonuna X in moment üreten fonksiyonu
d)
denir.
Teorem
a, b ∈ R olmak üzere,
a ) E ( aX + b ) = aE ( X ) + b
b) Var ( aX + b ) = a 2Var ( X )
c) Var ( X ) = E  X 2  − ( E ( X ) )
d)
2
dn
M X (t ) = E ( X n ) , n = 1, 2…
dt n
t =0
Düzgün Dağılım
Bazı Kesikli Dağılımlar
o.f.
m.ç.f.
1
, x = x1 , x2 ,..., xn
n
xt
n
ei
, t∈R
∑
i =1 n
n
∑x
j =1
x=
ortalama
j
n
n
∑(x − x )
i =1
varyans
parametre
Bernoulli Dağılımı
b (1, p )
Binom
b ( n, p )
o.f.
m.ç.f.
ortalama
varyans
parametre
o.f.
m.ç.f.
n
x1 , x2 ,..., xn ∈ R , n ∈ {1,2,...}
p x (1 − p )
1− x
p (1 − p )
p ∈ (0,1) , n ∈ {1,2,...}
n x
n− x
  p (1 − p ) , x = 0,1,...,n
 x
(1 − p + pe )
t n
, t∈ℝ
np
np (1 − p )
parametre
p ∈ (0,1) , n ∈ {1,2,...}
o.f.
a N − a  N 
 
  
 x n − x   n 
m.ç.f.
açık biçimi yok
ortalama
a
N
N −n
a
a
× n × × (1 − )
N −1
N
N
varyans
Poisson
, x =0,1
1 − p + pet , t ∈ ℝ
p
ortalama
varyans
Hipergeometrik
2
i
n×
parametre
N , a, n ∈ {1, 2,...} , a < N , n < N
o.f.
e−λ λ x
, x = 0,1, 2,...
x!
m.ç.f.
e
ortalama
varyans
parametre
λ  et −1


, t ∈R
λ
λ
λ ∈ (0, ∞)
Geometrik
o.f.
(1 − p )
m.ç.f.
pet
,
1 − (1 − p ) et
ortalama
p , x =1,2,...
t < − ln(1 − p )
1
p
1− p
p2
varyans
Negatif Binom
x −1
p ∈ (0,1)
parametre
o.f.
 x − 1 k
k −r

 p (1 − p ) , x = k , k + 1,...
 k − 1
m.ç.f.

pet

t
 1 − (1 − p ) e
ortalama



k
,
t < − ln(1 − p )
k
p
k (1 − p )
p2
p ∈ (0,1) , k ∈ {1, 2,...}
varyans
parametre
Bu ders döneminde sürekli dağılımlardan Düzgün, Üstel, Gamma, Ki-kare ve Normal
dağılımı gördükten sonra Ragele Vektörler (Çok Değişkenli Dağılımlar) konusuna
değineceğiz. Rasgele Değişkenlerin Bağımsızlığı konusundan sonra Büyük Sayılar Kanunu ve
Merkezi Limit Teoremini göreceğiz. Bu bilgiler çerçevesinde birinci dönem değindiğimiz
Parametre Tahmini ve Hipotez Testi konuları ile Đstatistiğe Giriş yapmaya devam edeceğiz.
Deney, Örnek Uzay, Olasılık Uzayı, Kesikli Rasgele Değişken ve Sürekli Rasgele
Değişken kavramlarını aşağıdaki iki örnek üzerinde yeniden hatırlayalım.
Örnek 1 Düzgün bir tavla zarı atılması ve üste gelen yüzeyin gözlenmesi deneyini anlatan
(modelleyen) Olasılık Uzayı,
Ω=
U = 2Ω
P( A) =
olmak üzere, X üste gelen yüzeydeki nokta sayısı olduğunda,
n( A) n( A)
=
n(Ω)
6
Ω=
X
R
0
1
2
3
4
5
6
7
fonksiyonu ortaya çıkmaktadır. X fonksiyonu, ∀ a ∈ R için,
{ω ∈ Ω : X (ω ) ≤ a} ∈ U
özelliğini sağlayan bir fonksiyon olup bir rasgele değişkendir.
X kesikli bir rasgele değişken olmak üzere, X in olasılık fonksiyonu,
f ( x) = P( X = x) =
1
, x ∈ DX = {1, 2,3, 4,5, 6}
6
dır. f fonksiyonunun grafiği,
grafik ( f ) = {( x, f ( x)) : x = 1, 2,3, 4,5, 6}
f(x)
1/6
• • • • • •
x
1 2 3 4 5 6
olmak üzere, bu grafiği
f(x)
1/6
x
1 2 3 4 5 6
biçiminde de göstermekteyiz. Okların yükseklikleri o noktalardaki olasılıkları göstermektedir.
X rasgele değişkeninin dağılım fonksiyonu,
x <1
 0 ,

 1
 , 1 ≤ x < 2
 6
 2
 , 2 ≤ x < 3
 6
3
F ( x) = P( X ≤ x) =  , 3 ≤ x < 4
 6

 4 , 4 ≤ x < 5
 6

 5 , 5 ≤ x < 6
 6

x≥6
 1 ,
ve grafiği,
 0 ,
x <1

 x = 
, 1≤ x < 6
 6

1 ,
x≥6

F(x)
1
5/6
4/6
3/6
2/6
1/6
1
x
2
3 4
5
6
7
dır. Dağılım fonksiyonunda basamakların yükseklikleri olasılıkları göstermektedir.
“Zıplamalı bir hareket” ‘in yol zaman grafiği bir basamak fonksiyonu ile temsil
edilebilir. Basmakların yükseklikleri zıplama miktarlarını, zaman eksenindeki konumları da
zıplama anlarını göstermektedir.
S(t) (metre)
1
5/6
4/6
3/6
2/6
1/6
1
2
t (saniye)
3 4
5
6
7
gibi bir yol-zaman grafiği, örneğin her saniye başında (6 saniye) 100/6 cm ileriye zıplayan ve
sonra duran bir kurbağanın hareketini anlatıyor olabilir. Kurbağanın “ani hızlarını” da,
V(t)
1/6
t
1 2 3 4 5 6
gibi bir hız-zaman grafiği ile anlatabiliriz.
Genel olarak, kesikli bir X rasgele değişkenin olasılık fonksiyonu f ve dağılım
fonksiyonu F olmak üzere,
f ( x ) = P ( X = x ) , x ∈ DX
1) f ( x) ≥ 0 , x ∈ DX


2) ∑ f ( x) = 1
 x∈DX
F : R → [0,1]
x → F ( x) = P( X ≤ x) =
∑
xi ∈DX , xi ≤x
f ( xi )
f ( x ) = P ( X = x ) = F ( x ) − F ( x− ) , x ∈ D X
E( X ) =
∑ xf ( x)
x∈Dx
Var ( X ) = E ( X − E ( X ) ) =
2
M X (t ) = E (etX ) =
dır.
∑ ( x − E( X ))
x∈DX
∑ e f ( x)
tx
x∈DX
2
f ( x)
Örnek 2 Çok küçük bir boncuk, yarıçapı 10 cm olan bir dairenin içine düşecek şekilde
rasgele atılsın. Böyle bir deney için, Örnek Uzay ve uygun bir Olasılık Ölçüsü aşağıdaki gibi
olabilir.
Ω
A
P ( A) =
" A nın alan ölçüsü "
" Ω nın alan ölçüsü "
X rasgele değişkeni, deney sonucunda boncuğun düştüğü nokta ile dairenin merkezi
arasındaki uzaklık olsun.
P ( A) =
Ω
ω
•
X
R
0
x
X (ω ) 10
X rasgele değişkenin aldığı değerlerin kümesi,
X (Ω) = { X (ω ) : ω ∈ Ω} = [0,10] ⊂ R
ve X in dağılım fonksiyonu,
" A nın alan ölçüsü "
" Ω nın alan ölçüsü "
F: R →
[ 0,1]
x<0
 0 ,
 2
x
→ F ( x) = P ( X ≤ x) = 
, 0 ≤ x < 10
100
x ≥ 10
 1 ,
x
olmak üzere, bu dağılım fonksiyonu,
 x

, 0 < x < 10
f ( x) =  50

0 , diğer yerlerde
fonksiyonu yardımıyla,
x
F ( x) = ∫ f ( x)dx , x ∈ R
−∞
biçiminde yazılabilir. X sürekli bir rasgele değişkendir. X in dağılım fonksiyonu ve olasılık
yoğunluk fonksiyonu,
 x

, 0 < x < 10
f ( x) =  50

0 , diğer yerlerde
x<0
 0 ,
 2
x
F ( x) = 
, 0 ≤ x < 10
100

x ≥ 10
 1 ,
olmak üzere, grafikleri
F(x)
f(x)
1
1/5
1/4
x
x
x
10
x
10
ve
x2
P( X ≤ x) = F ( x) =
100
dır.
5
P( X ≤ x) = ∫
0
5
x
x2
x2
dx =
=
50
100 x=0 100
Olasılık yoğunluk fonksiyonlarında olasılık hesabı doğrusal ve “sürekli bir hareket”‘in
hız-zaman grafiğinde yol hesabına benzemektedir. Hız-zaman grafiğinde belli bir zaman
aralığında alınan yol miktarı bir alana karşılık gelmektedir. Olasılık yoğunluk fonksiyonunda
da bir aralığın olasılığı bir alana karşılık gelmektedir. Dağılım fonksiyonunda olasılık hesabı,
yol-zaman grafiğinde yol miktarının hesabına benzemektedir.
Yukarıdaki iki grafiği,
S(t) (km)
V(t)
1
1/5
1/4
t
t (dakika)
10
5
5
10
biçiminde ele alırsak, bir cismin yol-zaman ve hız-zaman grafiği ile karşılaşırız. Bu harekette
yolun zaman bağlı formülü,
t2
S (t ) =
, 0 ≤ t ≤ 10
100
hızı
t
V(t)= ∫
0
t
t
t2
t2
dt =
=
, 0 ≤ t ≤ 10
50
100 0 100
ve ivmesi
a (t ) =
dır.
1
50
, 0 ≤ t ≤ 10
Download