Đst102 Olasılık ve Đstatistiğe Giriş DERSĐN TÜRÜ DERSĐN DÖNEMĐ DERSĐN KREDĐSĐ DERSĐN VERĐLDĐĞĐ Zorunlu Bahar Ulusal Kredi: (4, 0, 0 ) 4 Bölüm: Đstatistik AKTS: 7 2007/2008 Öğretim Yılı Yardımcı Kitaplar 1 2 3 Larson, H. J. (1982). Introduction to Probability Theory and Statistical Inference, John Wiley&Sons. Akdeniz, F. (2007). Olasılık ve Đstatistik, Nobel Kitabevi. Öztürk, F. (1993). Matematiksel Đstatistik, Ankara Üniversitesi Fen Fakültesi Yayınları, No.10. Sınavlar En az bir ara sınav ve dönem sonu sınavı yazılı olarak yapılacaktır. Dönem içi verilen ödevler ara sınav notu ile birlikte değerlendirmeye alınıp vize notunu oluşturacaktır. Geçme notu=0.4xVize notu+0.60xDönem sonu notu. GĐRĐŞ “Đstatistik, rasgelelik içeren olaylar, süreçler, sistemler hakkında modeller kurmada, gözlemlere dayanarak bu modellerin geçerliliğini sınamada ve bu modellerden sonuç çıkarmada gerekli bazı bilgi ve yöntemleri sağlayan bir bilim dalıdır” diyebiliriz. Gerçek Dünya Olgu Rasgelelik Örnekleme Ölçme Aklımız Model Veri (Data) Đstatistik çözümleme Sonuç çıkarım Ω A⊂ Ω ∩ (kesişim) ∪ (birleşim) \ (tümleme) σ -cebir P(A) Deney-Örnek Uzay olay ve veya değil ilgilendiğimiz olaylar bir olayın olasılığı Olasılık Uzayı (Ω, U , P ) Tanım: Ω ≠ ∅ ve U , Ω ’da bir sınıf olmak üzere i) Ω ∈ U ii) A ∈ U iii) ( ⇒ A ∈U An ), U ‘daki kümelerin bir dizisi ⇒ ∞ ∪A ∈U n n =1 özellikleri sağlandığında U ’ya Ω ’da σ -cebir denir. Kümelerden (olaylardan) oluşan σ -cebir ∪ , ∩ ,\ küme işlemlerinin sonlu veya sayılabilir sonsuz kez uygulanmasına göre kapalıdır. Tanım: U , Ω ’da bir σ -cebir olsun. Bir P :U → ℝ A → P ( A) fonksiyonu, ∀A ∈ U için P ( A) ≥ 0 ii) P (Ω) = 1 i) iii) ∞ ∞ n =1 n =1 A1 , A2 ,..., An ,...ler U 'da ayrık olaylar ⇒ P (∪ An ) = ∑ P ( An ) özelliklerine sahip olduğunda, P fonksiyonuna olasılık ölçüsü denir. P ( A) değerine A olayının olasılık ölçüsü ya da kısaca A’nın olasılığı denir. Tanım: U , Ω ’da bir σ -cebir ve P , U ’da bir olasılık ölçüsü olmak üzere (Ω, U , P ) üçlüsüne olasılık uzayı denir. (Ω, U , P ) bir olasılık uzayı olsun: a) Ρ(∅) = 0 b) A1 , A2 ,…, An , U da ayrık kümeler ⇒ Ρ( A1 ∪ A2 ∪ ... ∪ An ) = Ρ( A1 ) + ... + Ρ( An ) Teorem: P ( A) = 1 − P ( A) d) A ⊂ B ⇒ P ( A) ≤ P ( B ) e) 0 ≤ P ( A) ≤ 1 f) P ( A ∪ B ) = P ( A) + P ( B ) − P ( A ∩ B ) c) n Ρ ( A1 ∪ A2 ∪ ... ∪ An ) = ∑ Ρ( A ) − ∑ i i =1 g) 1≤ i < j ≤ n ∑ Ρ ( Ai ∩ Aj ) + n −1 Ρ ( Ai ∩ Aj ∩ Ak ) − ... + ( −1) Ρ ( A1 ∩ A2 ∩ ... ∩ An ) 1≤ i < j < k ≤ n Ρ( A1 ∪ A2 ∪ ... ∪ An ) ≤ Ρ( A1 ) + Ρ( A2 ) + ... + Ρ( An ) n n P ( A ) ≤ P ( Ai ) ∪ ∑ i i =1 i =1 ∞ ∞ Ρ( A1 ∪ A2 ∪ ... ∪ An ∪ ...) ≤ Ρ( A1 ) + Ρ( A2 ) + ... + Ρ( An ) + ... P (∪ Ai ) ≤ ∑ P ( Ai ) i =1 i =1 ∞ h) A1 ⊂ A2 ⊂ ⋯ ⊂ An ⊂ ⋯ ⇒ lim P ( An ) = P (∪ An ) n →∞ A1 ⊃ A2 ⊃ ⋯ ⊃ An ⊃ ⋯ n =1 ∞ ⇒ lim P ( An ) = P (∩ An ) n →∞ n =1 (Ω, U , P ) bir olasılık uzayı olsun. A1 , A2 ,..., An olayları Ω nın bir sonlu parçalanması ve B ∈ U , P ( B ) ≠ 0 olmak üzere, P( Aj ∩ B) P( Aj ) P( B / Aj ) P( Aj / B) = = n , j = 1, 2,..., n P( B) ∑ P( Ai ) P( B / Ai ) Bayes Teoremi: i =1 dır. Tanım (Ω, U , P ) bir olasılık uzayı ve olmak üzere, oluyorsa, Tanım ∀ a ∈ R için, X: Ω → R ω → X (ω ) {ω ∈ Ω : X (ω ) ≤ a} ∈ U X fonksiyonuna bir Rasgele Değişken denir. (Ω, U , P ) bir olasılık uzayı ve X : Ω → R ω → X (ω ) bir rasgele değişken olmak üzere, F : R → [0,1] x → F ( x) = P ( X ≤ x ) fonksiyonuna Tanım X rasgele değişkenin dağılım fonksiyonu (birikimli olasılık fonksiyonu) denir. DX = X (Ω) = {x : x ∈ R , ∃ω ∈ Ω için X (ω ) = x} DX kümesi sonlu veya sayılabilir sonsuz elemanlı olduğunda X e kesikli rasgele değişken (discrete random variable) denir. Tanım X kesikli bir rasgele değişken olmak üzere, f ( x ) = P ( X = x ) , x ∈ DX fonksiyonuna X in olasılık fonksiyonu denir. Kesikli bir X rasgele değişkenin dağılım fonksiyonu F ve olasılık fonksiyonu f olmak üzere, F : R → [0,1] x → F ( x) = P( X ≤ x) = ∑ xi ∈DX , xi ≤x f ( xi ) f ( x ) = P ( X = x ) = F ( x ) − F ( x− ) , x ∈ D X 1) f ( x) ≥ 0 , x ∈ DX 2) ∑ f ( x) = 1 x∈DX dır. Tanım Bir X rasgele değişkenin F : R → [0,1] dağılım fonksiyonu, ∞ 1) f ( x) ≥ 0 , x ∈ R 2) ∫ −∞ f ( x)dx = 1 özelliklerine sahip bir f fonksiyonu yardımıyla, x F ( x) = ∫ f ( x)dx , x ∈ R −∞ biçiminde yazılabiliyorsa, X rasgele değişkenine sürekli rasgele değişken (mutlak sürekli rasgele değişken) ve f fonksiyonuna X rasgele değişkeninin olasılık yoğunluk fonksiyonu denir. Sürekli bir X rasgele değişkeninin F dağılım fonksiyonu sürekli bir fonksiyondur. Ayrıca, a < b , a, b ∈ R için P({a}) = F (a) − lim+ F (a − h) = F (a ) − F (a − ) =0 h →0 b P ((a, b]) = F (b) − F (a ) = ∫ f ( x)dx a x F ( x) = ∫ f ( x)dx , x ∈ R −∞ ve F fonksiyonunun türevlenebildiği noktalarda, f ( x) = dır. Tanım i) dF ( x) dx X bir rasgele değişken ve g : R → R bir fonksiyon olmak üzere, X kesikli ve ∑ g ( x ) f ( x ) < ∞ olduğunda, x∈DX ii) X sürekli ve E ( g ( X )) = ∑ g ( x) f ( x) x∈DX ∞ ∞ −∞ −∞ ∫ g ( x ) f ( x ) dx < ∞ olduğunda, E ( g ( X ) ) = ∫ g ( x ) f ( x ) dx g ( X ) in beklenen değeri denir. Tanım X bir rasgele değişken, c ∈ R ve k bir doğal sayı olmak üzere: k a) E ( X − c ) değerine X ‘in c ye göre k ‘inci momenti, k b) E X değerine X ‘in k ‘inci momenti, sayısına c) E ( X ) değerine X ‘in beklenen değeri, 2 E ( X − EX ) değerine X ‘in varyansı, e) E X ( X − 1)( X − 2 )⋯ ( X − k + 1) değerine X ‘in k ‘inci çarpımsal momenti tX f) M X (t ) = E (e ) , − h < t < h (h > 0) fonksiyonuna X in moment üreten fonksiyonu d) denir. Teorem a, b ∈ R olmak üzere, a ) E ( aX + b ) = aE ( X ) + b b) Var ( aX + b ) = a 2Var ( X ) c) Var ( X ) = E X 2 − ( E ( X ) ) d) 2 dn M X (t ) = E ( X n ) , n = 1, 2… dt n t =0 Düzgün Dağılım Bazı Kesikli Dağılımlar o.f. m.ç.f. 1 , x = x1 , x2 ,..., xn n xt n ei , t∈R ∑ i =1 n n ∑x j =1 x= ortalama j n n ∑(x − x ) i =1 varyans parametre Bernoulli Dağılımı b (1, p ) Binom b ( n, p ) o.f. m.ç.f. ortalama varyans parametre o.f. m.ç.f. n x1 , x2 ,..., xn ∈ R , n ∈ {1,2,...} p x (1 − p ) 1− x p (1 − p ) p ∈ (0,1) , n ∈ {1,2,...} n x n− x p (1 − p ) , x = 0,1,...,n x (1 − p + pe ) t n , t∈ℝ np np (1 − p ) parametre p ∈ (0,1) , n ∈ {1,2,...} o.f. a N − a N x n − x n m.ç.f. açık biçimi yok ortalama a N N −n a a × n × × (1 − ) N −1 N N varyans Poisson , x =0,1 1 − p + pet , t ∈ ℝ p ortalama varyans Hipergeometrik 2 i n× parametre N , a, n ∈ {1, 2,...} , a < N , n < N o.f. e−λ λ x , x = 0,1, 2,... x! m.ç.f. e ortalama varyans parametre λ et −1 , t ∈R λ λ λ ∈ (0, ∞) Geometrik o.f. (1 − p ) m.ç.f. pet , 1 − (1 − p ) et ortalama p , x =1,2,... t < − ln(1 − p ) 1 p 1− p p2 varyans Negatif Binom x −1 p ∈ (0,1) parametre o.f. x − 1 k k −r p (1 − p ) , x = k , k + 1,... k − 1 m.ç.f. pet t 1 − (1 − p ) e ortalama k , t < − ln(1 − p ) k p k (1 − p ) p2 p ∈ (0,1) , k ∈ {1, 2,...} varyans parametre Bu ders döneminde sürekli dağılımlardan Düzgün, Üstel, Gamma, Ki-kare ve Normal dağılımı gördükten sonra Ragele Vektörler (Çok Değişkenli Dağılımlar) konusuna değineceğiz. Rasgele Değişkenlerin Bağımsızlığı konusundan sonra Büyük Sayılar Kanunu ve Merkezi Limit Teoremini göreceğiz. Bu bilgiler çerçevesinde birinci dönem değindiğimiz Parametre Tahmini ve Hipotez Testi konuları ile Đstatistiğe Giriş yapmaya devam edeceğiz. Deney, Örnek Uzay, Olasılık Uzayı, Kesikli Rasgele Değişken ve Sürekli Rasgele Değişken kavramlarını aşağıdaki iki örnek üzerinde yeniden hatırlayalım. Örnek 1 Düzgün bir tavla zarı atılması ve üste gelen yüzeyin gözlenmesi deneyini anlatan (modelleyen) Olasılık Uzayı, Ω= U = 2Ω P( A) = olmak üzere, X üste gelen yüzeydeki nokta sayısı olduğunda, n( A) n( A) = n(Ω) 6 Ω= X R 0 1 2 3 4 5 6 7 fonksiyonu ortaya çıkmaktadır. X fonksiyonu, ∀ a ∈ R için, {ω ∈ Ω : X (ω ) ≤ a} ∈ U özelliğini sağlayan bir fonksiyon olup bir rasgele değişkendir. X kesikli bir rasgele değişken olmak üzere, X in olasılık fonksiyonu, f ( x) = P( X = x) = 1 , x ∈ DX = {1, 2,3, 4,5, 6} 6 dır. f fonksiyonunun grafiği, grafik ( f ) = {( x, f ( x)) : x = 1, 2,3, 4,5, 6} f(x) 1/6 • • • • • • x 1 2 3 4 5 6 olmak üzere, bu grafiği f(x) 1/6 x 1 2 3 4 5 6 biçiminde de göstermekteyiz. Okların yükseklikleri o noktalardaki olasılıkları göstermektedir. X rasgele değişkeninin dağılım fonksiyonu, x <1 0 , 1 , 1 ≤ x < 2 6 2 , 2 ≤ x < 3 6 3 F ( x) = P( X ≤ x) = , 3 ≤ x < 4 6 4 , 4 ≤ x < 5 6 5 , 5 ≤ x < 6 6 x≥6 1 , ve grafiği, 0 , x <1 x = , 1≤ x < 6 6 1 , x≥6 F(x) 1 5/6 4/6 3/6 2/6 1/6 1 x 2 3 4 5 6 7 dır. Dağılım fonksiyonunda basamakların yükseklikleri olasılıkları göstermektedir. “Zıplamalı bir hareket” ‘in yol zaman grafiği bir basamak fonksiyonu ile temsil edilebilir. Basmakların yükseklikleri zıplama miktarlarını, zaman eksenindeki konumları da zıplama anlarını göstermektedir. S(t) (metre) 1 5/6 4/6 3/6 2/6 1/6 1 2 t (saniye) 3 4 5 6 7 gibi bir yol-zaman grafiği, örneğin her saniye başında (6 saniye) 100/6 cm ileriye zıplayan ve sonra duran bir kurbağanın hareketini anlatıyor olabilir. Kurbağanın “ani hızlarını” da, V(t) 1/6 t 1 2 3 4 5 6 gibi bir hız-zaman grafiği ile anlatabiliriz. Genel olarak, kesikli bir X rasgele değişkenin olasılık fonksiyonu f ve dağılım fonksiyonu F olmak üzere, f ( x ) = P ( X = x ) , x ∈ DX 1) f ( x) ≥ 0 , x ∈ DX 2) ∑ f ( x) = 1 x∈DX F : R → [0,1] x → F ( x) = P( X ≤ x) = ∑ xi ∈DX , xi ≤x f ( xi ) f ( x ) = P ( X = x ) = F ( x ) − F ( x− ) , x ∈ D X E( X ) = ∑ xf ( x) x∈Dx Var ( X ) = E ( X − E ( X ) ) = 2 M X (t ) = E (etX ) = dır. ∑ ( x − E( X )) x∈DX ∑ e f ( x) tx x∈DX 2 f ( x) Örnek 2 Çok küçük bir boncuk, yarıçapı 10 cm olan bir dairenin içine düşecek şekilde rasgele atılsın. Böyle bir deney için, Örnek Uzay ve uygun bir Olasılık Ölçüsü aşağıdaki gibi olabilir. Ω A P ( A) = " A nın alan ölçüsü " " Ω nın alan ölçüsü " X rasgele değişkeni, deney sonucunda boncuğun düştüğü nokta ile dairenin merkezi arasındaki uzaklık olsun. P ( A) = Ω ω • X R 0 x X (ω ) 10 X rasgele değişkenin aldığı değerlerin kümesi, X (Ω) = { X (ω ) : ω ∈ Ω} = [0,10] ⊂ R ve X in dağılım fonksiyonu, " A nın alan ölçüsü " " Ω nın alan ölçüsü " F: R → [ 0,1] x<0 0 , 2 x → F ( x) = P ( X ≤ x) = , 0 ≤ x < 10 100 x ≥ 10 1 , x olmak üzere, bu dağılım fonksiyonu, x , 0 < x < 10 f ( x) = 50 0 , diğer yerlerde fonksiyonu yardımıyla, x F ( x) = ∫ f ( x)dx , x ∈ R −∞ biçiminde yazılabilir. X sürekli bir rasgele değişkendir. X in dağılım fonksiyonu ve olasılık yoğunluk fonksiyonu, x , 0 < x < 10 f ( x) = 50 0 , diğer yerlerde x<0 0 , 2 x F ( x) = , 0 ≤ x < 10 100 x ≥ 10 1 , olmak üzere, grafikleri F(x) f(x) 1 1/5 1/4 x x x 10 x 10 ve x2 P( X ≤ x) = F ( x) = 100 dır. 5 P( X ≤ x) = ∫ 0 5 x x2 x2 dx = = 50 100 x=0 100 Olasılık yoğunluk fonksiyonlarında olasılık hesabı doğrusal ve “sürekli bir hareket”‘in hız-zaman grafiğinde yol hesabına benzemektedir. Hız-zaman grafiğinde belli bir zaman aralığında alınan yol miktarı bir alana karşılık gelmektedir. Olasılık yoğunluk fonksiyonunda da bir aralığın olasılığı bir alana karşılık gelmektedir. Dağılım fonksiyonunda olasılık hesabı, yol-zaman grafiğinde yol miktarının hesabına benzemektedir. Yukarıdaki iki grafiği, S(t) (km) V(t) 1 1/5 1/4 t t (dakika) 10 5 5 10 biçiminde ele alırsak, bir cismin yol-zaman ve hız-zaman grafiği ile karşılaşırız. Bu harekette yolun zaman bağlı formülü, t2 S (t ) = , 0 ≤ t ≤ 10 100 hızı t V(t)= ∫ 0 t t t2 t2 dt = = , 0 ≤ t ≤ 10 50 100 0 100 ve ivmesi a (t ) = dır. 1 50 , 0 ≤ t ≤ 10