ANADOLU ÜNİVERSİTESİ ENM 317 Prof. Dr. Nihal ERGİNEL 2 ÖRNEKLEME Anakütleden n birimlik örnek alınması ve anakütle parametrelerinin örnekten tahmin edilmesidir. 3 ÖRNEKLEME ALMANIN NEDENLERİ Anakütleye erişilemeyebilir. Anakütleye erişmek maliyetli olabilir. Anakütleye erişmek çok zaman alabilir. Test / ölçüm metodu tahribatlı olabilir. 4 ÖRNEKLEME ÇEŞİTLERİ 1.İradi Örnekleme: Örneklere eşit seçilme şansının verilmediği, bilerek ve isteyerek seçim niteliğinde olan, olasılık hesabına dayanmayan tekniklerdir. 2.Tesadüfi Örnekleme: Örneklerin seçilme şansının eşit olduğu olasılık hesabına dayanan tekniklerdir. •Basit Rassal Örnekleme • Tabakalı örnekleme • Çok Kademeli Örnekleme •Kümelere Göre Örnekleme 5 Basit Rassal Örnekleme : Belirli kurallara bağlı kalmadan örneklerin seçilmesi (milli piyango, sayısal vb.) Rassallığı içerdiği için en çok bu örnekleme tekniği kullanılır. Sistematik Örnekleme: Her saat başı 3 adet örnek almak veya her 50 tanede bir örnek almak gibi 6 Tabakalı Örnekleme: Ana kütle, ilgilenilen özellikler bakımından çok farklılık gösteriyorsa, ana kütleyi tabakalara ayırıp örnek almak gereklidir. Örneğin, gelir seviyelerine göre tabakalandırma, eğitim düzeylerine göre veya işyerinde çalışan sayılarına göre tabakalandırma yapılabilir. Kümelere Göre Örnekleme: Birimlerin dâhil oldukları kümelere göre örnekleme yapılabilir. Örneğin, mahalle, semte göre, işletmenin sektörüne göre, okul tiplerine göre kümelendirilebilir. 7 ÖRNEKLEME DAĞILIMLARI 1) Normal Dağılıma Sahip Bir Ana Kütleden Alınan Örneklerin Ortalamalarının Örnekleme Dağılımı Ana kütle ortalaması µ, standart sapması 𝜎 olan Normal Dağılmış olsun. 𝑥𝑖 ̴ N (µ , 𝜎 2 ). Bu ana kütleden alınan örneklerin ortalamalarının dağılımı; 𝑋 ̴ N (µ , 𝜎2 𝑛 ) olur. 𝜎𝑥 = 𝜎 𝑛 8 Eğer ana kütle hacmi küçük ise 𝑛 ( 𝑁 ≤ 0,05 ise) ; N: Ana kütledeki birim sayısı n: örnekteki birim sayısı 𝜎 : ana kütlenin standart sapma iken 𝜎𝑥 = 𝜎 𝑛 . 𝑁−𝑛 𝑁−1 olur. 9 2) Normal Dağılıma Sahip Bir Ana Kütleden Alınan Örneklerin Oranlarının Örnekleme Dağılımı p: ana kütle oranı 𝑝 : örnek oranı d: örnekteki ilgilenilen birim sayısı n: örnek büyüklüğü Ana kütle oranı bilinmediğinde, p yerine 𝑝 kullanılabilir. 𝑝= 𝑑 𝑛 B [p] = 𝑝 z= 𝑝−𝑝 𝜎𝑝 𝜎𝑝 = 𝑝 (1−𝑝) 𝑛 ̴ N(0,1) 10 Burada np ≥ 5 veya n(1-p) ≥ 5 olmalı. Eğer ana kütle hacmi küçük ise; 𝜎𝑝 = 𝑝 (1−𝑝) 𝑛 . 𝑁−𝑛 𝑁−1 olur. 11 MERKEZİ LİMİT TEOREMİ 𝑥1 , 𝑥2 , 𝑥3 ,…….., 𝑥𝑛 • aynı dağılıma sahip ve • istatistiksel olarak bağımsız rassal değişkenler olsun. Bunların aritmetik ortalaması B[𝑥𝑖 ] = µ𝑖 ve varyansı V(𝑥𝑖 ) = 𝜎𝑖 2 ile gösterilsin. Yeni bir rassal değişken tarif edelim; Y = 𝑥1 + 𝑥2 + 𝑥3 +……..+ 𝑥𝑛 ile oluşan rassal değişken olsun. 12 n yeterince büyük olduğunda, Y’nin dağılımı Normal Dağılıma yaklaşır. Z dönüşümü yapıldığında; Y ̴ N(0,1) olur. 13 Bu teoremin özel bir durumu örnek ortalamaları ile ilgilidir. 𝑥1 , 𝑥2 , 𝑥3 ,…….., 𝑥𝑛 • aynı dağılıma sahip, bağımsız, ardışık rassal değişkenler olsun. • Ortalaması B[𝑥𝑖 ] = µ ve V(𝑥𝑖 ) = 𝜎 2 olsun. Aynı ana kütleden alınan n birimlik örneklerin aritmetik ortalamaları 𝑥𝑖 iken; 14 𝑋 ~ N(µ , 𝜎2 ) 𝑛 olur. Merkezi limit teoremi gereğince, ana kütlenin dağılımı ne olursa olsun, örnekteki birim sayısı n yeterince artırıldığında, örnek ortalamalarının dağılımı Normal Dağılıma yaklaşır. 15 Farkların ve Toplamların Örnekleme Dağılımları Ortalamalar için; A, B iki farklı ana kütle 𝑛𝐴 , 𝑛𝐵 : örnek sayısı 𝑋𝐴 , 𝑋𝐵 : örnek ortalamaları iken, d = 𝑋𝐴 + 𝑋𝐵 ise; B[d] = B[ 𝑋𝐴 ] ± B[ 𝑋𝐵 ] µ𝑑 = µ𝐴 ± µ𝐵 16 𝜎𝑑 2 = 𝜎𝐴 2 𝜎𝐵 2 + 𝑛𝐴 𝑛𝐵 d ̴ N( µ𝐴 ± µ𝐵 ; Z= 𝑑− µ𝑑 𝜎𝑑 𝜎𝐴 2 𝜎𝐵 2 + ) 𝑛𝐴 𝑛𝐵 ̴ N(0,1) 17 Oranlar için; A,B iki farklı ana kütle 𝑝𝐴 , 𝑝𝐵 : örnek oranları 𝑛𝐴 , 𝑛𝐵 : örnek sayısı d = 𝑝𝐴 ± 𝑝𝐵 ise; B[d] = B[ 𝑝𝐴 ] ± B[ 𝑝𝐵 ] = 𝑝𝐴 ± 𝑝𝐵 18 V(d) = Z= 𝑝𝐴 (1− 𝑝𝐴 ) 𝑛𝐴 + 𝑝𝐵 (1− 𝑝𝐵 ) 𝑛𝐵 𝑝𝐴 ± 𝑝𝐵 −(𝑝𝐴 ± 𝑝𝐵 ) 𝑝𝐴 (1− 𝑝𝐴 ) 𝑝𝐵 (1− 𝑝𝐵 ) + 𝑛𝐴 𝑛𝐵 ̴ N(0,1) 19 Gamma Dağılımı α > 0 iken 𝛤 (α) ; 𝛤 (α) = ∞ 𝛼−1 −𝑥 𝑥 . 𝑒 0 . 𝑑𝑥 şeklinde tanımlanan fonksiyona Gamma fonksiyonu denir. 20 Gamma Dağılımı 𝛤 (1) = ∞ 0 𝑒 −𝑥 . 𝑑𝑥 = 1 olur. α > 1 iken , 𝛤 (α) = (α-1) 𝛤 (α-1) olur. 21 Gamma Olasılık Yoğunluk Fonksiyonu α > 0, 𝛽 > 0 olmak üzere f(x) = 𝛽𝛼 𝛤(𝛼) . 𝑥 𝛼−1 . 𝑒 −𝛽𝑥 ; x ≥ 0 0 ;x<0 şeklinde ise, f(x) ‘ e gamma dağılımı, x’ e de Gamma dağılmış rassal değişken denir. 22 Gamma Dağılımı µ= 𝛼 𝛽 2 ,𝜎 = 𝛼 𝛽2 olur. 23 𝜒 Gamma dağılmış bir rassal değişken iken, • k>0 ve tamsayı olmak üzere, • 𝛽 = ½ ise, 𝜒’ e Ki- kare dağılmış rassal değişken denir. 24 Ki – Kare Dağılımı (Chi- Square Distribution) 𝑧1 , 𝑧2 , 𝑧3 ,…….., 𝑧𝑘 ortalaması µ = 0 , varyansı 𝜎 2 = 1 olan Normal dağılmış ve bağımsız rassal değişkenler olsun. 𝜒 2 = 𝑧1 2 + 𝑧2 2 + ….+ 𝑧𝑘 2 ise; 𝜒 2 , Ki-Kare dağılmış rassal değişken olur. 25 Ki – Kare Dağılımı 𝜒 2 ‘ nin olasılık yoğunluk fonksiyonu: 1 𝑓𝑥 2 (u) = 𝑘 (2)2 Г 0 𝑘 2 u (k 2)−1 .𝑒 −u/2 / ; u>0 ; dd 26 Bu dağılıma serbestlik derecesi k olan 𝜒 2 (Ki- kare) dağılımı denir. µ=k 𝜎 2 = 2k 27 t DAĞILIMI z ~ N(0,1) ve V ~ (𝜒𝑘 2 ) k serbestlik derecesi ile 𝜒 2 dağılmış rassal değişken iken, T= 𝑧 𝑉 𝑘 ise, 28 t DAĞILIMI T’nin olasılık yoğunluk fonksiyonu; f(t) = 𝛤[(𝑘+1)/2] . 1 k+1 𝜋𝑘 . 𝛤(𝑘/2) [(𝑡 2 /𝑘 )+1] 2 ; -∞ <t<∞ 29 t DAĞILIMI ! Küçük örneklemelerde t dağılımı kullanılır. 30 F DAĞILIMI W ve Y bağımsız ve serbestlik dereceleri sırasıyla u ve v olan, 𝜒 2 dağılmış rassal değişkenler iken; F= 𝑊 𝑌 𝑢 𝑣 olarak tanımlanırsa; 31 F DAĞILIMI h(f) u+v = Г 2 . u v Г ( ). Г ( ). 2 2 u v u/2 u . (f ) u f+1 v 2 −1 ;0<f<∞ u+v 2 (f) fonksiyonuna F dağılımı denir. X ~ 𝐹𝑢,𝑣 şeklinde gösterilir 32 F DAĞILIMI 𝑆1 2 F=𝑆 2 2 𝜎1 2 𝜎2 2 33 ÖRNEK Bir tuğla üretim sürecinde tuğla bir fırına yerleştirilerek ortalaması 64 dk., standart sapması 5 dk. olmak üzere Normal dağılmış bir pişme zamanı ile fırınlanmaktadır. a)100 adet tuğlanın pişme zamanının 64 dk. 45 sn.den fazla olma olasılığı nedir? b)Pişme süresi 57 dk. ve daha az olan tuğla oranını hesaplayınız. 34 ÇÖZÜM a) µ=64 dk. 𝑋−µ 64,75−64 P(X ≥ 64,75) = P( ≥ 5 ) 𝜎𝑥 100 𝜎 = 5 dk. n = 100 =P(z ≥ 1,5) = 0,5-0,4332=0,0668 b) P(X ≤ 57) = 𝑋−µ P( 𝜎 ≥ 57−64 5 ) = P (z ≤ 1,4) = 0,5-0,4192 = 0,0808 35 ÖRNEK Gıda üzerine çalışan bir firmada, ürünlerde yer alan bir madde miktarının en çok 2 grama kadar olmasına izin verilmektedir. Firmanın geçmiş kayıtları incelendiğinde, paketlenen ürünlerde yer alan söz konusu maddenin 1,25 gr’a eşit olduğu ve standart sapması 0,5 gr olan Normal Dağıldığı görülmüştür. a) İçinde bulunan miktar itibariyle limitin üstünde olan paketlerin oranını, b) Seçilen herhangi bir paketteki maddenin 1,75 ile 2 gr arasında olma olasılığı, c) Rassal olarak seçilen 25 br’lik biri örneğin ortalamasının 1,6’dan büyük çıkma olasılığını hesaplayınız. 36 ÇÖZÜM a)µ= 1,25 gr 𝜎 = 0,5 gr P(X ≥ 2) = 𝑋−µ P( 𝜎 ≥ 2−1,25 0,5 ) = P(z ≥ 1,5 ) = 0,0668 b) P(1,75 ≤ X ≤ 2) = 1,75−1,25 P( 0,5 ≤𝑧 ≤ 2−1,25 ) 0,5 = P (1 ≤ X ≤ 1,5) = 0,0919 37 c) n = 25 𝜎𝑥 = 𝜎 𝑛 = 0,5 5 = 0,1 𝑋−µ P( 𝑋 ≥ 1,6) = P( 𝜎 ≥ 𝑥 1,6−1,25 ) 0,1 = P( z ≥ 3,5) = 0,0002