Örnekleme Planları İstatistik ve Olasılık Örnekleme Planlar ve Dağılımları Prof. Dr. İrfan KAYMAZ Atatürk Üniversitesi Tanım Örnekleme Planları İncelenen olayın ait olduğu anakütlenin bütünüyle dikkate alınması zaman, para, ekipman ve bunun gibi nedenlerden dolayı mümkün değildir. Bunun için anakütleyi temsil eden örnekler üzerinde çalışılır ve elde edilen sonuçlar kullanılarak anakütle hakkında bazı tahminler yapılır. Yapılan tahminlerin kesin sonuca yakınsayabilmesi, çekilen örneklerin anakütleyi temsil edebilmesine bağlıdır. Örneğin: seçimden önce sonuçların tahmini, üretilen malların tüketiciye gönderilmeden önce belirli özelliklere (sözgelimi standartlara) uygun olup olmadıklarının tahmini Makine elemanın ömrünün tahmini gibi günlük yaşamda sık yapılan bu işlem için anakütle yerine bu anakütleden örneklerin çekilmesi, incelenmesi ve sonuçlara ulaşılması örnekleme teorisinin konularını oluşturur. Atatürk Üniversitesi Beklenen Değer Örnekleme Planları Olasılık yoğunluk fonksiyonu /olasılık fonksiyonu ve dağılım fonksiyonu bir rastgele değişkenin komple (tam) tanımlamasını içermektedir. Ancak bu fonksiyonlar, ana kütleden elde edilen örnekler üzerinden hesaplanmaktadır veya tanımlanmaktadır. Kimi durumlarda rastgele değişkene ait tasvir edici parametrelerin hesaplanması, o rastgele değişkene ait genel özet bilgilerin elde edilmesi istenir. Bu özet bilgilerden en önemlisi beklenen değer( ümit) (expected value) Rastgele değişkene ait beklenen değer Kesikli Rastgele Değişken Sürekli Rastgele Değişken Atatürk Üniversitesi Beklenen Değer Örnekleme Planları Örnek: Bir süpermarket için müşterinin kasada bekleme zamanı (X)i tanımlayan olasılık yoğunluk fonksiyonu aşağıda verilmiştir: Müşterilerin ortalama bekleme sürelerini bulunuz. Örnek Çözüm: Atatürk Üniversitesi Beklenen Değer Örnekleme Planları Örnek: X zar atışında bir zarın alacağı değerleri göstermektedir. E(X) =? Örnek Çözüm: X in alacağı muhtemel değerler: 1,2,3,4,5 ve 6. Dolayısıyla X rastgele değişkenin olasılık yoğunluk fonksiyonu: Bir Zar atıldığında böyle bir sayı ile karşılaşılabilir mi??? Atatürk Üniversitesi Büyük Sayılar Yasası Örnekleme Planları Bir önceki örnekte zar atışında beklene değer 3.5 olarak hesaplanmıştı. Böyle bir değer asla gelmez. İstatistiksel kurallarda rastlantıya bağlı bir olayın çok (sonsuz) kez yinelenmesiyle farklılaşmaya yol açan rastgele nedenlerin birbirini dengeleyeceği düşünülmektedir. Böylece, çok kez tekrar halinde, belirli ve önemli olan nedenlerin etkisinin “ortalama değer” olarak görülebileceği kabul edilmektedir (büyük sayılar yasası). Bu teorem, n yeterince büyük olduğunda rastgele değişkenin gözlemlenen değerleri yaklaşık olarak ortalama değerine eşit olma ihtimali oldukça büyüktür. Dolayısıyla zar atışında beklenen değerin 3.5 olması, 3.5 değerini gözlemleyeceğimiz anlamına gelmez. Bir zarın pek çok kez atılması neticesindeki ortalama değer yaklaşık olarak 3.5 olduğu söylenebilir. Atatürk Üniversitesi Örnekleme Planları Merkezi Limit Teoremi Açıklayıcı İstatistikte çok önemli olan Merkezi Limit Teoremi: Ortalaması ve varyansı 2 olan herhangi bir anakütleden rastgele çekilen n birimlik örneklerin ortalamalarının dağılımı normal, ortalaması ve varyansı 2/n dir. Bu gibi durumlarda kullanılacak Z eşitliği yandaki biçimde olacaktır Z X 2 n Bu teoremin bir sonucu olarak; 2 örnekteki birim sayısı yeterince büyük olduğunda X ~ N( ; ) ilişkisi n anakütlenin dağılımına bakılmaksızın yazılabilmektedir. . . Atatürk Üniversitesi Örnekleme Planları Merkezi Limit Teoremi Örnek: Bir torbada 20 top->1 20 top->2 20 top->3 20 top->4 20 top->5 olarak işaretlenmiş olsun. Bu torbadan iadeli olmak koşuluyla 2 top çekilmektedir. Burada örnek sayısı 2 olmaktadır. Bu işlem 25 kez tekrarlandığında yandaki tabloda verilen değerler gözlemlenmiştir. Örnek İlk Top İkinci Top Örnek ortalaması 1 1 3 2.0 2 2 1 1.5 3 2 1 1.5 4 1 1 1.0 5 4 2 3.0 6 1 3 2.0 7 1 2 1.5 8 3 1 2.0 9 2 5 3.5 10 1 3 2.0 11 3 3 3.0 12 4 2 3.0 13 5 2 3.5 14 3 1 2.0 15 1 4 2.5 16 4 4 4.0 17 2 2 2.0 18 2 2 2.0 19 1 1 1.0 20 2 5 3.5 21 1 2 1.5 22 5 5 5.0 23 3 2 2.5 24 5 5 5.0 25 2 1 1.5 Atatürk Üniversitesi Örnekleme Planları Merkezi Limit Teoremi Örneklerin ortalamalarının olasılıkları Örnek Ortalaması Frekans Nisbi Frekans Olasılık 1.0 3 3/25 0.12 1.5 4 4/25 0.16 2.0 7 7/25 0.28 2.5 2 2/25 0.08 3.0 3 3/25 0.12 3.5 3 3/25 0.12 4.0 1 1/25 0.04 4.5 0 0/25 0.00 5.0 2 2/25 0.08 Normal Dağılıma benziyor mu??? Atatürk Üniversitesi Merkezi Limit Teoremi Örnekleme Planları n=5 n=20 n=10 Atatürk Üniversitesi Örnekleme Planları Örnekleme Dağılımı: Tanım Atatürk Üniversitesinde ortalama bir öğrencinin boy ortalamasını belirlemeye çalışalım. Bütün öğrencilerin boylarını ölçüp ortalama değerini hesaplamak mümkün değildir. Rastgele seçilen 10 öğrencinin boylarını ölçüp kaydedelim. Bu işlem beş kez tekrarlanıp aşağıda her bir tekrarın ortalama değeri belirtilmiştir. Örnekleme Numarası Boyların ortalama değeri (Örnek Ortalaması) 1 1.68 2 1.70 3 1.66 4 1.69 5 1.71 Tablodan görüleceği gibi her bir örnekleme kendisine ait ortalama değerine sahiptir ve birbirlerinden farklıdır. Bu dağılma örnekleme dağılımı denir. Atatürk Üniversitesi Örnek Ortalamasının Dağılımı Örnekleme Planları N birimlik bir anakütleden rastgele çekilecek n birimlik örnek sayısı örneklemenin iadeli veya iadesiz yapılışına göre farklı sayıda olacaktır. Çekilecek örnek sayısı: Her iki durumda da çekilecek örnek ortalamalarının ortalaması, ana kütle ortalamasına eşittir. Örnek ortalamalarının varyansı: Atatürk Üniversitesi Örnek Ortalamasının Dağılımı Örnekleme Planları Anakütlenin dağılımı normal ise örnek ortalamasının dağılımı da normal olacaktır. Anakütlenin dağılımı bilinmese de örnek ortalamasının dağılımının merkezi limit teoremine göre normal dağılım olacaktır. Her iki durumda kullanılacak Z eşitlikleri: Atatürk Üniversitesi Örnek Ortalaması Örnekleme Planları Örnek: Bir bölgedeki telefon görüşmeleri üzerine yapılan incelemede ortalama görüşme süresinin 8 dakika ve varyansının 4 olduğu belirlenmiştir. Rasgele seçilen 49 telefon görüşmesinde ortalama görüşme süresinin 7.8 dakika ile 8.4 dakika arasında çıkma olasılığı nedir? Örnek ÇÖZÜM: Anakütlenin dağılımı bilinmese de örnek ortalamasının dağılımının merkezi limit teoremine göre normal dağılım olacağından normal dağılım yardımıyla istenen olasılık değeri hesaplanabilir. Buna göre; Atatürk Üniversitesi İki Ortalama Farkı ve Toplamı Örnekleme Planları İKİ ORTALAMA ARASINDAKİ FARKIN VE TOPLAMIN DAĞILIMI Herhangi iki anakütleden rastgele çekilen n1 ve n2 büyüklükteki örneklerin toplamına (ve farkına) ait değerlerin ortalaması, anakütle ortalamalarının toplam (ve farkına), varyansları ise örnek varyanslarının toplamına eşittir. Yani, Ortalamaların toplam ve farklarının dağılımı ya normaldir ya da yaklaşık olarak normaldir. Bu ifadenin yazılışı ve kullanılacak Z eşitliği: Atatürk Üniversitesi İki Ortalama Farkı ve Toplamı Örnekleme Planları Örnek: Kablo üreticisi iki firmanın ürettikleri kabloların kopma mukavemetleri ortalamasının, sırasıyla 200 kg/cm2 ve 180 kg/cm2, standart sapmalarının 13.5 kg/cm2 ve 200 kg/cm2 olduğu belirtilmiştir. Bu iddianın doğru olup olmadığını test etmek isteyen tüketici bir firma ilk firmanın üretiminden rastgele 100 parça kablo, ikinci firmanın üretiminden rastgele 50 parça kablo almıştır. Üretici firmaların beyanatlarının doğru olduğu kabul edilirse; birinci ve ikinci firmanın kablolarının kopma mukavemetleri ortalamaları arasındaki farkın; a) En fazla 17 kg/cm2 çıkması olasılığı nedir? b) En az 15 kg/cm2 çıkması olasılığı nedir? Atatürk Üniversitesi İki Ortalama Farkı ve Toplamı Örnekleme Planları Örnek Çözüm: Atatürk Üniversitesi Bir Oranın Dağılımı Örnekleme Planları Atatürk Üniversitesi Bir Oranın Dağılımı Örnekleme Planları Örnek: Bir süpermarketten 50 milyon TL veya daha fazla bedelli ürün alan müşterilerin ortalama olarak %30’unun kredi kartı kullandığı belirlenmiştir. 50 milyon TL veya daha fazla bedelli ürün alan müşteriler arasından rastgele seçilen 100 müşteriden ödemesini kredi kartı ile yapanların oranının %20 ile %25 arasında çıkması olasılığı nedir? Örnek ÇÖZÜM: Örnek hacmi yeterince büyük olduğu için binom dağılımına normal dağılım yaklaşımı kullanılabilir. Atatürk Üniversitesi İki Oran Toplamı ve Farkı Örnekleme Planları Herhangi iki binom anakütlesinden rastgele çekilen n1 ve n2 birimlik örneklerden elde edilen oranların toplam ve farkları; ortalaması ve varyansı olan yaklaşık normal dağılım gösterir. Z değeri ise aşağıdaki gibidir: Atatürk Üniversitesi İki Oran Toplamı ve Farkı Örnekleme Planları Örnek: Pil üreten iki fabrikanın ürettiği pillerin dayanma sürelerini aşağıdaki şekilde açıklamışlardır: Birinci fabrika: Pillerimizin %80’i 200 saatin üzerinde dayanır İkinci fabrika: Pillerimizin %73’ü 200 saatin üzerinde dayanır Bunu test etmek isteyen bir tüketici örgütü birinci fabrikanın üretiminden rastgele 50 adet pil, ikinci fabrikanın üretiminden rastgele 60 pil almıştır. Birinci ve ikinci fabrikada üretilen pillerin dayanma oranları arasındaki farkın en az %10 olma olasılığı nedir? Atatürk Üniversitesi İki Oran Toplamı ve Farkı Örnekleme Planları Örnek Çözüm: Binom dağılımına normal dağılım yaklaşımı ile çözülebilir. Atatürk Üniversitesi Gelecek Dersin Konusu Örnekleme Planları İstatistiki Tahminler…. Atatürk Üniversitesi