İstatistik ve Olasılık

advertisement
Örnekleme Planları
İstatistik ve Olasılık
Örnekleme Planlar ve
Dağılımları
Prof. Dr. İrfan KAYMAZ
Atatürk Üniversitesi
Tanım
Örnekleme Planları
İncelenen olayın ait olduğu anakütlenin bütünüyle dikkate alınması zaman,
para, ekipman ve bunun gibi nedenlerden dolayı mümkün değildir.
Bunun için anakütleyi temsil eden örnekler üzerinde çalışılır ve elde edilen
sonuçlar kullanılarak anakütle hakkında bazı tahminler yapılır.
Yapılan tahminlerin kesin sonuca yakınsayabilmesi, çekilen örneklerin
anakütleyi temsil edebilmesine bağlıdır.
Örneğin:
seçimden önce sonuçların tahmini,
üretilen malların tüketiciye gönderilmeden önce belirli özelliklere (sözgelimi
standartlara) uygun olup olmadıklarının tahmini
Makine elemanın ömrünün tahmini
gibi günlük yaşamda sık yapılan bu işlem için anakütle yerine bu anakütleden
örneklerin çekilmesi, incelenmesi ve sonuçlara ulaşılması örnekleme
teorisinin konularını oluşturur.
Atatürk Üniversitesi
Beklenen Değer
Örnekleme Planları
Olasılık yoğunluk fonksiyonu /olasılık fonksiyonu ve dağılım fonksiyonu bir
rastgele değişkenin komple (tam) tanımlamasını içermektedir.
Ancak bu fonksiyonlar, ana kütleden elde edilen örnekler üzerinden
hesaplanmaktadır veya tanımlanmaktadır.
Kimi durumlarda rastgele değişkene ait tasvir edici parametrelerin
hesaplanması, o rastgele değişkene ait genel özet bilgilerin elde edilmesi
istenir.
Bu özet bilgilerden en önemlisi beklenen değer( ümit) (expected value)
Rastgele değişkene ait beklenen değer
Kesikli Rastgele Değişken
Sürekli Rastgele Değişken
Atatürk Üniversitesi
Beklenen Değer
Örnekleme Planları
Örnek:
Bir süpermarket için müşterinin kasada bekleme zamanı (X)i tanımlayan
olasılık yoğunluk fonksiyonu aşağıda verilmiştir:
Müşterilerin ortalama bekleme sürelerini bulunuz.
Örnek Çözüm:
Atatürk Üniversitesi
Beklenen Değer
Örnekleme Planları
Örnek:
X zar atışında bir zarın alacağı değerleri göstermektedir.
E(X) =?
Örnek Çözüm:
X in alacağı muhtemel değerler: 1,2,3,4,5 ve 6.
Dolayısıyla X rastgele değişkenin olasılık yoğunluk
fonksiyonu:
Bir Zar atıldığında böyle bir sayı ile karşılaşılabilir mi???
Atatürk Üniversitesi
Büyük Sayılar Yasası
Örnekleme Planları
Bir önceki örnekte zar atışında beklene değer 3.5 olarak hesaplanmıştı.
Böyle bir değer asla gelmez.
İstatistiksel kurallarda rastlantıya bağlı bir olayın çok (sonsuz) kez yinelenmesiyle
farklılaşmaya yol açan rastgele nedenlerin birbirini dengeleyeceği düşünülmektedir.
Böylece, çok kez tekrar halinde, belirli ve önemli olan nedenlerin etkisinin “ortalama değer”
olarak görülebileceği kabul edilmektedir (büyük sayılar yasası).
Bu teorem, n yeterince büyük olduğunda rastgele değişkenin gözlemlenen değerleri
yaklaşık olarak ortalama değerine eşit olma ihtimali oldukça büyüktür.
Dolayısıyla zar atışında beklenen değerin 3.5 olması, 3.5 değerini
gözlemleyeceğimiz anlamına gelmez.
Bir zarın pek çok kez atılması neticesindeki ortalama değer yaklaşık olarak 3.5
olduğu söylenebilir.
Atatürk Üniversitesi
Örnekleme Planları
Merkezi Limit Teoremi
Açıklayıcı İstatistikte çok önemli olan Merkezi Limit Teoremi:
Ortalaması  ve varyansı 2 olan herhangi bir anakütleden rastgele çekilen n
birimlik örneklerin ortalamalarının dağılımı normal, ortalaması  ve varyansı 2/n
dir.
Bu gibi durumlarda kullanılacak Z eşitliği yandaki biçimde olacaktır
Z
X
2
n
Bu teoremin bir sonucu olarak;
2
örnekteki birim sayısı yeterince büyük olduğunda X ~ N( ; ) ilişkisi
n
anakütlenin dağılımına bakılmaksızın yazılabilmektedir.
.
.
Atatürk Üniversitesi
Örnekleme Planları
Merkezi Limit Teoremi
Örnek:
Bir torbada
20 top->1
20 top->2
20 top->3
20 top->4
20 top->5
olarak işaretlenmiş olsun. Bu torbadan iadeli
olmak koşuluyla 2 top çekilmektedir. Burada
örnek sayısı 2 olmaktadır. Bu işlem 25 kez
tekrarlandığında yandaki tabloda verilen
değerler gözlemlenmiştir.
Örnek
İlk Top
İkinci Top
Örnek ortalaması
1
1
3
2.0
2
2
1
1.5
3
2
1
1.5
4
1
1
1.0
5
4
2
3.0
6
1
3
2.0
7
1
2
1.5
8
3
1
2.0
9
2
5
3.5
10
1
3
2.0
11
3
3
3.0
12
4
2
3.0
13
5
2
3.5
14
3
1
2.0
15
1
4
2.5
16
4
4
4.0
17
2
2
2.0
18
2
2
2.0
19
1
1
1.0
20
2
5
3.5
21
1
2
1.5
22
5
5
5.0
23
3
2
2.5
24
5
5
5.0
25
2
1
1.5
Atatürk Üniversitesi
Örnekleme Planları
Merkezi Limit Teoremi
Örneklerin ortalamalarının olasılıkları
Örnek Ortalaması
Frekans
Nisbi Frekans
Olasılık
1.0
3
3/25
0.12
1.5
4
4/25
0.16
2.0
7
7/25
0.28
2.5
2
2/25
0.08
3.0
3
3/25
0.12
3.5
3
3/25
0.12
4.0
1
1/25
0.04
4.5
0
0/25
0.00
5.0
2
2/25
0.08
Normal Dağılıma benziyor mu???
Atatürk Üniversitesi
Merkezi Limit Teoremi
Örnekleme Planları
n=5
n=20
n=10
Atatürk Üniversitesi
Örnekleme Planları
Örnekleme Dağılımı: Tanım
Atatürk Üniversitesinde ortalama bir öğrencinin boy ortalamasını belirlemeye
çalışalım.
Bütün öğrencilerin boylarını ölçüp ortalama değerini hesaplamak mümkün
değildir.
Rastgele seçilen 10 öğrencinin boylarını ölçüp kaydedelim.
Bu işlem beş kez tekrarlanıp aşağıda her bir tekrarın ortalama değeri belirtilmiştir.
Örnekleme Numarası
Boyların ortalama değeri
(Örnek Ortalaması)
1
1.68
2
1.70
3
1.66
4
1.69
5
1.71
Tablodan görüleceği gibi her bir örnekleme kendisine ait ortalama değerine
sahiptir ve birbirlerinden farklıdır.
Bu dağılma örnekleme dağılımı denir.
Atatürk Üniversitesi
Örnek Ortalamasının Dağılımı
Örnekleme Planları
N birimlik bir anakütleden rastgele çekilecek n birimlik örnek sayısı
örneklemenin iadeli veya iadesiz yapılışına göre farklı sayıda olacaktır.
Çekilecek örnek sayısı:
Her iki durumda da çekilecek örnek
ortalamalarının ortalaması, ana kütle
ortalamasına eşittir.
Örnek ortalamalarının varyansı:
Atatürk Üniversitesi
Örnek Ortalamasının Dağılımı
Örnekleme Planları
Anakütlenin dağılımı normal ise örnek ortalamasının dağılımı da
normal olacaktır.
Anakütlenin dağılımı bilinmese de örnek ortalamasının dağılımının
merkezi limit teoremine göre normal dağılım olacaktır.
Her iki durumda kullanılacak Z eşitlikleri:
Atatürk Üniversitesi
Örnek Ortalaması
Örnekleme Planları
Örnek:
Bir bölgedeki telefon görüşmeleri üzerine yapılan incelemede ortalama
görüşme süresinin 8 dakika ve varyansının 4 olduğu belirlenmiştir. Rasgele
seçilen 49 telefon görüşmesinde ortalama görüşme süresinin 7.8 dakika ile 8.4
dakika arasında çıkma olasılığı nedir?
Örnek ÇÖZÜM:
Anakütlenin dağılımı bilinmese de örnek ortalamasının dağılımının merkezi
limit teoremine göre normal dağılım olacağından normal dağılım yardımıyla
istenen olasılık değeri hesaplanabilir. Buna göre;
Atatürk Üniversitesi
İki Ortalama Farkı ve Toplamı
Örnekleme Planları
İKİ ORTALAMA ARASINDAKİ FARKIN VE TOPLAMIN DAĞILIMI
Herhangi iki anakütleden rastgele çekilen n1 ve n2 büyüklükteki örneklerin
toplamına (ve farkına) ait değerlerin ortalaması, anakütle ortalamalarının
toplam (ve farkına), varyansları ise örnek varyanslarının toplamına eşittir. Yani,
Ortalamaların toplam ve farklarının dağılımı ya normaldir ya da yaklaşık
olarak normaldir.
Bu ifadenin yazılışı ve kullanılacak Z eşitliği:
Atatürk Üniversitesi
İki Ortalama Farkı ve Toplamı
Örnekleme Planları
Örnek:
Kablo üreticisi iki firmanın ürettikleri kabloların kopma mukavemetleri
ortalamasının, sırasıyla 200 kg/cm2 ve 180 kg/cm2, standart sapmalarının 13.5
kg/cm2 ve 200 kg/cm2 olduğu belirtilmiştir. Bu iddianın doğru olup olmadığını
test etmek isteyen tüketici bir firma ilk firmanın üretiminden rastgele 100 parça
kablo, ikinci firmanın üretiminden rastgele 50 parça kablo almıştır. Üretici
firmaların beyanatlarının doğru olduğu kabul edilirse; birinci ve ikinci firmanın
kablolarının kopma mukavemetleri ortalamaları arasındaki farkın;
a) En fazla 17 kg/cm2 çıkması olasılığı nedir?
b) En az 15 kg/cm2 çıkması olasılığı nedir?
Atatürk Üniversitesi
İki Ortalama Farkı ve Toplamı
Örnekleme Planları
Örnek Çözüm:
Atatürk Üniversitesi
Bir Oranın Dağılımı
Örnekleme Planları
Atatürk Üniversitesi
Bir Oranın Dağılımı
Örnekleme Planları
Örnek:
Bir süpermarketten 50 milyon TL veya daha fazla bedelli ürün alan müşterilerin
ortalama olarak %30’unun kredi kartı kullandığı belirlenmiştir. 50 milyon TL veya
daha fazla bedelli ürün alan müşteriler arasından rastgele seçilen 100
müşteriden ödemesini kredi kartı ile yapanların oranının %20 ile %25 arasında
çıkması olasılığı nedir?
Örnek ÇÖZÜM:
Örnek hacmi yeterince büyük olduğu için binom dağılımına normal dağılım
yaklaşımı kullanılabilir.
Atatürk Üniversitesi
İki Oran Toplamı ve Farkı
Örnekleme Planları
Herhangi iki binom anakütlesinden rastgele çekilen n1 ve n2 birimlik
örneklerden elde edilen oranların toplam ve farkları;
ortalaması ve varyansı
olan yaklaşık normal dağılım gösterir.
Z değeri ise aşağıdaki gibidir:
Atatürk Üniversitesi
İki Oran Toplamı ve Farkı
Örnekleme Planları
Örnek:
Pil üreten iki fabrikanın ürettiği pillerin dayanma sürelerini aşağıdaki şekilde
açıklamışlardır:
Birinci fabrika: Pillerimizin %80’i 200 saatin üzerinde dayanır
İkinci fabrika: Pillerimizin %73’ü 200 saatin üzerinde dayanır
Bunu test etmek isteyen bir tüketici örgütü birinci fabrikanın üretiminden
rastgele 50 adet pil, ikinci fabrikanın üretiminden rastgele 60 pil almıştır.
Birinci ve ikinci fabrikada üretilen pillerin dayanma oranları arasındaki farkın
en az %10 olma olasılığı nedir?
Atatürk Üniversitesi
İki Oran Toplamı ve Farkı
Örnekleme Planları
Örnek Çözüm:
Binom dağılımına normal dağılım yaklaşımı ile çözülebilir.
Atatürk Üniversitesi
Gelecek Dersin Konusu
Örnekleme Planları
İstatistiki Tahminler….
Atatürk Üniversitesi
Download