süreklġ olasılık dağılımları süreklġ olasılık dağılımları

advertisement
SÜREKLĠ OLASILIK
DAĞILIMLARI
Sayı ekseni üzerindeki tüm noktalarda değer alabilen
değişkenler, sürekli değişkenler olarak tanımlanmaktadır.
Bu bölümde, sürekli değişkenlere uygun olasılık
dağılımları üzerinde duracağız.
Normal Olasılık Dağılımı
18. yy’da astronotlar, bir nesnenin kütlesini tekrarlamalı
olarak ölçtüklerinde, ölçüm sonuçlarının değiştiğini
gözlemişlerdir.
Bu ölçümleri çok fazla sayıda yapıp, bir frekans dağılımı
halinde düzenledikten sonra, grafiğini çizmişler ve elde
edilen dağılışa normal dağılış adını vermişlerdir.
Anakitlenin oransal frekansıyla ilgili en yaygın
kullanımı olan olasılık dağılımı C.F. Gauss (17771855) tarafından önerilmiş ve pek çok alanda
şaşırtıcı bir kullanım bulmuştur.
Normal dağılımın grafiği, normal eğri veya Gauss
eğrisi olarak anılır. Bu dağılım çan şeklindedir.
Normal eğri
Normal Olasılık Dağılımı
Bir veri seti için, standart sapması küçük olan
dağılım, daha sivridir.
Standart sapma büyüdükçe, eğri daha geniş bir
aralığa yayılmaktadır.
μ= -4, σ= 0.5
μ= 3, σ= 1
μ= 0, σ= 1.5
-4
0
3
Pek çok doğal ve fiziksel ölçüm, gözlenen frekans
dağılımlarına uygundur.
Normal dağılış, n≥30 örnek hacmi için, gerek örnek
ortalamaları, gerekse örnek oranlarının
dağılımlarına çok uygun bir dağılıştır.
Normal dağılış, n>20 olduğu durumlarda, binomial
olasılıkları tahmin etmek için kullanılabilir.
Aşağıda normal dağılışa uygun bazı örnekler yer
almaktadır:
 Bireylerin IQ değerleri,
 Bireylerin ağırlıkları,
 Bireylerin boyları,
 Satış miktarları,
 Ürünlerin bozulma süreleri,
 İnsan ve makine üretimleri
 Bir bölgedeki işletmelerde dekara buğday verimi
Normal Eğrinin Özellikleri
Normal dağılış eğrisini elde edebilmek için,
aşağıdaki fonksiyon kullanılmaktadır.
1
f(x) =
e-(1/2)[(x-μ)/σ]2
σ√2Π
Fonksiyonda;
x= Sürekli bir şans değişkeninin herhangi bir değeri,
μ= Şans değişkeninin ortalaması
σ= Şans değişkeninin standart sapması
e= 2.71828 (doğal logaritma tabanı)
Π= 3.1416
Fonksiyonda;
σ ve μ’nin bilindiği varsayılmaktadır.
Bunun anlamı; farklı her σ ve μ çifti için, farklı bir normal
dağılış eğrisi elde edileceğidir.
Herhangi bir normal dağılış eğrisinin tipik özellikleri:
Çan şeklindedir.
Aritmetik ortalamaya göre simetriktir.
Normal dağılışın tanımlanabilmesi için, μ ve σ’nın bilinmesi
gereklidir.
Her bir σ ve μ çifti için, farklı bir normal dağılış söz
konusudur.
Aritmetik ortalamanın sağına ve soluna doğru sonsuz
uzanır.
Herhangi bir normal dağılış eğrisinde:
Aritmetik ortalamanın 2 standart sapma solu ile 2
standart sapma sağındaki aralıkta, verilerin %95’i
yer alır.
%95
0.135
0.135
0.34
0.34
0.135
0.135
+
0.95
-2σ
μ
2σ
Herhangi bir normal dağılış eğrisinde:
Aritmetik ortalamanın 3 standart sapma solu ile 3
standart sapma sağındaki aralıkta, verilerin %99’u
yer alır.
%99
0.02
0.02
0.34
0.34
0.135
0.135
0.02
0.02
+
0.99
-3σ
μ
3σ
Standart Normal Dağılış
Aritmetik ortalaması sıfır, standart sapması bir olan
normal dağılışa, standart normal dağılış denir.
Standart z Değeri
z değeri, normal dağılış eğrisinin merkeziyle (veya
aritmetik ortalamasıyla), x değeri arasındaki
mesafenin, kaç standart sapma olduğunu ifade
eder.
z Değeri
z= (x-μ)/σ formülüyle hesaplanır. Burada:
z: Standart sapma cinsinden, aritmetik ortalamadan
uzaklık
x: Normal dağılış değişkenin bir değeri,
μ: Dağılımın aritmetik ortalaması
σ: Dağılımın standart sapması
Herhangi bir sürekli değişkenin tüm değerleri için, z
değeri hesaplandığında, standart normal dağılışa
dönüştürülmüş olur.
Bir başka ifadeyle, yapılan işlem
standartlaştırmadır.
Artık standartlaştırılan değişkeninin aritmetik
ortalaması sıfır, standart sapması birdir.
Standart Normal Dağılışın Özellikleri:
1. Eğri altında kalan %1 veya %100’dür. Bir başka
ifadeyle, toplam olasılık %1 veya %100’dür.
2. Alanın yarısı aritmetik ortalamanın sağında,
diğer yarısı ise solunda yer alır.
3. Herhangi bir şans değişkeninin belli bir aralıktaki
olasılığı, aralığın iki noktası arasında kalan
alandır.
4. Sürekli ölçekte ölçülür ve tek bir değerin normal
dağılıştaki olasılığı sıfırdır.
Standart Normal Eğri Altındaki Alanın Bulunması
Belli bir aralıkta, normal dağılış eğrisinin altında kalan
alanın bulunabilmesi için, matematiksel olarak, normal
dağılış formülünün integralini almak gerekmektedir.
Bu, karmaşık bir hesaplama şekli olduğundan, hazır bir
normal dağılış tablosunun kullanılması daha anlamlı ve
kolay olduğu düşünülmüş ve bu amaçla standart normal
dağılış (μ=0, σ=1) için hesaplanmış değerlerin
bulunduğu, normal dağılış tablosu geliştirilmiştir.
Standart Normal Eğri Altındaki Alanın Bulunması
Normal dağılış gösteren bir değişkenin, herhangi bir
aralığına ait eğri altındaki alan hesaplanırken,
aşağıdaki süreç izlenmektedir:
1. Değişkenin aritmetik ortalaması ile aralığın
başlangıç ve son değerleri normal dağılış grafiği
üzerine yerleştirilir.
2. Başlangıç ve son değerleri için z değerleri
hesaplanır. z değeri eğer pozitif ise, o değerin
aritmetik ortalamasının sağında, negatif ise
solunda yer aldığı anlaşılır.
Standart Normal Eğri Altındaki Alanın Bulunması
3. z değeri negatif ise, z’nin mutlak değeri alınır.
4. z tablosu, yüzde birler basamağına duyarlıdır. Bu
nedenle, z değeri ondalık noktadan itibaren 2
basamak yürütülerek hesaplanmalıdır.
z değerinin tablo değerini bulabilmek için, z
tablosunun sol sütununda 1’ler ve onda birler
basamağı, üst satırında ise yüzde birler basamağı
işaretlenir.
Standart Normal Eğri Altındaki Alanın Bulunması
Örneğin, z=1.46 ise, 1.4 sol sütundan, 6 ise üst
satırdan bulunur ve bu satır ve sütunların kesiştiği
noktadaki değer, olasılık olarak alınır.
5. Başlangıç değerinin z değerine karşılık gelen
tablo değeri, başlangıç değeri ile, aritmetik ortalama
arasında kalan alanın yüzde oranını verir.
 Bu oran, şans değişkeninin aritmetik ortalaması
ile o değer arasında yer alma olasılığıdır.
Standart Normal Eğri Altındaki Alanın Bulunması
6. Aralığın başlangıç ve son değerlerinin z değerleri
göz önüne alınarak, gerekli toplama ve çıkarma
işlemleri yapılır.
 z değerlerinin ikisi birden pozitif ise büyük tablo
değerinden, küçük tablo değeri çıkarılar.
 z değerleri ters işaretli ise, tablo değerleri
toplanır.
μ= 500, σ= 25 olan ve normal dağılış gösteren bir
şans değişkeni için, 535 değerinin altında
kalanlarının (x<535) olasılığını (oranını)
hesaplayalım.
A1
0.5
500
535
Önce A1
alanını
hesaplayalım:
535-500
z=
25
z= 1.4 standart sapma
z’nin 1.4 olması, 535 değerinin aritmetik
ortalamadan 1.4 standart sapma sağda yer aldığını
göstermektedir.
 z’nin 1.4 olduğu durum için normal dağılış tablo
değeri 0.4192’dir.
 p(500 < x < 535) = A1 = ztablo = 0.4192
 Buna göre, 535 ile aritmetik ortalama (500)
arasındaki aralıkta, eğri altında kalan alan 1
üzerinden 0.4192 veya yüzde olarak %41.92’dir.
535’in altında kalan aralığa ait alanı hesaplamaya
çalıştığımızdan, aritmetik ortalamanın solundaki alanı, bu
orana eklememiz gerekir.
 Aritmetik ortalama, eğri altındaki alanı iki eşit parçaya
böldüğünden A1 alanı ile 0.5’i topladığımızda, istediğimiz
alanı buluruz.
P(x<535) = A1 + 0.5 = 0.4192 + 0.5 = 0.9192
 Bu sonuç bize, üzerinde çalıştığımız değişkene ait verilerin
%91.92’sinin 535’in altında bir değere sahip olduğunu
belirtmektedir.
Bir kahve ithalatçısı ayda ortalama 2700 ABD $’ı kar
ediyor. Bu karın standart sapması 130 ABD $’dır.
Ayda 2600 ABD $’ının üzerinde ve altında kazanma
olasılığını bulunuz.??????
A1
0.5
2600 2700
 2600 $’dan az
kazanma
olasılığını
bulmak için A1
alanını
hesaplayalım.
2600 - 2700
z=
= -0.77
130
 z= -0.77 için normal dağılış tablo değerini bulmak
üzere, önce z’nin mutlak değeri alınır. 0.77’nin z
tablosu değeri, 0.2794’tür.
 p(2600 < x < 2700) = A1 = ztablo = 0.2794
 Bir başka deyişle, 2600 ile 2700 ABD $ arasında
kazanma olasılığı yaklaşık %28’dir.
 Şimdi bu alanı, 0.5’ten çıkaralım.
 p(x < 2600) = 0.5 – A1 = 0.5 – 0.2794 = 0.2206
 Buna göre, 2600 $’ın altında kazanma olasılığı,
%22’dir.
 2600 $’ın üzerinde kazanma olasılığını
bulabilmek için ise, A1 alanı ile 0.5’i toplamamız
gerekir.
 p(x>2600) = 0.5 + A1 = 0.5 + 0.2794 = 0.7794
 2600 $’ın üzerinde kazanma olasılığı %78’dir.
 Bir sınıftaki 60 öğrencinin boy ortalaması 173 cm,
standart sapması ise 7.5 cm olarak hesaplanmıştır.
170 ile 175 cm arasında kaç öğrenci vardır.
A2
A1
170 173 175
170 ile 175 cm
arasında boya
sahip öğrencilerin
yüzdesi, A1 ve A2
alanlarının
toplamıdır. Önce
A1 alanını
hesaplarsak;
170-173
z=
= -0.4 A1 = z tablo = 0.1554
7.5
A2
A1
170 173 175
Şimdi de A2
alanını
hesaplarsak:
175-173
z=
7.5
z= 0.27=0.1026
A2 = z tablo = 0.1064, p(170 < x < 175) = A1 + A2 =
= 0.1554 + 0.1064 = 0.2618
 170 ile 175
A2
cm arasındaki
öğrencilerin
A1
oranı
%26.18’dir.
 Bu aralıktaki
öğrenci sayısı
170 173 175
ise:
 n(170 < x < 175) = 0.2618 (60) ≈ 16 öğrenci
 İstatistik sınavına giren 120 öğrencinin not
ortalaması 100 üzerinden 75, standart sapması
20’dir.
Geçme notu
60 olduğuna
göre, kaç
öğrenci başarılı
olmuştur?
A1
60
75
Başarılı öğrenci oranı A1 ve ortalamanın sağ
tarafında 0.5’in toplamı kadardır.
60-75
z=
= -0.75, A1 = z tablo = 0.2734
20
P(x>60) = A1 +
A1
0.5 = 0.2734 +
0.5 = 0.7734
Başarılı
öğrenci oranı
%77’dir.
60
75
 n(x > 60) = 0.7734 (120) ≈ 93 öğrenci (başarılı
öğrenci sayısı)
Bir öğrencinin, en başarılı %10 arasında yer
alabilmesi için en az kaç alması gerekir?
En başarılı %10’luk dilimin en düşük notu x’tir. x’i
bulabilmek için farklı bir yol izlememiz gerekir.
A1
0.10
75
x
Bu kez alan bellidir: %10.
Daha önce z değerini hesaplayıp, z tablosundan
buna karşılık gelen alanı buluyorduk.
Şimdi 0.1 alanını bulup, bunu sağlayan ztablo
değerini tespit edeceğiz.
A1
0.10
75
x
0.1’e en yakın
alan 0.0987’dir. Bu
alana karşılık gelen
z değeri ise 0.25’tir.
0.25 = (x – 75)/20 = x = 80
 En başarılı %10 öğrenci arasında yer almak
isteyen bir öğrenci en az 80 almalıdır.
A1
0.10
75
x
OrtaAandolu’da buğday yetiştiren işletmelerin yıllık
buğday satış miktarı ortalama 2000 kg kadardır.
Satış miktarının standart sapması 250 kg dır. Söz
konusu bölgeden seçilen 49 işletmenin ortalama
buğday satışı 2100 kg bulunmuş olsun?
49 işletmelik örneğin , söz konusu populasyona
dahil olma ihtimali nedir? Başka bir ifade ile
örneğimizin populasyondan rastgele seçilmiş
olma ihtimali nedir?
• Önemli not:
(Örnek ortalamasının ortalaması, popülasyon ortalamasına eşittir.)
(Örnek ortalamasının standart hatası, popülasyon standart hatasının,
“örneğe seçilen” bölünmesiyle bulunur.
Z tablo’da 2.80 e tekabül eden alan 0.4974 olduğundan ;
0.50-0.4974=0.026=%0.26 elde edilir. Buna göre ortalamanın sağ tarafında
bizim örneğimiz kadar ve daha fazla sapma gösteren örneklerin %0.26 kadar
olduğudur. Sonuç olarak bu 49 işletmenin popülasyonu temsil ettiğini
göstermeye yeterli değildir.
Ödev:
Ege bölgesinde süt sığırcılığı yetiştiriciliği
işletmelerin yıllık yıllık süt üretim miktarı
ortalama 6000 kg kadardır. Üretim miktarının
miktarının standart sapması 800 kg dır. Söz
konusu bölgeden seçilen 50 işletmenin ortalama
süt üretimi 6187 kg bulunmuş olsun?
50 işletmelik örneğin , söz konusu populasyona
dahil olma ihtimali nedir? Başka bir ifade ile
örneğimizin populasyondan rastgele seçilmiş
olma ihtimali nedir?
Download