İSTATİSTİKSEL KALİTE KONTROLDE SIK KULLANILAN KESİKLİ

advertisement
1
İSTATİSTİKSEL KALİTE KONTROLDE SIK KULLANILAN KESİKLİ
VE SÜREKLİ OLASILIK DAĞILIMLARI
Kesikli ve Sürekli Rassal Değişkenler
Rassal bir değişkenin içinde bulunduğu örnek uzayı veya başka bir deyişle değişim aralığı
süreksiz ise, yani sonlu sayıda ya da sayılabilir sonsuz sayıda eleman içeriyorsa buna süreksiz
(kesikli ) rassal değişken adı verilir. Diğer taraftan bir değişken sayılamayacak sayıda
sınırsız değerler alırsa bu değişkene sürekli (kesiksiz) rassal değişken adı verilir.
3.5.1. Süreksiz (Kesikli ) Olasılık Dağılımları
X ile gösterilen
kesikli rassal bir değişkenin aldığı değerler
x 1 , x 2 , x 3 ............. ise
değişkenin bu değerlerden sadece birini alması olasılığı f(x) = P (X=x) şeklinde yazılabilir ve
X in Olasılık Yoğunluk Fonksiyonu veya sadece Yoğunluk Fonksiyonu olarak adlandırılır.
Bir dağılım ya da fonksiyonda aşağıdaki iki şart sağlanıyorsa bu
fonksiyonlara olasılık fonksiyonları adı verilir.
1- f (x) ≥ 0
Olasılık yoğunluk fonksiyonunun alacağı değerler 0 ile 1 arasında değişir.
2- Σ f ( x ) = 1
x
Bir olasılık yoğunluk fonksiyonunun tanım aralığındaki değerlerinin toplamı
1 olmalıdır.
X rassal değişkenin Olasılık Dağılım Fonksiyonu veya diğer bir deyişle Kümülatif
(yığılımlı, birikimli) Yoğunluk Fonksiyonu aşağıdaki şekilde tarif edilir.
F( x ) = ∑ f ( t ) burada - ∞ ≤ x ≤ ∞ aralığında değişiyor.
t≤x
2
Buradaki F(x) fonksiyonuna Kümülatif Dağılım Fonksiyonu denir.
Yukarıdaki eşitliğin sağ tarafına bakılırsa bu dağılım x’e eşit veya x ten küçük t değerlerinin
olasılıklarının toplamının kümülatif (birikimli) dağılımını verdiği görülür. Yani kümülatif
dağılım fonksiyonu x tesadüfi değişkenin belli bir değere eşit veya daha küçük olması
olasılığını gösteren bir fonksiyondur.
3.5.1.1. Binom Dağılımı
Olasılık dağılımları içersinde en yaygın olarak kullanılanıdır. Deneylerin tekrarlana bildiği
durumlarda kullanılır. Bir olay n deneyde X defa vuku buluyorsa bu olayın olasılığı Binom
dağılımı yardımı ile bulunur.
Örnek :
- Bir parti malın tesliminde örnek olarak seçilen 50 mamulden ikisinin bozuk
olması olasılığı
- 10 defa atılan bir para atışında üç yazı gelmesi (7 tura ) olasılığı
- 50 test sorusundan 30 nun doğru cevaplandırılması olasılığı
- Kansere yakalanan 30 hastadan 20 sinin kurtulması olasılığı vb.
Bu gibi durumlarda aranan şey n sayıdaki mümkün halden x sayıdaki uygun halin olasılığıdır.
Dolayısıyla binom dağılımında birbirini karşılıklı olarak engelleyen 2 olayda sadece birinin
(bozuk veya sağlam, doğru veya yanlış, kabul veya ret, kusurlu veya kusursuz gibi ) olasılığı
söz konusudur.
Binom dağılımı şu varsayımlara dayanmaktadır.
1- Her deney birbirlerinin karşılıklı önleyen iki mümkün halden sadece birinde vuku bulur.
Mümkün hallerden biri elverişli hal (x) diğeri elverişsiz hal (n-x) olarak ifade edilir.
2- Bir uygun halin olasılığı (p) her deneyde aynıdır. Uygun olmayan halin olasılığı
(q=1-p) içinde aynı durum söz konusudur.(seçim iadeli)
3- Deneyler bağımsızdır. Yani bir deneyde ister uygun ister uygun olmayan hal meydana
gelsin bu durum diğer deneydeki uygun bir halin olasılığına etki etmez.
3
Binom dağılımının formülü şöyle ifade edilebilir. n Bağımsız deneyden x sayıda uygun halin
gelmesi olasılığı;
n
P( X = x ) = f ( x ) = b( x ; n ; p ) =   p x (1 − p ) n −x burada x = 0,1,2,3,....n
 x
Problem: Bir acemi işçinin kusurlu mamul üretme olasılığı %10 dur. Bu işçinin ürettiği
mamullerden rasgele10 tanesi seçildiğinde (kütle sonsuz)
a) Mamullerin en az 2’sinin kusurlu olma olasılığı
b) En çok 3 ünü kusurlu olma olasılığı
c) En az birinin kusurlu olma olasılığını bulunuz.
Çözüm:
a ) P(X ≥ 2) = P(x = 2) + P(x = 3) + ...... + P(x = 10) =1 - [P(x = 0) + P(x = 1)]
10 

10 
P(X ≥ 2) = 1 -   ⋅ 0,10 ⋅ 0,910 +   ⋅ 0,11 ⋅ 0,9 9 
1 
 0 

b) P(X ≤ 3) = P(x = 0) + P(x = 1) + P(x = 2) + P(x = 3)
10 
10 
10 
10 
=  0,10 ⋅ 0,910 +  0,11 ⋅ 0,9 9 +  0,12 ⋅ 0,98 +  0,13 ⋅ 0,9 7
0 
1 
2 
3 
10 
c) P( X ≤ 9) = 1 − P( x = 0) = 1 −  0,10 ⋅ 0,910
0 
n veya p’nin her farklı değeri farklı bir dağılım gösterdiğinden, binom dağılımı gerçekte bir
dağılımlar gurubu teşkil eder. p=0,5 olduğu zaman dağılım simetrik bir şekil alır. p’nin aldığı
değere göre dağılım şekil alır. p<0,5 olursa dağılım sağa çarpık, p>0,5 olduğunda ise çarpıklık
sola doğru olmaktadır.
3.5.1.2. Hipergeometrik Dağılım
Binom dağılım genellikle yerine koymak suretiyle yapılan deneylere ya da sınırsız bir
kütleden yapılan deneylere uygulanan bir dağılımdır. Örnek, kütleden yerine koymadan
(iadesiz çekim) çekildiği takdirde artık bağımsız olay söz konusu olmadığından binom
dağılım uygulanamaz. Bu gibi durumlarda Hipergeometrik dağılım uygulanır.
4
İçerisinde a sayıda uygun, b sayıda uygun olmayan eleman bulunan sınırlı bir kütleden n
sayıda örnek iadesiz olarak çekildiğinde, örnekteki elemanların x tanesinin uygun, n-x
tanesinin uygun olmayan elemanlardan oluşma olasılığı hipergeometrik dağılımla aşağıdaki
fonksiyonla belirlenir.
 a  b 
 

x  n − x 

f ( x; n; a; b) =
a + b


 n 
x = 0,1,2,......, n olur.
Dağılımın a, b ve n gibi üç parametresi vardır.
Problem: 20’si sağlam 10’u bozuk toplam 30 parçadan 10 birimlik örnek çekildiğinde 4’ünün
sağlam olma olasılığı nedir?
Çözüm:
x:4
a:20
b:10
n:10
n-x=6
 a  b 
 

n  n − x 

f ( x; n; a; b) =
= f (4,10,20,10) =
a + b


 n 
 20 10 
  
 4  6  = 1017450 = 0,03386
30045015
 30 
 
10 
3.5.1.3. Poisson Dağılımı
p → 0 , n → ∞ ve n.p = Sabit olduğu zaman Binom dağılımı, Poisson dağılımına yaklaşır.
Bir olayın meydana gelme olasılığı (p) sıfıra, dolayısıyla q=1-p, 1’e yaklaşırsa (terside
mümkün ) ve n çok büyük olursa böyle olaylara nadir meydana gelen olaylar denir (n çok
büyüdüğünde kombinasyon hesabı zor yapılır). Pratik olarak eğer bir olaydaki deney sayısı en
az 50 n ≥ 50 ve n.p < 5 olursa böyle olaylar nadir meydana gelen olaylar olarak düşünülebilir.
Böyle durumlarda Binom dağılımı Poisson dağılımına yaklaşır.
Poisson dağılımı şöyle ifade edilir.
f(x; λ ) =
e −λ λx
x!
burada x = 0,1,2,........
Dağılımın bağlı olduğu tek parametre λ olup dağılımın ortalamasıdır ve λ=np ye eşittir.
5
Problem: Bir fabrikada imal edilen malların 0,03’ü bozuktur. Muayene için 25 birimlik bir
örnek çekildiğinde;
a) 4 bozuk mal çıkması
b) 3 veya daha fazla bozuk mal çıkması,
c) En fazla 2 bozuk mal çıkması olasılığı nedir?
Çözüm:
λ = 25.0,03 = 0,75
a) λ = n. p
f(x; λ ) =
λx e −λ
b) λ = 0,75
x!
⇒ f(4 : 0,75) =
x =4
0,75 4 e −0, 75 0,316.0,472
=
= 0,006
4!
4.3.2.1
x≥3
0,75 0.e −0, 75 0,751.e −0, 75 0,75 2.e −0, 75
−
−
0!
1!
2!
= 1 - 0,472 - 0,75.0,472 - 0,28.0,472
f(x ≥ 3;0,75) = 1 -
= 1 - 0,472 - 0,3540 - 0,1321
= 1 - 0,9601 = 0,04
0,75 0.e −0, 75 0,751.e −0, 75 0,75 2.e −0, 75
+
+
0!
1!
2!
= 0,9601 olur.
c) f(x ≤ 2) =
3.5.2. Sürekli Olasılık Dağılımları
Daha önce bir değişkenin sayılamayacak sayıda sınırsız değerler alabiliyorsa bu değişkene
‘Sürekli rassal değişken ’adı verildiğini görmüştük. Bu kısımda sürekli rassal değişkenin
olasılık dağılımları üzerinde durulacaktır.
Sürekli rassal bir değişkenin tanım aralığındaki herhangi bir değeri tam olarak alması
imkansızdır. Çünkü gerek sayılar ekseninin her aralığında sonsuz sayı (nokta) mevcuttur.
Sonsuz noktadan birinin çekilmesi olasılığı 1/ ∞ → 0 dır. O halde sürekli rassal bir değişkenin
her hangi bir değeri tam olarak alma olasılığı sıfır olup, her hangi bir olasılığından
bahsedebilmek için belli bir aralığın olasılığının araştırılması gerekir.
X sürekli tesadüfi değişkenin dağılım fonksiyonu F(x) (kümülatif dağılım fonksiyonu) olsun.
Bunun türevi olan F’(x)=f(x) ‘e olasılık fonksiyonu ( olasılık yoğunluk fonksiyonu )
denilebilmesi için şu iki şartın birlikte sağlaması gerekir.
6
∞
1) f (x) ≥ 0
2)
∫ f (x ) dx = 1 olmalıdır.
−∞
Bu fonksiyondan hareketle, X değişkeninin a ve b aralığında bulunma olasılığı şöyle tarif
edilir.
b
F(b)-F(a) = P (a<X<b) = ∫ f ( x )dx
a
3.5.2.1. Düzgün (Üniform) Dağılım
Bu dağılımın olasılık yoğunluk fonksiyonu şöyledir.
 1

f ( x) =  β − α
0

α <x<β
x<0
Burada α ve β dağılımın parametreleri olup gerçek sabitlerdir. (β>α)
Bu dağılımın dağılım fonksiyonu şöyle yazılır.
x <α
0

 x −α
F ( x ) = P( X < x ) = 
β −α
1
α≤x<β
x≥β
Problem: X tesadüfi değişkeni -2 ≤ x ≤ 2 aralığında uniform olarak dağılmıştır.
1
b)P( x − 1 ≥ ) yi hesaplayınız .
2
a) P(x<1)
Çözüm:
1
a) P(x < 1) =
1
1
∫ 4 dx = 4 x
−2
1
−2
=
1 2 3
+ =
4 4 4
1
b)P( x − 1 ≥ ) = P(−2 < x < 0,5) + P(1,5 < x < 2) = 1 − P(0,5 < x < 1,5)
2
1, 5
1
1
1 3
1, 5
1,5 − 0,5 
= 1 − ∫ dx =1 − ( x ) 0,5 = 1 − 
= 1− =

4
4
4 4
 4 
0,5
7
3.5.2.2. Üstel Dağılım
Bu dağılımın olasılık yoğunluk fonksiyonu şöyledir.
 1 −( µx )
 e
f ( x) =  µ
0

x > 0 için
diğiğerhaller
Burada µ >0 olup, dağılımın ortalaması ve tek parametresidir.
Üstel dağılımın olasılık yoğunluk fonksiyonunun grafiği aşağıdaki gibidir.
Üstel dağılımın dağılım fonksiyonu
x
−

1 − e µ
F( x ) = 
0
x>0
aksi durum
Olup bunun şekli aşağıda görülmektedir.
8
Problem: Bir işletmenin üretilmiş olduğu elektronik cihazların arızasız çalışma
sürelerinin (saat cinsinden ) üstel dağılıma uyduğu görülmüştür ve µ =24 saat olarak
bulunmuştur. Buna göre;
a )Bir cihazın en az 12 saat arızasız çalışması
b) En fazla 36 saat arızasız çalışması olasılığını bulunuz?
c) Cihazın 30 saatten fazla çalışma olasılığı en az %80 olması için µ
en az ne
olmalıdır.
Çözüm:
x
1 24
f (x) =
e
x>0
24
f(x) = 0 diğer haller
−∞
x
x
−
1 −
a ) P( x ≥ 12) = ∫ e 24 dx = − e 24
24
12
36
∞
12
= −e
x
x
−
1 −
b) P(0 < x < 36) = ∫ e 24 dx = − e 24
24
0
∞
c) ∫
30
1
µ
x
−( )
e
µ
dx =
1
µ
−
-e
−
.( − µ ).e
−
x
−( )
36
0
12
24
= e −0,5 = 0,6065
= 1 − e −1,5 = 1 − 0,2231 = 0,7769
∞
µ
= 0,8 ⇒ - e
x
−( )
µ
∞
30
= 0,8
30
∞
µ
+e
−
30
µ
= 0,8 ⇒ e
−
30
µ
= 0,8
30
= ln 0,8 µ ≥ 134 saat olmalıdır.
µ
3.5.2.3. Normal Dağılım
İstatistikte en yaygın kullanılan dağılımdır. Bazı eserlerde Gauss dağılımı, çan eğrisi, normal
eğri vb. gibi isimlerle adlandırılmaktadır.
Normal yoğunluk fonksiyonu şöyledir:
f (x) =
1
2 πσ
e - ( x -µ )
2
2σ 2
-∞ < x < ∞
9
Burada π = 3,14159 ve e = 2,71828 dir. Bu dağılım µ (ortalama) ve σ (standart sapma)
parametrelerine dayanmaktadır. Dolayısıyla normal bir dağılım N(µ, σ 2 ) sembolü ile
gösterilir.
Normal dağılım aritmetik ortalama etrafında simetrik bir dağılım olup, ortalama etrafındaki
bazı alanlar aşağıdaki şekilde gösterilmiştir.
Normal Dağılım , µ ve σ parametreleri ile tespit edilmektedir. Fakat her µ ve σ değeri için
farklı bir normal dağılım elde edilmektedir. µ farklı değerler alındığında şekilde görüldüğü
gibi dağılım x ekseni üzerinde kaymaktadır. σ ’nın farklı değerler alması ise dağılımın
10
sivriliğine
veya
basıklığına
tesir
etmektedir
bu
durum
şekilde
gösterilmiştir.
Standart Normal Dağılım
Daha önce belirtildiği gibi µ ve σ nın her farklı değeri için farklı bir normal dağılım vardır.
değerlerine dayanan sonsuz sayıda normal dağılım elde etmek
Dolayısıyla µ ve σ
mümkündür. Bu durumu önleyebilmek ve sadece bir tana normal dağılım elde edebilmek için
normal değişken standart hale çevrilir. Böylece farklı ortalama ve varyansa sahip bütün
normal dağılışlar aynı ortalama (0) ve varyansa (1) sahip dağılışlar haline dönüşürler. Böylece
standart normal değişkene ait dağılıma standart normal dağılım adı verilir.
Standart değişkene dönüştürme işlemi şöyle yapılır
Z=
X −X
σ
Bu Z değişkeninin dağılımının aritmetik ortalaması 0 ve varyansı 1 dir. Standart Normal
Dağılımın yoğunluk fonksiyonu normal yoğunluk fonksiyonundaki µ yerine 0 ve σ yerine
1 koymak suretiyle;
f (z) =
1
2π
e
−
z2
2
− ∞ < z < ∞ elde edilir.
Standart normal dağılımın alanları için olasılık değerlerini veren tablolar hazırlanmıştır. Bu
tablolardan faydalanarak alanlara ait olasılıkları kolaylıkla hesaplamak mümkün olmaktadır.
11
Problem: Bir fabrikada üretilen cıvataların çapları 2cm. Ortalama ve 0,1 cm. standart sapma
ile normal dağılıma uymaktadır. Bu cıvataların çapı 1,8 ile 2,15cm. dışına düşerse bozuk
sayılmaktadır. Bu verilere göre üretimin kusurlu oranını bulunuz.
Çözüm: P(X<1,8 ; X>2,15)=?
−
Z1 =
X1 − X
σ
1,8 − 2
=
⇒ Z 1 = −2
0,1
_
Z2 =
X2 − X
σ
=
2,15 − 2
⇒ Z 2 = 1,5
0,1
P(Z 1 <-2 veya Z 2 >1,5) =?
1, 5
1,5

0

1 −  ∫ f ( z )d z  = 1 −  ∫ f ( z )d z + ∫ f ( z )d z  = 1 − [0,4772 + 0,4332] = 0,0896
0
−2

−2

Problem: Bir final sınavında notların dağılımı µ = 60 ve σ = 10 olan normal dağılıma
uymaktadır. Sınava giren öğrenciler 300 kişi olduğuna göre bunun 250’sinin geçmesi
istenmektedir. Geçmek için gerekli en düşük not nedir?
Çözüm:
Geçmesi istenen öğrencilerin oranı,
250
= 0,833
300
1 − 0,833 = 0,167 Kalması gereken öğrencilerin oranıdır.
Z1
0
-∞
z1
∫ f ( z )dz = 0,167 ⇒ ∫ f ( z )dz ise Z
z1=
x−µ
σ
1
= −0,965 olur.
⇒ x = µ + z1 ⋅ σ ⇒ x = 60 − 0.965 ⋅ 10 ⇒ x = 50,35 bulunur.
12
Z
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0
0
0,003989
0,007978
0,011966
0,015953
0,019939
0,023922
0,027903
0,031881
0,035856
0,1
0,039828
0,043795
0,047758
0,051717
0,05567
0,059618
0,063559
0,067495
0,071424
0,075345
0,2
0,07926
0,083166
0,087064
0,090954
0,094835
0,098706
0,102568
0,10642
0,110261
0,114092
0,3
0,117911
0,12172
0,125516
0,1293
0,133072
0,136831
0,140576
0,144309
0,148027
0,151732
0,4
0,155422
0,159097
0,162757
0,166402
0,170031
0,173645
0,177242
0,180822
0,184386
0,187933
0,5
0,191462
0,194974
0,198468
0,201944
0,205401
0,20884
0,21226
0,215661
0,219043
0,222405
0,6
0,7
0,225747
0,258036
0,229069
0,261148
0,232371
0,264238
0,235653
0,267305
0,238914
0,27035
0,242154
0,273373
0,245373
0,276373
0,248571
0,27935
0,251748
0,282305
0,254903
0,285236
0,8
0,288145
0,29103
0,293892
0,296731
0,299546
0,302337
0,305105
0,30785
0,31057
0,313267
0,9
0,31594
0,318589
0,321214
0,323814
0,326391
0,328944
0,331472
0,333977
0,336457
0,338913
1
0,341345
0,343752
0,346136
0,348495
0,35083
0,353141
0,355428
0,35769
0,359929
0,362143
1,1
0,364334
0,3665
0,368643
0,370762
0,372857
0,374928
0,376976
0,379
0,381
0,382977
1,2
0,38493
0,386861
0,388768
0,390651
0,392512
0,39435
0,396165
0,397958
0,399727
0,401475
1,3
0,4032
0,404902
0,406582
0,408241
0,409877
0,411492
0,413085
0,414657
0,416207
0,417736
1,4
0,419243
0,42073
0,422196
0,423641
0,425066
0,426471
0,427855
0,429219
0,430563
0,431888
1,5
0,433193
0,434478
0,435745
0,436992
0,43822
0,439429
0,44062
0,441792
0,442947
0,444083
Z
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
1,6
0,445201
0,446301
0,447384
0,448449
0,449497
0,450529
0,451543
0,45254
0,453521
0,454486
1,7
0,455435
0,456367
0,457284
0,458185
0,45907
0,459941
0,460796
0,461636
0,462462
0,463273
1,8
0,46407
0,464852
0,46562
0,466375
0,467116
0,467843
0,468557
0,469258
0,469946
0,470621
1,9
0,471283
0,471933
0,472571
0,473197
0,47381
0,474412
0,475002
0,475581
0,476148
0,476705
2
0,47725
0,477784
0,478308
0,478822
0,479325
0,479818
0,480301
0,480774
0,481237
0,481691
2,1
0,482136
0,482571
0,482997
0,483414
0,483823
0,484222
0,484614
0,484997
0,485371
0,485738
2,2
0,486097
0,486447
0,486791
0,487126
0,487455
0,487776
0,488089
0,488396
0,488696
0,488989
2,3
0,489276
0,489556
0,48983
0,490097
0,490358
0,490613
0,490863
0,491106
0,491344
0,491576
2,4
0,491802
0,492024
0,49224
0,492451
0,492656
0,492857
0,493053
0,493244
0,493431
0,493613
2,5
0,49379
0,493963
0,494132
0,494297
0,494457
0,494614
0,494766
0,494915
0,49506
0,495201
2,6
0,495339
0,495473
0,495604
0,495731
0,495855
0,495975
0,496093
0,496207
0,496319
0,496427
2,7
0,496533
0,496636
0,496736
0,496833
0,496928
0,49702
0,49711
0,497197
0,497282
0,497365
2,8
0,497445
0,497523
0,497599
0,497673
0,497744
0,497814
0,497882
0,497948
0,498012
0,498074
2,9
0,498134
0,498193
0,49825
0,498305
0,498359
0,498411
0,498462
0,498511
0,498559
0,498605
3
0,49865
0,498694
0,498736
0,498777
0,498817
0,498856
0,498893
0,49893
0,498965
0,498999
Download