1 İSTATİSTİKSEL KALİTE KONTROLDE SIK KULLANILAN KESİKLİ VE SÜREKLİ OLASILIK DAĞILIMLARI Kesikli ve Sürekli Rassal Değişkenler Rassal bir değişkenin içinde bulunduğu örnek uzayı veya başka bir deyişle değişim aralığı süreksiz ise, yani sonlu sayıda ya da sayılabilir sonsuz sayıda eleman içeriyorsa buna süreksiz (kesikli ) rassal değişken adı verilir. Diğer taraftan bir değişken sayılamayacak sayıda sınırsız değerler alırsa bu değişkene sürekli (kesiksiz) rassal değişken adı verilir. 3.5.1. Süreksiz (Kesikli ) Olasılık Dağılımları X ile gösterilen kesikli rassal bir değişkenin aldığı değerler x 1 , x 2 , x 3 ............. ise değişkenin bu değerlerden sadece birini alması olasılığı f(x) = P (X=x) şeklinde yazılabilir ve X in Olasılık Yoğunluk Fonksiyonu veya sadece Yoğunluk Fonksiyonu olarak adlandırılır. Bir dağılım ya da fonksiyonda aşağıdaki iki şart sağlanıyorsa bu fonksiyonlara olasılık fonksiyonları adı verilir. 1- f (x) ≥ 0 Olasılık yoğunluk fonksiyonunun alacağı değerler 0 ile 1 arasında değişir. 2- Σ f ( x ) = 1 x Bir olasılık yoğunluk fonksiyonunun tanım aralığındaki değerlerinin toplamı 1 olmalıdır. X rassal değişkenin Olasılık Dağılım Fonksiyonu veya diğer bir deyişle Kümülatif (yığılımlı, birikimli) Yoğunluk Fonksiyonu aşağıdaki şekilde tarif edilir. F( x ) = ∑ f ( t ) burada - ∞ ≤ x ≤ ∞ aralığında değişiyor. t≤x 2 Buradaki F(x) fonksiyonuna Kümülatif Dağılım Fonksiyonu denir. Yukarıdaki eşitliğin sağ tarafına bakılırsa bu dağılım x’e eşit veya x ten küçük t değerlerinin olasılıklarının toplamının kümülatif (birikimli) dağılımını verdiği görülür. Yani kümülatif dağılım fonksiyonu x tesadüfi değişkenin belli bir değere eşit veya daha küçük olması olasılığını gösteren bir fonksiyondur. 3.5.1.1. Binom Dağılımı Olasılık dağılımları içersinde en yaygın olarak kullanılanıdır. Deneylerin tekrarlana bildiği durumlarda kullanılır. Bir olay n deneyde X defa vuku buluyorsa bu olayın olasılığı Binom dağılımı yardımı ile bulunur. Örnek : - Bir parti malın tesliminde örnek olarak seçilen 50 mamulden ikisinin bozuk olması olasılığı - 10 defa atılan bir para atışında üç yazı gelmesi (7 tura ) olasılığı - 50 test sorusundan 30 nun doğru cevaplandırılması olasılığı - Kansere yakalanan 30 hastadan 20 sinin kurtulması olasılığı vb. Bu gibi durumlarda aranan şey n sayıdaki mümkün halden x sayıdaki uygun halin olasılığıdır. Dolayısıyla binom dağılımında birbirini karşılıklı olarak engelleyen 2 olayda sadece birinin (bozuk veya sağlam, doğru veya yanlış, kabul veya ret, kusurlu veya kusursuz gibi ) olasılığı söz konusudur. Binom dağılımı şu varsayımlara dayanmaktadır. 1- Her deney birbirlerinin karşılıklı önleyen iki mümkün halden sadece birinde vuku bulur. Mümkün hallerden biri elverişli hal (x) diğeri elverişsiz hal (n-x) olarak ifade edilir. 2- Bir uygun halin olasılığı (p) her deneyde aynıdır. Uygun olmayan halin olasılığı (q=1-p) içinde aynı durum söz konusudur.(seçim iadeli) 3- Deneyler bağımsızdır. Yani bir deneyde ister uygun ister uygun olmayan hal meydana gelsin bu durum diğer deneydeki uygun bir halin olasılığına etki etmez. 3 Binom dağılımının formülü şöyle ifade edilebilir. n Bağımsız deneyden x sayıda uygun halin gelmesi olasılığı; n P( X = x ) = f ( x ) = b( x ; n ; p ) = p x (1 − p ) n −x burada x = 0,1,2,3,....n x Problem: Bir acemi işçinin kusurlu mamul üretme olasılığı %10 dur. Bu işçinin ürettiği mamullerden rasgele10 tanesi seçildiğinde (kütle sonsuz) a) Mamullerin en az 2’sinin kusurlu olma olasılığı b) En çok 3 ünü kusurlu olma olasılığı c) En az birinin kusurlu olma olasılığını bulunuz. Çözüm: a ) P(X ≥ 2) = P(x = 2) + P(x = 3) + ...... + P(x = 10) =1 - [P(x = 0) + P(x = 1)] 10 10 P(X ≥ 2) = 1 - ⋅ 0,10 ⋅ 0,910 + ⋅ 0,11 ⋅ 0,9 9 1 0 b) P(X ≤ 3) = P(x = 0) + P(x = 1) + P(x = 2) + P(x = 3) 10 10 10 10 = 0,10 ⋅ 0,910 + 0,11 ⋅ 0,9 9 + 0,12 ⋅ 0,98 + 0,13 ⋅ 0,9 7 0 1 2 3 10 c) P( X ≤ 9) = 1 − P( x = 0) = 1 − 0,10 ⋅ 0,910 0 n veya p’nin her farklı değeri farklı bir dağılım gösterdiğinden, binom dağılımı gerçekte bir dağılımlar gurubu teşkil eder. p=0,5 olduğu zaman dağılım simetrik bir şekil alır. p’nin aldığı değere göre dağılım şekil alır. p<0,5 olursa dağılım sağa çarpık, p>0,5 olduğunda ise çarpıklık sola doğru olmaktadır. 3.5.1.2. Hipergeometrik Dağılım Binom dağılım genellikle yerine koymak suretiyle yapılan deneylere ya da sınırsız bir kütleden yapılan deneylere uygulanan bir dağılımdır. Örnek, kütleden yerine koymadan (iadesiz çekim) çekildiği takdirde artık bağımsız olay söz konusu olmadığından binom dağılım uygulanamaz. Bu gibi durumlarda Hipergeometrik dağılım uygulanır. 4 İçerisinde a sayıda uygun, b sayıda uygun olmayan eleman bulunan sınırlı bir kütleden n sayıda örnek iadesiz olarak çekildiğinde, örnekteki elemanların x tanesinin uygun, n-x tanesinin uygun olmayan elemanlardan oluşma olasılığı hipergeometrik dağılımla aşağıdaki fonksiyonla belirlenir. a b x n − x f ( x; n; a; b) = a + b n x = 0,1,2,......, n olur. Dağılımın a, b ve n gibi üç parametresi vardır. Problem: 20’si sağlam 10’u bozuk toplam 30 parçadan 10 birimlik örnek çekildiğinde 4’ünün sağlam olma olasılığı nedir? Çözüm: x:4 a:20 b:10 n:10 n-x=6 a b n n − x f ( x; n; a; b) = = f (4,10,20,10) = a + b n 20 10 4 6 = 1017450 = 0,03386 30045015 30 10 3.5.1.3. Poisson Dağılımı p → 0 , n → ∞ ve n.p = Sabit olduğu zaman Binom dağılımı, Poisson dağılımına yaklaşır. Bir olayın meydana gelme olasılığı (p) sıfıra, dolayısıyla q=1-p, 1’e yaklaşırsa (terside mümkün ) ve n çok büyük olursa böyle olaylara nadir meydana gelen olaylar denir (n çok büyüdüğünde kombinasyon hesabı zor yapılır). Pratik olarak eğer bir olaydaki deney sayısı en az 50 n ≥ 50 ve n.p < 5 olursa böyle olaylar nadir meydana gelen olaylar olarak düşünülebilir. Böyle durumlarda Binom dağılımı Poisson dağılımına yaklaşır. Poisson dağılımı şöyle ifade edilir. f(x; λ ) = e −λ λx x! burada x = 0,1,2,........ Dağılımın bağlı olduğu tek parametre λ olup dağılımın ortalamasıdır ve λ=np ye eşittir. 5 Problem: Bir fabrikada imal edilen malların 0,03’ü bozuktur. Muayene için 25 birimlik bir örnek çekildiğinde; a) 4 bozuk mal çıkması b) 3 veya daha fazla bozuk mal çıkması, c) En fazla 2 bozuk mal çıkması olasılığı nedir? Çözüm: λ = 25.0,03 = 0,75 a) λ = n. p f(x; λ ) = λx e −λ b) λ = 0,75 x! ⇒ f(4 : 0,75) = x =4 0,75 4 e −0, 75 0,316.0,472 = = 0,006 4! 4.3.2.1 x≥3 0,75 0.e −0, 75 0,751.e −0, 75 0,75 2.e −0, 75 − − 0! 1! 2! = 1 - 0,472 - 0,75.0,472 - 0,28.0,472 f(x ≥ 3;0,75) = 1 - = 1 - 0,472 - 0,3540 - 0,1321 = 1 - 0,9601 = 0,04 0,75 0.e −0, 75 0,751.e −0, 75 0,75 2.e −0, 75 + + 0! 1! 2! = 0,9601 olur. c) f(x ≤ 2) = 3.5.2. Sürekli Olasılık Dağılımları Daha önce bir değişkenin sayılamayacak sayıda sınırsız değerler alabiliyorsa bu değişkene ‘Sürekli rassal değişken ’adı verildiğini görmüştük. Bu kısımda sürekli rassal değişkenin olasılık dağılımları üzerinde durulacaktır. Sürekli rassal bir değişkenin tanım aralığındaki herhangi bir değeri tam olarak alması imkansızdır. Çünkü gerek sayılar ekseninin her aralığında sonsuz sayı (nokta) mevcuttur. Sonsuz noktadan birinin çekilmesi olasılığı 1/ ∞ → 0 dır. O halde sürekli rassal bir değişkenin her hangi bir değeri tam olarak alma olasılığı sıfır olup, her hangi bir olasılığından bahsedebilmek için belli bir aralığın olasılığının araştırılması gerekir. X sürekli tesadüfi değişkenin dağılım fonksiyonu F(x) (kümülatif dağılım fonksiyonu) olsun. Bunun türevi olan F’(x)=f(x) ‘e olasılık fonksiyonu ( olasılık yoğunluk fonksiyonu ) denilebilmesi için şu iki şartın birlikte sağlaması gerekir. 6 ∞ 1) f (x) ≥ 0 2) ∫ f (x ) dx = 1 olmalıdır. −∞ Bu fonksiyondan hareketle, X değişkeninin a ve b aralığında bulunma olasılığı şöyle tarif edilir. b F(b)-F(a) = P (a<X<b) = ∫ f ( x )dx a 3.5.2.1. Düzgün (Üniform) Dağılım Bu dağılımın olasılık yoğunluk fonksiyonu şöyledir. 1 f ( x) = β − α 0 α <x<β x<0 Burada α ve β dağılımın parametreleri olup gerçek sabitlerdir. (β>α) Bu dağılımın dağılım fonksiyonu şöyle yazılır. x <α 0 x −α F ( x ) = P( X < x ) = β −α 1 α≤x<β x≥β Problem: X tesadüfi değişkeni -2 ≤ x ≤ 2 aralığında uniform olarak dağılmıştır. 1 b)P( x − 1 ≥ ) yi hesaplayınız . 2 a) P(x<1) Çözüm: 1 a) P(x < 1) = 1 1 ∫ 4 dx = 4 x −2 1 −2 = 1 2 3 + = 4 4 4 1 b)P( x − 1 ≥ ) = P(−2 < x < 0,5) + P(1,5 < x < 2) = 1 − P(0,5 < x < 1,5) 2 1, 5 1 1 1 3 1, 5 1,5 − 0,5 = 1 − ∫ dx =1 − ( x ) 0,5 = 1 − = 1− = 4 4 4 4 4 0,5 7 3.5.2.2. Üstel Dağılım Bu dağılımın olasılık yoğunluk fonksiyonu şöyledir. 1 −( µx ) e f ( x) = µ 0 x > 0 için diğiğerhaller Burada µ >0 olup, dağılımın ortalaması ve tek parametresidir. Üstel dağılımın olasılık yoğunluk fonksiyonunun grafiği aşağıdaki gibidir. Üstel dağılımın dağılım fonksiyonu x − 1 − e µ F( x ) = 0 x>0 aksi durum Olup bunun şekli aşağıda görülmektedir. 8 Problem: Bir işletmenin üretilmiş olduğu elektronik cihazların arızasız çalışma sürelerinin (saat cinsinden ) üstel dağılıma uyduğu görülmüştür ve µ =24 saat olarak bulunmuştur. Buna göre; a )Bir cihazın en az 12 saat arızasız çalışması b) En fazla 36 saat arızasız çalışması olasılığını bulunuz? c) Cihazın 30 saatten fazla çalışma olasılığı en az %80 olması için µ en az ne olmalıdır. Çözüm: x 1 24 f (x) = e x>0 24 f(x) = 0 diğer haller −∞ x x − 1 − a ) P( x ≥ 12) = ∫ e 24 dx = − e 24 24 12 36 ∞ 12 = −e x x − 1 − b) P(0 < x < 36) = ∫ e 24 dx = − e 24 24 0 ∞ c) ∫ 30 1 µ x −( ) e µ dx = 1 µ − -e − .( − µ ).e − x −( ) 36 0 12 24 = e −0,5 = 0,6065 = 1 − e −1,5 = 1 − 0,2231 = 0,7769 ∞ µ = 0,8 ⇒ - e x −( ) µ ∞ 30 = 0,8 30 ∞ µ +e − 30 µ = 0,8 ⇒ e − 30 µ = 0,8 30 = ln 0,8 µ ≥ 134 saat olmalıdır. µ 3.5.2.3. Normal Dağılım İstatistikte en yaygın kullanılan dağılımdır. Bazı eserlerde Gauss dağılımı, çan eğrisi, normal eğri vb. gibi isimlerle adlandırılmaktadır. Normal yoğunluk fonksiyonu şöyledir: f (x) = 1 2 πσ e - ( x -µ ) 2 2σ 2 -∞ < x < ∞ 9 Burada π = 3,14159 ve e = 2,71828 dir. Bu dağılım µ (ortalama) ve σ (standart sapma) parametrelerine dayanmaktadır. Dolayısıyla normal bir dağılım N(µ, σ 2 ) sembolü ile gösterilir. Normal dağılım aritmetik ortalama etrafında simetrik bir dağılım olup, ortalama etrafındaki bazı alanlar aşağıdaki şekilde gösterilmiştir. Normal Dağılım , µ ve σ parametreleri ile tespit edilmektedir. Fakat her µ ve σ değeri için farklı bir normal dağılım elde edilmektedir. µ farklı değerler alındığında şekilde görüldüğü gibi dağılım x ekseni üzerinde kaymaktadır. σ ’nın farklı değerler alması ise dağılımın 10 sivriliğine veya basıklığına tesir etmektedir bu durum şekilde gösterilmiştir. Standart Normal Dağılım Daha önce belirtildiği gibi µ ve σ nın her farklı değeri için farklı bir normal dağılım vardır. değerlerine dayanan sonsuz sayıda normal dağılım elde etmek Dolayısıyla µ ve σ mümkündür. Bu durumu önleyebilmek ve sadece bir tana normal dağılım elde edebilmek için normal değişken standart hale çevrilir. Böylece farklı ortalama ve varyansa sahip bütün normal dağılışlar aynı ortalama (0) ve varyansa (1) sahip dağılışlar haline dönüşürler. Böylece standart normal değişkene ait dağılıma standart normal dağılım adı verilir. Standart değişkene dönüştürme işlemi şöyle yapılır Z= X −X σ Bu Z değişkeninin dağılımının aritmetik ortalaması 0 ve varyansı 1 dir. Standart Normal Dağılımın yoğunluk fonksiyonu normal yoğunluk fonksiyonundaki µ yerine 0 ve σ yerine 1 koymak suretiyle; f (z) = 1 2π e − z2 2 − ∞ < z < ∞ elde edilir. Standart normal dağılımın alanları için olasılık değerlerini veren tablolar hazırlanmıştır. Bu tablolardan faydalanarak alanlara ait olasılıkları kolaylıkla hesaplamak mümkün olmaktadır. 11 Problem: Bir fabrikada üretilen cıvataların çapları 2cm. Ortalama ve 0,1 cm. standart sapma ile normal dağılıma uymaktadır. Bu cıvataların çapı 1,8 ile 2,15cm. dışına düşerse bozuk sayılmaktadır. Bu verilere göre üretimin kusurlu oranını bulunuz. Çözüm: P(X<1,8 ; X>2,15)=? − Z1 = X1 − X σ 1,8 − 2 = ⇒ Z 1 = −2 0,1 _ Z2 = X2 − X σ = 2,15 − 2 ⇒ Z 2 = 1,5 0,1 P(Z 1 <-2 veya Z 2 >1,5) =? 1, 5 1,5 0 1 − ∫ f ( z )d z = 1 − ∫ f ( z )d z + ∫ f ( z )d z = 1 − [0,4772 + 0,4332] = 0,0896 0 −2 −2 Problem: Bir final sınavında notların dağılımı µ = 60 ve σ = 10 olan normal dağılıma uymaktadır. Sınava giren öğrenciler 300 kişi olduğuna göre bunun 250’sinin geçmesi istenmektedir. Geçmek için gerekli en düşük not nedir? Çözüm: Geçmesi istenen öğrencilerin oranı, 250 = 0,833 300 1 − 0,833 = 0,167 Kalması gereken öğrencilerin oranıdır. Z1 0 -∞ z1 ∫ f ( z )dz = 0,167 ⇒ ∫ f ( z )dz ise Z z1= x−µ σ 1 = −0,965 olur. ⇒ x = µ + z1 ⋅ σ ⇒ x = 60 − 0.965 ⋅ 10 ⇒ x = 50,35 bulunur. 12 Z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0 0 0,003989 0,007978 0,011966 0,015953 0,019939 0,023922 0,027903 0,031881 0,035856 0,1 0,039828 0,043795 0,047758 0,051717 0,05567 0,059618 0,063559 0,067495 0,071424 0,075345 0,2 0,07926 0,083166 0,087064 0,090954 0,094835 0,098706 0,102568 0,10642 0,110261 0,114092 0,3 0,117911 0,12172 0,125516 0,1293 0,133072 0,136831 0,140576 0,144309 0,148027 0,151732 0,4 0,155422 0,159097 0,162757 0,166402 0,170031 0,173645 0,177242 0,180822 0,184386 0,187933 0,5 0,191462 0,194974 0,198468 0,201944 0,205401 0,20884 0,21226 0,215661 0,219043 0,222405 0,6 0,7 0,225747 0,258036 0,229069 0,261148 0,232371 0,264238 0,235653 0,267305 0,238914 0,27035 0,242154 0,273373 0,245373 0,276373 0,248571 0,27935 0,251748 0,282305 0,254903 0,285236 0,8 0,288145 0,29103 0,293892 0,296731 0,299546 0,302337 0,305105 0,30785 0,31057 0,313267 0,9 0,31594 0,318589 0,321214 0,323814 0,326391 0,328944 0,331472 0,333977 0,336457 0,338913 1 0,341345 0,343752 0,346136 0,348495 0,35083 0,353141 0,355428 0,35769 0,359929 0,362143 1,1 0,364334 0,3665 0,368643 0,370762 0,372857 0,374928 0,376976 0,379 0,381 0,382977 1,2 0,38493 0,386861 0,388768 0,390651 0,392512 0,39435 0,396165 0,397958 0,399727 0,401475 1,3 0,4032 0,404902 0,406582 0,408241 0,409877 0,411492 0,413085 0,414657 0,416207 0,417736 1,4 0,419243 0,42073 0,422196 0,423641 0,425066 0,426471 0,427855 0,429219 0,430563 0,431888 1,5 0,433193 0,434478 0,435745 0,436992 0,43822 0,439429 0,44062 0,441792 0,442947 0,444083 Z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 1,6 0,445201 0,446301 0,447384 0,448449 0,449497 0,450529 0,451543 0,45254 0,453521 0,454486 1,7 0,455435 0,456367 0,457284 0,458185 0,45907 0,459941 0,460796 0,461636 0,462462 0,463273 1,8 0,46407 0,464852 0,46562 0,466375 0,467116 0,467843 0,468557 0,469258 0,469946 0,470621 1,9 0,471283 0,471933 0,472571 0,473197 0,47381 0,474412 0,475002 0,475581 0,476148 0,476705 2 0,47725 0,477784 0,478308 0,478822 0,479325 0,479818 0,480301 0,480774 0,481237 0,481691 2,1 0,482136 0,482571 0,482997 0,483414 0,483823 0,484222 0,484614 0,484997 0,485371 0,485738 2,2 0,486097 0,486447 0,486791 0,487126 0,487455 0,487776 0,488089 0,488396 0,488696 0,488989 2,3 0,489276 0,489556 0,48983 0,490097 0,490358 0,490613 0,490863 0,491106 0,491344 0,491576 2,4 0,491802 0,492024 0,49224 0,492451 0,492656 0,492857 0,493053 0,493244 0,493431 0,493613 2,5 0,49379 0,493963 0,494132 0,494297 0,494457 0,494614 0,494766 0,494915 0,49506 0,495201 2,6 0,495339 0,495473 0,495604 0,495731 0,495855 0,495975 0,496093 0,496207 0,496319 0,496427 2,7 0,496533 0,496636 0,496736 0,496833 0,496928 0,49702 0,49711 0,497197 0,497282 0,497365 2,8 0,497445 0,497523 0,497599 0,497673 0,497744 0,497814 0,497882 0,497948 0,498012 0,498074 2,9 0,498134 0,498193 0,49825 0,498305 0,498359 0,498411 0,498462 0,498511 0,498559 0,498605 3 0,49865 0,498694 0,498736 0,498777 0,498817 0,498856 0,498893 0,49893 0,498965 0,498999