KAVRAMLAR n Olasılık Kuramı ve Bazı Olasılık Dağılımları n n n OLASILIK n n n Sübjektif görüş: Bir olayın gerçekleşeceğine olan inanç, olaylar hakkındaki bilgi derecesine bağlıdır. Klasik görüş: bir olayın olasılığı, gözlem ve deneye dayanmadan, teorik bir modelden elde edilen sonuçlarla belirlenebilir. Ampirik görüş: bir olayın olasılığı, bir veya birçok gözlem ve deneyden elde edilen sonuçlardan belirlenebilir. Yani, A olayının n sayıdaki denemede x kere gerçekleşmesi halinde olasılık P(A)=x/n’dir Deney: belirli koşullar altında tekrarlanabilen ve her tekrarda farklı sonuçlar elde edilebilen işlemdir. Örneklem uzayı: bir denemenin tüm olası sonuçlarını gösteren S kümesine örneklem uzayı denir. Örneklem noktaları: örneklem uzayının elemanları örneklem noktalarıdır. Olay: örneklem uzayının her alt kümesi bir olay olarak tanımlanır (A, B). Deney ve Örneklem Uzayı Deney Örnek Uzayı Yazı-Tura atılır 2 Para Yazı-Tura atılır Kart Seçildiğinde, Kart Seçildiğinde Kaliteye Bakılınca Cinsiyete Bakılınca Müsabaka Yapıldığında Tura,Yazı TT, YZ, TY, YY 2♥, 2♦, ..., A♠ (52) Kırmızı, Siyah Kalitesiz, Kaliteli Erkek,Bayan Kazanır, Kaybeder, Berabere Basit ve Bileşik Olay n n n n Olasılık Tablosu Bir tek çıktısı olan ve kendisinden başka olaylara ayrıştırılamayan olaylara basit olay; birden fazla basit olaydan oluşan olaylara bileşik olay denir. Ör. Bir zar atıldığında 3 gelmesi basit bir olayken atılan zarın çift gelmesi bileşik bir olaydır. Muhtemel olay: bir deneyden çıkabilecek her basit olay. Ayrık olay: arakesitleri boş olan olaylar Bileşik ve Ayrık Olay Ağaç Diyagramı Olasılık Olasılık- Temel Özelliği nP - olasılık. - belirli bir olay. n A, B, ve C n P (A) - A olayının oluşma olasılığı: bir deneyin çok sayıda tekrarında, bir olayın gözlenme oranına o olayın olasılığı denir P(A) = n n n A olayına ait sonuçların sayısı Muhtemel bütün sonuçların sayısı Ör: Bir zarın atılması sonrasında 5 gelmesi P(A)=1/6 Yazı-Tura Denemesi (T) n P(A)=1 kesin olay P(A)=0 imkansız olay Kesin ve imkansız olaylar dışında kalan bütün olayların olasılıkları 0 ile 1 arasındadır. 0<P(A)<1 ΣP(A)=1 Muhtemel tüm olay sayılarının hesabı n 1900’lerde İngiliz istatistikçi Karl Pearson 24000 kez Yazı Tura Atmış oyun sonunda 12012 kez Tura Gelmiştir. P(T)=0.5005 n Permütasyon: N birimin geliş sırası dikkate alınarak birbirinden farklı düzenlemelerin elde ediliş sayısı. (yerine koyarak örnekleme) n! nPr = Kombinasyon: (n - r)! N birimin geliş sırası dikkate alınmadan birbirinden farklı düzenlemelerin elde ediliş sayısı. (yerine koymadan örnekleme) nCr = n! (n - r )! r! Ayrık olaylar (Birbirini Engelleyen olaylar) Birleşik Olaylar İki olayın bileşimi: (A U B), (A veya B) Zar atma deneyinde: A: bir tek sayı gelmesi, A={1, 3, 5} B: 2’den büyük bir sayı gelmesi, B={3, 4, 5, 6} (A U B)={1, 3, 4, 5, 6} n İki olayın kesişimi: (A ∩ B), (A ve B) (A ∩ B) ={3, 5} n n n P(A Toplama Kuralı n Ayrık olaylar n P(A U B)=P(A)+P(B) n Birleşik olaylar n P(A U B)=P(A)+P(B)-P(A ∩ B) U B)=P(A)+P(B)=0.2+0.3=0.5 Birleşik olaylar (Bir Arada Oluşabilen Olaylar) Olasılık Kuralları n Bir mağazaya giren müşteri 0.2 olasılıkla lacivert, 0.3 olasılıkla siyah bir takım elbise alacaktır. Bu müşterinin mağazadan iki takımdan birisini alma olasılığı nedir? n n n n 52’lik bir deste oyun kağıdından rasgele seçilen 2 kağıdın kupa veya as olma olasılığı nedir? P(K)=13/52 P(A)=4/52 P(A ∩ K)=1/52 n P(A U K)=P(A)+P(K)-P(A ∩ K) =13/52+4/52-1/52=16/52=4/13 Bağımlı ve Bağımsız olaylar Olasılık Kuralları İki veya daha fazla olay meydana geldiğinde bir olayın meydana gelmesi diğerinin meydana gelmesini etkiliyor ise bağımlı, etkilemiyor ise bağımsız olay olarak adlandırılır. Tümleme: P(A) + P(A) = 1 Koşullu Olasılık Olasılık Kuralları ve P(B A) = P(A ∩ B) P(A) n S={1, 2, 3, 4, 5, 6} B ={2} A olayının olması durumunda B olayının olması olasılığı A ={2, 4, 6} Bir zar deneyinde sonucun bir çift sayı olduğu bilindiğine göre 2 olma olasılığı nedir? P(A)=3/6=1/2 A∩B={2} P(A∩B)=1/6 P(B | A)=[1/6]/[3/6] =1/3 Çarpma Kuralı n Bağımlı olaylar n P(A ∩ B)=P(A).P(B|A) n Bağımsız olaylar n P(A ∩ B)=P(A).P(B) Bağımlı Olay Bir makinenin üretmiş olduğu 50 parçadan 10 tanesinin kusurlu olduğu bilinmektedir. Bu parçalardan rasgele 2 parça çekildiğinde (yerine koymaksızın) her ikisinin de kusurlu olma olasılığı nedir? P(A): çekilen birinci parça kusurlu =10/50 P(B): çekilen ikinci parça kusurlu P(B|A)=9/49 n n n n n Bayes Teoremi Çeşitli sebeplerin aynı sonucu verebildiği durumlarda bazen sonuç bilindiği halde bunun hangi sebepten ileri gelmiş olduğu bilinmeyebilir. Sözkonusu sonucun hangi olasılıkla hangi sebepten ortaya çıktığı araştırılmak istendiğinde Bayes Teoremi kullanılır. P(A ∩ B)=P(A) . P(B|A) =10/50 . 9/49=0.0367 Bağımsız Olay n İki zarın birlikte havaya atıldığı bir deneyde her iki zarında 4 gelme olasılığı nedir P (4, 4) ? n P(A)=1/6 n P(B)=1/6 n P(A ∩ B)=P(A).P(B)=1/6 . 1/6=1/36 Bayes Teoremi Bir günlük üretim sonrasında bir ürün seçilmiş ve bozuk olduğu görülmüş. Bu ürünün M3’te üretilmiş olma ihtimali nedir? P ( M3 B) = P ( M3 B) = P ( M3 B) = Makine Üretimdeki % payı Bozuk Üretim Oranı % M1 0.20 0.02 M2 0.30 0.03 M3 0.50 0.04 P ( M 3). P ( B M 3 ) P ( B) P ( M 3). P ( B M 3 ) P ( M 1). P ( B M 1) + P ( M 2). P ( B M 2 ) + P ( M 3). P ( B M 3 ) 0.50 ⋅ 0.04 0.02 = = 0.606 0.20 ⋅ 0.02 + 0.30 ⋅ 0.03 + 0.50 ⋅ 0.04 0.033 Rastlantı Değişkenin Beklenen Değeri ve Varyansı Rastsal Değişken nHangi değeri alacağı önceden bilinmeyen ve belli olasılıklarla çeşitli değerler alabilen değişkene rastlantı (rastsal) değişken adı verilir. n E ( X ) = ∑ xi P ( x ) i =1 nOlasılık fonksiyonu: bir rastlantı değişkenin alabileceği değerlerle, bu değerleri alabilmesi olasılıkları arasındaki ilişkiyi gösteren bir fonksiyondur. f ( x ) ≥ 0 ve +∞ ∫ n V ( X ) = σ = ∑ xi2 P ( x ) − [ E ( X )] 2 2 i =1 f ( x ) ⋅dx = 1 −∞ koşulunu sağlayan f(x) fonksiyonuna x’in olasılık yoğunluk fonksiyonu denir RASTSAL DEĞİŞKEN TÜRÜ - Kesikli rastsal değişken sonlu sayıda değer alan bir değişken olabileceği gibi, sonsuz sayıda değer de alabilir. Sonlu değer alan bir kesikli rastsal değişken: x =' 1 günde satılan TV sayısı' olsun ve x 5 farklı değer alabilirse (örneğin : 0, 1, 2, 3, 4) Sonsuz değer alabilen bir kesikli rastsal değişken: x = '1 günde gelen müşteri sayısı' ve 0, 1, 2, . . . Değerlerini alabilir Gelen müşteri sayısını sayabiliriz, ama gelebilecek müşteri sayısı için bir üst limit saptayamayız. n n Bir kitabın sayfalarındaki yanlış sayısını gösteren x’in (0, 1, 2) olasılık fonksiyonu P(X=x), (0.8, 0.4, 0.02) sırası ile verilmiştir. Sayfa başına ortalama yanlış sayısını ve varyansını hesaplayınız. n E ( X ) = ∑ xi P ( x ) = 0(0.8) + 1(0.18) + 2(0.02) = 0.22 i =1 n V ( X ) = σ = ∑ xi2 P ( x ) − [ E ( X )] 2 Sürekli rastsal değişken - Sürekli rastsal değişken sınırlı ya da sınırsız belli bir aralıktaki bütün değerleri alabilen rastsal değişkendir. Sürekli bir değişkenin alabileceği değerler sayılamaz. 2 i =1 = 0 (0.8) + 12 (0.18) + 2 2 (0.02) − (0.22) 2 = 0.216 2 Olasılık Dağılımları Rastsal bir değişken için Olasılık dağılımı değişkenin değerleri için olasılıkların nasıl dağıldıklarını tanımlar. KESİKLİ, OLASILIK DAĞILIMLARI - Binom Olasılık Dağılımı - Poisson Olasılık Dağılımı - Hipergeometrik Olasılık Dağılımı Binom Dağılımı n Birbirinden bağımsız ve iki sonuçlu olaylar binom dağılımı gösterir n birbirinden bağımsız deneme sayısı. x p n denemede istenilen olayın gelme sayısı istenilen olayın ortaya çıkma olasılığı. q istenmeyen olayın ortaya çıkma olasılığı P(x) n denemede x sayıda istenilen olayın ortaya çıkma olasılığı SÜREKLİ OLASILIK DAĞILIMLARI - Dikdörtgen (UNIFORM) Olasılık Dağılımı - NORMAL DAĞILIM - ÜSTEL DAĞILIM P(S) = p (p = başarılı olma olasılığı) P(F) = 1 – p = q (q = başarısız olma olasılığı) Binom Dağılımı KESİKLİ OLASILIK DAĞILIMI n n n n Her deneme için p sabittir Denemeler bağımsızdır Her deneme için iki sonuç vardır Deneme sayısı n sonlu bir değere varır n x n − x x = 0,1, 2 ....., n p q p( x , n, p) = x 0 diğer x ' ler için Binom Dağılımı x = 0, 1, 2, . . ., n P(x) = n! • (n – x )!x! px • 2 σ x = 0,1, 2....., 6 diğer x ' ler için 6 0 6−0 6! p( x = 0) = ( 0.05 ) ( 0.95 ) = (0.95)6 = 0.7351 (6 − 0)!0! x b) 1’nin kusurlu çıkma ihtimali 6 6! 1 6−1 p( x = 1) = ( 0.05 ) ( 0.95 ) = (0.05)(0.95)6 = 0.2321 − x (6 1)!1! c) En az ikisinin kusurlu çıkma olasılığı p( x ≥ 2) = 1 − [ p( x = 0) + p( x = 1)] = 0.0328 = n•p•q Standart sapma ( 0.95) a)Hiç birinin kusursuz olma ihtimali ortalama µ = n • p Varyans σ ( 0.05 ) p( x , 6, 0.05) = x 0 qn-x x adet başarılı sonuç elde etme olasılığı n denemede tam x adet başarılı sonuç sayısı Örnek: n Bir makinenin ürettiği parçaların %5’nin kusurlu olduğu bilinmektedir. Bu makinenin ürettiği parçalardan 6 tanesi incelenmiştir. 6 x 6− x = n•p•q Binom Dağılımı Poisson Dağılımı (ender olaylar dağılımı) n X rastlantı değişkeninin belli bir zaman aralığında veya belli bir mekanda çok az tekrarlanan olayları göstermesi durumunda ortaya çıkan olasılık dağılımı • Eşit uzunluktaki zaman dilimlerinde ilgili olduğumuz olayın gerçekleşme olasılıkları aynıdır • Olayın herhangi bir zaman diliminde gerçekleşmesi ya da gerçekleşmemesi,başka bir zaman diliminde gerçekleşmesi ya da gerçekleşmemesinden bağımsızdır. 0<p<0.5 : sağa yatık P=0.5 : simetrik 0.5<p<1 : sola yatık P(x) = λx • e-λ x! e ≈ 2.71828 p(x ) : Bir birimlik bir zaman diliminde olayın x kez gerçekleşme olasılığı λ : Bir birimlik bir zaman diliminde olayın ortalama gerçekleşme sayısı E(X)= λ =n.p ve σ 2 = λ Poisson Dağılımı (ender olaylar dağılımı) Poisson Dağılımı (ender olaylar dağılımı) Aşağıda belirtilen koşullar sağlandığında binom dağılımı poisson’a yaklaşır ve binom yerine poisson dağılımı kullanılabilir v v n ≥ 100 np ≤ 10 Poisson dağılımında ortalama tahmininde binom dağılımı kullanılabilir λ =µ = n • p Poisson dağılımı deney sayısının çok fazla, fakat meydana gelme olasılıkları çok düşük olan olaylarla ilgili problemlerde çok uygun sonuçlar vermektedir. Ör. Bir ülkedeki doğal afetlerin, bir iş yerindeki iş kazalarının vs. dağılımı. (p≤0.01 ve λ=np ≤5) Poisson Dağılımı (ender olaylar dağılımı) Örnek: n Günde 1500 parça üreten bir makinenin kusurlu parça üretim oranı %0.01 dir. Her saat başında üretim hattından alınan 100 parçanın incelenmesi sonucu 2’den fazla bozuk bulunduğu durumda üretim durdurulacaktır. Üretimin durdurulma ihtimali nedir? P(x) = λx • e-λ x! E(X)= λ = σ 2 =n.p=100 .0.01=1 p( x > 2) = 1 − p( x ≤ 2) = 1 − [ p( x = 0) + p( x = 1) + p( x = 2)] e −1 ( 1) 0 e −1 ( 1) 1 e −1 ( 1) 2 = 0.0803 = 1− + + 0! 1! 2! DİKDÖRTGEN OLASILIK DAĞILIMI SÜREKLİ OLASILIK DAĞILIMLARI Bir sürekli değişkenin herhangi bir aralıkta değerler alma olasılığı konu edilen aralığın genişliği ile orantılı ise bu değişkenin dağılımı dikdörtgen dağılımdır denir. - Uniform olasılık yoğunluk fonksiyonu X 'in ortalaması μ=E(x) = (a + b)/2 X 'in varyansı: σ2 = Var(x) = (b - a)2/12 a = X 'in en küçük değeri b = X 'in en büyük değeri SÜREKLİ OLASILIK DAĞILIMLARI Örnek: Salata Açık Büfesi -- Sürekli bir değişkenin özel bir değeri için olasılık değeri sıfırdır, yani P(X=xi)=0 dır. - Sürekli bir değişkenin (a,b) gibi bir ararlıkta herhangi bir değer alması olasılığı pozitiftir. - P(a<X<b) olasılığı X değişkeninin olasılık yoğunluk fonksiyonunun belirlediği eğrinin altında kalan ve x=a ile x=b doğruları ile sınırlanan alandır. Bir otel işletmesi , salata büfesi müşterilerinin tabağına aldığı salata miktarının dağılımının tekdüze olduğunu, tabağa konan salat miktarının 150 gram ile 250 gram arasında değişen değerler aldığını saptanmıştır. Bir müşterinin tabağına aldığı salata miktarının 220 gram ile 250 gram arasında olması olasılığı nedir? Normal Dağılım (Gaus) n n n n n n Olasılık yoğunlu fonksiyonu: f (x ) = 1/100 , 150 < x < 250 = 0 diğer x değerleri için x = tabaktaki salatanın ağırlığı Normal Dağılım (Gaus) n Normal dağılım, belirli bir değişkene ilişkin gözlemleri iki uç değer arasında sıralayan dizilerin gösterdiği varsayılan bir dağılımdır. Bu dağılım, diziyi oluşturan gözlem veya değerlerin, çoğunluğunun ortalama çevresinde toplanması ve uç değerlere doğru giderek azalması biçiminde belirir. f ( x ) = N ( x, µ , σ ) = e = 2.718, π = 3.14 1 σ 2π e − ( x − µ )2 2σ 2 Normal dağılım eğrisi çan eğrisi olarak da bilinir. Eğrinin tepe noktası ortalamaya karşılık gelir. Bu dağılımda ortalama, medyan (ortanca) ve mod (Tepe değer) aynıdır. Normal dağılım eğrisi ortalamaya göre simetriktir. Standart sapma eğrinin genişliğini belirler, yani standart sapma büyüdükçe değişkenin alacağı en küçük değer ile en büyük değer arasındaki açıklık büyür. Eğrinin altında kalan alanın tamamı 1 birimdir. Normal dağılıma ilişkin olasılıklar normal dağılım yoğunluk fonksiyonunun belirlediği eğrinin altında kalan alanlar olarak hesaplanır. Normal dağılıma sahip bir seride n Ampirik (68-95-99.7) kuralı Standart Normal Dağılım n n Standart Normal Dağılım Ortalaması sıfır ve standart sapması 1 olan normal dağılıma sahip bir değişkenin dağılımına standart normal dağılım denir. Standart Normal dağılıma sahip değişkenler Z ile gösterilir. 1 f (z) = e σ 2π ( z )2 − 2 Standart Normal Dağılıma Dönüşüm n z değeri normal dağılmış bir X değişkeninin aldığı bir özel x değerinin kendi ortalaması μ 'den uzaklığının standart sapma cinsinden ölçüsüdür. x−µ z= σ Standart Normal Dağılım P(140<x<211)=? µ = 143 σ = 29 z = 211 – 143 = 2.34 29 z = 140 – 143 = - 0.10 29 P( –0.10 < z < 2.34 ) = 0.9904 – 0.4602 = 0.5302 Kadınların %53.02 ‘sinin 140-211 lb arasında olması beklenir P(x<38.8)=? µ = 36 σ = 1.4 z = 38.8 – 36.0 = 2.00 1.4 Örnek: Süper tamirci Süper tamirci oto tamiratının yanı sıra oto parçaları,ve motor yağı da satan bir işyeridir. Motor yağı stokları 20 kutuya inmesi halinde yeni bir parti yağ siparişi verilmesi gerektiği işletme tarafından saptanmıştır. İşletme sipariş edilen yağlar gelinceye kadar bazı müşterilerin ihtiyacının karşılanamaması durumu ile yüz yüze kalınacağı ve sonuç olarak da bazı muhtemel yağ satışlarının kaybedileceği düşüncesindedir. Sipariş bekleme süresindeki talep dağılımının ortalaması 15 kutu ve standart sapmasının 6 kutu olan bir normal dağılım olduğu saptanmışsa, gelen bir müşteriyi kaybetme olasılığı yani, P(x > 20) nedir? Standart normal dağılım tablosu -∞ ile z arası alan (z=1.23) Çözüm z = (x - μ)/σ = (20 - 15)/6 = .83 Standart normal dağılım tablosundan z = 0 ile z = .83 arasında kalan alanı . 2967 olarak vermektedir. Bizim ilgili olduğumuz alan yukarıdaki grafikte gösterilen yeşil alan olup bu da 0.5 - 0.2967 =0.2033. Olarak hesaplanır. Bu da aranan olasılık değeridir. Standart normal dağılım tablosu kullanımı (Z=0.83) z ,00 ,01 ,02 ,03 ,04 ,05 ,06 ,07 ,08 ,0 ,0000 ,0040 ,0080 ,0120 ,0160 ,0199 ,0239 ,0279 ,0319 ,0359 ,1 ,0398 ,0438 ,0478 ,0517 ,0557 ,0596 ,0636 ,0675 ,0714 ,0753 ,2 ,0793 ,0832 ,0871 ,0910 ,0948 ,0987 ,1026 ,1064 ,1103 ,1141 ,3 ,1179 ,1217 ,1255 ,1293 ,1331 ,1368 ,1406 ,1443 ,1480 ,1517 ,4 ,1554 ,1591 ,1628 ,1664 ,1700 ,1736 ,1772 ,1808 ,1844 ,1879 ,5 ,1915 ,1950 ,1985 ,2019 ,2054 ,2088 ,2123 ,2157 ,2190 ,2224 ,6 ,2257 ,2291 ,2324 ,2357 ,2389 ,2422 ,2454 ,2486 ,2518 ,2549 ,7 ,2580 ,2612 ,2642 ,2673 ,2704 ,2734 ,2764 ,2794 ,2823 ,2852 ,8 ,2881 ,2910 ,2939 ,2967 ,2995 ,3023 ,3051 ,3078 ,3106 ,3133 ,9 ,3159 ,3186 ,3212 ,3238 ,3264 ,3289 ,3315 ,3340 ,3365 ,3389 P (–2.00 < z < 1.50) =? ,09 P (z < –2.00) = 0.0228 P (z < 1.50) = 0.9332 P (–2.00 < z < 1.50) = 0.9332 – 0.0228 = 0.9104 P(z)=0.95→z=1.6+0.045=1.645 P (z > –1.23) = 0.8907 P(Z) Verildiğinde z’nin bulunması (Tek yanlı) 5% or 0.05 1.645 P(Z) Verildiğinde z’nin bulunması (Çift yanlı)