ÜNİTE 6 SÜREKLİ RASSAL DEĞİŞKENLER VE NORMAL DAĞILIM 1 Sürekli Olasılık Dağılımı Sürekli bir rassal değişkenin olası değerleri sonsuz ve sayılamaz olarak kabul edilmektedir. Sürekli bir rassal değişkenin uygulanacağı pek çok olasılık dağılımı bulunmakla birlikte, konu kapsamı içerisinde sadece normal olasılık dağılımı ve binom dağılımına yaklaşan normal dağılımla karşılaştırmalarda (test amacıyla) kullanılan Student-t dağılımı incelenecektir. 2 Sürekli Olasılık Dağılımı Sürekli bir rassal değişkenin olası değerleri sonsuz ve sayılamaz olarak kabul edilmektedir. Bir başka anlatımla, sürekli bir rassal değişken bir aralıkta ( veya aralıklarda ) her değeri alabilmekteydi. Çünkü bir aralıkta bu değişkenin alabileceği sonsuz sayıda değer olduğu varsayılmakla ve bu değerlerin sayılamayacak kadar çok olduğu kabul edilmektedir. 3 Sürekli Olasılık Dağılımı Sürekli bir rassal değişkenin olasılık dağılım eğrisine, olasılık yoğunluk fonksiyonu da denmektedir. Sürekli bir rassal değişkenin olasılık dağılımı aşağıdaki iki özelliği sağlamaktadır. 1. Bir aralıkta herhangi bir değer alan x’in olasılığı 0 – 1 arasındadır. 2. x’in aldığı tüm değerlerin olasılıkları toplamı 1’dir. 4 Sürekli bir rassal değişkenin bir aralıkta aldığı varsayılan değerlerin olasılığı bu aralığın iki limiti arasında ve eğri altında kalan alandır. P (c x d ) ? 5 X sürekli bir rassal değişken olmak üzere, x’in alabileceği tek bir değerin olasılığı 0’dır. Çünkü verilen bir noktanın alanı 0’dır. P( x c) 0 P( x d ) 0 P (c x d ) P (c x d ) 6 Normal Dağılım • Sürekli ve kesikli rassal değişkenlerinin dağılımları birlikte ele alındığında istatistikte en önemli dağılım Normal dağılımdır. • Normal dağılımın ilk uygulamaları doğada gerçekleşen olaylara karşı başarılı bir biçimde uyum göstermiştir. Dağılımın göstermiş olduğu bu uygunluk adının Normal Dağılım olması sonucunu doğurmuştur. • İstatistiksel yorumlamanın temelini oluşturan Normal Dağılım, bir çok rassal süreçlerin dağılımı olarak karşımıza çıkmaktadır. • Normal dağılış kullanımının en önemli nedenlerinden biride bazı varsayımların gerçekleşmesi halinde kesikli ve sürekli bir çok şans değişkeninin dağılımının normal dağılışa 7 yaklaşım göstermesidir. Normal Dağılım • Normal dağılımın parametreleri (ortalama) ve (standart sapma)’dır. • Bu iki parametrenin verilmesi halinde, bir normal dağılımın eğrisi altındaki, herhangi bir aralığa karşılık gelen alan bulunabilmektedir. • Ancak normal dağılım eğrisi tek olmayıp, bir ailedir. Çünkü her ve seti için farklı bir dağılım söz konusudur. • Bu parametrelerden , yatay eksen üzerinde bir normal dağılımın merkezini belirtirken, ’da dağılımın yayılımını ifade eder. 8 = standart sapma f(x) x Normal dağılım olasılık yoğunluk fonksiyonu 9 f(x) x f(x) 12 x 10 Normal Olasılık Dağılımı Çizildiğinde çan eğrisi şeklinde bir görünümü olan normal olasılık dağılımının üç önemli özelliği, 1.Eğri altında kalan alan 1.0 ya da % 100 ’dür. 2. Eğri ortalamaya göre simetrik olup eğri altındaki toplam alanın yarısı ortalamanın sağında, yarısı solunda yer alrı. 3. Bir normal eğrinin iki kuyruğu yatay eksene asimptottur. Bir normal dağılım eğrisi hiçbir zaman yatay eksene dokunmamakla birlikte; –’dan küçük ve ( + 3)’dan büyük bir aralıkta eğri altında kalan alanın 0 olduğu düşünülmektedir. 11 Normal Dağılımın Olasılık Yoğunluk fonksiyonu 1 e f ( x) 2 0 1 x 2 2 , x , diger yerlerde ... e = 2,71828 = populasyon standart sapması = populasyon ortalaması 12 Normal dağılım ortalama ve standart sapma parametrelerinin değişimi sonucu birbirinden farklı yapılar gösterir. • Her dağılımın için olasılık yoğunluk fonksiyonunu kullanarak olasılık hesaplama güçlüğü olasılık değerlerini içeren tablolar kullanma zorunluluğunu ortaya çıkarmıştır . • Birbirinden farklı sonsuz sayıda normal dağılış olabileceği için olasılık hesaplamasında kullanmak üzere sonsuz sayıda tablo gereklidir. 13 Standart Normal Dağılım • Olasılık hesaplamasındaki zorluktan dolayı normal dağılış gösteren şans değişkeni standart normal dönüştürülür. • Böylece tek bir olasılık tablosu kullanarak normal dağılış ile ilgili olasılık hesaplamaları yapılmış olur. • Standart normal dağılımda ortalama 0 , varyans ise 1 değerini alır. • Standart normal rassal değişken z ile gösterilir. 14 15 Standart Normal Dağılım Tablosunu Kullanarak Olasılık Hesaplama P (0 z 1) ? P(0 z 1) 0,3413 16 P ( z 1) ? 1 P (0 z 1) 1 0,3413 0,1587 17 SİMETRİKLİK ÖZELLİĞİNDEN DOLAYI 0’DAN EŞİT UZAKLIKTAKİ Z DEĞERLERİNİN 0 İLE ARASINDAKİ KALAN ALANLARININ DEĞERLERİ BİRBİRİNE EŞİTTİR. P ( 0 z a ) P ( a z 0) 18 P(1 z 1) ? P (1 z 1) P (1 z 0) P (0 z 1) 2 * P (0 z 1) 2(0,3413) 0,6826 19 Örnek: P1.2 z 2.2 P1.2 z 0 P0 z 2.2 0.3849 0.4861 0.8710 -1.2 0 2.2 1.2 z 20 Örnek: Pz 1.64 Pz 1.64 0.4495 0.5 P0 z 1.64 0.5 0.4495 0.0505 0.0505 -1.64 0 1.64 z 21 Normal Dağılımın Standartlaştırılması Normal dağılım gösteren sürekli bir rassal değişkenin, bir dönüştürme neticesinde standart normal dağılımlı bir değişkene çevrilmesi işlemine normal dağılımın standartlaştırılması adı verilir. Bu amaçla normal dağılım gösteren x rassal değişkeninin, standart normal dağılım gösteren z rassal değişkenine dönüştürülmesi yapılması gereklidir. f(x ) -x 0 x a 0 x b 22 -z 0 0 z 0 Z a Z b z x değerinin z değerine dönüştürülmesi z x • X ~ N ( , 2 ) • Z ~ N ( 0 , 1) f(z ) z 23 f(x) x a f(z) z P ( x a ) P (o z z1 ) 0 z 1 24 Normal Dağılımın Standart Normal Dağılım Dönüşümü P ( a X b) ? X ~ N ( , 2 ) Z ~ N ( 0 , 1) a x b P ( a X b) P P ( z a z zb ) f(z ) a b za zb z 25 • Örnek: Bir işletmede üretilen vidaların çaplarının uzunluğunun, ortalaması 10 mm ve standart sapması 2 mm olan normal dağılıma uygun olduğu bilinmektedir. Buna göre rasgele seçilen bir vidanın uzunluğunun 8,9mm ‘den az olmasının olasılığını hesaplayınız. P( X 8,9) ? X ~ N ( , ) x 8,9 10 P( X 8,9) P P( z 0,55) 2 f(z ) P ( z 0,55 ) 0,5 0, 2088 0, 2912 -0,55 0 z 26 Ö r n e k : B ir iş l e t m e , ö m r ü n o r m a l d a ğ ı lı m a u y a n = 1 2 0 0 s a a t o r ta la m a lı, = 3 0 0 s ta n d a r t s a p m a lı a m p u l le r ü r e t il m e k t e d ir . Ü r e ti m d e n s e ç i le n b ir a m p ü lü n ö m r ü n ü n 9 0 0 - 1 3 0 0 s a a t a r a s ın d a o l m a s ı o la s ılı ğ ı n e d ir ? P 900 x 1300 ? 0 .3 4 1 3 900 -1 0 .1 2 9 3 1200 0 x 1300 z 1 /3 9001200 x 13001200 P P 1 z 13 P1 z 0 P0 z 0.33 300 300 0.3413 0.1293 0.4706 27 Örnek: Belli bir dersten sınava giren öğrencilerin not ortalamaları 60, standart sapmaları 15’dir. a) 85 ile 95 arasında not alan öğrencilerin oranını bulunuz. 85 60 x 95 60 P 85 x 95 P P 1.67 z 2.33 15 15 P 0 z 2.33 P 0 z 1.67 0.4901 0.4525 0.0376 0 .0 3 7 6 60 85 95 0 1 .6 7 2 .3 3 x z 28 b) Hangi notun üstündeki öğrenciler üst %10 grubuna girer? P x b 0 .1 0 ,1 0 .4 60 0 b = 79 .2 1 .28 x z P 60 x b 0.4 60 60 x b 60 P 0 .4 15 15 b 60 P0 z 1.28 0.4 15 b 60 1.28 b 60 1.28(15) b=79.2 15 29 Binom Dağılımının Normal Dağılımına Yakınsaması 30 X rassal değişkeni n ve p parametreli Binom Dağılımı göstermek üzere, n deneme sayısının büyük olduğu ayrıca p başarı olasılığının 0,5 değerine yaklaşması sonucunda ( tercihen np > 5 ve nq > 5 ) , x rassal değişkeni ile ilgili olasılık hesaplamalarında kolaylık sağlaması açısından Binom Dağılımı yerine Normal Dağılım kullanılır. Normal Dağılımın parametreleri olan ve 2 tahmin edilirken Binom Dağılımının beklenen değer ve varyans formülleri dikkate alınır. •Normal Dağılım •Binom Dağılımı E (x) 2 Var ( x) E ( x) np Var ( x) np (1 p ) np np(1 p) 2 31 Süreklilik Düzeltmesi • Binom Dağılımı kesikli, normal dağılım ise sürekli bir dağılım olduğundan dolayı, binom dağılımını normal dağılıma yakınsadığı durumlar için olasılık hesaplamalarında süreklilik düzeltmesi kullanılması zorunluluğu vardır. • Kesikli bir şans değişkeni gösteren dağılım sürekli bir dağılıma yakınsadığında tamsayı değerleri sürekli bir eksende tanımlanır. P (a X b) P a 0,5 X b 0,5 P ( X a ) P X a 0,5 P( X a) P X a 0,5 32 • Örnek: Bir kampüste okuyan öğrencilerin % 20 si sigara içmektedir. Öğrencilerden 225 kişilik bir örnek alındığında, a) 40’dan fazla kişinin sigara içme olasılığını, b) 30 kişinin sigara içme olasılığını hesaplayınız. n = 225 p = 0,20 np = 45 > 5 np = 225(0,20)= 45 np(1 p) 225(0,20)(0,80) 6 a) P ( X ≥ 40) =? → P ( X ≥ 39,5) = ? 39,5 45 P( X 39,5) P z P( z 0,92) 0,5 0,3212 0,8212 6 b) P ( X = 30) =? → P ( 29,5 < X < 30,5) = ? 30,5 45 29,5 45 P(29,5 X 30,5) P z P(2,58 z 2,42) 6 6 33 0,4949 0,4922 0,0027