SÜREKLĠ OLASILIK DAĞILIMLARI Sayı ekseni üzerindeki tüm noktalarda değer alabilen değişkenler, sürekli değişkenler olarak tanımlanmaktadır. Bu bölümde, sürekli değişkenlere uygun olasılık dağılımları üzerinde duracağız. Normal Olasılık Dağılımı 18. yy’da astronotlar, bir nesnenin kütlesini tekrarlamalı olarak ölçtüklerinde, ölçüm sonuçlarının değiştiğini gözlemişlerdir. Bu ölçümleri çok fazla sayıda yapıp, bir frekans dağılımı halinde düzenledikten sonra, grafiğini çizmişler ve elde edilen dağılışa normal dağılış adını vermişlerdir. Anakitlenin oransal frekansıyla ilgili en yaygın kullanımı olan olasılık dağılımı C.F. Gauss (17771855) tarafından önerilmiş ve pek çok alanda şaşırtıcı bir kullanım bulmuştur. Normal dağılımın grafiği, normal eğri veya Gauss eğrisi olarak anılır. Bu dağılım çan şeklindedir. Normal eğri Normal Olasılık Dağılımı Bir veri seti için, standart sapması küçük olan dağılım, daha sivridir. Standart sapma büyüdükçe, eğri daha geniş bir aralığa yayılmaktadır. μ= -4, σ= 0.5 μ= 3, σ= 1 μ= 0, σ= 1.5 -4 0 3 Pek çok doğal ve fiziksel ölçüm, gözlenen frekans dağılımlarına uygundur. Normal dağılış, n≥30 örnek hacmi için, gerek örnek ortalamaları, gerekse örnek oranlarının dağılımlarına çok uygun bir dağılıştır. Normal dağılış, n>20 olduğu durumlarda, binomial olasılıkları tahmin etmek için kullanılabilir. Aşağıda normal dağılışa uygun bazı örnekler yer almaktadır: Bireylerin IQ değerleri, Bireylerin ağırlıkları, Bireylerin boyları, Satış miktarları, Ürünlerin bozulma süreleri, İnsan ve makine üretimleri Bir bölgedeki işletmelerde dekara buğday verimi Normal Eğrinin Özellikleri Normal dağılış eğrisini elde edebilmek için, aşağıdaki fonksiyon kullanılmaktadır. 1 f(x) = e-(1/2)[(x-μ)/σ]2 σ√2Π Fonksiyonda; x= Sürekli bir şans değişkeninin herhangi bir değeri, μ= Şans değişkeninin ortalaması σ= Şans değişkeninin standart sapması e= 2.71828 (doğal logaritma tabanı) Π= 3.1416 Fonksiyonda; σ ve μ’nin bilindiği varsayılmaktadır. Bunun anlamı; farklı her σ ve μ çifti için, farklı bir normal dağılış eğrisi elde edileceğidir. Herhangi bir normal dağılış eğrisinin tipik özellikleri: Çan şeklindedir. Aritmetik ortalamaya göre simetriktir. Normal dağılışın tanımlanabilmesi için, μ ve σ’nın bilinmesi gereklidir. Her bir σ ve μ çifti için, farklı bir normal dağılış söz konusudur. Aritmetik ortalamanın sağına ve soluna doğru sonsuz uzanır. Herhangi bir normal dağılış eğrisinde: Aritmetik ortalamanın 2 standart sapma solu ile 2 standart sapma sağındaki aralıkta, verilerin %95’i yer alır. %95 0.135 0.135 0.34 0.34 0.135 0.135 + 0.95 -2σ μ 2σ Herhangi bir normal dağılış eğrisinde: Aritmetik ortalamanın 3 standart sapma solu ile 3 standart sapma sağındaki aralıkta, verilerin %99’u yer alır. %99 0.02 0.02 0.34 0.34 0.135 0.135 0.02 0.02 + 0.99 -3σ μ 3σ Standart Normal Dağılış Aritmetik ortalaması sıfır, standart sapması bir olan normal dağılışa, standart normal dağılış denir. Standart z Değeri z değeri, normal dağılış eğrisinin merkeziyle (veya aritmetik ortalamasıyla), x değeri arasındaki mesafenin, kaç standart sapma olduğunu ifade eder. z Değeri z= (x-μ)/σ formülüyle hesaplanır. Burada: z: Standart sapma cinsinden, aritmetik ortalamadan uzaklık x: Normal dağılış değişkenin bir değeri, μ: Dağılımın aritmetik ortalaması σ: Dağılımın standart sapması Herhangi bir sürekli değişkenin tüm değerleri için, z değeri hesaplandığında, standart normal dağılışa dönüştürülmüş olur. Bir başka ifadeyle, yapılan işlem standartlaştırmadır. Artık standartlaştırılan değişkeninin aritmetik ortalaması sıfır, standart sapması birdir. Standart Normal Dağılışın Özellikleri: 1. Eğri altında kalan %1 veya %100’dür. Bir başka ifadeyle, toplam olasılık %1 veya %100’dür. 2. Alanın yarısı aritmetik ortalamanın sağında, diğer yarısı ise solunda yer alır. 3. Herhangi bir şans değişkeninin belli bir aralıktaki olasılığı, aralığın iki noktası arasında kalan alandır. 4. Sürekli ölçekte ölçülür ve tek bir değerin normal dağılıştaki olasılığı sıfırdır. Standart Normal Eğri Altındaki Alanın Bulunması Belli bir aralıkta, normal dağılış eğrisinin altında kalan alanın bulunabilmesi için, matematiksel olarak, normal dağılış formülünün integralini almak gerekmektedir. Bu, karmaşık bir hesaplama şekli olduğundan, hazır bir normal dağılış tablosunun kullanılması daha anlamlı ve kolay olduğu düşünülmüş ve bu amaçla standart normal dağılış (μ=0, σ=1) için hesaplanmış değerlerin bulunduğu, normal dağılış tablosu geliştirilmiştir. Standart Normal Eğri Altındaki Alanın Bulunması Normal dağılış gösteren bir değişkenin, herhangi bir aralığına ait eğri altındaki alan hesaplanırken, aşağıdaki süreç izlenmektedir: 1. Değişkenin aritmetik ortalaması ile aralığın başlangıç ve son değerleri normal dağılış grafiği üzerine yerleştirilir. 2. Başlangıç ve son değerleri için z değerleri hesaplanır. z değeri eğer pozitif ise, o değerin aritmetik ortalamasının sağında, negatif ise solunda yer aldığı anlaşılır. Standart Normal Eğri Altındaki Alanın Bulunması 3. z değeri negatif ise, z’nin mutlak değeri alınır. 4. z tablosu, yüzde birler basamağına duyarlıdır. Bu nedenle, z değeri ondalık noktadan itibaren 2 basamak yürütülerek hesaplanmalıdır. z değerinin tablo değerini bulabilmek için, z tablosunun sol sütununda 1’ler ve onda birler basamağı, üst satırında ise yüzde birler basamağı işaretlenir. Standart Normal Eğri Altındaki Alanın Bulunması Örneğin, z=1.46 ise, 1.4 sol sütundan, 6 ise üst satırdan bulunur ve bu satır ve sütunların kesiştiği noktadaki değer, olasılık olarak alınır. 5. Başlangıç değerinin z değerine karşılık gelen tablo değeri, başlangıç değeri ile, aritmetik ortalama arasında kalan alanın yüzde oranını verir. Bu oran, şans değişkeninin aritmetik ortalaması ile o değer arasında yer alma olasılığıdır. Standart Normal Eğri Altındaki Alanın Bulunması 6. Aralığın başlangıç ve son değerlerinin z değerleri göz önüne alınarak, gerekli toplama ve çıkarma işlemleri yapılır. z değerlerinin ikisi birden pozitif ise büyük tablo değerinden, küçük tablo değeri çıkarılar. z değerleri ters işaretli ise, tablo değerleri toplanır. μ= 500, σ= 25 olan ve normal dağılış gösteren bir şans değişkeni için, 535 değerinin altında kalanlarının (x<535) olasılığını (oranını) hesaplayalım. A1 0.5 500 535 Önce A1 alanını hesaplayalım: 535-500 z= 25 z= 1.4 standart sapma z’nin 1.4 olması, 535 değerinin aritmetik ortalamadan 1.4 standart sapma sağda yer aldığını göstermektedir. z’nin 1.4 olduğu durum için normal dağılış tablo değeri 0.4192’dir. p(500 < x < 535) = A1 = ztablo = 0.4192 Buna göre, 535 ile aritmetik ortalama (500) arasındaki aralıkta, eğri altında kalan alan 1 üzerinden 0.4192 veya yüzde olarak %41.92’dir. 535’in altında kalan aralığa ait alanı hesaplamaya çalıştığımızdan, aritmetik ortalamanın solundaki alanı, bu orana eklememiz gerekir. Aritmetik ortalama, eğri altındaki alanı iki eşit parçaya böldüğünden A1 alanı ile 0.5’i topladığımızda, istediğimiz alanı buluruz. P(x<535) = A1 + 0.5 = 0.4192 + 0.5 = 0.9192 Bu sonuç bize, üzerinde çalıştığımız değişkene ait verilerin %91.92’sinin 535’in altında bir değere sahip olduğunu belirtmektedir. Bir kahve ithalatçısı ayda ortalama 2700 ABD $’ı kar ediyor. Bu karın standart sapması 130 ABD $’dır. Ayda 2600 ABD $’ının üzerinde ve altında kazanma olasılığını bulunuz.?????? A1 0.5 2600 2700 2600 $’dan az kazanma olasılığını bulmak için A1 alanını hesaplayalım. 2600 - 2700 z= = -0.77 130 z= -0.77 için normal dağılış tablo değerini bulmak üzere, önce z’nin mutlak değeri alınır. 0.77’nin z tablosu değeri, 0.2794’tür. p(2600 < x < 2700) = A1 = ztablo = 0.2794 Bir başka deyişle, 2600 ile 2700 ABD $ arasında kazanma olasılığı yaklaşık %28’dir. Şimdi bu alanı, 0.5’ten çıkaralım. p(x < 2600) = 0.5 – A1 = 0.5 – 0.2794 = 0.2206 Buna göre, 2600 $’ın altında kazanma olasılığı, %22’dir. 2600 $’ın üzerinde kazanma olasılığını bulabilmek için ise, A1 alanı ile 0.5’i toplamamız gerekir. p(x>2600) = 0.5 + A1 = 0.5 + 0.2794 = 0.7794 2600 $’ın üzerinde kazanma olasılığı %78’dir. Bir sınıftaki 60 öğrencinin boy ortalaması 173 cm, standart sapması ise 7.5 cm olarak hesaplanmıştır. 170 ile 175 cm arasında kaç öğrenci vardır. A2 A1 170 173 175 170 ile 175 cm arasında boya sahip öğrencilerin yüzdesi, A1 ve A2 alanlarının toplamıdır. Önce A1 alanını hesaplarsak; 170-173 z= = -0.4 A1 = z tablo = 0.1554 7.5 A2 A1 170 173 175 Şimdi de A2 alanını hesaplarsak: 175-173 z= 7.5 z= 0.27=0.1026 A2 = z tablo = 0.1064, p(170 < x < 175) = A1 + A2 = = 0.1554 + 0.1064 = 0.2618 170 ile 175 A2 cm arasındaki öğrencilerin A1 oranı %26.18’dir. Bu aralıktaki öğrenci sayısı 170 173 175 ise: n(170 < x < 175) = 0.2618 (60) ≈ 16 öğrenci İstatistik sınavına giren 120 öğrencinin not ortalaması 100 üzerinden 75, standart sapması 20’dir. Geçme notu 60 olduğuna göre, kaç öğrenci başarılı olmuştur? A1 60 75 Başarılı öğrenci oranı A1 ve ortalamanın sağ tarafında 0.5’in toplamı kadardır. 60-75 z= = -0.75, A1 = z tablo = 0.2734 20 P(x>60) = A1 + A1 0.5 = 0.2734 + 0.5 = 0.7734 Başarılı öğrenci oranı %77’dir. 60 75 n(x > 60) = 0.7734 (120) ≈ 93 öğrenci (başarılı öğrenci sayısı) Bir öğrencinin, en başarılı %10 arasında yer alabilmesi için en az kaç alması gerekir? En başarılı %10’luk dilimin en düşük notu x’tir. x’i bulabilmek için farklı bir yol izlememiz gerekir. A1 0.10 75 x Bu kez alan bellidir: %10. Daha önce z değerini hesaplayıp, z tablosundan buna karşılık gelen alanı buluyorduk. Şimdi 0.1 alanını bulup, bunu sağlayan ztablo değerini tespit edeceğiz. A1 0.10 75 x 0.1’e en yakın alan 0.0987’dir. Bu alana karşılık gelen z değeri ise 0.25’tir. 0.25 = (x – 75)/20 = x = 80 En başarılı %10 öğrenci arasında yer almak isteyen bir öğrenci en az 80 almalıdır. A1 0.10 75 x OrtaAandolu’da buğday yetiştiren işletmelerin yıllık buğday satış miktarı ortalama 2000 kg kadardır. Satış miktarının standart sapması 250 kg dır. Söz konusu bölgeden seçilen 49 işletmenin ortalama buğday satışı 2100 kg bulunmuş olsun? 49 işletmelik örneğin , söz konusu populasyona dahil olma ihtimali nedir? Başka bir ifade ile örneğimizin populasyondan rastgele seçilmiş olma ihtimali nedir? • Önemli not: (Örnek ortalamasının ortalaması, popülasyon ortalamasına eşittir.) (Örnek ortalamasının standart hatası, popülasyon standart hatasının, “örneğe seçilen” bölünmesiyle bulunur. Z tablo’da 2.80 e tekabül eden alan 0.4974 olduğundan ; 0.50-0.4974=0.026=%0.26 elde edilir. Buna göre ortalamanın sağ tarafında bizim örneğimiz kadar ve daha fazla sapma gösteren örneklerin %0.26 kadar olduğudur. Sonuç olarak bu 49 işletmenin popülasyonu temsil ettiğini göstermeye yeterli değildir. Ödev: Ege bölgesinde süt sığırcılığı yetiştiriciliği işletmelerin yıllık yıllık süt üretim miktarı ortalama 6000 kg kadardır. Üretim miktarının miktarının standart sapması 800 kg dır. Söz konusu bölgeden seçilen 50 işletmenin ortalama süt üretimi 6187 kg bulunmuş olsun? 50 işletmelik örneğin , söz konusu populasyona dahil olma ihtimali nedir? Başka bir ifade ile örneğimizin populasyondan rastgele seçilmiş olma ihtimali nedir?