Bölüm 5 Logaritmik Normal Dağılım / Lognormal Dağılım Bir X rasgele değişkenine ilişkin lnX olasılık dağılımı normal ise, X’ in olasılık dağılımı logaritmik normal dağılım ya da kısaca lognormal dağılım terimiyle adlandırılır. Bu durum için olasılık yoğunluk fonksiyonu şöyledir; f (x) 1 ln x 2 1 exp 2x 2 Dağılımın parametreleri λ ve ζ, sırasıyla, lnX in ortalama değerini ve standart sapmasını belirtir; λ=E(lnX) ve ζ=[Var(lnX)]1/2 . Normal dağılım ile –bir logaritmik dönüşümü içeren- ilişkisi nedeniyle bir lognormal değişkene ilişkin olasılıklar, standart normal olasılıklar tablosu kullanılarak belirlenebilir. ln b ln a p(a X b) Z Z Lognormal değişkene ilişkin olasılıkların hesaplanması kolaydır. Ayrıca lognormal değişken daima pozitif değerler alır. Lognormal dağılımın kaykılması da her zaman pozitiftir. Bu nedenle uygulamada karşılaşılan –pozitif değerler alması kesin- malzeme mukavemetleri, metallerin yorulma ömrü, tasarımların tamamlanma süreleri, yağmur şiddetleri ve hava trafiği hacmi gibi pek çok sayıda rasgele değişken için lognormal dağılım model alınabilir. Yukarıdaki bağıntıdan görüleceği gibi olasılık, λ ve ζ parametrelerinin fonksiyonudur. Bu parametreler ile X değişkeninin ortalama değeri m ve standart sapması arasındaki ilişkileri belirten bağıntılar aşağıdaki şekilde türetilebilir; λ=lnm – ζ2 /2 ζ2=ln(1+2 / m2) = ln(1+V2) Varyasyon katsayısı V=/m , çok büyük değilse (V0.30), ln(1+2 / m2) 2 / m2 alınabilir. Bu gibi durumlarda; ζ/m=V 5-1 BAÜ Müh-Mim Fak. İstatistik Dersi Dr. Banu Yağcı Örnek; Beton çeliği üreten bir kuruluş, ürettiği nominal çapı 6 mm olan çelik toplumuna ilişkin çap (X) ortalamasını m=7mm ve standart sapmasını = 0.5 mm bulmuştur. Çap dağılımı lognormal olduğuna göre; (a) çapın 6 mm den küçük bulunması olasılığının ve (b) çelik toplumunun % 10 unun hangi çap değerinin altında kaldığının belirlenmesi istenmektedir. ζ2 =ln(1+(0.5)2 / (7)2) = 0.005089, ζ=0.071 λ = ln7 – 0.5(0.005089) = 1.943 ln 6 1.943 (a) P(X 6) P Z P( Z 2.13) 0.016586 0.071 ln x 0.10 1.943 (b) P Z 0.10 0.071 Standart normal dağılım tablosundan; 0.10 değeri yaklaşık olarak P(Z-1.28) olasılığına karşılık gelmektedir. Dolayısıyla; ln x 0.10 1.943 1.28 0.071 ln x 0.10 1.85212 x 0.10 6.37mm Bernouilli denemeleri ya da binom deneyleri ve binom dağılım; Kimi zaman mühendisleri, özellikle tasarım mühendislerini ilgilendiren sorunlar, tekrarlanan denemelerden oluşan bir dizideki potansiyel bir olayın ortaya çıkması ya da çıkmaması durumlarının göz önüne alınmasını gerektirir. Bir başka anlatımla tekrarlanan denemelerden oluşan bir deneyde, denemelerden her birinin yalnızca başarılı yada başarısız terimiyle nitelendirebileceğimiz iki sonucu olabilir. Örnekse, bir iş bandından gelen makine parçalarının ya da tüketim mallarının test edilmesi olgusunu ele alalım. Her yoklama ya da deneme ilgilenilen parçanın ya da malın kusurlu ya da kusursuz olduğunu belirler. Kimi zaman da iki sonuçtan birini başarılı, ötekini başarısız kabul edebileceğimiz durumlar bulunabilir. Örnekse, bir oyun kağıdı destesinden art arda beş kart çekilsin ve her deneme, seçilen kartın kırmızı yada siyah olmasına göre başarılı ya da başarısız olarak nitelendirilsin. Bir sonraki seçim yapılmadan önce çekilen her kart desteye katılır ve kartlar karıştırılırsa, iki deneyin özellikleri aynı, tekrarlanan denemeler istatistiksel bağımsız olur ve başarı olasılığı denemeden denemeye değişmez. Yukarıda belirtilen türden deneylere Bernouilli denemeleri ya da binom deneyleri denilir. Kart çekme deneyinde, yeni seçmelerden önce kartların -52 karttan oluşan- desteye katılmaması halinde, tekrarlanan denemelerdeki başarı olasılıkları değişir, sabit kalmaz. Daha açık anlatımla bu olguda, ilk çekişte kartın kırmızı gelmesi ihtimali 1/2 olur. Fakat ikinci çekişte, ilk çekilen kartın rengine bağlı koşullu olasılığın değeri 26/51 ya da 25/51 olur. Böyle bir deney ise Bernouilli denemesi ya da binom deneyi sayılamaz. 5-2 BAÜ Müh-Mim Fak. İstatistik Dersi Dr. Banu Yağcı Bernouilli denemeleri ya da binom deneyleri şu kabuller temel alınarak gerçekleştirilir; Deney n sayıda tekrarlanan denemeden oluşur. Her denemenin yalnızca iki olabilir sonucu vardır: bir olayın ortaya çıkması ya da çıkmaması. Başka bir anlatımla her deneme başarılı ya da başarısız terimiyle nitelendirilebilecek bir sonuçla sona erer. Her denemede olayın ortaya çıkma olasılığı sabittir. Başka bir anlatımla p ile gösterilen başarı olasılığı denemeden denemeye değişmez. Tekrarlanan denemeler istatistiksel yönden birbirinden bağımsızdır. Binom dağılımı; Bir üretim sürecinden rasgele 3 parçanın seçilmesi, yoklanması ve kusurlu ya da kusursuz olarak sınıflandırılmasıyla ilgili bir binom deneyini ele alalım. Kusursuz (Z) parçaya başarı, kusurlu (K) parçaya başarısız diyelim. Başarıların sayısını belirten X rasgele değişkeni sıfırdan üçe kadar olan tamsayıları değer alır. Olabilir 8 sonuç ve X in bu sonuçlara ilişkin değerleri aşağıda verilmiştir. Sonuç KKK KZK KKZ ZKK KZZ ZKZ ZZK ZZZ x 0 1 1 1 2 2 2 3 Parçalar, %75 i kusursuz kabul edilen bir üretim sürecinden, bağımsız seçilirse, örnekse; P(ZKZ) = P(Z).P(K).P(Z) = (3/4).(1/4).(3/4) = 9/64 bulunur. Olabilir öteki sonuçların olasılıkları da benzer yolla bulunabilir. X in böylece elde edilen olasılık dağılımı aşağıda verilmiştir. x p(x) 0 1 2 3 1/64 9/64 27/64 27/64 Bir binom deneyinin n denemesindeki başarıların sayısını belirten X e binom rasgele değişkeni denir. Bir X binom değişkeninin olasılık dağılımı da binom dağılımı terimiyle adlandırılır. Binom dağılımının değerleri deneme sayısına ve ilgili denemenin başarı olasılığına bağlı olduğu için b(x;n,p) notasyonu ile belirtilebilir. Mesela yukarıdaki örnek için kusursuz parçaların sayısına göre P(X=2) = b[2; 3, (3/4)] = 27/64 olur. 5-3 BAÜ Müh-Mim Fak. İstatistik Dersi Dr. Banu Yağcı Yukarıdaki betimleme genelleştirilir ve b(x;n, p) için bir bağıntı geliştirilir ise; Bu bağlamda, bir binom deneme p olasılıklı bir başarı ve q=1-p olasılıklı bir başarısızlıkla sonuçlanıyorsa, n bağımsız denemedeki başarıları gösteren X binom rasgele değişkeninin olasılık kütle fonksiyonu ya da kısaca olasılık dağılımı şöyle olur. n P(X x ) b( x; n, p) p x (1 p) nx x x=0,1,2,3,….,n Bir başka anlatımla, bir olayın her denemede ortaya çıkması olasılığı p ve çıkmaması olasılığı 1-p ise, bir Bernouilli denemesine ilişkin n deneme arasından tam olarak x ortaya çıkışın olasılığı yukarıdaki bağıntı ile belirlenir. Bağıntıdaki n ve p dağılımın parametreleridir. Yukarıdaki, kusursuz parça sayısı olasılık dağılımı ile ilgili örnekte n=3 ve p=3/4 parametre değerleri için kusursuz parçaların sayısını belirten X in olasılık dağılımı şöyle belirlenebilir; 3 P(X x ) b[ x;3, (3 / 4)] (3 / 4) x (1 / 4)3x x 3 Örnekse; P(X 2) b[2;3, (3 / 4)] (3 / 4) 2 (1 / 4) 27 / 64 2 Binom dağılımının ortalama değeri ve varyansı şöyledir; E(X) = m = np, Var(X) = 2 = npq Örnek; Belirli bir darbe denemesinde, bir malzemenin darbeye dayanma olasılığının 3/4 olduğu belirlenmiştir. Son dört malzemeden ikisinin darbe denemesine dayanabilme olasılığı ne olur? Denemelerin bağımsız olduğunu kabul edelim. Dört denemenin her biri için p=3/4 olur. 2 4 4! 3 Öyleyse, P(X 2) b[2;4, (3 / 4)] (3 / 4) 2 (1 / 4) 2 4 27 / 128 2 2!2! 4 Örnek; Bir karayolu yapımında beş greyderin kullanılması tasarlanmaktadır. Bu ekipmanın çalışma ömrü (T, saat) lognormal dağılımlı olup ortalama ömür 1500 saat ve varyasyon katsayısı %30 dur. Kullanılacak bu beş makine arasından iki tanesinin 900 saat çalışma süresinden önce işlevini yapamama olasılığı ne olur? f(t) Çalışma ömrü, saat lognormal m=1500 saat V=0.30 900 0.0594 900 Çalışır durumda olma ömrü, saat t Şekil a 5-4 BAÜ Müh-Mim Fak. 1 2 3 4 Makine no 5 Şekil b İstatistik Dersi Dr. Banu Yağcı Her greyder 900 saat çalışma süresinden sonra işlevini yapma ya da yapamama durumunda olabilir. Bu zaman dilimi içinde işlev yapamama olasılığı şöyle belirlenebilir; ζ 0.30, λ= ln1500 – (1/2)(0.3)2 = 7.27 O halde, bir makinenin 900 saatlik süre içinde işlevini yapamama olasılığı; P= P(T900) = P[Z (ln900- 7.27)/0.30] = P(Z-1.56) = 0.0594 (Şekil a) Beş makinenin fiili çalışma ömürleri Şekil b’ deki gibi gösterilebilir. Bu, şekilde betimlendiği gibi, örnekse 1 ve 4 numaralı makinelere ilişkin çalışma ömürlerinin 900 saatten az olması demektir. Şu halde, beş makine arasından herhangi ikisinin 900 saatlik zaman dilimi içinde işlevini yapamama olasılığı; 5 5! 2 3 P(X 2) b[2;5,0.0594] (0.0594) 2 (0.9406) 3 0.0594 (0.9406) 0.0294 2 2!3! Diğer yandan; p+q=1 olduğu için n b( x; n , p) 1 olur. Bu da herhangi bir olasılık x 0 dağılımının geçerli olma koşuludur. Çoğu zaman da, P(X<r) ya da P(a Xb) değerlerinin belirlenmesi sorunuyla ilgileniriz. Bu gibi sorunların çözümünü kolaylaştırmak için B(r; n,p) = r b(x; n, p) binom toplamını veren x 0 tablolar düzenlenmiştir. Aşağıdaki binom tablosu örnek büyüklükleri n=5, 10,15 ve 20 alınmış ve p değerleri 0.10 ile 0.90 arasında değiştirilmiştir. Tablonun kullanılışı aşağıdaki örnekte gösterilmiştir. Örnek ; Bir elektronik cihazın az rastlanan bir arızasının onarılma olasılığı 0.40 dır. 15 cihazın bu arızayı yapacağı biliniyorsa; (a) en az 10 cihazın, (b) 3 ila 8 cihazın (c) tam beş cihazın onarılma olasılığı ne olur? Onarılabilen cihaz sayısı X olsun 9 (a) P(X 10) 1 P(X 10) 1 b( x;15,0.4) 1 0.9662 0.0338 x 0 8 8 2 x 3 x 0 x 0 (b) P(3 X 8) b( x;15,0.4) b( x;15,0.4) b( x;15,0.4) 0.9050 0.0271 0.8779 5 4 x 0 x 0 (c) P(X 5) b( x;15,0.4) b( x;15,0.4) b( x;15,0.4) 0.4032 0.2173 0.1859 5-5 BAÜ Müh-Mim Fak. İstatistik Dersi Dr. Banu Yağcı 5-6 BAÜ Müh-Mim Fak. İstatistik Dersi Dr. Banu Yağcı Poisson deneyleri ve Poisson dağılımı Mühendisleri ilgilendiren fıziksel problemlerin çoğu, olayların herhangi bir anda ve/veya uzayın (mekân) herhangi bir noktasında olabilir ortaya çıkışlarını içerir. Örnekse, kaynakli bir yapısal sistemde yorulma çatlakları, sürekli bir kaynak boyunca herhangi bir yerde oluşabilir; sismik yönden faâl bir bölgenin herhangi bir yerinde, herhangi bir zamanda deprem olabilir; belirli bir karayolundaki trafik kazaları, herhangi bir zamanda ortaya çıkabilir. Bu tür zaman-uzay problemlerinin çözümünde Bernouilli deneyleri model alınabilir. Bu amaçla "zaman" küçük aralıklara bölünür, ya da "uzay" küçük bölümlere -bölgelere ayrılır. İlgilenilen olayın herbir aralıkta ya da bölgede ortaya çıktığı ya da çıkmadığı; başka bir anlatımla, başarı ya da başarısızlık terimleriyle nitelendirebileceğimiz iki olabilirlikten birinin gerçekleştiği kabul edilir, ve böylece bir deney oluşturulur. Ne var ki, herhangi bir anda ya da uzayın herhangi bir noktasında ortaya çıkabilen ilgilendiğimiz olayın, belirli bir zaman diliminde ya da belirli bir uzay bölümünde birden fazla gözükmesi de muhtemeldir. Bu gibi olgularda, ilgilenilen olaym ortaya çıkışları (başarılı görünüşler) için Poisson deneylerinin ya da Poisson sürecinin model alınması daha elverişli olur. Poisson deneyleri: Bu bağlamda, belirli bir zaman aralığı ya da belirli bir bölge içindeki başarılı görünüşlerin sayısıyla ilgili olan, ve bir X, rasgele değişkeninin sayısal değerlerinin elde edilmesini sağlayan deneylere Poisson deneyleri ya da Poisson süreci denir; t, zaman aralığı ya da bölge büyüklüğüdür. Belirli zaman aralığı herhangi bir uzunlukta olabilir; bir dakika, bir gün, bir ay, ya da bir yıl gibi. X, rasgele değişkeni, örnekse; yağmur ve kar yüzünden bir yıl içinde bir şantiyede çalışılamayan günlerin sayısını, ya da bir iş yerinde bir saat içinde edilen telefonların sayısını gösterebilir. Belirli bir bölge de bir doğru parçası, bir alan, bir hacim, ya da bir malzeme bölümü olabilir. Bu durum için X, rasgele değişkeni; belirli bir arazi parçasındaki belirli türden hayvanların sayısını, belirli bir kültürdeki bakterilerin sayısını, ya da her sayfadaki daktilo hatalarının sayısını gösterebilir. Poisson deneyleri şu temel kabullere göre gerçekleştirilir: 1. Bir olay herhangi bir zamanda ya da uzayın herhangi bir noktasında oluşabilir. 2. Belirli bir zaman aralığında ya da belirli bir uzay bölümünde gözüken başarıların sayısı, sözkonusu aralıkla ya da bölgeyle örtüşmeyen herhangi bir aralıkta ya da bölgede gözüken başarılardan bağımsızdır. 3. Çok kısa bir zaman aralığı süresince ya da küçük bir bölgede bir tek başarının gözükmesi olasılığı, aralığın uzunluğuyla ya da bölgenin büyüklüğüyle orantılıdır; sözkonusu aralığın ya da bölgenin dışında kalan başarıl arın sayısından bağımsızdır. Başka bir anlatımla, anılan aralık uzunluğıı ya da bölge büyüklüğü ∆t ile gösterilirse, bir olayın ∆t içinde ortaya çıkma olasılığı v∆t ile belirlenebilir. Burada, v olayın sabit kabul edilebilecek “ortaya çıkış ortalama hızı”dır. 4. Birden fazla başarının böyle küçük bir zaman aralığında gözükmesi ya da böyle bir küçük bir bölgeye isabet etmesi ihmal edilebilir. 5-7 BAÜ Müh-Mim Fak. İstatistik Dersi Dr. Banu Yağcı Bir Poisson deneyinde, t zaman aralığı ya da bölge büyüklüğü içindeki ortaya çıkışların sayısını gösteren Xt e Poisson rasgele değişkeni, ve değişkenin olasılık dağılımı Poisson dağılımı terimleriyle adlandırılır. Poisson dağılımının değerleri, öngörülen zaman aralığında ya da belirli bölge içinde gözüken başarıların ortalama sayısına, E(Xt)= vt, bağlı olduğu için dağılım p(x; vt) simgesiyle gösterilebilir. Poisson dağılımını veren bağıntı, yukarıda belirtilen kabuller esas alınarak türetilmiştir; Öngörülen bir zaman aralığında ya da belirli bir bölge içinde gözüken başarıların sayısını gösteren Xt Poisson rasgele değişkeninin olasılık dağılımı şöyledir; P(X t x ) p( x; vt) ( vt) x vt e x! x=0,1,2,3,… v, ortaya çıkış ortalama hızı; olayın, birim zaman aralığında yada birim bölge içinde ortalama ortaya çıkma sayısı vt; öngörülen zaman aralığında ya da belirli bir bölgede gözüken başarıların ortalama sayısı Poisson dağılımının hem ortalama değeri hem de varyansı vt ye eşittir. E(X)=vt, Var(X)=vt vt nin 0.1 den 18 e dek kimi değerleri için poisson olasılık toplamları aşağıdaki tabloda görülmektedir. Örnek; Bir laboratuar deneyinde, bir sayıcıdan bir milisaniye içinde geçen radyo aktif parçacıkların ortalama sayısı 4 tür. Belirli bir milisaniyede 6 parçanın sayıcıya girme olasılığı ne olur? X=6 ve vt=4 için aşağıdaki tablo kullanılırsa; 6 5 x 0 x 0 P(X t 6) p(6;4) p( x;4) p( x;4) 0.8893 0.7851 0.1042 Örnek; Bir liman kentine her gün ortalama 10 petrol tankeri gelmekte ve limanda hareket serbestliği sağlanabilmesi için tanker sayısının günde 15’ i aşmaması istenmektedir. Belirli bir günde tankerlerin geriye çevrilme olasılığı ne olur? Her gün gelen tanker sayısı X olsun. Aşağıdaki poisson tablosu kullanılırsa; 15 P(X t 15) 1 P(X t 15) 1 p( x;10) 1 0.9513 0.0487 x 0 5-8 BAÜ Müh-Mim Fak. İstatistik Dersi Dr. Banu Yağcı 5-9 BAÜ Müh-Mim Fak. İstatistik Dersi Dr. Banu Yağcı Bernouilli denemeleri - Poisson süreci n→∞, p→0 ve np sabit olan bir binom dağılımının limiti Poisson dağılımı olur; b(x;n,p)→p(x; vt) Bu nedenle n büyük ve p sıfıra yakınsa, m=vt=np olan poisson dağılımı, yaklaşık binom olasılıklarının belirlenmesinde kullanılabilir. Örnek Cam eşyanın üretildiği belirli bir üretim sürecinde ortaya çıkan kusurlar ya da hava kabarcıkları, kimi zaman parçanın satılmasına engel olabilir. Üretilen her 1000 parçadan ortalama bir tanesinde bir ya da birden fazla hava kabarcığı bulunduğunu bildiğimizi varsayalım ve 8000 parçadan oluşan rastgele bir örnekteki kabarcıklı parça sayısının 7 den az olması ihtimalini belirleyelim. 5-10 BAÜ Müh-Mim Fak. İstatistik Dersi Dr. Banu Yağcı Aslında deney, n= 8000 ve p= 0.001 olan bir binom deneyidir. Ne var ki, p sıfıra çok yakındır ve n oldukça büyüktür. Bu bakımdan sorunun yaklaşık çözümü m=(8000).(0.001)=8 alınarak Poisson dağılımıyla yapılabilir. Şu halde, hava kabarcıklı parçaların sayısı X ile gösterilirse; 6 6 0 0 P(X 7) b( x;8000,0.001) p( x;8) 0.3134 (Poisson tablosundan) Üssel dağılım Önce de belirtildiği gibi mühendislikle ve bilimle ilgili olasılıksal sorunların çoğu normal dağılım kullanılarak çözülebilir. Ama buna karşın, değişik tip yoğunluk fonksiyonlarının model alınmasını gerektiren çok sayıda olgu da vardır. Bunlardan biri, üssel dağılımdır. Üssel dağılımın Poisson süreciyle ilişkisi vardır. İlişki şöyle açıklanabilir: İlgilenilen olay bir Poisson sürecinde ortaya çıkıyorsa, olayın ilk ortaya çıkışına dek geçen T1 zamanı üssel dağılımlı olur. T1>t, t zamanı içinde olayın gözükmemesi demek olduğundan Poisson bağıntısına göre P(T1 > t) = P(Xt = 0) = e-vt ; T1 bir Poisson sürecinde ilk ortaya çıkış zamanı. Ayrıca, bir Poisson sürecinde bir olayın örtüşmeyen zaman aralıkları içinde ortaya çıkışları istatistiksel bağımsız olduğu için T1, aynı zamanda, tekrarlanma zamanı ya da olayın iki ardışık gözüküşü arasında geçen zaman olur. T1 rasgele değişkeni olasılık fonksiyonu; FT1 (t ) P(T1 t ) 1 e vt Örnek Geçmişle ilgili kayıtlara göre bir kentte son 125 yıllık zaman dilimi içerisinde VI ya da daha fazla şiddette 16 deprem oluşmuştur. Kentin bulunduğu yörede oluşan yüksek-şiddette depremlerin bir Poisson süreci izlediğini kabul edelim ve bu tür depremlerin gelecekteki iki yıl içerisinde ortaya çıkması olasılığını belirleyelim. Her yıl için depremin ortaya çıkış ortalama hızı v=16 /125 = 0.128 dir. Dolayısıyla P(T12)=1-e-0.128(2) = 0.226 olur. Gelecekteki 10 yıl içinde anılan şiddette depremin oluşmaması olasılığı da; P(T1 > 10) = e-0.128(10) = 0.278 bulunur. Çeşitli zaman dilimleri için P(T1 t)=1-e-0.128 t bağıntısı ile belirlenen Olasılıklar yandaki şekilde gösterilmiştir. 5-11 BAÜ Müh-Mim Fak. İstatistik Dersi Dr. Banu Yağcı