bilişim teknolojileri için işletme istatistiği - SABİS

advertisement
SAKARYAÜNİVERSİTESİ
BİLİŞİMTEKNOLOJİLERİ
İÇİNİŞLETME
İSTATİSTİĞİ
Hafta8
Yrd. Doç. Dr. Halil İbrahim CEBECİ Bu ders içeriğinin basım, yayım ve satış hakları Sakarya Üniversitesi’ne aittir. "Uzaktan Öğretim" tekniğine uygun olarak
hazırlanan bu ders içeriğinin bütün hakları saklıdır. İlgili kuruluştan izin almadan ders içeriğinin tümü ya da bölümleri
mekanik, elektronik, fotokopi, manyetik kayıt veya başka şekillerde çoğaltılamaz, basılamaz ve dağıtılamaz.
Her hakkı saklıdır © 2013 Sakarya Üniversitesi
0
BÖLÜM 4 OLASILIK BÖLÜMÜN AMACI Bu bölümün amacı en önemli istatistiksel dağılım olan normal dağılım ile ilgili temel bilgileri öğrenmek, normal olasılıkların hesaplanıp yorumlanmasını karyabilmektir. Normal Dağılım Bütün olasılık dağılımları arasında en önemlisi “Normal Dağılım”dır. Pratikte bütün veri setlerinin örneklem boyutu büyüdüğünde normal dağılıma yakınsadıkları farz edilir. Normal dağılımın iki parametresi ortalama ( ) ve standart sapma ( ) şeklindedir. Normal rassal değişken için olasılık yoğunluk fonksiyonu aşağıdaki gibidir. = 2.71828 = 3.14159 = Ana kütle ortalaması = Ana kütle standart sapması =   Normal dağılım çan şeklindedir. Bu yüzden literatürde zaman zaman çan eğrisi olarak da adlandırılırlar. (Bell shaped veya Gaussian) Ayrıca normal dağılım simetrik bir dağılımdır. Bu nedenle normal dağılımın ortalama, medyan ve mod değerleri birbirine eşittir. Sürekli bir rassal değişken olduğundan teorik olarak herhangi bir değeri alabilir. Sürekli rassal değişkenlerin büyük bir kısmı normal dağılıma uyarlar. Olasılık hesabı oldukça kolay ve rahatlıkla anlaşılabilirdir. Günümüz işletmelerinden, eğitim kurumlarına, bankalarda fabrikalara kadar bir çok oluşumda karar verme süreçlerinin temelini normal dağılım oluşturur. Nomal dağılımın kümülatif olasılık fonksiyonu aşağıdaki gibidir. 1
Normal dağılım kümülatif olasılık fonksiyonundaki olasılıkları bulmak aşağıdaki şekilde gerçekleştirilir. Şekildende anlaşılacağı üzere bir değerden küçük olunması olasılığı direkt olarak olasılık yoğunluk fonksiyonundaki alanların hesabı ile ortaya çıkar. Ama iki değer arasındaki alanı bulabilmek için öncelikle büyük olan değer için kümülatif olasılık hesaplanıp, diğer olasılık hesaplandıktan sonra bu değerden çıkarılır. Normal dağılım hesaplarının daha kolayca yapılabilmesi adına, normal rassal değişken standartlaştırılır. Bu şekilde yapılan basit dönüşün ile hesaplanan standart normal rassal değişken değeri yardımıyla olasılıklar kolayca hesaplanabilir. Buradaki Z değeri aşağıdaki dönüşüm formülü ile hesaplanabilir. 2
120 değeri için Eğer bir değişkeni 100 ortalama ve 10 standart sapma ile normal dağılıyorsa, standart normal rassal değişken değeri aşağıdaki gibi hesaplanır. 120
100
10
Bu değerin manası 2.0 120 değeri ortalamadan 2 standart sapma kadar sapmıştır. Unutulmamalıdır ki standart rassal değişken ile normal rassal değişkenin şekilleri tamamen aynıdır. Rassal değişken standartlaştırıldıktan sonra normal dağılım tabloları yardımıyla olasılık değerleri kolayca okunabilir. Normal dağılım tabloları yarım (%50) ve tam (%100) olarak ikiye ayrılır. Bu ders boyunca bir yarım tablolaro kullanmaktan ve okumaktan bahsedeceğiz. Olasılıkların belirlenmesinde karşımıza çıkabilecek durumlar aşağıdaki gibidir. 1.
2.
3.
4.
5.
0 : Bu durumda normal dağılım tablosundan okunan değere 0,500 eklenerek (Normal dağılım tablosu sadece sağ taraflı yani yarım ise) olasılık hesaplanır. 0 : Bu olasılık ise hesaplanan tablo değerinin 0,500 değerinden çıkarılması ile bulunur. 0 Simetriklik özelliğinden dolayı negatif a dan küçük olmak pozitif a dan büyük olmaya eşit olacağından olasılık ikinci durumdaki gibi hesaplanır. 0 : Simetriklik özelliğinden dolayı negatif a dan büyük olmak pozitif a dan küçük olmaya eşit olacağından olasılık birinci durumdaki gibi hesaplanır. olasılığı hesaplanıp bu değerden : Bu olasılık hesaplanırken olasılığı çıkarılır. Hesaplamalar negatiflik be pozitiflik durumlarına göre ilk 4 şıktaki gibi gerçekleştirilir. 3
ÖRNEK 1,52 olasılığını hesaplayınız. ÇÖZÜM 1,52 değerini belirlememiz gerekmektedir. Normal dağılım tablolarında satırlar değerinin tamsayı ve ilk ondalıklı basamağını verirken, sütunlar ikinci ondalıklı basamağını verir. Yani tablodaki 1,5 satırının 0,02 sütunu ile kesiştiği değer 1,5 0,02 1,52 değerinin olasılığını verir. Bulunan 0,4357 olasılık değeri ile 0,500 toplandığında 0,9357 değeri 1,52 olasılığını verir. Bu değerleri normal dağılım grafiği üzerinde tekrar inceleyelim. 4
ÖRNEK 1,37 olasılığını hesaplayınız. ÇÖZÜM 1,37 değeri normal dağılım tablosundan aşağıdaki gibi okunur. Bulunan 0,4147 olasılık değeri ile 0,500 den çıkarılır. Elde edilen 0,0853 değeri 1,37 olasılığını verir. Bu değerleri normal dağılım grafiği üzerinde tekrar inceleyelim. 5
ÖRNEK 1,23 olasılığını hesaplayınız. ÇÖZÜM 1,23 değeri normal dağılım tablosundan aşağıdaki gibi okunur. Bulunan 0,3907 olasılık değeri ile 0,500 den çıkarılır. Elde edilen 0,1093 değeri 1,23
1,23 olasılığını verir. Bu değerleri normal dağılım grafiği üzerinde tekrar inceleyelim. 6
ÖRNEK 0,9
1,30 olasılığını hesaplayınız. ÇÖZÜM 0,9 ve 1,30 değerleri normal dağılım tablosundan aşağıdaki gibi okunur. Bulunan 0,3907 olasılık değeri ile 0,500 den çıkarılır. Elde edilen 0,1093 değeri 1,23
1,23 olasılığını verir. Bu değerleri normal dağılım grafiği üzerinde tekrar inceleyelim. 7
ÖRNEK Bir bilgisayarın montajlanması işi 50 dakika ortalamalı ve 10 dakika standart sapmalı normal dağılıma uymaktadır. Herhangi bir bilgisayarın 45 ila 60 dakika arasında monte edilmesi ihtimali nedir? ÇÖZÜM Problemin cebirsel olarak ifadesi ? şeklindedir. Bu olasılığı hesaplamak için öncelikle Z dönüşümlerinin yapılması gerekmektedir. 45
50
45
10
0,5
Gerekli dönüşümler tamamlandıktan sonra tablodan gerektiğini belirlemiş oluyoruz. 60 60 50
10
1 0,50 ve 1,00 olasılıklarını okumamız 8
– .5
1 olasılığını iki parçaya ayırarak hesaplayabiliriz. – .5
0 0
1 0
.5 Normal dağılımın simetrik olduğu göz önüne alınırsa: – .5
0 Hesaplanması gereken olasılık aşağıdaki şekildedir. – .5
– .5
1 1
0
0,1915
.5 0,3413
0
1 0,5328
Excel yardımıyla Normal dağılım hesaplarını yapmak oldukça kolaydır. 9
EXCEL Excelde normal dağılıma uyan rassal değişkenin olasılıkları “NORM.DAĞ” fonksiyonu yardımıyla hesaplanabilir. NORM.DAĞ fonksiyonu yapısı aşağıdaki gibidir. NORM.DAĞ(x,ortalama,standart_sapma,kümülatif) X: Dağılımını bulmak istediğiniz değerdir ( ). Ortalama: Dağılımın aritmetik ortalamasıdır ( ). Standart_sapma: Dağılımın standart sapmasıdır ( ). Kümülatif: Kümülatif olarak olasılıklar hesaplanmak isteniyorsa “DOĞRU” ifadesi formül içerisine yerleştirilmelidir. Aksi halde “YANLIŞ” ifadesi kullanılmalıdır. Önceki örnekteki soruyu çözebilmek adına X, ortalama ve standart sapma değerleri aşağıdaki gibi ekrana girilmelidir. 10
Excel programı ile olasılık yoğunluk fonksiyonları değerleri tam tablodan okunmuş gibi verilir. Yani olasılıkların 0,500 den büyük çıkması beklenen bir durumdur. 45
60
60
45
0,8413
0,3085
0,5328 Soruda standart normal değişkeni değilde, Normal rassal değişkeni kullandığımıza dikkat edelim. Eğer işlemlerimizi standart normal değişken ile yapmak istiyorsak o zaman “NORM.S.DAĞ” fonksiyonunu kullanmalıyız. NORM.S.DAĞ fonksiyonu yapısı aşağıdaki gibidir. NORM.S.DAĞ(z,kümülatif) Z: Dağılımını bulmak istediğiniz standart normal rassal değişken değeridir ( ). Kümülatif: Kümülatif olarak olasılıklar hesaplanmak isteniyorsa “DOĞRU” ifadesi formül içerisine yerleştirilmelidir. Aksi halde “YANLIŞ” ifadesi kullanılmalıdır. Soruyu bir kezde NORM.S.DAĞ fonksiyonu yardımı ile çözelim. Bu durumda 0,50 ve değerlerini bulmalıyız. Bu iki değer için fonksiyon giriş ekranı aşağıdaki gibi olmalıdır. 1,00 Yukarıdanda görüleceği üzere olasılık değerleri tamamen aynı çıkmıştır. Sorunun cevabı da aşağıdaki olasılık değerinin hesabından tamamen aynıdır. 0,50
1,00
1,00
0,50
0,8413
0,3085
0,5328 11
Bazı durumlarda ise istenen bir olasılık değerine karşılık gelebilecek değerlerini belirlemek gerekebilir. Örneğin bir firma ürettiği bütün ürünlerin % 95 ‘ini altına alan ağırlık değerini bilmek isteyebilir. Bu tip hesaplarda istenen olasılık değeri (veya en yakın değer) tabloda aranır ve bulunan değerinden değerine doğru geri dönüşüm gerçekleştirilir. ÖRNEK değişkeninin 8 ortalama ve 5 standart sapma ile normal dağıldığını varsayalım. Bütün değerlerin %20 sinin altında olduğu değerini belirleyin? ÇÖZÜM Öncelikle %20 olasılık değerine karşılık gelen Z değerini normal dağılım tablosundan bulmamız gerekmektedir. Bu değer ortalamanın sol tarafında yer alır ve aslında negatif bir Z değeridir. Bu yüzden bu değeri tablodan okuyabilmek adına simetrisindeki değerin belirlenmesi gerekmektedir. 0,20
0,80
0,500
0,30 Yukarıdaki denklemden de anlaşılacağı üzere bakmamız geren değer 0,30 değeridir. Tablodanda görüleceği üzere %30 değerine en yakın değer 0,2995 tir. Bu değer ise 0,84 anındaki olasılıktır. Ama Z değerinin negatif olması gerektiğini sorunun başında vurgulamıştık. O zaman 0,84 değerini standart dönüşüm formülünde yazarak değerini çekelim. →
Yani bütün değerlerin %20 si 0,84
8
5
→
3,80 3,80 değerinin altında yer alır. 12
ÖZET Teoride sürekli rassal değişkenlerin tamamına yakını normal dağılmaktadır. Bu bağlamda normal dağılımın öğrenilmesi istatistik biliminin iyi kavranabilmesi adına önem arz etmektedir. Normal dağılımlar iki parametreli (ortalama ve standart sapma) olasılık dağılımlarıdır. Kümülatif yoğunluk olasılıklarının daha kolay bulunabilmesi adına normal rassal değişkenler, standart rassal değişkenlere döndürülerek hesapmalama yapılabilir. Standart rassal değişkene ait olasılık değerleri ise istatistik tablolarında okunabilir. SON NOT  Pratikte sürekli rassal değişkenlerin çoğu normal dağılsa da, bazı durumlarda üstel ve düzgün dağılıma uygun verilerin olduğu da göz ardı edilmemelidir.  Sürekli değişkenler büyük örneklemlerde normale yakınsarlar. Aksi halde normal dağıldığını söylemek doğru olmaz. ÇALIŞMA SORULARI S1 – Bir eksoz firması 30 dakikadan daha fazla sürede değişim yapılması durumunda bu işlemden ücret alınmayacağını reklamlarla duyurmuştur. Değişim süresinin 25 dakika ortalama ve 2,5 dakika standart sapma ile normal dağıldığı farz edilirse; a. Müşterilerin ücret ödemeden eksoz taktırma ihtimali nedir? b. Montajın 22 ila 26 dakika arasında olması ihtimali nedir? c. Firma geri ödeme yapılacak müşterilerin %1 aşmamasını istiyorsa reklamlardaki 30 dakika değerini nasıl güncellemelidir. S2 – Amerika’daki beysbol maçlarının yaklaşık olarak ortalama 156 ve 34 dakika standart sapma değeri ile normal dağıldığı gözlemlenmiştir. a. Bir maçın 3 saatten fazla sürme ihtimalini bulunuz? b. Maçların % kaçı 2 ila 3 saat arasında biter? c. Herhangi bir maçın 1,5 saatten önce bitmesi ihtimali nedir? S3 – İstanbul menkul kıymetler borsasındaki hisse senetlerinin ortalama değerlerinin 30 TL ve standart sapmalarının 8,2 TL olduğu bilinmektedir. Hisse senedi fiyatlarının normal dağıldığı farz edilirse; a. Bir firmanın hisse senedi fiyatının 40 TL den fazla olması ihtimali nedir? b. Herhangi bir firmanın hisse senedi değerinin 20 dolardan fazla olmaması ihtimali nedir? c. Bir firmanın hisse senedi değeri açısından ilk %10 luk dilimde olması için, hisse senedi fiyatı ne olması gereklemektedir? 13
KAYNAKLAR 1.
2.
3.
4.
Keller, Gerald; Statistics for Management and Economics, 9e, 2012 McClave, J.T, Benson, P.G, Sincich, T.; Statistics for Business and Economics, 11e, 2011 Sharpe N.R., De Veaux R.D., Velleman P.F.; Business Statistics 2e, 2012 Microsoft Excel 2010 yardım menüleri 14
Download