12.12.2013 1 Girdi Analizi Prosedürü EME 3105 2 SİSTEM SİMÜLASYONU • Modellenecek sistemi (prosesi) dokümante et • Veri toplamak için bir plan geliştir • Veri topla • Verilerin grafiksel ve istatistiksel analizini yap • Olası dağılımları hipotez et Girdi Analizi-II Ders 9 • Dağılımların parametrelerini tahmin et • Hipotezlenen dağılımların uygunluğunu kontrol et • Simulasyon çıktıları üzerinde girdilerin duyarlılığını kontrol et Dağılıma Uyum Testleri Dağılıma Uyumun Kontrol Edilmesi 3 4 Dağılımının ne olduğunu bilmediğiniz bir ana kitleden (populasyon) alınan n birimlik örnekleminiz olduğunu varsayalım. Veri grubunun hipotezlenen bir dağılıma uyup uymadığını nasıl kontrol edebiliriz? • İyi uyum testleriyle • Grafiksel olarak olasılık çizelgeleriyle Uyum testleri, verilerin seçilen dağılıma ne kadar iyi uyduğunu gösterir. Verilerin uyumu, • 2 Ki-kare ( c ) • Kolmogorov Smirnov (Sadece Sürekli dağılımlar) • Anderson Darling testleriyle kontrol edilir. 1 (Kesikli ve Sürekli dağılımlar) (Sadece Sürekli dağılımlar) 12.12.2013 Hipotez Testinin Adımları Bir Hipotezin Testi •Belirli bir hipotez hakkında bir karara yol açan bir prosedürdür. 1. Problemin içeriğinden ilgili parametreyi tanımla. 2. Sıfır Hipotezini (H0 )ifade et. 3. Uygun bir alternatif hipotez (H1) belirt. •Hipotez testi prosedürü, kitleden alınan bir rasgele örneklemdeki bilginin kullanılmasına dayanır. • Eğer bu bilgi hipotezle tutarlı ise, hipotezin doğru olduğu sonucuna; eğer bu bilgi hipotez ile tutarlı değilse, hipotezin yanlış olduğu kararına varırız. 4. Bir anlam düzeyi (önem düzeyi) α seç. 5. Uygun bir test İstatistiği belirle. 6. İstatistik için red bölgesini belirle. 7. Herhangi bir gerekli örneklem miktarı hesapla, bunları test istatistiği için denklemde yerine koy ve bu değeri hesapla. 8. H0’ın reddedilip reddedilmeyeceğine karar ver ve problem bağlamında bunu rapor et. Hipotez Testlerinde I.Tip ve II.Tip Hatalar Ki-kare ( c ) İyi Uyum Testi 2 H0: Örneklem verileri hipotezlenen dağılıma uyar. H0 doğru olduğu halde reddedildiğinde I. Tip Hata yapılır. H1: Örneklem verileri hipotezlenen dağılıma uymaz. Test, Ki-kare dağılımına dayanır. • Gi, i. sınıf aralığında gözlenen frekans, • Bi, i. sınıf aralığında beklenen frekans olsun. H0 yanlış olduğu halde kabul edildiğinde II.Tip Hata yapılır. Test İstatistiği: k c 02 = å i =1 ca ,v 2 ( Gi - Bi ) 2 KARAR Bi H0 Kabul H0 Red H0 Doğru Doğru Karar I. Tip Hata H0 Yanlış II. Tip Hata Doğru Karar α=P(H0 red/H0 doğru)=P(I.Tip Hata) β=P(H0 kabul/H0 yanlış)=P(II. Tip Hata) ca ,v 2 2 12.12.2013 Örnek 1 Testing for Goodness of Fit Belli bir ebattaki metal levha üzerindeki hata sayılarının Poisson dağılımına uyup, uymadığını araştıralım. 60 birimlik rassal örneklem alınmış ve aşağıda verilen hata sayıları gözlenmiştir. Hata Sayısı Hipotezlenen λ=0.75 hata/levha parametreli Poisson dağılımından i. sınıf aralığıyla ilgili pi olasılıklarını aşağıdaki gibi hesaplayabiliriz. f (x) = P(X = x) = Gözlenen Frekans ** Bu örnekte, varsayılan Poisson dağılımının ortalaması bilinmemektedir, ve örneklem verisinden tahmin edilmelidir. E[X] = l = x = 0,1,2,... i i "i i "i 32.0 + 15.1 + 9.2 + 4.3 = = 0.75 60 Örnek 1 (devam) Beklenen frekansları hesaplamak için örneklem büyüklüğü n=60 ve pi olasılıkları çarpılır. Bi=n.pi Olasılık e- l l x x! åfx åf Example 9-12 Örnek 1 (devam) Hata Sayısı Örnek 1 (devam) Beklenen Frekans α=0.05 anlam düzeyi seçerek 8 adımlı hipotez testi prosedürünü uygulayalım: 1. İlgili değişken, levha üzerindeki hata sayısının dağılımının uyumudur. 0.472(60) 1. H0: Lavha üzerindeki hata sayısı Poisson dağılımına uyar. 2. H1: Levha üzerindeki hata sayısı Poisson dağılımına uymaz. 3. α=0.05 (veya daha fazla) Eğer beklenen frekans 5’ten küçükse, önceki sınıfla birleştir: Hata Sayısı (veya daha fazla) Gozlenen Frekans Beklenen Frekans 4. Test İstatistigi: Eğer H0 doğruysa, c k ( Gi - Bi )2 i =1 Bi c 02 = å 2 0 ‘nin, k-p-1 serbestlik dereceli ki-kare dağılımına uyduğu gösterilebilir p: Hipotez edilen dağılımın parametre sayısı, k: Sınıf sayısıdır. 3 12.12.2013 2 Normal Dağılıma Sahip Bir Kitlenin Varyans c = 3.84 0.05,1 ve Standart Sapması İçin Hipotez Testi Örnek 1 (devam) 2 6. Eger c 02 > c 0.05,1 = 3.84 ise H 0 red 7. Hesaplamalar: c 02 = ( 32 - 28.32 )2 + (15 - 21.24 )2 + (13 - 10.44 )2 = 2.94 28.32 21.24 10.44 8. Sonuclar: 2 c 02 = 2.94 < c 0.05,1 = 3.84 oldugu icin levha üzerindeki hata sayısının Poisson dagılımına uyduguna iliskin H 0 hipotezini reddecek yeterli istatistiksel kanıt yoktur. P-Değeri Yaklaşımı P-Değeri Yaklaşımı ca2 ,v H0’ı reddetme kriteri olarak α’nın kullanımı; H0’ın zayıf bir şekilde mi yoksa güçlü bir şekilde mi reddedildiğini söylemez. Bunu bilmek için P-Değeri yaklaşımını kullanırız: 2 c0 P değeri, verilen veriyle (H0) sıfır hipotezinin reddedilmesine yol açan en küçük anlam seviyesidir. ( ) ( c 2 Uyum testi icin) ( 32 - 28.32 )2 + (15 - 21.24 )2 + (13 - 10.44 )2 28.32 = 2.94 P Tanım P = P c 2 > c 02 c 02 = ( P= P c > 2 21.24 2 c 0 ) = P( c 10.44 2 = 2.94 2.94 Örnekte, 2 c0 = 2.94 dir ve bu, tablodaki 2,71 ve 3,84 değerleri arasındadır. Bu nedenle, P değeri, 0.05 ve 0.10 arasında olmalıdır. 0.05 < P < 0.10 4 ) > 2.94 = ? 12.12.2013 Ki-kare Uyum Testi (Devam) Örnek 1 (devam) Örnek 2: Eczane Servis Süreleri H0 Kabul 0 P=0.086 x 2,94 H0 Red Test kriteri: P degeri > a ise H 0'ı reddetme P degeri £ a ise H 0'ı reddet P( X <= x ) 0,913589 Örnek 2 (Devam) (Sınıflandırılmış Serinin Hazırlanması) k = n = 100 = 10 X max- X min 15.19 - 0.5 = = 1.469 » 1.5 k 10 S= 2.0’den az 2.0 - 3.5 3.5 - 5.0 5.0 - 6.5 6.5 - 8.0 8.0 - 9.5 9.5 - 11.0 11.0 -12.5 12.5 -14.0 14,0’ten çok Servis sürelerinin Üstel dağılıma uyup uymadığını Ki-kare Uyum testiyle kontrol edin. Sonuç: α=0.05<P=0.086 olduğundan H0 Kabul P değeri=1-0,913589 ≈ 0,086 Sınıflar Eczane örneginde müşterilere servis süreleri (dk.) rassal olarak gözlemlenmiş ve yanda verilen 100 örneklem verisi oluşturulmuştur. 1 Cumulative Distribution Function Chi-Square with 1 DF 4,65 1,18 13,04 0,77 2,11 1,83 4,9 7,23 3,52 4,44 1,2 1,09 1,19 2,59 1,39 2,47 0,77 1,29 1,74 5,86 3,24 2,53 3,09 2,01 6,13 2,45 1,23 7,35 5,5 1,63 0,89 4,67 2,05 0,5 8,59 0,94 1,25 3,14 4,63 1,59 0,92 0,97 10,68 6,82 1,45 0,98 1,19 2,03 1,62 5,02 1,15 4,61 8,3 3,88 0,87 2,4 1,44 1,78 3,06 3,65 6,64 1,45 2,29 2,86 2,26 4,86 3,12 2,9 15,19 3,36 2,5 2,72 11,3 4,26 6,6 3,03 9,23 2,05 1,49 9,11 Örnek 2 (Devam) (Üstel Dağılımdan Olasılık Hesabı) (k:sınıf sayısı) H 0 : Müsterilerin servis süreleri Üstel dagılıma uyar. (S: sınıf genisligi) H1 : Müsterilerin servis süreleri Üstel dagılıma uymaz. m = E[ X ] = E éë X ùû = 1/ l fi 37 28 15 6 6 4 1 1 1 1 1,02 0,98 6,25 3,26 3,1 4,48 4,29 7,93 1,29 1,48 1,8 1,58 4,07 3,84 6,18 2,67 1,75 1,72 2,34 3,23 n E[X] = 1 / l = 100 åx åx i i =1 n = i i =1 100 » 3.5 (dk) 1 l= » 0.285 3.5 *** b b a a P(a < X < b) = ò f (x)dx = ò l e- l x dx P(a < X < b) = F(b) - F(a) F(x) = 1- e- l x f (x) = l e- l x Sınıflardaki frekanslar belirlenirken alt Sınıf değeri dahil üst sınıf değeri hariç tutulur 5 x>0 F(b) = 1- e- lb ; F(a) = 1- e- l a 12.12.2013 Örnek 2 (Devam) Örnek 2 (Devam) (Beklenen Frekansların Belirlenmesi) (Test Prosedürü) 100 *0, 435 = 43,5 Sınıf F(x) P(a<X<b) Bi <2 0,435 0,435 43,5 2 - 3,5 0,632 0,197 19,7 3,5 - 5 0,76 0,128 12,8 5 - 6,5 0,844 0,084 8,4 6,5 - 8 0,898 0,054 5,4 8 - 9,5 0,934 0,036 3,6 9,5 - 11 0,957 0,023 2,3 11 - 12,5 0,972 0,015 1,5 12,5 - 14 0,982 0,01 1 >14 1 0,018 1,8 F(2) = 1- e-(0,285)2 » 0, 435 Beklenen frekans 5’ten küçük sınıflar, önceki sınıfla birleştir 1. ilgilenilen degisken müsterilerin servis süreleridir. Sınıf Gi Bi <2 37 43,5 2 - 3,5 28 19,7 3,5 - 5 15 12,8 5 - 6,5 6 8,4 6,5 - 8 6 5,4 >8 8 10,2 2. H 0 :Servis süreleri l =0,285 olay/dk. olan Üstel dagılıma uyar. 3. H1: Servis süreleri l =0,285 olay/dk. olan Üstel dagılıma uymaz. 4. a =0,01 5. Test istatistigi: ; F(3,5) = 1- e-(0,285 )3,5 » 0,632 P(2 < X < 3,5) = F(3,5) - F(2) = 0,632 - 0, 435 = 0,197 Normal Dağılıma Sahip Bir Kitlenin Varyans 2 Testi ve Standart Sapması İçin Hipotez c 0.01,4 = 13.28 k ( Gi - Bi )2 i =1 Bi c 02 = å p=1; k=6; v=6-1-1=4 Örnek 2 (Devam) (Test Prosedürü) 2 6. Eger c 02 > c 0.01,4 = 13.28 ise H 0 red 7. Hesaplamalar: c 02 = ( 37 - 43.5 )2 + ( 28 - 19.7 )2 + ... + ( 8 - 10.2 )2 = 6,073 43.5 19.7 10.2 8. Sonuclar: 2 c 02 = 6.73 < c 0.01,4 = 13.28 oldugu için H 0 reddedilemez. Bu nedenle servis sürelerinin Üstel dagılıma uydugu kabul edilir. 6 12.12.2013 Örnek 2 (Devam) Örnek 2 (Devam) (Minitab Çözümü) (P-Değeri Yaklaşımı) ca2 ,v c 02 = P 2 c0 = 6.073 ( 37 - 43.5 )2 + ( 28 -19.7 )2 + ...+ ( 8 -10.2 )2 = 6,073 43.5 ( 19.7 H0 Kabul 10.2 ) ( ) P = P c 2 > c 02 = P c 2 > 6.073 = ? 6.073 0 H0 Red Cumulative Distribution Function 0.10 < P < 0.50 Örnekte, 2 c0 = 6.073 tur ve tablodaki 3.36 ve 7,78 değerleri arasındadır. 1 P=0.194 Chi-Square with 4 DF x P( X <= x ) 6,073 0,8060237 Sonuç: α=0.05<P=0.194 olduğundan H0 Kabul P değeri=1-0,806 ≈ 0,194 Bu nedenle, P değeri, 0.50 ve 0.10 arasında olmalıdır. Kolmogorov Smirnov testi bir örneklemin hipotezlenen sürekli bir dağılımdan gelip gelmedigine karar vermek için kullanılır. Test, Deneysel (Birikimli) Dağılım fonksiyonuna dayanır. x1, ... , xn ; F(x) Sürekli Birikimli Dağılımından alınan rassal örneklem olsun. Deneysel Birikimli Dağılım F̂n (x) aşağıdaki gibi ifade edilir: n F̂n (x) = åI i =1 Xi £x n ìï 1 , X i £ x I Xi £x = í ïî 0 , degilse Kolmogorov Smirnov Uyum Testi (Devam) • Test, sıfır hipotezi altında gözlenen birikimli dağılımla, beklenen birikimli dağılımı karşılaştırır. Test istatistiği: Dn = sup{ F̂n (x) - F(x)} x 1.0 frequency Cumulative Birikimli frekans Kolmogorov Smirnov Uyum Testi 0.8 0.6 0.4 Dmax 0.2 X Test istatistiği Dn, tablodan elde edilen kritik değerden büyükse seçilen α anlam düzeyinde H0 hipotezi reddedilir. 7 L4.28 2001 12.12.2013 Anderson Darling Uyum Testi Anderson Darling testi, Kolmogorov Smirnov testi gibi gözlenen birikimli dağılım fonksiyonunu, beklenen birikimli dağılım fonksiyonu ile karşılaştırır. Anderson Darling Uyum Testi (Devam) H0: Örneklem verileri hipotezlenen dağılıma uyar. H1: Örneklem verileri hipotezlenen dağılıma uymaz. Test istatistigi (A2 ) : Bu test, kuyruklara Kolmogrov Smirnov testinden daha fazla ağırlık verir. A2 = -n - 1 n å ( 2i -1) éëln F(xi ) + ln (1- F ( xn-i +1 )) ùû n i =1 Test istatistigi A2, tablodan elde edilen kritik değerden büyükse seçilen α anlam düzeyinde H0 hipotezi reddedilir. 8