EME 3105 SİSTEM SİMÜLASYONU

advertisement
12.12.2013
1
Girdi Analizi Prosedürü
EME 3105
2
SİSTEM SİMÜLASYONU
• Modellenecek sistemi (prosesi) dokümante et
• Veri toplamak için bir plan geliştir
• Veri topla
• Verilerin grafiksel ve istatistiksel analizini yap
• Olası dağılımları hipotez et
Girdi Analizi-II
Ders 9
• Dağılımların parametrelerini tahmin et
• Hipotezlenen dağılımların uygunluğunu kontrol et
• Simulasyon çıktıları üzerinde girdilerin duyarlılığını kontrol et
Dağılıma Uyum Testleri
Dağılıma Uyumun Kontrol Edilmesi
3
4
Dağılımının ne olduğunu bilmediğiniz bir ana kitleden
(populasyon) alınan n birimlik örnekleminiz olduğunu
varsayalım.
Veri grubunun hipotezlenen bir dağılıma uyup uymadığını
nasıl kontrol edebiliriz?
• İyi uyum testleriyle
• Grafiksel olarak olasılık çizelgeleriyle
Uyum testleri, verilerin seçilen dağılıma ne kadar iyi uyduğunu
gösterir.
Verilerin uyumu,
•
2
Ki-kare ( c )
•
Kolmogorov Smirnov (Sadece Sürekli dağılımlar)
•
Anderson Darling
testleriyle kontrol edilir.
1
(Kesikli ve Sürekli dağılımlar)
(Sadece Sürekli dağılımlar)
12.12.2013
Hipotez Testinin Adımları
Bir Hipotezin Testi
•Belirli bir hipotez hakkında bir karara yol açan bir
prosedürdür.
1. Problemin içeriğinden ilgili parametreyi tanımla.
2. Sıfır Hipotezini (H0 )ifade et.
3. Uygun bir alternatif hipotez (H1) belirt.
•Hipotez testi prosedürü, kitleden alınan bir rasgele
örneklemdeki bilginin kullanılmasına dayanır.
• Eğer bu bilgi hipotezle tutarlı ise, hipotezin doğru olduğu
sonucuna; eğer bu bilgi hipotez ile tutarlı değilse, hipotezin
yanlış olduğu kararına varırız.
4. Bir anlam düzeyi (önem düzeyi) α seç.
5. Uygun bir test İstatistiği belirle.
6. İstatistik için red bölgesini belirle.
7. Herhangi bir gerekli örneklem miktarı hesapla, bunları test istatistiği için
denklemde yerine koy ve bu değeri hesapla.
8. H0’ın reddedilip reddedilmeyeceğine karar ver ve problem bağlamında
bunu rapor et.
Hipotez Testlerinde
I.Tip ve II.Tip Hatalar
Ki-kare ( c ) İyi Uyum Testi
2
H0: Örneklem verileri hipotezlenen dağılıma uyar.
H0 doğru olduğu halde reddedildiğinde I. Tip Hata yapılır.
H1: Örneklem verileri hipotezlenen dağılıma uymaz.

Test, Ki-kare dağılımına dayanır.
•
Gi, i. sınıf aralığında gözlenen frekans,
•
Bi, i. sınıf aralığında beklenen frekans olsun.
H0 yanlış olduğu halde kabul edildiğinde II.Tip Hata yapılır.
Test İstatistiği:
k
c 02 = å
i =1
ca ,v
2
( Gi - Bi )
2
KARAR
Bi
H0 Kabul
H0 Red
H0 Doğru
Doğru Karar
I. Tip Hata
H0 Yanlış
II. Tip Hata
Doğru Karar
α=P(H0 red/H0 doğru)=P(I.Tip Hata)
β=P(H0 kabul/H0 yanlış)=P(II. Tip Hata)
ca ,v
2
2
12.12.2013
Örnek
1
Testing
for Goodness of Fit
Belli bir ebattaki metal levha üzerindeki hata sayılarının Poisson
dağılımına uyup, uymadığını araştıralım. 60 birimlik rassal örneklem
alınmış ve aşağıda verilen hata sayıları gözlenmiştir.
Hata
Sayısı
Hipotezlenen λ=0.75 hata/levha parametreli Poisson dağılımından
i. sınıf aralığıyla ilgili pi olasılıklarını aşağıdaki gibi hesaplayabiliriz.
f (x) = P(X = x) =
Gözlenen
Frekans
** Bu örnekte, varsayılan Poisson
dağılımının ortalaması bilinmemektedir,
ve örneklem verisinden tahmin edilmelidir.
E[X] = l =
x = 0,1,2,...
i i
"i
i
"i
32.0 + 15.1 + 9.2 + 4.3
=
= 0.75
60
Örnek 1 (devam)
Beklenen frekansları hesaplamak için örneklem büyüklüğü n=60 ve
pi olasılıkları çarpılır. Bi=n.pi
Olasılık
e- l l x
x!
åfx
åf
Example 9-12
Örnek 1 (devam)
Hata
Sayısı
Örnek 1 (devam)
Beklenen
Frekans
α=0.05 anlam düzeyi seçerek 8 adımlı hipotez testi prosedürünü uygulayalım:
1. İlgili değişken, levha üzerindeki hata sayısının dağılımının uyumudur.
0.472(60)
1. H0: Lavha üzerindeki hata sayısı Poisson dağılımına uyar.
2. H1: Levha üzerindeki hata sayısı Poisson dağılımına uymaz.
3. α=0.05
(veya daha fazla)
Eğer beklenen frekans 5’ten küçükse, önceki sınıfla birleştir:
Hata
Sayısı
(veya daha fazla)
Gozlenen
Frekans
Beklenen
Frekans
4. Test İstatistigi:
Eğer H0 doğruysa,
c
k
( Gi - Bi )2
i =1
Bi
c 02 = å
2
0 ‘nin, k-p-1 serbestlik dereceli ki-kare dağılımına uyduğu gösterilebilir
p: Hipotez edilen dağılımın parametre sayısı,
k: Sınıf sayısıdır.
3
12.12.2013
2
Normal Dağılıma Sahip Bir Kitlenin Varyans
c
= 3.84
0.05,1
ve Standart Sapması İçin Hipotez Testi
Örnek 1 (devam)
2
6. Eger c 02 > c 0.05,1
= 3.84 ise H 0 red
7. Hesaplamalar:
c 02 =
( 32 - 28.32 )2 + (15 - 21.24 )2 + (13 - 10.44 )2 = 2.94
28.32
21.24
10.44
8. Sonuclar:
2
c 02 = 2.94 < c 0.05,1
= 3.84 oldugu icin levha üzerindeki hata sayısının
Poisson dagılımına uyduguna iliskin H 0 hipotezini reddecek yeterli
istatistiksel kanıt yoktur.
P-Değeri Yaklaşımı

P-Değeri Yaklaşımı
ca2 ,v
H0’ı reddetme kriteri olarak α’nın kullanımı; H0’ın zayıf bir şekilde mi
yoksa güçlü bir şekilde mi reddedildiğini söylemez. Bunu bilmek için
P-Değeri yaklaşımını kullanırız:
2
c0
P değeri, verilen veriyle (H0) sıfır hipotezinin
reddedilmesine yol açan en küçük anlam seviyesidir.
(
)
( c 2 Uyum testi icin)
( 32 - 28.32 )2 + (15 - 21.24 )2 + (13 - 10.44 )2
28.32
= 2.94
P
Tanım
P = P c 2 > c 02
c 02 =
(
P= P c >
2
21.24
2
c
0
) = P( c
10.44
2
= 2.94
2.94
Örnekte,
2
c0
= 2.94 dir ve bu, tablodaki 2,71 ve 3,84 değerleri arasındadır.
Bu nedenle, P değeri, 0.05 ve 0.10 arasında olmalıdır.
0.05 < P < 0.10
4
)
> 2.94 = ?
12.12.2013
Ki-kare Uyum Testi (Devam)
Örnek 1 (devam)
Örnek 2: Eczane Servis Süreleri
H0 Kabul
0 P=0.086
x
2,94
H0 Red
Test kriteri: P degeri > a ise H 0'ı reddetme
P degeri £ a ise H 0'ı reddet
P( X <= x )
0,913589
Örnek 2 (Devam)
(Sınıflandırılmış Serinin Hazırlanması)
k = n = 100 = 10
X max- X min 15.19 - 0.5
=
= 1.469 » 1.5
k
10
S=
2.0’den az
2.0 - 3.5
3.5 - 5.0
5.0 - 6.5
6.5 - 8.0
8.0 - 9.5
9.5 - 11.0
11.0 -12.5
12.5 -14.0
14,0’ten çok

Servis
sürelerinin
Üstel
dağılıma uyup uymadığını
Ki-kare Uyum testiyle kontrol
edin.
Sonuç: α=0.05<P=0.086 olduğundan
H0 Kabul
P değeri=1-0,913589
≈ 0,086
Sınıflar
Eczane örneginde müşterilere
servis süreleri (dk.) rassal
olarak gözlemlenmiş ve yanda
verilen 100 örneklem verisi
oluşturulmuştur.
1
Cumulative Distribution Function
Chi-Square with 1 DF

4,65
1,18
13,04
0,77
2,11
1,83
4,9
7,23
3,52
4,44
1,2
1,09
1,19
2,59
1,39
2,47
0,77
1,29
1,74
5,86
3,24
2,53
3,09
2,01
6,13
2,45
1,23
7,35
5,5
1,63
0,89
4,67
2,05
0,5
8,59
0,94
1,25
3,14
4,63
1,59
0,92
0,97
10,68
6,82
1,45
0,98
1,19
2,03
1,62
5,02
1,15
4,61
8,3
3,88
0,87
2,4
1,44
1,78
3,06
3,65
6,64
1,45
2,29
2,86
2,26
4,86
3,12
2,9
15,19
3,36
2,5
2,72
11,3
4,26
6,6
3,03
9,23
2,05
1,49
9,11
Örnek 2 (Devam)
(Üstel Dağılımdan Olasılık Hesabı)
(k:sınıf sayısı)
H 0 : Müsterilerin servis süreleri Üstel dagılıma uyar.
(S: sınıf genisligi)
H1 : Müsterilerin servis süreleri Üstel dagılıma uymaz.
m = E[ X ] = E éë X ùû = 1/ l
fi
37
28
15
6
6
4
1
1
1
1
1,02
0,98
6,25
3,26
3,1
4,48
4,29
7,93
1,29
1,48
1,8
1,58
4,07
3,84
6,18
2,67
1,75
1,72
2,34
3,23
n
E[X] = 1 / l =
100
åx åx
i
i =1
n
=
i
i =1
100
» 3.5 (dk)
1
l=
» 0.285
3.5
***
b
b
a
a
P(a < X < b) = ò f (x)dx = ò l e- l x dx
P(a < X < b) = F(b) - F(a)
F(x) = 1- e- l x
f (x) = l e- l x
Sınıflardaki frekanslar belirlenirken alt
Sınıf değeri dahil üst sınıf değeri hariç tutulur
5
x>0
F(b) = 1- e- lb
;
F(a) = 1- e- l a
12.12.2013
Örnek 2 (Devam)
Örnek 2 (Devam)
(Beklenen Frekansların Belirlenmesi)
(Test Prosedürü)
100 *0, 435 = 43,5
Sınıf
F(x)
P(a<X<b)
Bi
<2
0,435
0,435
43,5
2 - 3,5
0,632
0,197
19,7
3,5 - 5
0,76
0,128
12,8
5 - 6,5
0,844
0,084
8,4
6,5 - 8
0,898
0,054
5,4
8 - 9,5
0,934
0,036
3,6
9,5 - 11
0,957
0,023
2,3
11 - 12,5
0,972
0,015
1,5
12,5 - 14
0,982
0,01
1
>14
1
0,018
1,8
F(2) = 1- e-(0,285)2 » 0, 435
Beklenen frekans 5’ten küçük
sınıflar, önceki sınıfla birleştir
1. ilgilenilen degisken müsterilerin servis süreleridir.
Sınıf
Gi
Bi
<2
37
43,5
2 - 3,5
28
19,7
3,5 - 5
15
12,8
5 - 6,5
6
8,4
6,5 - 8
6
5,4
>8
8
10,2
2. H 0 :Servis süreleri l =0,285 olay/dk. olan Üstel dagılıma uyar.
3. H1: Servis süreleri l =0,285 olay/dk. olan Üstel dagılıma uymaz.
4. a =0,01
5. Test istatistigi:
;
F(3,5) = 1- e-(0,285 )3,5 » 0,632
P(2 < X < 3,5) = F(3,5) - F(2) = 0,632 - 0, 435 = 0,197
Normal Dağılıma Sahip Bir Kitlenin Varyans
2 Testi
ve Standart Sapması İçin Hipotez
c 0.01,4
= 13.28
k
( Gi - Bi )2
i =1
Bi
c 02 = å
p=1; k=6; v=6-1-1=4
Örnek 2 (Devam)
(Test Prosedürü)
2
6. Eger c 02 > c 0.01,4
= 13.28 ise H 0 red
7. Hesaplamalar:
c 02 =
( 37 - 43.5 )2 + ( 28 - 19.7 )2 + ... + ( 8 - 10.2 )2 = 6,073
43.5
19.7
10.2
8. Sonuclar:
2
c 02 = 6.73 < c 0.01,4
= 13.28 oldugu için H 0 reddedilemez.
Bu nedenle servis sürelerinin Üstel dagılıma uydugu kabul edilir.
6
12.12.2013
Örnek 2 (Devam)
Örnek 2 (Devam)
(Minitab Çözümü)
(P-Değeri Yaklaşımı)
ca2 ,v
c 02 =
P
2
c0
= 6.073
( 37 - 43.5 )2 + ( 28 -19.7 )2 + ...+ ( 8 -10.2 )2 = 6,073
43.5
(
19.7
H0 Kabul
10.2
) (
)
P = P c 2 > c 02 = P c 2 > 6.073 = ?
6.073
0
H0 Red
Cumulative Distribution Function
0.10 < P < 0.50
Örnekte,
2
c0
= 6.073 tur ve tablodaki 3.36 ve 7,78 değerleri arasındadır.
1
P=0.194
Chi-Square with 4 DF
x
P( X <= x )
6,073 0,8060237
Sonuç: α=0.05<P=0.194
olduğundan H0 Kabul
P değeri=1-0,806
≈ 0,194
Bu nedenle, P değeri, 0.50 ve 0.10 arasında olmalıdır.
Kolmogorov Smirnov testi bir örneklemin hipotezlenen sürekli
bir dağılımdan gelip gelmedigine karar vermek için kullanılır.
Test, Deneysel (Birikimli) Dağılım fonksiyonuna dayanır.
x1, ... , xn ; F(x) Sürekli Birikimli Dağılımından alınan rassal
örneklem olsun.
Deneysel Birikimli Dağılım F̂n (x) aşağıdaki gibi ifade edilir:
n
F̂n (x) =
åI
i =1
Xi £x
n
ìï 1 , X i £ x
I Xi £x = í
ïî 0 , degilse
Kolmogorov Smirnov Uyum Testi
(Devam)
• Test, sıfır hipotezi altında
gözlenen birikimli dağılımla,
beklenen birikimli dağılımı
karşılaştırır.
Test istatistiği:
Dn = sup{ F̂n (x) - F(x)}
x
1.0
frequency
Cumulative
Birikimli frekans
Kolmogorov Smirnov Uyum Testi
0.8
0.6
0.4
Dmax
0.2
X
Test istatistiği Dn, tablodan elde edilen kritik değerden
büyükse seçilen α anlam düzeyinde H0 hipotezi
reddedilir.
7
L4.28
2001
12.12.2013
Anderson Darling Uyum Testi
Anderson Darling testi, Kolmogorov Smirnov testi gibi
gözlenen birikimli dağılım fonksiyonunu, beklenen
birikimli dağılım fonksiyonu ile karşılaştırır.
Anderson Darling Uyum Testi
(Devam)
H0: Örneklem verileri hipotezlenen dağılıma uyar.
H1: Örneklem verileri hipotezlenen dağılıma uymaz.
Test istatistigi (A2 ) :
Bu test, kuyruklara Kolmogrov Smirnov testinden daha
fazla ağırlık verir.
A2 = -n -
1 n
å ( 2i -1) éëln F(xi ) + ln (1- F ( xn-i +1 )) ùû
n i =1
Test istatistigi A2, tablodan elde edilen kritik değerden
büyükse seçilen α anlam düzeyinde H0 hipotezi reddedilir.
8
Download