Parametre Tahmini Ankara doğumlu 1 yaşındaki (12 aylık) çocukların ağırlık ortalaması nedir? Tüm çocukları gözlemeden bu soruya cevap verilmesi istendiğine, “iyi” bir örnekleme yapıp çocukların kitlesinden n birimlik bir örnek (n tane çocuk) çeker, bunların ağırlıklarını ölçer ve gözlenen değerlerin aritmetik ortalamasını alırız diye düşünebiliriz. Ancak, aklımıza hemen şu soru takılmaktadır. Bizden habersiz başka birisi aynı araştırmayı aynen bizim gibi yapsa aynı sonucu elde eder mi? Başka birisi, gözlediği değerlerin ortancasını cevap olarak söylerse ne olur? Bu derste İstatistiksel Sonuç Çıkarımın iki ana konusu olan Parametre Tahmini ve Hipotez Testi konularından biri olan Parametre Tahmini konusuna giriş yapacağız. Parametre tahmini, parametre için nokta tahmin ve parametre için aralık tahmini diye ikiye ayrılmaktadır. Bir X rasgele değişkeninin dağılımı f X (.; q), ( q Î Q) olasılık (yoğunluk) fonksiyonu ile verilsin. değerine parametre ve Q kümesine parametre kümesi denir. Örneğin, b(1, p) Bernoulli dağılımında parametre p ve parametre kümesi Q = (0,1) p (0,1) R dır. Poisson dağılımında parametre ve parametre kümesi Q = (0, ¥ ) (0, ) R dır. Gamma dağılımında iki tane parametre , bulunmaktadır ve parametre kümesi (0, ) (0, ) ( , ) (0, ) (0, ) R 2 dır. Gamma dağılımının beklenen değeri . olup, parametrelerin bir fonksiyonudur. Normal dağılımda da iki tane parametre bulunmaktadır ve ( , 2 ) (, ) (0, ) R 2 dır. Bir dağılımda parametre sayısı iki veya daha çok olduğunda ‘yı vektör olarak görebiliriz. Bir X rasgele değişkenin olasılık (yoğunluk) fonksiyonu f X (.; q), ( q Î Q) olmak üzere, X1 , X 2 ,..., X n ‘ler X ‘in dağılımından alınan n birimlik bir örneklem olsun. X1 , X 2 ,..., X n ‘ler bağımsız ve her biri X gibi dağılımlı rasgele değişkenlerdir. X1 , X 2 ,..., X n örnekleminin bir fonksiyonuna (bilinmeyen parametre içermeyen bir fonksiyonuna ) istatistik dendiğini önceki derste öğrendik. Nokta Tahmin Tanım 1 Bir istatistik bilinmeyen bir parametrenin (veya parametrenin bir fonksiyonunun) belirlenmesi amacıyla kullanıldığında bu istatistiğe tahmin edici denir. Tahmin edicinin aldığı değere (tahmin edicinin gözlenen değerine ) tahmin denir. Örnek 1 Bir yaşındaki çocukların ağırlık ortalamasını tahmin etmek amacıyla çocukların kitlesinden rasgele seçilen 10 birimlik bir örnek için ağırlıklar, x1 = 9.6 , x2 = 7.7 , x6 = 12.4 , x7 = 11.0 , x3 = 10.2 , x8 = 9.9 , x4 = 10.5 , x9 = 10.6 , x5 = 8.2 x10 = 10.9 (kg) n olarak gözlenmiş olsun. Örneklem ortalaması olan X n = å Xi i= 1 n istatistiğini kitle ortalaması için bir tahmin edici olarak alırsak, çocukların ağırlık ortalamasını 10 å x10 = xi i= 1 10 = 10.1 (kg) olarak tahmin ederiz. n Her zaman örneklem ortalaması X n = å Xi ‘yi kitle ortalamasının bir tahmin edicisi n olarak alabiliriz. Kitle ortalaması için başka tahmin ediciler olabilir mi? Varsa, bu tahmin edicilerden hangisi tercih edilecektir? Bir tahmin ediciyi tercih etmede aranan ölçütler veya özellikler nelerdir? Bir istatistik olan her hangi bir T ( X1 , X 2 ,..., X n ) tahmin edicisini kısaca T harfi ile de göstereceğiz. i= 1 Tanım 2 Bir ( q Î Q ) parametresi için önerilen bir T tahmin edicisi her q Î Q için E T özelliğine sahipse, bu tahmin ediciye yansız tahmin edici denir. Tanım 3 Bir ( q Î Q ) parametresi için önerilen bir T tahmin edicisi için Yanlılık (T , ) E (T ) değerine T tahmin edicisinin yanlılığı denir. Örnek 2 Belli bir olgu ile ilgili rasgelelik içeren bir özelliğin ölçülen ( X ) değerinin n dağılımı ortalamalı ve 2 varyanslı olsun. å Xn = Xi i= 1 n örneklem ortalaması ile n Sn2 = å ( X i - X )2 örneklem varyansını ve 2 ‘yi tahmin etmek için tahmin edici i= 1 n olarak kullanabiliriz. æn ö çç å X ÷ ÷ n ö 1 n çç i= 1 i ÷ 1 æ 1 n ÷ ççå X ÷ ÷ E ( X n ) = E çç = E = E ( X ) = ÷ ÷ å å m= m i÷ i n èç i= 1 ø n i= 1 n i= 1 çç n ÷ ÷ ÷ ÷ ççè ÷ ø olmak üzere, X n örneklem ortalaması kitle ortalaması için yansız bir tahmin edicidir. 2 E ( Sn ) E n ( X i X n )2 i 1 n 1 n 1 n E ( X i X n )2 E X i2 2 X i X n ( X n ) 2 n i 1 n i 1 n 1 n 2 E X i 2 X n X i n( X n )2 n i 1 i 1 n 1 n 2 2 n E X i X j X i n( X n )2 n i 1 n j 1 i 1 1 n 2 2 n E Xi n n j 1 i 1 n (X i 1 j X i ) n( X n ) 2 1 n 2 n 2 E ( X i ) n i 1 n j 1 2 E ( X X ) nE ( X ) j i n i 1 1 n 2 n 2 E ( X i ) n i 1 n j 1 E( X n n i 1 2 X ) nE ( X ) ……( E ( X 2 ) Var ( X ) ( E ( X )) 2 ) j i n 2 1 n 2 2 2 2 2 2 ( ) n ( ) n ( n 1) n ( 2 ) n i 1 n n 1 n( 2 2 ) 2( 2 2 ) 2(n 1) 2 2 n 2 n 1 n 2 2 n n 1 2 n olmak üzere, S n2 örneklem varyansı 2 kitle varyansı için yansız bir tahmin edici değildir. Bu tahmin edicicinin yanlılığı, n 1 2 1 Yanlılık ( S n2 , 2 ) E ( S n2 ) 2 2 2 n n dır. n n 2 ( X X ) ( X i X n )2 i n n 2 E i 1 E i 1 n 1 n n 1 olmak üzere, n Sn2- 1 = olarak tanımlanan S å ( X i - X )2 i= 1 2 n- 1 n- 1 istatistiği 2 kitle varyansı için yansız bir tahmin edicidir. Sn2- 1 istatistiğine de örneklem varyansı denir. Sn2- 1 ile S n2 örneklem varyanslarından hangisinden söz edildiği belirtilmediğinde, yani sadece S 2 örneklem varyansı dendiğinde, kitaplarda genellikle Sn2- 1 kastedilmektedir. Örnek 3 U ( 0 , ), ( 0 , düzgün ) dağılımında parametresi dağılımın üst sınırını belirlemektedir. Dağılımın beklenen değeri (ortalaması) ve varyansı 2 2 dır. 2 12 Örneğin 10 olduğunda, X U (0,10) dağılımlı bir X rasgele değişkeni için E ( X ) 5 , Var ( X ) 100 /12 ve olasılık yoğunluk fonksiyonu ile dağılım fonksiyonu, 1 , 0 x 10 f X ( x) 10 0 , d.y 0 x FX ( x) P( X x) 10 1 , x0 , 0 x 10 , x 10 olup grafikleri, f ( x) o 1/10o x 10 F ( x) 1 x 10 dır. Hayatımızda ulaşım, yemek, sağlık, banka gibi hizmet gördüğümüz değişik yerlerdeki kuyruklarda beklediğimiz, yani boşa harcadığımız zaman olmaktadır. İnsanların boşa harcadıkları zamanın U (0, ) , (0, ) gibi bir düzgün dağılıma sahip olduğu bilinsin. Kuyruklarda harcanan boş zaman için ortalama değerin, varyansın ve üst sınırın tahmin edilmesi istensin. Rasgele seçilen 65 kişi için haftalık boşa harcanan zaman, 0.03 0.61 2.37 0.17 2.76 3.55 4.65 0.72 0.41 4.12 1.23 1.45 1.53 3 0.74 2.12 3.53 0.52 1.82 4.58 1.9 2 1.06 3.06 1.74 0.74 4.5 0.93 4.76 3.03 (saat/hafta) 3.12 2.29 4.71 4.7 2.25 4.11 4.85 3.78 0.72 2.71 0.05 1.12 0.13 3.2 1.52 1.34 0.29 2.64 3.36 4.22 4.12 0.72 2.7 3.82 3.39 2.54 3.26 0.46 olarak gözlenmiş olup, bu veriler için histogram 10 8 6 4 2 0 0 0.5 1 1.5 2 2.5 örneklem ortalaması, 65 å xi i= 1 x65 = 65 = 2.35 örneklem varyansı, 65 2 s65 = å ( xi - x10 ) 2 i= 1 65 = 2.0028 65 2 s65 -1 = å ( xi - x10 )2 i= 1 64 = 2.0341 ve gözlenen en büyük değer, max x1 , x2 ,..., x65 4.85 dır. 3 3.5 4 4.5 5 2 2 2.11 3.46 1.44 2.39 3.6 U (0, ) , (0, ) dağılımında tahmin etmek istediklerimiz dağılımın ortalaması, varyansı ve üst sınırı olmak üzere, bunlar 2 2 2 12 Dağılımın üst sınırı dır. parametresinin bir fonksiyonu olan bu değerleri tahmin etmek için tahmin edici olarak, n å Xn = Xi i= 1 n n Sn2- 1 = å ( X i - X )2 i= 1 n- 1 T = max {X1 , X 2 ,..., X n } istatistiklerini kullanırsak, yukarıdaki veriye dayalı olarak, x65 2.35 2 s65 1 =2.0341 max x1 , x2 ,..., x65 4.85 tahminlerini elde ederiz. Kullandığımız tahmin edicilerden X n örneklem ortalaması kitle ortalaması için 2 n yansız bir tahmin edicidir. Sn2- 1 = å ( X i - X )2 de 2 2 için yansız bir tahmin edicidir. 12 n- 1 T = max {X1 , X 2 ,..., X n } tahmin edicisi için yansız mıdır? Önce, T rasgele değişkeninin dağılımını bulalım. T ‘nin dağılım fonksiyonu, FT (t ) P(T t ) P max X1, X 2 ,..., X n t i= 1 P X1 t , X 2 t ,..., X n t P X1 t ) P( X 2 t )...P( X n t n t 1 t n dx 0 olmak üzere, olasılık yoğunluk fonksiyonu, fT (t ) dır. n n t n 1 , 0 t E (T ) t 0 n n t n 1 n t n 1 n dt n t dt n 0 n 1 t 0 n 1 n n olmak üzere, T = max {X1 , X 2 ,..., X n } tahmin edicisi için yansız tahmin edici değildir. V= n+ 1 T n istatistiği için E (V ) = n+ 1 E (T ) = q n n+ 1 T istatistiği için yansız bir tahmin edicidir. Diğer taraftan, n E (2 X n ) olmak üzere, V = olmak üzere, U 2 X n istatistiği de için yansız bir tahmin edicidir. Bu iki tahmin ediciden hangisinin varyansı daha küçüktür? Var (U ) Var (2 X n ) 4Var ( X n ) 4 ve Var (V ) Var ( E (T ) t 2 0 2 2 12n 2 3n n 1 n 1 2 n 1 2 T) ( ) Var (T ) ( ) E (T 2 ) ( E (T )) 2 n n n n n t n 1 dt n n 0 t n 1 n t n2 n dt n 2 n 2 t 0 n 2 2 n n n Var (V ) 2 2 2 n 1 (n 2)(n 1) n 2 olmak üzere, Var (V ) Var (U ) n+ 1 n+ 1 T= max {X 1 , X 2 ,..., X n } tahmin edicisi yansız ve varyansı, yine yansız dır. V = n n olan U 2 X n tahmin edicisinin varyansından daha küçüktür. V tahmin edicisinden daha küçük varyanslı başka yansız bir tahmin edici var mıdır? En küçük varyanslı yansız tahmin edici nedir? Bu soruların cevaplarını önümüzdeki ders yılında verebileceksiniz. Tanım 4 Bir ( q Î Q Ì R ) parametresi için önerilen bir T tahmin edicisi için HKO(T , ) E T 2 sayısına T tahmin edicisinin Hata Kare Ortalaması denir. Teorem ( q Î Q Ì R ) bir parametre ve T bir tahmin edici olmak üzere, HKO(T , ) Var (T ) Yanlılık (T , ) 2 dır. İspat: HKO(T , ) E T E T E (T ) E (T ) 2 2 E T E(T ) 2E T E(T ) E(T ) E E (T ) 2 E T E (T ) 2 E (T ) E T E (T ) E E (T ) 2 2 2 0 Var (T ) Yanlılık (T , ) 2 Bir tahmin edicinin yansız olması, yansız olmadığında küçük bir yanlılığa sahip olması, Hata Kare Ortalamasının küçük olması gibi özellikler, tahmin edicilerde aranan özelliklerden sadece bir kaçıdır. Tahmin edicilerde aranan özellikleri ve belli özelliklere sahip tahmin edicilerin nasıl elde edileceğini önümüzdeki ders yılında İST202 dersinde göreceksiniz. Yukarıda örneklem ortalamasını kitle ortalaması için ve örneklem varyansının da kitle varyansı için bir tahmin olarak kullandık. Genel olarak, örneklem momentleri kitle momentleri için birer tahmin edici olarak kullanılabilir. Şimdi, tahmin edicileri elde etme yöntemlerinden biri olan En Çok Olabilirlik Yöntemine kısaca değineceğiz. Bir X rasgele değişkenin olasılık (yoğunluk) fonksiyonu f X (.; q), ( q Î Q) olmak üzere, X1 , X 2 ,..., X n ‘ler X ‘in dağılımından alınan n birimlik bir örneklem olsun. X1 , X 2 ,..., X n ‘ler bağımsız ve her biri X gibi dağılımlıdır. X1 , X 2 ,..., X n ‘lerin ortak olasılık (yoğunluk) fonksiyonu, f X1, X 2 ..., X n ( x1, x2 ,..., xn ; q) = f X1 ( x1; q) f X 2 ( x2 ; q)... f X n ( xn ; q) , ( x1 , x2 ,..., xn ) X dır. X1 , X 2 ,..., X n örnekleminin gözlenmiş x1 , x2 ,..., xn değerleri için yukarıdaki fonksiyon q 'nın bir fonksiyonu olmaktadır. L(q) = f X1 ( x1; q) f X 2 ( x2 ; q)... f X n ( xn ; q) , q Î Q fonksiyonuna Olabilirlik Fonksiyonu denir. Bu fonksiyonu maximum yapan değer ˆ( x1 , x2 ,..., xn ) olmak üzere, ˆ( X1, X 2 ,..., X n ) istatistiğine parametresinin En Çok Olabilirlik Tahmin Edicisi denir. ‘nın En Çok Olabilirlik Tahmin Edicisi’ni bulmak için genellikle L(q) yerine ln L(q) fonksiyonu maximize edilir. Örnek 4 Üstel dağılımın parametresinin En Çok Olabilirlik Tahmin edicisi nedir? Üstel dağılıma sahip bir X rasgele değişkenin olasılık yoğunluk fonksiyonu, 1 - qx f X ( x; q) = e , q x> 0 ( q Î Q = (0, ¥ )) olmak üzere, X1 , X 2 ,..., X n ‘ler bu dağılımdan bir örneklem olsun. X1 , X 2 ,..., X n ‘ler bağımsız ve her biri X gibi dağılımlıdır. X1 , X 2 ,..., X n ‘lerin ortak olasılık (yoğunluk) fonksiyonu, f X1, X 2 ..., X n ( x1, x2 ,..., xn ; q) = f X1 ( x1; q) f X 2 ( x2 ; q)... f X n ( xn ; q) = 1e q x1 q 1 - xq2 1 e ... e q q xn q n å 1 e qn = xi i= 1 q dır. Olabilirlik fonksiyonu, n å 1 qn L(q) = xi - i= 1 e q ve n n å 1 ln L(q) = ln( n ) q å xi i= 1 = - n ln q - q xi i= 1 q olmak üzere, bu fonksiyonu maximum yapan değerini bulmak için ‘ya göre türev alınsın. n å d - n ln L(q) = + dq q xi i= 1 q2 n 2å xi d2 n ln L(q) = 2 2 dq q i= 1 3 q olup, birinci türevin sıfıra eşitlenmesiyle, n å x - n i= 1 i =0 q q2 denklemi elde edilir. Bu denklemin çözümü, n ˆ( x1 , x2 ,..., xn ) ve x i i 1 n d2 ln L(qˆ( x1 , x2 ,..., xn )) < 0 olmak üzere, d q2 n ˆ( X 1 , X 2 ,..., X n ) X i 1 i n istatistiği parametresinin En Çok Olabilirlik Tahmin Edicisi’dir. Örnek 5 Poisson dağılımın parametresinin En Çok Olabilirlik Tahmin edicisi nedir? Poisson dağılımına sahip bir X rasgele değişkenin olasılık fonksiyonu, e- l l x f X ( x; l ) = , x = 0,1, 2,... ( l Î Q = (0, ¥ )) x! olmak üzere, X1 , X 2 ,..., X n ‘ler bu dağılımdan bir örneklem olsun. X1 , X 2 ,..., X n ‘ler bağımsız ve her biri X gibi dağılımlıdır. X1 , X 2 ,..., X n ‘lerin ortak olasılık (yoğunluk) fonksiyonu, f X1, X 2 ..., X n ( x1, x2 ,..., xn ;l ) = f X1 ( x1;l ) f X 2 ( x2 ;l )... f X n ( xn ;l ) e- l l x1 e- l l x2 e- l l xn = ... x1 ! x2 ! xn ! n e- nl l = åi= 1 xi x1 ! x2 !...xn ! dır. Olabilirlik fonksiyonu, n e- nl l L(l ) = åi= 1 xi x1 ! x2 !...xn ! ve n ln L(l ) = - nl + å xi ln l - ln (x1 ! x2 !...xn !) i= 1 olmak üzere, bu fonksiyonu maximum yapan değerini bulmak için alınsın. n å d ln L(l ) = - n + dl xi i= 1 l n d2 ln L(l ) = dl 2 å xi i= 1 l 2 olup, birinci türevin sıfıra eşitlenmesiyle, n å - n+ xi i= 1 =0 l denklemi elde edilir. Bu denklemin çözümü, n ˆ ( x1 , x2 ,..., xn ) ve x i 1 i n d2 ln L(lˆ( x1 , x2 ,..., xn )) < 0 olmak üzere, 2 dl ‘ya göre türev n ˆ ( X 1 , X 2 ,..., X n ) X i 1 i n istatistiği parametresinin En Çok Olabilirlik Tahmin Edicisi’dir. Bir kavşakta günlük trafik kazası sayısının Poisson dağılımına sahip olduğu bilinmektedir. Rasgele seçilen 10 gün için kaza sayısı, x1 = 0 , x2 = 3 , x3 = 2 , x4 = 0 , x5 = 4 x6 = 1 , x7 = 2 , x8 = 0 , x9 = 1 , x10 = 1 olarak gözlenmiş olsun. parametresinin En Çok Olabilirlik Tahmini, 10 ̂ = ˆ ( x1 , x2 ,..., x10 ) x i 1.4 10 dır. parametresi Poisson dağılımının beklenen değeri olmak üzere, günlük ortalama trafik kazası sayısını 1.4 olarak tahmin edildiğini söyleyebiliriz. i 1 Poisson dağılımının varyansı dır. n Sn2- 1 = å ( X i - X )2 i= 1 n- 1 örneklem varyansı kitle varyansı için yansız bir tahmin edicidir. Bu tahmin edicinin verdiği değer, 10 s102 - 1 = å 10 å ( xi - x10 ) 2 i= 1 10 - 1 = xi2 - 10 x 2 i= 1 9 = 36 - 10´ 1.42 16.4 = = 1.822 9 9 dır. Böylece parametresi için elimizde iki tane rahmin değeri bulunmaktadır. Birisi 1.4 diğeri 1.882 dir. Her ikisi de yansız birer tahmin edici tarafından elde edilmiştir. Tahmin edicilerden varyansı küçük olan tahmin ediciyi tercih etmemiz gerekir. En Çok Olabilirlik Tahmin Edici’sinin (örneklem ortalamasının) varyansını biliyoruz. n Xi ˆ Var ( X 1 , X 2 ,..., X n ) Var i 1 n n æn ö çç å ( X - X ) 2 ÷ ÷ ÷ çç i= 1 i ÷ 2 ÷ = ? Bu sorunun Örneklem varyansının varyansı nedir? Var (S n- 1 ) = Var çç ÷ ÷ n- 1 çç ÷ ÷ ÷ ççè ø÷ cevabı da önümüzdeki ders yılına kalsın. Aralık Tahmini Bir yaşındaki çocukların ağırlıklarının ortalamasını ( kitle ortalamasını) tahmin n etmek için X n X i 1 i örneklem ortalamasını tahmin edici olarak kullanabiliriz. Bu tahmin n n x i değeri için bir nokta tahmindir. Kitle dağılımının, yani n çocukların boy uzunluklarının N ( , 2 ) gibi bir normal dağılıma sahip olması durumunda, edicinin aldığı xn i 1 2 Xn N ( , Z Xn n ) ve N (0,1) n dır. Ayrıca, P( z / 2 Z z1 / 2 ) 1 P( z1 / 2 Z z1 / 2 ) 1 olmak üzere, Xn P( z1 / 2 z1 / 2 ) 1 n P( X n z1 / 2 n X n z1 / 2 n ) 1 yazılabilir. Bu son eşitlik, 1 olasılıkla ( X n z1 / 2 n , X n z1 / 2 n ) aralığı kitle ortalamasını (parametresini) kapsar diye okunmaktadır. ( X n z1 / 2 , X n z1 / 2 ) n n aralığına, için 1 güven katsayılı güven aralığı denmektedir. Örneğin, ( X n 1.96 , X n 1.96 ) n n aralığı için 1 %95 güven katsayılı ve ( X n 1.645 n , X n 1.645 n ) aralığı için 1 %90 güven katsayılı bir güven aralığıdır. Bu güven aralıklarının kullanışlı olması için değerinin bilinmesi gerekir. Örnek 6 Bir yaşındaki çocukların ağırlıklarının 2 1.5 varyanslı normal dağılıma ( N ( , 2 1.5) ) sahip olduğu bilinmektedir. Rasgele seçilen 10 birimlik bir örnek için ağırlıklar, x1 = 9.6 , x2 = 7.7 , x3 = 10.2 , x4 = 10.5 , x5 = 8.2 x6 = 12.4 , x7 = 11.0 , x8 = 9.9 , x9 = 10.6 , x10 = 10.9 (kg) olarak ve gözlenmiştir. 10 å xi i= 1 x10 = = 10.1 10 olmak üzere, kitle ortalaması için 1 %95 güven katsayılı güven aralığı (10.1 1.96 1.5 1.5 ,10.1 1.96 ) 10 10 (9.341 , 10.859) olarak elde edilmektedir. Kitle dağılımının, yani çocukların boy uzunluklarının dağılımı bilinmiyor olsun. Sonlu varyanslı olan her kitle dağılımı için Merkezi Limit Teoremi’nden, büyük örneklem hacimlerinde X P n t P(Z t ) n olmak üzere, X P( z1 / 2 n z1 / 2 ) 1 n yazılabilir. Buna göre, ( X n z1 / 2 , X n z1 / 2 ) n n aralığı parametresi için 1 güven katsayılı bir güven aralığıdır. Bu güven aralığının kullanışlı olması için değerinin bilinmesi gerekir. 2 kitle varyansı bilinmediğinde, n Sn2- 1 = å ( X i - X )2 i= 1 n- 1 örneklem varyansını “yerine yazabiliriz”. Büyük örneklem hacimlerinde, kitle ortalaması için 1 güven katsayılı bir güven aralığı 2 ( X n z1 / 2 Sn 1 n , X n z1 / 2 Sn 1 n ) dır. Dikkat ettiyseniz, sadece kitle ortalaması (kitle dağılımının beklenen değeri) için güven aralığı üzerinde durmaktayız. Kitle oranı da bir anlamda kitle dağılımının beklenen değeridir. b(1, p) Bernoulli dağılımının beklenen değeri (ortalaması) p dır. Kitle oranı p bilinmediğinde, p için bir nokta tahmin edici, n Xn X i 1 i n ve 1 güven katsayılı bir güven aralığı, ( X n z1 / 2 Sn 1 , X n z1 / 2 Sn 1 ) n n dır. Bernoulli dağılımından alınan örneklemler için n n i 1 i 1 X i X i2 olmak üzere, n Sn2- 1 = å n å ( X i - X )2 i= 1 n- 1 = n å X i2 - nX n2 i= 1 n- 1 = X i - nX n2 i= 1 n- 1 = nX n - nX n2 nX n (1- X n ) = n- 1 n- 1 olup, p için 1 güven katsayılı bir güven aralığı, X n (1 X n ) X n (1 X n ) , X n z1 / 2 X n z1 / 2 n 1 n 1 dır. Örnek 7 Rasgele seçilen 100 öğrenciden 40 tanesinin sigara içtiği gözlenmiştir. Sigara içenlerin kitledeki oranı p için 1 %95 güven katsayılı bir güven aralığı, 0.40(1 0.40) 0.40(1 0.40) , 0.40 1.96 0.40 1.96 100 1 100 1 (0.3035 , 0.4965 dır.