DEĞİŞKENLİK ÖLÇÜLERİ Değişkenlik (Yayılım) Ölçüleri • İki farklı anakütleyi birbirinden ayırmak için her zaman yalnızca yer ölçüleri yeterli olmayabilir. • Dağılımları birbirinden ayırt etmede kullanılan ve genellikle aritmetik ortalama etrafındaki değişimi dikkate alarak hesaplanan istatistiklere değişkenlik(yayılım) ölçüleri adı verilir. 2 400 Frekans Frekans Aşağıdaki iki grafik n = 1500 hacimlik alınan iki farklı örnek doğrultusunda oluşturulan histogramlardır. Her iki örnek ortalaması yaklaşık olarak 100 olduğuna göre iki örneğin aynı anakütleden alındığı söylenebilir mi? 300 1200 1000 800 200 600 400 100 200 0 0 3 12 3 3 ,3 33 33 33 3 9, 10 , 95 , 81 , 67 33 9, 3 ,3 3 ,3 3 ,3 33 3, 12 10 95 81 67 X X 3 • İki örneğin aynı anakütleden geldiği söylenemez. • Bunun nedeni alınan örnek sonucunda oluşturulan histogramda dağılımların ortalama etrafında farklı olmasından kaynaklanmaktadır. • Dağılımları birbirinden ayırt etmede kullanılan yayılım ölçüleri aritmetik ortalama etrafındaki değişimleri dikkate alan tanımlayıcı istatistiklerdir. • Bir veri setinde aritmetik ortalamalardan her bir gözlemin farkı alınıp bu değerlerin tümü toplandığında sonucun 0 olduğu görülür. 4 • Örnek: 4,8,9,13,16 şeklinde verilen bir basit seri için; n x 4 8 9 13 16 x 10 n 5 i 1 i x x 4 10 8 10 9 10 n i 1 i 13 10 16 10 0 • Bu örnekten görüleceği üzere gözlemlerin aritmetik ortalamadan uzaklığı alıp toplandığında 0 elde edildiğinden dolayı bu problem mutlaka değer kullanarak veya karesel uzaklık alınarak ortadan kaldırılır. 5 2) Varyans Ortalama mutlak sapmada kullanılan mutlak değerli ifadeler ile işlem yapmanın zor hatta bazı durumlarda imkansız olması sebebiyle yeni değişkenlik ölçüsüne ihtiyaç bulunmaktadır. • • Mutlak değer ifadesindeki zorluk aritmetik ortalamadan farkların karelerinin alınmasıyla ortadan kalkmaktadır. • Veri setindeki her bir gözlem değerinin aritmetik ortalamadan farklarının karelerinin toplamının örnek hacminin bir eksiğine bölünmesinden elde edilen değişkenlik ölçüsüne örnek varyansı adı verilir. 6 Basit seriler İçin: Populasyon Varyansı: m : Populasyon Ortalaması x m 2 2 i N N : Populasyon Hacmi x x n Örnek Varyansı : s 2 s2 n 1 i 1 s2 f i ( xi x ) 2 k f k Sınıflanmış Seriler İçin : i i 1 k Gruplanmış Seriler İçin: 2 i 1 i 1 i 1 f i (mi x ) 2 k f i 1 i 1 7 x x n 2 i i 1 ifadesi istatistikte bir çok formülde kullanılır ve kareler toplamı olarak adlandırılır. • Matematiksel olarak hesaplama kolaylığı sağlaması açısından formüllerde kareler toplamının açılımı olan aşağıdaki eşitlik kullanılabilir. x 2 n x x x n i 1 2 i n i 1 2 i i i 1 n 8 x 2 n n Basit Seriler İçin: x s i 1 i i 1 2 2 n 1 n fx 2 k k fx i i Gruplanmış Seriler İçin: s 2 i i i k i f 2 i 1 i k f 1 i 1 i f i mi f m2 i k k i Sınıflanmış Seriler İçin : s i i 2 k f 2 i 1 k f i 1 i i 1 9 3) Standart Sapma • Varyans hesaplanırken kullanılan verilerin kareleri alındığından verilerin ölçü biriminin karesi varyansında ölçü birimi mevcut ölçü birimini karesi olur. • Örnek: kg2, cm2 gibi. • Bu nitelendirme veriler açısından bir anlam taşımayacağından varyans yerine ortalama etrafındaki değişimin bir ölçüsü olarak onun pozitif karekökü olan standart sapma kullanılır. 10 Basit seriler İçin: x m 2 Populasyon Standart Sapması: i N m : Populasyon Standart Sapması N : Populasyon Hacmi x x n Örnek Standart Sapması : s 2 i i 1 n 1 k Gruplanmış Seriler İçin: s f (x x) i i 1 f k Sınıflanmış Seriler İçin : s i k i 1 i 1 2 i 1 f i (mi x ) 2 k f i 1 i 1 11 Örnek: İstatistik I dersini alan 10 öğrencinin vize notları aşağıdaki gibi sıralanmıştır. Buna göre vize notları için varyans ve standart sapmayı hesaplayınız. n x 30,41,53,61,68,79,82,88,90,98 x x n s 2 i 1 2 i i 1 n i 30 41 .... 98 69 10 30 69 41 69 ... 98 69 2 2 n 1 4538 504,22 9 s 504,22 2 x → 2 9 s s 504,22 22,45 2 İstatistik I vizesinden alınan notların ortalama etrafında yaklaşık olarak 22 puan değiştiği görülmektedir. 12 Aynı soru kareler ortalamasının açılımı kullanılarak çözüldüğünde aynı sonuçları verecektir. 30,41,53,61,68,79,82,88,90,98 n x 30 41 53 61 68 79 82 88 90 900 1681 2809 3721 4624 6241 6724 7744 8100 x 690 i 1 i 2 x n x 2 n n s 2 x i 1 2 i i 1 n 1 n 690 52148 2 10 9 s 504,22 2 s s 504,22 22,45 2 x 52148 i 1 2 i 13 Örnek: Yandaki tabloda bir Samsung bayisindeki LCD televizyonların ekran boyutlarına göre satış miktarları verilmiştir. Frekans dağılımının varyans ve standart sapmasını hesaplayınız. Grup Frekans xifi 51 66 72 82 94 fx i s i 2 fx i i i f i 1 k f 1 i i 1605 131607 2 i k 2 i 1 1 51 2601 3 198 13068 4 288 20736 5 410 33620 7 658 61852 ∑fi =20 1605 131607 2 k k xi2 fi 20 19 147,67 s s 147,67 12,15 2 14 Örnek: Aşağıdaki tabloda 30 günlük süre içinde bir restoranın kullandığı et miktarının dağılımı verilmiştir. Günlük kullanılan et miktarının varyansını ve standart sapmasını hesaplayınız. fi( mi x )2 Sınıflar fi mi 2(33-46,6)2 30-36’dan az 2 33 k m f 6(39-46,6)2 36-42’den az 6 39 i i 10(45-46,6)2 x i1 k 42-48’den az 10 45 46,6kg. 2 7(51-46,6) 48-54’dan az 7 51 f i 2 i1 4(57-46,6) 54-60’den az 4 57 1(63-46,6)2 60-66’den az 1 63 Toplam 30 1579,2 k s 2 f (m x ) i 1 i i k f 1 i 1 i 2 1579,2 54,46 30 1 s s 54,46 7,38 kg. 2 15 % 57.5 % 68.27 % 95.45 % 99.73 -3 x x OMS -2 - - OMS m OMS 2 3 gözlemlerin %68.27’sini gözlemlerin %57.5’ini kapsar 16 4) Range (Değişim Aralığı) Veri setindeki yayılımı ifade etmede kullanılan en basit istatistik değişim aralığıdır. Genel olarak basit seriler için kullanılır. • • En büyük gözlem değeri ile en küçük gözlem değeri arasındaki fark değişim aralığını verir. • Veri setindeki tek bir gözlemin aşırı derecede küçük veya büyük olmasından etkilendiği için bir başak ifadeyle örnekte yer alan sadece iki veri kullanılarak hesaplanmasından dolayı tüm veri setinin değişkenliğini açıklamak için yetersiz kalmaktadır. 17 • R = Xmax – Xmin X: SÜREKLİ ŞANS DEĞİŞKENİ • R = Xmax – Xmin +1 X: KESİKLİ ŞANS DEĞİŞKENİ Örnek: Bir fabrikada çalışan 5 endüstri mühendisinin bildiği yabancı dil sayıları aşağıda verilmiştir. Buna göre bu mühendislerin bildiği yabancı dil sayısı için değişim aralığını hesaplayınız. 2,0,1,2,0 Xİ = 0,0,1,2,2. n=5 i: 1,2,3,4,5. • R = Xmax – Xmin +1 = 2 – 0 + 1 = 3 18 Örnek: Kuruyemiş satan bir dükkanda bir haftalık sürede satılan leblebi, fıstık ve bademlerin ortalamaları ve standart sapmaları aşağıda verilmiştir. Buna göre kuruyemişleri değişkenlikleri açısından karşılaştırınız ve kuruyemişin değişkenliğinin daha fazla olduğunu belirtiniz. x s Leblebi 30 kg. 5 kg. Fıstık 40 kg. 4 kg. Badem 10 kg. 3 kg. C Vleblebi s 5 *100 *100 16,67 %16,67 X 30 C V fııstı C VBADEM s 4 *100 *100 10 %10 X 40 s 3 *100 *100 30 %30 X 10 Üç kuruyemişin değişkenlikleri karşılaştırıldığında en küçük standart sapma değeri bademde olmasına rağmen en büyük varyasyon katsayısına sahip olduğundan en fazla değişkenliğin bademde olduğu görülür. Aritmetik ortalamalar içerisinde standart 19 sapma yüzdelerine bakıldığında en büyük yüzde bademdedir. 5) Değişkenlik(Varyasyon) Katsayısı • İki veya daha fazla populasyon üzerinde aynı şans değişkenleri için yapılan araştırmalarda değişkenliklerin karşılaştırılması için kullanılan bir ölçüdür. Varyasyon Katsayısı: • Standart sapmayı ortalamanın bir yüzdesi olarak ifade eden ve iki veya daha fazla populasyondaki varyasyonu CV (değişkenliği) karşılaştırmada kullanılan ölçüye varyasyon(değişkenlik) katsayısı denir. •%’ler azaldıkça araştırmanın hassasiyeti artar. s *100 X •Örnek: İstanbul’da ve Ankara’da yaşayan ailelerin aylık gelirlerinin değişkenliklerinin karşılaştırılması 20 Örnek: Kuruyemiş satan bir dükkanda bir haftalık sürede satılan leblebi, fıstık ve bademlerin ortalamaları ve standart sapmaları aşağıda verilmiştir. Buna göre kuruyemişleri değişkenlikleri açısından karşılaştırınız ve kuruyemişin değişkenliğinin daha fazla olduğunu belirtiniz. x s Leblebi 30 kg. 5 kg. Fıstık 40 kg. 4 kg. Badem 10 kg. 3 kg. C Vleblebi s 5 *100 *100 16,67 %16,67 X 30 C V fııstı C VBADEM s 4 *100 *100 10 %10 X 40 s 3 *100 *100 30 %30 X 10 Üç kuruyemişin değişkenlikleri karşılaştırıldığında en küçük standart sapma değeri bademde olmasına rağmen en büyük varyasyon katsayısına sahip olduğundan en fazla değişkenliğin bademde olduğu görülür. Aritmetik ortalamalar içerisinde standart 21 sapma yüzdelerine bakıldığında en büyük yüzde bademdedir. Çarpıklık (Asimetri) Ölçüleri • Populasyonları birbirinden ayırmak için her zaman yalnızca yer ve yayılım ölçüleri yeterli olmayabilir. Aşağıda iki farklı populasyondan alınmış örnekler için oluşturulan histogramlar verilmiştir. 0 mA 0 m A B 22 • Şekilden görüleceği üzere A ve B örneklerinin aynı ortalamaya ve yaklaşık olarak aynı değişkenliğe sahip olmalarına rağmen bu iki örneğin açıkça aynı populasyondan gelmediği söylenir. • Asimetri (çarpıklık) ifadesi simetrik olmayan anlamını taşımaktadır. •Şekillere bakıldığında frekansların A’da daha çok sol tarafta (küçük xi değerlerinde), B’de ise daha çok sağ tarafta (büyük xi değerlerinde), toplandığı görülmektedir. 23 Asimetri Ölçüleri PEARSON ÇARPIKLIK ÖLÇÜSÜ x mod Skp s 3( X med) Skp s veya SkP < 0 →Negatif çarpık(Sola) SkP > 0 → Pozitif Çarpık(Sağa) SkP = 0 ise dağılış simetrik 24 Simetrik Dağılım A.O = Med = Mod İki modlu simetrik dağılım Sağa çarpık dağılım Sola çarpık dağılım A.O > Med > Mod A.O < Med < Mod Modu olmayan dağılım Tekdüzen dağılım 25 Örnek: Aşağıdaki tabloda 30 günlük süre içinde bir restoranın kullandığı et miktarının dağılımından elde edilen bazı tanımlayıcı istatistikler verilmiştir. Buna göre pearson ve bowley asimetri ölçülerini hesaplayıp yorumlayınız. Aritmetik Ort. Mod Medyan Q1 Q2 s2 46,6 45,4 46,2 41,5 51,9 54,46 Sk p 3( X med ) 3(46,6 46,2) 0,16 0 s 54,46 x mod 46,6 45,4 Sk p 0,16 0 s 54,46 Sağa Çarpık , Pozitif Asimetri Sağa Çarpık, Pozitif Asimetri (Q3 Q2 ) (Q2 Q1 ) (51,9 46,2) (46,2 41,5) Skb Q3 Q1 51,9 41,5 1 0,10 0 10,4 Sağa Çarpık , Pozitif Asimetri 26