Merkezi eğilim ve dağılma ölçüleri İstatistik ve Olasılık Ders 3: MERKEZİ EĞİLİM VE DAĞILMA ÖLÇÜLERİ Prof. Dr. İrfan KAYMAZ Erzurum Teknik Üniversitesi Tanım Merkezi eğilim ve dağılma ölçüleri Araştırma sonuçlarının açıklanmasında frekans tablosu ve poligonu istenilen bilgiyi her zaman sağlamayabilir. Verilerin merkezileştiği noktanın değeri nedir? Dağılımın değişkenlik durumu ne ölçüdedir? soruların cevaplanabilmesi için dağılımı karakterize eden bazı değerlerin hesaplanması gerekir. Bu amaçla veri grubuna ilişkin yer ve dağılma ölçülerinden yararlanılır. Merkezi Eğilim Ölçüleri Dağılım (Değişim) Ölçüleri Aritmetik Ortalama Değişim Genişliği Ağırlıklı (Tartılı) Ortalama Varyans Geometrik Ortalama Standart Sapma Harmonik Ortalama Varyasyon Katsayısı Medyan (Ortanca) Mod (Tepe Değeri) Erzurum Teknik Üniversitesi Aritmetik Ortalama Merkezi eğilim ve dağılma ölçüleri Dağılımın yerinin belirlenmesinde kullanılır. Tek başına ortalama teriminden aritmetik ortalama anlaşılır. Basit aritmetik ortalama herhangi bir konu ile ilgili gözlemlerin toplamının toplam gözlem sayısına bölümü ile bulunur. X1, X2, X3,......, Xn gözlenen örnek değerlerini göstermek üzere aritmetik ortalama: n Xi X1 X 2 X 3 ........ X n X i1 n n Erzurum Teknik Üniversitesi Merkezi eğilim ve dağılma ölçüleri Aritmetik Ortalama Aritmetik ortalamanın iki önemli özelliği vardır: 1. Verilerin, aritmetik ortalamadan sapmalarının toplamı sıfıra eşittir. n n n n n n X i i1 i1 i1 i1 n ( X i X) 0 X i X 0 X i i1 0 2. Verilerin, aritmetik ortalamadan sapmalarının kareleri toplamı minimumdur. Herhangi bir değeri a ile gösterirsek ifade aşağıdaki gibi yazılabilir. n n i1 i1 ( X i X) 2 ( X i a ) 2 Erzurum Teknik Üniversitesi Ağırlıklı Ortalama Merkezi eğilim ve dağılma ölçüleri Bazı durumlarda verilerin aritmetik ortalaması sonuç hakkında pek fazla açıklayıcı bilgi taşımaz. Örneğin farklı krediye sahip dersler almış olan bir öğrencinin başarı ortalaması hesaplanırken aritmetik ortalama ile anlamsız sonuçlar bulunur. Böylesi durumlarda verilerin gözlenen frekansları ile çarpılıp toplanması ve elde edilen değerin toplam frekansa bölünmesi ile bulunan değer kullanılır. Bu işleme ağırlıklı ortalama denir. Xi gözlenen i. veri, Wi i. verinin gözlenen ağırlığı (frekansı) olmak üzere ağırlıklı ortalama: n X Wi X i i1 n Wi i1 Erzurum Teknik Üniversitesi Ağırlıklı Ortalama Merkezi eğilim ve dağılma ölçüleri Örnek 1: Bir öğrencinin almış olduğu derslere ilişkin krediler ve notlar aşağıda verilmiştir. Ders Kredi Not Matematik 6 54 Kimya 4 50 Makina Bilgisi 2 54 Teknik Resim 5 51 Ölçme Tekniği 3 67 Öğrencinin başarı notunu; a) Aritmetik ortalama yöntemiyle hesaplayınız. b) Ağırlıklı ortalama yöntemiyle hesaplayınız. c) Hangi yöntemin sonucu kullanılmalıdır? Neden? Erzurum Teknik Üniversitesi Ağırlıklı Ortalama Merkezi eğilim ve dağılma ölçüleri Çözüm 1: a) X 54 50 54 51 67 276 55.2 5 b) X 5 6 * 54 4 * 50 2 * 54 5 * 51 3 * 67 1088 54.4 6 4 2 5 3 20 c) Gözlenen değerlerin (öğrencinin notlarının) frekansları (kredileri) farklı olduğundan ağırlıklı ortalama kullanılmalıdır. Erzurum Teknik Üniversitesi Geometrik Ortalama Merkezi eğilim ve dağılma ölçüleri Özellikle eşit zaman aralığı ile değişen oranların ortalamasının hesaplanmasında (örneğin, nüfus artışı, faiz gibi olaylarda ortalama artış hızını hesaplayabilmek için) geometrik ortalama kullanılır. Geometrik ortalama: GO n X1 * X 2 * X 3 *.......*Xn Örnek 2: Akaryakıt fiyatlarında ardışık 3 yıldaki fiyat artışı %15, %20 ve %24 olarak gerçekleşmiştir. Ortalama artış oranını hesaplayınız. Çözüm 2: GO 3 15 * 20 * 24 %19.309 Erzurum Teknik Üniversitesi Harmonik Ortalama Merkezi eğilim ve dağılma ölçüleri Verilerin terslerinin ortalamasının tersi harmonik ortalamayı verir. HO n 1 1 1 ........ X1 X 2 Xn 1 1 n 1 n i1 X i Oran şeklinde türetilmiş verilerde, oran elde edilirken, d/t, eğer pay (d) sabit payda (t) değişken ise oranların ortalaması harmonik ortalama ile hesaplanır. Bunun tersi durumda ise aritmetik ortalama kullanılır. Örneğin, hız=yol/zaman veya fiyat=para/mal şeklinde ifade edilen olaylarda; zamanın değişken gidilen yolun sabit, alınan mal miktarının değişken paranın sabit olması halinde harmonik ortalama kullanılır. Erzurum Teknik Üniversitesi Merkezi eğilim ve dağılma ölçüleri Harmonik Ortalama Örnek 3: Bir sürücü 200 km’lik yolu 2 saatte gitmiş ve 4 saatte dönmüştür. Bu yolculukta sürücünün ortalama hızını hesaplayınız. Çözüm 3: Hız=yol/zaman Gidiş hızı=200/2=100km/s Dönüş hızı=200/4=50km/s HO 1 1 1 1 2 100 50 2 1 1 100 50 66.67km / s Üç ortalama arasında: AO GO HO ilişkisi vardır. Bütün değerlerin aynı olması halinde ilişki eşitlik halinde gerçekleşir. Erzurum Teknik Üniversitesi Medyan (Ortanca) Merkezi eğilim ve dağılma ölçüleri Verilerin küçükten büyüğe veya büyükten küçüğe sıralanması halinde ortaya düşen değer (veri sayısı tek ise) veya ortaya düşen iki değer çiftinin ortalaması (veri sayısı çift ise) medyan olarak adlandırılır. n veri sayısını göstermek üzere; Gruplandırılmış verilerde (frekans tablosunda) medyan hesabı: L: Medyan sınıfının alt sınırı N N: Toplam gözlem sayısı Fb Medyan L 2 * c c: Sınıf aralığı (genişliği) Fmed Fmed: Medyan sınıfının frekansı Fb: Medyan sınıfından önceki sınıfların frekans toplamı Medyan ortalamaya nazaran uç değerlerden etkilenmez veya çok az etkilenir ve daha az işlem yükü getirir. Sayılan bu yararlarına karşın ortalama gibi analitik bir değere sahip değildir. Medyanın standart sapması ortalamanınkinden büyüktür Erzurum Teknik Üniversitesi Mod (Tepe Değeri) Merkezi eğilim ve dağılma ölçüleri Verilerin içinde en çok tekrarlanan (frekansı en büyük olan) değer mod olarak adlandırılır. Gruplandırılmış verilerde (frekans tablosunda) mod hesabı aşağıdaki formül yardımıyla yapılmaktadır. L: Mod sınıfının alt sınırı d1 d1: Mod sınıfı frekansı ile bir önceki sınıf frekansı Mod L *c arasındaki fark d1 d 2 d2: Mod sınıfı frekansı ile bir sonraki sınıfın frekansı arasındaki fark c: Sınıf aralığı (genişliği) Frekansı en yüksek olduğu sınıf mod sınıfı olarak adlandırılır. Mod değerinin anlamlı olabilmesi için gözlem sayısının çok fazla olması gerekir. Bazen veri gurubunun birden fazla modu olabilir. Bu durum, ilgili anakütlenin birkaç alt gruptan meydan geldiğini gösterir. mod veri grubundaki uç değerlerden etkilenmez. Erzurum Teknik Üniversitesi Merkezi eğilim ve dağılma ölçüleri Mod (Tepe Değeri) Örnek 4: Aşağıdaki verilerin modunu ve medyanını belirleyiniz. 120 100 130 100 160 130 86 100 94 90 Çözüm 3: Verileri küçükten büyüğe sıralayalım. 1.değer 2.değer 3.değer 4.değer 5.değer 6.değer 7.değer 8.değer 9.değer 10.değer 86 90 94 100 100 100 120 130 130 160 Veri grubunda en çok tekrarlanan değer 100 olduğu için Mod=100 Veri sayısı n=10 çift Erzurum Teknik Üniversitesi Dağılım Ölçüleri Merkezi eğilim ve dağılma ölçüleri Yer (merkezi eğilim) ölçüleri tek başına dağılımı karakterize etmez. Verilerin yer ölçülerinden uzaklık durumlarını, yani değişkenliklerini belirtmek için diğer bazı ölçülerin kullanılması gerekir. Verilerin değişkenlik durumunu ve dağılım şeklini belirlemek için kullanılan ölçülere dağılım ölçüleri denir. İki veri grubu ortalamasının eşit olması dağılımlarının aynı olmasını gerektirmez. Dağılım şeklinin ve değişkenliğinin karşılaştırılması dağılım ölçüleri ile belirlenir. Dağılım (Değişim) Ölçüleri Değişim Genişliği Varyans Standart Sapma Varyasyon Katsayısı Erzurum Teknik Üniversitesi Değişim Genişliği Merkezi eğilim ve dağılma ölçüleri Değişkenliğin en basit ölçüsüdür. Erzurum Teknik Üniversitesi Varyans Merkezi eğilim ve dağılma ölçüleri Verilerin ortalamasından sapmalarının büyüklüğü dağılımın değişkenliğini gösteren iyi bir ölçüdür. Yaygın olarak kullanılan bu değişkenlik ölçüsü varyanstır. Varyansın büyüklüğü veri grubundaki değişkenliğin fazlalığını ve veri grubunun dağılımının yayvanlığını gösterir. Varyans, değişim genişliğinden daha hassas bir ölçüdür. Öte yandan, varyansın birimi olmadığından bazı durumlarda verilerin elde edildiği birime sahip bir ölçü kullanılması daha uygun olmaktadır. Böyle bir ölçü varyansın karekökü olan standart sapmadır. Erzurum Teknik Üniversitesi Standart Sapma Merkezi eğilim ve dağılma ölçüleri Dağılım ölçüsünü fiziksel anlamı olan bir büyüklük şeklinde ifade etmek için varyansın karekökü alınır ve buna standart sapma denir. Örnek standart sapmasının ve varyansının paydasında bulunan n-1 ifadesi serbestlik derecesi olarak adlandırılır. Erzurum Teknik Üniversitesi Varyasyon Katsayısı Merkezi eğilim ve dağılma ölçüleri Verilerin değişkenliğini kendi ortalamalarına oranla ifade etmek için kullanılan bir ölçüdür. Değişim Katsayısı olarak da adlandırılır. Ortalamaları birbirinden farklı olan anakütlelerin değişkenliklerinin karşılaştırılmasında değişim katsayısı ölçüsü kullanılmalıdır. Değişim katsayısının büyüklüğü arttıkça istenilen değerden uzaklaşıldığı söylenebilir Erzurum Teknik Üniversitesi Örnek Merkezi eğilim ve dağılma ölçüleri Örnek 5: Bir üretim hattından kg olarak alınan ağırlık ölçümleri 35 40 45 30 40 50 35 38 42 olarak belirlendiğine göre verilerin değişim genişliğini, varyansını, standart sapmasını ve değişim katsayısını hesaplayınız. 44 Çözüm 5: DG=50-30=20 _ X 35 40 45 30 40 50 35 38 42 44 39.9 10 2 2 2 ( 35 39 . 9 ) ( 40 39 . 9 ) .............. ( 42 39 . 9 ) S2 33.21 10 1 S 33.21 5.76 5.76 DK * 100 %14.44 39.9 Erzurum Teknik Üniversitesi Çarpıklık ve Basıklık Merkezi eğilim ve dağılma ölçüleri Çarpıklık Normal dağılımda simetrikliğin bozulma derecesi çarpıklık olarak ifade edilir. Dağılım sağa doğru uzun kuyruklu ise sağa çarpık, sola doğru uzun kuyruklu ise sola çarpık olarak adlandırılır. Çarpıklık katsayısı : n 3 ( X ) i i 1 3 n 3 m3 3 Hesap sonunda bulunan katsayıya göre dağılımın yorumu aşağıdaki gibi yapılır: Erzurum Teknik Üniversitesi Merkezi eğilim ve dağılma ölçüleri Çarpıklık ve Basıklık Basıklık Normal dağılım eğrisinin sivrilik ya da basıklık derecesi n ( Xi ) 4 i 1 4 n 4 m4 4 Hesap sonunda bulunan katsayıya göre dağılımın yorumu aşağıdaki gibi yapılır: Erzurum Teknik Üniversitesi MATLAB Komutları Merkezi eğilim ve dağılma ölçüleri ARİTMETİK ORTALAMA Yazım Biçimi M=mean(A) Açıklama A dizi vektörü veya matris olarak tanımlanan sayıların aritmetik ortalamayı verir Örnek: 1 5 6 8 10 11 12 14 15 7 sayılarının ortalamasını veren program Örnek: Aşağıda verilen matrisin ortalaması her bir sütunun ortalamasını veren bir vektör olarak elde edilir. Erzurum Teknik Üniversitesi MATLAB Komutları Merkezi eğilim ve dağılma ölçüleri HARMONİK VE GEOMETRİK ORTALAMA Erzurum Teknik Üniversitesi MATLAB Komutları Merkezi eğilim ve dağılma ölçüleri STANDART SAPMA Yazım Biçimi s=std(A) s=std(A,flag) Açıklama A dizi vektörü veya matris olarak tanımlanan sayıların standart sapmasını verir A dizi vektörü veya matris olarak tanımlanan sayıların standart sapmasını verir flag=0 ise örneğin standart sapması flag=1 ise anakütle standart sapması hesaplanır Örnek: 1 5 6 8 10 11 12 14 15 7 sayılarının standart sapmasını veren program Erzurum Teknik Üniversitesi MATLAB Komutları Merkezi eğilim ve dağılma ölçüleri MEDYAN Yazım Biçimi ortanca=median(A) Açıklama A dizi vektörü veya matris olarak tanımlanan sayıların medyan (ortanca) değerini verir Örnek: 1 5 6 8 10 11 12 14 15 7 sayılarının medyan değerini veren program Erzurum Teknik Üniversitesi MATLAB Komutları Merkezi eğilim ve dağılma ölçüleri MOD Yazım Biçimi t=mode(A) Açıklama A dizi vektörü veya matris olarak tanımlanan sayıların mode(en fazla tekrar edilen sayı) değerini verir Örnek: 1 5 6 5 10 11 12 11 15 11 sayılarının medyan değerini veren program Erzurum Teknik Üniversitesi Gelecek dersin konusu Merkezi eğilim ve dağılma ölçüleri Olasılık….. Prof. Dr. rfan KAYMAZ'n ders notlarndan alnmtr. Erzurum Teknik Üniversitesi