Tanımlayıcı İstatistikler (Descriptive Statistics) Dr. Musa KILIÇ http://kisi.deu.edu.tr/musa.kilic TANIMLAYICI ÖRNEK İSTATİSTİKLERİ YER ÖLÇÜLERİ (Frekans dağılışının absis eksenindeki durumunu belirtir.) 1. Aritmetik Ortalama 2. Diğer Ortalamalar - Geometrik Ortalama - Harmonik Ortalama - Ağırlıklı Ortalama 3. Ortanca (Medyan) 4. Tepe Değeri (Mod) DEĞİŞİM ÖLÇÜLERİ ( Frekans dağılışının şeklini belirtir.) 1. Değişim Aralığı 2. Ortalama Sapma Ortalama Mutlak Sapma 3. Varyans 4. Standart Sapma 5. Değişim Katsayısı http://kisi.deu.edu.tr/musa.kilic YER ÖLÇÜLERİ Aritmetik Ortalama: • Değişken • Örnek büyüklüğü • Teksel gözlemler 1 n x = ∑ xi n i =1 • :X :n : x1, x2, x3,…, xn ………tek tek veriler için n adet gözlemin bazı durumlarda değerinin değişik frekanslarla tekrarlanması durumunda x= 1 ∑f k ∑fx i i =1 i i ……… gruplandırılmış veriler için Örnek: Bir öğrencinin beş ayrı dersten aldığı notlar: 72,66,88,92,76 ise Öğrencinin not ortalaması: 1 n =5 1 x = ∑ xi = (72 + 66 + 88 + 92 + 76) = 78,8 5 i =1 5 http://kisi.deu.edu.tr/musa.kilic YER ÖLÇÜLERİ Ağırlıklı Ortalama n xa = ∑a x i =1 n i i Not Haftalık Ders Saati 1. Ders 72 5 2. Ders 66 4 3. Ders 88 4 4. Ders 92 2 5. Ders 76 4 ∑ ai i =1 xa:Ağırlıklı ortalama, xi: i. gözlem, ai:i. gözlem değerinin ağırlığı • Örnek: Yukarıdaki örnekteki öğrencinin ağırlıklı not ortalaması (Haftalık ders saatine göre ağırlıklı not ortalaması) Örneği oluşturan gözlemlerin ağırlıkları birbirine oranla farklı olduğu zaman kullanılır. xa = (72 x5 + 66 x 4 + 88 x 4 + 92 x 2 + 76 x 4) 5+4+4+2+4 xa = 360 + 264 + 352 + 184 + 304 1464 = = 77,05 19 19 http://kisi.deu.edu.tr/musa.kilic YER ÖLÇÜLERİ Geometrik Ortalama Logaritmaları alınan değişkenlerin tekrar orijinal şekle dönüştürülmüş ortalamasına “geometrik ortalama” denir. 1 n G.O.x = anti log ∑ log xi n i =1 G.O.x = ( x1.x2 .x3 ...xn ) 1 n http://kisi.deu.edu.tr/musa.kilic YER ÖLÇÜLERİ Harmonik Ortalama Bir X değişkeninin tersi (1/x) alınarak dönüşüm yapılır ve gözlemlerin terslerinin aritmetik ortalaması hesaplanırsa elde edilen ortalamaya “Harmonik Ortalama” denir. 1 1 n 1 = ∑ H x n i =1 xi • Örnek: Öğrencinin notları : 72, 66, 88, 92, 76 1 G.Ox = anti log (log 72 + log 66 + log 88 + log 92 + log 76 ) n 1 G.Ox = anti log (1,86 + 1,82 + 1,94 + 1,96 + 1,88) 5 = 78,197 1 1 1 1 1 1 1 = + + + + H x 5 72 66 88 92 76 1 = 0,01288 Hx H x = 77,602 http://kisi.deu.edu.tr/musa.kilic YER ÖLÇÜLERİ Ortanca (Medyan) Bir değişken için yapılan gözlemlerin büyükten küçüğe (veya küçükten büyüğe) sıralanmasından sonra kendisinden küçük ve kendisinden büyük eşit sayıda gözlem bırakan değer “ortanca” olarak tanımlanır ve M ile gösterilir. Ortanca, frekans dağılışını iki eşit kısma böler. Gözlem sayısı tek ise ortanca büyüklük sırasına konmuş verilerden (n+1)/2’ncidir. Gözlem sayısı çift ise ortanca büyüklük sırasına göre konmuş verilerden n/2’nci ile (n/2)+1’incinin ortalaması olarak hesaplanır. Örnek: 14,15,16,19,19,29 1 M = (16 + 19) = 17,5 2 http://kisi.deu.edu.tr/musa.kilic YER ÖLÇÜLERİ • Kartil: %25, %50, %75 noktalarında dağılışı dört eşit parçaya böler. • Desil: %10, % 20,…, %80,%90 noktalarında dağılışı on eşit parçaya böler. • Persentil: %1, %2,…, %99 noktalarında dağılışı yüz eşit parçaya böler. http://kisi.deu.edu.tr/musa.kilic YER ÖLÇÜLERİ Tepe Değeri (Mod) • Bir frekans dağılışında en çok tekrarlanan değer, üzerinde çalışılan değişkenin “tepe değeri” olarak tanımlanır. • Frekans tablosu oluşturulmuşsa (veriler sınıflanmışsa) tek bir tepe değeri yerine tepe değerini içine alan sınıfın orta değerini vermek daha uygun olur. (Tepe değeri sınıfı) • Dağılış iki tepe değerine sahipse bimodal (iki tepeli); ikiden çok tepe değerine sahipse multimodal (çok tepeli) olarak adlandırılır. http://kisi.deu.edu.tr/musa.kilic DEĞİŞİM ÖLÇÜLERİ Değişim Aralığı (Range) Değişim Aralığı (R) = Xmaks- Xmin Değişimi belirleyen en basit ölçüdür. Gözlem serisi içindeki ekstrem değerlerden çok etkilenir. Gözlemlerin ölçüm birimi ile ifade edilir. http://kisi.deu.edu.tr/musa.kilic DEĞİŞİM ÖLÇÜLERİ Ortalama Sapma, Ortalama Mutlak Sapma İyi bir değişken ölçüsü bir dağılışta yer alan tüm verilerin dağılışın merkezinden uzaklıklarını kullanan bir ölçü olmalıdır. Değişim aralığı sadece iki veriden hesaplandığı için iyi bir değişim ölçüsü olarak kullanılmaz. Ortalama Sapma = 1 n ( xi − x ) ∑ n i =1 Ortalama Mutlak Sapma= 1 ∑ xi − x n Sapmalar toplamı daima “sıfır”dır. Ortalama mutlak sapmada mutlak değerlerin kullanılması nedeniyle matematiksel işlem zorluğu vardır. http://kisi.deu.edu.tr/musa.kilic DEĞİŞİM ÖLÇÜLERİ Varyans (Variance) • Ortalamadan sapmalar kareler toplamının ortalaması Tek tek veriler için: Varyans: Gruplandırılmış veriler için: n 1 s = ∑ ( xi − x ) 2 n i =1 2 s = ∑ f (x − x) k ∑f i =1 • k 1 2 i =1 i 2 i i Varyans hesaplanırken ölçüm birimi ile ifade edilen sapmaların kareleri alındığından varyans, ölçüm biriminin karesi şeklinde belirtilir. Standart Sapma (Standart Deviation) • Varyansın pozitif kareköküdür. Standart Sapma : 1 n ( xi − x ) 2 s=+ ∑ n i =1 s=+ ∑ f (x − x) k ∑f i =1 • k 1 i =1 i 2 i i Standart sapmanın birimi gözlemlerin elde edilmesinde kullanılan ölçüm birimidir. Değişim Katsayısı (Varyasyon Katsayısı, Coefficient of Variation) s CV (%) = 100(%) x http://kisi.deu.edu.tr/musa.kilic Gruplanmamış (tek tek) veriler için örnek: • Bir işletmedeki yıllık izinler gün olarak aşağıdaki gibidir. 8,8,7,7,7,6,6,5,5,4,4,3 Buna göre; a) Ortalama izin kaç gündür? b) Bu grubun ortancası(medyanı) kaçtır? c) Mod'u kaçtır? d) Ranj'ı(Değişim aralığı) kaçtır? e) Standart sapması kaçtır? f) Değişim katsayısı kaçtır? http://kisi.deu.edu.tr/musa.kilic Histogram http://kisi.deu.edu.tr/musa.kilic Gövde-Yaprak (Stem-and-Leaf) http://kisi.deu.edu.tr/musa.kilic Kutu-Bıyık (BoxPlot) http://kisi.deu.edu.tr/musa.kilic Kutu-Bıyık (BoxPlot) http://kisi.deu.edu.tr/musa.kilic Skewness (Çarpıklık) Skewness (Çarpıklık) http://kisi.deu.edu.tr/musa.kilic http://kisi.deu.edu.tr/musa.kilic Kurtosis (Basıklık) http://kisi.deu.edu.tr/musa.kilic Pareto Diyagramı İstatistiksel Kalite Kontrolü’nde sıkça kullanılan araçlardan bir tanesidir. Kategorilere ayrılmış değişkenleri frekanslarına göre büyükten küçüğe sıralayan ve aynı grafikte kümülatif yüzdelerini de gösteren grafik çeşididir. http://kisi.deu.edu.tr/musa.kilic