Merkezi Eğilim Ölçüleri (Ortalamalar) • Analitik Ortalamalar – Aritmetik – Geometrik – Harmonik – Kareli ortalama • Analitik olmayan ortalamalar – Mod – Medyan – Kartil, Desil ve Santiller I. Merkezi Eğilim Ölçüleri (Ortalamalar) • Bir veri setinin merkez noktasını gösteren, serinin normal değerinin bir göstergesi olan ve veriyi tek bir değerle ifade eden değerlere merkezi eğilim ölçüleri adı verilir. Bir verinin ortalaması onun en küçük ve en büyük değeri arasında yer alır. X min Ortalama X max Ortalamaların Faydaları: Ortalamaların faydaları kısaca şöyle özetlenebilir. 1. Ortalamalar çoğu zaman serinin normal değerini gösterir. Tabi bunun için serinin dağılımının da aşırı çarpık olmaması gerekir. 2. İstatistik analiz işleminin temel elemanlarından biridir. 3. Aynı birimle ölçmek kaydıyla farklı serileri karşılaştırmaya imkan tanır. 4. Tek bir sayı olması sebebiyle hatırda tutulması kolaydır. Ortalamalar verinin tamamını kapsayıp kapsamamasına göre analitik ve analitik olmayan ortalamalar şeklinde iki grupta incelenir. 1. Analitik (Hassas ortalamalar) Verideki bütün değerleri dikkate alarak hesaplanan ortalamalardır. Analitik ortalamalar verinin özelliğine ve hesap tarzına göre dört farklı şekilde elde edilir. 1.1. Aritmetik ortalama ( X ) 1.2. Geometrik ortalama (G) 1.3. Harmonik ortalama (H) 1.4. Kareli ortalama (K). 1.1. Aritmetik ortalama • Aritmetik ortalama serideki gözlem değerleri toplamının toplam gözlem sayısına oranıdır. • Basit seride X 1 X 2 ........... XN X i X N N • Tasnif edilmiş seride f 1 X 1 f 2 X 2 .... fkXk f i X i X f 1 f 2 .... fk fi • Gruplanmış seride f1m1 f 2 m2 .... f k mk X f1 f 2 .... f k Xi : i. gözlem değeri fi : i. değerin frekansı mi : i. sınıfın orta noktası N : toplam gözlem sayısı fm f i i i • Örnek: Adapazarı'nda nisan ayı ortalama yağışlarını tahmin etmek için geçmiş nisan ayı yağış rakamlarından rasgele 7 tanesi seçilmiş ve aşağıdaki sonuçlar elde edilmiştir. Bu verilerden hareketle Adapazarı'nda nisan ayı yağışlarının aritmetik ortalamasını hesaplayınız. Nisan ayı yağışları (Kg) (Xi) 60 75 80 100 120 130 155 ∑Xi=720 X 1 X 2 ........... XN X N X i 720 X N 7 X 102,86 Kg Örnek Bir işletmede aynı parçayı üreten işçilerin bu parçayı üretim sürelerinin dağılımı aşağıdaki gibi gözlenmiştir. Parça üretim süresinin aritmetik ortalamasını bulunuz. 5 Parça üretim İşçi süresi(dk)(Xi) sayısı (f ) i fi.Xi 12 2 24 13 5 65 14 10 140 X f i Xi i 1 5 fi 398 28 i 1 X 14,21 dk . 12 10 15 16 7 4 105 64 8 6 4 2 0 Toplam 28 398 12 13 14 15 16 Örnek Bir işyerinde yapılan telefon görüşmelerinin süresinin dağılımı için aşağıdaki gruplanmış seri verilmiştir. Buna göre görüşme süresinin aritmetik ortalamasını bulunuz. k Görüşme Görüşme süresi sayısı (fi) mi fimi 0 - 2 1 5 X 5 f i mi i 1 k fi 670 110 i 1 2 - 4 10 3 30 4 - 6 40 5 200 X 6,09 dak ik a 45 40 6 -8 30 7 210 35 30 25 8 - 10 Toplam 25 110 9 225 670 20 15 10 5 0 1 3 5 7 9 Tartılı Aritmetik Ortalama • Bir serideki gözlem değerlerlerinin önem dereceleri farklı olursa, bu tür serilerin aritmetik ortalaması tartılı olarak hesaplanır. Bunun için önem derecesini gösteren katsayılar (tartılar) kullanılır. Örnek olarak öğrencilerin ortalama notlarını hesaplarken derslerin kredileri tartı olarak düşünülürken, ücretlerin belirlenmesinde kıdem tartı olarak kabul edilebilir. • Basit seride XT t X t i i i • Tasnif edilmiş seride XT t f X t f t fm t f i i i • Gruplanmış seride XT i i i i i i i Örnek Aşağıda bir öğrencinin almış olduğu dersler, notları ve kredileri verilmiştir. Not ortalamasını tartılı aritmetik ortalama cinsinden hesaplayınız. Dersler Notlar (Xi) Kredi (ti) tiXi İstatistik 70 3 210 Matematik 60 4 240 Fizik 50 3 150 Kimya 80 2 160 Toplam 260 ti=12 tiXi=760 XT tX t i i i 760 12 X T 63,33 puan Örnek Bir işletmede işçilerin saat ücretleri çalıştıkları süre (kıdem) dikkate alınarak belirlenmektedir. Veriler aşağıdaki gibi olduğuna bu işletmede ortalama saat ücretini tartılı aritmetik ortalama cinsinden hesaplayınız. Saat ücreti (milyon) (YTL) İşçi sayısı (fi) Ortalama kıdem (ti) mi f it i fitimi fimi 1.00 – 1.40 10 2.5 1.20 25 30.0 12.00 1.40 – 1.60 30 5.0 1.50 150 225.0 45.00 1.60 – 1.80 50 9.5 1.70 475 807.5 85.00 1.80 – 2.00 15 13.0 1.90 195 370.5 16.90 2.00 – 2.50 5 18.0 2.25 90 202.5 11.25 Toplam 110 935 1635.5 170.15 ftm X ft i i i i i 1635,5 X 1,75 YTL / saat 935 Tartılı aritmetik ortalamanın kullanıldığı yerler - Veriler arasında önem farkı bulunması halinde kullanılır. - Oranların ve ortalamaların ortalaması hesaplanırken kullanılır. - Ortalama maliyet ve satış fiyatı, bileşik fiyat ve miktar indekslerinin hesaplanmasında da tartılı ortalama kullanılır. Örnek Bir işletmede bulunan üç tezgahın belli bir günde ürettikleri malların sayısı ve üretimlerindeki kusurlu oranları aşağıdaki tabloda verilmiştir. Buna göre bu tezgahlarının ürettiği mamul kütlesinin kusurlu oranını bulunuz. Tezgah lar Üretim miktarı (ti) Kusurlu oranı (Xi) tiXi A 100 0.03 3 B 200 0.05 10 C 50 0.01 0.5 ti = 350 Xi = 0.09 tiXi = 13.5 XT tX t i i i X T 0,03857 13,5 350 Aritmetik ortalamanın özellikleri 1 Aritmetik ortalama hassas bir ortalama olup serideki aşırı değerlerden etkilenir ve aşırı değere doğru kayma gösterir. 2 - Serinin gözlem sayısı ile aritmetik ortalaması çarpılırsa serinin toplam değeri elde edilir. NX X i 3- Serideki gözlem değerlerinin aritmetik ortalamadan sapmaları toplamı sıfır olur. (X i X ) X i NX X N i NX X X 0 N 4- Serideki değerlerin aritmetik ortalamadan sapmalarının kareleri toplamı minimum olur. X ) 2 Minimum 5Aritmetik ortalama özellikle normal yakın serilerin ( X i dağılıma ortalaması için elverişlidir. 6- Bir serinin değerleri, diğer iki serinin değerleri toplamından oluşuyorsa bu serinin aritmetik ortalaması da diğer iki serinin aritmetik ortalamaları toplamına eşit olur. X =Y +Z Aritmetik ortalamanın SPSS’te hesaplanması • Aritmetik ortalamayı SPSS’te analyze menüsünün Reports kısmından hesaplamak mümkündür. Bunun için Analyze, Reports ve Case summaries tıklanır. Aritmetik ortalamanın SPSS’te hesaplanması • Gelen ekranda Variables kısmına Ağırlık değişkeni girilir ve Statistics tıklanır. Gelen ekranda Cell statistics kısmına Mean atanır. Continue ve OK tıklanarak sonuçlar çıktı ekranında görüntülenir. Sonuç çıktı ekranında şöyle görüntülenir. Case Summaries Mean Aracın ağırlığı 2970,99 Aritmetik ortalamanın SPSS’te hesaplanması • Aritmetik ortalamanın belli bir değişkenin kategorilerine göre hesaplanması: Bunun için otomobilin ağırlığının aritmetik ortalamasını ülke orjinine göre hesaplayacağız. Analyze menüsünden Reports ve Case summaries tıklanır. Gelen ekranda Variables kısmına ağırlık, Grouping variable(s) kısmına ülke orjini değişkeni girilir ve statistics tıklanır ve gelen ekranda Mean girilip Continue ve OK tıklanır. Aritmetik ortalamanın SPSS’te hesaplanması • Sonuçlar SPSS ekranında aşağıdaki gibi görüntülenir. Case Processing Summary Cases Included N Aracın ağırlığı * Ülke orjini Excluded Percent N 393 100,0% Case Summaries Mean Ülke orjini American European Japanese Total Aracın ağırlığı 3366,92 2437,09 2221,23 2970,99 Percent 0 ,0% Total N Percent 393 100,0% SPSS te Aritmetik Ortalama • SPSS’te aritmetik ortalamayı hesaplayabilmek için Analyze menüsünden Descriptive Statistics seçeneği tıklanır. SPSS te Aritmetik Ortalama • Gelen ekranda Variable(s) kısmına ortalamasını hesaplamak istediğimiz değişkenleri ( Alınanyol, Motorhacmi, Beygirgücü, Ağırlık) girilir. Options tıklanır ve gelen ekranda Mean (aritmetik ortalama) işaretlenir ve Continue ve OK tıklanarak sonuçlar çıktı ekranından alınır. SPSS te Aritmetik Ortalama • Sonuçlar aşağıdaki şekilde elde edilir. Descriptive Statistics Galon başına Miles N Minimum Maximum 392 10 47 Sum 9216 Mean 23,51 Motor hacmi boyutu 393 68 455 76127 193,71 Beygir gücü 392 46 230 40869 104,26 Aracın ağırlığı 393 1613 5140 1167601 2970,99 Valid N (listwise) 391 En küçük değerler En büyük değerler Verinin toplamı Aritmetik ortalama SPSS’te Tasnif Edilmiş serinin Aritmetik Ortalaması • Önce tasnif edilmiş bir seri oluşturalım. Bunun için öğrencilerin 010 arasındaki notların dağılımını SPSS sayfasına giriş yapalım. Bunun için veri ekranının 1. sütununa notları, 2. sütununa öğrenci sayılarını girelim. File menüsünden New ve Data tıklanır ve yeni bir veri sayfası ekrana gelir. Bu sayfaya veriler girilir. Variable view sayfasından değişken isimleri girilir. SPSS’te Tasnif edilmiş serinin Aritmetik Ortalaması • Öğrenci sayılarını frekans olarak tanımlayabilmek için Data menüsünden Weight cases tıklanır ve gelen ekranda Weight cases by kısmına öğrencisayısı değişkeni girilir böylece frekans tanımlanmış olur. SPSS’te Tasnif edilmiş serinin Aritmetik Ortalaması • Analyze menüsünden Reports ve Case summaries tıklanır. Gelen ekranda Variables kısmına Ağırlık değişkeni girilir ve statistics tıklanır. Gelen ekranda Mean (aritmetik ortalama) seçilir, continue ve OK tıklanarak sonuçlar çıktı ekranından alınır. SPSS’te Tasnif edilmiş serinin Aritmetik Ortalaması Sonuçlar aşağıdaki gibi görüntülenir. Case Summaries Mean Notlar 5,00 SPSS’te Tasnif Edilmiş serinin Aritmetik Ortalaması • Analyze menüsünden Descriptive statistics kısmından Descriptive tıklanır. Gelen ekranda Variable(s) için Notlar girilir.Options tıklanır Mean işaretlenip Continue ve OK tıklanır SPSS’te Tasnif Edilmiş serinin Aritmetik Ortalaması • Sonuçlar çıktı ekranında aşağıdaki gibi görüntülenir. Descriptive Statistics N Notlar Valid N (listwise) Minimum Maximum 113 0 10 113 Öğrenci sayısı Endüşük not Enyüksek not Sum 617 Notlar toplamı Mean 5,46 Aritmetik ortalama 2- Geometrik Ortalama (G) • Bir serideki gözlem değerlerinin birbirleri ile çarpımlarının, gözlem sayısı derecesinde kökünün alınması ile elde edilir. Basit seri için şöyle yazılır. • G N X 1 X 2 X 3 XN olup X 1 X 2 X 3 X N X i yazılırsa kısaca geometrik ortalama N olarak yazılır. GN X i i 1 Ancak bu yoldan geometrik ortalamayı bulmak için gözlem sayısının az olması gerekir. Gözlem sayısı arttıkça bu yoldan geometrik ortalamayı hesaplamak güçleşmektedir. Bunun yerine logaritmik dönüşüm uygulanarak geometrik ortalama hesaplanır. G N X 1 X 2 X 3 XN G ( X 1 X 2 X 3 XN )1/ N ifadesi üslü olarak yazılır, bu ifadenin her iki tarafının logaritması alınırsa 1 log G log( X 1 X 2 X 3 X N ) N Çarpımın logaritması ayrı ayrı logaritmalar toplamına eşit olduğuna göre; log X log X log X log X olup düzenlenirse, log G 1 2 3 N N N log X i log G i 1 Burada logG’yi G ye çevirmek için logG’nin ters logaritması alınarak geometrik ortalama elde edilir. N G 10 log G • Tasnif edilmiş seride; fi f 1 G X 1 X 2f 2 X 3f 3 X kfk logaritmik olarak; k fi log Xi f 1 log X 1 f 2 log X 2 f 3 log X 3 fk log Xk log G logolur. G i 1 k f 1 f 2 f 3 fk • Gruplanmış seri için; f i i 1 fi f 1 f 2 G m1 m2 m3f 3 mkfk k f 1 log m1 f 2 log m2 f 3 log m3 fk log mk log G log G i 1 k f 1 f 2 f 3 fk fi fi log mi i 1 Geometrik ortalamanın özellikle geometrik dizi şeklindeki serilere uygun olduğunu söylemek mümkündür. Geometrik bir diziye logaritması alınarak aritmetik diziye dönüşür. Örnek Bir işletmede aynı parçayı üreten 5 işçinin belli bir günde ürettikleri kusurlu parça sayıları aşağıda verilmiştir. Bu işçilerin parça üretiminin geometrik ortalamasını bulunuz. G N X 1 X 2 X 3 XN Kusurlu parça sayısı (Xi) logXi 3 0.477 G 5 3 5 8 15 30 5 54000 5 0.699 G 8,84 parça 8 0.903 15 30 veya N 1.176 1.477 log Xi = 4.732 log X i log G İ 1 N G 10 0,9464 4.732 log G 0,9464 5 G 8,84 parça Örnek 1.10) Bir işletmede çalışan işçilerin belli bir günde ürettikleri kusurlu parça sayılarının dağılımı aşağıda verilmiştir. Bu verilerden hareketle işçi başına günlük kusurlu parça üretiminin geometrik ortalamasını bulunuz. Kusurlu parça sayısı İşçi sayısı (fi) mi logmi filogmi 0 – 10 5 5 0.69897 3.49485 10 – 13 8 11.5 1.0606 8.4848 13 – 15 10 14 1.146 11.46 15 – 20 12 17.5 1.243 14.316 20 – 40 5 30 1.477 7.385 fi = 40 fi G m1f 1 m2f 2 m3f 3 mkfk filogmi = 45.74065 40 55 11.58 1410 17.512 305 =13,918 k f log m i log G i i 1 k f i 1 i 45,74065 log G 1,1436 40 G 101,1436 G=13,918 parça Geometrik ortalamanın SPSS’te bulunuşu • Basit serinin geometrik ortalaması • Basit bir serinin geometrik ortalamasını SPSS’te bulabilmek için Analyze menüsünden Reports ve cases summary tıklanır. Geometrik ortalamanın SPSS’te bulunuşu • Gelen ekranda geometrik ortalaması bulunacak değişken(ler) Variables kısmına taşınır (Gidilenyol). Statistics tıklanır ve gelen ekranda Geometric mean seçilir, continue ve OK tıklanır. Sonuçlar çıktı ekranında görüntülenir. Sonuçlar çıktı ekranda aşağıdaki gibi görüntülenir. Case Summaries Geometric Mean Galon başına Miles 22,24 Geometrik ortalamanın SPSS’te bulunuşu • Tasnif edilmiş serinin geometrik ortalaması • Tasnif edilmiş bir serinin geometrik ortalamasını SPSS’te bulabilmek için serinin frekansının tanımlanması gerekir. Bilindiği gibi bunun için Data menüsünden Weight cases seçeneği tıklanıp frekans değişkeni Weight cases by kısmına taşınarak tanımlanmaktadır. Geometrik ortalama için diğer işlemler yukarıda anlatıldığı gibi yapılmaktadır. • Öğrencilerin notlarının geometrik ortalaması SPSS’te hesaplanacaktır. İlgili ekranlar aşağıdaki gibi görüntülenir. Geometrik ortalamanın SPSS’te bulunuşu Frekans tanımlama işlemi aşağıdaki gibi yapılır Geometrik ortalamanın SPSS’te bulunuşu Geometrik ortalama çıktı ekranında aşağıdaki gibi görüntülenir. Case Summaries Geometric Mean Notlar 4,98 • Geometrik Ortalamanın Tahmin Amacıyla Kullanımı • Geometrik diziye benzer değişim gösteren nüfus, milli gelir artışı, fiyat artışı ve sermaye artışı gibi değişkenlerin tahmininde geometrik ortalama özelliğinden yararlanılabilir. Bu tür seriler genel olarak bir önceki yılın belli bir yüzdesi şeklinde değişim göstermektedir. Bunun için bir dönemlik (ay yıl vs)değişim oranı geometrik ortalama ile belirlenir. Bu eğilimin gelecekte de benzerlik göstereceği varsayımı ile gelecek dönem ile ilgili tahminler elde edilebilir. • Bir malın fiyatı için: Po: başlangıç dönemi değeri, Pn: n. Dönemin değeri, r : bir dönemlik değişim yüzdesi Pn (1 r ) n P0 Pn (1 r ) P0 n Pn P0 (1 r ) n şeklinde olur. Örnek Bir X malının 1995 yılı fiyatı 10000 TL , 2003 yılı fiyatı 300000 TL olduğu bilindiğine göre; a) Bu malın yıllık fiyat artış oranını hesaplayınız b) 2010 yılı için X malının fiyatını tahmin ediniz c) 1985 yılı fiyatı ne olmuş olabilir d) 1999 yılı fiyatını tahmin ediniz e) Hangi yılda fiyatlar 50000000 TL olur? Çözüm P1995 = 10000 P2003 = 300000 n= 8 (2003-1995) Fiyat artış oranı için geometrik artış dikkate alınırsa; Pn 8 300000 fiyat artışı %53 8 ( 1 r ) 30 ( 1 r ) 1 , 53 a) (1 r ) 10000 P0 n b) Pn P 0(1 r ) n formülünden 2010 yılı fiyatı tahmin edilebilir. P2010 = P2003(1,53)(2010-2003) P2010 = 300000(1,53)7 = 300000(19,626) P2010 = 5887800 TL olur. Geometrik ortalamanın özellikleri 1) Geometrik ortalamanın gözlem sayısı kadar üssü alınırsa serinin çarpımı elde edilir. GN = X1X2X3XN GN = Xi 2) Bir serideki gözlem değerlerinin geometrik ortalamaya oranları çarpımı 1’e eşittir. X 1 X 2 X 3 XN Xi G N N N 1 G G G G G G 3) Bir serideki değerlerin logaritmalarının serinin geometrik ortalamasının logaritmasından farklarının toplamı sıfır olur (logXi - logG) = 0 logXi - NlogG = 0 log X i N N log G 0 log G log G 0 N 4) Serideki aşırı değerlere karşı, aritmetik ortalama kadar hassas değildir. 5- İki serinin gözlem sayısı ve çarpımları eşit ise geometrik ortalamaları da eşit olur. 6) Seride sıfır veya negatif gözlem değeri varsa geometrik ortalama hesaplanamaz. 7) Geometrik ortalama özellikle geometrik dizi şeklindeki (değişim oranı sabit) serilerin ortalamasının hesaplanmasında kullanılır. (2,4,8,16,32,64 tam geometrik 1,10,100,1000,10000 tam geometrik vs.) Xi 3 logXi 0,477 9 0,954 27 1,431 81 1,908 243 2,386 G 5 3 9 27 81 243 5 14348907 G 27 log X i 7,156 log G log G 1,4312 N 5 G 10 1, 4312 G 27 4. Kareli Ortalama (K) • Kareli ortalama serideki değerlerin karelerinin aritmetik ortalamasının kareköküdür.Kareli ortalama aşağıdaki formüllerle hesaplanır. N Basit seride: K X X X X N 2 1 2 2 2 3 2 N K X 2 i i 1 N k Tasnif edilmiş seride: K f1 X 12 f 2 X 22 f 3 X 32 f k X k2 K f 1 f 2 f 3 fk f X i i 1 2 i k f i i 1 k Gruplanmış seride: K f1 m12 f 2 m22 f 3 m32 f k mk2 K f 1 f 2 f 3 fk i 1 f i mi2 k f i 1 i Örnek: Bir otomobil servis istasyonuna günlük olarak gelen araçların dağılımı aşağıda verilmiştir. Araç sayısı (Xi) Gün sayısı (fi) 1 2 3 4 8 12 1 4 9 4 32 108 4 10 16 160 5 Toplam 6 ∑fi= 40 25 150 K f f i X i2 K 11,35 i X 2 i 454 40 K 3,39 araç fi X 2 i fi X i2 454 Örnek Bir şehirdeki konutlarda elektrik enerjisi tüketimi üzerine yapılan araştırmada, 200 konut rasgele seçilmiş ve aşağıdaki sonuçlar elde edilmiştir. k K fm 2 i i i 1 k f i 4235875 200 i 1 K 21179,375 K 145,53 Kwh / ay Aylık elektrik Tüketimi (Kwh) Konut sayısı (fi) mi 0 – 60 10 30 9000 60 – 100 20 80 128000 100 – 120 40 110 484000 120 – 140 50 130 845000 140 – 180 45 160 1152000 180 – 250 35 215 1617875 Toplam 200 fimi2 4235875 Kareli ortalamanın kullanıldığı yerler • Diğer ortalamaların kullanılmadığı durumlarda kareli ortalama kullanılabilir. Bir seride sıfır ve/veya farklı işaretli değerler varsa geometrik ve harmonik ortalamalar hesaplanamaz, hesaplansa da mantıklı sonuçlar vermez. Eğer aritmetik ortalama da makul bir sonuç vermiyorsa kareli ortalama kullanılabilir. • Kareli ortalama özel olarak sapmalar serisinin ortalamasında kullanılır. Sapmalar serisi verilerin aritmetik ortalamadan sapmalarını veren seridir. Yani ( X i X ) serisidir. Zira sapmalar serisinin toplamı sıfır olduğundan { ( X X ) = 0 }, bu serinin ortalaması kareli ortalama ile hesaplanabilir. Bu şekilde hesaplanan ortalamaya standart sapma adı verilir. • SPSS’te kareli ortalama işlemi yapılamamaktadır. Bu sebeple kareli ortalamayı Excel kullanarak hesaplayacağız. Analitik ortalamalar arasındaki ilişkiler Normal bir seride ortalamalar arasında aşağıdaki gibi bir büyüklük ilişkisi vardır. K >X > G > H i Analitik Ortalamaların Excel Kullanılarak Hesaplanması • Excel sayfasına veri girişi SPSS’te olduğu gibi girilir. Hücre tanımlamak suretiyle ilgili işlemler yapılarak ortalamalar hesaplanır. Aşağıda basit bir serinin ortalamaları Excel ortamında gerçekleştirilmiştir. Aritmetik Ortalamanın Excel Kullanılarak Hesaplanması • Önceki slaytta ortalama formülleri kullanılarak ortalamalar hesaplanmıştı. Ancak Excelde doğrudan ortalamaları hesaplayan fonksiyonlar vardır. Bunları kullanarak ta ortalamalar hesaplanabilir. 16 Harmonik Ortalamanın Excel Kullanılarak Hesaplanması • Harmonik ortalamanın hesaplanması 14,55696203 Kareli Ortalamanın Excel Kullanılarak Hesaplanması • Excel fonksiyonu kullanılarak Geometrik ortalamanın hesaplanması. Excelde kareli ortalama için fonksiyon yoktur. Kareli ortalama formül kullanılarak hesaplanır. 15,26181087 Analitik Ortalamaların Excel Kullanılarak Hesaplanması • Excel sayfasına veri girişi SPSS’te olduğu gibi girilir. Hücre tanımlamak suretiyle ilgili işlemler yapılarak ta ortalamalar hesaplanır. Aşağıda basit bir serinin ortalamaları Excel ortamında gerçekleştirilmiştir. • Örnek: Bir işletmede gerçekleştirilen günlük üretim miktarının dağılımı aşağıda verilmiştir. Bu verilerden hareketle; • Aritmetik ortalamayı, • Geometrik ortalamayı, • Harmonik ortalamayı, • Kareli ortalamayı bulunuz. Üretim (Kg) fi mi fi.mi fi/mi mi2 fimi2 logmi filogmi 0 – 60 10 30 300 0,3333 900 9000 1,47712 14,771 60 – 100 20 80 1600 0,25 6400 128000 1,90309 38,062 100 – 120 40 110 4400 0,3636 12100 484000 2,04139 81,656 120 – 140 50 130 6500 0,38462 16900 845000 2,11394 105,7 140 – 180 45 160 7200 0,2813 25600 1152000 2,20412 99,185 180 – 250 35 215 7525 0,1628 46225 1617875 2,33244 81,635 Toplam 200 27525 1,7756 4235875 12,0721 421,01 • • • • Aritmetik ortalama: 137,63 logGeometrik ortalama: 2,105 Harmonik ortalama: 112,64 Geometrik ortalama: 127,36 Kareli ortalama: 145,53 K = 145,53>X = 137,63 > G = 127,36> H = 112,64 olduğu görülür. Analitik olmayan ortalamalar Bu gruptaki ortalamalar serinin bütün değerlerini dikkate almayıp, sadece belli birkaç değerini, özellikle ortadaki değerleri esas alarak hesaplanan ortalamalardır. Serinin bütün değerlerini dikkate almadan hesaplandıkları için analitik olmayan ortalamalar olarak adlandırılmaktadırlar. 1. Mod Bir seride en çok tekrarlanan değere mod adı verilir. İstatistikte nispeten az kullanılan bu ölçü özellikle verilerin simetrik bir dağılış göstermediği durumlarda iyi bir ölçü olarak düşünülebilir. Basit ve tasnif edilmiş seride modun bulunması oldukça kolaydır. Seride en fazla rastlanan ya da frekansı en yüksek olan değer mod olarak ifade edilir. Eğer seride en çok tekrarlanan birden fazla eleman varsa bu tür seriler çok modlu seriler olarak isimlendirilir. Böyle serilerde modun tek bir değerle ifade edilmesi istenirse seri gruplanmış hale dönüştürülerek modu hesaplanabilir. Gruplama sonrasında da en yüksek frekansa sahip tek bir sınıf bulunamazsa sınıflar birleştirilerek mod hesaplanabilir. Örnek:Adapazarı’nda nisan ayında yağışlı gün sayısı için aşağıdaki iki veri elde edilmiştir. Nisan ayı yağışlı gün sayısının modunu bulunuz. Yağışlı gün sayısı 3 4 5 5 5 6 6 7 Mod = 5gün Yağışlı gün sayısı Ay sayısı 3 4 5 6 7 2 4 7 9 4 Mod= 6 gün Gruplanmış seride modun hesaplanması Gruplanmış seride modu belirleyebilmek için önce modun içinde bulunduğu sınıf belirlenir. Mod sınıfı frekansı en fazla olan sınıftır. Gruplanmış seride modun hesaplanabilmesi için serinin sınıf aralığının eşit olması gerekir. Çünkü sınıf içindeki frekansların dağılımı sınıf aralıklarının büyüklüğüne göre değişir. Eğer sınıf aralıkları eşit değilse eşit hale getirmek gerekir. Eşit hale getirilemiyorsa modun bu şekilde hesaplanması uygun olmaz. Bu sınıf içindeki modun değeri aşağıdaki formülle bulunur. 1 Mod l1 s 1 2 Yukarıdaki formülde; l1: mod sınıfının alt sınırı 1: mod sınıfı frekansından bir önceki sınıf frekansının farkı, 2: mod sınıfı frekansından bir sonraki sınıf frekansının farkı, s: seride sabit olan sınıf aralığı • Örnek Bir ilköğretim okulunda öğrencilerin günlük olarak aldıkları harçlıkların dağılımı aşağıda verilmiştir. Öğrencilerin aldıkları günlük harçlık miktarının ortalamasını mod ile belirleyiniz. Harçlık (YTL/gün) Öğrenci sayısı 0 – 0,5 1– 1,5 2 – 0,5 –1 1,5 –2 2,5 30 50 100 70 20 l1 = 1 1 = 100 – 50 = 50 Mod sınıfı 2 = 100 – 70 = 30 s = 0,5 1 50 Mod l1 s Mod 1 0,5 Mod 1,3125 1 2 50 30 Mod 1,312500 YTL / gün • Örnek: Aşağıda bir parçanın üretim süreleri verilmiştir. Bu parçanın üretim sürelerinin • a) Aritmetik (13,52) b) Geometrik (12,77) • c) Harmonik (12,03) d) Kareli ortalamalarını (14,25) • e) modunu bulunuz. (11,67) Üretim süresi 5-9 9-13 Parça sayısı (fi) 4 10 mi 7 11 13-17 17-21 21-25 7 4 2 15 19 23 Toplam 27 fimi 28 110 fi mi m 2 i f i mi2 0,571 0,909 49 121 196 1210 105 76 46 0,467 0,211 0,087 225 361 529 1575 1444 1058 365 2,245 5483 Modun Grafikle Gösterilmesi • modun grafikle gösterilebilmesi için serinin histogramı çizilir. Histogramda en yüksek sütün mod sınıfına karşılık gelir. Burada modun yerini tayin etmek için en yüksek sütunun üst köşegenleri ile komşu sütunların bitişik üst köşeleri çapraz olarak birleştirilir. İki doğrunun kesim noktasından yatay eksene çizilen doğrunun ekseni kestiği nokta mod olarak tespit edilir. Modun özellikleri • Ortalamalar arasında en temsili olanıdır. • Pratik hayatta çok kullanılan ortalamalardandır • Özellikle kalitatif (niteliksel) serilerin ortalaması mod ile ifade edilir. Göz rengi, medeni hal, marka, cinsiyet v.s gibi değişkenler kalitatif değişkenler olup sayısal olarak ifade edilemezler • Mod serideki aşırı değerlere karşı hassas değildir. Çünkü normal serilerde mod genellikle serinin orta bölgesinde yer alır, uç değerlerden etkilenmez. • Yukarıdaki avantajlarının yanında analitik olmaması sebebi ile matematik işlemlere elverişli olmaması dezavantajıdır. • J, ters J ve U tipi serilerde mod temsili alma özelliğini kaybeder. Böyle serilerde mod ya en küçük veya en büyük değere karşılık gelir. SPSS’te Modun Belirlenmesi • Araçların modelininin dağılımının modunu belirlemek istiyoruz. Bunun için Analyze menüsünden Descriptive ve Frequencies tıklanır. SPSS’te Modun Belirlenmesi • Gelen ekranda variable(s) kısmına Modu hesaplanacak Model değişkeni girilir. Statistics tıklanır gelen ekranda Mode işaretlenir, continue ve OK tıklanarak sonuçlar çıktı ekranında görüntülenir. Çıktı aşağıdaki gibi görüntülenir. Statistics Modeli N Valid Missing Mode 393 0 73 SPSS’te Modun Belirlenmesi • Sonucu frekans tablosu ile birlikte almak istersek frequencies ekranının altındaki Display frequency tables işaretlenerek OK tıklanır. Frequ Valid Cumulative ency Percent Percent Percent Valid 70 28 7,1 7,1 7,1 71 27 6,9 6,9 14,0 72 28 7,1 7,1 21,1 40 10,2 10,2 31,3 Mod 73 74 26 6,6 6,6 37,9 75 30 7,6 7,6 45,5 76 34 8,7 8,7 54,2 77 28 7,1 7,1 61,3 78 36 9,2 9,2 70,5 79 29 7,4 7,4 77,9 80 27 6,9 6,9 84,7 81 30 7,6 7,6 92,4 82 30 7,6 7,6 100,0 Total 393 100,0 100,0 Statistics Modeli N Mode Valid Missing 393 0 73 2. Medyan (Ortanca) • Serideki değerler küçükten büyüğe sıralandığında tam ortaya düşen ve seriyi iki eşit parçaya bölen değere medyan adı verilir. • Basit ve tasnif edilmiş seride medyanın bulunuşu: • Bunun için serideki değerler küçükten büyüğe sıralanır. Daha sonra medyana karşılık gelen değerin sıra değeri N 1 işlemi ile belirlenir. 2 Eğer bu işlemin sonucu tam sayı ise bu sıradaki eleman medyan olarak belirlenmiş olur. Eğer bu işlemin sonucu kesirli çıkarsa medyan iki değerin tam ortasına düşeceğinden bu iki değerin ortalaması alınarak medyan bulunur. • Örnek: Xi:15,8,12,23,45,32,5,18,16,28,39,51 Yukarıdaki serinin medyanını bulunuz. Önce serideki değerler büyüklük sırasına göre dizilir. Xi : 5,8,12,15,16,18,23,28,32,39,45,51 gözlem sayısı N=12 N 1 12 1 6,5 sıradaki değer medyandır. Bu değer 18;23 arasına düşer. 2 2 Medyan = 20,5 olur. 18 23 Medyan 2 • Örnek: Aşağıda bir atölyede çalışan işçilerin belli bir günde ürettikleri kusurlu parçalarının dağılımı verilmiştir. Bu verilerden hareketle işçi başına ortalama kusurlu parça sayısını medyanla belirleyiniz. • Çözüm: • Medyanın serideki sırası N 1 36 1 18,5 2 2 • Medyan = 18 parça Kusurlu parça sayısı İşçi sayısı 10 2 10 ve daha az 2 12 3 12 ve daha az 5 15 4 15 ve daha az 9 16 6 16 ve daha az 15 18 10 18 ve daha az 25 20 5 21 4 25 2 Toplam (N) 36 İşçi sayısı Gruplanmış seride medyanın hesaplanması • Gruplanmış seriler sürekli karakterde seriler olduğu için medyanın sıra değeri N/2 şeklinde bulunur. Bu değer toplam frekansın yarısına eşit olup serinin orta noktasını gösterir. Bu noktayı tespit etmek gruplanmış serilerde basit bir sayma işlemi ile mümkün olmaz. Bu işlemle medyanın içinde bulunduğu sınıf tespit edilir. Belirlenmiş olan medyan sınıfından hareketle aşağıdaki formül yardımı ile medyan değeri hesaplanır. N m 1 Ni 2 i 1 Medyan l1 sm Nm • l1 : Medyan sınıfının alt sınırı Nm : Medyan sınıfının frekansı • Sm : Medyan sınıfının sınıf aralığı N/2 : Medyanın sıra değeri medyan1 • N i 1 i : Medyandan sınıfından önceki frekanslar toplamı • Örnek: Bir işletmede işçilere ödenen saat ücretlerinin dağılımı aşağıda verilmiştir. Bu verilere göre medyan saat ücretini hesaplayınız. Saat ücreti (Bin TL) İşçi sayısı İşçi sayısı 500 – 600 10 600 den az 10 l1=700 600 – 700 50 700 den az 60 N/2=150/2=75 700 – 800Medyan sınıfı 40 800 den az 100 800 – 1000 30 Nm=40 1000 – 1500 20 Sm= 800-700 = 100 Toplam 150 Ni= 60 N 150 75. 2 2 sıradaki değer medyandır. Bu değer 700-800 sınıfına düşmektedir. Bu sınıf içindeki medyan değeri şöyle hesaplanır. N m1 Ni 75 60 2 i 1 Medyan l1 sm Medyan 700 100 Medyan 737,5 YTL / saat Nm 40 SPSS’te Medyanın Bulunuşu • SPSS’te Medyanı hesaplayabilmek için Reports ya da Descriptive statistics menülerini kullanabiliriz. • Analyze menüsünden Reports ve case summaries tıklanır. Gelen ekranda medyanı hesaplanacak değişken (Aracın ağırlığı) variables kısmına taşınır. Statistics tıklanır, gelen ekranda Median seçilir continue ve OK tıklanarak sonuçlar çıktı ekranında görüntülenir. Case Summaries Median Aracın ağırlığı 2800,00 SPSS’te Medyanın Bulunuşu • Diğer bir yoldan Medyanı belirleyebilmek için Analyze menüsünden Descriptive ve frequencies tıklanır. Gelen ekranda Variable(s) kısmına medyanı hesaplanacak değişken ya da değişkenler (Aracın ağırlığı) taşınır. Statistics tıklanır gelen ekranda Median işaretlenir continue ve OK tıklanarak sonuçlar çıktı ekranından alınır. Çıktı ekranı Statistics Aracın ağırlığı N Valid 393 Missing 0 Median 2800,0 Medyanın grafikle belirlenmesi • Medyanın grafik üzerinde gösterilebilmesi için kümülatif ve ters kümalatif frekans serilerin oluşturulması gerekir. Bu serilerin grafiği birlikte çizildiğinde iki eğrinin birbirini kestiği noktadan yatay eksene çizilen doğrunun ekseni kestiği nokta medyan olarak tespit edilir. Esasen bu işlemi sadece eğrilerden birini çizmekle de yapabiliriz. Eğrilerden biri çizildiğinde Y ekseninde N/2 değerine karşılık gelen noktadan X eksenine paralel çizildiğinde, bu doğrunun kümülatif eğriye temas ettiği noktadan X eksenine çizilen doğrunun ekseni kestiği noktada medyanı gösterecektir. • Örnek: Yukarıdaki örneğin grafikle gösterimi Kümülatif frekans dağılımı Ters kümülatif frekans dağılımı Saat ücreti (Bin TL) fi 500 den az 600 den az 700 den az 800 den az 0 10 60 100 500 den çok 600 den çok 700 den çok 800 den çok 150 140 90 50 1000 den az 130 1000 den çok 20 1500 den az 150 1500 den çok 0 fi Medyanın grafikle gösterilmesi • • • • • Medyanın özellikleri 1- Pratik bir ortalamadır. Çünkü sadece basit bir sıralama işlemi gerektirir. 2- Özellikle açık sınıflı seriler için medyan daha bir önem kazanır. Bu tür serilerde diğer ortalamalar ya hesaplanamaz, ya da açık sınıflar için sınıf sınırları farazi olarak seçilerek hesaplanabilir. Mod ise sınıf aralıklarının eşit olmasını gerektirdiğinden hesaplanamaz. Medyan ise böyle serilerin ortalamasında problemsiz olarak hesaplanabilir. 3- Serideki aşırı değerlere karşı hassas değildir. Çünkü medyan serinin ortasına rastladığından, uçlarda oluşan aşırı değerler medyanı etkilemez. 4- Serideki değerlerin medyandan mutlak farkları toplamı minimum olur. Bu sebeple ortalama sapma medyandan sapmalar şeklinde de hesaplanmaktadır. Xi-medyan minimum 5- Medyanın zayıf tarafı serideki bütün değerleri dikkate almaması sebebi ile matematik işlemlere uygun olmamasıdır. Mod, Medyan ve Aritmetik Ortalama Arasındaki İlişkiler • 1- Simetrik seride her üç ortalama birbirine eşit olur. • X = medyan = mod • 2- Sağa çarpık serilerde • 3- Sola çarpık seride • 4- Asimetrisi hafif serilerde aşağıdaki yaklaşık eşitlik vardır. (X Mod) 3(X Medyan) Sapma (Dağılma) ölçüleri • Mutlak Sapma Ölçüleri – Değişim aralığı – Kartil ve Desil aralığı – Ortalama mutlak sapma – Standart sapma ve Varyans • Nispi sapma ölçüleri – Değişim Katsayısı II. Sapma Ölçüleri • Bir veri setini meydana getiren elemanlar ortalama değer etrafında belirli bir dağılış gösterirler. Gözlem değerleri arasındaki farklılıktan ileri gelen bu durum istatistik olarak serinin önemli karakteristiklerinden biridir. • Bilindiği gibi ortalamalar serinin merkezi noktasını belirlemeye yarayan ölçülerdir. Dağılma ölçüleri ise gözlem değerlerinin bu merkezi noktadan uzaklaşma durumunu ortaya koyan ölçülerdir. Aynı ortalamaya sahip seriler farklı dağılış gösterebilirler. Bu yüzden bir seriyi sadece ortalama değere göre tanımlamak yanlış olur. Bunun yanı sıra dağılışının da bilinmesi gerekir. • Bir seride ortalamanın temsil kabiliyeti ile dağılma ölçüleri arasında ters bir ilişki vardır. Dağılışı az olan serilerin ortalamaları daha temsili oldukları halde, dağılışı fazla olanların ortalamaları seriyi daha az temsil eder. Bu sayede veri setindeki dağılışın tespiti ortalamanın temsil kabiliyeti hakkında da bilgi verecektir. II.1. Mutlak Dağılma Ölçüleri • Mutlak dağılma ölçüleri ilgili değişkenin kendi ölçüldüğü birim cinsinden (kg, cm, TL vs) sonuç verir. Bu sebeple mutlak dağılma ölçüleri olarak adlandırılırlar. • • 1.1. Değişim Aralığı • Gözlem değerlerinin en büyük ve en küçük değeri arasındaki fark olup, verilerin ne kadarlık bir aralıkta değiştiğini gösterir. • R = Xmax – Xmin • Xi : 12,15,20,30,50,52,58,70,90 • olan bir serinin değişim aralığı R=90-12 =78 olur . Yani gözlem değerleri 78 birimlik bir aralıkta değişme göstermektedir. • Bu dağılım ölçüsü oldukça basit ve anlaşılır olmasına karşılık sadece iki uç değere bağlı olması sebebiyle serideki aşırı değerlerin etkisi altında kalması zayıf yönünü oluşturur. Sadece iki uç değeri dikkate alması diğer gözlem değerlerinin dağılımının hiç dikkate alınmamasına sebep olmaktadır. 1.2) Kartil ve Desil Aralığı • • • • Bilindiği gibi değişim aralığı serideki sadece iki uç değeri dikkate almakta, dolayısıyla aşırı değerlerin etkisi altında kalmaktadır. Bu durumu ortadan kaldırmak için kartil ve desillerden faydalanılmaktadır. Kartil ve desil aralıkları kullanılarak gözlem değerleri için daha tutarlı değişme aralığı belirlenmiş olacaktır. Kartil aralığı 3. kartil ile 1.kartil arasındaki fark olup serinin orta bölgesindeki %50’lik gözlem kümesinin değişim aralığını verir. Q = Q3 – Q1 şeklinde belirlenir. Desil aralığı ise 9. desil ile 1.desil arasındaki fark olup, her iki uçtaki %10 gözlem değeri haricinde kalan %80 lik gözlem değerinin değişim aralığını verir. D = D9 – D1 şeklinde belirlenir. • Örnek: Bir işletmede belli bir parçayı üreten işçinin bu parçayı • • • • üretim süresi gözlemlenmiş ve aşağıdaki veriler elde edilmiştir. Bu verilere göre parça üretim süresinin; a) Değişim aralığını Üretim Süresi Parça Sayısı fi b) Kartil aralığını 30-35 10 10 35-37 30 40 c) Desil aralığını bulunuz. 37-40 40 80 Çözüm: a) R=Xmax – Xmin 40-42 35 115 R = 60-30 = 30 dakika 42-50 20 135 b) Q = Q3 – Q1 idi N .h 140.3 50-60 5 140 Q3 için 105. sıradaki r 4 değer Q3 dür. . Bu değer 40-42 sınıfındadır. Q3 40 105 80 * 2 41.43 dakika / parça 35 Q1 35 35 10 * 2 36.67 dakika / parça bulunur. 30 Benzer şekilde Şu halde kartil aralığı Q = 41,43 - 36.67 = 4,76 dakika olur. • c) D=D9-D1 idi. D1 için Bu sınıf içindeki değeri; N .h 140.1 14 olup D1 35-37 sınıfındadır. r 10 14 10 D1 35 * 2 35.27 dakika / parça 30 N .h 140.9 126 r 10 • D9 için .sıradaki değer olup 42-50 sınıfındadır. Bu sınıf içindeki D9 değeri şöyle bulunur. 126 115 D9 42 * 8 46.4 dakika / parça 20 • Desil aralığı ise D = 46,4-35,27 = 11,13 dakika olur. Burada aşırılıklar yok edildiğinden gözlem değerlerinin ortalamaya daha yakın dağıldıkları anlaşılmaktadır. Bununla birlikte yukarıda anlatılan sapma ölçüleri sadece iki değere bağlı olduklarından serideki bütün değerlerin sapmasını göstermekten uzaktır. Veri setindeki bütün değerlerin merkez noktadan sapmalarını gösterecek başka ölçülere ihtiyaç vardır. Bu amaçla ortalama mutlak sapma ve standart sapma ölçülerinden faydalanılır. 1.3. Ortalama (mutlak) Sapma ( ( X i X ) 0) • Bilindiği gibi sapmalar serisinin (aritmetik ortalamadan sapmalar) toplamı sıfıra eşittir. Bu durumda sapmalar serisinin ortalaması da sıfır olacağından bir sapma ölçüsü elde etmek mümkün değildir. Serinin toplamını sıfır olmaktan kurtarabilmek için mutlak sapmalar dikkate alınabilir. Çünkü mutlak sapmalar serisinin toplamı sıfırdan büyük ( X i X 0) olacaktır Böylece mutlak sapmalar serisinin ortalaması alınarak yeni bir sapma ölçüsü elde edilebilir. Bu sapma ölçüsü diğer iki sapma ölçülerinin aksine serinin bütün değerlerini dikkate almaktadır. Bu sebeple daha kullanışlı ve daha temsili bir sapma ölçüsü elde edilmiş olmaktadır. Ortalama (mutlak) sapma formülleri • Ortalama sapmayı şöyle formüle edebiliriz. • Basit Seride O.S X i X N • Tasnif Edilmiş Seride fi X X O.S fi i fi m X O.S fi i • Gruplanmış Seride Örnek: Bir atölyede üretim hattında günlük olarak üretilen mamul sayılarının dağılımı aşağıda verilmiştir. Günlük üretimin ortalama sapmasını bulunuz. Mamul Sayısı (Xi) Gün Sayısı (fi) fi.Xi 33 2 66 -3,5 7 34 5 170 -2,5 12,5 35 9 315 -1,5 13,5 36 30 1080 -0,5 15 37 20 740 0,5 10 38 16 608 1,5 24 39 5 195 2,5 12,5 40 3 120 3,5 10,5 Toplam 90 3286 X i X fi X i X 105 • Aritmetik ortalama fiXi 3286 X 36,5 fi 90 • Ortalama sapma fi Xi X O.S fi 105 90 OS = 1,167 adet/gün Örnek: Bir ağrı kesicinin insanlar üzerinden ne kadar süre ile etkili olduğunu belirlemek için yapılan araştırmada, ağrı kesicinin etkinlik süresinin aşağıdaki gibi dağıldığı gözlenmiştir. Bu verilere göre etkinlik sürenin ortalama sapmasını bulunuz. Etkin.Sür Hast.Say mi fi.mi (saat) mi X • Aritmetik ortalama fi mi X X 986 9,3 saat 106 2-5 10 3,5 35 -5,8 58 5-8 30 6,5 195 -2,8 84 8 - 12 50 10 500 0,7 35 12 - 20 16 16 256 6,7 107,2 fi mi X O.S fi Toplam 106 284,2 • OS = 2,68 saat 986 • Ortalama sapma 284,2 106 • Ortalama sapma serinin sapmasını iyi bir şekilde ölçmektedir. Ancak mutlak işlemler gerektirmesi bu sapma ölçüsünün aritmetik işlemlere elverişsiz olmasına sebep olmaktadır. Bu sebeple istatistik analizde kullanılması mümkün olamamaktadır. 1.4-Standart Sapma • Serideki gözlem değerlerinin aritmetik ortalamadan sapmaları (sapmalar serisi) toplamı sıfır idi. Bu durumu daha önce mutlak değer almak suretiyle önlemiş olduk. Ancak bu yol aritmetik işlemler için elverişli olmamaktadır. Mutlak işlemler yerine kare alma yolu ile sapmalar serisi toplamı sıfır olmaktan kurtarılabilir. Böylece yeni bir sapma ölçüsü elde edilmektedir. • Standart sapma, sapmalar serisinin (aritmetik ortalamadan sapmalar) kareli ortalamasıdır. Yani gözlem değerlerinin aritmetik ortalamadan sapmalarının kareli ortalamasına standart sapma denir. Standart sapmanın karesine varyans adı verilir. Kütle ve örnek standart sapması için aşağıdaki formüller kullanılır. Standart sapma formülleri • Aşağıda farklı seri ve veri türü için standart sapmanın formülleri verilmiştir. Basit seri Tasnif edilmiş seri Gruplanmış seri Kütle ( Xi X ) fi( Xi X ) Örnek fi Kütle Örnek S ( Xi X ) 2 fi(mi X ) Örnek fi S 2 S 2 n 1 N Kütle 2 fi( Xi X ) 2 ( fi) 1 fi(mi X ) 2 ( fi) 1 • Yukarıdaki formüllerde örnek verileri için standart sapma formüllerinde paydada (n-1) serbestlik derecesi kullanılmıştır. Örnek hacmi büyük olduğunda bu düzeltmeye ihtiyaç kalmaz. • Örnek: Bir beyaz eşya servis Servis isteği merkezine gelen günlük 3 servis isteklerinin dağılımı ile ilgili aşağıdaki veriler 4 elde edilmiştir. Bu verilere 5 göre servis merkezine gelen 7 günlük servis isteklerinin aritmetik ortalamasını ve 10 standart sapmasını bulunuz. Xi X -4 -3 -2 0 3 6 13 ∑Xi=42 • Aritmetik ortalama: X X n ( X i X )2 16 9 4 0 9 36 ∑74 42 X 7 6 • Standart sapma • s = 3,85 S 2 ( Xi X ) N 1 74 14,8 6 1 • Örnek: Doğru, yanlış şeklinde cevap şıkları olan 10 soruya öğrencilerin verdikleri doğru cevap sayılarının dağılımı aşağıda verilmiştir. Bu serinin standart sapmasını ve varyansını bulunuz. Doğru Cevap. Sayısı Öğr. Sayısı (fi) fi.Xi 2 2 4 -4,69 43,99 3 4 12 -3,69 54,46 4 5 20 -2,69 36,18 5 10 50 -1,69 28,56 6 20 120 -0,69 9,52 7 30 210 0,31 2,88 8 20 160 1,31 34,32 9 10 90 2,31 53,36 10 3 30 3,31 32,87 Toplam 104 696 Xi X fi( Xi X ) 2 296,15 • Çözüm: Yukarıdaki verileri kütle verisi olarak kabul ederek çözelim. Çözüm için önce aritmetik ortalamanın hesaplanması gerekir. 696 X 6,69 104 • Aritmetik ortalamadan farklar serisi oluşturularak standart sapma elde edilir. 2 fi ( Xi X ) fi 296,15 1,687 varyans : 2 2,847 104 • Yukarıdaki verileri örnek kabul edersek standart sapma şöyle olur. S 2 fi ( Xi X ) ( fi) 1 296,15 S 1,6956 varyans s 2 2,875 103 • Örnek hacmi büyük olduğundan kütle ve örnek varyansları arasında önemli bir fark çıkmamıştır. • Örnek: Bir liseden mezun olan ve ÖSS sınavına giren öğrencilerin puanlarının dağılımı aşağıda verilmiştir. Buna göre öğrenci puanlarının standart sapmasını bulunuz. ÖSS Puanları Öğr.Sayısı mi fi.mi mi X fi(mi X ) 2 90-110 10 100 1000 -37,9 14364,1 110-130 30 120 3600 -17,9 9612,3 130-150 50 140 7000 2,1 220,5 150-170 25 160 4000 22,1 12210,25 170-210 5 190 950 52,1 13572,05 Toplam 120 16550 49979,2 16550 Ortalama : X 137,9 puan 120 Standart sapma 2 fi ( mi X ) fi 49979,2 20,4 puan 120 Standart sapmanın kısa yoldan hesaplanması • • 2 2 2 ( Xi X ) ifadesi açılarak yazılırsa; N ( Xi 2 2 2 X . Xi X ) N • Bu ifade ayırarak yazılırsa 2 • Xi Xi 2 N • K şeklinde yazılabilir. , N X 2 Xi 2 Xi N X 2. X . N olduğuna göre; N N 2 olur . 2 K 2 2 X . X X 2 K 2 2 X 2 X 2 olur. Buna göre; • Standart sapma kısa yoldan K 2 X 2 şeklinde yazılır. • Şu halde varyans kareli ortalamanın karesinden aritmetik ortalamanın karesinin farkına eşit olup, bunun kare kökü standart sapmaya eşit olur. Örnek: Yukarıdaki ÖSS örneği için standart sapmayı kısa yoldan hesaplayınız. • Aritmetik ortalama 22000 X 146,67 puan 150 • Kareli ortalama 3328000 K2 22186,67 150 • Standart sapma K2 X 2 22186,67 146,67 2 ÖSS Puanları Öğr.Sa yısı mi fi.mi fi.mi2 90-110 10 100 1000 100000 110-130 30 120 3600 432000 130-150 50 140 7000 980000 150-170 30 160 4800 768000 170-190 20 180 3600 648000 190-210 10 200 2000 400000 22000 3328000 Toplam 674,58 25,97 puan 150 Standart sapmanın kısa yoldan hesabı • Kütle verisi için standart sapma (kısa yol formülünün farklı yazılışı) 2 2 X N X i • Basit seride N • Tasnif edilmiş seride • Gruplanmış seride f i X i2 NX 2 f i f m NX f i 2 i 2 i • Örnek verisi için standart sapma hesaplamak için payda N-1 serbestlik derecesi ile bölünür. S X 2 i NX 2 N 1 Örnek: Bir çekme halatının kopma kuvveti için yapılan deneyde aşağıdaki sonuçlar elde edilmiştir. Kopma kuvvetinin standart sapmasını yukarıdaki formülden hesaplayınız. Kopma Halat kuvveti sayısı 5–7 3 7–9 7 9 – 11 10 11 - 13 5 Toplam 25 mi f i mi mi2 f i mi 2 6 8 18 56 36 64 108 448 10 12 100 60 234 100 144 1000 720 2276 2 2 f m N X i i N fm X f i i i 234 X 25 X 9,36 2276 25 9,362 85,76 1,85 25 25 Standart Sapmanın Özellikleri: • Matematik işlemler için uygun bir dağılma ölçüsüdür. Bu sebeple en yaygın kullanılan ölçüdür. • Standart sapmada aritmetik ortalama gibi istatistik analiz için temel ölçülerden birisidir. • Genel olarak standart sapma ortalama sapmadan daha büyüktür. (OS < ) • N1 ve N2 gözlemden oluşan iki serinin ortalamaları aynı ve sırayla varyansları 12 ve 22 olsun. Bu iki serinin birleştirilmiş ortak varyansı . N1 . 1 N 2 . 2 şeklinde olur. N1 N 2 2 • 2 2 II. 2. Nispi sapma ölçüleri • Mutlak dağılma ölçüleri gözlem değerlerinin ifade edildiği birimler cinsinden sonuç vermekte idi. Mutlak dağılma ölçülerinin bu özelliği farklı birimlerle ifade edilen serilerin değişkenliklerini karşılaştırma imkanı vermemektedir. Diğer taraftan aynı birimle ifade edilen serilerde bile gözlem değerleri arttıkça mutlak dağılma ölçüleri de buna paralel olarak artmaktadır. Bu durumda aynı cins serilerin dağılımlarını da mutlak sapma ölçüleri ile karşılaştırmak çoğu zaman mümkün olamamaktadır. • Nispi dağılma ölçüleri serideki gözlem değerlerinin ölçüldüğü birim farklılıklarını ortadan kaldırmakta ve değişkenliği yüzde(%) cinsinden ifade etmektedir. Böylece nisbi dağılma ölçüleri farklı birimlerle ifade edilen ve farklı büyüklüklerdeki serileri aynı cins ve büyüklükte ifade etme imkanı tanımaktadır. Nispi sapma ölçüleri bu özellikleri dolayısıyla farklı birimlerle ölçülmüş, farklı büyüklük ve özelliklerdeki verilerin sapmalarının karşılaştırılmasına imkan sağlamaktadır 2.1. Değişim Katsayısı • Standart sapmanın ortalamanın bir yüzdesi olarak ifade edilmesine değişim katsayısı adı verilir. Bu tanıma göre standart sapmanın büyüklüğü aritmetik ortalamaya göre ifade edilmektedir. D.K .100 X • Bu ölçü farklı cins ve büyüklüklerdeki serileri aynı cins ve büyüklükte (yüzde cinsinden) ifade etme imkanı sağlamaktadır. Ancak bu ölçünün bir dezavantajı bir üst sınırının olmamasıdır. Yani değişim katsayısı %100 ü geçen değerler de alabilmesi bu ölçünün zayıf tarafıdır. Eğer bu ölçünün üst sınırı %100 olsaydı verinin değişkenliğini daha iyi yorumlamak mümkün olurdu. Özellikle ortalaması sıfıra yakın seriler için kullanımı pek uygun değildir. Örnek: • Konutlarda tüketilen aylık elektrik ve su miktarları için aşağıdaki veriler elde edilmiştir. Değişim katsayılarını bularak hangi grupta değişikliğin daha fazla olduğunu araştırın. Elekt. Tük.(kw/h) Konut Say.(fi) mi fi.mi fi.mi2 50-100 10 75 750 56250 100-150 20 125 2500 312500 150-200 30 175 5250 918750 200-300 15 250 3750 937500 300-500 5 400 200 800000 • Elektrik Tüketimi İçin: 14250 X 178,125 80 K2 3025000 37812,5 80 2 K X 37812,5 178,125 2 6083,98 78 • Değişim katsayısı: D.K 100 D.K 78 2 X 178,125 100 DK %44,8 Su Tük.(ton/h) Konut Say. mi fi.mi fi.mi2 5-15 10 10 100 1000 15-25 30 20 600 12000 25-35 40 30 1200 36000 35-45 20 40 800 32000 45-65 10 55 550 30250 • Su Tüketimi İçin değişim katsayısı; X 3250 111250 29,55 K 2 1011,4 110 110 2 K X 1011,4 29,55 2 138,16 11,75 2 D.K X .100 D.K 11,75 .100 29,55 DK %39,76 • Bu verilere göre elektrik tüketiminin değişkenliği (DK=44,8) su tüketiminin değişkenliğine göre (DK=39.7) daha fazladır. Sapma ölçüleri için SPSS uygulaması • Sapma ölçülerini SPSS ortamında hesaplayabilmek için Analyze menüsünden, Reports ve Case summaries seçeneği tıklanarak hesaplanabilir. Sapma ölçüleri için SPSS uygulaması • Gelen ekranda Variable(s) kısmına sapması hesaplanacak değişken ya da değişkenler girilir. Statistics tıklanır ve bu kısımdan Standard Deviation, Variance ve Range işaretlenir Continue ve OK tıklanarak sonuçlar çıktı ekranında görüntülenir. Çıktılar aşağıdaki gibi görüntülenir. Case Summaries Aracın ağırlığı Std. Variance Deviation 844,353 712932,235 Range 3527 Standart Varyans Değişim sapma aralığı Sapma ölçüleri için SPSS uygulaması • Sapma ölçülerini SPSS te farklı şekilde de hesaplamak mümkündür. Analyze menüsünden Descriptive ve frequencies tıklanır. Gelen ekranda variable(s) kısmına sapması araştırılan değişken(ler) taşınır. Statistics tıklanarak gelen ekranda dispersion kısmından istenen sapma ölçüleri işaretlenerek continue ve OK tıklanarak sonuçlar elde edilir. Sapma ölçüleri için SPSS uygulaması Çıktılar aşağıdaki gibi görüntülenir. Statistics Motor hacmi boyutu N Valid 393 Missing 0 Std. Deviation 104,536 Variance 10927,784 Range 387 Beygir gücü 392 1 38,230 1461,557 184 Sapma ölçüleri için SPSS uygulaması • Bir değişkenin kategorilerine göre sapma ölçülerini hesaplamak için Analyze menüsünden Reports ve Case summaries tıklandıktan sonra Variables kısmına değişken ya da değişkenler girilir, grouping varisble(s) kısmına kategori değişkeni girilerek statistics tıklanır. Gelen ekranda standart deviation, variance ve range girilip continue ve OK tıklanarak sonuçlar elde edilir. Sapma ölçüleri için SPSS uygulaması • Aşağıdaki çıktı ekranında ülke orjinine göre otomobillerin gittiği yolun, motor gücünün ve motor hacminin sapma ölçüleri elde edilir. Case Summaries Galon başına Mil Ülke orjini American European Japanese Total Std. Deviation Variance Range Std. Deviation Variance Range Std. Deviation Variance Range Std. Deviation Variance Range 6,415 41,146 29 6,584 43,351 28 6,090 37,089 29 7,791 60,693 37 Beygir gücü 39,696 1575,787 178 20,321 412,926 87 17,819 317,524 80 38,230 1461,557 184 Motor hacmi boyutu 98,512 9704,547 370 22,434 503,272 115 23,140 535,465 98 104,536 10927,784 387