Ölçmeyle İlgili Temel İstatistikler Bir eğitimci olarak niçin belli düzeyde istatistik bilmeliyiz? • Günlük hayatta çevremizde olup anlayabilmek ve yorumlayabilmek için bitenleri izleyebilmek, • Borsa düşünce dolara ne oluyor? • Seçimleri kim kazanacak? • Şampiyon kim olacak? • Sınıftaki en başarılı öğrenci kim? • Sınavda ilk yüzde elliye kimler giriyor? • Elde ettiğimiz verilerle ilişkiler kurar, sonuçlar çıkarmaya çalışırız! 23.7.2017 2 İstatistik Nedir? • İstatistik, belli amaçlar için veri toplama, toplanan verileri düzenleme, çözümlemenin yanı sıra yorumlama teknik ve yöntemleri olarak tanımlanabilir. • Nitel ve nicel değerlerle ilgilenir. • Nicel verilerin ve bilgilerin düzenlenmesi, özetlenmesi ve açıklanması betimsel (descriptive) istatistiğin uğraştığı alandır. • Nitel verilerin yorumlanması ve betimsel istatistik sonuçları kullanılarak bir olay veya olgu hakkında varsayımda bulunmak, genellemeler yapmak sonuç çıkarıcı (inferential) istatistiktir. 23.7.2017 3 • • Bir çalışma sonunda toplanan veriler ham verilerdir. Verileri anlamlı hâle getirmek için toplanan veriler; 1. 2. 3. 4. 5. Sözel ifadelerle açıklanır. Tablolar oluşturularak sunulur. Grafiklerle ifade edilir. Veriler üzerinde bazı istatistiksel hesaplamalar yapılır. Bu sayılan yöntemlerden birkaçı birden kullanılır. Yukarıda sayılan yöntemlerden hangisinin kullanılacağı; ne tür ölçek kullanıldığına ve ne tür veri elde edildiğine bağlıdır. 23.7.2017 4 • Evren-Genel Uzay • Araştırmanın yapıldığı, verilerin toplanıldığı, gözlemlerin yapıldığı alandaki tüm nesneler veya bireyler evreni oluşturur. • Örneklem • Evrenin içinden ayrıntılı olarak üzerinde çalışmak amacıyla seçilen bir grup nesne veya birey, çalışmanın örneklemini oluşturur. Örneklem evrenin bütün özelliklerini yansıtmalıdır. • Örneklem seçimi çeşitli tekniklerle yapılır. Bütün bu teknikler araştırmanın türüne ve amacına bağlıdır. • Ölçmede kesinlik • Kullanılan ölçeklerin hassasiyetine bağlı olarak yapılan ölçümlerin kesinlik dereceleri de değişmektedir. 23.7.2017 5 Verilerin Özetlenmesi ve Grafikle Gösterilmesi • Frekans Dağılımları – Basit Frekans Dağılımı – Gruplandırılmış Frekans Dağılımı • Verilerin Grafikle Gösterilmesi – Bar Grafik – Histogram – Frekans Poligonu – Çizgi Grafiği – Pasta ya da Daire Grafiği 23.7.2017 6 Frekans Dağılımları • Gözlem ya da kayıt yoluyla elde edilen ve işlenmemiş, anlamlı hale getirilmemiş sayılar yığını “ham veri” olarak kabul edilir. • Ham verilerin düzenlenmesinde, özetlenmesinde, anlamlı ve anlaşılır hale getirilmesinde en sık kullanılan yöntemlerden biri, bu verilerin frekans dağılımlarının verilmesidir. • Frekans dağılımlarının verilmesi ile karışık halde bulunan puanlamalar derlenir, puanlar yüksekten düşüğe ya da tersi biçimde sıralanabilir ve puanlar hakkında yorumlar yapılabilir. 23.7.2017 7 Frekans Dağılımları • Ham Puanlar • Sıralanmış Puanlar 23.7.2017 8 Basit Frekans Dağılımı • Basit frekans dağılımı, her puan değerinin kaç sefer tekrarlandığını gösterir. Frekans “f” harfi ile gösterilir. • Frekans tablosu hazırlanırken; tüm puanlar gösterilir. İstenirse öğrencilerin almadıkları diğer puanlar da verilebilir. • Toplamalı frekans, frekans değerlerinin ard arda toplanması ile elde edilir. 23.7.2017 9 23.7.2017 10 Gruplandırılmış Frekans Dağılımı • Gruplandırılmış frekans dağılımında, belirli puan kategorilerinin oluşturulması için puanlar arasındaki ranjlar ya da aralıklar dikkate alınır. • Burada grup ya da kategorilerin aralığını gösteren “aralık katsayısı”nın bulunması önemlidir. 23.7.2017 11 Gruplandırılmış Frekans Dağılımı • Gruplandırılmış frekans dağılımını belirlemede “aralık katsayısı”nı bulmak için en yüksek ve en düşük puanlar arasındaki fark (RANJ) belirlenir. Bu değer tahmini grup sayısına bölünür. Grup ya da kategori sayısı 5, 8, 10, 12 ya da 15 olarak alınabilir. • Az sayıda kategori oluşturma veri kaybına, çok sayıda kategori oluşturma ise işlemlerin güçleşmesine yol açabilir. 23.7.2017 12 23.7.2017 13 23.7.2017 14 23.7.2017 15 Temel Kavramlar 23.7.2017 16 Temel Kavramlar 23.7.2017 17 Bar Grafik İstatistiksel verileri açıklamak için en çok kullanılan grafik türüdür. Bar diyagram, birbirini izleyen barların bir serisini gösterir. Barlar küçükten büyüğe ya da tersi biçimde sıralanır. 23.7.2017 18 Histogram Histogram bar grafiğe benzer. Ancak, bar grafik kategorik ya da kesikli grup aralıklarıyla çizildiği halde, histogram sürekli grup aralıklarıyla çizilir. Histogramda dikey eksen her zaman sıfır değeriyle başlarken, yatay eksen sıfır ya da büyük bir değerden başlayabilir. 23.7.2017 19 Frekans Poligonu Histogramda verilen puan aralıklarının orta noktalarının birleştirilmesiyle oluşur. Puan aralıkları ve orta noktalar 23.7.2017 20 Çizgi Grafiği Frekans poligonunun iki ucu yatay eksene değmediği zaman çizgi grafiği oluşur. Çizgi grafiği sürekli verilere uygulanabilir. Puanlar ya da puan aralıkları yatay eksende, bunlara ait frekanslar dikey eksende yer alır. 23.7.2017 22 Pasta ya da Daire Grafiği Özellikle değişkenlerin yüzdelik değerlerini göstermede sıklıkla kullanılan bir grafik türüdür. 23.7.2017 23 Merkezi Eğilim (Yığılma) Ölçüleri • Aritmetik Ortalama • Mod (Tepe Değer) • Medyan (Ortanca) 23.7.2017 24 Aritmetik Ortalama Puan toplamlarının veri sayısına bölümüdür. X X 1 X 2 X 3 n Örnek: 95,88,73,67,59,46,35,26,23 Ortalama: 56.88 23.7.2017 25 Mod (Tepe Değer) • Mod ya da tepe değer, bir puan dağılımında en çok tekrar eden, yani frekansı en fazla olan puan ya da ölçümdür. Örnek: 60,72,82,72,61,81,72 ise Mod=72’dir. • Güvenirliğinin düşük olması nedeniyle nadiren kullanılır. Çünkü bazı durumlarda dağılımın çarpık olması nedeniyle birden fazla mod bulunabilir. 23.7.2017 30 23.7.2017 31 Tepe Değer (Mod) ile ilgili bazı önemli noktalar 1) Bir puan dağılımında puanların frekansı aynı ise dağılımın modu hesaplanamaz (mod yoktur). Örneğin; 1,1,1,5,5,5,7,7,7 puan dağılımının modu yoktur. 2) Bir dizi puan dağılımında ardı ardına gelen iki puanın frekansı birbirine eşitse bu durumda mod frekansı eşit olan puanların ortalamasıdır. Örneğin; 2,2,3,3,3,5,5,5,9,9 puan dağılımında 3 ve 5 puanlarının frekansları birbirine eşittir. Bu durumda mod (3+5)/2=4 olarak bulunur. Dizinin modu 4’tür. 3) Bir dizi puan dağılımında frekansı eşit fakat ardı ardına gelmeyen puanlar varsa, bu durumda dizinin iki modu olur. Örneğin; 2,3,3,3,4,5,6,6,6,7 puan dağılımının 3 ve 6 olmak üzere iki modu (bimodal) bulunmaktadır. 32 23.7.2017 32 Medyan (Ortanca) Büyüklük sırasına göre dizilmiş puanlar dizisinin tam ortasına düşen puandır. n 1 ' inci puan 2 Örnek: 95,88,73,67,59,46,35,26,23 Medyan: 59 Puanların sayısı çift ise: n n ile 1 ‘inci değerin ortalaması alınır 2 2 Örnek: 95,88,73,67,59,46,35,26,23,12 Medyan: 52.5 23.7.2017 33 Medyan (Ortanca) • Örnek: 4, 7, 8, 11, 12, 15, 19 ise Medyan=(n+1)/2=(7+1)/2=8/2=4. sıradaki 11’dir. • Örnek: 3, 5, 7, 9 ise Medyan=n/2=4/2=2. sıradaki (5+7)/2=6’dır. 23.7.2017 34 Medyan (Ortanca) • Medyan sıralamalı ölçeklerle elde edilen veriler için uygun bir merkezi eğilim ölçüsüdür. • Medyanda ölçümlerin her birinin puan değerinden çok dağılım içindeki sırası önemlidir. 23.7.2017 35 23.7.2017 39 23.7.2017 40 Dağılım (Değişim, Yayılma) Ölçüleri Yayılma Ölçüleri: Verilerin yığılma gösterdikleri noktadan ne kadar uzakta olduklarını, yani: merkeze yığılma ölçüsüne göre ne kadar dağıldıklarını belirler Ranj (dizi genişliği) Çeyrek Sapma Standart Sapma 23.7.2017 41 Ranj (Dizi Genişliği) Bir veri grubunda en yüksek puan ile, en düşük puan arasındaki farktır. Puanların sıralanmış olması gerekmez Grubun homojen ya da heterojen bir dağılım gösterdiği hakkında bilgi verir. Örnek: 78,89,56,36,48,92,59,60 Ranj: 92-36=56 23.7.2017 42 Ranj (Dizi Genişliği) • Örnek Birinci Dağılım: 59, 59, 59, 60, 61, 61, 61 ise Ranj=? 61-59=2 İkinci Dağılım: 30, 40, 50, 60, 70, 80, 90 ise Ranj=? 90-30=60 Bu iki dağılımda aritmetik ortalama ve medyanlar eşit olmasına karşın ranjları farklıdır. Dağılımın ranjı azaldıkça dağılımdaki puanlar birbirine yaklaşır ya da benzeşir, ranj arttıkça puanlar birbirinden uzaklaşır ya da puanlar arası fark artar. 23.7.2017 43 Çeyrek Sapma Çeyrek sapma, bir dağılımdaki üçüncü çeyrek (75.yüzdelik) ile birinci çeyrek (25.yüzdelik) arasındaki farkın yarısına eşittir. Aritmetik ortalama yerine medyanın kullanıldığı durumlarda kullanılması uygundur. 23.7.2017 44 Aşağıda 20 öğrencinin İngilizce sınavından aldığı notlar küçükten büyüğe doğru sıralanarak verilmiştir. Çeyrek sapmayı hesaplayalım: 15,17,20,21,25,30,33,40,43,47,50,55,57,60,65,70,73,77,80,84 25. yüzdelik için (Y25)= 20(25/100) = 5. puan (25) 75. yüzdelik için (Y75)= 20(75/100) = 15. puan (65) Bu durumda çeyrek sapma (65-25)/2=20 olur. 23.7.2017 45 Baştan % 25. not 25 ve sondan % 75. not 65 olduğuna göre bu notların aritmetik ortalamadan ne kadar saptığını çeyrek sapma yaklaşık olarak vermektedir. 46,05 25 21 ve 65 - 46,05 19 23.7.2017 46 Örnek: Çeyrek Sapma 23.7.2017 Puan Aralığı f Toplamalı Frekans Aralığın Gerçek Sınırı 21,00-25,00 1 1 20,50-25,50 26,00-30,00 1 2 25,50-30,50 31,00-35,00 2 4 30,50-35,50 36,00-40,00 6 10 35,50-40,50 41,00-45,00 6 16 40,50-45,50 46,00-50,00 7 23 45,50-50,50 51,00-55,00 1 24 50,50-55,50 47 48 23.7.2017 48 49 23.7.2017 49 Standart Sapma (SS) Bir veri grubunda verilerin aritmetik ortalamadan ne kadar uzaklaştığının ölçüsüdür. Puanların ortalamadan olan farklarının, kareleri toplamının ortalamasının (Varyans), kareköküne eşittir. Varyans standart sapmanın karesine eşittir. S (X X ) 2 n 1 Örnek: 78,89,56,36,48,92,59,60 S=19.8 23.7.2017 50 Standart sapma • Bir veri dizisinde standart sapmayı hesaplamak için önce aritmetik ortalama bulunur ve her veriyle aritmetik ortalamanın farkının karesi şeklinde hesaplanarak aşağıdaki formülle dizinin standart sapması hesaplanır. N Sx (X i 1 i X) N 2 21,9 ÇEYREK SAPMA değişim hakkında kaba bir sonuç verir. SS verilerin oluşturduğu dizinin homojenliğiyle ilgili bilgi verir. 23.7.2017 51 • Gruplandırılmış Frekans tablosuyla verilen dizinin standart sapması, aşağıdaki formül ile hesaplanır: N Sx 23.7.2017 i 1 f i ( X i X) 2 N -1 52 Standart Sapmanın Özellikleri • SS, bir veri grubunun ortalaması etrafındaki dağılımını belirlemek amacıyla kullanılır. • Negatif değerler almaz. • Veri grubundaki tüm değerler aynı ise SS sıfırdır. • SS veri grubundaki uç değerlere karşı duyarlı olup tek bir uç değer dahi değerini artırabilir. Yani, dağılımı çarpık hale getirir. 23.7.2017 55 Standart Sapma ve Aritmetik Ortalama Arasındaki İlişki Aritmetik ortalama ile standart Heterojen yapı oluşur ve grup sapmanın arası büyürse, başarısı düşer. Aritmetik ortalama ile standart Homojen yapı oluşur ve grup sapmanın arası küçülürse, başarısı artar. Bir puan dağılımında puanlar arası fark (ranj) büyüdükçe, Standart sapmada büyür. Bir testten elde edilen puanların standart sapması büyüdükçe, Testin güvenirliği artar. 23.7.2017 56 Standart Hata • Standart sapmayla ilgili bir kavram da ortalamanın standart hatasıdır. Bir dağılımda standart hata, standart sapmanın örneklem sayısının kareköküne bölünmesiyle hesaplanır. SH 23.7.2017 Sx N 57 Standart Puanlar Standart puan, gözlenen puanların ortalamadan farklarının standart sapmaya bölünmesiyle standart sapma birimi cinsinden elde edilen bir puandır. “Z” ve “T” puanları olmak üzere iki türlüdür. Aritmetik ortalaması 0,00 ve standart sapması 1,00 olan dağılıma birim normal dağılım ya da standart normal dağılım denir. Uygulanan bir testten elde edilen sonuçların standart normal dağılıma dönüştürülmesi ile elde edilen puanlara Z puanları adı verilir • Z puanı, farklı test sonuçlarının karşılaştırılmasında ve matematiksel işlemlerde kolaylık sağlar. Farklı test sonuçlarının karşılaştırılmasına yönelik olarak aşağıdaki soruyu inceleyelim. • Soru 2: Tabloya göre Ali hangi testte daha başarılıdır? Hangi iki testteki başarısı birbirine eşittir? • 1. test için Z puanı = -1 • 2. test için Z puanı = 0 • 3. test için Z puanı = +1 • 4. test için Z puanı = +1 • 5. test için Z puanı = +2 olarak bulunur. • Buna göre Ali, 5. testte daha başarılıdır ve 3. ve 4. testlerdeki başarıları birbirine eşittir T puanı • T puanı, aritmetik ortalaması 50 ve standart sapması 10 olan diğer bir standart dağılımdır. Normal Dağılım Eğrisi %34,13 %34,13 (Simetrik Dağılım) %13,59 %13,59 %2,14 Sx -3 -2 %2,14 -1 0 +1 +2 +3 +1 +2 +3 60 70 80 %68 Z -3 -2 -1 0 %95 T 23.7.2017 20 30 40 50 %99 61 Normal Dağılım • Birçok değişkene ait ölçümlerin frekans dağılımı, çan eğrisi şeklinde simetrik bir frekans eğrisiyse bu eğri, normal dağılım eğrisi olarak adlandırılır. • İstatistikte çok önemli bir yeri olan normal dağılım eğrisi aslında bir matematiksel eğridir. Eğrinin tepe noktası aritmetik ortalamaya karşılık gelir. • Normal dağılımda standart sapma, eğrinin genişliğini belirler. Standart sapma büyüdükçe değişkenin alacağı en küçük değer ile en büyük değer arasındaki açıklık büyür. • Ortalamanın üstünde ve altında eşit sayıda puan (%50’si) bulunmaktadır. • Hiçbir puan dağılımı, normal dağılımı tam olarak karşılamaz. Bu nedenle, normal dağılım eğrisinin yüzdelik karşılıkları tahmini olarak belirtilir. Soru: • Aritmetik Ort:60, SS=8 olan bir testten 70 puan alan bir öğrencinin başarısı hakkında yorum yapılacak olursa; • AO ve SS dikkate alınarak grubun genel dağılımının bulunması gerekir. • -3S -2S -1S AO +1S +2S +3S • 36 44 52 60 68 76 84 • Öğrenci puanları 36 ile 84 arasında değiştiği söylenebilir • 70 puan +2S puan diliminde yer alır.Yani öğrencinin sınıfın % 84’ünden daha fazla puan aldığı söylenebilir. KPSS Soru Örneği Aritmetik Ortalama Mod (Tepe Değer) Medyan Standart Leyla’nın (Ortanca) Sapma notu Türkçe 68 75 70 5 55 Matematik 70 65 60 10 60 Tarih 80 80 80 7 73 Fizik 65 75 70 4 72 Coğrafya 60 70 65 3 69 • Hangi derste dağılım normaldir? Normal Dağılım: Aritmetik ortalama, mod ve medyanın eşit olduğu dağılımdır. 23.7.2017 64 Aritmetik Ortalama Mod Medyan Standart Sapma Leyla’nın notu Türkçe 68 75 70 5 55 Matematik 70 65 60 10 60 Tarih 80 80 80 7 73 Fizik 65 75 70 4 72 Coğrafya 60 70 65 3 69 • Hangi derste grup homojendir ya da farklılaşma en düşük ya da öğrencilerin öğrenme düzeyi birbirine en yakındır? • Hangi derste grup heterojendir ya da farklılaşma en yüksek ya da öğrencilerin öğrenme düzeyi birbirine en uzaktır? 23.7.2017 65 Aritmetik Ortalama Mod Medyan Standart Sapma Leyla’nın notu Türkçe 68 75 70 5 55 Matematik 70 65 60 10 60 Tarih 80 80 80 7 73 Fizik 65 75 70 4 72 Coğrafya 60 70 65 3 69 • • • • 23.7.2017 Grup olarak en başarılı ve en başarısız olunan ders hangisidir? Ortalama öğrenme düzeyi ya da grup başarı düzeyi en yüksek ve en düşük olan ders hangisidir? Coğrafya (SS-min)ve Matematik(SS-max) dersi; Tarih (AO-max) ve Coğrafya (AO-min) 66 Leyla’nın en başarılı ve en başarısız olduğu dersler hangisidir ? -2 -1 X 53 55 58 63 Matematik 40 50 Tarih 60 Fizik Coğrafya Sx Türkçe +1 +2 68 73 78 83 60 70 80 90 100 67 73 80 87 94 100 53 57 61 65 69 72 73 77 51 54 57 60 63 69 -3 66 +3 67 KPSS Soru Örneği X SS Z-Puanı 90 75 13 (90-75)/13= +1,15 50+(10.1,15)= 61,5 FenTeknoloji 55 65 16 (55-65)/16= -0,63 50+(10.-0,63)= 43,7 Sosyal Bilgiler 45 40 12 (45-40)/12= +0,42 50+(10.0,42)= 54,2 85 60 14 (85-60)/14= +1,79 50+(10.1,79)= 67,9 Ders Türkçe Matematik Ham Puan T-Puanı 1.Matematik, 2.Türkçe, 3.Sosyal Bilgiler, 4.Fen-Teknoloji. 68 23.7.2017 69 Dağılımda Çarpıklık: Negatif Çarpık Dağılım Puanların çoğu dağılımın sağ tarafına yığılmıştır. Sola çarpık: Sınıf başarısı yüksek. Ortalama<Medyan<Mod. Sorular ve test kolaydır. 23.7.2017 70 Dağılımda Çarpıklık: Pozitif Çarpık Dağılım Puanların çoğu dağılımın sol tarafına yığılmıştır. Sağa çarpık: Sınıf başarısı düşük. Mod<Medyan<Ortalama. Sorular ve test zordur. 23.7.2017 71 Mod < Medyan < Ortalama Ortalama < Medyan < Mod Mod Medyan Ortalama 0 Sağa çarpık dağılım 100 0 Sola çarpık dağılım 100 Çarpıklık Katsayısı • Çarpıklık katsayısının sıfırdan küçük olması çarpıklığın negatif (sola), sıfırdan büyük olması ise pozitif (sağa) olduğunu gösterir. • Çarpıklık katsayısının sıfıra eşit olması, dağılımın simetrik olduğunu gösterir. 23.7.2017 73 Dağılımın Basıklığı Korelâsyon • Korelasyon, X ve Y gibi iki değişken arasında bir ilişki olup olmadığı eğer ilişkili ise bu ilişkinin derecesini belirlemeye yarayan istatistiksel bir tekniktir. Değişkenler arasındaki ilişkinin derecesini veren katsayıya ise korelasyon katsayısı denilmektedir. Korelasyon katsayısı “r” ile gösterilir ve +1 ile -1 arasında değerler alır Pearson Momentler Çarpımı Korelasyon Katsayısı • Bu korelasyon katsayısı, aralıklı ya da oranlı ölçek düzeyinde elde edilen veriler arasındaki ilişkilerin belirlenmesinde kullanılan bir tekniktir. Pearson korelasyon katsayısı “r” ile gösterilmektedir ve değeri -1 ile +1 arasında değişmektedir. Pearson momentler çarpımı korelâsyon katsayısı aşağıdaki formüller kullanılarak hesaplanabilir Sperman Sıra Farkları Korelasyonu (Spearman Rho) • Bu korelasyon katsayısı, sıralama ölçeğinde elde edilen veriler arasındaki ilişkilerin belirlenmesinde kullanılan bir tekniktir (Baykul, 2000). Sperman Rho, Pearson korelasyon katsayısı ile aynı şekilde yorumlanmaktadır. Bunun yanı sıra, değişkenlerden biri sıralama diğeri ise aralıklı ya da oranlı ölçek düzeyinde ise, bu korelasyon katsayısının kullanılabilmesi için, aralıklı ya da oranlı ölçek düzeyindeki değişkenin sıralama ölçeğine dönüştürülmesi gerekir. • 5A sınıfındaki öğrencilerin 25 soruluk matematik testinden aldıkları puanlar gruplanarak aşağıdaki frekans grafiğinde gösterilmiştir. (KPSS-2007) • • • • • • 3. 5A sınıfının mevcudu kaçtır? A) 5 B) 7 C) 8 D) 20 E) 25 4. 5A sınıfının matematik testi puanlarının aritmetik ortalaması kaçtır? A) 5,7 B) 7,4 C) 14,5 D) 18,6 E) 20 5. 5A sınıfının matematik testi puanlarının tepe değeri (mod) kaçtır? A) 5 B) 7 C) 8 D) 18 E) 25 • 7. Mehmet Öğretmen, öğrencilerine uyguladığı bir test sonucunda elde ettiği puanlardan bazı istatistikleri hesaplamıştır. Daha sonra, öğrencilerden birinin puanını yanlış yazdığını fark etmiş ve gerekli düzeltmeyi yaparak istatistikleri tekrar hesaplamıştır. • Buna göre, Mehmet Öğretmen’in düzeltmesi sonucunda aşağıdaki istatistiklerden hangisi kesin olarak değişmiştir? (KPSS-2008) • A) Ortalama B) Ortanca C) Mod • D) Ranj E) Yığmalı frekans