Ölçme Sonuçları Üzerinde İstatistiksel İşlemler Ölçme sonuçları ve bunlar üzerinde yapılan istatistiksel işlemler aşağıda verilmiştir. Okullarda yapılan çeşitli ölçme uygulamaları (sınavlar) sonucunda sayısal değerler (puanlar) elde edilir. Bu puanlar öğrencilerin başarı durumlarının sayısal ifadesidir ve genelde her bir öğrencinin başarısının değerlendirilmesinde kullanılır. Bununla birlikte, ölçme sonuçları, tek tek öğrenciler hakkında bilgi verdiği gibi uygulandığı grubun tümü hakkında da bilgi verir ve hem öğrencilerin hem de eğitim sisteminin değerlendirilmesinde kullanılır. Ölçme sonuçlarının betimlenmesi, özetlenmesi, birbirleri ile karşılaştırılması ve yorumlanması bunlar üzerinde çeşitli istatistiksel işlemlerin yapılmasını gerektirmektedir. Bu işlemler aşağıda örneklerle açıklanmıştır. Ölçme Sonuçlarının (Puanların) Düzenlenmesi Ölçme sonuçları ilk elde edildiklerinde çok sayıda ve düzensizdirler. Bu yüzden bunları yorumlamak ve sonuç çıkarmak mümkün değildir. Bu nedenle veriler üzerinde yapılacak ilk iş onların düzenlenmesidir. gereken onların Verilerin büyüklük düzenlenmesinde sırasına konulmasıdır. yapılması Sıralama büyükten küçüğe ya da küçükten büyüğe doğru yapılabilir. Aşağıda testinden 60 almış öğrencinin oldukları 50 soruluk puanların bir sayısal küçükten yetenek büyüğe doğru sıralanmış hali örnek olarak tablo 1'de verilmiştir. Puanların sıralaması büyüğe doğru yapılabilir. büyüktün küçüğe ya da küçükten Tablo 1: Öğrencinin Sayısal Yetenek Puanlarının Sıralanmış Hali 15 28 32 37 42 19 28 33 37 42 22 29 33 37 43 22 29 33 37 43 23 29 34 37 43 23 29 34 38 43 24 30 34 38 44 25 30 36 39 44 25 31 36 39 45 26 31 36 40 45 26 32 37 40 47 28 32 37 40 47 Tablo değerleri: (x) puanlar (f) frekans (tf) toplam frekanslar (%) yüzdeler ve (%tf) toplamlı yüzdeler. Tablodaki veriler incelendiğinde puanların 15 ile 47 arasında değiştiği açıkça görülmektedir. Sınavda hiç bir öğrencinin testteki 50 sorunun tamamına doğru cevap veremediği, ayrıca bazı puanların bir, bazılarının da birden fazla olduğu gözlenmektedir. Ancak, bu bilgiler yalnız başına verilerin yorumlanması için yeterli değildir. Frekans Tablosunun Hazırlanması Verilerden daha fazla bilgi elde etmek için yapılan diğer bir işlem, frekans tablosu hazırlamadır. Bu tabloda puanlar (X), frekans (f), ve toplamlı frekanslar (ti), yüzdeler (%) ve toplamlı yüzdeler (%tf) yer alır. Tablo 1'de sıralı halde verilmiş olan verilerin frekans tablosu Tablo 2'de verilmiştir. Tablo 2: 60 Öğrencinin Sayısal Yetenek Puanlarının Frekans Tablosu x 15 19 22 23 24 25 26 28 29 30 31 32 33 37 36 37 38 39 40 42 43 f 1 1 2 2 1 2 2 3 4 2 2 3 3 3 3 7 2 2 3 2 4 tf 1 2 4 6 7 9 11 14 18 20 22 25 28 31 34 41 43 45 48 50 54 % 2 2 3 3 2 3 3 5 7 3 3 5 5 5 5 12 3 3 5 3 7 %tf 2 4 7 10 12 15 18 23 30 33 36 41 46 51 56 68 71 73 78 81 88 44 45 47 Toplam 2 2 2 60 56 58 60 3 3 3 98 91 94 98 Frekans tablosunun ilk sütunu, testten alınmış olan puanların büyükten küçüğe ya da küçükten büyüğe doğru sıralanarak yazılmış halini gösterir, ikinci sütunda frekanslar yer almaktadır. Bir verinin frekansı, o veriden, grupta kaç tane olduğunu gösterir. Örneğin Tablo 2'de 60 öğrenciden 3'ü 28, 4'ü 29 puan almıştır. Frekans tablosundaki frekanslar toplamının veri sayısına eşit olması gerekmektedir. Tablo oluşturulduktan sonra bu kontrolün yapılması istenir. Tablo 1'deki verilerin toplam sayısı 60'tır ve frekanslar toplamı da 60 bulunmuştur. Bu bilgi bize, frekanslar toplamının alınmasında ve verilerin tabloya geçirilmesinde bir hatanın yapılıp yapılmadığını gösterir. Tablo 2'nin üçüncü sütunundaki toplamlı (yığmalı) frekanslar, bir veriye ait frekans ile ondan önceki tüm verilere ait frekansların toplamıdır. Toplamlı frekansın son değerinin veri sayısına eşit olduğuna dikkat edilmelidir. Toplamlı frekanslar, frekansla elde edilen bilgiye ek olarak bireylerin aldıkları puana göre diğerleri ile karşılaştırılmasına imkan sağlar. Örneğin 30 puan alan 2 öğrenci, 60 kişilik grupta 29 ve daha düşük puan alan 18 öğrenciden daha yüksek puan almışlardır. Ancak, grupta bu 2 öğrenciden daha yüksek puan alan 40 kişi vardır. Bu iki öğrenci gruptaki 18 öğrenciden daha yüksek fakat 40 öğrenciden daha düşük bir başarı göstermişlerdir. Frekans tablosuna yüzdeler ve toplamlı yüzdeler eklenerek veriler hakkında daha fazla yorum yapılabilir. Yüzde, bir veriye ait frekansın toplam frekansa bölünüp 100 ile çarpılması ile elde edilir. Yüzde değerlerinin toplamının 100 olması gerekir. Ancak, Tablo 2'de bu değer 98 olarak görülmektedir. Bunun nedeni yapılan bölme ilgilidir. işleminde Yüzde çıkan ve değerlerin toplamlı yuvarlanması yüzdelere ile bakarak öğrencilerin grup içindeki yeri (%'de kaçından daha başarılı olduğu ya da başarısız olduğu vb.) belirlenebilir. Verilerin sıraya konulması, frekans tablosunun düzenlenmesi vb. işlemler veriler hakkında çok genel bilgiler vermektedir. Bu işlemler verilerin tümü hakkında bilgi vermez. Düzenlenmiş verilerin yorumlanması ve daha ileri düzeydeki işlemler için verilerin bütününe ait özelliklen belirtecek bilgilere ihtiyaç vardır. Verilerin bütününe ait özellikleri ortaya koymada merkezi eğilim ölçüleri (merkeze yığılma ölçüleri) ve dağılım (değişme) ölçülerinden yararlanılmaktadır. Merkezi Eğilim Ölçüleri (Merkeze Yığılma Ölçüleri) En sık kullanılan merkezi eğilim ölçüleri aritmetik ortalama, ortanca ve mod'dur. Bu ölçüler verilerin gruplândırılmış olması ve olmaması durumlarında farklı yollarla (formüllerle) aritmetik ortalama, geldikleri hesaplanmaktadır. ortanca ve gruplândırılmamış mod'un veriler ne için Aşağıda anlama yapılan hesaplama örnekleriyle birlikte verilmiştir. Mod (Tepe Değer): Bir veri grubunda en çok tekrar eden ölçme sonucuna mod denir. Mod, verilerin en çok tekrar eden değer etrafında toplandığını ifade eden bir ölçüdür. Veri grubunu betimlemede, tüm verilerden ziyade en çok tekrar eden verinin kullanılmasından dolayı mod, diğer merkezi eğilim ölçülerine kıyasla veriler hakkında en az bilgi veren ölçüdür. Bir veri grubunda en çok tekrar eden ölçme sonucuna mod denir. Örnek 1: a) 10 öğrencinin bir sınavdan aldıkları puanlar sırasıyla 80, 72, 65, 73, 72, 57, 41, 72, 41 ve 65'tir. Bu veri kümesinde en çok tekrarlanan puan 72'dir. Dolayısıyla bu verilerin mod'u 72'dir. b) Tablo 2'deki frekans tablosunda görülen 60 öğrencinin sayısal yetenek testi puanlarına ait dağılımda, en yüksek frekans 7 ve buna ait ölçme sonucu 37 olduğundan, bu dağılımın modu 37'dir. Yani sayısal yetenek testi puanları 37 etrafında yığılma göstermektedir. Bir veri grubundaki bütün ölçme sonuçlan aynı değeri alırsa dağılımın modu olmaz. Bir veri kümesinde birden fazla modun olduğu durumlar da bulunabilir. Böyle durumlarda mod, verilerin toplandığı grup hakkında bilgi vermez. Bu gibi durumlarda mod kullanılmaz. Ortanca (medyan): Sıralanmış bir veri grubunu tam ortadan ikiye ayıran noktaya rastlayan ölçme sonucuna ortanca denir. Veriler sıraya konulduktan sonra, baştan ve sondan n 1 inci sıradaki ölçme sonucu sayılarak bulunur. Bulunan değer 2 ortancadır. Sık kullanılan merkezi eğilim ölçülerinden biridir. Örnek 2. (veri sayısının tek olması durumunda): 2, 3, 5, 6, 7, 9, 10 şeklinde sıralı halde verilmiş olan puan dağılımının ortancası, bu puanların tam orta noktasına rastlayan ölçme sonucu olan 6'dır. Örnek 3. (veri sayısının cin olması durumunda): 12, 13, 13, 14, 15, 17, 18, 19, 20, 25, 26, 27 şeklinde sıralı halde verilmiş olan puan dağılımının ortancası 17+18/2 = 17,5' tir. Sıralanmış bir veri grubunu tam ortadan ikiye ayıran noktaya rastlayan ölçme sonucuna ortanca denir. Aritmetik Ortalama: En çok kullanılan ve diğerlerine göre daha fazla bilgi veren merkezi eğilim ölçüsüdür. Aritmetik ortalamanın hesaplanmasında, ortanca ve mod da olduğu gibi, sadece bir kaç veri değil verilerin tamamı dikkate alınmaktadır. Çoğu yerde sadece ortalama olarak ifade edilir. Aritmetik ortalama verilerin tamamının veri sayısına bölünmesi ile elde edilir. Aritmetik ortalama formülü, X1+X2+X3+....+Xn verileri, "n" de veri sayısını göstermek üzere; X X1 X 2 .... X n ’dir. n Aritmetik ortalama; En çok kullanılan ve diğerlerine göre daha fazla bilgi veren merkezi eğilim ölçüsüdür. Örnek 4: 7 öğrencinin yabancı dil testinden aldıkları puanlar, 75, 53, 81, 55, 67, 39, 49 olsun. Bu puanların aritmetik ortalaması, X 75 53 81 55 67 39 49 59.86 ’dır. 7 Bu sonuç, 7 öğrencinin yabancı dil sınavından aldıkları puanların 59,86 civarında olduğunu gösterir. Bu değer grubun tümüne ait ve grubun tümünü temsil eden bir değerdir. Dağılım (Değişim) Ölçüleri Bir puan dağılımı betimlemede kullanılan diğer bir ölçü, dağılım ölçüleridir. Dağılım ölçüleri, verilerin yığılma gösterdikleri noktadan ne kadar uzakta olduklarını, başka bir deyişle merkeze yığılma ölçüsüne göre ne kadar dağıldıklarını belirten bir sayıdır. Başlıca dağılım ölçüleri; ranj ve standart kaymadır. Ranj: Bir veri grubunda en büyük ölçme sonucu ile en küçük ölçme sonucu arasındaki farka ranj denir. Ranj sembollerle aşağıdaki gibi gösterilebilir. Ranj = XEB - XEK XEB : En büyük ölçme sonucu XEK: En küçük ölçme sonucu Ranj, veri grubundaki iki değere (en büyük ve en küçük) bağlı olduğundan verilerin dağılımı hakkında fazla bilgi vermez. Bu yüzden çok kullanışlı değildir. Merkeze yığılma ölçüsü olarak sadece modun kullanılabildiği verilerde dağılım ölçüsü olarak da ranj kullanılır. Ranj: Bir veri grubunda en büyük ölçme sonucu ile en küçük ölçme sonucu arasındaki farka ranj denir. Ranj sembollerle aşağıdaki gibi gösterilebilir. Örnek 5: Tablo 4'deki verilerin ranjını bulalım. Verilerin en büyüğü 47, en küçüğü 15 olduğundan, Ranj= 47- 15 = 32dir. Bu değer bize öğrencilerin testten aldıkları puanların 15 ile 47 arasında değiştiğini göstermektedir. Standart Kayma (Sapma): Bir veri grubundaki ölçme sonuçlarının aritmetik ortalamadan farklarının karelerinin aritmetik ortalamasının kareköküne standart kayma denir. Standart kayma, bir veri grubunda verilerin aritmetik ortalamadan ne kadar uzaklaştığının ortalama bir ölçüsünü verir. Bir veri grubu için merkezi eğilim ölçüsü olarak aritmetik ortalamanın kullanıldığı durumlarda dağılma ölçüsü olarak standart kayma kullanılır. Standart kayma aşağıdaki formülle hesaplanır. Bir veri grubundaki ölçme sonuçlarının aritmetik ortalamadan farklarının karelerinin aritmetik ortalamasının kareköküne standart kayma denir. Standart sapma bize hangi tür istatistiksel bilgi verir? S (X X) 2 n 1 i Bu formülde S standart kaymayı, Xi ölçülen özelliğin değerlerini (ölçme sonuçlarını), X ölçme sonuçlarının aritmetik ortalamasını, n de veri sayısını göstermektedir. Örnek: Bir testten öğrencilerin almış oldukları puanlar 25, 19, 21, 14, 15, 13, 11, 22 olsun. Bu ölçme sonuçlarının standart kaymasını hesaplamak için Çizelge 17'deki gibi bir işlem tablosunun hazırlanması işlemleri kolaylaştırır. Verilerin aritmetik ortalaması; X = (25+19 + 21 + 14+15+13+ 11 +22)/8= 140/8= 17,5dir Tablo 3: Standart Kaymanın Hesaplanması için Çalışma Tablosu x x-x (x-x)2 11 11 – 17,5 = -6,5 42,25 13 13 – 17,5 = -4,5 20,25 14 14 – 17,5 = -3,5 12,25 15 15 – 17,5 = -2,5 6,25 19 19 – 17,5 = 1,5 2,25 21 21 – 17,5 = 3,5 12,25 22 22 – 17,5 = 4,5 20,25 25 25 – 17,5 = 7,5 56,25 Toplam 0,00 172 S 172 4.95 ’dir. 8 1 Diğer bir dağılım ölçüsü olan varyans hesaplanan standart sapma değerinin karesinin alınması ya da standart sapma formülündeki karekökün işleme dahil edilmemesi suretiyle elde edilir. Standart sapma için yapılmış olan açıklamalar varyans için de geçerlidir. Şunu vurgulamakta yarar vardır ki, merkezi eğilim ve dağılım ölçüleri için burada verilmiş formüller ve hesaplanma yollarından başka verilerin özelliklerine ve büyüklüğüne bağlı olarak diğer hesaplama yolları ve formülleri mevcuttur. Bu kısımda az sayıdaki veriler üzerinde bu işlemlerin nasıl yapılacağına ilişkin açıklamalarda bulunulmuş, diğer işlem yollarına ilişkin hesaplama örnekleri verilmemiştir. Ayrıca, bir puan dağılımını betimleme de kullanılan farklı grafiksel yöntemler, dağılımı yorumlamada kullanılan bağıl değişkenlik, çarpıklık, basıklık ve standart puanlar gibi kavramlar ve işlem yollan bu bölümün kapsamı dışında bırakılmıştır. Değerlendirme ve Not verme Değerlendirme Değerlendirmenin genel anlamda, bir ölçme işlemi sonunda elde edilen ölçme sonuçlarının bir ölçütle karşılaştırılması ve buna bağlı olarak bir değer yargısına ulaşma işi olduğu ve ölçme sonucu, ölçüt ve karar olmak üzere üç öğesinin bulunduğu daha önce vurgulanmıştı. Değerlendirme bir karar verme işlemi olup bu yönü ile ölçmeden ayrılmaktadır. Değerlendirme kapsam açısından daha geniş bir kavramdır. Ölçme, değerlendirme için gerekli sayısal değerlerle ilgilidir ve değerlendirme kavramının gözlem ve veri toplama kısmını içine alır. Ölçmenin temel özelliği, sonuçların "sayısal" olarak ifade edilmesi, değerlendirme ise, ölçme sonuçlarının belirli ölçütlere göre yorumlanarak yargılara varılmasıdır (Özcelik,1992 ; Özgüven, 1994) Değerlendirme bir karar verme işlemi olup bu yönü ile ölçmeden ayrılmaktadır. Değerlendirmenin Eğitim Sistemi İçindeki İşlevleri Özçelik'e göre (1992) eğitimdeki değerlendirmeler göz önüne alındığında bunların çoğunda, ya öğrenmeler ya da öğretim üzerinde durulduğu görülür. Ölçmenin temel özelliği, sonuçların "sayısal" olarak ifade edilmesi, değerlendirme ise, ölçme sonuçlarının belirli ölçütlere göre yorumlanarak yargılara varılmasıdır. Öğrenmeler değerlendirilirken ya öğrenciyi tanıma ve yerleştirme, ya öğrenme eksiklikleri ile güçlükleri belirleyerek bunları ortadan kaldırma, ya da öğrenme düzeyini belirleyerek not, sertifika vb. verme amaçlanmaktadır. Öğretim değerlendirilirken de ya öğretim programının sağlamlık ve işe yarama derecesini ya da öğretim hizmetinin etkililiğini ortaya koyma söz konusudur. Bloom ve arkadaşları, öğretim ve değerlendirmenin, istendik davranışın oluşmasında eğitim sürecinin ayrılmaz iki unsuru olduğunu belirterek değerlendirme olmadan öğretim durumu hakkında karar vermenin olanaksızlığını ortaya koymakta ve değerlendirmenin fonksiyonunu, hedeflerle belirlenen değişmelerin olup olmadığını, olmuşsa gerçekleşme derecesini belirleyen kanıtların toplanması olarak belirtmektedirler (Bilen, 1996). Astin ve Panos (1971) değerlendirmenin asıl amacının, eğitimle ilgili kararlar alınırken kullanılabilecek bilgileri elde etmek olduğunu belirterek ölçme ve değerlendirmenin eğitimdeki kullanılış amaçlarını önem sırası gözetilmeksizin şu şekilde sıralamaktadır. Ölçme ve değerlendirme: 1. Eğitsel ve meslekî rehberliğin etkili bir biçimde gerçekleştirilmesi için gerekli bilgileri sağlar, 2. Öğrencilere not verme ve velilerine öğrenci ile ilgili rapor vermek için gerekli bilgileri sağlar, 3. Öğrenme ile ilgili problem ve zorlukların belirlenmesini sağlar, 4. Öğrencinin öğrenme kapasitesinin değerlendirilmesini sağlar, 5. Öğretim metodlarının değerlendirilmesini sağlar, 6. Öğrencilerin çeşitli programlara, liselere yada diğer çeşitli eğitsel, meslekî, endüstriyel ve askeri programlara seçilmesini sağlar, 7. Ders öğretmenlerinin öğretime ilişkin etkililiklerinin değerlendirilmesini sağlar, 8. Eğitim kurumunun bir bütün olarak değerlendirilmesi için gerekli bilgileri sağlar. Ertürk (1993) program geliştirmenin son ve tamamlayıcı halkası olarak ele aldığı değerlendirmenin eğitimde başlıca beş hizmeti olduğunu belirtmiştir. Ertürk'e göre değerlendirme: 1. Bayıltılan, hedefleri, yaşantıları ve şartları kontrol ederek, mevcut eğitim ve öğretim faaliyetlerinin ıslahına yardım eder, 2. Ancak bazı hedeflere göre yapılabileceğinden, değerlendirme faaliyetlerini ifa etmek, eğitimcileri eğitim hedeflerini daha ileri seviyede sınıflamaya ve tanımlamaya yani işe-vuruklaştırmaya zorlar, 3. Öğrencilerin öğrenme faaliyetlerinde nelere önem verecekleri, nasıl ve ne üzerinde sınava tabi tutulduklarına bağlı olduğundan ve değerlendirme işlem yolları da sınavları ihtiva ettiğinden, değerlendirme süreci öğrenciyi ileri öğrenmeye doğru güdüler, 4. Süreci içinde her öğrenci hakkında elde edilecek bilgi rehberlik maksatları için işe koşulabilir, 5. Öğretmenlere, öğrencilere ve diğer eğitimcilere işlerinin ve eserlerinin gerçekçi bir tablosunu çizmek sureti ile yardımcı olabilir. Bu gerçekçi tablo, eğitimcilere hem kendi kendini tanıyıp değerlendirme hem de okul hakkında ilgili kimseleri aydınlatma maksatlarına hizmet edecek şekilde kullanılabilir.