Nicel Analizlere Giri

advertisement
Nicel Analizlere Giriş
Yrd. Doç. Dr. İhsan Sarı
Veri toplama işlemi ile birlikte toplanan veriler
HAM VERİ olarak adlandırılır.
Veri analizi yöntemi ile ham veriye anlam
kazandırılır.
BAZI KONTROLLER YAPILMALIDIR
Ölçme: önceden belirlenmiş olan kurallara göre,
nesnelere ve objelere sayılar atfetme.
Ölçeme de hata: ölçülmek istenen gerçek
değerden sapmalardır.
SOSYAL BİLİMLERDE HER ÖLÇÜMDE BELLİ
DÜZEYDE HATA MEVCUTTUR.
GERÇEK DEĞER = ÖLÇÜLEN DEĞER + HATALAR
Hata kaynakları
•
•
•
•
•
Deneğin karakteri
Kısa süreli kişisel faktörler (sağlık, duygu vb.)
Örnekleme ve ölçeklerden kaynaklı hatalar
Durumsal faktörler
Mekanik faktörler (silik yazı veya sıkışık
hazırlanmış sorular)
• Anketin uygulanması ile ilgili faktörler (örn:
mülakatçı yönlendirmesi)
• Analizle ilgili faktörler
En genel halde ölçme hatalarının
sınıflandırılması
• Sistematik hatalar
• Tesadüfi hatalar
Saha çalışması kaynaklı hatalar
• Örnekleme hataları
• Örnekleme dışı hatalar
Veri hazırlama süreci
Saha çalışmasında elde edilen ham verilerin
analize hazır hale getirilmesi amacıyla yapılan
işlemler dizisidir.
Amaç: ham verinin yapısında olan ve sıhhatini
bozan hatalar ve sorunların ortadan kaldırılması.
Veri hazırlama süreci basamakları
1.
2.
3.
4.
5.
6.
7.
Anketlerin kontrol edilmesi
Düzenleme (edit etme)
Kodlama
Verinin bilgisayar ortamına aktarılması
Veri temizleme
İstatistiksel düzenlemeler
Uygun analiz stratejisinin seçilmesi
Anketlerin kontrol edilmesi
•
•
•
•
•
Tam doldurulmuşmu
Cevaplarda belli bir trend varmı
Sayfalar eksikmi
Son kabul tarihinden sonramı gelmiş
Anket uygun olmayan kişilercemi doldurulmuş
Düzenleme
• Eksik cevaplar olup olmadığına bakılır
• İki seçenek arasına işaret koyma
• Eksik cevaplama
– Eksik cevaplı anketlerde yapılabilecekler
• Anket deneğe tekrar doldurtulur
• Eksik cevapların yerine uygun cevaplar bulunur
– Eksik cevap verenlerin sayısının oransal olarak düşük olduğu,
– Eksik cevaplı anketlerde eksik kısımların az olması
– Eksik olan kısımların araştırma için önem arz eden değişkenlerden olmaması
durumlarında kullanılan yöntemdir
• Eksik cevaplı anketlerin iptal edilmesi
–
–
–
–
Örneklemin büyük olması,
Cevap verenlerle vermeyenler arasında özellikler açısından bir fark olmaması
Cevap vermeyenlerin anketin büyük bir kısmına cevap vermemesi,
Temel değişkenlere cevap verilmemiş olması durumlarında kullanılan
yöntemdir
Kodlama
• Sayısal forma dönüştürmedir. (KODLAMA
ÖRNEKLERİ)
• Her bir cevap seçeneğine karşılık gelen bir kod
(sayı) atanır.
• YENİDEN KODLAMA: kodlanmış olan bir
değişkene ait mevcut kodların yeni kodlarla
değiştirilmesidir.
• Her ankete bir numara verilmelidir (hataların
tespiti).
Verinin bilgisayar ortamına aktarılması
• İnternet anketlerinde ver direk aktarılır
• Veri klavye aracılığı ile giriliyor ise hata yapma
olasılığı yüksektir.
• Hataları görmek için frekans analizi alınır.
Veri temizleme
• Uç değerlerin tespiti (Belli bir markaya ilişkin herşey çok yüksek veya çok
düşük işaretlendi ise ön yargı olma ihtimali düşünülebilir).
• Mantıksal çelişkilerin araştırılması
• Cevap aralığı dışında kalan değerlerin tespiti (ankete giderek kontrol
yapılır).
• Eksik cevaplara çözüm bulma (ilk kontrol elle yapıldı, burada daha detaylı
inceleme yapılır)
– Eksik cevapları yeni değerlerle değiştirirken yapılacaklar
• Mevcut değişkenin ortalamasını almak
• Diğer değişkenlerden yararlanarak mevcut değişken için bir ortalama koymak
• Eksik değerlerin iptal edilmesi
– Tamamen iptal etmek
– Her bir hesaplamada sadece tam olan verilerle analiz yapmak
• Çamaşır makinası olmayan birinin, çamaşır makinası ile ilgili soruları
cevaplaması gibi durumlar
• Kontrol sorusu olarak sorulan soruya çelişkili cevaplar verenlerin tespiti vb.
İstatistiksel Düzenlemeler
• Değişkenlere Ağırlık Atama
• Bazı deneklerin cevaplarına diğerlerine göre daha fazla
ağırlık verme
• Zaman Serisinde son gözlemlere daha fazla ağırlık verme
• Değişkenlerin Yeniden Tanımlanması
• Örneğin aralıklı yaş değişkenini kategorik yapıya
dönüştürmek
• Veri Transformasyonu (Dönüştürme)
• Karekök dönüşümü negatif, logaritma dönüşümü vb
Uygun analiz stratejisinin seçimi
• Araştırmaya ve veriye uygun analiz
belirlenmelidir.
• Cinsiyet verisinde ortalama almak gibi
yanlışlıklar yapılmaktadır…
MERKEZİ EĞİLİM (YIĞILMA) ÖLÇÜLERİ
Puanların bir merkezde toplanma durumunu gösterir
Merkezi Yığılma Ölçüleri
mod
medyan
Aritmetik ortalama
Normal Dağılımda; mod=medyan=aritmetik ortalama bir birine eşittir
ortanca
MEDYAN (ORTANCA)
% 50
% 50
•Dağılımı iki eşit parçaya bölen değerdir (%50 - %50)
• Sıralama türü ölçekler için uygundur
Ham puanların sayısından etkilenir. Uç değerlerden etkilenmez
•Dağılımın tam ortası isteniyorsa, uç değerler ortalamayı etkiliyorsa, ortalamayı
hesaplamak için süre yoksa kullanılır
•Medyan bulunurken puanlar sıraya konulur
•Formülü: Çift sayılarda [(N/2) + (N/2)+(1)]/2
Örnek: Öğrencilerin vizeden aldığı notlar şu şekilde verilmiştir: 68, 71, 74, 80, 82, 88
Ortanca = [(6/2) + (6/2)+1 ] /2 = (3 + 4)/2 = (74+80)/2 = 77 68, 71, 74, (77) 80, 82, 88
Formülü: Tek sayılarda (N+1)/2
Örnek: Öğrencilerin vizeden aldığı notlar şu şekilde verilmiştir: 68, 71, 74, 80, 82
Ortanca = [(5+1)/2] = 3
68, 71, (74) 80, 82
MOD
•Dağılımda en çok tekrar eden değerdir
•Sınıflama türü ölçekler için uygundur
•Ortalama ve ortancanın hesaplanmadığı durumlarda kullanılır
En tipik ölçümler bilinmek isteniyorsa, kabaca hesaplanmak gerekiyorsa moda bakılır
Bir dağılımın birden fazla modu olabilir
•Ardışık eşit sayıda tekrarlanan varsa orta noktasıdır
•Dağılımdaki ölçümlerin hepsi aynı ise mod yoktur
•Uç noktalardan etkilenmez
•En az güvenilen merkezi eğilim ölçüsüdür
•Az sayıdaki ölçümler için uygun değildir
Örnek: Öğrencilerin vizeden aldığı notlar şu şekilde verilmiştir:
68, 71, 71, 74, 80, 80, 80, 80, 82, 88, 88
Cevap: 68, 71, 71, 74, 80, 80, 80, 80, 82, 88, 88
ortanca
MEDYAN (ORTANCA)
% 50
% 50
•Dağılımı iki eşit parçaya bölen değerdir (%50 - %50)
• Sıralama türü ölçekler için uygundur
Ham puanların sayısından etkilenir. Uç değerlerden etkilenmez
•Dağılımın tam ortası isteniyorsa, uç değerler ortalamayı etkiliyorsa, ortalamayı
hesaplamak için süre yoksa kullanılır
•Medyan bulunurken puanlar sıraya konulur
•Formülü: Çift sayılarda [(N/2) + (N/2)+(1)]/2
Örnek: Öğrencilerin vizeden aldığı notlar şu şekilde verilmiştir: 68, 71, 74, 80, 82, 88
Ortanca = [(6/2) + (6/2)+1 ] /2 = (3 + 4)/2 = (74+80)/2 = 77 68, 71, 74, (77) 80, 82, 88
Formülü: Tek sayılarda (N+1)/2
Örnek: Öğrencilerin vizeden aldığı notlar şu şekilde verilmiştir: 68, 71, 74, 80, 82
Ortanca = [(5+1)/2] = 3
68, 71, (74) 80, 82
A. ortalama
ARİTMETİK ORTALAMA
• En çok kullanılan merkezi yığılma ölçüsüdür ( x ) ile gösterilir
•Ölçümlerin toplamının, ölçüm sayısına bölümünü ifade eder
• Dağılımın uç değerlerinden etkilenir
• Bütün ölçümlerin kullanılmasıyla elde edilir
• Dağılım simetrikse, yani çarpık değilse ve üst düzey istatistiksel
işlemler yapılacaksa kullanılır
Öğrenci
1
2
3
4
5
6
Test Puanı
70
70
71
75
75
76
A.O.= (70+70+71+75+75+76) / 6
A.O.= 72.83
Dağılımda Çarpıklık
Download