Veri Düzenleme Grafiksel Gösterimler ve Merkezi Eğilim

advertisement
Veri Düzenleme Grafiksel Gösterimler
ve Merkezi Eğilim Ölçüleri
• Verilerin İşlenmesi
• Yapılan bir araştırmada elde edilen veriler dağınık,
düzensiz ve karmaşık bir hal içerir. Bu şekliyle veriden
anlamlı bir sonuca ulaşmak mümkün değildir. İstatistik
analizin hammaddesi niteliğinde olan bu ham verinin
işlenerek düzenli ve anlaşılır hale getirilmesi gerekir.
• Çeşitli kaynaklardan derlenmiş ya da bizim
tarafımızdan anket, deney ya da gözlem gibi tekniklerle
toplanmış olan ham verilerin anlaşılır ve düzenli hale
getirilebilmesi için istatistik seriler, tablolar ve
grafiklerden faydalanılır.
Veri Düzenleme Grafiksel Gösterimler
ve Merkezi Eğilim Ölçüleri
Veri Düzenleme
Zaman Serileri
• Bir
değişkenin
değerlerinin
zamanın
şıklarına göre (gün, ay,
mevsim,
yıl
vb.)
değişimini
gösteren
serilere zaman serisi
denir. Zaman serisi
verileri
eşit
zaman
aralıkları ile derlenmiş
verilerden oluşur.
Yıllar
X malı fiyatı
2000
12
2001
18
2002
15
2003
20
2004
27
2005
24
Veri Düzenleme
Kalitatif (niteliksel) Veriler ve Dağılışları
• Kalitatif
(Niteliksel)
verileri basit tasnif ya
da
bileşik
tasnif
işlemine tabi tutabiliriz.
Basit
tasnif
işlemi
sadece bir değişkenin
şıklarına göre yapılan
tasniftir.
Yanda
öğrencilerin
mezun
oldukları
lise
değişkeninin şıklarına
göre dağılışı basit tasnif
işlemine
örnek
gösterilebilir.
MYO öğrencilerinin mezun olduğu Lise
türüne göre dağılımı
Lise türü
Frekan Yüzde Kümülatif
sı
si
yüzde
Düz lise
143
43,7
43,7
End Meslek
123
37,6
81,3
Ticaret
23
7,1
88,4
Anadolu Fen
5
1,5
88,9
Diğer
33
10,1
100
Toplam
327
100
Veri Düzenleme
Niceliksel (Kantitatif- Ölçülebilen) Verilerin
İstatistik Bölünme Serileriyle Gösterilmesi
• Aşağıdaki tabloda öğrencinin mezun olduğu lise değişkeni
ile cinsiyet değişkeninin birlikte değişimi bileşik tasnif
işlemi ile gösterilmiştir.
MYO öğrencilerinin mezun olduğu Lise ve cinsiyet
değişkeninin şıklarına göre dağılışı
Lise türü
Erkek
Kız
Toplam
Yüzde
Düz lise
88
55
143
43,7
End Meslek
95
28
123
81,3
Ticaret
10
13
23
88,4
Anadolu Fen
2
3
5
89,9
Diğer
19
14
33
100,0
Toplam
214
113
327
43,7
Veri Düzenleme
Niceliksel (Kantitatif- Ölçülebilen) Verilerin
İstatistik Bölünme Serileriyle Gösterilmesi
• Niceliksel olarak ifade edilen sayısal olarak ifade edilen ya
da ölçülebilir özellik taşıyan değişkenlere ait verilerin
istatistik bölünme serileri ile gösterilmesinde basit, tasnif
edilmiş ve gruplanmış seriler kullanılır.
• Basit Seri: Derlenmiş olan sayısal verilerin küçükten
büyüğe doğru sıralanması ile elde edilen serilerdir.
• Tasnif edilmiş seri: Tasnif edilmiş serilerde tekrarlayan
elemanlar bir araya getirilerek frekanslar şeklinde ifade
edilen seridir.
• Gruplanmış seri: Belli değer aralıklarına düşen birimler
bir araya getirilerek oluşturulan frekanslı serilere
gruplanmış seri adı verilir.
Veri Düzenleme
Niceliksel (Kantitatif- Ölçülebilen) Verilerin
İstatistik Bölünme Serileriyle Gösterilmesi
• Basit seri örnekleri
Notlar
Uzunluklar
Satışlar
10
143
3
22
147
4
30
155
6
43
160
7
50
167
7
55
170
7
63
176
8
70
185
8
90
191
9
Veri Düzenleme
Niceliksel (Kantitatif- Ölçülebilen) Verilerin
İstatistik Bölünme Serileriyle Gösterilmesi
• Tasnif edilmiş seri örnekleri
Notlar
(Xi)
Öğr.say
(fi)
1
2
3
5
160
165
3
5
4
5
1
3
3
4
5
Toplam
8
4
1
21
170
180
190
Toplam
4
2
1
15
6
7
8
Toplam
6
4
2
16
Uzunluk Fert say
(Xi)
(fi)
Satışlar Gün say
(Xi)
(fi)
Veri Düzenleme
Niceliksel (Kantitatif- Ölçülebilen) Verilerin
İstatistik Bölünme Serileriyle Gösterilmesi
• Gruplanmış seri örnekleri
Notlar
Öğrenci
sayısı
0 - 20
Uzunluk
Fert
sayısı
Satışlar
Gün
sayısı
4
140 – 150
2
10 – 30
1
20 – 40
10
150 – 160
5
30 – 40
4
40 – 60
20
160 – 170
12
40 – 50
7
60 – 80
13
170 – 180
10
50 – 70
6
80 –100
3
180 – 190
6
70 – 100
3
Veri Düzenleme
Niceliksel (Kantitatif- Ölçülebilen) Verilerin
İstatistik Bölünme Serileriyle Gösterilmesi
• Kesikli
karakterdeki
niceliksel
verileri
gruplarken
sınıf
aralıklarında boşluklar
oluşur. Yandaki seride
KOBİ’lerde çalışan işçi
sayısı değişkeni kesikli
bir özelliğe sahiptir. Bu
değişken
tamsayı
dışında değerler almaz.
Bu sebeple sınıflar arası
boşluklar oluşur.
Çalışan İşçi KOBİ Sayısı
Sayısı
5 – 14
10
15 – 24
20
25 – 34
25
35 – 44
15
45 – 54
5
Veri Düzenleme
Niceliksel (Kantitatif- Ölçülebilen) Verilerin
İstatistik Bölünme Serileriyle Gösterilmesi
• Niceliksel olarak ifade edilen sayısal olarak ifade edilen ya
da ölçülebilir özellik taşıyan değişkenlere ait verilerin
istatistik bölünme serileri ile gösterilmesinde basit, tasnif
edilmiş ve gruplanmış seriler kullanılır.
• Basit Seri: Derlenmiş olan sayısal verilerin küçükten
büyüğe doğru sıralanması ile elde edilen serilerdir.
• Tasnif edilmiş seri: Tasnif edilmiş serilerde tekrarlayan
elemanlar bir araya getirilerek frekanslar şeklinde ifade
edilen seridir.
• Gruplanmış seri: Belli değer aralıklarına düşen birimler
bir araya getirilerek oluşturulan frekanslı serilere
gruplanmış seri adı verilir.
Basit ve tasnif edilmiş serinin
Gruplanmış seriye dönüştürülmesi
• Basit ve tasnif edilmiş serilerle verinin anlaşılır hale
gelmesi mümkün olmuyorsa böyle durumlarda veriyi
sınıflara ayırarak gruplanmış seriye dönüştürmek
gerekebilir. Veriyi gruplamak için aşağıdaki Sturges
sınıf aralığı formülü kullanılabilir.
X max  X min
S
1  3,322  log N
• S: Sınıf aralığı
• Xmax: Verinin en büyük değeri
• Xmin: Verinin en küçük değeri
• N: Veri sayısı
Bir verinin gruplanmış seriye
dönüştürülmesi
Öğrencilerin notları
37 67 79 58 51 33
53 95 60 64 43 66
81 58 65 50 64 50
70
25
56
46
40
56
59
51
89
57 77
60 57
63 80
77
59
73
• Xmin: 25
Xmax: 95
95  25
S
 11,37  11
1  3,322 log 36
• Serinin sınıf aralıkları
11 birim olacak şekilde
gruplanması
uygun
olacaktır.
Bir verinin gruplanmış seriye
dönüştürülmesi
Notlar
Öğrenci sayısı
25 - 36 dan az
2
36 - 47
“
“
4
47 - 58
“
“
9
58 - 69
“
“
12
69 - 80
“
“
5
80 - 91
“
“
3
91 - 100 “
“
1
Çapraz Tablolar
• Bazı durumlarda değişkenin iki farklı özelliğinin
aynı tabloda eşleştirilmiş olarak gösterilmesi
istenebilir. Böyle durumlarda çapraz tablo
kullanılır. Tabloda satıra istatistik birimlerin bir
özelliği, sütuna diğer özelliği yazılarak ortak
eleman sayıları hücrelere yazılmak suretiyle
çapraz tablolar oluşturulur. Çapraz tablolar hem
niteliksel, hem de niceliksel veriler için
oluşturulabilir. Aşağıda MYO öğrencilerinin mezun
oldukları lise türü ve öğrenim gördükleri bölümlere
göre dağılışı verilmiştir. Bu tablo niteliksel veriler
için düzenlenmiş bir tablodur.
Çapraz Tablo Örneği
Lise Lise
Türü
Bölümler
Çevre
Bilgisayar Kalıpçılık Lojistik Makine Mekatronik
Düz lise
27
11
16
8
17
9
Anadolu
Fen
2
0
0
0
1
0
Ticaret
0
3
5
3
0
2
End.
Meslek
0
9
3
5
5
2
Diğer
3
0
3
0
6
3
Toplam
32
23
27
16
29
16
Verilerin Grafiklerle Gösterilmesi
•Niteliksel seriler ve Tasnif edilmiş seriler için çubuk diyagramı
1
2
3
Öğrenci sayısı
3
7
10
4
6
5
2
Öğrenci sayısı
Notlar
Öğrenci sayısının dağılımı
12
10
8
6
4
2
0
1
2
3
Notlar
4
5
Gruplanmış serinin Histogram grafiği
Bu grafiğin diğer bir ismi sütun grafiğidir. Grafiğin özelliği
sürekli karakterde verilerin grafiği olması sebebiyle
histogram sütunların birbirine bitişik olmasıdır
Not sınıfları
Öğrenci
sayısı
26– 37 den az
2
37 – 48 “ “
4
48 – 59 “ “
9
59 – 70 “ “
12
70 – 81 “ “
5
81 – 92 “ “
3
92 – 100 “ “
1
Gruplanmış serinin Histogram grafiği
Bu grafiğin diğer bir ismi sütun grafiğidir. Grafiğin özelliği
sürekli karakterde verilerin grafiği olması sebebiyle
histogram sütunların birbirine bitişik olmasıdır
Not sınıfları
Öğrenci
sayısı
25 – 36 den
az
2
36 – 47 “ “
4
47 – 58 “ “
9
58 – 69 “ “
12
69 – 80 “ “
5
80 – 91 “ “
3
91 – 100 “ “
1
Gruplanmış serinin Histogram grafiği
• Sınıf aralıkları eşit olmadığı
zaman histogramı orijinal seri
üzerinden çizmek uygun olmaz.
Eğer orijinal seriden hareketle
histogram
çizilirse
olayın
dağılışı doğru bir şekilde
gösterilemez. Dağılışı daha
doğru
bir
şekilde
ortaya
koymak
için
histogram
sütunlarının alanını frekansa
eşit
yapacak
şekilde
frekansların
yeniden
ayarlanması yapılır. Yanda
öğrenci notları serisi farklı sınıf
aralıkları ile verilmiştir
Notlar
Öğrenci
sayısı
0 – 5 den az
10
5 – 7 den az
20
7 – 9 dan az
14
9 - 10
5
Gruplanmış serinin Histogram grafiği
Notlar Öğrenci
Sınıf
Ayarlan
sayısı Genişliği
mış
frek
ans
0–5
10
5
10/5 =
2
5–7
20
2
20/2 =
10
7–9
14
2
14/2 =
7
9 - 10
5
1
5/1 = 5
Frekans Eğrisi (Poligonu)
Histogram sütunlarının üst orta noktalarından geçen grafiktir.
Bu grafik dağılımın şeklini ortaya koymada kullanılan bir grafiktir.
Not sınıfları
Öğrenci
sayısı
25 – 36 den az
2
36 – 47
47 – 58
58 – 69
69 – 80
“
“
“
“
“
“
“
“
4
9
12
5
80 – 91 “ “
91 – 100 “ “
3
1
Dairesel Grafikler
• Özellikle niteliksel (sayısal olmayan) değişken
değerlerinin grafikle gösterilmesinde kullanılırlar.
Dairenin frekanslara açısal olarak paylaştırılması ile
elde edilir. Bir birimin açısal karşılığı şöyle bulunur.
•
360
360

 3 derece
Açısal değer 
Toplam frekans 120
• Her kategorinin frekansı bu 3 ile çarpılarak dairedeki
açısal değeri bulunur.
Dairesel Grafikler
Mezun old.
Lise
Öğr.
sayısı
Açısal
değer
End. Meslek
Lis.
50
150
Düz Lise
40
120
20
60
10
30
120
360
Ticaret
Lisesi
Diğer
Liseler
Toplam
Zaman Serisi Grafiği (Çizgi Grafiği)
• Zamana bağlı olarak sabit aralıklarla toplanmış olan
verilerin eğilimini ve değişimini izleyebilmek için çizgi
grafiklerinden faydalanılır. Grafikte yatay eksen
zamanı, dikey eksen ise zaman serisi değerlerini
göstermektedir. Zaman serileri artan, azalan,
durağan ya da periyodik değişen veya bu özelliklerin
bir kısmını içeren verilerden oluşur. Nüfus, gelir,
enerji tüketimi, konut sayısı vs. artan zaman
serilerine örnek gösterilebilir. Modası geçen,
teknolojisi eskiyen ürünlerin satışı azalan zaman
serisi niteliğindedir. Konutlarda tüketilen doğalgaz
miktarı, meşrubat tüketimi vb. hem eğilimli hem de
periyodik değişim gösteren bir özelliğe sahiptir.
Artan bir zaman serisi ve grafiği
Yıllar
X malı fiyatı
2000
12
2001
18
2002
15
2003
20
2004
27
2005
24
Dağılım Grafiği
• Aralarında ilişki olduğu düşünülen iki değişkenin
birbirine göre nasıl bir değişim gösterdiğini, nasıl
bir ilişki içinde olduğunu gösteren grafiklerdir.
Genellikle bu değişkenlerden bir etkileyen
(bağımsız, açıklayan), diğeri etkilenen (bağımlı,
açıklanan) değişken olarak ortaya çıkar. Bir malın
fiyatı ile onun talebi arasında ters bir ilişki olduğu
düşünülür. Kişilerin gelirleri ile tüketim harcamaları
arasında pozitif bir ilişkinin olduğu kabul edilir.
Aşağıda öğrencilerin matematik notları ile istatistik
notları arasındaki ilişki dağılım grafiği ile
gösterilmiştir.
Dağılım Grafiği
Matematik
notu
70
25
40
55
90
15
70
Dağılım Grafiği
İstatistik notu
İstatistik
notu
60
30
50
40
80
20
80
90
80
70
60
50
40
30
20
10
0
0
20
40
60
80
Matematik notu
100
Üç boyutlu grafikler
Çapraz tablo şeklindeki verilerin grafikle gösteriminde kullanılır.
Bu grafikte dikey eksen frekansları, yatay eksenler ise
değişkenin iki özelliğini gösterecek şekilde dizayn edilir.
Lise
Çevre
Bilgisa
yar
Kalıp
çılık
Lojis
tik
Düz lise
17
11
6
8
Ticaret
2
0
0
0
Anadolu
0
3
5
13
EML
0
9
15
5
Diğer
3
0
6
0
KAYNAKLAR
1. Yüksel, İ., ‘İstatistik ve Olasılık Ders Notları’, 2011.
Download