Örnek - SABİS

advertisement
Merkezi Eğilim Ölçüleri (Ortalamalar)
• Analitik Ortalamalar
– Aritmetik
– Geometrik
– Harmonik
– Kareli ortalama
• Analitik olmayan ortalamalar
– Mod
– Medyan
– Kartil, Desil ve Santiller
I. Merkezi Eğilim Ölçüleri (Ortalamalar)
•
Bir veri setinin merkez noktasını gösteren, serinin normal
değerinin bir göstergesi olan ve veriyi tek bir değerle ifade
eden değerlere merkezi eğilim ölçüleri adı verilir. Bir verinin
ortalaması onun en küçük ve en büyük değeri arasında yer
alır.
X min Ortalama  X max
Ortalamaların Faydaları: Ortalamaların faydaları kısaca şöyle
özetlenebilir.
1. Ortalamalar çoğu zaman serinin normal değerini gösterir.
Tabi bunun için serinin dağılımının da aşırı çarpık olmaması
gerekir.
2. İstatistik analiz işleminin temel elemanlarından biridir.
3. Aynı birimle ölçmek kaydıyla farklı serileri karşılaştırmaya
imkan tanır.
4. Tek bir sayı olması sebebiyle hatırda tutulması kolaydır.
Ortalamalar
verinin
tamamını
kapsayıp
kapsamamasına göre analitik ve analitik olmayan
ortalamalar şeklinde iki grupta incelenir.
1. Analitik (Hassas ortalamalar)
Verideki bütün değerleri dikkate alarak hesaplanan
ortalamalardır. Analitik ortalamalar verinin özelliğine
ve hesap tarzına göre dört farklı şekilde elde edilir.
1.1. Aritmetik ortalama ( X )
1.2. Geometrik ortalama (G)
1.3. Harmonik ortalama (H)
1.4. Kareli ortalama (K).
1.1. Aritmetik ortalama
• Aritmetik ortalama serideki gözlem değerleri
toplamının toplam gözlem sayısına oranıdır.
• Basit seride
X 1  X 2  ...........  XN  X i
X

N
N
• Tasnif edilmiş seride
f 1 X 1  f 2 X 2  ....  fkXk  f i X i
X

f 1  f 2  ....  fk
 fi
• Gruplanmış seride
f1m1  f 2 m2 ....  f k mk
X 

f1  f 2  ....  f k
Xi : i. gözlem değeri
fi : i. değerin frekansı
mi : i. sınıfın orta noktası N : toplam gözlem sayısı
fm
f
i
i
i
• Örnek: Adapazarı'nda nisan ayı ortalama yağışlarını tahmin etmek için
geçmiş nisan ayı yağış rakamlarından rasgele 7 tanesi seçilmiş ve
aşağıdaki sonuçlar elde edilmiştir. Bu verilerden hareketle
Adapazarı'nda nisan ayı yağışlarının aritmetik ortalamasını hesaplayınız.
Nisan ayı yağışları (Kg)
(Xi)
60
75
80
100
120
130
155
∑Xi=720
X 1  X 2  ...........  XN
X
N
X i 720

X

N
7
X  102,86 Kg
Örnek Bir işletmede aynı parçayı üreten işçilerin bu parçayı
üretim sürelerinin dağılımı aşağıdaki gibi gözlenmiştir. Parça
üretim süresinin aritmetik ortalamasını bulunuz.
5
Parça üretim İşçi
süresi(dk)(Xi) sayısı (f )
i
fi.Xi
12
2
24
13
5
65
14
10
140
X 

f i Xi

i 1
5

fi
398
28
i 1
X  14,21 dk .
12
10
15
16
7
4
105
64
8
6
4
2
0
Toplam
28
398
12
13
14
15
16
Örnek Bir işyerinde yapılan telefon görüşmelerinin süresinin dağılımı
için aşağıdaki gruplanmış seri verilmiştir. Buna göre görüşme süresinin
aritmetik ortalamasını bulunuz.
k
Görüşme Görüşme
süresi
sayısı (fi)
mi fimi
0 - 2
1
5
X 
5

f i mi
i 1
k

fi
670

110
i 1
2 - 4
10
3
30
4 - 6
40
5
200
X  6,09 dak ik a
45
40
6 -8
30
7
210
35
30
25
8 - 10
Toplam
25
110
9
225
670
20
15
10
5
0
1
3
5
7
9
Tartılı Aritmetik Ortalama
• Bir serideki gözlem değerlerlerinin önem dereceleri farklı olursa,
bu tür serilerin aritmetik ortalaması tartılı olarak hesaplanır. Bunun
için önem derecesini gösteren katsayılar (tartılar) kullanılır. Örnek
olarak öğrencilerin ortalama notlarını hesaplarken derslerin
kredileri tartı olarak düşünülürken, ücretlerin belirlenmesinde
kıdem tartı olarak kabul edilebilir.
• Basit seride
XT
t X


t
i
i
i
• Tasnif edilmiş seride
XT
t f X


t f
t fm


t f
i
i
i
• Gruplanmış seride
XT
i
i
i
i
i
i
i
Örnek Aşağıda bir öğrencinin almış olduğu dersler, notları ve kredileri
verilmiştir. Not ortalamasını tartılı aritmetik ortalama cinsinden
hesaplayınız.
Dersler
Notlar
(Xi)
Kredi
(ti)
tiXi
İstatistik
70
3
210
Matematik
60
4
240
Fizik
50
3
150
Kimya
80
2
160
Toplam
260
ti=12
tiXi=760
XT
tX


t
i
i
i
760

12
X T  63,33 puan
Örnek Bir işletmede işçilerin saat ücretleri çalıştıkları süre (kıdem) dikkate
alınarak belirlenmektedir. Veriler aşağıdaki gibi olduğuna bu işletmede
ortalama saat ücretini tartılı aritmetik ortalama cinsinden hesaplayınız.
Saat ücreti
(milyon)
(YTL)
İşçi sayısı
(fi)
Ortalama
kıdem
(ti)
mi
f it i
fitimi
fimi
1.00 – 1.40
10
2.5
1.20
25
30.0
12.00
1.40 – 1.60
30
5.0
1.50
150
225.0
45.00
1.60 – 1.80
50
9.5
1.70
475
807.5
85.00
1.80 – 2.00
15
13.0
1.90
195
370.5
16.90
2.00 – 2.50
5
18.0
2.25
90
202.5
11.25
Toplam
110
935
1635.5
170.15
ftm

X
 ft
i i
i i
i
1635,5

 X  1,75 YTL / saat
935
Tartılı aritmetik ortalamanın kullanıldığı yerler
- Veriler arasında önem farkı bulunması halinde kullanılır.
- Oranların ve ortalamaların ortalaması hesaplanırken kullanılır.
- Ortalama maliyet ve satış fiyatı, bileşik fiyat ve miktar indekslerinin
hesaplanmasında da tartılı ortalama kullanılır.
Örnek Bir işletmede bulunan üç tezgahın belli bir günde ürettikleri
malların sayısı ve üretimlerindeki kusurlu oranları aşağıdaki tabloda
verilmiştir. Buna göre bu tezgahlarının ürettiği mamul kütlesinin
kusurlu oranını bulunuz.
Tezgah
lar
Üretim
miktarı
(ti)
Kusurlu
oranı
(Xi)
tiXi
A
100
0.03
3
B
200
0.05
10
C
50
0.01
0.5
 ti = 350
Xi = 0.09
tiXi = 13.5
XT
tX


t
i
i

i
X T  0,03857
13,5
350
Aritmetik ortalamanın özellikleri
1 Aritmetik ortalama hassas bir ortalama olup serideki aşırı
değerlerden etkilenir ve aşırı değere doğru kayma gösterir.
2 - Serinin gözlem sayısı ile aritmetik ortalaması çarpılırsa serinin
toplam değeri elde edilir.
NX   X i
3- Serideki gözlem değerlerinin aritmetik ortalamadan sapmaları
toplamı sıfır olur.
(X
i
 X )   X i  NX
X


N
i
NX

 X X 0
N
4- Serideki değerlerin aritmetik ortalamadan sapmalarının kareleri
toplamı minimum olur.
X ) 2  Minimum
5Aritmetik ortalama özellikle normal
yakın serilerin
 ( X i dağılıma
ortalaması için elverişlidir.
6-
Bir serinin değerleri, diğer iki serinin değerleri toplamından
oluşuyorsa bu serinin aritmetik ortalaması da diğer iki serinin
aritmetik ortalamaları toplamına eşit olur. X =Y +Z
Aritmetik ortalamanın SPSS’te hesaplanması
• Aritmetik ortalamayı SPSS’te analyze menüsünün Reports
kısmından hesaplamak mümkündür. Bunun için Analyze,
Reports ve Case summaries tıklanır.
Aritmetik ortalamanın SPSS’te hesaplanması
• Gelen ekranda Variables kısmına Ağırlık değişkeni girilir ve
Statistics tıklanır. Gelen ekranda Cell statistics kısmına
Mean atanır. Continue ve OK tıklanarak sonuçlar çıktı
ekranında görüntülenir.
Sonuç çıktı
ekranında şöyle
görüntülenir.
Case Summaries
Mean
Aracın ağırlığı
2970,99
Aritmetik ortalamanın SPSS’te hesaplanması
• Aritmetik ortalamanın belli bir değişkenin kategorilerine göre
hesaplanması: Bunun için otomobilin ağırlığının aritmetik
ortalamasını ülke orjinine göre hesaplayacağız. Analyze
menüsünden Reports ve Case summaries tıklanır. Gelen
ekranda Variables kısmına ağırlık, Grouping variable(s)
kısmına ülke orjini değişkeni girilir ve statistics tıklanır ve gelen
ekranda Mean girilip Continue ve OK tıklanır.
Aritmetik ortalamanın SPSS’te hesaplanması
• Sonuçlar SPSS ekranında aşağıdaki gibi görüntülenir.
Case Processing Summary
Cases
Included
N
Aracın ağırlığı * Ülke orjini
Excluded
Percent
N
393 100,0%
Case Summaries
Mean
Ülke orjini
American
European
Japanese
Total
Aracın ağırlığı
3366,92
2437,09
2221,23
2970,99
Percent
0
,0%
Total
N
Percent
393 100,0%
SPSS te Aritmetik Ortalama
• SPSS’te aritmetik ortalamayı hesaplayabilmek için
Analyze menüsünden Descriptive Statistics seçeneği
tıklanır.
SPSS te Aritmetik Ortalama
• Gelen ekranda Variable(s) kısmına ortalamasını hesaplamak
istediğimiz değişkenleri ( Alınanyol, Motorhacmi, Beygirgücü,
Ağırlık) girilir. Options tıklanır ve gelen ekranda Mean (aritmetik
ortalama) işaretlenir ve Continue ve OK tıklanarak sonuçlar çıktı
ekranından alınır.
SPSS te Aritmetik Ortalama
• Sonuçlar aşağıdaki şekilde elde edilir.
Descriptive Statistics
Galon başına Miles
N
Minimum Maximum
392
10
47
Sum
9216
Mean
23,51
Motor hacmi boyutu
393
68
455
76127
193,71
Beygir gücü
392
46
230
40869
104,26
Aracın ağırlığı
393
1613
5140
1167601
2970,99
Valid N (listwise)
391
En küçük
değerler
En büyük
değerler
Verinin
toplamı
Aritmetik
ortalama
SPSS’te Tasnif Edilmiş serinin Aritmetik
Ortalaması
• Önce tasnif edilmiş bir seri oluşturalım. Bunun için öğrencilerin 010 arasındaki notların dağılımını SPSS sayfasına giriş yapalım.
Bunun için veri ekranının 1. sütununa notları, 2. sütununa
öğrenci sayılarını girelim. File menüsünden New ve Data tıklanır
ve yeni bir veri sayfası ekrana gelir. Bu sayfaya veriler girilir.
Variable view sayfasından değişken isimleri girilir.
SPSS’te Tasnif edilmiş serinin Aritmetik Ortalaması
• Öğrenci sayılarını frekans olarak tanımlayabilmek için Data
menüsünden Weight cases tıklanır ve gelen ekranda Weight
cases by kısmına öğrencisayısı değişkeni girilir böylece frekans
tanımlanmış olur.
SPSS’te Tasnif edilmiş serinin Aritmetik Ortalaması
• Analyze menüsünden Reports ve Case summaries tıklanır. Gelen
ekranda Variables kısmına Ağırlık değişkeni girilir ve statistics
tıklanır. Gelen ekranda Mean (aritmetik ortalama) seçilir,
continue ve OK tıklanarak sonuçlar çıktı ekranından alınır.
SPSS’te Tasnif edilmiş serinin Aritmetik Ortalaması
Sonuçlar
aşağıdaki gibi
görüntülenir.
Case
Summaries
Mean
Notlar
5,00
SPSS’te Tasnif Edilmiş serinin Aritmetik
Ortalaması
• Analyze menüsünden Descriptive statistics kısmından Descriptive
tıklanır. Gelen ekranda Variable(s) için Notlar girilir.Options tıklanır
Mean işaretlenip Continue ve OK tıklanır
SPSS’te Tasnif Edilmiş serinin Aritmetik
Ortalaması
• Sonuçlar çıktı ekranında aşağıdaki gibi görüntülenir.
Descriptive Statistics
N
Notlar
Valid N
(listwise)
Minimum Maximum
113
0
10
113
Öğrenci
sayısı
Endüşük
not
Enyüksek
not
Sum
617
Notlar
toplamı
Mean
5,46
Aritmetik
ortalama
2- Geometrik Ortalama (G)
• Bir serideki gözlem değerlerinin birbirleri ile
çarpımlarının, gözlem sayısı derecesinde kökünün
alınması ile elde edilir. Basit seri için şöyle yazılır.
• G  N X 1  X 2  X 3     XN olup X 1  X 2  X 3       X N   X i
yazılırsa kısaca geometrik ortalama
N
olarak yazılır.
GN
X

i
i 1
Ancak bu yoldan geometrik ortalamayı bulmak için gözlem
sayısının az olması gerekir. Gözlem sayısı arttıkça bu
yoldan
geometrik
ortalamayı
hesaplamak
güçleşmektedir. Bunun yerine logaritmik dönüşüm
uygulanarak geometrik ortalama hesaplanır.
G  N X 1  X 2  X 3     XN
G  ( X 1  X 2  X 3     XN )1/ N
ifadesi üslü olarak
yazılır, bu ifadenin her iki
tarafının logaritması alınırsa
1
log G  log( X 1  X 2  X 3      X N )
N
Çarpımın logaritması ayrı ayrı logaritmalar toplamına eşit
olduğuna göre;
log X  log X  log X       log X
olup düzenlenirse,
log G 
1
2
3
N
N
N
 log X
i
log G 
i 1
Burada logG’yi G ye çevirmek için
logG’nin ters logaritması alınarak geometrik ortalama
elde edilir.
N
G  10 log G
• Tasnif edilmiş seride;
fi f 1

G
X 1  X 2f 2  X 3f 3     X kfk
logaritmik olarak;
k
fi log Xi

f 1 log X 1  f 2 log X 2  f 3 log X 3       fk log Xk
log G 
 logolur.
G  i 1 k
f 1  f 2  f 3      fk
• Gruplanmış seri için;
f
i
i 1
fi f 1 f 2

G
m1  m2  m3f 3    mkfk
k

f 1 log m1  f 2 log m2  f 3 log m3       fk log mk
log G 
 log G  i 1 k
f 1  f 2  f 3      fk
 fi
fi log mi
i 1
Geometrik ortalamanın özellikle geometrik dizi şeklindeki
serilere uygun olduğunu söylemek mümkündür. Geometrik
bir diziye logaritması alınarak aritmetik diziye dönüşür.
Örnek Bir işletmede aynı parçayı üreten 5 işçinin belli bir
günde ürettikleri kusurlu parça sayıları aşağıda
verilmiştir. Bu işçilerin parça üretiminin geometrik
ortalamasını bulunuz.
G  N X 1  X 2  X 3     XN
Kusurlu parça
sayısı (Xi)
logXi
3
0.477
G  5 3  5  8 15  30  5 54000
5
0.699
G  8,84 parça
8
0.903
15
30
veya
N
1.176
1.477
log Xi = 4.732
 log X
i
log G 
İ 1
N
G  10 0,9464

4.732
 log G  0,9464
5
G  8,84 parça
Örnek 1.10) Bir işletmede çalışan işçilerin belli bir günde
ürettikleri kusurlu parça sayılarının dağılımı aşağıda
verilmiştir. Bu verilerden hareketle işçi başına günlük kusurlu
parça
üretiminin
geometrik
ortalamasını
bulunuz.
Kusurlu parça
sayısı
İşçi sayısı
(fi)
mi
logmi
filogmi
0 – 10
5
5
0.69897
3.49485
10 – 13
8
11.5
1.0606
8.4848
13 – 15
10
14
1.146
11.46
15 – 20
12
17.5
1.243
14.316
20 – 40
5
30
1.477
7.385
fi = 40
fi
G   m1f 1  m2f 2  m3f 3    mkfk
filogmi = 45.74065
 40 55  11.58 1410 17.512  305
=13,918
k
 f log m
i
log G 
i
i 1
k
f
i 1
i

45,74065
 log G  1,1436
40
G  101,1436 G=13,918 parça
Geometrik ortalamanın SPSS’te bulunuşu
• Basit serinin geometrik ortalaması
• Basit bir serinin geometrik ortalamasını SPSS’te bulabilmek
için Analyze menüsünden Reports ve cases summary tıklanır.
Geometrik ortalamanın SPSS’te bulunuşu
• Gelen ekranda geometrik ortalaması bulunacak
değişken(ler) Variables kısmına taşınır (Gidilenyol). Statistics
tıklanır ve gelen ekranda Geometric mean seçilir, continue
ve OK tıklanır. Sonuçlar çıktı ekranında görüntülenir.
Sonuçlar çıktı
ekranda aşağıdaki
gibi görüntülenir.
Case Summaries
Geometric Mean
Galon başına Miles
22,24
Geometrik ortalamanın SPSS’te bulunuşu
• Tasnif edilmiş serinin geometrik ortalaması
• Tasnif edilmiş bir serinin geometrik ortalamasını
SPSS’te bulabilmek için serinin frekansının
tanımlanması gerekir. Bilindiği gibi bunun için Data
menüsünden Weight cases seçeneği tıklanıp
frekans değişkeni Weight cases by kısmına
taşınarak tanımlanmaktadır. Geometrik ortalama
için diğer işlemler yukarıda anlatıldığı gibi
yapılmaktadır.
• Öğrencilerin notlarının geometrik ortalaması
SPSS’te hesaplanacaktır. İlgili ekranlar aşağıdaki
gibi görüntülenir.
Geometrik ortalamanın SPSS’te bulunuşu
Frekans tanımlama işlemi aşağıdaki gibi yapılır
Geometrik ortalamanın SPSS’te bulunuşu
Geometrik ortalama
çıktı ekranında
aşağıdaki gibi
görüntülenir.
Case Summaries
Geometric Mean
Notlar
4,98
• Geometrik Ortalamanın Tahmin Amacıyla Kullanımı
• Geometrik diziye benzer değişim gösteren nüfus, milli gelir artışı, fiyat
artışı ve sermaye artışı gibi değişkenlerin tahmininde geometrik
ortalama özelliğinden yararlanılabilir. Bu tür seriler genel olarak bir
önceki yılın belli bir yüzdesi şeklinde değişim göstermektedir. Bunun
için bir dönemlik (ay yıl vs)değişim oranı geometrik ortalama ile
belirlenir. Bu eğilimin gelecekte de benzerlik göstereceği varsayımı ile
gelecek dönem ile ilgili tahminler elde edilebilir.
• Bir malın fiyatı için:
Po: başlangıç dönemi değeri,
Pn: n. Dönemin değeri,
r : bir dönemlik değişim yüzdesi
Pn
(1  r )  n
P0
Pn
 (1  r ) 
P0
n
Pn  P0 (1  r )
n
şeklinde olur.
Örnek Bir X malının 1995 yılı fiyatı 10000 TL , 2003 yılı fiyatı 300000
TL olduğu bilindiğine göre;
a) Bu malın yıllık fiyat artış oranını hesaplayınız
b) 2010 yılı için X malının fiyatını tahmin ediniz
c) 1985 yılı fiyatı ne olmuş olabilir
d) 1999 yılı fiyatını tahmin ediniz
e) Hangi yılda fiyatlar 50000000 TL olur?
Çözüm
P1995 = 10000 P2003 = 300000 n= 8 (2003-1995)
Fiyat artış oranı için geometrik artış dikkate alınırsa;
Pn 8 300000
fiyat artışı %53
8


(
1

r
)

30
(
1

r
)

1
,
53
a) (1  r ) 
10000
P0
n
b) Pn  P 0(1  r ) n
formülünden 2010 yılı fiyatı tahmin edilebilir.
P2010 = P2003(1,53)(2010-2003) P2010 = 300000(1,53)7 = 300000(19,626)
P2010 = 5887800 TL olur.
Geometrik ortalamanın özellikleri
1) Geometrik ortalamanın gözlem sayısı kadar üssü alınırsa serinin
çarpımı elde edilir.
GN = X1X2X3XN GN = Xi
2) Bir serideki gözlem değerlerinin geometrik ortalamaya oranları
çarpımı 1’e eşittir.
X 1  X 2  X 3     XN  Xi G N
 N  N 1
G  G  G    G
G
G
3) Bir serideki değerlerin logaritmalarının serinin geometrik
ortalamasının logaritmasından farklarının toplamı sıfır olur
(logXi - logG) = 0 logXi - NlogG = 0
 log X
i
N
N  log G

 0  log G  log G  0
N
4) Serideki aşırı değerlere karşı, aritmetik ortalama kadar hassas
değildir.
5- İki serinin gözlem sayısı ve çarpımları eşit ise geometrik ortalamaları
da eşit olur.
6) Seride sıfır veya negatif gözlem değeri varsa geometrik ortalama
hesaplanamaz.
7) Geometrik ortalama özellikle geometrik dizi şeklindeki (değişim oranı
sabit) serilerin ortalamasının hesaplanmasında kullanılır. (2,4,8,16,32,64
tam geometrik 1,10,100,1000,10000 tam geometrik vs.)
Xi
3
logXi
0,477
9
0,954
27
1,431
81
1,908
243
2,386
G  5 3  9  27  81 243  5 14348907
G  27
log X i 7,156
log G 

 log G  1,4312
N
5
G  10
1, 4312
G  27
4. Kareli Ortalama (K)
• Kareli ortalama serideki değerlerin karelerinin aritmetik
ortalamasının kareköküdür.Kareli ortalama aşağıdaki formüllerle
hesaplanır.
N
Basit seride:
K
X  X  X    X
N
2
1
2
2
2
3
2
N
K
X
2
i
i 1
N
k
Tasnif edilmiş seride:
K
f1 X 12  f 2 X 22  f 3 X 32      f k X k2
K
f 1  f 2  f 3       fk
f X
i
i 1
2
i
k
f
i
i 1
k
Gruplanmış seride:
K
f1 m12  f 2 m22  f 3 m32      f k mk2
K
f 1  f 2  f 3       fk

i 1
f i mi2
k
f
i 1
i
Örnek: Bir otomobil servis istasyonuna günlük olarak gelen
araçların dağılımı aşağıda verilmiştir.
Araç sayısı
(Xi)
Gün sayısı
(fi)
1
2
3
4
8
12
1
4
9
4
32
108
4
10
16
160
5
Toplam
6
∑fi= 40
25
150
K

f
f i  X i2
K  11,35
i

X
2
i
454
40
K  3,39 araç
fi  X

2
i
fi  X i2  454
Örnek Bir şehirdeki konutlarda elektrik enerjisi tüketimi üzerine yapılan
araştırmada, 200 konut rasgele seçilmiş ve aşağıdaki sonuçlar elde
edilmiştir.
k
K
fm
2
i
i
i 1
k
f
i
4235875

200
i 1
K  21179,375
K  145,53 Kwh / ay
Aylık elektrik
Tüketimi
(Kwh)
Konut
sayısı
(fi)
mi
0 – 60
10
30
9000
60 – 100
20
80
128000
100 – 120
40
110
484000
120 – 140
50
130
845000
140 – 180
45
160
1152000
180 – 250
35
215
1617875
Toplam
200
fimi2
4235875
Kareli ortalamanın kullanıldığı yerler
• Diğer ortalamaların kullanılmadığı durumlarda kareli ortalama
kullanılabilir. Bir seride sıfır ve/veya farklı işaretli değerler varsa
geometrik ve harmonik ortalamalar hesaplanamaz, hesaplansa da
mantıklı sonuçlar vermez. Eğer aritmetik ortalama da makul bir
sonuç vermiyorsa kareli ortalama kullanılabilir.
• Kareli ortalama özel olarak sapmalar serisinin ortalamasında
kullanılır. Sapmalar serisi verilerin aritmetik ortalamadan
sapmalarını veren seridir. Yani ( X i  X )
serisidir. Zira
sapmalar serisinin toplamı sıfır olduğundan {  ( X  X ) = 0 }, bu
serinin ortalaması kareli ortalama ile hesaplanabilir. Bu şekilde
hesaplanan ortalamaya standart sapma adı verilir.
• SPSS’te kareli ortalama işlemi yapılamamaktadır. Bu sebeple kareli
ortalamayı Excel kullanarak hesaplayacağız.
Analitik ortalamalar arasındaki ilişkiler
Normal bir seride ortalamalar arasında aşağıdaki gibi bir büyüklük
ilişkisi vardır.
K >X > G > H
i
Analitik Ortalamaların Excel Kullanılarak Hesaplanması
• Excel sayfasına veri girişi SPSS’te olduğu gibi girilir. Hücre
tanımlamak suretiyle ilgili işlemler yapılarak ortalamalar
hesaplanır. Aşağıda basit bir serinin ortalamaları Excel
ortamında gerçekleştirilmiştir.
Aritmetik Ortalamanın Excel Kullanılarak Hesaplanması
• Önceki slaytta ortalama formülleri kullanılarak ortalamalar
hesaplanmıştı. Ancak Excelde doğrudan ortalamaları
hesaplayan fonksiyonlar vardır. Bunları kullanarak ta
ortalamalar hesaplanabilir.
16
Harmonik Ortalamanın Excel Kullanılarak Hesaplanması
• Harmonik ortalamanın hesaplanması
14,55696203
Kareli Ortalamanın Excel Kullanılarak Hesaplanması
• Excel fonksiyonu kullanılarak Geometrik ortalamanın
hesaplanması. Excelde kareli ortalama için fonksiyon
yoktur. Kareli ortalama formül kullanılarak hesaplanır.
15,26181087
Analitik Ortalamaların Excel Kullanılarak Hesaplanması
• Excel sayfasına veri girişi SPSS’te olduğu gibi girilir. Hücre
tanımlamak suretiyle ilgili işlemler yapılarak ta ortalamalar
hesaplanır. Aşağıda basit bir serinin ortalamaları Excel
ortamında gerçekleştirilmiştir.
• Örnek: Bir işletmede gerçekleştirilen günlük üretim miktarının dağılımı
aşağıda verilmiştir. Bu verilerden hareketle;
• Aritmetik ortalamayı,
• Geometrik ortalamayı,
• Harmonik ortalamayı,
• Kareli ortalamayı bulunuz.
Üretim
(Kg)
fi
mi
fi.mi
fi/mi
mi2
fimi2
logmi
filogmi
0 – 60
10
30
300
0,3333
900
9000
1,47712
14,771
60 – 100
20
80
1600
0,25
6400
128000
1,90309
38,062
100 – 120
40
110
4400
0,3636
12100
484000
2,04139
81,656
120 – 140
50
130
6500
0,38462
16900
845000
2,11394
105,7
140 – 180
45
160
7200
0,2813
25600
1152000
2,20412
99,185
180 – 250
35
215
7525
0,1628
46225
1617875
2,33244
81,635
Toplam
200
27525
1,7756
4235875
12,0721
421,01
•
•
•
•
Aritmetik ortalama:
137,63
logGeometrik ortalama: 2,105
Harmonik ortalama: 112,64
Geometrik ortalama:
127,36
Kareli ortalama:
145,53
K = 145,53>X = 137,63 > G = 127,36> H = 112,64 olduğu görülür.
Analitik olmayan ortalamalar
Bu gruptaki ortalamalar serinin bütün değerlerini dikkate
almayıp, sadece belli birkaç değerini, özellikle ortadaki değerleri
esas alarak hesaplanan ortalamalardır. Serinin bütün değerlerini
dikkate almadan hesaplandıkları için analitik olmayan ortalamalar
olarak adlandırılmaktadırlar.
1. Mod
Bir seride en çok tekrarlanan değere mod adı verilir. İstatistikte
nispeten az kullanılan bu ölçü özellikle verilerin simetrik bir dağılış
göstermediği durumlarda iyi bir ölçü olarak düşünülebilir. Basit ve
tasnif edilmiş seride modun bulunması oldukça kolaydır. Seride en
fazla rastlanan ya da frekansı en yüksek olan değer mod olarak
ifade edilir. Eğer seride en çok tekrarlanan birden fazla eleman
varsa bu tür seriler çok modlu seriler olarak isimlendirilir. Böyle
serilerde modun tek bir değerle ifade edilmesi istenirse seri
gruplanmış hale dönüştürülerek modu hesaplanabilir. Gruplama
sonrasında da en yüksek frekansa sahip tek bir sınıf bulunamazsa
sınıflar birleştirilerek mod hesaplanabilir.
Örnek:Adapazarı’nda nisan ayında yağışlı gün sayısı için
aşağıdaki iki veri elde edilmiştir. Nisan ayı yağışlı gün
sayısının modunu bulunuz.
Yağışlı gün sayısı
3
4
5
5
5
6
6
7
Mod = 5gün
Yağışlı gün sayısı
Ay sayısı
3
4
5
6
7
2
4
7
9
4
Mod= 6 gün
Gruplanmış seride modun hesaplanması
Gruplanmış seride modu belirleyebilmek için önce modun içinde
bulunduğu sınıf belirlenir. Mod sınıfı frekansı en fazla olan sınıftır.
Gruplanmış seride modun hesaplanabilmesi için serinin sınıf
aralığının eşit olması gerekir. Çünkü sınıf içindeki frekansların
dağılımı sınıf aralıklarının büyüklüğüne göre değişir. Eğer sınıf
aralıkları eşit değilse eşit hale getirmek gerekir. Eşit hale
getirilemiyorsa modun bu şekilde hesaplanması uygun olmaz. Bu
sınıf içindeki modun değeri aşağıdaki formülle bulunur.
1
Mod  l1 
s
1   2
Yukarıdaki formülde;
l1: mod sınıfının alt sınırı
1: mod sınıfı frekansından bir önceki sınıf frekansının farkı,
2: mod sınıfı frekansından bir sonraki sınıf frekansının farkı,
s: seride sabit olan sınıf aralığı
• Örnek Bir ilköğretim okulunda öğrencilerin günlük olarak aldıkları
harçlıkların dağılımı aşağıda verilmiştir. Öğrencilerin aldıkları
günlük harçlık miktarının ortalamasını mod ile belirleyiniz.
Harçlık (YTL/gün) Öğrenci sayısı
0 –
0,5
1–
1,5
2 –
0,5
–1
1,5
–2
2,5
30
50
100
70
20
l1 = 1
1 = 100 – 50 = 50
Mod sınıfı
2 = 100 – 70 = 30
s = 0,5
1
50
Mod  l1 
 s  Mod  1 
 0,5  Mod  1,3125
1   2
50  30
Mod  1,312500 YTL / gün
• Örnek: Aşağıda bir parçanın üretim süreleri verilmiştir. Bu parçanın üretim
sürelerinin
• a) Aritmetik (13,52)
b) Geometrik (12,77)
• c) Harmonik (12,03)
d) Kareli ortalamalarını (14,25)
• e) modunu bulunuz. (11,67)
Üretim
süresi
5-9
9-13
Parça
sayısı (fi)
4
10
mi
7
11
13-17
17-21
21-25
7
4
2
15
19
23
Toplam
27
fimi
28
110
fi
mi
m
2
i
f i  mi2
0,571
0,909
49
121
196
1210
105
76
46
0,467
0,211
0,087
225
361
529
1575
1444
1058
365
2,245
5483
Modun Grafikle Gösterilmesi
• modun grafikle
gösterilebilmesi için
serinin histogramı çizilir.
Histogramda en yüksek
sütün mod sınıfına karşılık
gelir. Burada modun yerini
tayin etmek için en yüksek
sütunun üst köşegenleri
ile komşu sütunların bitişik
üst köşeleri çapraz olarak
birleştirilir. İki doğrunun
kesim noktasından yatay
eksene çizilen doğrunun
ekseni kestiği nokta mod
olarak tespit edilir.
Modun özellikleri
• Ortalamalar arasında en temsili olanıdır.
• Pratik hayatta çok kullanılan ortalamalardandır
• Özellikle kalitatif (niteliksel) serilerin ortalaması mod ile ifade edilir.
Göz rengi, medeni hal, marka, cinsiyet v.s gibi değişkenler kalitatif
değişkenler olup sayısal olarak ifade edilemezler
• Mod serideki aşırı değerlere karşı hassas değildir. Çünkü normal
serilerde mod genellikle serinin orta bölgesinde yer alır, uç
değerlerden etkilenmez.
• Yukarıdaki avantajlarının yanında analitik olmaması sebebi ile
matematik işlemlere elverişli olmaması dezavantajıdır.
• J, ters J ve U tipi serilerde mod temsili alma özelliğini kaybeder.
Böyle serilerde mod ya en küçük veya en büyük değere karşılık
gelir.
SPSS’te Modun Belirlenmesi
• Araçların modelininin dağılımının modunu belirlemek
istiyoruz. Bunun için Analyze menüsünden Descriptive ve
Frequencies tıklanır.
SPSS’te Modun Belirlenmesi
• Gelen ekranda variable(s) kısmına Modu hesaplanacak
Model değişkeni girilir. Statistics tıklanır gelen ekranda
Mode işaretlenir, continue ve OK tıklanarak sonuçlar çıktı
ekranında görüntülenir.
Çıktı aşağıdaki
gibi görüntülenir.
Statistics
Modeli
N Valid
Missing
Mode
393
0
73
SPSS’te Modun Belirlenmesi
• Sonucu frekans tablosu ile birlikte almak istersek frequencies
ekranının altındaki Display frequency tables işaretlenerek OK
tıklanır.
Frequ
Valid
Cumulative
ency Percent Percent
Percent
Valid 70
28
7,1
7,1
7,1
71
27
6,9
6,9
14,0
72
28
7,1
7,1
21,1
40
10,2
10,2
31,3
Mod 73
74
26
6,6
6,6
37,9
75
30
7,6
7,6
45,5
76
34
8,7
8,7
54,2
77
28
7,1
7,1
61,3
78
36
9,2
9,2
70,5
79
29
7,4
7,4
77,9
80
27
6,9
6,9
84,7
81
30
7,6
7,6
92,4
82
30
7,6
7,6
100,0
Total
393
100,0
100,0
Statistics
Modeli
N
Mode
Valid
Missing
393
0
73
2. Medyan (Ortanca)
• Serideki değerler küçükten büyüğe sıralandığında tam ortaya düşen
ve seriyi iki eşit parçaya bölen değere medyan adı verilir.
• Basit ve tasnif edilmiş seride medyanın bulunuşu:
• Bunun için serideki değerler küçükten büyüğe sıralanır. Daha sonra
medyana karşılık gelen değerin sıra değeri N  1 işlemi ile belirlenir.
2
Eğer bu işlemin sonucu tam sayı ise bu sıradaki eleman medyan
olarak belirlenmiş olur. Eğer bu işlemin sonucu kesirli çıkarsa medyan
iki değerin tam ortasına düşeceğinden bu iki değerin ortalaması
alınarak medyan bulunur.
• Örnek: Xi:15,8,12,23,45,32,5,18,16,28,39,51
Yukarıdaki serinin medyanını bulunuz.
Önce serideki değerler büyüklük sırasına göre dizilir.
Xi : 5,8,12,15,16,18,23,28,32,39,45,51 gözlem sayısı N=12
N  1 12  1

 6,5 sıradaki değer medyandır. Bu değer 18;23 arasına düşer.
2
2
Medyan = 20,5 olur.
18  23
Medyan 
2
• Örnek: Aşağıda bir atölyede
çalışan işçilerin belli bir
günde ürettikleri kusurlu
parçalarının dağılımı
verilmiştir. Bu verilerden
hareketle işçi başına
ortalama kusurlu parça
sayısını medyanla
belirleyiniz.
• Çözüm:
• Medyanın serideki sırası
N  1 36  1

 18,5
2
2
• Medyan = 18 parça
Kusurlu
parça
sayısı
İşçi sayısı
10
2
10 ve daha az
2
12
3
12 ve daha az
5
15
4
15 ve daha az
9
16
6
16 ve daha az
15
18
10
18 ve daha az
25
20
5
21
4
25
2
Toplam (N)
36
İşçi sayısı
Gruplanmış seride medyanın hesaplanması
• Gruplanmış seriler sürekli karakterde seriler olduğu için medyanın
sıra değeri N/2 şeklinde bulunur. Bu değer toplam frekansın
yarısına eşit olup serinin orta noktasını gösterir. Bu noktayı tespit
etmek gruplanmış serilerde basit bir sayma işlemi ile mümkün
olmaz. Bu işlemle medyanın içinde bulunduğu sınıf tespit edilir.
Belirlenmiş olan medyan sınıfından hareketle aşağıdaki formül
yardımı ile medyan değeri hesaplanır.
N m 1
  Ni
2
i 1
Medyan  l1 
 sm
Nm
• l1 : Medyan sınıfının alt sınırı
Nm : Medyan sınıfının frekansı
• Sm : Medyan sınıfının sınıf aralığı
N/2 : Medyanın sıra değeri
medyan1
•
N
i 1
i
: Medyandan sınıfından önceki frekanslar toplamı
• Örnek: Bir işletmede işçilere ödenen saat ücretlerinin dağılımı aşağıda
verilmiştir. Bu verilere göre medyan saat ücretini hesaplayınız.
Saat ücreti (Bin TL)
İşçi sayısı
İşçi sayısı
500 – 600
10
600 den az
10
l1=700
600 – 700
50
700 den az
60
N/2=150/2=75
700 – 800Medyan sınıfı
40
800 den az
100
800 – 1000
30
Nm=40
1000 – 1500
20
Sm= 800-700 = 100
Toplam
150
Ni= 60
N 150

 75.
2
2
sıradaki değer medyandır. Bu değer 700-800 sınıfına
düşmektedir. Bu sınıf içindeki medyan değeri şöyle hesaplanır.
N m1
  Ni
75  60
2 i 1
Medyan  l1 
 sm  Medyan  700 
100  Medyan  737,5 YTL / saat
Nm
40
SPSS’te Medyanın Bulunuşu
• SPSS’te Medyanı hesaplayabilmek için Reports ya da
Descriptive statistics menülerini kullanabiliriz.
• Analyze menüsünden Reports ve case summaries tıklanır.
Gelen ekranda medyanı hesaplanacak değişken (Aracın ağırlığı)
variables kısmına taşınır. Statistics tıklanır, gelen ekranda
Median seçilir continue ve OK tıklanarak sonuçlar çıktı
ekranında görüntülenir.
Case Summaries
Median
Aracın ağırlığı
2800,00
SPSS’te Medyanın Bulunuşu
• Diğer bir yoldan Medyanı belirleyebilmek için Analyze
menüsünden Descriptive ve frequencies tıklanır. Gelen
ekranda Variable(s) kısmına medyanı hesaplanacak değişken
ya da değişkenler (Aracın ağırlığı) taşınır. Statistics tıklanır
gelen ekranda Median işaretlenir continue ve OK tıklanarak
sonuçlar çıktı ekranından alınır.
Çıktı ekranı
Statistics
Aracın ağırlığı
N
Valid
393
Missing
0
Median
2800,0
Medyanın grafikle belirlenmesi
• Medyanın grafik üzerinde gösterilebilmesi için kümülatif ve ters kümalatif
frekans serilerin oluşturulması gerekir. Bu serilerin grafiği birlikte
çizildiğinde iki eğrinin birbirini kestiği noktadan yatay eksene çizilen
doğrunun ekseni kestiği nokta medyan olarak tespit edilir. Esasen bu işlemi
sadece eğrilerden birini çizmekle de yapabiliriz. Eğrilerden biri çizildiğinde Y
ekseninde N/2 değerine karşılık gelen noktadan X eksenine paralel
çizildiğinde, bu doğrunun kümülatif eğriye temas ettiği noktadan X
eksenine çizilen doğrunun ekseni kestiği noktada medyanı gösterecektir.
• Örnek: Yukarıdaki örneğin grafikle gösterimi
Kümülatif frekans dağılımı
Ters kümülatif frekans dağılımı
Saat ücreti (Bin TL)
fi
500 den az
600 den az
700 den az
800 den az
0
10
60
100
500 den çok
600 den çok
700 den çok
800 den çok
150
140
90
50
1000 den az
130
1000 den çok
20
1500 den az
150
1500 den çok
0
fi
Medyanın grafikle gösterilmesi
•
•
•
•
•
Medyanın özellikleri
1- Pratik bir ortalamadır. Çünkü sadece basit bir sıralama işlemi
gerektirir.
2- Özellikle açık sınıflı seriler için medyan daha bir önem kazanır.
Bu tür serilerde diğer ortalamalar ya hesaplanamaz, ya da açık
sınıflar için sınıf sınırları farazi olarak seçilerek hesaplanabilir. Mod
ise sınıf aralıklarının eşit olmasını gerektirdiğinden hesaplanamaz.
Medyan ise böyle serilerin ortalamasında problemsiz olarak
hesaplanabilir.
3- Serideki aşırı değerlere karşı hassas değildir. Çünkü medyan
serinin ortasına rastladığından, uçlarda oluşan aşırı değerler
medyanı etkilemez.
4- Serideki değerlerin medyandan mutlak farkları toplamı
minimum olur. Bu sebeple ortalama sapma medyandan sapmalar
şeklinde de hesaplanmaktadır.
Xi-medyan  minimum
5- Medyanın zayıf tarafı serideki bütün değerleri dikkate almaması
sebebi ile matematik işlemlere uygun olmamasıdır.
Mod, Medyan ve Aritmetik Ortalama Arasındaki
İlişkiler
• 1- Simetrik seride her üç ortalama
birbirine eşit olur.
• X = medyan = mod
• 2- Sağa çarpık serilerde
• 3- Sola çarpık seride
• 4- Asimetrisi hafif serilerde
aşağıdaki yaklaşık eşitlik vardır.
(X  Mod)  3(X  Medyan)
Sapma (Dağılma) ölçüleri
• Mutlak Sapma Ölçüleri
– Değişim aralığı
– Kartil ve Desil aralığı
– Ortalama mutlak sapma
– Standart sapma ve Varyans
• Nispi sapma ölçüleri
– Değişim Katsayısı
II. Sapma Ölçüleri
• Bir veri setini meydana getiren elemanlar ortalama değer
etrafında belirli bir dağılış gösterirler. Gözlem değerleri arasındaki
farklılıktan ileri gelen bu durum istatistik olarak serinin önemli
karakteristiklerinden biridir.
• Bilindiği gibi ortalamalar serinin merkezi noktasını belirlemeye
yarayan ölçülerdir. Dağılma ölçüleri ise gözlem değerlerinin bu
merkezi noktadan uzaklaşma durumunu ortaya koyan ölçülerdir.
Aynı ortalamaya sahip seriler farklı dağılış gösterebilirler. Bu
yüzden bir seriyi sadece ortalama değere göre tanımlamak yanlış
olur. Bunun yanı sıra dağılışının da bilinmesi gerekir.
• Bir seride ortalamanın temsil kabiliyeti ile dağılma ölçüleri
arasında ters bir ilişki vardır. Dağılışı az olan serilerin ortalamaları
daha temsili oldukları halde, dağılışı fazla olanların ortalamaları
seriyi daha az temsil eder. Bu sayede veri setindeki dağılışın
tespiti ortalamanın temsil kabiliyeti hakkında da bilgi verecektir.
II.1. Mutlak Dağılma Ölçüleri
• Mutlak dağılma ölçüleri ilgili değişkenin kendi ölçüldüğü birim
cinsinden (kg, cm, TL vs) sonuç verir. Bu sebeple mutlak dağılma
ölçüleri olarak adlandırılırlar.
•
• 1.1. Değişim Aralığı
• Gözlem değerlerinin en büyük ve en küçük değeri arasındaki fark
olup, verilerin ne kadarlık bir aralıkta değiştiğini gösterir.
•
R = Xmax – Xmin
• Xi : 12,15,20,30,50,52,58,70,90
• olan bir serinin değişim aralığı R=90-12 =78 olur . Yani gözlem
değerleri 78 birimlik bir aralıkta değişme göstermektedir.
• Bu dağılım ölçüsü oldukça basit ve anlaşılır olmasına karşılık sadece iki
uç değere bağlı olması sebebiyle serideki aşırı değerlerin etkisi altında
kalması zayıf yönünü oluşturur. Sadece iki uç değeri dikkate alması
diğer gözlem değerlerinin dağılımının hiç dikkate alınmamasına sebep
olmaktadır.
1.2) Kartil ve Desil Aralığı
•
•
•
•
Bilindiği gibi değişim aralığı serideki sadece iki uç değeri
dikkate almakta, dolayısıyla aşırı değerlerin etkisi altında
kalmaktadır. Bu durumu ortadan kaldırmak için kartil ve
desillerden faydalanılmaktadır. Kartil ve desil aralıkları
kullanılarak gözlem değerleri için daha tutarlı değişme
aralığı belirlenmiş olacaktır.
Kartil aralığı 3. kartil ile 1.kartil arasındaki fark olup
serinin orta bölgesindeki %50’lik gözlem kümesinin
değişim aralığını verir.
Q = Q3 – Q1 şeklinde belirlenir.
Desil aralığı ise 9. desil ile 1.desil arasındaki fark olup, her
iki uçtaki %10 gözlem değeri haricinde kalan %80 lik
gözlem değerinin değişim aralığını verir.
D = D9 – D1 şeklinde belirlenir.
• Örnek: Bir işletmede belli bir parçayı üreten işçinin bu parçayı
•
•
•
•
üretim süresi gözlemlenmiş ve aşağıdaki veriler elde edilmiştir. Bu
verilere göre parça üretim süresinin;
a) Değişim aralığını
Üretim Süresi Parça Sayısı fi
b) Kartil aralığını
30-35
10
10
35-37
30
40
c) Desil aralığını bulunuz.
37-40
40
80
Çözüm: a) R=Xmax – Xmin
40-42
35
115
R = 60-30 = 30 dakika
42-50
20
135
b) Q = Q3 – Q1 idi
N .h 140.3
50-60
5
140
Q3 için

 105. sıradaki
r
4
değer Q3 dür. . Bu değer 40-42 sınıfındadır.
Q3  40 
105  80
* 2  41.43 dakika / parça
35
Q1  35 
35  10
* 2  36.67 dakika / parça bulunur.
30
Benzer şekilde
Şu halde kartil aralığı Q = 41,43 - 36.67 = 4,76 dakika olur.
• c) D=D9-D1 idi. D1 için
Bu sınıf içindeki değeri;
N .h 140.1

 14 olup D1 35-37 sınıfındadır.
r
10
14  10
D1  35 
* 2  35.27 dakika / parça
30
N .h 140.9

 126
r
10
• D9 için
.sıradaki değer olup 42-50 sınıfındadır. Bu
sınıf içindeki D9 değeri şöyle bulunur.
126  115
D9  42 
* 8  46.4 dakika / parça
20
• Desil aralığı ise D = 46,4-35,27 = 11,13 dakika olur.
Burada aşırılıklar yok edildiğinden gözlem değerlerinin ortalamaya daha
yakın dağıldıkları anlaşılmaktadır. Bununla birlikte yukarıda anlatılan
sapma ölçüleri sadece iki değere bağlı olduklarından serideki bütün
değerlerin sapmasını göstermekten uzaktır. Veri setindeki bütün
değerlerin merkez noktadan sapmalarını gösterecek başka ölçülere
ihtiyaç vardır. Bu amaçla ortalama mutlak sapma ve standart sapma
ölçülerinden faydalanılır.
1.3. Ortalama (mutlak) Sapma

( ( X i  X )  0)
• Bilindiği gibi sapmalar serisinin
(aritmetik
ortalamadan sapmalar) toplamı sıfıra eşittir. Bu durumda sapmalar
serisinin ortalaması da sıfır olacağından bir sapma ölçüsü elde
etmek mümkün değildir. Serinin toplamını sıfır olmaktan
kurtarabilmek için mutlak sapmalar dikkate alınabilir. Çünkü
mutlak
sapmalar
serisinin
toplamı
sıfırdan
büyük
(  X i  X  0)
olacaktır
Böylece mutlak sapmalar serisinin
ortalaması alınarak yeni bir sapma ölçüsü elde edilebilir. Bu sapma
ölçüsü diğer iki sapma ölçülerinin aksine serinin bütün değerlerini
dikkate almaktadır. Bu sebeple daha kullanışlı ve daha temsili bir
sapma ölçüsü elde edilmiş olmaktadır.
Ortalama (mutlak) sapma formülleri
• Ortalama sapmayı şöyle formüle edebiliriz.
• Basit Seride
O.S 
X

i
X
N

• Tasnif Edilmiş Seride
 fi X  X
O.S 
 fi
i

 fi m  X
O.S 
 fi
i
• Gruplanmış Seride
Örnek: Bir atölyede üretim hattında günlük olarak üretilen mamul
sayılarının dağılımı aşağıda verilmiştir. Günlük üretimin ortalama
sapmasını bulunuz.
Mamul
Sayısı
(Xi)
Gün
Sayısı
(fi)
fi.Xi
33
2
66
-3,5
7
34
5
170
-2,5
12,5
35
9
315
-1,5
13,5
36
30
1080
-0,5
15
37
20
740
0,5
10
38
16
608
1,5
24
39
5
195
2,5
12,5
40
3
120
3,5
10,5
Toplam
90
3286


X i  X fi X i  X
105
• Aritmetik ortalama
fiXi 3286

X 

 36,5
 fi 90

• Ortalama sapma

 fi Xi  X
O.S 
 fi

105
90
OS = 1,167 adet/gün
Örnek:
Bir ağrı kesicinin insanlar üzerinden ne kadar süre ile etkili olduğunu belirlemek
için yapılan araştırmada, ağrı kesicinin etkinlik süresinin aşağıdaki gibi dağıldığı
gözlenmiştir.
Bu verilere göre etkinlik sürenin ortalama sapmasını bulunuz.
Etkin.Sür Hast.Say mi fi.mi

(saat)
mi  X
• Aritmetik ortalama

fi mi  X

X 
986
 9,3 saat
106
2-5
10
3,5
35
-5,8
58
5-8
30
6,5
195
-2,8
84
8 - 12
50
10
500
0,7
35
12 - 20
16
16
256
6,7
107,2
 fi mi  X
O.S 
 fi
Toplam
106
284,2
• OS = 2,68 saat
986
• Ortalama sapma


284,2
106
• Ortalama sapma serinin sapmasını iyi bir şekilde ölçmektedir. Ancak
mutlak işlemler gerektirmesi bu sapma ölçüsünün aritmetik işlemlere
elverişsiz olmasına sebep olmaktadır. Bu sebeple istatistik analizde
kullanılması mümkün olamamaktadır.
1.4-Standart Sapma
• Serideki gözlem değerlerinin aritmetik ortalamadan
sapmaları (sapmalar serisi) toplamı sıfır idi. Bu durumu daha
önce mutlak değer almak suretiyle önlemiş olduk. Ancak bu
yol aritmetik işlemler için elverişli olmamaktadır. Mutlak
işlemler yerine kare alma yolu ile sapmalar serisi toplamı sıfır
olmaktan kurtarılabilir. Böylece yeni bir sapma ölçüsü elde
edilmektedir.
• Standart sapma, sapmalar serisinin (aritmetik ortalamadan
sapmalar) kareli ortalamasıdır. Yani gözlem değerlerinin
aritmetik ortalamadan sapmalarının kareli ortalamasına
standart sapma denir. Standart sapmanın karesine varyans
adı verilir. Kütle ve örnek standart sapması için aşağıdaki
formüller kullanılır.
Standart sapma formülleri
• Aşağıda farklı seri ve veri türü için standart sapmanın formülleri
verilmiştir.

Basit seri
Tasnif
edilmiş
seri
Gruplanmış
seri
Kütle

 ( Xi  X )

 fi( Xi  X ) Örnek
 fi

Kütle

Örnek S 
 ( Xi  X )
2
 fi(mi  X ) Örnek
 fi
S
2
S
2
n 1
N

Kütle

2


fi( Xi  X ) 2
( fi)  1


fi(mi  X ) 2
( fi)  1
• Yukarıdaki formüllerde örnek verileri için standart sapma
formüllerinde paydada (n-1) serbestlik derecesi kullanılmıştır. Örnek
hacmi büyük olduğunda bu düzeltmeye ihtiyaç kalmaz.
• Örnek: Bir beyaz eşya servis Servis isteği
merkezine gelen günlük
3
servis isteklerinin dağılımı
ile ilgili aşağıdaki veriler
4
elde edilmiştir. Bu verilere
5
göre servis merkezine gelen
7
günlük servis isteklerinin
aritmetik ortalamasını ve
10
standart sapmasını bulunuz.
Xi  X
-4
-3
-2
0
3
6
13
∑Xi=42
• Aritmetik ortalama:
X

X 
n
( X i  X )2
16
9
4
0
9
36
∑74
42

 X 7
6

• Standart sapma
• s = 3,85
S
2
(
Xi

X
)

N 1

74
 14,8
6 1
• Örnek:
Doğru, yanlış şeklinde cevap şıkları olan 10 soruya öğrencilerin verdikleri
doğru cevap sayılarının dağılımı aşağıda verilmiştir. Bu serinin standart
sapmasını ve varyansını bulunuz.
Doğru Cevap.
Sayısı
Öğr. Sayısı
(fi)
fi.Xi
2
2
4
-4,69
43,99
3
4
12
-3,69
54,46
4
5
20
-2,69
36,18
5
10
50
-1,69
28,56
6
20
120
-0,69
9,52
7
30
210
0,31
2,88
8
20
160
1,31
34,32
9
10
90
2,31
53,36
10
3
30
3,31
32,87
Toplam
104
696

Xi  X

fi( Xi  X ) 2
296,15
• Çözüm: Yukarıdaki verileri kütle verisi olarak kabul ederek çözelim.
Çözüm için önce aritmetik ortalamanın hesaplanması gerekir.

696
X 
 6,69
104
• Aritmetik ortalamadan farklar serisi oluşturularak standart sapma
elde edilir.


2
fi
(
Xi

X
)

 fi
296,15

   1,687 varyans :  2  2,847
104
• Yukarıdaki verileri örnek kabul edersek standart sapma şöyle olur.

S
2
fi
(
Xi

X
)

( fi)  1
296,15

 S  1,6956 varyans s 2  2,875
103
• Örnek hacmi büyük olduğundan kütle ve örnek varyansları arasında
önemli bir fark çıkmamıştır.
• Örnek: Bir liseden mezun olan ve ÖSS sınavına giren öğrencilerin
puanlarının dağılımı aşağıda verilmiştir. Buna göre öğrenci
puanlarının standart sapmasını bulunuz.


ÖSS Puanları
Öğr.Sayısı
mi
fi.mi
mi  X
fi(mi  X ) 2
90-110
10
100
1000
-37,9
14364,1
110-130
30
120
3600
-17,9
9612,3
130-150
50
140
7000
2,1
220,5
150-170
25
160
4000
22,1
12210,25
170-210
5
190
950
52,1
13572,05
Toplam
120
16550
49979,2
16550
Ortalama : X 
 137,9 puan
120

Standart sapma  
2
fi
(
mi

X
)

 fi

49979,2
   20,4 puan
120
Standart sapmanın kısa yoldan hesaplanması
•
•

2 

2
2
(
Xi

X
)

ifadesi açılarak yazılırsa;
N
( Xi


2
 2

 2 X . Xi  X )
N
• Bu ifade ayırarak yazılırsa
2
•  Xi
 Xi
2
N
•
K
şeklinde yazılabilir.
,
N
X
2
Xi


2

Xi N X

 2. X .

N
olduğuna göre;

N
N
2
olur .
 2  K 2  2 X . X  X 2  K 2  2 X 2  X 2 olur. Buna göre;
• Standart sapma kısa yoldan
  K 2  X 2 şeklinde yazılır.
• Şu halde varyans kareli ortalamanın karesinden aritmetik ortalamanın
karesinin farkına eşit olup, bunun kare kökü standart sapmaya eşit
olur.
Örnek: Yukarıdaki ÖSS örneği için standart sapmayı kısa yoldan
hesaplayınız.
• Aritmetik ortalama
22000
X
 146,67 puan
150
• Kareli ortalama
3328000
K2 
 22186,67
150
• Standart sapma
  K2  X 2
  22186,67  146,67 2
ÖSS
Puanları
Öğr.Sa
yısı
mi
fi.mi
fi.mi2
90-110
10
100
1000
100000
110-130
30
120
3600
432000
130-150
50
140
7000
980000
150-170
30
160
4800
768000
170-190
20
180
3600
648000
190-210
10
200
2000
400000
22000
3328000
Toplam
  674,58    25,97 puan
150
Standart sapmanın kısa yoldan hesabı
• Kütle verisi için standart sapma (kısa yol formülünün farklı
yazılışı)
2
2
X

N
X
 i
• Basit seride

N
• Tasnif edilmiş seride
• Gruplanmış seride



f i X i2  NX 2
f
i
 f m  NX
f
i
2
i
2
i
• Örnek verisi için standart sapma hesaplamak için payda N-1
serbestlik derecesi ile bölünür.
S
X
2
i
 NX 2
N 1
Örnek:
Bir çekme halatının kopma kuvveti için yapılan deneyde
aşağıdaki sonuçlar elde edilmiştir. Kopma kuvvetinin standart
sapmasını yukarıdaki formülden hesaplayınız.
Kopma Halat
kuvveti sayısı
5–7
3
7–9
7
9 – 11
10
11 - 13
5
Toplam
25

mi
f i mi
mi2
f i mi 2
6
8
18
56
36
64
108
448
10
12
100
60
234
100
144
1000
720
2276
2
2
f
m

N
X
 i i
N
fm

X
f
i
i
i
234
X
25
X  9,36
2276  25  9,362
85,76


   1,85
25
25
Standart Sapmanın Özellikleri:
• Matematik işlemler için uygun bir dağılma ölçüsüdür. Bu
sebeple en yaygın kullanılan ölçüdür.
• Standart sapmada aritmetik ortalama gibi istatistik analiz için
temel ölçülerden birisidir.
• Genel olarak standart sapma ortalama sapmadan daha
büyüktür. (OS < )
• N1 ve N2 gözlemden oluşan iki serinin ortalamaları aynı ve
sırayla varyansları 12 ve 22 olsun. Bu iki serinin birleştirilmiş
ortak varyansı .
N1 . 1  N 2 . 2
 
şeklinde olur.
N1  N 2
2
•
2
2
II. 2. Nispi sapma ölçüleri
• Mutlak dağılma ölçüleri gözlem değerlerinin ifade edildiği birimler
cinsinden sonuç vermekte idi. Mutlak dağılma ölçülerinin bu özelliği
farklı birimlerle ifade edilen serilerin değişkenliklerini karşılaştırma
imkanı vermemektedir. Diğer taraftan aynı birimle ifade edilen
serilerde bile gözlem değerleri arttıkça mutlak dağılma ölçüleri de
buna paralel olarak artmaktadır. Bu durumda aynı cins serilerin
dağılımlarını da mutlak sapma ölçüleri ile karşılaştırmak çoğu zaman
mümkün olamamaktadır.
• Nispi dağılma ölçüleri serideki gözlem değerlerinin ölçüldüğü birim
farklılıklarını ortadan kaldırmakta ve değişkenliği yüzde(%) cinsinden
ifade etmektedir. Böylece nisbi dağılma ölçüleri farklı birimlerle ifade
edilen ve farklı büyüklüklerdeki serileri aynı cins ve büyüklükte ifade
etme imkanı tanımaktadır. Nispi sapma ölçüleri bu özellikleri
dolayısıyla farklı birimlerle ölçülmüş, farklı büyüklük ve özelliklerdeki
verilerin sapmalarının karşılaştırılmasına imkan sağlamaktadır
2.1. Değişim Katsayısı
• Standart sapmanın ortalamanın bir yüzdesi olarak ifade
edilmesine değişim katsayısı adı verilir. Bu tanıma göre
standart sapmanın büyüklüğü aritmetik ortalamaya göre ifade
edilmektedir.

D.K  .100
X
• Bu ölçü farklı cins ve büyüklüklerdeki serileri aynı cins ve
büyüklükte (yüzde cinsinden) ifade etme imkanı
sağlamaktadır. Ancak bu ölçünün bir dezavantajı bir üst
sınırının olmamasıdır. Yani değişim katsayısı %100 ü geçen
değerler de alabilmesi bu ölçünün zayıf tarafıdır. Eğer bu
ölçünün üst sınırı %100 olsaydı verinin değişkenliğini daha iyi
yorumlamak mümkün olurdu. Özellikle ortalaması sıfıra yakın
seriler için kullanımı pek uygun değildir.
Örnek:
• Konutlarda tüketilen aylık elektrik ve su miktarları için aşağıdaki
veriler elde edilmiştir. Değişim katsayılarını bularak hangi grupta
değişikliğin daha fazla olduğunu araştırın.
Elekt. Tük.(kw/h) Konut Say.(fi)
mi
fi.mi
fi.mi2
50-100
10
75
750
56250
100-150
20
125
2500
312500
150-200
30
175
5250
918750
200-300
15
250
3750
937500
300-500
5
400
200
800000
• Elektrik Tüketimi İçin:

14250
X 
 178,125
80
K2 
3025000
 37812,5
80
 2
  K  X  37812,5  178,125 2  6083,98  78
• Değişim katsayısı: D.K   100  D.K  78
2
X
178,125
100 DK  %44,8
Su Tük.(ton/h)
Konut Say.
mi
fi.mi
fi.mi2
5-15
10
10
100
1000
15-25
30
20
600
12000
25-35
40
30
1200
36000
35-45
20
40
800
32000
45-65
10
55
550
30250
• Su Tüketimi İçin değişim katsayısı;

X
3250
111250
 29,55 K 2 
 1011,4
110
110
 2
  K  X  1011,4  29,55 2  138,16  11,75
2
D.K 


X
.100  D.K 
11,75
.100
29,55
DK  %39,76
• Bu verilere göre elektrik tüketiminin değişkenliği (DK=44,8) su
tüketiminin değişkenliğine göre (DK=39.7) daha fazladır.
Sapma ölçüleri için SPSS uygulaması
• Sapma ölçülerini SPSS ortamında hesaplayabilmek için
Analyze menüsünden, Reports ve Case summaries
seçeneği tıklanarak hesaplanabilir.
Sapma ölçüleri için SPSS uygulaması
• Gelen ekranda Variable(s) kısmına sapması hesaplanacak
değişken ya da değişkenler girilir. Statistics tıklanır ve bu
kısımdan Standard Deviation, Variance ve Range
işaretlenir Continue ve OK tıklanarak sonuçlar çıktı
ekranında görüntülenir.
Çıktılar aşağıdaki gibi
görüntülenir.
Case Summaries
Aracın ağırlığı
Std.
Variance
Deviation
844,353 712932,235
Range
3527
Standart Varyans Değişim
sapma
aralığı
Sapma ölçüleri için SPSS uygulaması
• Sapma ölçülerini SPSS te farklı şekilde de hesaplamak
mümkündür. Analyze menüsünden Descriptive ve
frequencies tıklanır. Gelen ekranda variable(s) kısmına
sapması araştırılan değişken(ler) taşınır. Statistics tıklanarak
gelen ekranda dispersion kısmından istenen sapma ölçüleri
işaretlenerek continue ve OK tıklanarak sonuçlar elde edilir.
Sapma ölçüleri için SPSS uygulaması
Çıktılar aşağıdaki gibi görüntülenir.
Statistics
Motor hacmi
boyutu
N
Valid
393
Missing
0
Std. Deviation
104,536
Variance
10927,784
Range
387
Beygir
gücü
392
1
38,230
1461,557
184
Sapma ölçüleri için SPSS uygulaması
• Bir değişkenin kategorilerine göre sapma ölçülerini
hesaplamak için Analyze menüsünden Reports ve Case
summaries tıklandıktan sonra Variables kısmına değişken ya da
değişkenler girilir, grouping varisble(s) kısmına kategori
değişkeni girilerek statistics tıklanır. Gelen ekranda standart
deviation, variance ve range girilip continue ve OK tıklanarak
sonuçlar elde edilir.
Sapma ölçüleri için SPSS uygulaması
• Aşağıdaki çıktı ekranında ülke orjinine göre otomobillerin
gittiği yolun, motor gücünün ve motor hacminin sapma
ölçüleri elde edilir.
Case Summaries
Galon başına
Mil
Ülke orjini
American
European
Japanese
Total
Std. Deviation
Variance
Range
Std. Deviation
Variance
Range
Std. Deviation
Variance
Range
Std. Deviation
Variance
Range
6,415
41,146
29
6,584
43,351
28
6,090
37,089
29
7,791
60,693
37
Beygir gücü
39,696
1575,787
178
20,321
412,926
87
17,819
317,524
80
38,230
1461,557
184
Motor hacmi
boyutu
98,512
9704,547
370
22,434
503,272
115
23,140
535,465
98
104,536
10927,784
387
Download