İstatistik ve Olasılık - Erzurum Teknik Üniversitesi

advertisement
Merkezi eğilim ve dağılma ölçüleri
İstatistik ve Olasılık
Ders 3: MERKEZİ EĞİLİM VE
DAĞILMA ÖLÇÜLERİ
Prof. Dr. İrfan KAYMAZ
Erzurum Teknik Üniversitesi
Tanım
Merkezi eğilim ve dağılma ölçüleri
Araştırma sonuçlarının açıklanmasında frekans tablosu ve poligonu istenilen
bilgiyi her zaman sağlamayabilir.
Verilerin merkezileştiği noktanın değeri nedir?
Dağılımın değişkenlik durumu ne ölçüdedir?
soruların cevaplanabilmesi için dağılımı karakterize eden bazı değerlerin
hesaplanması gerekir. Bu amaçla veri grubuna ilişkin yer ve dağılma ölçülerinden
yararlanılır.
Merkezi Eğilim Ölçüleri
Dağılım (Değişim) Ölçüleri
Aritmetik Ortalama
Değişim Genişliği
 Ağırlıklı (Tartılı) Ortalama
Varyans
Geometrik Ortalama
Standart Sapma
Harmonik Ortalama
Varyasyon Katsayısı
Medyan (Ortanca)
Mod (Tepe Değeri)
Erzurum Teknik Üniversitesi
Aritmetik Ortalama
Merkezi eğilim ve dağılma ölçüleri
Dağılımın yerinin belirlenmesinde kullanılır. Tek başına ortalama teriminden
aritmetik ortalama anlaşılır.
Basit aritmetik ortalama herhangi bir konu ile ilgili gözlemlerin toplamının
toplam gözlem sayısına bölümü ile bulunur.
X1, X2, X3,......, Xn gözlenen örnek değerlerini göstermek üzere aritmetik
ortalama:
n
Xi
X1  X 2  X 3  ........ X n 
X
 i1
n
n
Erzurum Teknik Üniversitesi
Merkezi eğilim ve dağılma ölçüleri
Aritmetik Ortalama
Aritmetik ortalamanın iki önemli özelliği vardır:
1. Verilerin, aritmetik ortalamadan sapmalarının toplamı sıfıra eşittir.
n
n
n
n
n
n X i
i1
i1
i1
i1
n
 ( X i  X)  0   X i   X  0   X i 
i1
0
2. Verilerin, aritmetik ortalamadan sapmalarının kareleri toplamı
minimumdur. Herhangi bir değeri a ile gösterirsek ifade aşağıdaki gibi
yazılabilir.
n
n
i1
i1
 ( X i  X) 2   ( X i  a )
2
Erzurum Teknik Üniversitesi
Ağırlıklı Ortalama
Merkezi eğilim ve dağılma ölçüleri
Bazı durumlarda verilerin aritmetik ortalaması sonuç hakkında pek fazla
açıklayıcı bilgi taşımaz.
Örneğin farklı krediye sahip dersler almış olan bir öğrencinin başarı ortalaması
hesaplanırken aritmetik ortalama ile anlamsız sonuçlar bulunur.
Böylesi durumlarda verilerin gözlenen frekansları ile çarpılıp toplanması ve elde
edilen değerin toplam frekansa bölünmesi ile bulunan değer kullanılır.
Bu işleme ağırlıklı ortalama denir.
Xi gözlenen i. veri, Wi i. verinin gözlenen ağırlığı (frekansı) olmak üzere ağırlıklı
ortalama:
n
X
 Wi X i
i1
n
 Wi
i1
Erzurum Teknik Üniversitesi
Ağırlıklı Ortalama
Merkezi eğilim ve dağılma ölçüleri
Örnek 1:
Bir öğrencinin almış olduğu derslere ilişkin krediler ve notlar aşağıda verilmiştir.
Ders
Kredi
Not
Matematik
6
54
Kimya
4
50
Makina Bilgisi
2
54
Teknik Resim
5
51
Ölçme Tekniği
3
67
Öğrencinin başarı notunu;
a) Aritmetik ortalama yöntemiyle hesaplayınız.
b) Ağırlıklı ortalama yöntemiyle hesaplayınız.
c) Hangi yöntemin sonucu kullanılmalıdır? Neden?
Erzurum Teknik Üniversitesi
Ağırlıklı Ortalama
Merkezi eğilim ve dağılma ölçüleri
Çözüm 1:
a) X  54  50  54  51  67  276  55.2
5
b) X 
5
6 * 54  4 * 50  2 * 54  5 * 51  3 * 67 1088

 54.4
6 4 2 5 3
20
c) Gözlenen değerlerin (öğrencinin notlarının) frekansları (kredileri)
farklı olduğundan ağırlıklı ortalama kullanılmalıdır.
Erzurum Teknik Üniversitesi
Geometrik Ortalama
Merkezi eğilim ve dağılma ölçüleri
Özellikle eşit zaman aralığı ile değişen oranların ortalamasının hesaplanmasında
(örneğin, nüfus artışı, faiz gibi olaylarda ortalama artış hızını hesaplayabilmek
için) geometrik ortalama kullanılır. Geometrik ortalama:
GO  n X1 * X 2 * X 3 *.......*Xn
Örnek 2:
Akaryakıt fiyatlarında ardışık 3 yıldaki fiyat artışı %15, %20 ve %24 olarak
gerçekleşmiştir. Ortalama artış oranını hesaplayınız.
Çözüm 2:
GO  3 15 * 20 * 24  %19.309
Erzurum Teknik Üniversitesi
Harmonik Ortalama
Merkezi eğilim ve dağılma ölçüleri
Verilerin terslerinin ortalamasının tersi harmonik ortalamayı verir.
HO 
n
1
1
1

 ........
X1 X 2
Xn

1
1 n 1

n i1 X i
Oran şeklinde türetilmiş verilerde, oran elde edilirken, d/t, eğer pay (d) sabit
payda (t) değişken ise oranların ortalaması harmonik ortalama ile hesaplanır.
Bunun tersi durumda ise aritmetik ortalama kullanılır.
Örneğin, hız=yol/zaman veya fiyat=para/mal şeklinde ifade edilen olaylarda;
zamanın değişken gidilen yolun sabit, alınan mal miktarının değişken paranın
sabit olması halinde harmonik ortalama kullanılır.
Erzurum Teknik Üniversitesi
Merkezi eğilim ve dağılma ölçüleri
Harmonik Ortalama
Örnek 3:
Bir sürücü 200 km’lik yolu 2 saatte gitmiş ve 4 saatte dönmüştür. Bu yolculukta
sürücünün ortalama hızını hesaplayınız.
Çözüm 3:
Hız=yol/zaman Gidiş hızı=200/2=100km/s Dönüş hızı=200/4=50km/s
HO 
1
1 1
1

2  100 50 

2
1
1

100 50
 66.67km / s
Üç ortalama arasında:
AO  GO  HO
ilişkisi vardır.
Bütün değerlerin aynı olması halinde ilişki eşitlik halinde gerçekleşir.
Erzurum Teknik Üniversitesi
Medyan (Ortanca)
Merkezi eğilim ve dağılma ölçüleri
Verilerin küçükten büyüğe veya büyükten küçüğe sıralanması halinde ortaya
düşen değer (veri sayısı tek ise) veya ortaya düşen iki değer çiftinin ortalaması
(veri sayısı çift ise) medyan olarak adlandırılır. n veri sayısını göstermek üzere;
Gruplandırılmış verilerde (frekans tablosunda) medyan hesabı:
L: Medyan sınıfının alt sınırı
N
N: Toplam gözlem sayısı
 Fb
Medyan  L  2
* c c: Sınıf aralığı (genişliği)
Fmed
Fmed: Medyan sınıfının frekansı
Fb: Medyan sınıfından önceki sınıfların frekans toplamı
Medyan ortalamaya nazaran uç değerlerden etkilenmez veya çok az etkilenir ve
daha az işlem yükü getirir. Sayılan bu yararlarına karşın ortalama gibi analitik bir
değere sahip değildir. Medyanın standart sapması ortalamanınkinden büyüktür
Erzurum Teknik Üniversitesi
Mod (Tepe Değeri)
Merkezi eğilim ve dağılma ölçüleri
Verilerin içinde en çok tekrarlanan (frekansı en büyük olan) değer mod olarak
adlandırılır.
Gruplandırılmış verilerde (frekans tablosunda) mod hesabı aşağıdaki formül
yardımıyla yapılmaktadır.
L: Mod sınıfının alt sınırı
d1
d1: Mod sınıfı frekansı ile bir önceki sınıf frekansı
Mod  L 
*c
arasındaki fark
d1  d 2
d2: Mod sınıfı frekansı ile bir sonraki sınıfın frekansı
arasındaki fark
c: Sınıf aralığı (genişliği)
Frekansı en yüksek olduğu sınıf mod sınıfı olarak adlandırılır.
Mod değerinin anlamlı olabilmesi için gözlem sayısının çok fazla olması gerekir.
Bazen veri gurubunun birden fazla modu olabilir. Bu durum, ilgili anakütlenin
birkaç alt gruptan meydan geldiğini gösterir.
mod veri grubundaki uç değerlerden etkilenmez.
Erzurum Teknik Üniversitesi
Merkezi eğilim ve dağılma ölçüleri
Mod (Tepe Değeri)
Örnek 4:
Aşağıdaki verilerin modunu ve medyanını belirleyiniz.
120
100
130
100
160
130
86
100
94
90
Çözüm 3:
Verileri küçükten büyüğe sıralayalım.
1.değer
2.değer
3.değer
4.değer
5.değer
6.değer
7.değer
8.değer
9.değer
10.değer
86
90
94
100
100
100
120
130
130
160
Veri grubunda en çok tekrarlanan değer 100 olduğu için Mod=100
Veri sayısı n=10  çift
Erzurum Teknik Üniversitesi
Dağılım Ölçüleri
Merkezi eğilim ve dağılma ölçüleri
Yer (merkezi eğilim) ölçüleri tek başına dağılımı karakterize etmez.
Verilerin yer ölçülerinden uzaklık durumlarını, yani değişkenliklerini belirtmek
için diğer bazı ölçülerin kullanılması gerekir.
Verilerin değişkenlik durumunu ve dağılım şeklini belirlemek için kullanılan
ölçülere dağılım ölçüleri denir.
İki veri grubu ortalamasının eşit olması dağılımlarının aynı olmasını
gerektirmez. Dağılım şeklinin ve değişkenliğinin karşılaştırılması dağılım ölçüleri
ile belirlenir.
Dağılım (Değişim) Ölçüleri
Değişim Genişliği
Varyans
Standart Sapma
Varyasyon Katsayısı
Erzurum Teknik Üniversitesi
Değişim Genişliği
Merkezi eğilim ve dağılma ölçüleri
Değişkenliğin en basit ölçüsüdür.
Erzurum Teknik Üniversitesi
Varyans
Merkezi eğilim ve dağılma ölçüleri
Verilerin ortalamasından sapmalarının büyüklüğü dağılımın değişkenliğini
gösteren iyi bir ölçüdür. Yaygın olarak kullanılan bu değişkenlik ölçüsü
varyanstır.
Varyansın büyüklüğü veri grubundaki değişkenliğin fazlalığını ve veri grubunun
dağılımının yayvanlığını gösterir.
Varyans, değişim genişliğinden daha hassas bir ölçüdür. Öte yandan, varyansın
birimi olmadığından bazı durumlarda verilerin elde edildiği birime sahip bir ölçü
kullanılması daha uygun olmaktadır. Böyle bir ölçü varyansın karekökü olan
standart sapmadır.
Erzurum Teknik Üniversitesi
Standart Sapma
Merkezi eğilim ve dağılma ölçüleri
Dağılım ölçüsünü fiziksel anlamı olan bir büyüklük şeklinde ifade etmek için
varyansın karekökü alınır ve buna standart sapma denir.
Örnek standart sapmasının ve varyansının paydasında bulunan n-1
ifadesi serbestlik derecesi olarak adlandırılır.
Erzurum Teknik Üniversitesi
Varyasyon Katsayısı
Merkezi eğilim ve dağılma ölçüleri
Verilerin değişkenliğini kendi ortalamalarına oranla ifade etmek için kullanılan bir
ölçüdür. Değişim Katsayısı olarak da adlandırılır.
Ortalamaları birbirinden farklı olan anakütlelerin değişkenliklerinin
karşılaştırılmasında değişim katsayısı ölçüsü kullanılmalıdır.
Değişim katsayısının büyüklüğü arttıkça istenilen değerden uzaklaşıldığı
söylenebilir
Erzurum Teknik Üniversitesi
Örnek
Merkezi eğilim ve dağılma ölçüleri
Örnek 5:
Bir üretim hattından kg olarak alınan ağırlık ölçümleri
35
40
45
30
40
50
35
38
42
olarak belirlendiğine göre verilerin değişim genişliğini, varyansını, standart
sapmasını ve değişim katsayısını hesaplayınız.
44
Çözüm 5: DG=50-30=20
_
X
35  40  45  30  40  50  35  38  42  44
 39.9
10
2
2
2
(
35

39
.
9
)

(
40

39
.
9
)

..............

(
42

39
.
9
)
S2 
 33.21
10  1
S  33.21  5.76
5.76
DK 
* 100  %14.44
39.9
Erzurum Teknik Üniversitesi
Çarpıklık ve Basıklık
Merkezi eğilim ve dağılma ölçüleri
Çarpıklık
Normal dağılımda simetrikliğin bozulma derecesi çarpıklık olarak ifade edilir.
Dağılım sağa doğru uzun kuyruklu ise sağa çarpık, sola doğru uzun kuyruklu ise
sola çarpık olarak adlandırılır. Çarpıklık katsayısı :
n
3
(
X


)
 i
i 1
3 
n
3
m3
 3

Hesap sonunda bulunan katsayıya göre dağılımın yorumu aşağıdaki gibi yapılır:
Erzurum Teknik Üniversitesi
Merkezi eğilim ve dağılma ölçüleri
Çarpıklık ve Basıklık
Basıklık
Normal dağılım eğrisinin sivrilik ya da basıklık derecesi
n
 ( Xi   ) 4
i 1
4 
n
4
m4
 4

Hesap sonunda bulunan katsayıya göre dağılımın yorumu aşağıdaki gibi yapılır:
Erzurum Teknik Üniversitesi
MATLAB Komutları
Merkezi eğilim ve dağılma ölçüleri
ARİTMETİK ORTALAMA
Yazım Biçimi
M=mean(A)
Açıklama
A dizi vektörü veya matris olarak tanımlanan
sayıların aritmetik ortalamayı verir
Örnek:
1 5 6 8 10 11 12 14 15 7 sayılarının ortalamasını veren program
Örnek:
Aşağıda verilen matrisin ortalaması her bir sütunun ortalamasını veren bir vektör olarak
elde edilir.
Erzurum Teknik Üniversitesi
MATLAB Komutları
Merkezi eğilim ve dağılma ölçüleri
HARMONİK VE GEOMETRİK ORTALAMA
Erzurum Teknik Üniversitesi
MATLAB Komutları
Merkezi eğilim ve dağılma ölçüleri
STANDART SAPMA
Yazım Biçimi
s=std(A)
s=std(A,flag)
Açıklama
A dizi vektörü veya matris olarak tanımlanan
sayıların standart sapmasını verir
A dizi vektörü veya matris olarak tanımlanan
sayıların standart sapmasını verir
flag=0 ise örneğin standart sapması
flag=1 ise anakütle standart sapması hesaplanır
Örnek:
1 5 6 8 10 11 12 14 15 7 sayılarının standart sapmasını veren program
Erzurum Teknik Üniversitesi
MATLAB Komutları
Merkezi eğilim ve dağılma ölçüleri
MEDYAN
Yazım Biçimi
ortanca=median(A)
Açıklama
A dizi vektörü veya matris olarak tanımlanan
sayıların medyan (ortanca) değerini verir
Örnek:
1 5 6 8 10 11 12 14 15 7 sayılarının medyan değerini veren program
Erzurum Teknik Üniversitesi
MATLAB Komutları
Merkezi eğilim ve dağılma ölçüleri
MOD
Yazım Biçimi
t=mode(A)
Açıklama
A dizi vektörü veya matris olarak tanımlanan sayıların
mode(en fazla tekrar edilen sayı) değerini verir
Örnek:
1 5 6 5 10 11 12 11 15 11 sayılarının medyan değerini veren program
Erzurum Teknik Üniversitesi
Gelecek dersin konusu
Merkezi eğilim ve dağılma ölçüleri
Olasılık…..
Erzurum Teknik Üniversitesi
Download