Biyoistatistiğin Tanımı Biyoistatistikte Kullanılan Terimler Değişken Tipleri Parametre ve İstatistik Tanımlayıcı İstatistikler Doç. Dr. Ertuğrul ÇOLAK Eskişehir Osmangazi Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı Biyoistatistiğin Tanımı İstatistik, toplumdan kurallara uygun olarak, rastgele bir mekanizma içerisinde, doğru ve yeterli sayıda veri toplama, veri işleme ve verilerden topluma ilişkin çıkarsamalar yapmaya yönelik yöntemler içeren ve geliştiren bir bilim dalıdır. Biyoistatistiğin Tanımı İstatistik bilimi iki ana bölüme ayrılır: • Matematiksel İstatistik • Uygulamalı İstatistik Biyoistatistiğin Tanımı Matematiksel istatistik, istatistik teorisini kuran, istatistiksel çıkarsamalar için yeni yöntemler geliştiren ve soyut matematik bilgisi gerektiren bir bilim dalıdır. Biyoistatistiğin Tanımı Uygulamalı istatistik, matematiksel istatistiğin geliştirdiği teknikleri çeşitli alanlara uygulayan (örneğin biyoloji, ekonomi, eğitim, sağlık eczacılık vb.), işleyişlerini kontrol eden ve uygulama alanlarına özgü yeni teknikler geliştiren bir istatistik bilim dalıdır. Biyoistatistiğin Tanımı Biyoistatistik, uygulamalı bir istatistik dalı olup, istatistiksel tekniklerin tıp ve sağlık bilimlerinde uygulamalarını ve bu alanlara özgü olarak geliştirilen yöntemleri içeren ve aynı zamanda da bu alanlara has yeni teknikler geliştiren bir bilim dalıdır. Biyoistatistiğin Tanımı Genel olarak istatistik iki şekilde tanımlanır. • Tanımlayıcı (Descriptive) istatistik • Çıkarsamalı (Inferential) istatistik Biyoistatistiğin Tanımı Tanımlayıcı istatistik, çalışma yapılan toplumu tanıtan, örnek birimlerden elde edilen verileri özetleyen, değişkenler hakkında tanımlayıcı bilgiler veren istatistiksel yöntemleri içerir. Kesinlikle toplum hakkında herhangi bir karara ya da genellemeye gitmemizi sağlamaz. Biyoistatistiğin Tanımı Çıkarsamalı istatistik, topluma ilişkin tahminlerde bulunulması, uygun kararların alınması ve topluma ilişkin genellemelere gidilmesi ile ilgilidir. Çıkarsamalı istatistik yöntemler genel olarak parametrelere ilişkin tahminleme yöntemleri ile istatistiksel hipotez testleridir. Biyoistatistikte Kullanılan Terimler Olay: Toplumdaki birimlerde ortaya çıkan ve üzerinde çalışmalar oluşumlara olay denir. yapmak gereği duyulan Biyoistatistikte Kullanılan Terimler İstatistiksel Olay: Araştırmaya, incelemeye konu teşkil eden, gözlenebilen, deneysel olarak varlığı kanıtlanabilen ve sayılarak, ölçülerek sayısal biçimde ifade edilebilen olaya istatistiksel olay denir. Biyoistatistikte Kullanılan Terimler Toplum (Popülasyon, Anakütle, Evren): İstatistiksel olayın gözlendiği, gözlenebildiği birimler topluluğuna toplum denir. Toplumdaki birim sayısı büyük “N” harfi ile gösterilir. Biyoistatistikte Kullanılan Terimler Birim: İncelenen olayın gözlendiği en küçük toplum parçasına, toplum ögesine birim denir. Gözlem: Birimlerin gözlemlenmesi sonucunda incelenen özelliklerinin sayısal değerine gözlem denir. Biyoistatistikte Kullanılan Terimler Örnek: Toplumu temsil edebilecek özellikte ve sayıda olan, örnekleme yöntemleri ile elde edilmiş toplumun bir parçasına örnek denir. Örnekteki birim sayısı küçük “n” harfi ile gösterilir. Değişken ve Değişken Tipleri Değişken: Birimlerin incelenen ve gözlenebilen özelliklerine değişken denir. Birimden birime farklı değerler alır. Örneğin boy uzunluğu bir değişkendir. Sağlıklı 20 erkek birey içeren bir örnekte tüm birimlerin boy uzunluğunun aynı olması beklenemez. Değişken ve Değişken Tipleri Değişkenler özelliklerine göre çeşitli biçimlerde sınıflandırılırlar. Gözlenme biçimlerine göre nitel ve nicel, ölçümleme tekniklerine göre isimsel, sıralı, aralıklı ve oransal, ölçülen değerlerin matematiksel durumuna göre ise kesikli ve sürekli olarak sınıflandırılırlar. Değişken ve Değişken Tipleri Nitel Değişkenler: Birimlerin kategorik ya da isimsel olarak belirtilebilen durumlarını ve karakteristik pozisyonlarını özelliklerini, belirten değişkenlerdir. Örneğin, birimlerin cinsiyeti, kan grubu, eğitim durumu, geçirmiş olduğu hastalıkların türleri, hastalık şiddeti, tedavi sonuçları vb. Değişken ve Değişken Tipleri Nicel Değişkenler: saptanan, sayısal Değerleri olarak ölçüm sonucu gözlenebilen değişkenlerdir. Örneğin birimlerin, boy uzunluğu, vücut ağırlıkları, kan basınçları, kolesterol düzeyleri gibi özellikleri nicel değişkenlerdir. Değişken ve Değişken Tipleri İsimsel Değişkenler: İncelenen değişkenin değeri isimsel olarak seçenekler halinde saptanıyorsa bu değişkene isimsel ölçekli değişken, elde edilen veriye ise isimsel veri denir. Örneğin birimlerin cinsiyeti, medeni durumu, geçirdiği hastalıklar vb. Değişken ve Değişken Tipleri Sıralı Değişkenler: Değişkenin değerleri isimsel ve birbirlerini ardışık olarak artan biçimde izleyen değerler içeriyorsa bu değişkene sıralı ölçekli değişken, elde edilen veriye ise sıralı veri denir. İsimsel kategoriler arasında bir hiyerarşi söz konusudur. Örneğin hastalığın düzeyi evre I, evre II, evre III ve evre IV, ağrı şiddeti yok, az, orta, çok gibi. Değişken ve Değişken Tipleri Aralıklı Değişkenler: Dünyaca kabul edilmiş bir başlangıç noktası olmayan, ölçüm sonucu değeri sayısal olarak gözlemlenen ve kat ya da oran hesabı yapılamayan nicel değişkene aralıklı ölçekli değişken, elde edilen veriye ise aralıklı veri denir. Değişken ve Değişken Tipleri Örneğin sıcaklık birimi santigrat derece bir aralıklı ölçektir. Örneğin bir odanın sıcaklığını ölçelim. Sıcaklığı santigrat ile ölçelim ve 25 santigrat derece olsun. Aynı odayı Fahrenhayt ile ölçtüğümüzde 77 Fahrenhayt olarak belirleriz. Değişken ve Değişken Tipleri Odayı ısıtalım ve sıcaklığı 50 santigrat dereceye yükseltelim. Bu defa bu odanın sıcaklığını Fahrenhayt ile ölçtüğümüzde 122 Fahrenhayt olarak belirleriz. Halbuki sıcaklığı santigrat olarak 2 katına çıkardığımızda Fahrenhayt olarak 2 kat bir sıcaklık ölçemedik. Değişken ve Değişken Tipleri Oransal Değişken: Değişkenin değeri uluslararası ölçü birimlerinden ediliyorsa, dünyaca (başlangıç) noktası uygun kabul varsa bir ölçekle edilmiş ve elde bir sayısal sıfır olarak gözlemleniyorsa bu değişkene oransal ölçekli değişken denir ve elde edilen veriye ise oransal veri denir. Kat ve oran hesabı yapılabilen bir ölçektir. Değişken ve Değişken Tipleri Kesikli Değişken: Değerler seti içinde sadece tamsayı değerler alabilen değişkenlerdir. Çocuk sayısı, dakikada nabız atım sayısı vb. Sürekli Değişken: Değerler seti içinde her türlü değeri alabilen (tamsayı ve kesirli) değişkenlerdir. Boy uzunluğu, ağırlık, yaş, sistolik kan basıncı, kreatinin değeri vb. Değişken ve Değişken Tipleri Bağımlı Değişken: İncelenen bir olayda değeri başka değişkenlerce belirlenebilen ve dışsal faktörlerden etkilenerek değer alan değişkenlerdir. Bağımsız Değişken: İncelenen bir olayda değeri rasgele oluşan, başka değişkenlerin üzerinde etkili olan değişkendir. Değişken ve Değişken Tipleri Bağımlı ve bağımsız değişken tanımlarında “incelenen bir olayda” ifadesini vurgulamak gerekir çünkü bir değişken incelenen olayın özelliklerine göre bağımlı ya da bağımsız değişken olabilir. Değişken ve Değişken Tipleri Veri: İki ya da daha fazla birimden elde edilmiş ve kaydedilmiş bir ya da daha fazla değişkenin değerlerinin rakamlar setine veri denir. Frekans (sıklık): Bir değişkenin belli bir değerinin ya da belli bir değer aralığının gözlendiği birim sayısıdır. Parametre ve İstatistik Parametre: İncelenen değişkenin toplumdaki tipik değeridir. Parametre hesaplanan sayısal değerdir. İstatistik: n sayıda birimden oluşan örnekten elde edilen verilerden hesaplanmış değerdir. İstatistik parametrenin bir tahmincisidir. Parametre ve İstatistik Parametre İstatistik x S r Tanımlayıcı İstatistikler Elde edilen veri seti ile ilgili olarak yapılacak ilk adım veri setini tanımlamak ve özetlemektir. Küçük veri setlerinde bu adım, tüm veri seti içindeki değişkenler ve değişkenlere ait ölçümler listelenerek gerçekleştirebilir. Genelde bu işlem uzun sürer ve etkili bir yaklaşım değildir. Ayrıca büyük veri setleri içinde bu işlem imkansız olabilir. Tanımlayıcı İstatistikler Çeşitli değişkenlere ait verileri özetleyen, birimlerin yığıldıkları tipik değerleri ve bu değerler etrafındaki yayılımlarını, dağılımlarını gösteren, birimlere ait değişkenler hakkında genel olarak bilgi veren ve bu değişkenleri tanımlayan istatistiklere tanımlayıcı istatistikler (descriptive statistics) denir. Tanımlayıcı İstatistikler Özetle, eldeki mevcut veri setini nümerik yöntemler ile özetleyen, tanımlayan istatistiklere tanımlayıcı istatistikler denir. iki kategoride yer alır. • Merkezi eğilim ölçüleri • Dağılım ölçüleri Merkezi Eğilim Ölçüleri Verilerin hangi değerlerde yığıldığını, toplandığını gösteren, birimlerin genel eğilimlerinin hangi değerlere doğru olduğunu belirten, veri setinin merkezi noktalarının neler olduğunu bildiren istatistiklerdir. Merkezi Eğilim Ölçüleri Ortalama Nicel veri setlerinde birimlerin toplandığı kabul edilen merkezi tipik değere ortalama denir. Veri setindeki değerler kümesinin ağırlık noktasını gösterir. Hesaplamada değerlerin kullanım biçimlerine göre en sık kullanılan üç farklı tipi vardır. Merkezi Eğilim Ölçüleri Aritmetik Ortalama En sık kullanılan ortalama türüdür. Tüm gözlem değerlerinin toplamının birim sayısına bölünmesiyle elde edilir. Genel olarak değişken ismi üzeri çizgi ile gösterilir. X, Y, Z X n X i 1 n i X 1 X 2 ... X n n Merkezi Eğilim Ölçüleri Aritmetik Ortalama Örnek: 40 yaşında 165 cm. boyunda 10 sağlıklı kadına ait FEV1 (Forced Expiratory Volume in One Second) (litre) değerleri ölçülmüş ve 2.82 2.78 2.88 2.70 2.91 2.76 2.80 2.86 2.80 2.87 değerleri elde edilmiştir. FEV1 değeri aşağıdaki gibi hesaplanır. Merkezi Eğilim Ölçüleri Aritmetik Ortalama FEV1 değerlerinin aritmetik ortalaması aşağıdaki gibi hesaplanır. X FEV1 2.82 2.78 2.88 2.70 2.91 2.76 2.80 2.86 2.80 2.87 10 X FEV1 28.18 2.818 10 Merkezi Eğilim Ölçüleri Aritmetik Ortalama Aritmetik Ortalamanın Özellikleri: • • x x 0 • i1 xi a n x n x i i 1 n i 1 n i 2 İfadesi a= x küçük olur. olduğunda en Merkezi Eğilim Ölçüleri Aritmetik Ortalama Aritmetik Ortalamanın Özellikleri: Aritmetik ortalamanın zayıf yönü aşırı uç değerlere oldukça duyarlıdır. Örneğin aşağıda yer alan verileri düşünelim. 1 1 2 4 5 7 8 9 12 12 13 130 Merkezi Eğilim Ölçüleri Aritmetik Ortalama Aritmetik Ortalamanın Özellikleri: 1 1 2 4 5 7 8 9 12 12 13 130 aritmetik ortalama 17 olarak elde edilmiştir. Ancak 12 veriden 11 tanesi hesaplanan ortalama değerinden küçüktür. aritmetik Buda bize hesaplanan değerin eldeki mevcut verilerin merkezi olmadığını göstermektedir. Merkezi Eğilim Ölçüleri Geometrik Ortalama Veri setindeki değerler artan ya da azalan bir diziyi izliyorsa ya da değişim oranlarının (yüzde, oran gibi) değerler içeriyorsa ortalama hesaplanır. bu durumda geometrik Merkezi Eğilim Ölçüleri Geometrik Ortalama Veri setindeki değerlerin çarpımlarının birim sayısı cinsinden kökünün alınması ile ya da verilerin logaritmalarının toplamının birim sayısına bölünmesi ve hesaplanan logaritmik ortalamanın anti logaritmasının alınması ile hesaplanır. Merkezi Eğilim Ölçüleri Geometrik Ortalama XG n n n X X ... X X i 1 2 n i 1 n log( X i ) X G anti log i 1 n Merkezi Eğilim Ölçüleri Geometrik Ortalama Örnek: Bir bölgede son 10 yıla ait hava kirliliği ölçümünde kullanılan SO2 (kükürtdioksit) (µg/m3) değerleri 3, 7, 8, 10, 12, 14, 16, 18, 22, 24 olarak ölçülmüştür. Son 10 yılın ortalama SO2 değeri nedir? Merkezi Eğilim Ölçüleri Geometrik Ortalama Veri seti incelendiğinde artan bir eğilim gözlenmektedir. Bu durumda geometrik ortalama hesaplamak daha uygun olacaktır. X G ( SO2 ) 3 7 ... 24 11.5682 10 Merkezi Eğilim Ölçüleri Geometrik Ortalama Geometrik Ortalamanın Özellikleri: Geometrik ortalama sürekli artan ya da azalan yapıda çarpık dağılıma sahip verilerde kullanılır çünkü aritmetik ortalama çarpık dağılımlarda merkezden uzaklaşmakta etkilenmektedir. ve aşırı uçlardan Merkezi Eğilim Ölçüleri Geometrik Ortalama Geometrik Ortalamanın Özellikleri: Gözlem sonuçları arasındaki oransal (nisbi) farkların mutlak farklardan daha önemli olduğu durumlarda kullanılır. Gözlem sonuçlarının her biri bir önceki gözlem sonucuna bağlı olarak değişiyorsa ve bu değişimin hızı saptanmak isteniyorsa geometrik ortalama sağlıklı sonuçlar verir. Merkezi Eğilim Ölçüleri Geometrik Ortalama Geometrik Ortalamanın Özellikleri: Geometrik ortalama pozitif değer içeren veri setlerinde kullanılır çünkü sıfırın ve negatif sayıların logaritması tanımsızdır. Merkezi Eğilim Ölçüleri Harmonik Ortalama Zamana bağlı hız, verimlilik gibi oransal değişimleri gösteren verilere ait ortalama hesaplanmasında kullanılır. Veri setindeki değerler bir zaman serisi, eşit şartlarda yapılmış k sayıda deneyin sonuçları gibi değerler içeriyor ise harmonik ortalama sağlıklı sonuçlar verir. Merkezi Eğilim Ölçüleri Harmonik Ortalama Harmonik ortalama değerlerin çarpmaya göre terslerinin ortalamasının tersidir. Aşağıdaki şekilde hesaplanır. XH n n i 1 1 Xi n 1 1 1 ... X1 X 2 Xn Merkezi Eğilim Ölçüleri Harmonik Ortalama Örnek: Bir bölgede son bir yıl içerisinde üst solunum yolu enfeksiyonundan dolayı sağlık ocağına başvuran hasta sayısı aylara göre aşağıda verilmiştir. Aylık verilere göre ortalama hasta sayısı nedir? Ocak Şubat Mart Nisan Mayıs Haziran 125 158 103 95 74 30 Temmuz Ağustos 13 14 Eylül Ekim Kasım Aralık 38 156 208 205 Merkezi Eğilim Ölçüleri Harmonik Ortalama Ocak Şubat Mart Nisan Mayıs Haziran 125 158 103 95 74 30 XH Temmuz Ağustos 13 14 12 1 1 1 ... 125 158 205 Eylül Ekim Kasım Aralık 38 156 208 205 44.0894 Merkezi Eğilim Ölçüleri Harmonik Ortalama Harmonik Ortalamanın Özellikleri: Zamana bağlı hız, verimlilik gibi oransal değişimleri gösteren verilere ait ortalama hesaplanmasında kullanılır. Harmonik ortalama sıfır içermeyen veri setlerinde kullanılır çünkü sıfırın tersi tanımsızdır. Merkezi Eğilim Ölçüleri Medyan Aritmetik ortalamadan sonra en yaygın kullanılan merkezi eğilim ölçüsü medyandır. Ortanca değer olarak da adlandırılmaktadır. Veri setini tam olarak iki eşit parçaya bölen değerdir. Merkezi Eğilim Ölçüleri Medyan n birimlik bir örnekte veriler küçükten büyüğe doğru sıralanmış olsun. Eğer n tek sayı ise medyan [(n+1)/2]’inci sırada yer alan değerdir. Eğer n çift sayı ise medyan [n/2]’ci ve [(n/2)+1]’ci değerlerin ortalamasıdır. Merkezi Eğilim Ölçüleri Medyan Örnek: 7 yeni doğanın doğum ağırlıkları 3200, 3500, 3400, 3460, 3100, 7800, 2900 gram olarak ölçülmüştür. Bu ölçümlerin ortanca değeri kaçtır? Merkezi Eğilim Ölçüleri Medyan Öncelikle veriler küçükten büyüğe doğru sıralanır. X[1]=2900, X[2]=3100, X[3]=3200, X[5]=3460, X[6]=3500 ve X[7]=7800. n=7 sayısı tek olduğundan Medyan = X[(7+1)/2] = X[4] = 3400 şeklinde elde edilir. X[4]=3400, Merkezi Eğilim Ölçüleri Medyan Örnek: 6 yeni doğanın doğum ağırlıkları 3200, 3500, 3400, 3100, 7800, 2900 gram olarak ölçülmüştür. Bu ölçümlerin ortanca değeri kaçtır? Merkezi Eğilim Ölçüleri Medyan Öncelikle veriler küçükten büyüğe doğru sıralanır. X[1]=2900, X[2]=3100, X[3]=3200, X[4]=3400, X[5]=3500, ve X[6]=7800. n=6 sayısı çift olduğundan Medyan = (X[3]+X[4])/2 = (3200+3400)/2 = 3300 şeklinde elde edilir. Merkezi Eğilim Ölçüleri Medyan Medyanın Özellikleri: Aşırı derecede tekrar etmeyen ölçümleri içeren büyük veri setlerinde veri setinin yarısı medyan değerinden küçük, diğer yarısı da medyan değerinden büyük ölçümlere sahiptir. Ancak veri seti aşırı derecede tekrar eden verileri içeriyorsa yukarıdaki sonuç doğru olmaz. Merkezi Eğilim Ölçüleri Medyan Medyanın Özellikleri: Örneğin 100 aileyi içeren bir örnekte 20 aile 2 kişiden, 40 aile 3 kişiden ve 40 ailede 4 kişiden oluşuyorsa bu veri setine ait medyan değerini hesaplayalım. Gözlem 2 . . . 2 3 . . . 3 3 . . . 3 4 . . . 4 Sıra No 1 . . . 20 21 . . . 50 51 . . . 60 61 . . . 100 Merkezi Eğilim Ölçüleri Medyan Medyanın Özellikleri: Örnek büyüklüğü n=100 olduğundan medyan değeri 50’ci ve 51’ci sırada yer alan değerlerin ortalamasıdır. Bu durumda medyan değeri 3 olarak hesaplanır. Ancak 3’den küçük veri sayısı sadece 20’dir. Bu durumda yukarıdaki sonuç yanlış olur. Gözlem 2 . . . 2 3 . . . 3 3 . . . 3 4 . . . 4 Sıra No 1 . . . 20 21 . . . 50 51 . . . 60 61 . . . 100 Merkezi Eğilim Ölçüleri Medyan Medyanın Özellikleri: Medyan aşırı uç değerlerden etkilenmez. Bu özelliği nedeniyle sapan değer içeren veri setlerinde aritmetik ortalamaya göre tercih edilen bir merkezi eğilim ölçüsüdür. Merkezi Eğilim Ölçüleri Mod Bir veri setinde en çok gözlemlenen, en çok tekrar eden değere mod ya da tepe değeri denir. Bir seride benzer sayıda tekrarlanan birden fazla değer varsa o seriye çok tepeli seri denir. Merkezi Eğilim Ölçüleri Mod Örnek: 15 bireye ait hemoglobin değerleri 11, 12, 14, 11, 15, 16, 15, 12, 11, 10, 9, 11, 13, 14, 15 ise bu veri setinin Mod=11 olarak elde edilir. Merkezi Eğilim Ölçüleri Dörttebirlikler ve Yüzdebirlikler Dörttebirlikler: Büyüklük sırasına dizilmiş bir veri setini dört eşit parçaya bölen istatistiklere dörttebirlik denir. Dörttebirliklerin hesaplanması ortanca değer hesaplanmasına benzer. Merkezi Eğilim Ölçüleri Dörttebirlikler ve Yüzdebirlikler Birinci dörttebirlik Q1 ile gösterilir ve veri setinin ilk çeyreğini yani %25. değerini belirtir. Q1=x[n/4] olarak hesaplanır. İkinci dörttebirlik Q2 ile gösterilir yani bu aynı zamanda ortanca değerdir ve veri setinin %50. değerini gösterir. Üçüncü dörttebirilik Q3 ile gösterilir ve veri setinin %75. değerini belirtir. Q3=x[3n/4] olarak hesaplanır. Merkezi Eğilim Ölçüleri Dörttebirlikler ve Yüzdebirlikler Yüzdebirlikler: Büyüklük sırasına dizilmiş bir veri setini yüzdelik bölümlere ayıran istatistiklerdir. P(%) olarak gösterilirler. Örneğin P(5) veri setinin %5. değerini gösterir. Örneğin, P(5)=x[5n/100], P(90)=x[90n/100], P(80)=x[80n/100] olarak hesaplanır. Merkezi Eğilim Ölçüleri Dörttebirlikler ve Yüzdebirlikler Dörttebirliklerin ve yüzdebirliklerin hesaplanmasında farklı hesaplama yöntemleri kullanılmaktadır. Merkezi Eğilim Ölçüleri Dörttebirlikler ve Yüzdebirlikler En yaygın kullanılan hesaplama yöntemi aşağıdaki gibidir. Hesaplanacak yüzdelik değeri p olsun. Bu durumda pn/100=k değeri tam sayı ise p. yüzdelik değeri (k). ve (k+1). sırada yer alan gözlemlerin ortalamasıdır. Eğer pn/100=k değeri tam sayı değil ise p. yüzdelik değeri [[k]]+1’inci sırada yer alan gözlem değeridir. Dağılım Ölçüleri Bir değişkenin dağılımını, değerler aralığındaki serpilmesini ve ortalama etrafında yayılışlarını, belirli değerlerde yığılma eğilimlerini belirlemeye yarayan belirtici istatistiklere dağılım ölçüleri adı verilir. Dağılım Ölçüleri Dağılım ölçüleri, merkezi eğilim ölçülerini destekleyen ve verilerin merkezi eğilim ölçüleri etrafında yayılışlarını, dağılımlarını ve serpilmelerini gösteren ölçülerdir. Dağılım Ölçüleri Dağılım Aralığı Dizideki en büyük ve en küçük değer arasındaki farka dağılım aralığı denir. R ile gösterilir. R = Xmax - Xmin şeklinde hesaplanır. Dizideki değerlerin kabaca kaç birimlik yayılış gösterdiğini belirtir. Dağılım Ölçüleri Dağılım Aralığı Örnek: 15 bireye ait hemoglobin değerleri 11, 12, 14, 11, 15, 16, 15, 12, 11, 10, 9, 11, 13, 14, 15 ise bu veri setinin dağılım aralığı,R aşağıdaki gibi hesaplanır. R = Xmax – Xmin = 16 – 9 = 7 Dağılım Ölçüleri Dağılım Aralığı Dağılım Aralığının Özellikleri: Dağılım aralığı sadece en küçük ve en büyük değeri hesaplamaya katar. Dolayısıyla sapan değerlerden etkilenir. Örneğin veri setinde yer alan ölçümlerin çoğu birbirine yakın değerler içeriyor ancak çok büyük sadece bir ölçüm bile olsa dağılım aralığı büyük çıkacak ve genel dağılımı yansıtmayacaktır. Dağılım Ölçüleri Dağılım Aralığı Dağılım Aralığının Özellikleri: Dağılım aralığı veri setinin örnek büyüklüğünden etkilenmektedir. Örnek büyüklüğü arttıkça dağılım aralığı da artma eğilimi göstermektedir. Dağılım Ölçüleri Çeyrekler Aralığı Dağılım aralığı en küçük ve en büyük değerlere bağlı olduğundan dolayı, modifiye edilmiş bir diğer dağılım aralığı olan çeyrekler aralığı kullanılır. Çeyrekler aralığı orta nokta olan medyan etrafındaki dağılımı özetler. Q3 ile Q1 arasındaki farkı verir. 𝐼𝑄𝑅 = 𝑄3 − 𝑄1 Dağılım Ölçüleri Ortalama Mutlak Sapma Ortalama mutlak sapma her bir gözlem değerinin kendi ortalamasından mutlak farklarının ortalaması olarak tanımlanır. Gözlem değerlerinin kendi ortalamasından farklarının toplamı sıfır olduğundan mutlak sapma kullanılmıştır. 𝑂𝑀𝑆 = 𝑛 𝑖=1 𝑥𝑖 − 𝑥 𝑛 Dağılım Ölçüleri Ortalama Mutlak Sapma Ortalama mutlak sapma bir dağılım ölçüsü olarak kullanılır ancak incelenen değişkenin dağılımı normal dağılım gösteriyorsa standart sapma ya da varyans daha uygun bir dağılım ölçüsü olur çünkü normal dağılımın bir parametresi de standart sapmadır ve dağılımı karakterize eder. Dağılım Ölçüleri Varyans Verilerin kendi ortalaması etrafında nasıl bir dağılım gösterdiğini, yayılış ve serpilmenin durumunu değişkenin ölçü biriminin karesi olarak belirten dağılım ölçüdür. S2 ya da değişken adına göre V(X), V(Y)... ile gösterilir. 𝑆2 = 𝑛 𝑖=1 𝑥𝑖 − 𝑥 𝑛−1 2 = 𝑛 2 𝑥 𝑖=1 𝑖 − 𝑛−1 𝑛 2 𝑥 𝑖=1 𝑖 𝑛 Dağılım Ölçüleri Standart Sapma Varyans ölçü biriminin karesi olarak ifade edilmektedir. Örneğin gözlem değerleri metre ise hesaplanan varyans, metrekare olarak karşımıza çıkar. Çoğunlukla kullanılan ölçü biriminde dağılım ölçüsünün ifade edilmesi istenir. Dağılım Ölçüleri Standart Sapma Dolayısıyla varyasın karekökü orijinal ölçü birimine tekrar dönüş olacaktır. Varyansın karekökü standart sapma olarak isimlendirilir ve ortalama ile birlikte (aynı ölçü birimde olduklarından) kullanılır. S harfi ile gösterilir. 𝑆= 𝑆2 Dağılım Ölçüleri Standart Sapma Örnek: 40 yaşında 165 cm. boyunda 10 sağlıklı kadına ait FEV1 (litre) değerleri ölçülmüş ve 2.82 2.78 2.88 2.70 2.91 2.76 2.80 2.86 2.80 2.87 değerleri elde edilmiştir. FEV1 ölçümlerine ait standart sapma değeri aşağıdaki gibi hesaplanır. Dağılım Ölçüleri Değişim Katsayısı Birim sayıları ve ölçü birimleri birbirlerinden farklı olan değişkenlerin ortalamaya göre yayılışlarını karşılaştırmak için yararlanılan ve değişkenin ortalama ve standart sapmasından yararlanılarak hesaplanan bir dağılım ölçüsüdür. DK ile gösterilir. 𝑆 𝐷𝐾 = 100 𝑥 Dağılım Ölçüleri Değişim Katsayısı Örnek: 15 bireye ait hemoglobin değerleri 11, 12, 14, 11, 15, 16, 15, 12, 11, 10, 9, 11, 13, 14, 15 olarak belirlenmiştir. 40 yaşında 165 cm. boyunda 10 sağlıklı kadına ait FEV1 (litre) değerleri ölçülmüş ve 2.82 2.78 2.88 2.70 2.91 2.76 2.80 2.86 2.80 2.87 değerleri elde edilmiştir. Dağılım Ölçüleri Değişim Katsayısı Acaba bu iki değişkeninden hangisi daha fazla dağılım göstermektedir? Bu soruyu cevaplamak için her iki değişkene ait değişim katsayısı değişkenlerin standart hesaplanmalıdır. sapmalarını Eğer doğrudan karşılaştıracak olursak hata yapmış oluruz çünkü değişkenlerin ölçü birimleri birbirinden farklıdır. Dağılım Ölçüleri Değişim Katsayısı Acaba bu iki değişkeninden hangisi daha fazla dağılım göstermektedir? Bu soruyu cevaplamak için her iki değişkene ait değişim katsayısı değişkenlerin standart hesaplanmalıdır. sapmalarını Eğer doğrudan karşılaştıracak olursak hata yapmış oluruz çünkü değişkenlerin ölçü birimleri birbirinden farklıdır. Dağılım Ölçüleri Değişim Katsayısı FEV1 değişkenine ait değişim katsayısı DK(FEV1)=(0.063/2.818) x 100 = % 2.235 Hemoglobin değişkenine ait değişim katsayısı DK(HG)= (2.131/12.6) x 100 = %16.9 olarak hesaplanır. Bu sonuçlara göre Hemoglobin değişkeni FEV1 değişkenine göre daha fazla dağılım göstermektedir.