T.C. ANADOLU ÜNİVERSİTESİ YAYINI NO: 2534 AÇIKÖĞRETİM FAKÜLTESİ YAYINI NO: 1505 TIBBİ İSTATİSTİK Yazarlar Doç.Dr. Zeki YILDIZ (Ünite 1, 7) Prof.Dr. Veysel YILMAZ, Yrd.Doç.Dr. H. Eray ÇELİK (Ünite 2, 5) Yrd.Doç.Dr. Cengiz AKTAŞ (Ünite 3, 8) Yrd.Doç.Dr. Cengiz BAL (Ünite 4) Prof.Dr. Ahmet ÖZMEN (Ünite 6) Editör Prof.Dr. Veysel YILMAZ ANADOLU ÜNİVERSİTESİ i Bu kitabın basım, yayım ve satış hakları Anadolu Üniversitesine aittir. “Uzaktan Öğretim” tekniğine uygun olarak hazırlanan bu kitabın bütün hakları saklıdır. İlgili kuruluştan izin almadan kitabın tümü ya da bölümleri mekanik, elektronik, fotokopi, manyetik kayıt veya başka şekillerde çoğaltılamaz, basılamaz ve dağıtılamaz. Copyright © 2012 by Anadolu University All rights reserved No part of this book may be reproduced or stored in a retrieval system, or transmitted in any form or by any means mechanical, electronic, photocopy, magnetic, tape or otherwise, without permission in writing from the University. UZAKTAN ÖĞRETİM TASARIM BİRİMİ Genel Koordinatör Doç.Dr. Müjgan Bozkaya Genel Koordinatör Yardımcısı Doç.Dr. Hasan Çalışkan Öğretim Tasarımcıları Yrd.Doç.Dr. Seçil Banar Öğr.Gör.Dr. Mediha Tezcan Grafik Tasarım Yönetmenleri Prof. Tevfik Fikret Uçar Öğr.Gör. Cemalettin Yıldız Öğr.Gör. Nilgün Salur Kitap Koordinasyon Birimi Yrd.Doç.Dr. Feyyaz Bodur Uzm. Nermin Özgür Kapak Düzeni Prof. Tevfik Fikret Uçar Öğr.Gör. Cemalettin Yıldız Grafiker Gülşah Yılmaz Dizgi Açıköğretim Fakültesi Dizgi Ekibi Tıbbi İstatistik ISBN 978-975-06-1208-4 1. Baskı Bu kitap ANADOLU ÜNİVERSİTESİ Web-Ofset Tesislerinde 22.800 adet basılmıştır. ESKİŞEHİR, Haziran 2012 ii İçindekiler Önsöz ……………………………………………………………………………………………….... iv 1. İstatistiğin Tanımı ve Temel Kavramlar……………………………………………………… 2 2. Verilerin Derlenmesi, İşlenmesi ve Grafikler ile Gösterimi………………………………. 14 3. Ortalamalar ve Değişkenlik Ölçüleri……………………………..…………………………… 54 4. Sağlık Alanına Özel İstatistiksel Yöntemler……………………………..………………….. 76 5. Olasılık Kuramı……………………………..……………………………………………………. 112 6. Örnekleme ve Bazı Örnekleme Dağılımları……………………………..…………………… 146 7. İstatiksel Tahmin ve Hipotez Testleri……………………………..…………………………. 182 8. Korelasyon ve Regresyon Analizi……………………………..……………………………… 212 iii Önsöz Anadolu Üniversitesi Açıköğretim Fakültesi önlisans programlarından Sağlık Kurumları İşletmeciliği Programında yürütülecek olan Tıbbi İstatistik dersi için hazırlanan bu kitap sekiz üniteden oluşmaktadır. Bu programda öğrenim görecek siz değerli öğrencilerimiz sağlık kurumları işletmelerinde gelecekte birer yönetici olarak yer alacasınız. Bu amaçla sizlerin vereceği kararlarda ve planlamalarınızda doğru ve sağlıklı kararlar alabilmeniz için, karar verme sürecinde riski en aza indirecek istatistik bilgisiyle donatılmış olmanız gerekmektedir. İstatistik, verilerin elde edilmesinden başlayarak bilgiye dönüştürülmeleri ve veri sayısının azaltılarak kullanım değerlerinin artması sürecinde çeşitli alanlarda çalışan kişilere birçok yararlar sağlar. Ekonomik, sosyal, tıbbi, biyolojik, jeolojik v.b. herhangi bir olayın sayısal yapısının anlaşılmasında ve elde edilen verilerden sonuçlar çıkarılmasında istatistik başvurulabilecek önemli bir araçtır. Sağlık kurumu yöneticileri özellikle ileriye dönük planlama yaparken, mevcut durumu değerlendirirken, önceki yıllara göre kıyaslama yaparken ve diğer sağlık kurumları ile kendi kurumunu karşılaştırırken tek bir ölçüye dayalı değil, bir çok ölçüden yararlanarak karşılaştırmalar yapmalıdır. Kendini sürekli olarak yenilemeli, sağlık yöneticiliği alanındaki gelişmeleri takip etmeli, kurumunu en üst seviyeye çıkarmaya çaba göstermelidir. Bu anılan faaliyetler gerçekleştirebilmek için doğru, tam, güvenilir, kullanılabilir, güncel ve denetlenebilir verilere ihtiyaç vardır. Bu verilerin, bilgiye dönüştürülmesi işlemi istatistiksel teknikler olmadan asla yerine getirilemez. Bu nedenle müfredatınızda okutulan Tıbbi İstatistik dersini bu açıdan değerlendirmekte yarar vardır. Sağlık kurumları işletmeciliği programında okutulacak olan bu kitapda, öncelikle istatistiğe ilişkin temel konular ile alana ilişkin karar verme durumunda kalabileceğiniz çok sayıda probleme ve çözülmüş örneklere yer verilmiştir. Her ünite içinde yer alan sıra sizde soruları konuları kavrayıp kavramadınız hakkında sizlere geribildirim sunmak için verilmiştir. Ayrıca ünite içindeki konularda bilginizi değerlendirebileceğiniz ve sizleri sınavlara hazırlamak için her ünite sonunda yer alan kendimizi sınayalım sorularına yer almıştır. Hazırlamış olduğumuz Tıbbi istatistik kitabı sadece öğrenim gördüğünüz süre içinde değil aynı zamanda sağlık kurumu işletmelerinde birer yönetici olarak yer aldığınızda da bir başvuru kitabı olarak karar verme sürecinizde belirsizlikleri en aza indirgemenizde yardımcı olmasını dilerim.. Bu kitabın meydana gelmesinde, başta Anadolu Üniversitesi Rektörlüğüne, Açıköğretim Fakültesi Dekanlığına, koordinatörler ve ile kitabın hazırlanması için emeği geçen çalışanlara, editör ve yazarlar olarak teşekkür ederiz. Editör Prof.Dr. Veysel Yılmaz iv 1 Amaçlarımız Bu üniteyi tamamladıktan sonra; İstatistiğin tanımı ve işlevini açıklayabilecek, İstatistiğin temel kavramlarını açıklayabilecek, Değişken kavramını açıklayabilecek ve çeşitli açılardan sınıflandırabilecek, Değişkenin hangi ölçekle ölçülebileceğini belirleyebilecek bilgi ve becerilere sahip olabilirsiniz. Anahtar Kavramlar İstatistik Ana kütle Birim Örneklem Yığın olay Ölçekler Değişken İçindekiler Giriş İstatistik Kelimesinin Anlamı İstatistiğin Tanımı ve İşlevi İstatistiğin Bilim Dalları ve Hastane Yöneticiliği Açısından Önemi Temel Kavramlar 2 İstatistiğin Tanımı ve Temel Kavramlar GİRİŞ Bilimsel araştırma, belirli bir o1gular kümesinin niteliği, ortaya çıkış nedenleri ile ortaya çıkardığı sonuçlar konusunda bilgilenme olarak tanımlanabilir. Araştırma amacının gerçekleştirilmesi için benimsenen genel yaklaşım araştırma yöntemi olarak ifade edilebilir. Bilimsel bir araştırma yöntemi soru biçiminde bir araştırma probleminin ortaya konulması, eldeki bilgilerin değerlendirilmesi, araştırmanın planlanması, araştırmanın gerçekleştirilmesi, elde edilen verilerin bilgiye dönüştürülerek yorumlanması, sonuçlara varılması ve sonuçların yarara sunulması aşamalarını içerir. Gözlem yapıldığında istatistik, bilimsel yöntemdeki yerini almaktadır. Gözlemler sonucunda verilerin elde edilmesi, düzenlenmesi, kullanıma sunulması ve çözümlenmesi istatistiğin görevidir. Ayrıca, bilimsel araştırmalarda ulaşılan sonuçların çoğu kesin olmayan yargı, birer çıkarsama niteliğindedir. Bu durumun ölçülmesi de istatistiğin işlevlerinden biridir. Dolayısıyla istatistiğin bilimsel yöntemde betimleme ve çıkarsama görevleri vardır. İstatistik, verilerin elde edilmesinden başlayarak bilgiye dönüştürülmeleri ve hacimlerinin azaltılarak kullanım değerlerinin artması sürecinde çeşitli alanlarda çalışan kişilere birçok yararlar sağlar. Ekonomik, sosyal, tıbbi, biyolojik, jeolojik v.b. herhangi bir olayın sayısal yapısının anlaşılmasında ve elde edilen verilerden sonuçlar çıkarılmasında istatistik başvurulabilecek önemli bir araçtır. Bu ünitede, istatistiğin tanımı ve işlevine, ayrıca istatistiğin öğrenilmesinde belirli bir temelin oluşmasında önemli rol oynayacak bazı temel kavramlar açıklanmaya çalışılacaktır. Temel kavramlar öğrenilmeden sayısal problemlere odaklanılmasının araştırmacıyı yanlış yönlendireceği unutulmamalıdır. İSTATİSTİK KELİMESİNİN ANLAMI İstatistik kelimesi üç farklı anlamda kullanılmaktadır. Birinci anlamda istatistik kelimesi, çeşitli olaylar hakkında toplanan verileri belirtmek için kullanılmaktadır. Örneğin “sağlık istatistikleri” denildiğinde sağlık alanındaki olaylar hakkındaki sayısal veriler anlatılmak istenmektedir. Benzer biçimde “eğitim istatistikleri”, “dış ticaret istatistikleri” ve “bir spor karşılaşmasına ilişkin istatistikler” ifadelerindeki “istatistikler” kelimesi bu anlamda kullanılmaktadır. İkinci anlamda istatistik kelimesi, çeşitli alanlardaki bilimsel araştırmalardan elde edilen verilerin düzenlenmesi, özetlenmesi, çözümlenmesi ve yorumlanması işlemlerinin gerçekleştirildiği teknikler bütününü ifade etmektedir. İstatistik yöntembiliminin adıdır. Üçüncü anlamda istatistik, hakkında bilgi elde etmek amacıyla hedeflenen ana kütleden tesadüfi olarak çekilen bir örneklemin aritmetik ortalama, standart sapma, oran v.b. herhangi bir özetleyici değerine verilen addır. Ana kütleden hesaplanan bu özet değerlere “parametre”, örneklemeye başvurulduğunda ise “istatistik” adı verilir. İSTATİSTİĞİN TANIMI VE İŞLEVİ İstatistik, belirli bir amaç için incelenen bir olayın (olgunun, gerçekliğin) sayısal doğasının anlaşılmasına ve başkalarına anlatılmasına yarar. Çeşitli bilim dallarındaki araştırmalarda, herhangi bir olayın sayısal yapısının anlaşılmasında ve elde edilen verilerden yararlanarak sonuçlar çıkarılmasında kullanılan bir araçtır. İstatistik sayılarla ilgilidir ve istatistiksel çözümlemelerin yapılabilmesi için sayısal verilere veya 3 sayısal görünüm kazandırılmış verilere gereksinim vardır. İstatistiğin tanımı şu biçimde yapılabilir; İstatistik, belirli bir amaca yönelik veri elde etme (derleme), elde edilen verileri işleme, özetleme, çözümleme ve elde edilen sonuçları yorumlama işlemlerinin gerçekleştirildiği teknikler bilimidir. İstatistik, belirli bir amaç için hakkında bilgi edinilmek istenen birimleri ve bunların oluşturduğu kütleleri inceler. Söz konusu birimler canlı varlıklar, cansız varlıklar ya da “ortaya çıkan durum” biçiminde ifade edilebilecek olaylar olabilir. Örneğin, bir hastanede yatan hastalar çeşitli nitelikleri bakımından, belirli bir bölgedeki özel, devlet ve üniversite hastaneleri çeşitli nitelikleri bakımından ya da belirli bir hastanedeki doğumlar, acil vakalar çeşitli açıdan incelenebilir. Ancak birimlerin istatistiğin konusu olabilmesi için “yığın (kollektif) olay” niteliğinde olması gerekir. Yığın olay, bir olaylar kütlesinde bir olayın kendi türünden olayları incelenen nitelikleri bakımından tam anlamıyla temsil etmeyen olaylardır. Birbirinin tam benzeri olan olaylar “tipik olaylardır. Bu tür olaylardan ele alınan değişken açısından sadece biri incelense ait olduğu kütleyi temsil eder. Bu tür olaylar birim anlamında istatistiğin konusunu oluşturmaz. Örneğin bir hastane işletmesinde görev yapan doktorların meslek açısından incelenmesinde doktorlar tipik olay durumundadır. Dolayısıyla bu çalışmada doktorlar birim olma niteliğinde olmazlar. İşlevleri açısından istatistik, “betimsel istatistik” ve “çıkarsamalı istatistik” biçiminde iki ana gruba ayrılabilir. İncelenen birimlere ilişkin verilerin elde edilmesi, elde edilen verilerin sayısal yapılarının anlaşılabilmesi amacıyla işlenip düzenlenmesi, tablolar ve grafiklerle görsel olarak sunulması, aritmetik ortalama, standart sapma gibi değerlerle özetlenmesi betimsel istatistiğin konusudur. Buna karşılık örnekleme temeline dayanan çıkarsamalı istatistikte bir ana kütleden tesadüfî olarak seçilen örneklem yardımıyla ana kütle parametrelerine ilişkin tahmin, hipotez testleri ve gelecek dönemlere ilişkin öngörüler yapılır. İstatistiğin kelime anlamını ve işlevlerini açıklayınız. İSTATİSTİĞİN BİLİM DALLARI VE HASTANE YÖNETİCİLİĞİ AÇISINDAN ÖNEMİ İstatistik yığın olayları, yani birbirine benzemeyen, bazı ortak özelliklere sahip olmakla birlikte genelde aralarında önemli farklılıklar da bulunan olayları, konu aldığı için bu tür olayları konu alan çeşitli alanlara uygulanabilmektedir. İstatistik, hangi amaçlar için, hangi verilerin toplanacağını, verilerin nasıl işleneceğini, çözümleme aşamasında amaca uygun olarak hangi teknik ya da tekniklerin kullanılacağını ve sonuçların nasıl yorumlanacağı konusunda araştırmacıya ışık tutmaktadır. Bu açıdan istatistik çeşitli bilim dallarındaki uygulamalı çalışmalarda yoğun bir biçimde kullanılmaktadır. Günümüzde hastaneler hizmet üreten işletmeler olarak değerlendirilmektedir. Bu amaçla işletme faaliyetlerinde istatistiksel tekniklerden yoğun bir biçimde yararlanılmaktadır. Örneğin; Hastane işletmesinin bütünü veya hastane bölümleri için faaliyetlerin planlanmasında, Üretilen veya satın alınan mal ve hizmetlerin kalitesi, miktarı, finansal değerler gibi işletme yönetimi için önem taşıyan değerlerin belirlenmesinde, Hasta memnuniyeti, çalışan personelin memnuniyeti veya tükenmişlik durumlarının tespiti, Planlanan hedeflere ulaşılıp ulaşılmadığının ortaya konulması ve bunların nedenlerini belirlemek üzere başvurulan denetim işlemlerinde istatistikten yararlanılmaktadır. Çalışma hayatında rasyonel hareket edebilmek için yöneticilerin yerel, ulusal ve uluslar arası istatistiklerden yararlanmaları kaçınılmaz olmaktadır. Ancak, bu anlamda yararlanılacak istatistiklerin tümünün hazır olarak bulunması mümkün gözükmemektedir. Bu durumda işletmelerin faaliyetleri için gerekli olan bazı istatistikleri kendi bünyesinde hazırlaması bir zorunluluktur. İşletmeler gerekli istatistikleri toplamanın yanında bunların değerlendirilmesi ve çözümlenmesi, ayrıca işletmeye özel istatistiksel araştırmaları yapmak üzere büyük ölçekli kuruluşlarda istatistik ve araştırma birimi kurulmaktadır. 4 TEMEL KAVRAMLAR Bu bölümde, istatistiğin öğrenilmesinde belirli bir temelin (alt yapının) oluşturulmasını sağlayacak bazı temel kavramlar açıklanacaktır. İstatistik öğrenilmek isteniyorsa öncelikle onun temel kavramları iyi bir biçimde öğrenilmelidir. Dolayısıyla istatistik öğreniminde temel kavramlar öğrenilmeden sayısal problemlere ve bunlardan elde edilen sonuçlara odaklanma bireyi yanılgıya düşürebilir. Birim ve Türleri Araştırmanın amacına uygun olarak incelenen ve hakkında bilgi edinilmek istenen yığın olayların her birine “birim” adı verilir. Birimler canlı veya cansız varlıklar olabileceği gibi ortaya çıkan durumlar (fiili olaylar) da olabilir. Canlı varlıklara insan, hayvan, bitki, cansız varlıklara bina, otomobil, aile, banka, işletme gibi sosyal bir kuruluş, fiili olaylara ise doğum, ameliyat, trafik kazası örnek olarak verilebilir. Birimler çeşitli açılardan sınıflandırılabilir. Bunlardan önemli görülen bazılarına aşağıda değinilecektir. Birimler öncelikle belirli bir maddi varlığa sahip olup olmamasına göre “maddi birim” veya “maddi olmayan birim” biçiminde sınıflandırılmaktadır. Bu sınıflama biçiminde birimlerin boyutlarının olup olmaması dikkate alınır. Maddi birim, elle tutulur ve gözle görülür, yani uzunluk, genişlik ve yükseklik boyutlarına sahip olan birimlerdir. Maddi olmayan birim ise boyutları olmayan birimlerdir. Örneğin, insan, bitki, bina v.b. birimler maddi, doğum, ölüm, hastalık, bir ilaç denemesi gibi birimler maddi olmayan birimlerdir. Birimleri incelendikleri zaman diliminde hazır oluş durumlarına göre de sınıflandırmak mümkündür. Ömür süreleri oldukça uzun olan, dolayısıyla herhangi bir anda incelenebilecek durumdaki birimler “devamlı birim”, çok kısa bir ömür süresine sahip, dolayısıyla ortaya çıktığı anda incelenebilecek birimler “ani birim” olarak sınıflandırılır. Genel olarak maddi birimler aynı zamanda devamlı birimler, maddi olmayan birimler ise ani birimler niteliğindedir. Birimlerin sınıflandırılmasında “doğal birim” ve “doğal olmayan birim” biçiminde bir ayrım da yapılmaktadır. Doğal birim, parçalara ayrıldığında veya birleştirildiğinde birim olma özelliklerini yitiren birimlerdir. Örneğin, deneysel bir çalışmada denek olarak kullanılan bir farenin ikiye bölünmesi durumunda iki canlı fare oluşmaz. Benzer biçimde otomobil, bina doğal birime örnek olarak verilebilir. Doğal olmayan birim ise bir bütün olma niteliğinde olmayan, dolayısıyla parçalandığında ya da birleştirildiğinde birim olma niteliğini koruyan birimlerdir. Bu durumda birimlerin sadece büyüklükleri değişmektedir. Örneğin, deneysel bir çalışmada büyük hacimli bir sıvı daha küçük miktarlara ayrılarak denemede birim olarak kullanılabilir. Bir arazi parçası daha küçük parsellere ayrılarak tarımsal denemelerde birim olarak kullanılabilmektedir. Verilen iki örnekte de birimler aynı araştırma düzeninde parçalandıklarında veya birleştirildiklerinde birim olma niteliğini kaybetmezler. Bir başka sınıflandırmada birimler “gerçek birim” ve “varsayımsal birim” biçiminde iki kategoriye ayrılabilir. Gerçekte somut olarak var olan birimler gerçek birim, buna karşılık fiili olarak var olmayan ancak kuramsal olarak var olacağı düşünülebilen birimler varsayımsal birim olarak nitelendirilirler. Gerçek birimlerin maddi bir varlığa sahip olması gerekliliği yoktur. Maddi olmayan birimler de gerçek birim olabilir. Ayrıca doğal veya doğal olmayan birimler de gerçek birimdir. İstatistiğin konusu olan “birim” kavramını açıklayınız. Her olay istatistiğe konu olur mu? Ana kütle (Popülâsyon) ve Örneklem Üzerinde araştırma yapmak amacıyla hakkında bilgi elde edinilmek istenen ve belirli bir tanıma uyan, yani yığın olay niteliğindeki birimlerin tamamının oluşturduğu topluluğa “ana kütle” adı verilmektedir. Ana kütleyi oluşturan birimlerin aralarında farklılıklar olmakla birlikte biçimsel homojenlik açısından bazı ortak özellikleri bulunmalıdır. Ekonomik, zaman kısıtı, deneysel çalışmalarda birimlerin deforme 5 olması v.b. nedenlerden dolayı her araştırmada hedeflenen ana kütleyi oluşturan birimlerin tamamı incelenemez. Böyle durumlarda gözlemlemek üzere ana kütleden tesadüfî olarak seçilen birimlerden oluşan ve ana kütlenin doğal bir parçası olan alt kütleye “örneklem” adı verilir. Ana kütle ve örneklem birimlerden oluştuğuna göre bu birimlerden ayrı bir yapıya sahip olmaması gerekir. Örneğin bir üniversitenin çeşitli bölümleri birim olarak tanımlandığında üniversite ana kütle olarak ifade edilemez. Sözü edilen bölümlerin oluşturduğu topluluk ana kütledir. Ana kütle ve örneklemi oluşturan birimlerin zaman ve mekân bakımından sınırlandırılması zorunluluğu vardır. Araştırmanın amacına uygun olarak belirli bir tanıma uyan belirli bir mekândaki (hastane, şehir, bölge, ülke v.b.) birimler ile ilgilenildiğinde kütle mekân bakımından, benzer biçimde belirli bir zaman noktası veya zaman aralığındaki (gün, hafta, ay, yıl v.b.) birimler ile ilgilenildiğinde ise kütle zaman bakımından sınırlandırılmış olur. Örneğin, 2011 yılı Mart ayında Eskişehir’deki özel hastanelere başvuran hastaların oluşturduğu kütle zaman ve mekân bakımından sınırlandırılmıştır. Böylece hedeflenen kütle net olarak belirtilmiş olur. Değişken ve Türleri İncelenen birimlerin sahip olduğu ve birimden birime farklı değerler alabilen, dolayısıyla birimlerin ayırt edilmesini sağlayan niteliklerine “değişken” adı verilir. Örneğin, insanlar için yaş, cinsiyet, öğrenim durumu, medeni durum, bir bina için inşaat türü, oda sayısı, kullanım alanı, bir hastane işletmesi için yatak sayısı, hizmet verdiği servisler, doktor sayısı v.b. değişken olarak sayılabilir. Bir değişken kütleyi oluşturan birimlerde çeşitli biçimlerde ortaya çıkabilir. Belirli bir değişkenin birimlerde ortaya çıkış biçimine “düzey” adı verilir. Düzeyler araştırma için verileri (gözlem değerleri, ölçüm sonuçları) oluşturur. Bu anlamda değişken, birimler topluluğunu veriler topluluğuna dönüştüren bir işleve sahiptir. Değişkenler çeşitli açılardan sınıflandırılabilirler. Bu sınıflandırma biçimleri bir araştırmanın istatistiksel olarak tanımlanmasında ele alınacak değişkenlerin belirlenmesinde yararlı olmaktadır. Sayısal ve Sayısal Olmayan Değişken Düzeyleri sayılarla ifade edilebilen ve matematiksel işlemlere elverişli olan değişkenlere sayısal (nicel) değişken adı verilir. Matematiksel işlemlere elverişlilik, incelenen değişkene ilişkin elde edilen veriler üzerinde aritmetik işlemlerin bir anlam ifade etmesidir. Örneğin yaş, boy uzunluğu, ağırlık, işletmenin geliri, yatan hastaların yatış süresi sayısal değişkenlerdir. Sayısal değişkenler ayrıca “sürekli sayısal değişken” ve kesikli sayısal değişken” olmak üzere iki gruba ayrılabilir. Sayısal bir değişkenin herhangi iki düzeyi arasına düşünsel olarak sonsuz sayıda yeni düzey ilave edilebiliyorsa sürekli, sınırlı sayıda yeni düzey ilave edilebiliyorsa kesikli sayısal değişken söz konusu olur. Örneğin ağırlık değişkeninin iki düzeyi arasına sonsuz sayıda yeni düzey getirilebilir, ancak ailedeki çocuk sayısı değişkeninin iki düzeyi arasına sınırlı sayıda düzey ilave edilebilir. Buna göre ağırlık sürekli, çocuk sayısı kesikli sayısal değişkendir. Düzeyleri sözcüklerle ifade edilebilen ya da sayılarla ifade edilse bile matematiksel işlemlere elverişli olmayan değişkenler sayısal olmayan (nitel) değişken olarak adlandırılır. Cinsiyet, medeni durum, hastaların yattığı servis türü, hastanın mesleği değişkenleri sayısal olmayan değişkene örnek olarak verilebilir. Bağımsız, Bağımlı ve Kontrol Edilecek Değişken Araştırmalarda ele alınan problemler genellikle çok değişkenli yapıdadır. Dolayısıyla bazı araştırmaların amacı değişkenler arasındaki nedensellik (sebep-sonuç) ilişkisini belirlemek olabilir. Değişkenler bu tür bir araştırmada üstlendikleri işlevlere göre bağımsız, bağımlı ve kontrol edilecek (etkisi arındırılacak) değişken olarak üç grupta toplanabilir. Bağımlı (açıklanan) değişken, bir araştırmada özellikle inceleme konusu olan ve başka değişken ya da değişkenler tarafından açıklanan değişkendir. Bağımsız (açıklayıcı) değişken ise bağımlı değişken üzerinde etkisi araştırılan değişkendir. Bir araştırmada bağımlı ve bağımsız değişkenler üzerinde etkili olabilecek bazı değişkenler bulunabilir. Bağımlı ve bağımsız değişkenler 6 arasındaki salt ilişkiyi ortaya koyabilmek bakımından bu tür değişkenlerin kontrol altına alınması ya da etkilerinin giderilmesi gerekebilir. Bu tür değişkenler kontrol edilecek (etkisi arındırılacak) değişken olarak ifade edilir. Bir araştırmada herhangi bir değişkenin bağımsız, bağımlı ya da kontrol edilecek değişken işlevini üstlenmesi araştırmanın amacı ile ilgilidir. Başka bir anlatımla, bir değişken belirli bir araştırmada bağımsız değişken işlevi görürken başka bir araştırmada araştırmanın amacına uygun olarak bağımlı ya da kontrol edilecek değişken işlevini üstlenebilir. Değişken nedir? Sayısal ve sayısal olmayan değişkeni açıklayınız, matematiksel işlemlere elverişliliğini değerlendiriniz. Değişkenin Ölçülmesi ve Ölçekler Bir araştırmada ele alınan belirli bir değişkenin birimlerde ortaya çıkış biçimi olan düzeyler değişkenin ölçülmesiyle belirlenebilir. Ölçme, herhangi bir değişkene ilişkin gözlem sonuçlarının sayı ve simgelerle gösterilmesidir. Birimlerin ele alınan değişken ya da değişkenlerin hangi düzeyine karşılık olduklarının ölçme yoluyla belirlenmesi sonucu sayısal ve sayısal olmayan değerlere ulaşılır. Bilimsel araştırmalarda bu değerler veri (gözlem değeri) olarak isimlendirilir. Bu verilerden yararlanılarak kullanılacak çözümleme tekniklerinin belirlenmesinde değişkenlerin ölçme düzeyi olarak ifade edilebilecek ölçekler önemli rol oynarlar. İstatistiksel araştırmalarda değişkenlere ilişkin elde edilen verilerin matematiksel özelliklerine göre sınıflayıcı, sıralayıcı, aralıklı ve oranlı olmak üzere dört ölçek kullanılmaktadır. Bu ölçekler izleyen alt kesimlerde incelenecektir. Sınıflayıcı Ölçek Sınıflayıcı ölçek, incelenen değişken bakımından birimlerin eşdeğer olup olmadıklarını ortaya koyan ölçme düzeyidir. Bu ölçekte incelenen değişken bakımından benzer birimlere diğer birimlerden ayırmak için aynı simge verilir. Bu simgeler sayılar olsa bile bunlar sadece birimlerin hangi sınıfa (kategoriye) ait olduklarını belirler. Örneğin bir hastaneye başvuranların meslek bakımından incelenmesiyle çeşitli meslek sınıflarına ayrılması ve her bir sınıfın da bir sayı veya simgeyle gösterilmesi durumunda sınıflayıcı ölçek söz konusu olur. Sınıflayıcı ölçekte gözlem sonuçlarıyla sadece birimlerin sınıflandırılması işlemi yapılabilir. Buna karşın sıralama ve aritmetik işlemler yapılamaz. Sınıflayıcı ölçekle ölçülebilen değişkenlere ilişkin cinsiyet, medeni durum, hastanın yattığı servis, hastane türü v.b. örnek olarak verilebilir. Sıralayıcı Ölçek Sıralayıcı ölçek ele alınan birimlerin incelenen değişken bakımından sınıflandırılması yanında önem sıralarını da belirleyen ölçektir. Bu ölçekte gözlem sonuçları sayı ile ifade edildiğinde bunlar sıra sayılarıdır. Örneğin bir yerleşim yerinde en çok tercih edilen hastaneye “1.”, ondan sonra tercih edilene “2.”, … sıra sayılarının verilmesiyle tercih sırasının oluşturulması durumunda sıralayıcı ölçek söz konusu olur. Burada sayıların sırasının bir anlamı olmakla birlikte, bunlar arasındaki farkın bir anlamı yoktur. Başka bir anlatımla sıralayıcı ölçekte gözlem sonuçlarıyla sınıflama ve sıralama işlemleri yapılabilirken aritmetik işlemler yapılamaz. Sıralayıcı ölçekle ölçülebilen değişkenlere öğrenim düzeyi, ordu ve emniyet mensuplarının rütbeleri, başarı düzeyi örnek olarak verilebilir. Aralıklı Ölçek Aralıklı ölçekte değişkenler için elde edilen gözlem değerleri sayılarla ifade edilirler ve bunlar arasındaki farklar bir anlam taşımaktadır. Ele alınan bir değişkenin aralıklı ölçekle ölçülebilmesi için bir ölçü biriminin tanımlanması gerekir. Ayrıca aralıklı ölçme düzeyinde gözlem değerleri için bir başlangıç noktasının belirlenmesi gerekir. Örneğin sıcaklık değişkenini incelediğimizde gözlem değerleri 150C, 200C, 300C gibi ölçü birimi ile birlikte ifade edilir. Ayrıca 00C değeri -17,780F değerine karşılık 7 gelmektedir. Burada farklı ölçü birimlerinde farklı değerler elde edilmektedir. Aralıklı ölçekte sıfır değeri bir anlam ifade eder, yani yokluk anlamına gelmez. Aralıklı ölçekle ölçülebilen değişkenler için elde edilen gözlem sonuçlarıyla sınıflama, sıralama ve aritmetik işlemler yapılabilir. Ancak herhangi iki değer arasındaki farkın bir anlamı varken iki değer arasındaki kattan söz edilemez. Aralıklı ölçekle ölçülebilen değişkenlere takvim zamanı, başarı örnek olarak verilebilir. Oranlı Ölçek Oranlı ölçekte aralıklı ölçeğin özellikleriyle birlikte sıfır değerinin bir başlangıç değeri olması söz konusudur. Buna bağlı olarak sıfır değeri yokluk anlamı ifade eder ve herhangi iki değer arasındaki katın (veya oranın) bir anlamı vardır. Bu ölçme düzeyinde ölçülebilen değişkenlere ilişkin elde edilen gözlem değerleriyle sınıflama, sıralama ve aritmetik işlemler yapılabilir. Örneğin ağırlık değişkeni için elde edilen değerler yardımıyla birimler 50 kg’dan az ve 50 kg ve daha fazla biçiminde sınıflandırılabilir. Ayrıca gözlem değerleri en küçük değerden en büyüğüne doğru sıralandığında birimler de ağırlık sırasına konmuş olur. Herhangi iki birime ilişkin ağırlık değerleri arasında 10 kg’lık bir fark olduğunu ve bir birimin diğerinin iki katı ağırlığa sahip olduğunu söyleyebiliriz. Oranlı ölçekle ölçülebilecek değişkenlere örnek olarak boy uzunluğu, hastane işletmesinin geliri, yatan hasta sayısı, yatış süresi verilebilir. Ölçekler arasında sınıflayıcıdan oranlıya doğru geçiş söz konusu değildir. Buna karşın oranlıdan başlayarak sınıflayıcı ölçeğe doğru geçiş yapılabilir, ancak bu durum bilgi kaybına neden olur. Bir araştırmanın amacına uygun olarak ele alınan herhangi bir değişkenin hangi ölçme düzeyinde ölçülebileceğini belirleyebilmek için aşağıdaki sorulardan yararlanabiliriz. a) Gözlem değerlerinin sırasının anlamı var mı? b) Gözlem değerleri arasında farkın anlamı var mı? c) Gözlem değerleri arasında katın anlamı var mı? Ölçeklerin yukarıdaki sorulara verecekleri cevaplar dikkate alınarak aşağıdaki karar tablosu oluşturulabilir. Tablo 1.1: Ölçek Türü Belirlemede Karar Tablosu Gözlem değerlerinin sırasının anlamı var mı? Gözlem değerleri arasında farkın anlamı var mı? Gözlem değerleri arasında katın anlamı var mı? Sınıflayıcı Hayır Hayır Hayır Sıralayıcı Evet Hayır Hayır Aralıklı Evet Evet Hayır Oranlı Evet Evet Evet Ölçek Türü Verilerin elde edilmesinde kullanılan ölçeklerin önemi, istatistiksel çözümlemede kullanılacak teknik seçiminde ortaya çıkmaktadır. Sayısal değişkenler oranlı ve aralıklı ölçme düzeyinde, buna karşın sayısal olmayan değişkenler ise sıralayıcı ve sınıflayıcı ölçekle ölçülebilmektedir. Dolayısıyla sınıflayıcı ve sıralayıcı ölçekle elde edilen veriler “parametrik olmayan”, aralıklı ve oranlı ölçekle elde edilen veriler hem “parametrik” hem de “parametrik olmayan” tekniklerden yararlanılarak çözümlenebilir. Ancak parametrik olmayan tekniklerin kullanımı bilgi kaybına neden olabilir. Özet olarak, sayılarla ifade edilen her veri her türlü istatistiksel işlem ve çözümlemeye elverişli değildir. Bu nedenle, incelenen değişkene ilişkin elde edilen verilerin hangi ölçekle ölçülmüş oldukları bilinmeli ve yeri geldiğinde hatırlanmalıdır. 8 Ölçek türlerini kısaca açıklayınız. Çözümleme tekniğinin seçimi açısından önemini açıklayınız. Likert Ölçeği Sosyal bilimlerde bireylerin duyguları, düşünceleri, tutumları, beğeni düzeyleri, kaygıları ile ilgili veriler anket yoluyla toplanmaktadır. Buna bağlı olarak elde edilen veriler genellikle sınıflayıcı ve sıralayıcı ölçme düzeyinde olmaktadır. Likert ölçeği, insanların belirli bir konudaki tavırlarını ölçmek amacıyla geliştirilmiş bir yaklaşımdır. Likert ölçeğinin oluşturulmasında yanıtlayıcılara belirli bir konuya ilişkin çeşitli ifadeler (maddeler) sunulur ve bunlara karşı tavırlarını ifade eden seçeneği işaretlemeleri istenir. Örneğin, hasta memnuniyetinin belirlenmesine ilişkin bir araştırmada “hemşirelik hizmetleri yeterlidir”, “hastanenin genel temizliği iyidir”, “doktorum hastalığım konusunda doğruları söyler” biçimindeki ifadeler için yanıtlayıcının ifadelere katılma derecesi genellikle 5’li ölçekle “kesinlikle katılmıyorum” ile “kesinlikle katılıyorum” arasında seçenekleri işaretlemesi biçiminde belirlenir. Yanıtlayıcının bu biçimdeki çok sayıda soruya verdikleri cevaplardan hareketle toplam skoru hesaplanabilir. Ancak soruların oluşturulmasında farklı tavırları ortaya çıkarmada geçerli ve güvenilir olduklarının belirlenmesi gerekir. Bu amaçla çeşitli yaklaşımlardan yararlanılmaktadır. Örneğin; Bir hastane yöneticisi hastaneden hizmet alan kişilerin hizmetlere göre memnuniyetlerini belirlemek istemektedir. Bu amaçla Likert ölçeği ile hazırlanan tutum ifadeleri Tablo 1.1’de örnek olarak verilmiştir. Tablo 1.1: Hastane Memnuniyetinin Belirlenmesi Amacıyla Likert Ölçeği Örneği 9 Özet Değişkenlerin birimlerdeki ortaya çıkış biçimine düzey adı verilir. Düzeyler verileri oluştururlar. Değişkenlerin ölçülmesinde istatistikte ölçek olarak adlandırılan dört ölçme düzeyinden yararlanılır. Bunlar sınıflayıcı, sıralayıcı, aralıklı ve oranlı ölçektir. İstatistik kelimesi değişik anlamlarda kullanılmaktadır. Belirli amaçlar için kişi ve kuruluşlar tarafından toplanan verileri belirtmek için istatistikler kelimesi kullanılmaktadır. İkinci anlamda istatistik, yöntembilimi açısından verilerin elde edilmesi, düzenlenmesi, belirli değerlerle özetlenmesi ve çözümlenmesi işlemlerinin gerçekleştirildiği teknikler bütününü ifade eder. Üçüncü anlamda istatistik, ana kütle olarak adlandırılan kütleye ilişkin parametreleri tahmin etmek amacıyla örneklemden hesaplanan özetleyici bilgileri ifade eder. Bir araştırma probleminin çözümlenmesinde kullanılacak tekniğin seçiminde değişkenlerin hangi ölçekle ölçülebileceğinin belirlenmesi önemlidir. Sınıflayıcı ve sıralayıcı ölçekle ölçülebilen değişkenlerden elde edilen verilerle parametrik olmayan tekniklerden, aralıklı ve oranlı ölçekteki verilerle hem parametrik olmayan hem de parametrik tekniklerden yararlanılabilir. İstatistik yığın olayları ve bunların oluşturduğu kütleleri inceler. İstatistik, yığın olayları incelemek suretiyle verilerin elde edilmesini, düzenlenmesini, özetlenmesini, çeşitli tekniklerle çözümlenmesini ve elde edilen sonuçların yarara sunulmasını mümkün kılan teknikler bütünüdür. Hakkında bilgi edinilmek istenen birimlerin tamamının oluşturduğu topluluk ana kütle, bu ana kütleden çekilen ve ana kütleyi araştırmanın amacına uygun olarak temsil eden alt kütleye örneklem adı verilir. İstatistiğin betimleme ve çıkarsama olmak üzere en genel olarak iki işlevi vardır. Betimsel istatistik, elde edilen verilerin sayısal ve grafiksel yaklaşımlarla özetler ve sunar. Çıkarsamalı istatistik, bir ana kütleden tesadüfî olarak seçilen örneklem yardımıyla ana kütle parametrelerine ilişkin kestirim, hipotez testleri ve gelecek dönemlere ilişkin öngörüler yapar. Hakkında bilgi edinilmek istenen birimlerin sahip olduğu ve birimden birime farklı değerler alabilen niteliklere değişken adı verilir. Değişkenler çeşitli açılardan sınıflandırılırlar. Değişkenler sayılarla ifade edildiklerinde ve sayıların aritmetik işlemlere elverişli olmaları durumunda sayısal değişken, sayılarla ifade edilemediği durumda ise sayısal olmayan değişken olarak ifade edilirler. Sayısal değişkenler ayrıca sürekli ve kesikli olmak üzere iki sınıfta toplanır. Değişkenler ayrıca bir araştırmada üstlendikleri işlevler açısından bağımlı, bağımsız ve kontrol edilecek değişken biçiminde üç sınıfa ayrılır. 10 Kendimizi Sınayalım 1. Aşağıdaki değişkendir? değişkenlerden hangisi 6. nicel Aşağıdakilerden hangisi ani birim değildir? a. Doğum a. Cinsiyet b. Grev b. Yaş c. Ölüm c. Öğrenim durumu d. Ameliyat d. Meslek e. Doktor e. Medeni durum 7. Aralıklı ölçekle elde edilen verilerle hangi işlem sonucu anlamlı olmaz? 2. Değişkenlerin ortaya çıkış biçimine ne ad verilir? a. Sınıflama a. Birim b. Sıralama b. Kütle c. Toplama c. Düzey d. İki değer arası fark d. Örneklem e. İki değer arası oran 8. e. Ölçek 3. Aşağıdakilerden kullanılmaz? hangisi birim Aşağıdaki ifadelerden hangisi doğrudur? a. İstatistik yığın olayları inceler olarak b. Aralıklı ölçekte sıfır değeri yokluk ifade eder c. Doğal birimler parçalandığında birim olma özelliğini yitirmez a. Bina b. Öğrenci d. Bağımsız değişken açıklanan değişkendir c. Hastane e. Tipik olaylar istatistiğin konusudur d. Renk 9. Ölçekler ile ilgili aşağıdaki ifadelerden hangisi yanlıştır? e. Trafik kazası a. Sınıflayıcı ölçekle elde edilen verilerle sıralama yapılabilir 4. Araştırma amacına uygun olarak hakkında bilgi edinilmek istenen birimlerin tamamının oluşturduğu kütle hangisidir? b. Sıralayıcı ölçekle elde edilen verilerle sıralama yapılabilir a. Ana kütle c. Aralıklı ölçekle elde edilen verilerle sıralama yapılabilir b. Grup c. Yığın d. Oranlı ölçekle elde edilen verilerle sıralama yapılabilir d. Örneklem e. Aralıklı ve oranlı ölçekle elde edilen verilerle sınıflama yapılabilir e. Üniversite 5. Aşağıdaki değişkenlerden hangisi aralıklı ölçekle ölçülebilir? 10. Aşağıdakilerden değişken değildir? a. Hastalık türü hangisi a. Hastanenin yatak kapasitesi b. Sıcaklık b. Yatan hasta sayısı c. Ağırlık c. Çocuk sayısı d. Göz rengi d. Doğum ağırlığı e. Gelir e. Doktor sayısı 11 kesikli sayısal istatistiğin konusu olabilmesi için “yığın (yığın) olay” niteliğinde olması gerekir. Dolayısıyla istatistik her olayla ilgilenmez. Kendimizi Sınayalım Yanıt Anahtarı 1. b Yanıtınız yanlış ise “Değişken ve Türleri” başlıklı konuyu yeniden gözden geçiriniz. Sıra Sizde 3 İncelenen birimlerin sahip olduğu ve birimden birime farklı değerler alabilen, dolayısıyla birimlerin ayırt edilmesini sağlayan niteliklerine “değişken” adı verilir. Düzeyleri sayılarla ifade edilebilen ve matematiksel işlemlere elverişli olan değişkenlere sayısal (nicel) değişken adı verilir. Düzeyleri sözcüklerle ifade edilebilen ya da sayılarla ifade edilse bile matematiksel işlemlere elverişli olmayan değişkenler sayısal olmayan (nitel) değişken olarak adlandırılır. 2. c Yanıtınız yanlış ise “Değişken ve Türleri” başlıklı konuyu yeniden gözden geçiriniz. 3. d Yanıtınız yanlış ise “Birim ve Türleri” başlıklı konuyu yeniden gözden geçiriniz. 4. a Yanıtınız yanlış ise “Ana kütle ve Örneklem” başlıklı konuyu yeniden gözden geçiriniz. 5. b Yanıtınız yanlış ise “Değişken ve Türleri ile Değişkenin Ölçülmesi ve Ölçekler” başlıklı konuyu yeniden gözden geçiriniz. Sıra Sizde 4 6. e Yanıtınız yanlış ise “Birim ve Türleri” başlıklı konuyu yeniden gözden geçiriniz. Sınıflayıcı ölçek, incelenen değişken bakımından birimlerin eşdeğer olup olmadıklarını ortaya koyan ölçme düzeyidir. Sıralayıcı ölçek ele alınan birimlerin incelenen değişken bakımından sınıflandırılması yanında önem sıralarını da belirleyen ölçektir. Bu ölçekte gözlem sonuçları sayı ile ifade edildiğinde bunlar sıra sayılarıdır. Aralıklı ölçekte değişkenler için elde edilen gözlem değerleri sayılarla ifade edilirler ve bunlar arasındaki farklar bir anlam taşımaktadır. Ele alınan bir değişkenin aralıklı ölçekle ölçülebilmesi için bir ölçü biriminin tanımlanması gerekir. Oranlı ölçekte aralıklı ölçeğin özellikleriyle birlikte sıfır değerinin bir başlangıç değeri olması söz konusudur. Buna bağlı olarak sıfır değeri yokluk anlamı ifade eder ve herhangi iki değer arasındaki katın (veya oranın) bir anlamı vardır. Bir araştırma probleminin çözümlenmesinde kullanılacak tekniğin seçiminde değişkenlerin hangi ölçekle ölçülebileceğinin belirlenmesi önemlidir. Sınıflayıcı ve sıralayıcı ölçekle ölçülebilen değişkenlerden elde edilen verilerle parametrik olmayan tekniklerden, aralıklı ve oranlı ölçekteki verilerle hem parametrik olmayan hem de parametrik tekniklerden yararlanılabilir. 7. e Yanıtınız yanlış ise “Değişkenin Ölçülmesi ve Ölçekler” başlıklı konuyu yeniden gözden geçiriniz. 8. a Yanıtınız yanlış ise “Temel Kavramlar” başlıklı konuyu yeniden gözden geçiriniz. 9. a Yanıtınız yanlış ise “Değişkenin Ölçülmesi ve Ölçekler” başlıklı konuyu yeniden gözden geçiriniz. 10. d Yanıtınız yanlış ise “Değişken ve Türleri” başlıklı konuyu yeniden gözden geçiriniz. Sıra Sizde Yanıt Anahtarı Sıra Sizde 1 İstatistik, belirli bir amaca yönelik veri elde etme (derleme), elde edilen verileri işleme, özetleme, çözümleme ve elde edilen sonuçları yorumlama işlemlerinin gerçekleştirildiği teknikler bilimidir. İstatistiğin betimleme ve çıkarsama olmak üzere en genel olarak iki işlevi vardır. Betimsel istatistik, elde edilen verilerin sayısal ve grafiksel yaklaşımlarla özetler ve sunar. Çıkarsamalı istatistik, bir ana kütleden tesadüfi olarak seçilen örneklem yardımıyla ana kütle parametrelerine ilişkin kestirim, hipotez testleri ve gelecek dönemlere ilişkin öngörüler yapar. Sıra Sizde 2 Araştırmanın amacına uygun olarak incelenen ve hakkında bilgi edinilmek istenen yığın olayların her birine “birim” adı verilir. Ancak birimlerin 12 Yararlanılan Kaynaklar Çömlekçi, N. (1998). Temel İstatistik İlke ve Teknikleri. İstanbul: Bilim Teknik Yayınevi. Çömlekçi, N. (1998). Bilimsel Araştırma Yöntemi ve İstatistiksel Anlamlılık Sınamaları. İstanbul: Bilim Teknik Yayınevi. Gürsakal, N. (2007). Betimsel İstanbul: Nobel Yayın Dağıtım. İstatistik, Serper, Ö (2004). Uygulamalı İstatistik 1, Bursa: Ezgi Kitabevi. 13 2 Amaçlarımız Bu üniteyi tamamladıktan sonra; İstatistiksel bir araştırmada verilerin nasıl derleneceğini açıklayabilecek, Derleme türlerini ifade edebilecek, Veri toplama tekniklerini sıralayabilecek, Verileri tablo ve grafiklerle gösterebilecek, bilgi ve becerilere sahip olabilirsiniz. Anahtar Kavramlar Veri Anket Derleme Tablo Derleme Türleri Grafik Veri Toplama Teknikleri Histogram Gözlem İçindekiler Giriş Veri ve Derleme Derleme Türleri Verinin Özellikleri Veri Toplama Teknikleri Tablolar Grafikler 14 Verilerin Derlenmesi, İşlenmesi ve Grafiklerle Gösterimi GİRİŞ Modern yaşamda karşılaşılan birçok sorunun çözümü için istatistiksel veriye ve istatistiksel çözümleme tekniklerine gereksinim vardır. İstatistiksel teknikleri öğrenmek kolaydır, zor olan doğru ve veri için uygun tekniğin doğru yerde kullanımıdır. Bu nedenle, yeni bilgilerin verilerin özenle derlenmesi, analiz edilmesi ve yorumlanmasıyla elde edilebileceğini dikkate alarak, maksimum bilginin mümkün olan en düşük maliyette sağlanabilmesi için verilerin derlenmesiyle ilgili kullanılacak tekniklerin seçiminde özenli davranılması gerekir. İstatistiksel bir araştırma; araştırma probleminin tanımlanması, verilerin derlenmesi, derlenen verilerin işlenmesi ve düzenlenmesi, verilerin belirli kurallar çerçevesinde gösterilmesi, analiz ve sonuçların yorumlanması aşamalarından oluşur. Araştırmanın en önemli basamaklarından biri olan veri derleme aşamasında hata yapıldığında, bundan sonraki tüm aşamalar zincirleme olarak bu hatalı durumdan etkileneceğinden, doğru ve güvenilir veri uygun veri derleme tekniği kullanılarak derlenmelidir. Sağlık kurumları yöneticileri, kurumlarının geçmiş ve bugünkü hizmet göstergelerini anlayarak kurumlarına ilişkin etkin planlamalar yapabilmesi için, öncelikle güvenilir verilere ve bu verileri değerlendirebilmek için de istatistiksel tekniklere ihtiyacı vardır. Sağlık kurumları yöneticileri açısından doğru verilerin derlenmesi, hizmetleri etkin ve uygun biçimde planlanarak doğru kararlar alınabilmesi için çok önemlidir. Bu ünitede verinin tanımı, veri derleme, verilerin sahip olması gereken özellikler, veri toplama teknikleri ve verilerin gösterimi konuları işlenecektir. VERİ VE DERLEME Bir problemi çözmek, bir olayı aydınlatmak ya da belli bir konuda planlama yapmak amacıyla; istatistik birimlerinin ilgilenilen değişken ya da değişkenler dikkate alınarak yapılan gözlem, ölçme ve sayma yoluyla elde edilen özelliklerine veri denmektedir. Veriler sayısal, sözel, simge ya da herhangi bir şekil ile gösterilebilir. Veriler, belirli bir amaca göre bir araya getirilip düzenlendikten sonra istatistiksel tekniklerle analiz edilmesi sonucu bilgiye dönüşür. Bilgi, çok sayıda rakam topluluğundan oluşan verinin istatistiksel teknikler kullanılarak daha az sayıda rakamla özetlenmesinden oluşur. Herhangi bir hastanede muayene olan hastaların aldıkları hizmetlerden memnuniyet düzeyleri; “memnun değilim, orta ve memnunum” cevapları veri, verilerin analizi sonucunda hastaların % 70’ inin memnun olduğu bulgusu ise bilgi olarak değerlendirilir. Bu örnekten de anlaşılabileceği gibi karar alma sürecinde bilgi, veriden daha değerlidir. Bu nedenle verinin bilgiye dönüştürülerek karar alıcıya sunulması gerekir. Bu dönüştürme işlemi de ancak istatistiksel tekniklerin kullanımıyla olabilir. Sağlık yöneticileri için veri kaynakları ölümler, doğumlar, hastalıklar ve sağlık hizmetleri konusunda sürekli olarak tutulan kayıtlar veya deneylerle saptanan veriler olabilir. İstatistikte toplanan ilk veriler ham veri olarak tanımlanır. Ham veriler üzerinde herhangi bir düzenleme ve işlem yapılmamış verilerdir. Veri derleme, derlenen verilerin düzenlenmesi ve sunulması bir araştırmanın ilk basamaklarını oluşturmaktadır. Veri derleme; belirlenen amaçlar doğrultusunda gözlenecek birimlerin ölçülmesi ya 15 da sayılması, sonra da bunların, ilgilenilen değişkenlere göre, hangi düzeylere sahip olduğunun belirlenmesi ve kaydedilmesi işlemlerini içermektedir. Derlemenin yapılabilmesi için derlemeye ilişkin konu ve gözlenecek birimlerin açık bir şekilde tanımlanması gerekir. Bir kütleyi oluşturan öğelere birim adı verilmektedir. Bir olayın birim olabilmesi için ölçülmeye ve sayılmaya uygun olması gerekir. Örneğin insan, evlilik, intihar, bekleme süresi, kırmızı ışık ihlali, hastane, hastalık gibi canlı ve cansız varlıklar ölçülmeye ve sayılmaya elverişleri olan istatistik birimleridir. Sayılmaya ve ölçülmeye uygun olmayan, kâbuslar, sevinçler ve rüyalar gibi olaylar istatistik açısından birim olamazlar. Gözlem birimlerinden meydana gelen kütlenin, zaman ve mekânın kesin olarak sınırlandırılmış olması gerekir. Araştırma nerede, ne zaman, kimlerle, ne kadar sürede tamamlanacağı ve ölçmenin nasıl yapılacağı bilinmelidir. Hastanede belli bir ameliyatı olmuş hastalar, bir hastalıktan dolayı yatan hastalar ya da meydana gelen bebek ölümlerine ilişkin derleme yapılacağı zaman kimlerin gözleneceği açıklanmış olmakla birlikte, ne zaman ve nerede gözleneceklerine dair sorular cevapsız kalmaktadır. Bu örnekteki belirsizliklerin giderilmesi için ana kütle zaman ve mekân bakımından tanımlanmalı ve sınırlandırılmalıdır. Verileri derlemeye başlamadan önce ana kütleyi zaman ve mekân bakımından sınırlandırarak tanımlayınız. Derleme Türleri Derlemeleri farklı kriterlere göre sınıflandırmak mümkündür. Derlemenin ilk sınıflandırılması verilerin elde ediliş biçimine göre doğrudan(dolaysız) ve dolaylı derlemedir. Araştırılması söz konusu olan ana kütle birimleri doğrudan gözlenip kayıt altına alınıyorsa doğrudan derleme, ilgilenilen ana kütle birimlerinin gözlenmesi yerine farklı bir ana kütlenin birimleri gözlenerek asıl ana kütle hakkında veri derlenmesi ise dolaylı derleme türü olarak tanımlanır. Nüfusun miktarı ve çeşitli niteliklere göre dağılımı belirlenmek istendiğinde doğrudan nüfusu oluşturan bireyler gözlemlendiğinden derleme doğrudandır. Buna karşılık, bir ülkede nüfusun miktarını bulmak için bu ülkedeki konutların sayısı belirlenebilir ki, bu dolaylı derlemedir. Böyle bir durumda asıl hakkında bilgi edinilmek istenen kütleye varabilmek için tahmin yapmak gerekir. Bu örnek için ülke nüfusu, konut sayısının bir konutta yaşayan ortalama kişi sayısı tahminiyle çarpılarak belirlenir. Dolaylı derleme ile elde edilen verilerin güvenirliği doğrudan derlemeye göre daha az olacağından uygulamalarda dolaylı derleme türü tercih edilmemektedir. Derleme genel ve kısmi olarak da sınıflandırılabilir. Bu sınıflandırma istatistiksel açıdan oldukça önemlidir. Ana kütleyi oluşturan birimlerin tamamının gözlenmesi genel derleme olarak tanımlanmaktadır. Nüfus sayımları genel derlemeye ilişkin en belirgin örnektir. Bazı durumlarda üzerinde araştırma yapılan ana kütlenin tamamının gözlenmesi maliyet, zaman ve işgücü açısından imkansızdır. Bu gibi durumlarda ana kütleyi oluşturan birimlerin tamamının gözlenmesi yerine olası gözlem birimlerinin bir bölümü seçilerek incelenir. Bu derleme türü kısmi derleme olarak tanımlanır. Genel derlemede ana kütleyi oluşturan bütün birimler-denekler gözlenirken kısmi derlemede ana kütle içinden tesadüfi bir örneklem seçilerek gözlem yapılır. Bundan dolayı genel derleme “tamsayım”, kısmi derleme ise “örnekleme” olarak da tanımlanmaktır. Doğu Anadolu Bölgesindeki yetişkinlerin beslenme alışkanlıklarının belirlenmesi için yürütülen bir araştırmada, söz konusu bölgedeki yetişkin bireylerin tamamı gözlendiğinde genel derleme, ancak bu bölgeden tesadüfî olarak seçilen 1000 kişinin gözlenmesi ise kısmi derlemeye örnektir. Derleme, derlemenin zamanına göre ani ya da devamlı olarak da sınıflandırılabilmektedir. Kütleyi oluşturan gözlem birimlerinin belli bir zaman aralığındaki durumlarının belirlenmesi için yapılan derleme ani derlemedir. Ani derlemede kütleyi oluşturan birimler devamlı birimlerdir. Bu birimler, tanımlanan bir zaman aralığında toplu halde var olan ve gözlenen birimlerdir. Nüfus, hastane, tarım ve sanayi işyeri sayımları ani derlemeye örnektir. Araştırılması söz konusu olayın gözlenmesi olay gerçekleştiği anda oluyorsa bu derleme devamlı derlemedir. Bu olaylar belli bir zaman aralığı boyunca meydana geldikçe kayıt altına alınmaktadırlar. Devamlı derlemede kütle ani birimlerden oluşmaktadır. Bu birimlerin belli bir zaman aralığında gözlenmeleri ve kaydedilmeleri gerekmektedir. Doğum, ölüm, 16 intihar, bir acil servise gelen hastaların yaralanma türü, evlenme ve bir hastanenin hasta hakları birimine gelen şikâyetler devamlı derlemeye örnek olarak gösterilebilir. Genel ve kısmi derleme kavramlarını örneklendirerek açıklayınız. Verinin Özellikleri Derlenen verilerden anlamlı sonuçlar çıkarabilmek için verinin taşıması gereken bazı özellikler vardır. Bu özellikler verinin yararlılık derecesinin belirlenmesini sağlamaktadır. Öncelikle bir veri doğru olmalı ve var olan durumu objektif bir biçimde yansıtmalıdır. Doğruluk, en basit tanımıyla gözlenen veya ölçülen bir olgunun gerçeği en yakın biçimde yansıtmasıdır. Bir hastanede yürütülen hasta memnuniyeti çalışmasında söz konusu hastanenin hizmetlerinden hiç faydalanmamış bir kişiye anket uygulayarak elde edilen verinin doğruluğu tartışmalıdır. “Hastane Afet Planı” na ilişkin eğitim almamış ve hiç tatbikata katılmamış yönetici hemşirelerin, deprem afet planları konusundaki görüşlerinden oluşan veriler var olan durumu objektif olarak yansıtmadığından doğru veri değildir. Verilerin taşıması gereken diğer bir özellik ise güvenilir olmasıdır. Güvenirlik aynı şeyin tekrarlamalı ölçme sonuçlarının birbirine yakın değerler almasıdır. Doğru veri aynı zamanda güvenilir veri olma özelliğini de taşımaktadır. Güvenilir bir verinin ise aynı zamanda doğru bir veri olduğu söylenemez. Bir veri güncel olmalıdır. Bir araştırmada derlenen veriler o zamana kadar olan durumu belirleyerek, geleceğe ilişkin tahminlerde bulunmak ve planlama yapmak için kullanılır. Verilerin gereksinimleri karşılayabilmesi ve onlardan yararlanılabilmesi için zamanında elde edilerek kullanıma sunulması gereklidir. Bir afet bölgesinde, risk gruplarının temel sağlık ihtiyaçlarına ilişkin verilerin afet durumu ortadan kalktıktan sonra ya da derleme işleminin çok uzun sürmesi durumunda veriler güncel olma özelliğini taşımayacaktır. Verinin taşıması gereken son özellik maliyettir. Verinin faydası derlenmesi için yapılan harcamadan daha yüksek olmalıdır. Verinin taşıması gereken dört özelliği açıklayınız. Veri Derleme Teknikleri Araştırma sorununun çözümlenebilmesi için gerekli olan veri farklı kaynaklardan sağlanabilir. İstatistik yayınları, dergiler, raporlar ve arşivler hazır veri kaynaklarıdır. Bir istatistiksel araştırmada hazır veri; iç veya dış kaynaklardan sağlanabilir. Örneğin bir hastanenin acil servisine gelen hastaların şikayet nedenlerini araştırmak isteyen bir yönetici gereksinim duyduğu verileri hastanenin kayıtlarından sağlayabilir, böyle bir araştırmada iç veri kaynağı kullanmış olacaktır. Çeşitli illerdeki özel hastanelerin yoğun bakım ünitelerinin kapasiteleri hakkında araştırma yapan yöneticinin yararlanacağı veriler, Sağlık Bakanlığı Sağlık İstatistikleri Yıllığından veya TSİM’ den (Temel Sağlık İstatistikleri Müdürlüğü) elde edilebilir. Bu yolla elde edilen veriler dış veri niteliğindedir. Sağlık alanında veri toplama teknikleri; sistematik veri toplama teknikleri ve özel veri toplama teknikleri olmak üzere iki başlık altında ele alınmaktadır. Sistematik veri derleme, istatistik birimlerinin çeşitli niteliklerine ait bilgilerin ortaya çıktığı yer ve zamanda belgelenerek kayıt altına alınmasıyla yapılır. Özel amaca yönelik verilerin toplanması için başvurulan teknikler ise özel veri toplama teknikleri olarak adlandırılır. Sistematik Veri Toplama Teknikleri Sağlık alanında kullanılan sistematik veri kaynakları, kayıtlar, sayımlar ve özel bildirimlerdir. Sistematik veri toplama tekniğinde hazır veri kaynaklarından faydalanılır. 17 Sağlık kayıtları; hasta ya da sağlıklı tüm bireylerin sağlık ve hastalıkla ilgili bilgileri ile sağlık yönetimiyle ilgili bilgilerin yazıldığı defter, kart, dosya, form ya da formlar topluluğudur. Doğum, ölüm ve hastalık kayıtları sağlık hizmetlerinin planlanmasında kullanılan en önemli veri kaynaklardır. Belirli zaman aralıklarında yapılan sayımlarla bölge ya da ülke hakkında bazı veriler derlenir. Genel nüfus sayımı en önemli veri derleme tekniğidir. Nüfus sayımı; bir ülkede veya herhangi bir toplumda belirli bir zaman kesitinde yaşayanların sayısını, niteliklerini saptamak amacıyla yapılan sayımlardır. Özel bildirimler; sağlık kurum ve kuruluşları ile sağlık personelinin bazı sağlık olaylarını (doğum, anne ölümleri, ölümler, bulaşıcı hastalıklar vb.) gözledikleri anda belirli süre içinde sağlık otoritelerine bildirmeyle elde edilen verilerdir. Bazı sağlık olayları sağlık bakanlığınca, bildirimi zorunlu olaylar ya da hastalıklar olarak tanımlanmıştır. Bu sağlık olayları gözlendiği an ya da her ayın sonunda ilgili birimlere bildirilmesi zorunludur. Sağlık Bakanlığı Sağlıkta Dönüşüm Programı kapsamında Bilgi İşlem Daire Başkanlığı sorumluluğunda yürütülen çalışmalarla, sağlık verilerinin ve temel süreçlerin standart hâle getirilmesi üzerinde yoğunlaşmaktadır. Sağlık alanından toplanan veriler, il sağlık müdürlükleri aracılığıyla elektronik ortamda sağlık bakanlığı veri sistemine aktarılmaktadır. Bakanlık sağlık hizmetlerini planlama, yürütme, değerlendirme ve denetim işlevlerinde bu verileri ölçü olarak kullanmaktadır. Sağlık bakanlığı; Sağlık-NET ile sağlık kurumlarında üretilen her türlü veriyi, doğrudan üretildikleri yerden, standartlara uygun şekilde toplamayı, toplanan verilerden tüm paydaşlar için uygun bilgiler üreterek sağlık hizmetlerinde verim ve kaliteyi artırmayı hedefleyen, entegre, güvenli, hızlı ve genişleyebilen bir bilgi ve iletişim platformu kurmayı amaçlamaktadır. http://www.sagliknet.saglik.gov.tr/ Sağlık Bakanlığı Tedavi Hizmetleri Genel Müdürlüğü tarafından “Çekirdek Kaynak Yönetim Sistemi” ile toplanan veriler hazır veri kaynakları için önemli örneklerden biridir. Sağlık Bakanlığı “Çekirdek Kaynak Yönetim Sistemi” ile standart olarak geliştirilmiş formlara uygun olarak kayıtlar yapılmaktadır. İlgili birimlerin sağlıkla ilgili verileri kayıt altına alması sağlık bilgi kaynağını oluşturmaktadır. TC. Sağlık Bakanlığı Tedavi Hizmetleri Genel Müdürlüğü: http://www.tedavi.saglik.gov.tr/ Sağlık Bakanlığının sahadan toplayacağı minimum içeriğe sahip veri grupları Minimum Veri Setleri (MVS) olarak adlandırılmaktadır. MVS ile şimdiye kadar kâğıt ortamda toplanan veriler, gelişen haberleşme ve bilişim teknolojisi altyapısını kullanarak daha hızlı ve doğru bir şekilde doğrudan verinin üretildiği bilgi sisteminden elektronik ortamda Sağlık Bakanlığına iletilebilmektedir. Sağlık Kurumları, veri setleri içerisinde yer alan veri elemanlarını kullandıkları bilgi sistemleri aracılığıyla veya Sağlık-NET portalı üzerindeki veri seti bildirim ekranları aracılığıyla Sağlık Bakanlığına iletilmektedir. Minimum Sağlık Veri Setleri (MSVS) ile başlangıçta büyük ölçüde sağlık verisi toplama amacıyla geliştirilen veri setlerine, idari ve mali veri setlerinin de eklenmesiyle daha kapsamlı bir yapı ortaya çıkartılması planlanmaktadır. Sağlık bakanlığı bünyesinde İdari Veri Setleri ve Mali Veri Setleri çalışmaları önümüzdeki dönemde yerine getirileceğe öngörülmektedir. İdari Veri Setleri, sağlık kurumlarının altyapı ve idari bilgilerini toplamayı hedeflerken; Mali Veri Setleri ise sağlık kurumlarının maliyet bilgilerini toplamayı hedeflemektedir. MSVS veri seti içerikleri Şekil 2.1’ de gösterilmiştir. 18 Şekil 2.1: Sağlık Bakanlığı Minimum Sağlık Veri Setleri Sağlık-NET bünyesinde Aralık 2011 tarihine kadar hazırlanmış olan Minimum Sağlık Veri Seti adedi 46 tanedir. Bu veri setlerinin listesine ve içeriklerine Ulusal Sağlık Veri Sözlüğü Web Browser üzerinden ulaşılabilmektedir. Veri setlerini ana gruplar halinde ifade etmek gerekirse 10 farklı veri seti grubundan bahsetmek mümkündür; Kayıt Veri Setleri Doğum-Ölüm Veri Setleri Bebek-Çocuk Veri Setleri Kadın Sağlığı Veri Setleri Bulaşıcı Hastalık Veri Setleri Muayene Grubu Veri Setleri Yatan Hasta Veri Setleri Kronik Hastalık Veri Setleri Organ ve Kök Hücre Nakil Veri Setleri Akıl ve Ruh Sağlığı Veri Setleri Sağlık Bakanlığının veri şeması Temel Sağlık İstatistikleri Müdürlüğü (TSİM), İnsan Kaynakları Yönetimi Sistemi (İKYS), Sağlık Kuruluşları Yönetim Sistemi (SKYS), Malzeme Kaynakları Yönetim Sistemi (MKYS) ve Çekirdek Kaynak Yönetim Sisteminden (ÇKYS) meydana gelmektedir. Veri şeması Şekil 2.2’de verilmiştir. Şekil 2.2: Sağlık Bakanlığı veri tabanı şeması 19 Sağlık Bakanlığı veri akış şeması ise Şekil 2.3’ te ayrıntılı olarak verilmiştir. Şekil 2.3 Sağlık Bakanlığı veri akış şeması http://www.istatistik.saglik.gov.tr Özel Veri Toplama Teknikleri Veri kaynakları çok çeşitli olmakla birlikte her zaman yeterli olmayabilir. Bazen gerekli olan veri, iç ve dış veri kaynaklarından elde edilemeyebilir. Bu gibi durumlarda yeni veri derlemek zorunlu hale gelir. İstatistiksel bir araştırmada, yeni veri derlemesine karar verildiğinde, öncelikle uygun veri derleme tekniğinin seçilmesi gerekir. Yürütülecek istatistiksel bir araştırma ister deneysel araştırma isterse de alan araştırması yöntemi olsun, kullanılacak özel veri toplama teknikleri; gözlem, görüşme, anket, taramalar ve muayenelerdir. İzleyen kısımda sözü edilen bu tekniklere yer verilecektir. Gözlem Tekniği Gözlem tekniği, veri derleme teknikleri arasında en yaygın olarak kullanılanıdır. Gözlem bakma ve dinleme olarak tanımlanabilir. Her araştırıcının dikkatli gözlemler yapabilmesi gerekir. Çok farklı şekillerde yapılabilen gözlem, özel veri derleme tekniklerinin hem en eskisi, hem en modern olanıdır. Gözlem tekniği laboratuvar deneylerinde kullanıldığı gibi, alan araştırması niteliğindeki araştırmalarda da kullanılabilir. Araştırmacı gözlemi, veri derleme tekniği olarak seçtiğinde, bu seçiminin araştırmasına sağlayacağı yarar ve sakıncaları dikkate almalıdır. Gözlem tekniğinin sağladığı yararlar; 1. Bu veri derleme tekniğinde ölçme işlemi ilgilenilen birim üzerinde doğrudan doğruya yapıldığı için, veri derlemesi sırasında “eksik hatırlama” veya “gerçeklerin çarpıtılması” gibi sorunlar ortaya çıkmaz. 2. Gözlem tekniği uygulanarak veriler oldukça uzun bir zaman aralığı boyunca sürekli olarak elde edilebilir. Gözlem tekniğinin sakıncaları ise; 1. Gözlem tekniğini benimseyen araştırmacı yanlı davranabilir, ilgilenilen değişken veya değişkenlere ilişkin ölçüm değerlerini doğru bir biçimde kaydetmeyebilir. 2. Gözlemi yapanlar yanlı davranabilecekleri gibi, gözlenenler de yanlı gözlemlere neden olabilirler. Gözlemi yapılan ve bunun farkında olan kişiler davranışlarını değiştirebilir. Böylece derlenen veriler yanlı olabilir. İstatistiksel bir araştırmada veri derleme tekniği olarak gözlem benimsendiğinde aynı zamanda gözlemlerin (derlenen verilerin) hangi koşullarda yapıldığı ve veri setinin sınırlılıkları da açıklanmış olur. 20 Görüşme Tekniği Görüşme tekniğiyle veri derlemede görüşmeci daha önce hazırlanmış olan soru kâğıdındaki soruları ilgiliye sorar, yanıtları da soru kâğıdında yanıtlara ayrılmış olan yerlere kaydeder. Görüşmeci ve yanıtlayıcı kişi arasındaki doğrudan ilişkiyle derlenen verilerin birtakım yararları olduğu gibi sakıncaları da olabilir; 1. Kendileriyle doğrudan ilişki kurulan kişiler, yöneltilen sorulara cevap verme eğilimindedir. Görüşülen kişilerin büyük bir bölümü yararlı yanıtlar verebilir. 2. Görüşme tekniği soruların yanlış anlaşılmasını engellerken, tamamlayıcı bir takım verilerin de derlenmesine imkân sağlayabilir. Veri derleme tekniği olarak görüşme seçildiğinde bazı sakıncalar ortaya çıkabilir; 1. Görüşmeci yanıtlayanların seçiminde objektif davranmayabilir. Bu durum verilerde bir yanlılığa neden olur. 2. Görüşmeci tutum ve davranışlarıyla yanıtlayanı etkileyebilir. 3. Görüşmeci yanıtları kaydetmede hatalar yapabilir. Anket Tekniği Anket tekniği doğrudan yanıtlayanın doldurması gereken bir soru kâğıdına dayandırılmış bir veri derleme tekniğidir. Anketler; yanıt ya da yanıtları yazmayı gerektiren açık uçlu sorulardan oluşabileceği gibi daha önceden belirlenmiş yanıt seçeneklerinden birini veya birkaçını işaretlemeyi gerektiren kapalı uçlu sorulardan oluşur. Soru kâğıdı yanıtlayıcıya posta veya başka bir şekilde kendisine ulaştırılır. Anket ile veri derlemenin yarar ve sakıncalar, görüşmecinin olmamasından kaynaklanabilir. Görüşme tekniğinde görüşmeci nedeniyle ortaya çıkan yanılgılar anket yoluyla veri derlemede ortadan kalkar; ancak bu defa da görüşmecinin olmaması nedeniyle bazı sorunlar ortaya çıkabilir: 1. Anket soruları bir kuruma veya bir aileye ulaştırıldığında, yanıtlayıcı konusunda bir denetim uygulanması söz konusu değildir. 2. Görüşmecinin olmaması nedeniyle yanıtlama oranının düşük düzeyde kalmasıyla karşılaşılabilir. Düşük yanıtlama oranı özellikle alan araştırmalarında yanlılığın ortaya çıkmasına neden olabilir. Taramalar Toplumda görülen veya görülebilecek sağlık olaylarının tespiti için çeşitli araştırmalar yapılır. Bu araştırmalarda özel veri derleme tekniği olarak taramalar kullanılır. Bulaşıcı hastalıkların tespitinde en çok kullanılan bu teknikte; 1. Risk altındaki grupların belirlenmesiyle araştırmanın sınırları çizilir, 2. Taramada kullanılacak teknik ve formlar tespit edilir, 3. Taramada görev alacak, yapılacak araştırma alanında eğitimli personel seçilir, 4. Tarama sonucu kullanılacak değerlendirme şekli belirlenir, 5. Değerlendirme sonucu rapor hâlinde sunulur. Muayeneler Toplumda görülen hastalıkların durumu ve seyrinin nasıl devam ettiğini tespit etmek için uygulanan veri toplama tekniğidir. Muayenede hangi tekniklerin uygulanacağı, hangi tetkiklerin yapılacağı ve bireylere hangi soruların sorulacağı önceden belirlenir. Yukarıda ifade edilen teknikler kullanılarak derlenen verilerin daha iyi anlaşılabilir duruma getirilebilmesi için tablolar veya grafikler şeklinde düzenlenmesi gerekir. Araştırmada ele alınan değişken türüne göre oluşturulan tablo ve grafikler izleyen kısımda aktarılacaktır. 21 Özel veri toplama teknikleri; gözlem, görüşme, anket, taramalar ve muayenelerdir. Sistematik veri derleme teknikleri nelerdir? Tablolar ve Grafikler İstatistiğin üç temel işlevi betimleme, çözümleme ve tahmindir. Betimleme işlevinin temel amacı istatistiksel verilerin özetlenerek en iyi şekilde kullanıma sunmaktır. Gözlenen veya kayıt altına alınan veriler başlangıçta anlaşılması zor karmaşık bir niteliktedir. Derleme sonucunda elde edilen istatistiksel veriler belli bir düzende olmayan niceliklerdir. Fişler, anketler veya listeler şeklinde toplanmış verilere bakarak ilk bakışta bir sonuç çıkarmak oldukça zordur. Belli bir niteliğe ilişkin toplanmış ham verilerin düzenlenerek sunulması gereklidir. Ham verilerin düzenlenmesi ve sunumu ele alınan verilerin niteliğine göre yapılmaktadır. Bundan dolayı veriler tablolar veya grafikler yardımıyla sunulabilir. Tablo, elde edilen sayısal veya sözel verilerin satır ve sütunler halinde düzenlenmiş halidir. Tablolar verilerin daha kolay anlaşılmasını sağlar. İstatistiksel verilerin sunulduğu tabloların üç temel özelliği: tablonun hangi bilgiyi içerdiğini gösterir bir başlığının, satır ve sütunlarının olmasıdır. Tablonun satır ve sütunlarında hangi bilgilerin temsil edildiği açık bir biçimde belirtilmelidir. Tablolarda sunulan bilgiler anlaşılabilir olmalı ve çok fazla bilgiyi aynı anda karmaşık olarak sunmamalıdır. Ayrıca tabloda kullanılan verilerin varsa ölçü birimi (TL, kg., saat, vb.) açık bir şekilde ifade edilmelidir. Verilerin daha anlaşılır bir şekilde sunumunu sağlayan diğer bir gösterim şekli ise grafiklerdir. Bir grafik kolayca anlaşılabilir ve çiziminin objektif olmasının yanı sıra konusunu açıklayan bir başlığa da sahip olmalıdır. Grafik çiziminde; histogram, çizgi grafiği, çubuk grafiği ve daire grafik gibi grafik türleri kullanılabilir. İstatistiksel verilerin sunulduğu tabloların üç temel özelliğini yazınız. Tablolar Nicel (sayısal) bir değişken (yaş, canlı doğum ağırlığı, kolesterol düzeyleri vb.) dikkate alınarak gözlem yapıldıysa, söz konusu bu gözlem değerleri belli bir sıraya göre dizilir ve değişkenin aldığı değerlere göre sınıflanır. Nitel (sözel-sayısal olmayan) bir değişken (cinsiyet, medeni durum, göz rengi vb.) söz konusu olduğunda ise gözlenen özelliğin gözlem birimlerindeki görünme sayıları saptanarak tablo halinde sunulur. İlgilenilen nitel değişken sayısı iki veya daha çok olduğunda çapraz tablolar (kontenjans) kullanılarak verilerin sunumu gerçekleştirilir. Nicel Verilerin Tablolaştırılması Bir tablo oluşturulurken yapılacak işlemlerden ilki, derlenen ham verilerin küçükten büyüğe veya büyükten küçüğe sıralayarak istatistiksel bir dizi oluşturmaktır. Belli bir amaca göre düzenlenmiş veriler tabloya aktarılırken tablonun bir başlığı olmalıdır. Tablo başlığı bilgiyi kısa ve anlaşılır bir biçimde tanımlamalıdır. Satır ve sütun başlıkları açık bir biçimde belirtilmelidir. Ayrıca satır ve sütunlarda yer alan değişkenlerin ölçülmesinde kullanılan ölçü birimlerine yer verilmelidir ( kg, saat, %, lt vb.). Örneğin; bir aile hekimine gün içerisinde gelen 30 kadın hastanın ağırlıkları (kg) ile ilgilendiğimizi varsayalım. Kadınların ağırlıkları (kg) şöyledir: 68, 57, 50, 47, 61, 49, 68, 57, 68, 55,49, 52, 61, 50, 55, 68, 55, 57, 57, 61, 52, 72, 63, 65, 50, 72, 61, 63, 68, 49. Bu 30 kadına ait ağırlıkları kullanarak bir tablo hazırlayalım. Yukarıda verilen ağırlıklar incelendiğinde verilerin karmaşık bir halde olduğu ve bir anlam ifade etmediği anlaşılmaktadır. Öncelikle bu veriler küçükten büyüğe dizilmelidir. Ağırlık (kg) : 47, 49, 49, 49,50, 50, 50, 52, 52, 55, 55, 55, 57, 57, 57, 57, 61, 61, 61, 61, 63, 63, 65, 68, 68, 68, 68, 68, 72, 72 22 Bu düzenlemeyle veriler derli toplu bir görünüş kazanmış olmaktadır. Verilerin bu şekilde bir dizi olarak gösterilmesi kolaylıkla algılanmasına ve yorumlanmasına imkan vermektedir. Ağırlıklar incelendiğinde çok sayıda ağırlığın tekrarlanan değerleri olduğu görülmektedir. Ölçümlerin tekrar sayıları frekans (sıklık) olarak tanımlanır. Bu durumda iki sütundan oluşan bir tablo oluşturarak verilerin düzenlenmesi sağlanabilir. Tablonun birinci sütununda ağırlık değişkeninin almış olduğu farklı değerlere, ikinci sütununda ise her değerin gözlem sayısını gösteren frekanslara yer verilir. Tablo 2.1: 30 Kadının ağırlıklarına ait frekans dağılımı Ağırlık (kg) 47 49 50 52 55 57 61 63 65 68 72 Toplam Frekans 1 3 3 2 3 4 4 2 1 5 2 30 Tablon 2.1’ in ikinci sütunda yer alan frekansların toplamı toplam gözlem sayısına eşit olmalıdır. Tablo incelendiğinde en düşük ağırlığın 47 kg, en yüksek ağırlığın 72 kg ve en çok gözlenen ağırlığın ise 68 kg olduğu görülmektedir. Tablo 2.1’ de sunulan frekans dağılımına gruplandırılmamış frekans dağılımı da denilmektedir. Gruplandırılmamış frekans dağılımı gözlenen birim sayısı az olduğunda verilerin sunulması için oldukça elverişlidir. Oluşturulan tablonun matematiksel simgelerle gösteriminde olduğu değeri, ni ise i. değerin frekansını göstermek için kullanılır. xi , değişkenin i. sıradaki almış Frekans Değişken ni xi x1 n1 x2 n2 . . . . . . xk nk Toplam n Frekansların toplamı yukarıda değinildiği gibi toplam gözlem sayısına eşit olmalıdır. O zaman; k n ni n1 n2 i 1 nk dır. Nicel Verilerin Gruplandırılarak Tablolaştırılması Tablo 2.1’ de ele alınan örnekte ağırlık değişkeninin ölçülmesi sonucunda elde edilen veriler gruplandırılmadan tablolaştırıldı. Derlenen verilerin çok fazla sayıda olduğunda verileri gruplandırmadan sunmak oldukça zordur. Gözlenen denek veya birim sayısı çok fazla olduğunda ve ölçümü yapılan değişkenin almış olduğu değerler bir birinden oldukça farklı olduğunda gruplandırılmamış frekans 23 dağılımları çok uzun olabilmektedir. Böyle durumlarda gruplandırılmamış frekans dağılımı veriyi temsil etmede kolayca anlamada yetersiz kalabilir. Bundan dolayı verilerin gruplandırılarak tablolaştırılması en iyi çözümdür. Yaş, kişi başı ilaç harcaması, hastane yatış süresi, fiili yatak sayısı, döner sermaye harcamaları gibi değişkenlerin tablo halinde sunumunda verilerin gruplandırılmış frekans dağılımı biçiminde verilmesi sıklıkla tercih edilmektedir. Gruplandırılmış frekans dağılımları kullanıldığında bilgi kaybı olmakla birlikte genel yapının daha kolay bir biçimde betimlenmesine olanak tanınmaktadır. Verilerin gruplandırılmasında en önemli konular; ilgilenilen değişkenin kesikli ya da sürekli olması, grup sayısı ve grup aralığıdır. Öncelikle elde edilen ham verilerin dizi biçiminde düzenlenmesi gereklidir. Küçükten büyüğe sıralanmış olarak düzenlenen verilerin kaç grupta sınıflandırılacağının belirlenmesi için genellikle Sturges Kuralı kullanılır. Sturges kuralı uygun grup sayısının ve grup aralığının hesaplanmasını olanak sağlamaktadır. Gruplandırma yapılırken ilgilenilen değişken nicel ve sürekli ise gruplandırma işleminde genellikle ortak sınıf yaklaşımı benimsenirken, değişken nicel ve kesikli olduğunda ise ortak sınıf yaklaşımı benimsenmez. Sturges kuralı yardımıyla grup sayısını hesaplamak için aşağıdaki matematiksel eşitlik kullanılır: k 1 3,3 log n k, grup sayısını n ise toplam gözlem sayısını göstermektedir. Grup sayısı belirlendikten sonra grup aralıklarını hesaplamak için veri setindeki gözlenen en küçük ve en büyük değer yardımıyla aşağıdaki eşitlik kullanılır; c xenbüyük xenküçük k Örnek 2.1: Bir hastanede çalışanların örgüt kültürünü belirlemek amacıyla yapılan bir çalışmada, 50 personelin kıdem yılına ilişkin veriler derlenmiştir. Elde edilen sonuçlar Tablo 2.2’ de verilmiştir. Tablo 2.2: Kıdem yıları 1 6 15 1 7 15 1 8 16 2 8 16 2 9 17 2 9 17 3 9 18 Kıdem Yılı 3 3 3 10 10 10 18 20 20 4 11 21 4 11 21 5 11 22 5 13 23 5 14 26 5 14 28 6 15 Çözüm 2.1: Tablo 2.2’de yer alan veri setinin gruplandırılarak tablolaştırılması için aşağıdaki işlem adımları sırasıyla gerçekleştirilir. 1. Grup Sayısının Hesaplanması k 1 3,3 log n n 50 (toplam gözlem sayısı) log50 1,699 k 1 3,3 1,699 6,61 7 Veriler 7 grup altında düzenlenecektir. 2. Grup Aralığının Hesaplanması Veri setinde kayıt altına alınan en küçük kıdem yılı 1 yıl ve en yüksek kıdem yılı 28 yıldır. xenb 28 xenk 1 c 28 1 4 7 Grup aralığının genişliği 4 yıl olacaktır. 24 3. Grup sayısı 7 ve grup aralığı 4 yıla göre verilerin tablolaştırılması Kayıt altına alınan en küçük değerden başlanarak (1 yıl) grup aralıkları 4 yıl ve grup sayısı 7 olacak biçimde veriler gruplandırılır. Gruplar oluşturulduktan sonra bu gruplarda yer alan değerlerin sayısı frekans olarak tablonun ikinci sütununa yazılır. Tablo 2.3: Kıdem yıllarına ilişkin gruplandırılmış frekans dağılımı Kıdem Yılı Frekans 1 - 5’den az 12 5 - 9’dan az 9 9 - 13’den az 9 13 - 17’den az 8 17 - 21’den az 6 21 - 25’den az 4 25 - 29’dan az 2 Toplam 50 Tablo 2.3’ te yer alan gruplandırılmış frekans dağılımı oluşturulurken kayıt altına alınan en büyük değer grup aralığı dışında kaldığında “açık grup” biçiminde düzenlenir. Örneğin en büyük kıdem yılı 29 yıl olarak belirlenseydi bu durumda 7.grup “25 yıl ve üzeri” biçiminde düzenlenecekti. Tablo 2.3 kullanarak üçüncü grubu ilişkin sonuçları yorumlayalım. Üçüncü grup 9-13 yıl grubudur. 50 hastane çalışanından dokuzunun kıdem yılı 9-13 yıl arasındadır. Bu dokuz çalışanın kıdem yılı 9 yıla eşit ve daha fazla ancak 13 yıldan daha azdır. Kıdem yılı 13 yıl olanlar dördüncü grup (13-17 yıl) içindedir. Bu grubun alt sınırı 9 yıl, üst sınırı ise 13 yıl ve grup aralığı = grubun üst sınırı – grubun alt sınır = 4 yıldır. Her grubun orta noktasının o grubu en iyi şekilde temsil ettiği varsayılır. Üçüncü grubun orta noktası 9 13 / 2 11 yıldır. Tabloda yer alan diğer gruplar içinde ayrı ayrı yorumlar yapılabilir. Aşağıda yönetici hemşirelerin aylık ayakta geçirdikleri süre saat olarak verilmiştir, frekans dağılımını oluşturarak elde ettiğiniz sonuçları tabloda gösteriniz ve kısaca yorumlayınız. Süre (saat) 60 61 62 62 62 62 63 63 64 64 64 64 65 65 65 65 66 66 66 66 66 66 66 66 67 67 67 67 67 67 67 67 68 68 68 69 69 69 69 70 70 70 71 71 71 72 72 73 73 73 Birikimli Frekans Dağılımları Bir frekans dağılımında, her sınıfın frekansına bir önceki sınıfın frekansının birikimli olarak eklenmesiyle oluşturulan dağılıma birikimli dağılımı, bu şekilde oluşturulan dağılımlara da birikimli frekans dağılımları adı verilir. Birikimli frekanslar, küçükten büyüğe ya da büyükten küçüğe oluşturulabilir. Eğer birikimli frekanslar küçükten büyüğe oluşturulmuşsa “-den az”, büyükten küçüğe oluşturulmuşsa “-den çok” olarak isimlendirilir. Birikimli frekanslar, gözlem değerlerinin büyüklüklerine göre kaçıncı sırada yer aldıklarının belirlenmesinde kullanılır. 25 Tablo 2.3’ te 50 çalışanın kıdem yıllarına ilişkin gruplandırılmış frekans dağılımını kullanarak “-den az” ve “-den çok” birikimli frekansları oluşturarak, bu birikimli frekansları nasıl yorumlayacağını görelim. Tablo 2.4: Kıdem yıllarına ilişkin gruplandırılmış frekans dağılımı Kıdem Yılı Frekans “-den az” “-den çok” 1 - 5’den az 12 12 38 + 12= 50 5 - 9’dan az 9 9 + 12 = 21 29 + 9= 38 9 - 13’den az 9 9 + 21 = 30 20 + 9= 29 13 - 17’den az 8 8 + 30 = 38 12 + 8= 20 17 - 21’den az 6 6 + 38 = 44 6 + 6= 12 21 - 25’den az 4 4 + 44= 48 2+ 4= 6 25 - 29’dan az 2 2 + 48 = 50 2 Toplam 50 Tablo 2.4’ ün ikinci ve üçüncü sütunlarında birikimli frekanslara yer verilmiştir. “-den az” birikimli frekanslar oluşturulurken ilk grubun frekansından başlanılır. İkinci grubun “-den az” birikimli frekansı ilk grubun frekansı ile ikinci grubun frekansının toplanmasıyla elde edilir. Son gruba kadar frekanslar toplanarak devam eder, son grubun “-den az” birikimli frekansı toplam frekansa eşit olmalıdır. “-den çok” birikimli frekansta ise işlem “-den az” birikimli frekansların tam tersidir ve “-den çok” birikimli frekanslarda birinci grubun birikimli frekansı toplam frekans sayısına eşit olmalıdır. Tablo 2.4’ deki örnekte kıdem yılı grupları göz önüne alınırsa “-den az” birikimli frekanslar yardımıyla 38 personelin kıdem yılının 17 yıldan daha az olduğu, “-den çok” birikimli frekanslar yardımıyla 6 personelin kıdem yılının ise 21ve 21 yıldan daha fazla olduğu söylenir. Örnek 2.2: Aşağıda verilen gruplandırılmış frekans dağılımını kullanarak, Kıdem Yılı Frekans 0 - 10 7 10 - 20 12 20 - 30 16 30 - 40 24 40 - 50 32 50 - 60 28 60 - 70 21 a. Frekans dağılımındaki toplam gözlem sayısını belirleyiniz. b. “-den az” ve “-den çok” birikimli frekansları oluşturunuz. c. Kıdem yılı 40’ tan küçük olan gözlem sayısını belirleyiniz. d. Kıdem yılı 60 ve daha büyük gözlem sayısını belirleyiniz. 26 Çözüm 2.2: a. Toplam gözlem sayısı frekanslar toplamına eşittir. Bu örnekte toplam gözlem sayısı 140’ tır. k n ni 7 12 16 24 32 28 28 21 140 i 1 b. “-den az” ve “-den çok” birikimli frekanslar: Kıdem Yılı Frekans “-den az” “-den çok” 0 - 10 7 7 140 10 - 20 12 19 133 20 - 30 16 35 121 30 - 40 24 59 105 40 - 50 32 91 81 50 - 60 28 119 49 60 - 70 21 140 21 Toplam 140 c. Kıdem yılı 40’ tan küçük olan gözlem sayısı 59’ dur. d. Kıdem yılı 60 ve daha büyük gözlem sayısı 21’dir. Nitel Verilerin Tablolaştırılması Nicel bir değişkene ait verilerin tablolaştırılmasından sonra, şimdi nitel bir değişkenin nasıl tablolaştıracağımızı ele alalım. Medeni durum, cinsiyet, öğrenim düzeyi, psikiyatrik tanı, hastaların hastane tercih nedenleri gibi nitel değişkenlerin kullanıldığı durumlarda değişkenin sözel karşılıkları tablo haline getirilir. Nitel değişkenlerin kullanıldığı durumlarda frekanslarla birlikte yüzdelik oranlara da yer verilmesi önemlidir. Gerçek frekansların yanında verilen yüzdelikler oransal frekanslar olarak tanımlanmaktadır. Oransal frekanslar nitel değişkenin düzeylerine katılma yüzdesini ya da tercih oranını göstermektedir. Değişken düzeylerinin tekrarlanma sayısı (frekansı) sadece değişkenin o değerinin gözlenme sayısını gösterir ve elde edilen diğer sonuçlardan bağımsızdır. Oransal frekans ise değişkenin almış olduğu değerin toplam içindeki oranını gösterir ve bu tüm veri setiyle ilişkilendirilir. Birim sayısı en az 50 ve daha fazla olan kütlenin oransal frekanslarının hesaplanması ve yorumlanması anlamlıdır. Zaman kavramı sağlık hizmetlerinin yönetimi alanında oldukça önemli bir konudur. Hastane yöneticilerinin zaman yönetimine ilişkin tutumlarının belirlenmesi için bir çalışma yapıldığını varsayalım. Bu çalışmada 250 hastane yöneticisinin “zaman planlaması yönetimi yapıyor musunuz?” ifadesine verdiği yanıtlar özet olarak aşağıda verilmiştir. Bu yanıtları kullanarak ilgili tabloyu oluşturalım. Yönetici Cevap Birinci Yönetici Bazen İkinci Yönetici Her Zaman Üçüncü Yönetici Hiçbir Zaman . . . İki Yüz Ellinci Yönetici . . . Her Zaman 27 Elde edilen ham verileri yorumlamak oldukça zordur. Zaman Planlaması nitel değişkeninin 5 farklı düzeyi; Hiçbir Zaman, Nadiren, Bazen, Genellikle, Her Zaman şeklindedir. Beş farklı sonucun tercih sıklıkları belirlenerek tablonun ikinci sütununda yer alan frekans kısmına yazılır. Tablonun üçüncü sütununda yer alan oransal frekanslar, değişkenin i. sıradaki almış değerin frekansı ni’ nin toplam frekansına oranlanmasıyla hesaplanır, ni ni . Örneğin, “Hiçbir Zaman” düzeyi için oransal frekans 30/250=0,12 dir. Tablo 2.4: 250 Hastane yöneticisinin zaman planlamasına ilişkin tutumları Tutum Frekans Oransal Frekans Hiçbir Zaman 30 0,12 Nadiren 20 0,08 Bazen 50 0,20 Genellikle 80 0,32 Her Zaman 70 0,28 Toplam 250 1,00 Hastane yöneticilerinin % 32’ si zaman planlanmasını genellikle, % 28’ i ise her zaman yaptıklarını bildirmiştir. Zaman planlamasına ilişkin “Hiçbir Zaman” yanıtı verenlerin oranı ise % 12 dir. Tablo 2.4’ te nitel değişken için oluşturulan tablonun matematiksel simgelerle ifadesi aşağıda verilmiştir. Değişken Frekans Oransal Frekans n xi ni x1 n1 n1 x2 n2 n2 . . . . . . . . . xk nk Toplam n ni i n n nk i i n i 1,00 Örnek 2.3: Tablo 2.5’ te 262 hastanın A hastanesinde aradıkları birimleri bulma konusunda kullandıkları yönteme ilişkin elde edilen veriler düzenlenmiş biçimde verilmiştir. Tablo 2.5’ i kullanarak elde edilen sonuçları yorumlayınız. Hastaların aradıkları birimi bulma konusunda en sık kullandıkları yöntemin ne olduğunu açıklayınız. 28 Tablo 2.5: Hastaların aradıkları birimleri bulma teknikleri Teknik Frekans Oransal Frekans Levhalar 84 0,32 Danışma Memuru 65 0,25 Herhangi Bir Hastane Personeli 90 0,34 Diğer 23 0,09 Toplam 262 1,00 Tablo 2.5. incelendiğinde hastaların A hastanesinde ilgili birimi bulmak için 4 farklı teknik kullandığı görülmektedir: levhalar, danışma memuru, herhangi bir hastane personeli ve diğer. Hastalar aradıkları birimi bulmak için en sık olarak herhangi bir hastane personeline danışmaktadırlar, 262 hastanın % 34’ u bu yöntemi tercih etmiştir. Danışma memuruna sorarak aradıkları birimi bulan hastaların oranı ise % 25’ dir. Levhaları takip ederek ilgili birimi bulanların oranı % 32 iken diğer herhangi bir yöntemi kullananların oranı ise % 9’ dur. Hastaların poliklinik hizmeti aldıkları hastaneleri genel olarak değerlendirme sonuçları hastane yöneticileri açısından oldukça önemlidir. Hastanelerin hastalarda bıraktığı genel imajının belirlenmesine yönelik sonuçlar Tablo 2.6’ da verilmiştir. Tabloda yer alan sonuçlardan hareketle oransal frekansları hesaplayarak elde edilen sonuçları yorumlayınız. Tablo 2.6: Hastaların hastanenin genel imaj değerlendirmeleri İmaj Frekans Çok İyi 25 İyi 80 Orta 64 Zayıf 19 Çok Zayıf 12 Toplam 200 Oransal Frekans Çapraz Tablo Derlenen veriler aynı anda iki veya daha fazla değişken göz önünde bulundurularak tablolaştırıldığında çapraz tablo elde edilir. Bir gözlem kümesi iki değişkene göre tablolaştırıldığında 2×2 veya genelde R×C tabloları ortaya çıkar. Bu tablolar R kadar sıra ve C kadar sütundan oluşur. Söz konusu tabloların gözelerinde (hücre) frekanslar yer alır. Y hastanesinde yatarak tedavi görüp taburcu olan 500 hastaya, hastanede kalış süreleri ve bu hastaneden tekrar hizmet alıp almayacakları sorulmuş olsun. Veriler aşağıdaki 2×2 çapraz tabloda verilmiştir. Hastanede yatma süresi Hastaneden tekrar hizmet alma Tekrar Hizmet Tekrar Hizmet Alacağım Almayacağım Toplam En fazla Bir hafta 260 20 280 Bir haftadan fazla 80 140 220 29 Bu tablodan şu yorumlar çıkarılabilir; Hastanede en fazla bir hafta yatan 280 hastanın %93’ü (260/280) tekrar bu hastaneden hizmet almaya devam edeceğini, Hastanede bir haftadan daha fazla yatan 220 hastanın %36’ı (80/220) tekrar bu hastaneden hizmet almaya devam edeceğini, %64’ü (140/220) ise bu hastaneden tekrar hizmet almayacağını belirtmiştir. Hastane yöneticisi, bu sonuçlardan hastanede kalış süresi arttıkça hastaların Y hastanesinden tekrar hizmet alma eğiliminde bir azalma olduğu bulgusuna ulaşabilir. Ancak, bu bulgunun idari karara dönüşebilmesi için kitabın ilerleyen ünitelerinde yer alan hipotez testlerinin uygulanmasına gerek vardır. Grafikler Verileri kolay anlaşılabilir hale getirerek sunmanın en iyi yollarından biri de grafiklerdir. Grafikler verilerin geometrik şekilleridir. Grafik çizimi belli kurallar çerçevesinde yapılır. Tablolarda olduğu gibi grafiklerin de konusunu gösteren bir başlığı olmalıdır. Bir grafikte yer alan şekil ve çizgilerin anlamları grafik üzerinde belirtilmelidir. Grafiğin apsis (yatay eksen –x) ve ordinat (düşey eksen –y) eksenlerinin ölçeklendirilmesi ve bu eksenlerin tanımları grafik üzerinde gösterilmelidir. Grafikte anlaşılması ve yorumlanması zor olan işaretlemelere ve şekillere yer verilmemelidir. Ayrıca çizilen grafiğin kaynağının da belirtilmesi gerekir. Veri türlerinin yanında grafikler oluşturulma amaçları, kullanış biçimleri ve şekilleri itibariyle de farklı başlıklar altında ele alınmaktadır. Verilerin görsel bir biçimde sunumunda sıklıkla kullanılan grafikler: çubuk grafiği, histogram, serpilme diyagramları, alan grafikleri, çizgi grafiği, kare ve daire grafikleridir. Histogram Birbirine bitişik dikdörtgenlerden oluşan grafiğe histogram adı verilir. Histogram sürekli nicel veriler için uygun bir gösterim biçimidir. Histogram çizilirken apsis ekseninde değişkenin almış olduğu farklı değerler, ordinat ekseninde ise frekanslar yer alır. Apsis ekseninde grup sınırları işaretlenerek; tabanı grup aralığına, alanı ise grup frekansına karşılık gelen bir birine bitişik dikdörtgenler çizilerek histogram oluşturulur. Çizilen dikdörtgenlerin orta noktalarının birleştirilmesi ile frekans poligonu elde edilir. Histogram çiziminde diğer önemli konulardan biri grupların bölüm aralıklarının eşit olmasıdır. Grup aralıkları eşit olmadığında frekansların ayarlanması gerekmektedir. Histogramda grup aralıkları eşit olduğunda dikdörtgenlerin tabanlarının bir birim olduğu kabul edilmektedir. Grup aralıkları eşit olmadığında dikdörtgen tabanlarının bir birim olacak şekilde düzenlenmesi için frekansların basit matematiksel işlemler ile ayarlanır. Bunun için frekanslar grup aralığına bölünerek dikdörtgenlerin alanları ile grupların frekansları eşit hale getirilir. Frekanslar ayarlanırken en fazla görülen grup aralığı standart birim olarak tanımlanır. Aralığı bir standart birim olan grupların frekansları değerlerini korurken, grup aralığı standart birimden farklı olan grupların frekansları grupların standart birim cinsinden aralık değerlerine oranlanarak frekanslar ayarlanır (Bakınız: örnek 2.4). Dikdörtgenlerin alanlar toplamı her zaman toplam frekansa eşit olmalıdır. Hastanede çalışan hekim ve hemşireleri geçirdikleri iş kazaları ve meslek hastalıkları yönünden değerlendirmek amacıyla yapılan bir çalışmada A hastanesinin çalışanlarının haftalık çalışma sürelerine ait veriler toplanmış ve Tablo 2.7 de sunulmuştur. Bu frekans dağılımı için histogramı çizelim. Tablo 2.7: Haftalık çalışma sürelerine ilişkin gruplandırılmış frekans dağılımı Çalışma Süresi (saat) 30 - 40 40 - 50 50 - 60 60 - 70 Toplam 30 Frekans 4 29 23 40 96 Tablo 2.7’ deki çalışma sürelerinin grup aralıkları incelendiğinde, 4 grupta da grup aralıklarının 10 saat olduğu görülmektedir. Frekanslara ilişkin her hangi bir matematiksel işlem yapmadan histogram çizilebilir. Şekil 2.4: Tablo 2.7’deki veriler için histogram Şekil 2.4’ te yer alan histogramda her bir dikdörtgenin alanı o grubun frekansına eşittir. Dikdörtgenlerin alanları toplamı ise toplam frekansı vermektedir. Dikdörtgenlerin orta noktalarını birleştirerek çizdiğimiz doğru ise frekans poligonunu göstermektedir. Grup aralıkları bu histogramda (10) birbirine eşit olduğundan her bir dikdörtgenin tabanı 1 birim olarak kabul edilir. O halde 30-40 grubunu temsil eden dikdörtgenin yüksekliği h = 4, tabanı 1 birimdir ve dikdörtgenin alanı 4 birimdir (4×1=4). Dikdörtgenlerin alanları sırasıyla; 4, 29, 23 ve 40’ tır, alanlar toplamı ise 96’ dır. Örnek 2.4: Aşağıda verilen gruplandırılmış frekans dağılımının histogramını çiziniz. Gruplar 15 - 30 30 - 40 40 - 50 50 - 60 60 - 75 75 - 80 Toplam Frekans 15 25 60 44 30 16 190 Çözüm 2.4: Bu örnekte grup aralıklarının eşit olmadığı görülmektedir. En sık görülen grup aralığı 10’dur ve 10 bir standart birim olarak kabul edilir. Bölüm aralığı 10’ dan farklı olan; birinci, beşinci ve altıncı grupların frekansları ayarlanmalıdır. Bu grupların aralıkları 10’ a bölünerek standartlaştırıldıktan sonra bu grupların gerçek frekansları standart değerlere bölünerek ayarlamış frekanslar elde edilir. Örneğin birinci grubun “15-30” grup aralığı 15, bir standart birim olarak belirlediğimiz grup aralığı 10 için 1,5 birimdir. O zaman birinci grubun ayarlanmış frekansı 15 /1,5 10 olarak hesaplanır. Ayarlanmısş frekans hesabı tablo üzerinde gösterilmiştir. O halde ayarlanmış frekanslar kullanılarak histogram çizimi yapılabilir 31 Gruplar Frekans Grup Aralığı Standart Birim Ayarlanmış Frekans 15 - 30 15 15 15 /10 1,5 15 /1,5 10 30 - 40 40 - 50 50 - 60 60 - 75 25 60 44 30 10 10 10 15 10/10=1 10/10=1 10/10=1 25 60 44 15 /10 1,5 30 /1,5 20 75 - 80 16 5 5 /10 0,5 16 / 0,5 32 Toplam 190 Şekil 2.5: Ayarlanmış frekanslara göre histogram Tablo 2.8’de verilen gruplandırılmış frekans dağılımı için histogramı çiziniz. Tablo 2.8: Gruplandırılmış frekans dağılımı Gruplar 0 - 15 15 - 30 30 - 45 45 - 60 60 - 75 75 - 90 Frekans 10 15 20 30 15 5 Çubuk Grafiği Nitel verilerin gösteriminde sıklıkla çubuk grafikleri kullanılmaktadır. Bu grafikte, sıralayıcı veya sınıflayıcı ölçekle ölçülmüş değişkenlere ait verilerin sayılarını veya oranlarını gösterilmektedir. Çubuk grafiklerinde gruplar tabanları eşit ve birbirine bitişik olmayan dikdörtgenler ile çizilir. Dikdörtgenler bir birini izleyen bir seriyi temsil eder. Çubuk grafiği dikey ya da yatay olabilir. Eksenlerden birinde değişkenin düzeyleri, diğerinde ise frekans veya yüzdelere yer verilir. 32 Örnek 2.5: 2010 yılı Sağlık İstatistikleri Yıllığına göre tüm sektörler itibariyle sağlık personeli sayıları Tablo 2.9’ da verilmiştir. Bu verileri kullanarak çubuk grafiğini çiziniz. Tablo 2.9: 2010 Yılı Sağlık Personeli Sayıları Sağlık Personeli Personel Sayısı Uzman Hekim 63563 Pratisyen Hekim 38818 Asistan Hekim 21066 Diş Hekimi 21432 Eczacı 26506 Sağlık Memuru 94443 Hemşire 114772 Ebe 50343 Kaynak: Sağlık İstatistikleri Yıllığı 2010 120000 100000 80000 60000 40000 20000 0 Uzman Hekim Pratisyen Hekim Asistan Diş Hekimi Eczacı Hekim Sağlık Hemşire Memuru Şekil 2.6: Tablo 2.9’daki veriler için çubuk grafiği 33 Ebe Örnek 2.6: Yıllara ve sektörlere göre hastane sayılarını gösteren çubuk grafiği Şekil 2.7’ de verilmiştir. 1000 Hastane Sayıları 900 800 700 600 Sağlık bakanlığı 500 Özel 400 300 Üniversite 200 Diğer 100 0 2006 2007 2008 2009 2010 Yıllar Şekil 2.7: Yıllara ve Sektörlere Göre Hastane Sayısı, Türkiye Kaynak: Sağlık İstatistikleri Yıllığı 2010 Çubuk grafiğinde 4 sektöre göre hastaneler farklı renklerde gösterilmiştir. Çubukların üzerinde sektörler itibariyle hastane sayıları görülmektedir. Örnek 2.7: Bir hastane hastalarına sunmuş oldukları hizmetlerin hastalar tarafından değerlendirilmesi amacıyla bir değerlendirme formu hazırlayarak 300 hastanın görüşlerini almıştır. Elde edilen görüşlerin oransal dağılımları Tablo 2.10 da verilmiştir. Tablo 2.10 kullanılarak birikimli grafiğin çizimi şekil 2.8 de verilmiştir. Elde edilen sonuçları yorumlayınız. Tablo 2.10: Hastane hizmetlerinin değerlendirilmesinde verilen yanıtların oransal dağılımı (%) Mükemmel İyi Orta Yetersiz Çok Yetersiz Toplam Randevu Alma % 35 % 30 % 15 % 10 % 10 100 Kayıt Yaptırma % 25 % 30 % 25 % 10 % 10 100 Acil Servis Hizmet % 30 % 35 % 10 % 10 % 15 100 Laboratuvar % 30 % 20 % 10 % 15 % 25 100 Doktorlar % 35 % 25 % 10 % 20 % 10 100 Hemşireler % 20 % 20 % 30 % 10 % 20 100 Güvenlik % 15 % 15 % 20 % 20 % 30 100 Temizlik % 25 % 15 % 20 % 15 % 25 100 Hizmetler 34 Şekil 2.8: Hastane hizmetlerinin değerlendirilmesinde verilen yanıtların oransal dağılımı (%) Bir ildeki Devlet, Özel ve Fakülte hastanelerinin acil servislerine hafta sonu (Cumartesi – Pazar) başvuran hasta sayıları Tablo 2.11 de verilmiştir. Tablo 2.11’e göre çubuk grafiğini çiziniz. Tablo 2.11: Hastanelere göre hafta sonu Acil servise gelen hasta sayıları Hasta Başvuru Sayısı (Kişi) Cumartesi Pazar Devlet Hastaneleri Acil Servisleri Hastaneler 52 68 Özel Hastaneler Acil Servisleri 54 46 Fakülte Hastanesi Acil Servisi 64 55 Daire Grafiği Daire grafikleri tek bir değişken dikkate alınarak çizilen grafiklerdir. Nitel verilerin grafik gösteriminde kullanılmaktadır. Bir nitel değişkenin düzeyleri az olduğunda çoğunlukla daire grafikleri tercih edilmektedir. Dairenin alanı değişkenin düzeylerinin 360 lik daire içindeki paylarına göre parçalara ayrılır. Her bir düzeyin daire içindeki payını bulmak için; önce her bir düzeye ait frekans toplam frekans sayısına oranlanır, sonra bunların derece cinsine dönüştürülmesi için bu oranlar 360’ la çarpılır. Böylece her grubun daire içinde kaç derecelik bir merkez açıyla yer aldığı belirlenmiş olur. 35 Örnek 2.8: Sektörlere göre 2010 yılı için erişkin yoğun bakım yatağı sayıları aşağıda verilmiştir. Bu verileri kullanarak daire grafiğini çizelim. Tablo 2.12: Sektörlere göre 2010 yılı için erişkin yoğun bakım yatağı sayısı Sektör Yatak Sayısı Sağlık Bakanlığı 6130 Üniversite 2900 Özel 4142 Kaynak: Sağlık İstatistikleri Yıllığı 2010 Çözüm 2.8: Tablo 2.12’de Sağlık Bakanlığı’na ait erişkin yoğun bakım yatağı sayısı 6130 ve toplam yatak sayısı 13172’dir. Sağlık Bakanlığına ait erişkin yoğun bakım yatağı sayısının daire içindeki payı 6120 /13172 0.47 dir. Diğer düzeyler içinde aynı işlem sırasıyla tekrarlanarak tüm düzeylerin daire içindeki payları elde edilir. Tablo 2.13: Sektörlere göre 2010 yılı için erişkin yoğun bakım yatağı sayısı ve oranları Sektör Yatak Sayısı Yüzde Daire Üzerindeki Açı Sağlık Bakanlığı 6130 0,47 0, 47 360 167,5 Üniversite 2900 0,22 0, 22 360 79,3 Özel 4142 0,31 0,31 360 113, 2 Şekil 2.9: 2010 Yılı sektörlere göre yoğun bakım yatağı sayısı, Türkiye 36 Örnek 2.9: Bir hastanenin hasta hakları birimi hastanelerine gelen hastalardan tesadüfi olarak gelen 250 hastaya sunulan hizmetlerden memnuniyetlerini sormuş ve Tablo 2.14’deki sonuçları elde etmiştir. Hasta memnuniyeti için daire grafiğini çiziniz ve kısaca sonuçları yorumlayınız. Tablo 2.14: 250 Hastanın Memnuniyet Düzeyi Memnuniyet Düzeyi Yatak Sayısı Yüzde Daire Üzerindeki Açı Memnun 187 0,75 0,75 360 269,3 Orta 33 0,13 0,13 360 47,5 Memnun Değil 30 0,12 0,12 360 43, 2 Şekil 2.10: 250 Hastanın Memnuniyet Düzeyi 250 hastanın % 75’ i hastanenin hizmetlerinden memnun, % 13’ u orta derece memnun ve % 12’ si memnun olmadığını bildirmiştir. Söz konusu hastanenin hizmet sunumu hasta memnuniyeti sağlamaktadır. 2000 yılı Sağlık Bakanlığı istatistiklerine göre ölüm sayılarının hastalık nedenlerine göre dağılımı Tablo 2.15’ te yer almaktadır. Verilere ilişkin daire grafiğini çiziniz, hastalık nedenlerinin oranlarını hesaplayarak kısaca açıklayınız. Tablo 2.15: 2000 yılı ölüm sayılarının hastalık nedenlerine göre dağılımı Hastalık Nedeni Ölüm Sayısı Enfeksiyon Hastalıkları 38071 Yaralanmalar 25025 Kardiyovasküler Hastalıklar 205457 Kanserden Ölüm 56250 Solunum Sistemi Hastalıkları 34211 Diabet 9549 Kaynak: Sağlık İstatistikleri Yıllığı, 2000 37 Çizgi Grafiği Çizgi grafikleri nicel bir değişkenin almış olduğu değerlerin frekanslarının dağılımını göstermek için kullanılmaktadır. Çizgi grafikleri, basit ve çoklu çizgi grafikleri olmak üzere ikiye ayrılmaktadır. Çizgi grafikleri belli bir aralıkta grafik üzerinde işaretlenen noktaların bir çizgi ile birleştirilmesi ile oluşturulur. Zaman serisi grafiği olarak ta adlandırılan çizgi grafikleri değişkenin zaman içindeki değişimini görsel olarak gösterir. Diğer grafiklere göre zamana bağlı değişimleri daha iyi bir şekilde açıklamaktadır. Çubuk ve histograma göre çizimi daha kolay olmakla birlikte büyük veri setlerinin özet bir biçimde gösterimini de sağlamaktadır. Ancak verilerin doğruluğu ve kaynağına ilişkin kesin kanıtlar sunmada yetersiz kalmaktadır. Yıllara göre ölüm hızı, yıllara göre birinci basamak sağlık kuruluşlarına müracaat sayısı, kişi başına düşen ilaç harcamaları gibi değişkenlerin çiziminde basit çizgi grafiği kullanılır. Yıllara göre faiz dışı harcamalar ve kamu sağlık harcamaları aynı grafik üzerinde gösterilecekse bu durumda çoklu çizgi grafiği kullanılır. Çizgi grafiklerinde bir değişkenin almış olduğu değerler ve bunların frekansları varsa; apsis ekseninde değişkenin almış olduğu değerler ordinat ekseninde ise frekanslar yer alır. Ancak iki değişkenin olduğu durumlarda ise apsis ve ordinat eksenleri birer değişkeni temsil eder. Şimdi farklı örnekler üzerinde basit ve çoklu çizgi grafiklerini ele alalım. Örneğin; yıllara göre Sağlık Bakanlığı birinci basamak kuruluşları sevk oranlarına ilişkin bir grafik çizmeye karar verelim. Tablo 2.16’ da yıllara göre Sağlık Bakanlığı birinci basamak kuruluşları sevk oranları verilmiştir. Tablo 2.16: Yıllara Göre Sağlık Bakanlığı Birinci Basamak Kuruluşları Sevk Oranı Yıllar 2002 2006 2007 2008 2009 2010 Oran 16,7 6,4 2,4 1,3 1,0 0,4 Kaynak: Sağlık İstatistikleri Yıllığı 2010 Bu durumda farklı grafikler çizilebilir. Ancak yıllar itibariyle birinci basamak sağlık kuruluşlarına sevk oranlarındaki değişimi veya farklılaşmayı gösterecek en iyi grafik çizgi grafiktir. Verileri önce çubuk grafiği ile gösterelim. Oran(%) 18 16 14 12 10 8 6 4 2 0 2002 2006 2007 2008 2009 2010 Yıllar Şekil 2.11: Yıllara Göre Sağlık Bakanlığı Birinci Basamak Kuruluşları Sevk Oranı 38 Çubuk grafiği (Şekil 2.11) incelendiğinde yıllar itibariyle sevk oranının azaldığı görülmektedir. Ancak bu grafik azalım eğilimini iyi bir şekilde temsil etmemektedir. Çubuk grafiği yerine çizgi grafiği verilerin daha kolay anlaşılmasını sağlayacaktır. Grafik çizilirken apsiste oranlar ordinat ekseninde ise yıllar yer alacaktır. Her bir yıla karşılık gelen sevk oranı analitik düzlemde birer nokta olarak işaretlenecek ve daha sonra bu noktalar birleştirilerek çizgi grafiği elde edilecektir. 18 16 16,7 14 12 10 8 Oran(%) 6,4 6 4 2,4 2 1,3 1 0 2002 2006 2007 2008 0,4 2009 2010 Yıllar Şekil 2.12: Yıllara göre sağlık bakanlığı birinci basamak kuruluşları sevk oranı Şekil 2.12’ de verilen çizgi grafik ile Tablo 2.16’daki veriler daha kolay anlaşılabilir duruma getirilmiştir. 2002 yılında birinci basamak sağlık kuruluşlarında sevk oranı 16,7 iken bu oran 2010 yılında 0,4’ e kadar düşmüştür. Örnek 2.10: Yıllara göre kemik iliği nakli merkezlerindeki değişime ilişkin veriler Tablo 2.17’de verilmiştir. Uygun grafiğin hangisi olduğunu belirterek, çiziniz ve grafiği kısaca yorumlayınız. Tablo 2.17: Yıllara göre kemik iliği nakli merkezleri Yıllar Pediatrik Erişkin Toplam 2004 7 12 19 2005 7 13 20 2006 7 14 21 2007 8 18 26 2008 9 21 30 2009 9 25 34 2010 10 28 38 Kaynak: Sağlık İstatistikleri Yıllığı, 2010 Verileri özetlemek için farklı grafikler kullanabilir. Ancak kemik iliği nakli merkezi sayılarını yıllar itibariyle, pediatri, erişkin ve toplam açısından göstermek için kullanılacak en iyi grafik çoklu çizgi grafiğidir. Çoklu çizgi grafiği, sonuçların bütünsel bir çerçevede değerlendirmesini sağlamaktadır Grafiğin apsis ekseninde yıllar ordinat ekseninde ise sayılar yer alır. Analitik düzlemde sırasıyla pediatri, yetişkin ve toplam için yıllara karşılık gelen nakil merkezleri sayıları işaretlenir. Bu işaretlenen noktaların birleştirilmesi ile çoklu çizgi grafiği çizilir. Çoklu çizgi grafikleri çiziminde her bir değişken için çizilen değişkenin diğer değişken veya değişkenlerden ayrımının yapılması çok önemlidir. Şekil 2.13’ teki çoklu 39 çizgi grafiği incelendiğinde pediatri, erişkin ve toplam için farklı desenlerin kullanıldığı görülmektedir. Çizgiler üzerinde yıllar için alınan değerleri göstermek için kullanılan işaretçiler görülmektedir. Örneğin pediatrik için kullanılan işaretçi karelerdir. İstendiğinde işaretçiler etiketlenerek ilgili sayılar da gösterilebilir. Şekil 2.13: Yıllara Göre Kemik İliği Nakil Merkezleri 2004-2010 Şekil 2.13’ teki çoklu çizgi grafiği incelendiğinde 2006 yılı itibariyle kemik iliği nakil merkezleri sayısında bir artış olduğu görülmektedir. Yeni açılan kemik iliği nakil merkezleri büyük oranda erişkinler için olduğu görülmektedir. Yıllara göre Sağlık Bakanlığı bütçesinin GSYİH (Gayri Safi Yurtiçi Hasıla) içindeki oranına ilişkin veriler aşağıdaki Tablo 2.18’ de gösterilmiştir. Çizgi grafiğini çiziniz. 40 Tablo 2.18: Yıllara göre sağlık bakanlığı bütçesinin GSYİH içindeki oranı Yıllar Oran 1999 0,77 2000 0,68 2001 0,76 2002 0,87 2003 0,81 2004 0,80 2005 1,04 2006 1,13 2007 1,23 2008 1,26 2009 1,53 Kaynak: Sağlık İstatistikleri Yıllığı 2010 Birikimli Frekansların Grafikle Gösterilmesi Birikimli dağılımların grafikleri çizilirken gruplar apsiste, birikimli frekanslarda ordinat ekseninde yer alır. Terim sayısı çok olduğu ya da özellikle birkaç dağılımın aynı grafik üzerinde gösterilmesi ve karşılaştırılması söz konusu olduğunda histogram yerine birikimli frekans grafikleri tercih edilmektedir. “-den az” birikimli frekanslar için grafik çizilirken, koordinat sisteminde grup üst sınıflarıyla ilgili gruba karşılık gelen birikimli frekansların belirledikleri noktalar birleştirilerek grafik oluşturulur. “-den çok” grafikleri oluşturulurken ise, grup alt sınırlarıyla ilgili gruba karşılık gelen birikimli frekansların belirledikleri noktalar birleştirilerek grafik çizimi yapılır. “-den az” birikimli frekanslara ait eğri ilk grubun frekansından başlayarak sürekli artan, “-den çok” birikimli frekanslar ise son grubun frekansına kadar sürekli azalan bir eğridir. Örnek 2.11: Aşağıda verilen gruplandırılmış frekans dağılımı için birikimli frekansları oluşturarak grafiğini çizelim. Gruplar Frekans 25 - 30 15 30 - 35 25 35 - 40 68 40 - 45 54 45 - 50 20 50 - 55 18 Toplam 200 41 Çözüm 2.11: Gruplar Frekans “-den az” “-den çok” 20-30 15 15 200 30-40 25 40 185 40-50 68 108 160 50-60 54 162 92 60-70 20 182 38 70-80 18 200 18 Toplam 200 250 Frekans 200 150 den az 100 den çok 50 0 25 35 45 55 65 75 Gruplar Şekil 2.14: Birikimli frekans eğrileri MICROSOFT OFFICE EXCEL UYGULAMASI Microsoft Office Excel ortamında kolayca grafikler oluşturulabilir. Oluşturduğunuz bu grafikler, anlamlı olacak şekilde verileri görüntülemenize ve daha kolay yorumlanmasına yardımcı olur. Excel, sayısız grafik türünü destekler. Excel'de yeni bir grafik oluşturmak için öncelikle sayısal girdilerden oluşan bir veri aralığına sahip olmanız gerekir. Aşağıdaki resimde gösterilen çalışma sayfası verilerinin grafiklerinin çizilmesi için gerekli adımları gösterelim. 42 1. Adım: Grafiği çizilecek veri aralığı içinden bir hücre seçerek Ekle sekmesine tıklayarak, Grafikler grubunu görüntüleyiniz. 2. Adım: Grafikler grubunda bulunan Sütun düğmesine daha sonra açılan menüden 2-b Sütun grubunda bulunan ve seçtiğiniz grafik türünün alt türü olan Kümelenmiş Sütun tıklayınız. Elde ettiğiniz grafik üzerinde fare sağ tuşa basarak veri seç ve buradan da satır/sütün değiştir öğesini tıklayınız. Böylece aşağıdaki grafiği elde edeceksiniz. 43 3. Adım: Başlık eklemek istediğiniz grafiği fare ile tıklayınız. Tasarım, Düzen ve Biçim sekmeleri eklenerek Grafik Araçları görüntülenir. 44 Buradan Düzen sekmesinde, Etiketler grubundaki Grafik Başlığını fare ile tıklayınız. Grafik Başlığı metin kutusuna grafik başlığı olmasını istediğiniz metni yazınız. Şimdi aynı veriler için çizgi grafik çizelim. Bunun için yukarıdaki adımlar da ekle sekmesinden grafik grubundan ise çizgi seçilerek çizgi grafik elde edilir. Elde ettiğiniz grafik üzerinde fare sağ tuşa üzerinde istediğiniz değişiklikleri yapabilirsiniz. Böylece aşağıdaki grafiği elde edeceksiniz. 45 Özet grafik konusunu açıklayan bir başlığa sahip olmalıdır. Grafik çiziminde; histogram, çizgi grafiği, çubuk grafiği ve daire grafik gibi grafik türleri kullanılabilir. Sağlık kurumu yöneticileri işletmenin geçmiş ve bugünkü durumunu betimleyerek, geleceğe yönelik planlamalar yapabilmesi ancak amaca yönelik verileri derleyip bu verileri analiz etmesi ile mümkün olabilir. Verilerin gruplandırılmasında en önemli konular; ilgilenilen değişkenin kesikli ya da sürekli olması, grup sayısı ve grup aralığıdır. Öncelikle elde edilen ham verilerin dizi biçiminde düzenlenmesi gereklidir. Küçükten büyüğe sıralanmış olarak düzenlenen verilerin kaç grupta sınıflandırılacağının belirlenmesi için genellikle Sturges Kuralı kullanılır. Sturges kuralı uygun grup sayısının ve grup aralığının hesaplanmasını sağlamaktadır. Veri derlemek, gözlemi yapılacak birimleri ölçmek veya saymak, sonara da bunları göz önünde buldurulan değişken ya da değişkenlerin hangi konumlarına karşılık geldiklerini belirlemek ve kaydetmektir. Sağlık yöneticileri için veri kaynakları ölümler, doğumlar, hastalıklar ve sağlık hizmetleri konusunda sürekli olarak tutulan kayıtlar veya deneylerle saptanan veriler olabilir. İstatistikte toplanan ilk verilere ham veri olarak tanımlanır. Ham veri herhangi bir düzenleme ve işleme tabii tutulmamış veridir. Sturges kuralı yardımıyla grup sayısını hesaplamak için aşağıdaki matematiksel eşitlik kullanılır: k 1 (3,3 log n) Derlemenin yapılabilmesi için derlemeye ilişkin konu ve gözlenecek birimlerin açık bir biçimde tanımlanarak zaman – mekan dikkate alınarak sınırlandırılması gerekir. k, grup sayısını n ise toplam gözlem sayısını göstermektedir. Grup sayısı belirlendikten sonra grup aralıklarını hesaplamak için veri setindeki gözlenen en küçük ve en büyük değer yardımıyla aşağıdaki eşitlik kullanılır; Derleme verilerin elde ediliş biçimine göre, doğrudan veya dolaylı; hakkında bilgi edinilmek istenin kütlenin tamamının incelenip incelenmemesine göre genel ve kısmi; birimlerin belirli bir anda ve yerde mi yoksa belirli bir zaman aralığı boyunca sürekli olarak kaydedilmesine göre ani veya devamlı derleme olarak sınıflandırılır. c xenb xenk k Bir frekans dağılımında, her sınıfın frekansına bir önceki sınıfın frekansı eklenerek oluşturulan dağılıma birikimli dağılım, bu tür oluşturulan frekanslara da birikimli frekans dağılımları adı verilir. Birikimli frekanslar, küçükten büyüğe ya da büyükten küçüğe oluşturulabilir. Eğer birikimli frekanslar küçükten büyüğe oluşturulmuşsa “-den az”, büyükten küçüğe oluşturulmuşsa “-den çok” olarak isimlendirilir. Birikimli frekanslar, gözlem değerlerinin büyüklüklerine göre kaçıncı sırada yer aldıklarının belirlenmesinde kullanılır. Derlenen veriler doğru, güvenilir, güncel ve en az maliyetle elde edilmiş olmalıdır. Veri toplama teknikleri sistematik veri toplama teknikleri ve özel veri toplama teknikleri olmak üzere ikiye ayrılmaktadır. Sistematik veri kaynakları, kayıtlar, sayımlar ve özel bildirimler, özel veri toplama teknikleri ise; gözlem, görüşme, anket, taramalar ve muayenelerdir. Tablo, elde edilen sayısal veya sözel verilerin satır ve sütünler halinde düzenlenmiş halidir. Tablolar verilerin daha kolay anlaşılmasını sağlar. İstatistiksel verilerin sunulduğu tabloların üç temel özelliği: tablonun hangi bilgiyi içerdiğini gösterir bir başlığının, satır ve sütunlarının olmasıdır. Verileri kolay anlaşılabilir hale getirerek sunmanın bir yolu da grafiklerdir. Grafikler verilerin geometrik şekilleridir. Grafik çizimi belli kurallar çerçevesinde yapılmalıdır. Tablolarda olduğu gibi grafiklerin de konusunu gösteren bir başlığı olmalıdır. Bir grafikte yer alan şekil ve çizgilerin anlamları grafik üzerinde belirtilmelidir. Grafiğin apsis ve ordinat eksenlerinin ölçeklendirilmesi ve bu eksenlerin tanımları grafik üzerinde gösterilmelidir. Grafikte anlaşılması ve yorumlanması zor olan Verilerin daha anlaşılır bir şekilde sunumunu sağlayan diğer bir gösterim grafiklerdir. Bir grafiğin kolayca anlaşılabilir ve çiziminin objektif olması oldukça önemlidir. Aynı zamanda 46 Daire grafikleri tek bir değişkene göre çizilen grafiklerdir. Nitel verilerin grafiksel gösteriminde kullanılmaktadır. Bir nitel değişkenin düzeyleri az olduğunda çoğunlukla daire grafikleri tercih edilmektedir. Dairenin alanı değişkenin düzeylerinin 360 lik daire içindeki paylarına göre parçalara ayrılır. işaretlemeler ve şekillere yer verilmemelidir. Tüm bunlara ek olarak çizilen grafiğin kaynağının da belirtilmesi oldukça önemlidir. Birbirine bitişik dikdörtgenlerden oluşan grafiğe histogram adı verilir. Histogram sürekli nicel veriler için uygun bir gösterim biçimidir. Özellikle aralıklı ölçekle ölçülmüş ve gruplandırılmış verilerin gösteriminde kullanılmaktadır. Histogram çiziminde diğer önemli konulardan biri grupların bölüm aralıklarının eşit olmasıdır. Grup aralıkları eşit olmadığında frekansların ayarlanması gerekmektedir. Histogramda grup aralıkları eşit olduğunda dikdörtgenlerin tabanlarının bir birim olduğu kabul edilmektedir. Grup aralıkları eşit olmadığında dikdörtgen tabanlarının bir birim olacak şekilde düzenlenmesi için frekansların basit matematiksel işlemler ile ayarlanır. Bunun için frekanslar grup aralığına bölünerek dikdörtgenlerin alanları ile grupların frekansları eşit hale getirilir. Çizgi grafikleri nicel bir değişkenin almış olduğu değerlerin frekanslarının dağılımını göstermek için kullanılmaktadır. Çizgi grafikleri, basit ve çoklu çizgi grafikleri olmak üzere ikiye ayrılmaktadır. Çizgi grafikleri belli bir aralıkta grafik üzerinde işaretlenen noktaların bir çizgi ile birleştirilmesi ile oluşturulur. Birikimli dağılımların grafikleri çizilirken gruplar apsiste, birikimli frekanslarda ordinat ekseninde yer alır. Terim sayısı çok olduğu ya da özellikle birkaç dağılımın aynı grafik üzerinde gösterilmesi ve karşılaştırılması söz konusu olduğunda histogram yerine birikimli frekans grafikleri tercih edilmektedir. Nitel verilerin gösteriminde sıklıkla çubuk grafikleri kullanılmaktadır. Bu grafikte, sıralayıcı veya sınıflayıcı ölçekle ölçülmüş değişkenlere ait verilerin sayılarını veya oranlarını gösterilmektedir. Çubuk grafiklerinde gruplar tabanları eşit ve birbirine bitişik olmayan dikdörtgenler ile çizilir. 47 Kendimizi Sınayalım 1. Aşağıdakilerden hangisi istatistik birimi değildir? 6. Aşağıdakilerden hangisiz özel veri toplama tekniklerinden biri değildir? a. Hastane a. Gözlem b. Doktor b. Kayıtlar c. İntihar c. Anket d. Kabus d. Görüşme e. Yangın e. Tarama 2. Bir psikiyatri kliniğine gelen hastaların memnuniyet düzeyleri araştırılmak istenmektedir. Bu olaydaki birim nedir? 7. a. Hastane X Frekans 5 3 7 6 b. Doktor 9 8 c. Memnuniyet 11 11 d. Tanı 13 7 e. Hasta 15 5 Toplam 40 3. Aşağıdaki olaylardan hangisi ani veri derlemeye konu oluşturur? Yukarıda verilen frekans dağlımı için “-den az” birikimli frekanslar oluşturulmak istendiğinde, birikimli frekanslar aşağıdakilerden hangisidir? a. Belli bir yer ve zaman aralığındaki doğumlar b. Belli bir yer ve zamandaki aralığındaki intiharlar a. "-den az" b. "-den az" c. "-den az" c. Nüfus sayımı 3 3 40 d. Belli bir yer ve zamandaki trafik kazaları 9 9 37 e. Belli bir yer ve zamandaki hasta hakları birimine gelen şikayetler 17 15 31 28 25 23 35 38 12 40 40 5 d. "-den az" e. "-den az" 4. Aşağıdakilerden değildir? hangisi derleme türü a. Genel derleme b. Devamlı derleme c. Kısmi derleme 3 3 d. Olay derleme 6 11 e. Ani derleme 8 17 5. Aşağıdakilerden hangisi bir verinin taşıması gereken özelliklerden değildir? 11 32 7 35 40 38 a. Soyut b. Güvenilir c. Güncel d. Doğru e. Düşük maliyet 48 8. Aşağıdaki “-den az” ve “-den çok” birikimli frekanslar birlikte verilmiştir. 10. Aşağıdakilerden hangisi bir taşıması gereken özellik değildir? Gruplar Frekans “-den az” “-den çok” a. Her tablonun bir başlığı olmalıdır. 0-6 20 20 127 6-12 24 44 107 b. Tablo karmaşık olmalı ve çok sayıda bilgi içermelidir. 12-18 35 79 83 c. Tablonun satır ve sütun başlıkları yazılmalıdır. 18-24 26 105 48 d. Tablonun kaynağı belirtilmelidir. 24-30 22 127 22 e. Tabloda kullanılan değişkenin varsa ölçü birimi belirtilmelidir. Yukarıdaki tabloya göre sayısal değeri 18’ den büyük gözlem sayısı kaçtır? a. 105 b. 79 c. 44 d. 48 e. 26 9. Bir hastanenin acil servisine haftanın günlerine göre geliş yoğunluğu aşağıda yer alan daire grafiğinde gösterilmiştir. Pazar 18% Pazartesi 13% Salı 13% Cumartesi 16% Cuma 14% Çarşamba 13% Perşembe 13% Daire grafiği yorumlandığında ifadelerden hangisi yanlıştır? tablonun aşağıdaki a. Acil servise en çok Pazar günleri hasta gelmektedir. b. Salı, Çarşamba ve Perşembe günleri hasta yoğunluğu aynı düzeydedir. c. Pazartesi günü hasta yoğunluğu Cuma gününden fazladır. d. Cumartesi hasta yoğunluğu haftalık hasta yoğunluğunun % 16’ sıdır. e. Hafta sonları acil servis hafta içine göre daha yoğun olmaktadır. 49 Kendimizi Sınayalım Yanıt Anahtarı Sıra Sizde Yanıt Anahtarı 1. d Yanıtınız yanlış ise “Veri ve Derleme” başlıklı konuyu yeniden gözden geçiriniz. Anakütleyi oluşturan birimlerin tamamının gözlenmesi genel derleme olarak tanımlanmaktadır. Anakütleyi oluşturan birimlerin tamamının gözlenmesi yerine olası gözlem birimlerinin bir bölümü seçilerek incelenir. Bu derleme türü kısmi derleme olarak tanımlanır . Sıra Sizde 1 2. e Yanıtınız yanlış ise “Veri ve Derleme” başlıklı konuyu yeniden gözden geçiriniz. 3. c Yanıtınız yanlış ise “Veri ve Derleme” başlıklı konuyu yeniden gözden geçiriniz. 4. d Yanıtınız yanlış ise “Derleme Türleri” başlıklı konuyu yeniden gözden geçiriniz. Sıra Sizde 2 5. a Yanıtınız yanlış ise “Verinin Özellikleri” başlıklı konuyu yeniden gözden geçiriniz. Verinin taşıması gereken dört özellik; doğru, güvenilir, güncel ve düşük maliyetli olmasıdır. 6. b Yanıtınız yanlış ise “Özel Veri Toplama Teknikleri” başlıklı konuyu yeniden gözden geçiriniz. Sıra Sizde 3 Sağlık alanında kullanılan sistematik kaynakları; kayıtlar, sayımlar ve bildirimledir. 7. a Yanıtınız yanlış ise “Birikimli Frekans Dağılımları” başlıklı konuyu yeniden gözden geçiriniz. veri özel Sıra Sizde 4 İstatistiğin üç temel işlevi betimleme, çözümleme ve tahmindir. 8. d Yanıtınız yanlış ise “Birikimli Frekans Dağılımları” başlıklı konuyu yeniden gözden geçiriniz. Sıra Sizde 5 9. c Yanıtınız yanlış ise “Daire Grafiği” başlıklı konuyu yeniden gözden geçiriniz. 1.Grup Sayısının Hesaplanması 10. b Yanıtınız yanlış ise “Tablolar” başlıklı konuyu yeniden gözden geçiriniz. n 50 (toplam gözlem sayısı) log50 1,699 k 1 (3,3 1,699) 6,61 7 Veriler 7 grup altında düzenlenecektir. 2. Grup Aralığının Hesaplanması Veri setimizde kayıt altına alınan en küçük değer 60 yıl ve en büyük değer 73’tür. xenb 73 xenk 60 c 73 60 2 7 Grup aralığının genişliği 2 olacaktır. 50 Sıra Sizde 8 3. Grup sayısı 7 ve grup aralığı 2’ ye göre verilerin tablolaştırılması Gruplar Grafiği çizebilmek için Microsoft Excel kullanılabilir. Tablonun tümünü seçerek kopyalayınız ve Excel’de bir çalışma sayfasına yapıştırınız. Excel’e yapıştırdığınız tablonun tamamını seçerek ekle sekmesinden çubuk grafiği seçilerek grafik çizilir. Frekans 60 - 62’den az 2 62 - 64’den az 6 64 - 66’dan az 8 66 - 68’den az 16 68 - 70’den az 7 70 - 72’den az 6 72 - 74’den az 5 Toplam 50 Sıra Sizde 6 İmaj Oransal Frekans Çok İyi 0,125 İyi 0,400 Orta 0,320 Zayıf 0,095 Çok Zayıf 0,060 Toplam 1,000 Sıra Sizde 9 Sıra Sizde 7 30 Sıra Sizde 10 20 15 10 5 15 30 45 60 75 90 Gruplar 51 Yararlanılan Kaynaklar Anadolu Üniversitesi Açık Öğretim Fakültesi, İstatistik, Editör: Prof. Dr. Ali Fuat Yüzer, AÖF Yayın No: 771, Anadolu Üniversitesi, Eskişehir. Çömlekçi, N. (1997). Temel İstatistik İlke ve Teknikleri, Bilim Teknik Yayınevi, Eskişehir. Çömlekçi, N. (1998). Bilimsel Araştırma Yöntemi ve İstatistiksel Anlamlılık Sınamaları, Bilim Teknik Yayınevi, Eskişehir Gürsakal, N. (2007). Betimsel İstatistik, Nobel Yayın Dağıtım, İstanbul. Serper, Ö. (1988). Uygulamalı İstatistik I, Filiz Kitabevi, İstanbul. Sümbüloğlu, K. (2001). Sağlık Alanına Özel İstatistiksel Teknikler, Somgür Yayıncılık, Ankara. Sağlık istatistikleri yıllığı (2010), T.C. Sağlık Bakanlığı, Bakanlık Yayın no: 832. http://www.tedavi.saglik.gov.tr http://www.sagliknet.saglik.gov.tr http://www.istatistik.saglik.gov.tr 52 3 Amaçlarımız Bu üniteyi tamamladıktan sonra; İstatistik serileri için duyarlı ortalamaları hesaplayabilecek, İstatistik serileri için duyarlı olmayan ortalamaları hesaplayabilecek, İstatistik serileri için değişkenlik ölçülerini hesaplayabilecek bilgi ve becerilere sahip olabilirsiniz. Anahtar Kavramlar Aritmetik ortalama Medyan Tartılı aritmetik ortalama Standart sapma Geometrik ortalama Varyans Mod Değişim katsayısı İçindekiler Giriş Verilerin Özetlenmesi Aritmetik Ortalama Geometrik Ortalama Tartılı Aritmetik Ortalama Mod Medyan Değişkenlik ölçüleri Standart Sapma Değişim katsayısı 54 Ortalamalar ve Değişkenlik Ölçüleri GİRİŞ Bundan önceki bölümlerde, verilerin toplanması, düzenlenmesi (dizi, frekans serisi, gruplandırılmış seri) ve grafiklerle gösterilmesi ayrıntılı olarak anlatıldı. Frekans dağılımları ve grafikler, bir veri seti içindeki değerlerin dağılımı hakkında genel bir fikir vermede etkilidir. Bununla birlikte, daha ileri analizler için, verilerin tek bir değerle ifade edilebileceği, kesin bilgilere ihtiyaç vardır. Bu ünitede, bir veri setinin tek bir değerle ifade edilmesini sağlayan ortalamalar anlatılacaktır. Daha sonra da verilerin bir değer etrafında nasıl dağıldıklarının ölçüsü olarak, değişkenlik ölçüleri açıklanacaktır. VERİLERİN ÖZETLENMESİ Bir araştırma sonucu toplanan verilerin frekans serisi veya gruplandırılmış seri halinde gösterilmesi, veriler hakkında genel fikir verebilir. Yine bu verilerin grafikle gösterilmesi, verilerin nasıl dağıldıkları hakkında genel bir eğilim yansıtır. Ancak bunların hiç biri verilerin tek bir değerle gösterilmesini sağlamazlar. Oysa derlenen verileri “tek bir sayıda” özetleyecek kolay ölçütlere de ihtiyaç vardır. Bu özet veri, araştırma sonunda derlenen verilerin hangi değer etrafında toplandıklarının bir göstergesi olacaktır. Bir seriyi temsil etmeye ve özetlemeye yarayan tek bir rakama “ortalama” denir. Dolayısıyla ortalamalar veri setindeki en küçük değerden daha küçük, en büyük değerden de daha büyük olamazlar. xenk Ortalama xenb Hesaplanan ortalamanın serideki terimlerin çoğuna yakın değer alması, söz konusu ortalamanın seriyi iyi temsil ettiğini gösterir. Ortalamalar hesaplanırken, serideki bütün gözlem değerleri hesaba katılarak hesaplanıyorsa buna “duyarlı ortalamalar”, bazı gözlem değerlerine göre hesaplanıyorsa buna da “duyarlı olmayan ortalamalar” adı verilir. Başka bir ifadeyle ortalama hesaplanırken, gözlem değerlerinden birinin değiştirilmesiyle ortalama değeri değişiyorsa bu duyarlı ortalamadır. Aksi durumda gözlem değerlerinden birinin değiştirilmesi ortalama değerini etkilemiyorsa buna da duyarlı olmayan ortalama denir. Bu ünitede, duyarlı ortalamalardan aritmetik ortalama ve geometrik ortalama, duyarlı olmayan ortalamalardan da mod ve medyan anlatılacaktır. Aritmetik Ortalama Hesaplanması kolay ve çok geniş bir uygulama alanına sahip olduğu için, istatistikte en çok kullanılan ve ortalama denilince akla gelen ilk ortalama “aritmetik ortalama” dır. Aritmetik ortalama, veriler toplamının veri sayısına bölünmesi şeklinde tanımlanabilir. Bir ortalama, ana kütlenin tamamı için hesaplanacağı gibi, ana kütleden seçilen bir örneklem kütlesi için de hesaplanır. Kütledeki birimlerin sayısı, yani kütle büyüklüğü genellikle N ve kütle ortalaması da ile gösterilir. Örneğin, A hastanesinde yatan toplam hasta sayısı 120 kişi ise ve amacımız bu hastaların tamamını incelemek ise kütle mevcudu N=120 olacaktır. Bu hastaların yaş ortalamasını belirlemek istediğimizde, hasta yaşlarının toplamı, 120’ye bölünerek hesaplanacaktır. Yaş değişkeni x ile gösterildiğinde, kütle ortalaması; 55 x1 x2 .... x120 120 olarak hesaplanacaktır. Bilindiği gibi toplam simgesi sembolüyle gösterilir. Bu durumda kütle ortalaması kısaca N x i 1 i N formülüyle belirlenir. Ancak kütle çok büyük olduğunda, bunun tamamını gözlemlemek daha çok maliyet ve zaman gerektirir ya da bazen kütlenin tamamı incelemek imkansız olabilir. Böyle durumlarda daha az sayıda birimle araştırma yapılır. Örneğin Türkiye’deki tüm hastanelerde yatan hastaların incelenmesi oldukça zor olacağından, bunlar arasından çeşitli tekniklerle belirlenen ve “örneklem “olarak ifade edilen, daha az sayıda hasta ile araştırma yapılır. Kütle içinden seçilen birim sayısı da genellikle n simgesiyle gösterilir. n birim için hesaplanılan ortalamaya “örneklem ortalaması” denir ve aşağıdaki gibi hesaplanır: n x x i 1 i n Eğer istatistik serisi, frekans serisi veya gruplandırılmış seri ise aritmetik ortalama, k x x .n i 1 k i i n i i 1 formülüyle hesaplanacaktır. Bu ünitenin ilerleyen sayfalarındaki örnek çözümler aksi belirtilmedikçe örneklem verileri için çözülecektir. Örnek 3.1: Eskişehir Yunus Emre Devlet hastanesi dâhiliye kliniğinde yatarak tedavi gören ve taburcu edilen 10 hastanın, hastanede kalış süreleri gün olarak aşağıdaki gibi elde edilmiştir. Buna göre örneklem ortalamasını hesaplayınız. xi : 8 10 12 15 16 18 20 21 23 25 Çözüm 3.1: Yukarıda ifade edilen örneklem ortalaması formülüne göre, verilerin toplanıp veri sayısına bölünmesi gerekir. O halde veriler toplamı; 10 x =8+10+12+15+16+18+20+21+23+25=168 i 1 i olarak hesaplanacaktır. 168 değeri aynı zamanda terimler toplamı olarak da ifade edilir. Terimler toplamının, terim sayısına bölünmesiyle elde edilecek aritmetik ortalama, n x x i 1 n i 168 16,8 gün olarak hesaplanacaktır. 10 56 Örnek 3.2: A hastanesinin çeşitli kliniklerinde yatan 25 hastalık örneklem seçilmiş ve bu hastaların tedavisi için kullanılan B maddesi tüketimi değerleri ölçülmüş ve tüketen hasta sayılarıyla beraber Tablo 3.1’deki değerler elde edilmiştir. B maddesi tüketim ortalamasını hesaplayınız. Tablo 3.1: B maddesi Tüketim Verileri B Maddesi Tüketimi ( xi ) Hasta Sayısı ( ni ) 120 125 130 135 140 145 150 2 3 5 7 5 2 1 Çözüm 3.2: Yukarıdaki örnekte verilen seri bir frekans serisidir. Frekans serileri için terimler toplamı ise; x i 120+120+125+125+125+…………..+145+145+150 şeklinde belirlenecektir. Ancak bu şekilde hesaplama işlemi uzatacağından, terimler frekanslarla çarpılıp, toplamı alınır. Bu değerler de Tablo 3.2’de verilmiştir: Tablo 3.2: Frekans Serisi İçin Gerekli İşlemler Tablosu x Hasta Sayısı ( ni ) xi .n i 120 125 130 135 140 145 150 Toplam 2 3 5 7 5 2 1 240 375 650 945 700 290 150 3350 Terimler toplamı 3350 olarak hesaplandığına göre, bu değerin frekanslar toplamına bölünmesiyle, verilen frekans serisinin ortalaması hesaplanmış olacaktır. Dolayısıyla B maddesi tüketim ortalaması k x x .n i 1 k i i n i 1 = 3350 134 25 i olarak elde edilecektir. 57 Örnek 3.3: A hastanesinde yatan hastaları arasından tesadüfi olarak seçilen 40 hastanın tedavi süreleri ve hasta sayıları Tablo 3.3’deki gibi elde edilmiştir. Aritmetik ortalamayı hesaplayınız. Tablo 3.3: Örnek 3.3 Verileri Tedavi Süresi (Gün) Hasta Sayısı ( ni ) 3-5 5-7 7-9 9-11 11-13 13-15 15-17 3 5 9 12 7 3 1 Çözüm 3.3: Verilen seri gruplandırılmış bir seridir. Gruplandırılmış serilerin aritmetik ortalaması da frekans serilerindeki gibi hesaplanır. Ancak xi değerlerinin hesaplanması gerekir. xi değerleri de her bir grubun (3 5) 4 olarak elde edilecektir. 2 Diğer gruplara ilişkin grup ortalamaları da benzer şekilde hesaplandığında Tablo 3.4’de verilen sonuçlara ulaşılacaktır. ortalaması alınarak hesaplanır. Örneğin, 3-5 grubu için xi değeri Tablo 3.4: Gruplandırılmış Seri İçin Gerekli İşlemler Tablosu Grup Ortalaması ni xi .n i 4 6 8 10 12 14 16 Toplam 3 5 9 12 7 3 1 40 12 30 72 120 84 42 16 376 Yine, terimler toplamı olan 376 değeri, frekanslar toplamı olan 40 değerine bölündüğünde, istenilen ortalama değeri, k x x .n i 1 k i i n i 1 = 376 9, 4 40 i gün olarak hesaplanacaktır. Ancak belirtmek gerekir ki, gruplandırılmış serilerde aritmetik ortalama hesaplanırken, her bir grubun ortalaması alındığından, gruplandırılmış serilerdeki aritmetik ortalama yaklaşık olarak hesaplanabilmektedir. Aritmetik ortalama, aşırı küçük veya büyük değerlerden etkilenen bir ortalamadır. Dolayısıyla veriler içinde, diğer verilere nazaran aşırı küçük veya büyük değerler olması durumunda, aritmetik ortalama tüm 58 verileri temsil eden bir ortalama olmayacaktır. Böyle durumlarda ise temsili olabilecek yani, verilerin geneline yakın olabilecek ortalama geometrik ortalamadır. Geometrik Ortalama Bir istatistik serisindeki veriler geometrik olarak artıyorsa ya da diğer verilere nazaran aşırı büyük ya da küçük değerler varsa, bu durumda aritmetik ortalama temsili olmayacağından, geometrik ortalama hesaplanır. Mikroorganizmaların çoğalması, nüfus artışı, gibi birbirinin katları olarak çoğalan yani geometrik artış gösteren verilerde geometrik ortalama kullanılır. Diziler için geometrik ortalama aşağıdaki gibi hesaplanır: G.O n x1.x2 .......xn Ancak veri sayısı çok olduğunda bu şekilde hesaplamak zorlaşacağından, önce xi ’lerin her birinin e tabanına göre doğal logaritması olan “ln” leri alınır, daha sonra bunların toplamı terim sayısına bölünür. En sonunda bulunan bu sayının exponansiyeli alınır ve aşağıdaki gibi hesaplanır. G.O e ( ln xi ) n Gruplandırılmış ve frekans serilerinde ise aşağıdaki formülle belirlenir: ni ln xi ) n G.O e i ( Örnek 3.4: Bir hafta boyunca A hastanesinin acil servisine gelen hasta sayıları aşağıdaki gibi elde edilmiştir. Buna göre en uygun (temsili) ortalamayı hesaplayınız. Tablo 3.5: Acil Servise Gelen Hasta Sayıları Günler xi 1 2 3 4 5 6 7 12 15 10 18 13 11 100 Çözüm 3.4: Seri incelendiğinde, son değerin diğer verilerden oldukça büyük olduğu görülecektir. Böyle durumlarda aritmetik ortalama, serideki aşırı büyük verilerden etkileneceğinden temsili olmayacaktır. Dolayısıyla duyarlı ortalamalardan geometrik ortalamanın hesaplanması gerekir. Çözümleme için önce verilerin “ln” değerleri hesaplanacaktır. Bu değerler de Tablo 3.6’da verilmiştir. 59 Tablo 3.6: Geometrik Ortalama İçin ln Değerleri Günler xi ln( xi ) 1 2 3 4 5 6 7 Toplam 12 15 10 18 13 11 100 2,48 2,71 2,30 2,89 2,56 2,40 4,61 19,95 ln değerlerinin toplamı formülde yerine yazıldığında, G.O e ( ln xi ) n e ( 19,95 ) 7 e2,85 17, 29 olarak bulunacaktır. Aynı serinin aritmetik ortalaması hesaplandığında ise 25,57 olarak elde edilecekti. Dolayısıyla serideki 100 değeri, aritmetik ortalamayı gerçek değerinin çok üzerine çıkarttığından, aritmetik ortalama temsili ortalama olmayacaktır. Aşağıdaki istatistik serisi için temsili olabilecek duyarlı ortalamayı hesaplayınız. xi ni 5 3 7 7 10 10 13 4 500 1 Tartılı Aritmetik Ortalama Ortalamaların ve oranların ortalamaları hesaplanmak istendiğinde ya da farklı zaman ve yerde yapılan deney sonuçlarını birleştirerek ortak bir değer hesaplama gerektiğinde, “tartılı aritmetik ortalama” ni ‘ler tartı olmak üzere, ortalamaların ortalaması, hesaplanır. k xt x .n i 1 k i i n i i 1 formülüyle belirlenirken, oranları göstermek üzere oranların ortalaması da aşağıdaki gibi hesaplanır: k pt n p i 1 k i i n i 1 i 60 Örnek 3.5: A ilacı ile tedavi edilen akut ishalli hastalardaki serum gereksinimleri, Tablo 3.7‘deki gibi olsun. Buna göre 5 klinikte hastalar için kullanılan serum miktarı ortalamasını hesaplayınız. Tablo 3.7: Örnek 3.5 Verileri Klinik Adı Ortalama Serum Miktarı(kg) Tedaviye Katılan Hasta Sayısı( ni ) A B C D E 75 92 71 18 60 4,5 3,6 3,9 5,9 4,8 Çözüm 3.5: Veriler incelendiğinde, kliniklerde tedaviye katılan hasta sayıları farklı olduğundan, bu verilerin çözümü için tartılı aritmetik ortalama kullanılacaktır. Verilen serum miktarları da ortalama değerler olduğundan, ortalamaların ortalaması için verilen formül yardımıyla hesaplanacaktır. Tedaviye katılan hasta sayıları tartı olmak üzere, gerekli hesaplamalar Tablo 3.8‘de verilmiştir: Tablo 3.8: Tartılı Aritmetik Ortalama İçin Gerekli İşlemler Tablosu Klinik Adı Tedaviye Katılan Hasta A B C D E Toplam 75 92 71 18 60 316 Ortalama serum Sayısı ( ni ) miktarı (kg) 4,5 3,6 3,9 5,9 4,8 xi xi ni 337,5 331,2 276,9 106,2 288,0 1339,8 Hesaplanılan toplam formülde yerine yazıldığında, 5 klinikte kullanılan serum miktarı ortalaması 5 xt x .n i 1 5 i i n = 1339,8 4, 24 kg olarak belirlenecektir. 316 i i 1 Örnek 3.6: 4 farklı klinikte, B anti-kanser ilacının deneme sonuçları aşağıdaki gibi elde edilmiştir. 4 klinikteki hayatta kalan hasta oranını hesaplayınız. Tablo 3.9: Örnek 3.6 Verileri Klinik Adı Denemeye Katılan Hasta Sayısı( ni ) A B C D 98 65 76 28 61 3. yılda hayatta kalan kanserli hasta oranı (%) 53,9 28,5 61,2 38,6 Çözüm 3.6: Bu örnekte de kliniklerdeki denemeye katılan hasta sayıları farklı olduğundan tartılı ortalama hesaplanacaktır. Ancak bir önceki örnekten farklı olarak, ortalamalar yerine oranlar söz konusudur. O halde oranlar için tartılı ortalama formülü kullanılacaktır. Bir önceki soruda olduğu gibi ni ‘ler tartı olmak üzere gerekli hesaplamalar Tablo 3.10‘da verilmiştir: Tablo 3.10: Oranların Ortalaması İçin Gerekli İşlemler Tablosu Klinik Adı ni pi (%) ni pi A B C D Toplam 98 65 76 28 267 53,9 28,5 61,2 38,6 5282,2 1852,5 4651,2 1080,8 12866,7 Gerekli toplamlar formülde yerine yazıldığında, 4 klinik için oranların ortalaması aşağıdaki gibi elde edilecektir: Gerekli toplamlar formülde yerine yazıldığında, 4 klinik için oranların ortalaması aşağıdaki gibi elde edilecektir: 5 pt n p i 1 5 i i n i 1 12866, 7 48,19 267 i Dolayısıyla 4 klinikte, 3 yılsonunda hastaların hayatta kalma oranları %48,19 dur. Şimdiye kadar anlatılan ortalamalar serideki tüm verilere göre hesaplanan ortalamalardı. Oysa bazı ortalamalar, bir serideki tüm gözlemleri dikkate almadan hesaplanır. Bundan sonraki kısımda da tüm verileri hesaba katmadan belirlenen ve “duyarlı olmayan ortalamalar” olarak isimlendirilen “mod” ve “medyan” açıklanacaktır. Mod İstatistikte, diziler ve frekans serileri için hesaplanması en kolay ortalama mod değeridir. Bir dizide en çok tekrarlanan değere “Mod” değeri denir. Frekans serlerinde bu değer en yüksek frekansa sahip olan değer olacaktır. Dizilerde ve frekans serilerinde mod değerini belirlemek oldukça basit olmasına rağmen, gruplandırılmış serilerde ise aşağıdaki formül yardımıyla belirlenecektir: Mod La 1 cm 1 2 La : Mod grubunun alt değeri, 1 : Mod grubunun frekansı ile bir önceki grubun frekansı arasındaki fark, 2 : Mod grubunun frekansı ile bir sonraki grubun frekansı arasındaki fark, cm : Mod grubunun aralığıdır. Gruplandırılmış serilerde frekans değeri en yüksek olan grup mod grubu olarak tanımlanır. Eğer grup aralıkları farklı ise grup aralıkları ünite 2’de anlatıldığı gibi ayarlanır. 62 Örnek 3.7: B hastanesinde çalışan 15 personelin kullandığı yıllık izin süreleri gün olarak aşağıda verilmiştir. Bu veriler için mod değerini hesaplayınız. 13 12 14 15 18 22 25 15 30 18 24 18 17 23 16 Çözüm 3.7: Veriler incelendiğinde en fazla görülen izin süresinin 18 olduğu yani, 3 defa yer aldığı görülecektir. Dolayısıyla aranılan mod değeri 18 gün olacaktır. Örnek 3.2’deki veriler için mod değerini hesaplayınız. Örnek 3.8: Tablo 3.11’deki gruplandırılmış seri için mod değerini hesaplayınız. Tablo 3.11: B Maddesi Tüketim Verileri B Maddesi Tüketimi Hasta Sayısı ( ni ) 6 8 12 17 9 7 5 110-115 115-120 120-130 130-140 140-150 150-155 155-160 Çözüm 3.8: En yüksek frekansın (17) bulunduğu grup, mod grubudur (130-140). Dolayısıyla mod grubunun alt değeri 130’dur. Mod grubunun frekansı 17 ve bir önceki grubun frekansı da 12 olduğuna göre, arasındaki fark 17-12=5 olacaktır. Yine mod grubundan sonraki frekans 9 olduğuna göre, bunun farkı da 17-9=8’dir. Mod grubunun aralığı da 140-130=10 olduğuna göre, formülde yer alan değerler aşağıdaki gibi olacaktır: La =130 1 =5 2 =8 cm =10 Belirlenen bu değerler formülde yerine yazıldığında mod değeri, Mod La 1 5 50 cm 130 10 130 130 3,85 133,85 1 2 58 13 olarak hesaplanacaktır. 63 Medyan Küçükten büyüğe sıralanmış verileri, iki eşit kısma ayıran ve tam ortaya düşen değere Medyan (ortanca değer) adı verilir. Dizilerde medyan hesabı oldukça kolaydır. Önce gözlem sayısı 2’ye bölünür (n/2). Eğer (n/2) bir tamsayı değilse, bu değer tamsayıya çevrilir. Aranan medyan değeri de tam ortaya düşen bu gözlem değeridir. Örneğin, veri sayısı 17 olsun. 17/2 değeri 8,5 olacağından, bu değer tamsayıya çevrildiğinde 9 olacaktır. ( n 1 ). Dolayısıyla medyan değeri küçükten büyüğe sıralanmış veri setindeki 2 9. değer olacaktır (x9). Eğer (n/2) tamsayı ise aranılan medyan değeri aşağıdaki gibi belirlenir: M1/ 2 xn / 2 x( n / 2) 1 2 Frekans serilerinde medyan değerini hesaplayabilmek için frekans serisindeki gözlem değerlerinin sırasının bilinmesi gerekir. Bu nedenle küçükten büyüğe “birikimli frekanslar” oluşturulur ve medyan değeri dizilerdeki gibi hesaplanır. Gruplandırılmış serilerde medyan hesabı ise aşağıdaki formülle hesaplanacaktır: M 1/ 2 n na La 2 cm nm Formüldeki; La : Medyan grubunun alt değeri, na : Medyan grubundan önceki grupların frekanslar toplamı, nm : Grup frekansı, cm : Medyan grubunun aralığı’dır. Örnek 3.9: Örnek 3.1 ‘deki veriler için medyan değerini hesaplayınız. Çözüm 3.9: Çözüm için önce n/2 değerini hesaplamak gerekir. Örneğimizde n=10 olduğuna göre 10/2=5 olarak hesaplanacaktır. 5 değeri bir tamsayı olduğuna göre medyan değeri M1/ 2 x10/ 2 x(10/ 2) 1 2 x5 x6 formülünden, 2 5 ve 6. terimin ortalaması olarak elde edilecektir. Terimleri küçükten büyüğe sıralanmış serideki 5 nci değer 16, 6 ncı değer de 18 olduğuna göre, medyan değeri M1/ 2 16 18 17 gün olacaktır. 2 64 Örnek 3.10: Örnek 3.2’deki veriler için medyan değerini hesaplayınız. Çözüm 3.10: Veriler frekans serisi şeklinde olduğundan, medyan değerinin hesaplanabilmesi için, birikimli frekanslara ihtiyaç vardır. Birikimli frekansların bulunduğu tablo ise aşağıda verilmiştir: Tablo 3.12: Örnek 3.10 İçin Birikimli Frekanslar Tablosu B Maddesi Tüketimi ( xi ) Hasta Sayısı ( ni ) Birikimli Frekanslar n i 120 125 130 135 140 145 150 2 3 5 7 5 2 1 2 5 10 17 22 24 25 n 25 12,5 olduğundan ve tamsayı olmadığından 2 2 bu değer yuvarlatılarak tamsayıya 13 olarak çevrilir. Yani medyan değeri 13. değerdir. Bu da birikimli frekanslarda 11. değerden 18. değere kadar olan 135 değeri olacaktır. Şimdi de (n/2) değerinin belirlenmesi gerekir. Örnek 3.11: Örnek 3.3’deki veriler için medyan değerini hesaplayınız. Çözüm 3.11: Örnek 3.3’deki veriler gruplandırılmış bir seri olduğuna göre önce medyan grubunun bulunduğu grubu belirlemek gerekir. Bunun için de yine birikimli frekanslar hesaplanacaktır. Birikimli frekanslar Tablo 3.13’de verilmiştir: Tablo 3.13: Örnek 3.11 İçin Birikimli Frekanslar Tablosu Tedavi Süresi (Gün) Hasta Sayısı ( ni ) Birikimli Frekanslar 3-5 5-7 7-9 9-11 11-13 13-15 15-17 3 5 9 12 7 3 1 3 8 17 29 36 39 40 n i Birikimli frekanslar belirlendikten sonra medyan grubunu belirleyebilmek için n/2=40/2=20 değeri belirlenir. 18. değerden 29. değere kadar olan veriler 9-11 grubundadır. O halde aranılan medyan grubu 911 grubudur. Dolayısıyla medyan grubunun alt değeri 9 olacaktır. Birikimli frekanslara bakıldığında, medyan grubundan önceki frekanslar toplamının 17 olduğu görülmektedir. Medyan’nın grup frekansı 12 ve medyan grubunun grup aralığı da 11-9=2 olarak hesaplanacaktır. Formülde yer alan bu değerler düzenli bir şekilde yazılırsa aşağıdaki gibi elde edilecektir: 65 La = 9 na = 17 nm = 12 cm : 2 Bu değerler formülde yerine yazılarak gerekli işlemler yapıldığında, M1/ 2 n 40 na 17 2 La cm 9 2 2 nm 12 M1/ 2 9 3 2 9 0,5 9,5 12 olarak hesaplanacaktır. O halde aranılan medyan 9,5 değeridir. DEĞİŞKENLİK ÖLÇÜLERİ Ortalamalar, serileri özetlemek için gerekli olsa da gözlem değerlerinin birbirine yakınlık derecesini belirlemediğinden yeterli değildir. Ortalamaları aynı olan seriler birbirinden çok farklı olabilir. Dolayısıyla bir istatistik serisi incelenirken gözlem değerlerinin ortalaması yanında, ortalama etrafındaki dağılımlarına da ihtiyaç vardır. Bir istatistik serisini oluşturan gözlem değerlerinin birbirlerinden ya da ortalamadan uzaklıkları, verilerin nasıl değişim gösterdiğini belirtir. Bunları hesaplamaya yarayan ölçülere de “değişkenlik ölçüleri” denir. Ortalamalarda olduğu gibi yine bu ünitede istatistikte en sık kullanılan değişkenlik ölçüleri olan standart sapma ve değişim katsayısı anlatılacaktır. Standart Sapma İstatistikte en sık kullanılan değişkenlik ölçüsü standart sapmadır. Standart sapma ve karesi olan varyans pek çok istatistiksel analize temel oluşturur. Dizilerde ana kütle standart sapması, (x ) 2 i N formülüyle hesaplanır. Bunun karesi olan 2 ise “ana kütle varyansı” olarak ifade edilir. Örneklem standart sapması ise s ile ifade edilir ve aşağıdaki gibi belirlenir: s (x X ) 2 i n 2 Bunun karesi olan s değerine ise “örneklem varyansı” denir. Frekans serilerinde ve gruplandırılmış serilerde örneklem standart sapması, s n (x X ) i 2 i n formülü yardımıyla hesaplanır. 66 Örnek 3.12: Özel bir hastanede çalışan personelin tamamının yaşları Tablo 3.14’de verilmiştir. Standart sapmayı hesaplayarak yorumlayınız. Tablo 3.14: Hastanede Çalışan Personelin Yaşları 56 32 36 41 45 48 41 56 48 26 33 56 55 42 32 53 34 35 32 53 27 48 44 40 42 39 54 28 47 30 36 29 32 38 41 42 43 28 22 43 40 38 53 35 43 33 28 54 36 33 Çözüm 3.12: Çalışan personelin tamamı incelendiğinden, hesaplanacak standart sapma ana kütle için olacaktır. Terimlerin ortalamadan sapmalarının kareleri toplamını belirleyebilmek için, ana kütle ortalamasını hesaplamak gerekir. Bunun için de ana kütledeki tüm terimlerin toplamına ihtiyaç vardır. Terimlerin tamamı toplandığında 2000 olarak elde edilecektir. Dolaylısıyla ana kütle ortalaması, N x i 2000 40 olarak hesaplanacaktır. Şimdi de tüm terimlerin ana kütle ortalaması olan N 50 40 değerinden çıkartılarak karelerinin alınması gerekmektedir. Yani sırasıyla i 1 (56-40)2+(32-40)2+(36-40)2+(41-40)2+…+(54-40)2+(36-40)2+(33-40)2 hesaplanarak, bunların toplamı alınacaktır. Bu değer ise 4104 olarak bulunacaktır. Buradan da ana kütle standart sapması, (x ) i N 2 4104 82, 08 9, 06 50 olarak hesaplanacaktır. O halde incelenen serinin terimleri, ortalaması olan 40 değerinden, ortalama olarak 9,06 birimlik bir sapma gösterecektir. Örnek 3.11’deki verilerden 8 birimlik bir örneklem çekilerek 54, 43, 30, 34, 48, 35, 53 ve 39 değerleri elde edilmiştir. Standart sapmayı hesaplayınız. 67 Örnek 3.13: Örnek 3.3’deki veriler için standart sapmayı hesaplayınız. Çözüm 3.13: Standart sapmayı hesaplayabilmek için öncelikle serinin ortalaması hesaplanmalıdır. Serinin ortalaması Örnek 3.3’te 9,4 olarak hesaplanmıştı. Bu seri bir frekans serisi olduğuna göre, terimlerin ortalamadan sapmalarının kareleri, frekanslarla çarpılarak toplanacaktır. Bu işlemler de izleyen tabloda açık bir şekilde verilmiştir: Tablo 3.15: Standart Sapmanın Hesaplanması İçin Gerekli İşlemler Tablosu Grup Ortalaması ni ni .( xi x )2 4 6 8 10 12 14 16 Toplam 3 5 9 12 7 3 1 40 3.(4-9,4)2=87,48 5.(6-9,4)2=57,80 9.(8-9,4)2=17,64 12.(10-9,4)2=4,32 7.(12-9,4)2=47,32 3.(14-9,4)2=63,48 1.(16-9,4)2=43,56 321,60 Gerekli toplamlar, frekans serisi için verilen standart sapma formülünde yerine yazıldığında, s n (x x ) i i n 2 321, 60 8, 04 2,84 40 gün olarak bulunur. Dolayısıyla “terimler ortalama 9,4 değerinden ortalama olarak 2,84 günlük bir sapma gösterir” şeklinde yorumlanır. Mutlak bir ölçü olan standart sapma, gözlem değerlerinin büyüklüğünden etkilenen bir ölçüdür. Ayrıca ölçü birimleri farklı olan serilerin karşılaştırılmasında da standart sapma kullanılamaz. Dolayısıyla ölçü birimleri (cm, lt, hg v.b), ve terimlerin değeri farklı olan serilerin karşılaştırılmasında değişim katsayısı kullanılır. Değişim Katsayısı Standart sapmanın, aritmetik ortalamaya bölünmesiyle elde edilen değişim katsayısı, oransal bir ölçüdür. Dolayısıyla değişim katsayısı terimlerin büyüklüğünden ve ölçü birimlerinden etkilenmez. Değişim katsayısı aşağıdaki formülle hesaplanır: D.K s x Mutlak bir ölçü olan standart sapmanın aksine, değişim katsayısının ölçü birimi yoktur. Çünkü formülün pay ve paydasında yer alan ve aynı ölçü birimine sahip olan standart sapma ve aritmetik ortalama birbirine bölündüğü için, sonuçta ölçü birimine sahip olmayan bir oran kalır. Tek bir serinin değişkenliğini belirlemek için çok kullanışlı olmayan değişim katsayısı, daha çok iki ve daha fazla serinin karşılaştırılması için kullanılır. Değişim katsayısı küçük olan serilerin, diğerlerine göre daha az değişken olduğu ifade edilecektir. Bunun anlamı ise değişim katsayısı küçük olan serinin daha homojen yani birbirine daha yakın terimlerden oluştuğudur. 68 Örnek 3.14: Tablo 3.16’da verilen serilerden hangisinin değişkenliğinin daha fazla olduğunu belirleyiniz. Tablo 3.16: A ve B Maddesi Tüketim Verileri A Maddesi Tüketimi (gr) 110 115 120 130 140 150 160 B Maddesi Tüketimi (cm) 125 132 140 160 200 225 300 Çözüm 3.14: Hatırlanacağı gibi serilerin değişkenliğini belirleyebilmek için kullanılan ölçüler, standart sapma ve değişim katsayısıdır. Ancak bu iki serinin ölçü birimleri farklı olduğundan, bunların karşılaştırılabilmesi için kullanılacak değişkenlik ölçüsü, değişim katsayısı olacaktır. Değişim katsayısının hesaplanabilmesi için de serilerin ortalaması ve standart sapmasına ihtiyaç vardır. Bu iki seri için hesaplanılan ortalama ve standart sapma Tablo 3.17’de verilmiştir. Tablo 3.17: Değişim Katsayısı İçin Hesaplanan Ortalama ve Standart Sapma Verileri s x A Maddesi Tüketimi (gr) 17,29 132,14 B Maddesi Tüketimi (cm) 58,66 183,14 A maddesinin tüketimi için değişim katsayısı, D.K s 17, 29 0,13 x 132,14 olarak hesaplanırken, B maddesinin tüketimi için, D.K s 58, 66 0,32 x 183,14 şeklinde belirlenecektir. Bu sonuçlara göre, B maddesi tüketimi için hesaplanılan %32 değeri, A maddesinin tüketimi için belirlenen %13 değerinden daha büyüktür. Dolayısıyla, B maddesi tüketimi serisinin değişkenliği, A maddesi tüketimi serisinin değişkenliğinden daha fazladır. MICROSOFT EXCEL OFFICE UYGULAMALARI Şimdiye kadar ortalamalar ve değişkenlik ölçülerinin teorik yapısı anlatılarak, konuya ilişkin sayısal örnekler çözüldü. Bu kısımda da bazı örneklerin Excel’de nasıl çözümlendiği anlatılacaktır. Ancak hemen belirtmek gerekir ki, Excel’in doğrudan hesapladığı seriler, basit seri şeklindedir. Öncelikle basit bir seri için aritmetik ortalamanın nasıl hesaplandığı anlatılacaktır. Bunun için Excel’de yeni bir çalışma sayfası açarak, daha önce çözülen Örnek 3.1’deki verileri A kolonuna giriniz. Daha sonra “Formüller” menüsü tıklanarak buradan “Tüm İşlevler” ve “İstatistiksel” menüsü tıklanır. Şimdi karşımıza çıkan pencereden, “ORTALAMA” işlevi tıklanır. Bunların nasıl yapılacağı ayrıca aşağıda gösterilmiştir. 69 Şimdi karşımıza çıkan pencerede, ortalaması hesaplanacak verilerin seçilmesi gerekir. Veriler A2-A11 arasında olduğu için, bu aralık seçilerek “Tamam” tıklandığında, aritmetik ortalamanın hesaplanarak A13 kolonuna yazıldığı görülecektir (İşlem yapılırken hangi hücre seçilmişse, değer oraya yazılır). 70 Şimdi de sırasıyla geometrik ortalama, mod, medyan ve standart sapma’nın hesaplanmasına ilişkin uygulama yapılacaktır. Bunun için aşağıda da görüldüğü gibi, A kolonuna Örnek 3.4, C kolonuna Örnek 3.6, E kolonuna Örnek 3.1 ve G kolonuna da Sıra Sizde 3 verilerini giriniz. Aritmetik ortalamanın hesaplanmasında olduğu gibi yine “Formüller-Tüm İşlevler ve İstatistiksel” menüsü tıklanarak karşımıza çıkan pencerede geometrik ortalama için “GEOORT”, mod için “ENÇOK_OLAN”, medyan için “ORTANCA” ve standart sapma için de “STDSAPMAS” tıklanarak işlemler yaptırılır. Bu işlemlerin sonucunu da ayrıntılı olarak aşağıda verilmiştir. 71 Özet Verilerin tek bir değerle ifade edilebilmelerini sağlayan ortalamalar, verilerin nasıl dağıldıkları konusunda yeterince fikir veremezler. Bazı serilerde veriler birbirine yakın yani, homojen olabilirler. Bazen de gözlem değerleri birbirinden oldukça farklı dağılmış yani, heterojen olabilirler. İşte verilerin nasıl bir dağılım gösterdiklerini belirleyebilmek için de değişkenlik ölçülerine gereksinim vardır. İstatistikte verilerin nasıl bir değişkenlik gösterdiğini belirleyebilmek için kullanılan ve yine ilk akla gelen ölçü ise standart sapmadır. Ancak standart sapma verilerin büyüklüğünden etkilenen bir ölçüdür. Yani büyük rakamlardan oluşan bir serinin standart sapması, küçük rakamlardan oluşan serinin standart sapmasından daima daha büyüktür. Dolayısıyla terim büyüklükleri veya ölçü birimleri farklı serilerin karşılaştırılmasında kullanılacak değişkenlik ölçüsü ise değişim katsayısıdır. Bir araştırmada toplanan verilerin tek bir değerle gösterilmesi, hem verilerin özetlenmesi açısından hem de daha ileri analizlerin kullanılabilmesi için oldukça önemlidir. Verilerin tek bir değerle gösterilebildiği bu ölçütlere ortalama denir. Serideki tüm verileri dahil ederek hesaplanan ortalamalar duyarlı, verilerin tamamı dahil edilmeden hesaplanan ortalamalar ise duyarlı olmayan ortalamalar olarak adlandırılır. Duyarlı ortalamalardan aritmetik ortalama ise, ortalama denilince akla gelen ilk ortalamadır. Ancak bazı durumlarda aritmetik ortalamanın hesaplanması mümkün olmayabilir. Böyle durumlarda ise duyarlı ortalamalardan geometrik ortalama veya duyarlı olmayan ortalamalardan mod ve medyan hesaplanabilir. Dolayısıyla aritmetik ortalama çok sık kullanılan bir ortalama olmasına rağmen, özel durumlarda uygun ortalamaların kullanılması gerekir. Eğer elimizde farklı zamanlarda veya farklı yerlerde elde edilmiş deney sonuçları varsa ve bunlar da ortalama veya oran şeklinde ise, bunların ortalamaları için tartılı aritmetik ortalama kullanılacaktır. 72 Kendimizi Sınayalım 1. 6 çocuğun vücut ağılığı 30, 32, 28, 34, 24 ve 32 olarak belirlenmiştir. Aritmetik ortalamasının değeri aşağıdakilerden hangisidir? 5. 3. sorudaki veriler için aşağıdakilerden hangisidir? a. 28 b. 127,37 b. 30 c. 98,56 c. 32 d. 114,44 d. 34 e. 102,65 e. 24 6. 3. sorudaki veriler için varyans değeri aşağıdakilerden hangisidir? a. 135,46 a. 10,67 b. 165,86 b. 9,26 c. 19,92 c. 6,78 d. 17,65 d. 5,52 e. 142,10 e. 3,27 7. Bir hafta boyunca A hastanesi acil servisine başvuran hasta sayıları aşağıdaki gibi elde edilmiştir: Kişi Sayısı 95-100 10 100-110 14 110-120 18 120-130 13 130-140 8 değeri a. 111,56 2. 1. sorudaki veriler için standart sapmanın değeri aşağıdakilerden hangisidir? Gruplar mod 20, 28, 17, 25, 12, 23, 15 Bu veriler için medyan değeri aşağıdakilerden hangisidir? a. 25 b. 15 3. Yukarıda verilen gruplandırılmış seri için aritmetik ortalama değeri aşağıdakilerden hangisidir? c. 17 d. 23 a. 114,60 e. 20 b. 120,87 8. 7. Sorudaki veriler için değişim katsayısının değeri aşağıdakilerden hangisidir? c. 105,45 a. 0,13 d. 130,58 b. 0,52 e. 118,79 c. 0,44 4. 3. Sorudaki veriler için medyan değeri aşağıdakilerden hangisidir? d. 0,26 e. 0,72 a. 121,44 b. 132,42 c. 114,17 d. 118,26 e. 125,19 73 9. Aşağıdakilerden hangisi varyansının simgesidir? ana kütle Kendimizi Sınayalım Yanıt Anahtarı a. s b. s c. 1. b Yanıtınız yanlış ise “aritmetik ortalama” başlıklı konuyu yeniden gözden geçiriniz. 2 2. e Yanıtınız yanlış ise “standart sapma” başlıklı konuyu yeniden gözden geçiriniz. d. e. 3. a Yanıtınız yanlış ise “aritmetik ortalama” başlıklı konuyu yeniden gözden geçiriniz. 2 4. c Yanıtınız yanlış ise “Medyan” başlıklı konuyu yeniden gözden geçiriniz. 10. Bir istatistik serisinde diğer verilerden aşırı büyük bir değer varsa duyarlı ortalamalardan hangisi hesaplanmalıdır? 5. d Yanıtınız yanlış ise “Mod” başlıklı konuyu yeniden gözden geçiriniz. a. Aritmetik ortalama 6. e Yanıtınız yanlış ise “Standart sapma” başlıklı konuyu yeniden gözden geçiriniz. b. Geometrik ortalama c. Tartılı aritmetik ortalama 7. a Yanıtınız yanlış ise “Medyan” başlıklı konuyu yeniden gözden geçiriniz. d. Mod e. Medyan 8. d Yanıtınız yanlış ise “Değişim katsayısı” başlıklı konuyu yeniden gözden geçiriniz. 9. e Yanıtınız yanlış ise “Standart sapma” başlıklı konuyu yeniden gözden geçiriniz. 10. b Yanıtınız yanlış ise “Geometrik ortalama” başlıklı konuyu yeniden gözden geçiriniz. 74 Sıra Sizde Yanıt Anahtarı Yararlanılan Kaynaklar Sıra Sizde 1 Çömlekçi, N. (1998). Temel İstatistik İlke ve Teknikleri, Bilim Teknik Yayınevi, Eskişehir. xi ni ln xi 5 3 1,61 4,83 7 7 1,95 13,65 10 10 2,3 23 13 4 2,56 10,24 500 1 6,21 6,21 Toplam ni ln xi Devore, J. ve Peck, R. (1990), Introductory Statistics, West. Freund, J.E. ve Simon, G.A. (1 997), Modern Elementary Statistics, Prentice Hall, New Jersey. Özdamar, (1985). Biyoistatistik, Bilim Teknik Yayınevi, Eskişehir. 57,93 Serper, Ö. (2004). Uygulamalı İstatistik 1, Ezgi Kitabevi, Bursa. ni ln xi ) 57,93 ni 2,32 25 G .O e e e 10,18 ( Sümbüloğlu, K. ve Sümbüloğlu. V. (2002), Biyoistatistik, Hatipoğlu Yayınevi, Ankara. Sıra Sizde 2 Örnek 3.2’deki veriler için en yüksek frekans 7 olduğuna göre, aranılan mod değeri 135 olacaktır. Sıra Sizde 3 ( xi x )2 2 54 (54-42) =144 43 (43-42) = 2 1 2 30 (30-42) =144 34 (34-42) = 64 48 (48-42) = 36 35 (35-42) = 49 53 (53-42) =121 39 (39-42) = 2 2 2 2 2 336 9 568 n x x i 336 42 8 n i 1 ) ( x X 2 s i n 568 8 71 8, 43 75 4 Amaçlarımız Bu üniteyi tamamladıktan sonra; Nüfusun yapısı ve dinamiklerini tanımlayabilecek, Sağlık alanında, nüfus ile ilgili verilerin önemini açıklayabilecek, Sağlık alanında sıklıkla kullanılan istatistiksel yöntemleri tanımlayarak, hesaplayabilecek, Hastanelerdeki sağlık hizmetlerinin değerlendirilmesini yapabilecek, İstatistiklere ait formülleri belirleyerek, verilen istatistikleri hesaplayabilecek bilgi ve becerilerine sahip olabilirsiniz. Anahtar Kavramlar Nüfus ve yapısı Mortalite Hız Odds Oranı Oran Göreli risk Nüfus piramidi Yaşam tablosu İnsidans, prevelans İçindekiler Giriş Nüfusun yapısı ve özellikleri Hız ve oran Hastalıklarla ilgili istatistikler Koruyucu sağlık hizmetleri Sunulan sağlık hizmetlerinin düzeyini gösteren ölçütler Yaşam tabloları Hastalık ve ölüm nedenlerinin uluslararası sınıflandırılması Hastanedeki sağlık hizmetlerinin değerlendirilmesi 76 Sağlık Alanına Özel İstatistiksel Yöntemler GİRİŞ Bu bölümde, toplumun nüfus yapısı, bu yapıyı etkileyen faktörler tanımlanacak ve sıklıkla kullanılan sağlık alanına özel istatistiksel teknikler hakkında bilgi verilecektir. Çözümlü örnekler aracılığı ile konuların kavranması sağlanacaktır. Sağlık alanında kullanılan istatistiksel yöntemlerin temel amacı; Bölgenin uzun, orta ve kısa vadede sağlıkla ilgili hizmet planlamasını yapmak, Sağlık kurumlarındaki tedavi hizmetlerinin aksamadan yürümesini sağlamak, doktor ve personel sayısını düzenlemek, Sağlık kurumlarındaki hastaların bakım ve tedavi hizmetlerinin sürekliliğini sağlamak, toplum dinamiklerine göre yeniden düzenlemek ve değerlendirmek, Sağlık kurumlarında verilen hizmetin kalitesini arttırmak, Belirli aralıklarla, doktor, yardımcı sağlık personeli, hasta ve hasta yakınlarının bilgi, tutum ve davranışlarını araştırarak sağlık hizmetlerinin en iyi şekilde yürütülmesini sağlamak, Yapılacak olan bilimsel çalışmalara en doğru bilgiyi sağlamak, bu çalışmalara yol göstermek, Sağlık çalışanlarının, kendi alanlarında değerlendirebilmesini sağlamaktır. yayınlanan güncel bilimsel çalışmaları Başka bir tanımla sağlık istatistiği; sağlık hizmetlerinde, sağlık hizmetlerinin planlanmasında, sağlıkla ilgili bilimsel araştırmaların yürütülmesinde, hizmet göstergesi olarak, koruyucu sağlık hizmetlerinde, tedavi edici sağlık hizmetlerinde, toplumun sağlık düzeyinin belirlenmesinde, yükseltilmesinde ve toplumda sağlık alanındaki değişimlerin incelenmesinde kullanılmaktadır. İlgilenilen bölgenin coğrafi, sosyal, ekonomik, demografik ve sağlık açısından göstergelerini belirlemek için sağlık örgütünün hangi tür verilere gereksinim duyacağı ve toplanan verilerin içeriğinin ne olacağı, bu sağlık sisteminin yönetim biçimine, sağlıkta ulaşılması istenen hedeflere ve içeriğine bağlıdır. Sağlık enformasyon sistemlerinin etkin ve yaygın olmadığı bir ülke ya da bölgede iyi bir sağlık planlaması ve sağlığın iyi bir şekilde yönetilmesinden sözetmek oldukça zordur. NÜFUSUN YAPISI VE ÖZELLİKLERİ Hastane yöneticileri hizmet verecekleri bölgenin nüfus yapısını iyi bilmeli ve ona göre vereceği sağlık hizmetlerini planlama yoluna gitmelidir. Bir bölgedeki sağlık ile ilgili hizmetlerin örgütlenmesi, tedavi hizmetlerinin yürütmesi ve zaman içerisinde yeniden düzenlenmesi çalışmalarında bölgenin nüfusu ve nüfusun yapısal özelliklerine öncelikle başvurulmaktadır. Günümüzde nüfus yapısını ayrıntılı olarak incelemeden yapılacak olan hizmet planlamasının başarılı olması neredeyse imkânsızdır. Buna ilave olarak nüfus; bölgeye ait hız ve oranların hesaplanılmasında kullanılan önemli bir veridir. Bu bakımdan nüfus ve nüfusun yapısı sağlık yöneticilerinin, planlayıcıların, ekonomistlerin ve istatistikçilerin en çok yararlandıkları veridir. 77 Nüfus, belirli bir zamanda sınırları belirlenmiş bir bölgede yaşayan insan sayısı olarak tanımlanabilir. Bir ülkenin ya da bölgenin sağlık ile ilgili istatistiklerinin, hız ve oranlarının hesaplanmasında bölgenin nüfusu ve nüfusun yapısal özelliklerinden yararlanılmaktadır. Bölgede belirli bir zamandaki yaşayan bireylerin sayılarak çeşitli özelliklerinin kaydedilmesi işlemine nüfus sayımı denir. Nüfus sayımları iki farklı yöntemle yapılmaktadır. Bunlar; De facto, sayım anında bireylerin bulundukları bölge içerisinde sayılmasıdır. De jure, sayım anında bireylerin bulundukları bölge içerisinde değil sürekli oturma yerlerindeki nüfusta sayılması yöntemidir. Nüfus sayımları yoluyla belirli bir zamanda, bir yerleşim birimindeki insan grubunun demografik özellikleri saptanmaya çalışılır. Bu sayımların amacı, erkek-kadın nüfusu belirlemek, eğitim durumunu belirlemek, nüfusun yaşa göre dağılımını belirlemek vb. olarak sayılabilir. Ülkemizde, nüfusumuzun sayı ve demografik özelliklerini belirlemek amacıyla Cumhuriyet’in kuruluşundan günümüze kadar pek çok nüfus sayımı yapılmıştır. Birincisi 1927 yılında, ikincisi 1935 yılında ve bu tarihten sonra 1990'a kadar her 5 yılda bir aksatılmadan nüfus sayımı tekrarlanmıştır. 1990'dan sonra ise nüfus sayımı 2000 yılında yapılmış ve her 10 yılda yapılmasına karar verilmiştir. Bu arada 1997 yılında bir sayım yapılmıştır. Fakat bu sayım nüfus tesbiti olarak adlandırılmıştır. Seçmen kütüklerinin güncelleştirilmesine yönelik bu sayımda, yerleşim yerleri itibariyle ikametgâha dayalı sayısal sonuçlar elde edilmiş, sosyal ve ekonomik bilgiler bu sayımda yer almamıştır. Ülkemizde yapılan nüfus sayımlarına ait tarihler, nüfusumuz ve artış hızları Tablo 4.1’de görülmektedir. 2000 yılı sonuçlarındaki yıllık nüfus artış hızı rakamı 1990-2000 dönemine aittir. Tablo 4.1: Yıllara ilişkin nüfusumuz ve artış hızları YILLAR NÜFUS Artış Hızı (binde) 20.10.1927 13.648.270 - 20.10.1935 16.158.018 21,10 20.10.1940 21.10.1945 17.820.950 18.790.174 19,59 10,59 22.10.1950 20.947.188 21,73 23.10.1955 24.064.763 27,75 23.10.1960 27.754.820 28,53 24.10.1965 31.391.421 24,63 25.10.1970 26.10.1975 35.605.176 40.347.719 25,19 25,01 12.10.1980 44.736.957 20,65 20.10.1985 50.664.458 24,88 21.10.1990 56.473.035 21,71 30.11.1997 62.865.574 15,08 22.10.2000 67.803.927 18,28 2007(1) 2008(1) 70.586.256 71.517.100 13,10 2009(1) 72.561.312 14,50 (1) 73.722.988 15,88 2010 (1) Adrese Dayalı Nüfus Kayıt Sistemi (ADNKS) 78 Sağlık kurumu yöneticisinin hizmet verdiği bölgeye ait bir takım düzenlemeleri yapabilmesi için bölgeye ait nüfus yapısı hakkında öncelikle bilmesi gereken tanım, açıklamalar ve hesaplamalar aşağıda verilmiştir. Yıl ortası nüfus (YON) Bir bölgenin belirli bir yıl içindeki 30 Haziran ya da 1 Temmuz tarihindeki nüfusudur. 3 farklı şekilde hesaplanır. ı şı ü ı ü ( ) ( ) Eğer sadece her yılın başında nüfus sayımı yapılıyor ise yıl ortası nüfus, Ülkelerin veya bölgelerin nüfusları, belli yaş gruplarındaki insanların yoğunluklarına göre farklı isimlerle anılmaktadır. Eğer, 65 ve daha üzeri yaştaki insanlar (65+), toplumun %10’undan fazla ise bu tür toplumların nüfus yapısına yaşlı nüfus adı verilmektedir. Endüstriyel toplumların nüfus yapıları yaşlı nüfusa örnek olarak verilebilir. 15 yaş altı nüfusun, genel nüfus içerisindeki oranı yüksek ise bu tür toplumların nüfus yapısına genç nüfus adı verilir. Özellikle bu oran %40’ın üzerinde ise bu tür toplumlara genç nüfuslu toplumlar denir. Genellikle geri kalmış ülkeler ya da bölgelerin nüfusları bu özelliği taşımaktadır. 0-14 yaş nüfusu tüm topluma oranlandığında %30-40, 15-64 yaş nüfusu %50-60, 65+ yaş nüfusu ise %5-9 oranlarında yoğunluğa sahip olan bölgelere orta yaşlı nüfus adı verilir. Kalkınmakta olan ülkelerin nüfus yapıları bu formdadır. Sağlık kurumlarının yöneticileri ve planlayıcılar nüfusun genel yapısını bilmeli ve faaliyetlerini toplumun nüfus yapısı doğrultusunda şekillendirmelidir. Nüfusun yapısını etkileyen başlıca faktörler; doğumlar, ölümler, göçler, evlenme ve boşanmalardır. Doğumlar ve ölümler genellikle nüfusun sayısını, içe ve dışa göçler hem nüfusun sayısını hem de yapısını etkiler. Evlenmeler ve boşanmalar ise nüfusun medeni durum yapısındaki değişikliğe, dolayısıyla da doğumlarda artış ya da azalışa neden olur. Bu olaylar kısaca nüfus hareketleri olarak isimlendirilmektedir. Nüfusla İlgili Hız ve Oranlar Sağlık kurumu yönetcisi, nüfusun bölgedeki dağılımı, hizmet verilen bölgedeki nüfusun yoğunluğunu, kadın- erkek oranını, bölgedeki nüfus artış hızını, nüfusun yaşa ve cinsiyete göre dağılımını bilmek zorundadır. Sağlık hizmeti verilecek olan hedef toplumun nüfus yapısı ve özellikleri bilinmiyorsa, yapılan hizmetin etkinliğinden sözetmekte mümkün olamaz. Bu nedenle bölgenin nüfus yapısına göre yönetici, kurumunu organize etmeli, hizmet vereceği hedef toplumu tanımalı, toplumdaki hastalık profillerini çıkarmalı, personel eksikliklerini tamamlamalı ve verilecek olan sağlık hizmetini hasta kabulünden, hastanın tedavisi sonlanıncaya kadar planlamalıdır. Aşağıda bazı hız ve oranlara ait tanım ve hesaplamalar verilmiştir 79 Nüfus yoğunluğu Bir bölgedeki kilometre kare başına düşen nüfusu gösteren bir ölçüdür. Aşağıdaki biçimde hesaplanır. ( ) Nüfus Artış Hızı (NAH) Bir bölgenin nüfusunda bir yıl içerisindeki doğumlar ve ölümlere bağlı olarak nasıl bir artış ya da azalışın olduğunu ifade eden bir kavramdır. Aşağıdaki gibi hesaplanmaktadır. ( ) [ ] Cinsellik Oranı (CO) Bölge nüfusunda her 100 kadına düşen erkek sayısını belirleyen bir ölçüdür. Cinsellik oranı aşağıdaki gibi hesaplamaktadır. ( ) Nüfus Piramidi Nüfus pramidi, nüfusun yaş ve cinsiyet yapısını incelemeyi sağlayan grafiksel bir yöntemdir. Aynı zamanda nüfusun yaş ve cinsiyet yapısını bir zaman dilimi içerisinde değerlendirme olanağı sağlamaktadır. Bu grafiksel yöntemde nüfusun yaşa ve cinsiyete göre dağılımı beşerli yaş gruplarına göre gösterilir. 0-4 yaş grubu tabanda, 90+ yaş grubu tavanda olacak şekilde artan beşli yaş grupları yukarıya doğru orantılı olarak yatay dikdörtgen çubuklar dizilerek çizilmektedir. Farklı iki cinsiyete ait aynı yaş grubundaki verileri, toplam nüfus içerisindeki yoğunluğunu da dikkate alarak karşılaştırma olanağı sağlar. Nüfus pramitleri ülkelerin sosyo-ekonomik yapıları hakkında da önemli bilgiler vermektedir. Aşağıda Şekil 4.1’de nüfus piramitlerine ilişkin bazı örnekler verilmiştir. Geri kalmış ülkeler Gelişmekte olan ülkeler Gelişmiş ülkeler Sanayileşmiş Ülkeler Şekil 4.1: Nüfus pramitlerine ilişkin bazı örnekler Seçilmiş bazı ülkelerin 2010 yılı nüfus piramitleri Şekil 4.2’de verilmiştir. (Kaynak: U.S. Census Bureau http://www.census.gov) 80 Şekil 4.2: Seçilmiş bazı ülkelerin 2010 yılı nüfus piramitleri TÜİK verilerine göre, Türkiye’nin kadın ve erkek nüfusundan ve yaş gruplarından yararlanılarak çizilen 2007 yılına ait nüfus piramidi Şekil 4.3’te, 2010 yıllarına ait nüfus piramidi ise Şekil 4.4’te verilmiştir. Üç yıl gibi kısa bir sürede, nüfustaki değişim karşılaştırmalı olarak bu piramitlerden görülmektedir. 81 90+ 85-89 80-84 75-79 70-74 65-69 60-64 55-59 50-54 45-49 40-44 35-39 30-34 25-29 20-24 15-19 10-14 5-9 0-4 -4000000 90+ 85-89 80-84 75-79 70-74 65-69 60-64 55-59 50-54 45-49 40-44 35-39 30-34 25-29 20-24 15-19 10-14 5-9 0-4 -4000000 Kadın Erkek -2000000 0 2000000 Şekil 4.3: Türkiye’nin 2007 yılına ait nüfus pramidi 4000000 Kadın Erkek -2000000 0 2000000 Şekil 4.4: Türkiye’nin 2010 yılına ait nüfus pramidi 82 4000000 HIZ VE ORAN Birçok alanda olduğu gibi sağlık alanında da bölgelere ait nüfus profillerinin belirlenmesi aşamasında hız, oran ve diğer istatistiklerden sıklıkla yararlanılmaktadır. Oran (proportion) ve hız (rate) bir bölgede meydana gelen olayların yüzde (%), binde ( ), onbinde,… gibi değerlerle sunulmasını sağlayan göstergelerdir. Hesaplanılan hız ve oranlar sağlıkta verilen hizmetlerin kalitesi hakkında bilgiler vermekte, standartlar yardımıyla da önceki yıllara göre kurumun kendini değerlendirmesine veya kurumlararası karşılaştırmalara olanak sağlamaktadır. Sayılarla karşılaştırma yerine hız ve oranlarla yapılan karşılaştırmalar sağlık kurumlarının yöneticilerine pek çok yönden avantajlar sağlamaktadır. Hız, sağlık olaylarının belirli bir bölgede görülme sıklığını belirlemek amacıyla kullanılır. Olayın görülme sayısının, bölgedeki tüm nüfusa bölünmesiyle elde edilir. (belli bir zaman diliminde ölenlerin sayısının (a), ölen ve yaşayanların (b) toplamına oranıdır (a/a+b)). Örnek olarak, “2011 yılında trafik kazalarında ölenlerin toplam nüfusa (kazalarda ölenlerde dahil tüm nüfus) bölünmesi” verilebilir. Oran, bir olayının diğerine göre ne boyutta olduğunu ifade eder. Bir miktarın kendi bütünü içerisindeki payı olarakta tanımlanabilir. Hasta sayısının sağlam nüfusa oranı, 15-49 yaş grubundaki sigara kullanan erkeklerin kullanmayanlara oranı ya da kontrol yöntemi olarak RİA (rahim içi araç) kullanan kadınların, kullanmayan kadınlara oranıdır (a/b). Sağlık kurumu yöneticileri ve sağlık planlayıcıları bölgenin demografik yapısını belli aralıklarla takip etmelidir. Toplum dinamiklerinin ne yönde değiştiğini saptamalı ona göre kurumlarını yönetmelidirler. Dünya’da, sağlık alanına ilişkin demografik göstergeler, nüfus, evlenmeler, boşanmalar, doğum, ölüm ve hastalıklara göre benzer şekillerde hesaplanmaktadır. Sağlık hizmetlerinin değerlendirilmesinde sıklıkla kullanılan hız ve oranlar aşağıda açıklanmıştır. Evlenmeler Evlenme; Türk Medeni Kanunu’na göre evlenmeye ehil erkek ve kadının, yetkili kanuni merci önünde yapmış oldukları çift taraflı bir akittir. Bölgede olan evlenmelerin sayısı ve evlenen çiftlerin özellikleri hakkındaki veriler, ana-çocuk sağlığı ve aile planlaması hizmetlerinin örgütlenmesi, yürütümü ve yeniden düzenlenmesi aşamalarının planlanmasında kullanılır. Evlenmelerle ilgili olarak evlenme akdinin yapıldığı il, ilçe, bucak veya köy verileri derlenmektedir. Bunun yanında evlenen kadın ve erkeğin; doğum yeri ve yılı, uyruğu, ana dili, dini, eğitimi, evlenmeden önceki medeni durumu, kaçıncı evliliği olduğu, önceki evliliklerinden olup da bakmakla yükümlü olduğu çocuk sayısı, evlenmeden önceki daimi oturduğu yer, mesleği gibi bilgiler toplanmaktadır. Evlenmelerle ilgili veri kaynakları ise TÜİK’in yayınladığı Evlenme İstatistikleri, Türkiye nüfus araştırmaları ve özel araştırmalardır. Evlenme verilerinin değerlendirilmesinde evlenenlerin; cinsiyete göre yaş ortalamaları, oturulan bölgeye göre yaş ortalamaları, cinsiyete göre eğitim düzeyleri, evlenme sayıları, evlenmeden önceki medeni durumları, oturdukları illere göre dağılımı, mesleklere göre dağılımı, önceki evliliklerindeki çocuk sayıları, evlendikleri yaşlara göre dağılımları, din ve ana dillerine göre dağılımları, uyruklarına göre dağılımı hesaplanabilmektedir. 2010 yılı TÜİK verilerine göre Türkiye’de yaş gruplarına göre damat ve gelin sayıları Tablo 4.2’de verilmiştir. Tablo 4.2: Türkiye’de 2010 yılında yaş gruplarına göre Damat ve Gelin sayıları Damat Gelin 16-19 14.824 134.874 20-24 163.791 212.923 25-29 237.474 132.952 30-34 91.054 45.817 35-39 30.276 19.409 40-44 13.729 9.326 Kaynak: (TÜİK, 2010, http://www.tuik.gov.tr) 83 45-49 9.237 6.057 50-54 6.326 3.675 55+ 12.679 4.470 Tablo 4.2 verilerinden yararlanılarak çizilen Şekil 4.5 incelenecek olursa, yaş grupları ile damat ve gelin sayıları arasındaki ilişki daha iyi anlaşılabilir. Grafikte, bayanların büyük çoğunluğunun 20-24 yaş grubunda, erkeklerin ise büyük çoğunluğunun 25-29 yaş grubunda evlenmiş oldukları açıkça görülmektedir. Damat Gelin 400 350 300 250 200 150 100 50 0 16-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55+ Şekil 4.5: 2010 yılında yaş gruplarına göre damat ve gelin sayıları Sağlık kurumları yöneticisi hizmet verdiği toplumdaki evlenmelerle ilgili olarak ana ve çocuk sağlığı, aile planlaması, aşılama hizmetleri vb. sağlık hizmetlerinide düzenlemelidir. Evlenmelerle İlgili Hız ve Oranlar Evlenmelerle ilgili olarak sıklıkla kullanılan hızlar aşağıdaki gibi sıralanabilir. Genel Evlenme Hızı Evlenelebilecek Yaşa Özel Evlenme Hızı Kadınlara Özel Evlenme Hızı Erkeklere Özel Evlenme Hızı Genel Evlenme Hızı (GEH) Belirli bir yıl içerisindeki evlenme sayısının o yıla ait yıl ortası nüfusa bölünmesi ile hesaplanır. Binde olarak yorumlanır. Örnek 4.1: Bir bölgede 2010 yılı içerisinde 178 evlenme gerçekleşmiştir. Bu bölgenin yıl ortası nüfusu ise 327.147’dir. Eldeki bilgilere göre genel evlenme hızını hesaplayınız. ( Bölgenin 2010 yılı genel evlenme hızı ’tür 84 ) Erkeklere Özel Evlenme Hızı (EÖEH) Belirli bir yıl içerisindeki evlenen erkek sayısının o yıla ait evlenebilecek yaşta olan erkeklerin yıl ortası nüfusuna bölünmesi ile hesaplanır. Binde olarak yorumlanır. Kadınlara Özel Evlenme Hızı (KÖEH) Belirli bir yıl içerisindeki evlenen kadın sayısının o yıla ait evlenebilecek yaşta olan kadınların yıl ortası nüfusuna bölünmesi ile hesaplanır. Binde olarak yorumlanır. Örnek 4.2: Bir bölgede 2010 yılı içerisinde evlenen kadın sayısı 347’dir. 2010 yılı evlenebilecek yaştaki kadın yıl ortası nüfusu 6.219 ise kadınlara özel evlenme hızını hesaplayınız. Bölgenin 2010 yılı kadınlara özel evlenme oranı ’dir. Evlenilebilecek Yaşa Özel Evlenme Hızı (EYÖEH) Belirli bir yıl içerisindeki evlenme sayısının o yıla ait evlenebilecek yaşta olan erkek ve kadın yıl ortası nüfusuna bölünmesi ile hesaplanır. Binde olarak yorumlanır. Bir bölgede 2011 yılı içerisinde 422 evlenme gerçekleşmiştir. Bu bölgenin Genel Evlenme Hızı olduğuna göre yıl ortası nüfusu kaçtır? Boşanmalar Boşanma, evlenmenin yasal olarak sona erdirilmesidir. Diğer bir ifade ile erkek ile kadının, yeniden evlenmelerine hukuki bir engel kalmayacak şekilde hukuki bir kararla evliliklerini tamamen sona erdirmeleridir. Boşanmalara ilişkin veriler, Medeni Kanun'un 4 Ekim 1926 tarihinde yürürlüğe girmesinden sonra Türkiye geneli için toplanmaktadır. Boşanmalara ait bilgiler 2003 yılına kadar Türkiye İstatistik Kurumu tarafından asliye hukuk ve aile mahkemeleri kanalıyla üçer aylık dönemler halinde derlenmekteydi. İçişleri Bakanlığı Nüfus ve Vatandaşlık İşleri Genel Müdürlüğü ile Türkiye İstatistik Kurumu arasında 7 Şubat 2006 tarihinde yapılan bir protokol ile 2003 yılından sonra boşanmalara ait bilgiler, Merkezi Nüfus İdaresi Sistemi (MERNİS) veri tabanından elde edilerek yayımlanmaya başlanmıştır. Bölgede olan boşanmaların sayısı ve boşanan çiftlerin belirli özellikleri hakkında toplanan verilerden, Ana-çocuk sağlığı, aile planlaması hizmetlerinin örgütlenmesi, yürütülmesi ve yeniden yapılandırılarak düzenlenmesi aşamalarının planlanmasında yararlanılır. Ayrıca sağlık kurumu yöneticisi boşanmaların sık olduğu bir bölgede, boşanan çiftlerin ve çocuklarının ruh-sinir hastalıkları tedavilerinin planlanması ve 85 düzenlenmesi, psikolojik danışmanlıkların arttırılması ve sağlıklı birey, aile ve toplum yapısının oluşturulması, korunması çabalarını desteklemelidir. Boşanmalarla ilgili olarak birçok veri toplanmaktadır. Bunlar; boşanma davasını açan taraf, boşanma nedeni, kadın ve erkeğin doğum tarihi, eğitim durumu ve mesleği, evlenme tarihi, boşanma davasının açıldığı tarih, boşanma davasının sonuçlandığı tarih, bu evlilik içinde doğan çocuk sayısı gibi verilerdir. Sonlanan her boşanma davası için yetkili mahkemenin doldurduğu ve savcılıkça altı ayda bir TÜİK’e gönderilen Boşanma İstatistik Formu ve bu formların derlenmesiyle her yıl TÜİK tarafından yayınlanan Boşanma İstatistikleri isimli yayın konu ile ilgili önemli bir veri kaynağıdır. Buna ilaveten, özel araştırmalar ve nüfus sayımı yoluyla da boşanmalar hakkında veri toplanabilmektedir. Boşanmalara ilişkin verilerin analiz edilmesinde, yıllara göre boşanma sayıları ve oranları, illere göre dağılımı, yaşlara göre dağılımı, cinsiyete göre dağılımı, boşanma nedenlerine göre dağılımı, evlilik süresine göre dağılımı, davanın süresine göre dağılımı, çocuk sayısına göre dağılımı, kadın-erkek yaşlarına göre dağılımı, davayı açan tarafa göre dağılımı, eğitim düzeyine göre dağılımı, mesleklere göre dağılımı gibi istatistikler için hız ve oranlar yardımıyla hesaplanmaktadır. Türkiye’de 2010 yılında dava süresine göre boşanma sayıları Tablo 4.3’te verilmiştir. Bu verilere göre 2010 yılında toplam 118.568 boşanma olmuştur. Tablo 4.3: Türkiye’de 2010 yılında dava sürelerine göre boşanma sayılarının dağılımı Dava Süresi (Ay) <2 2-4 5-8 9-12 13-18 19-24 25-35 36 + Bilinmeyen Toplam Sayı 34.738 29.254 20.114 10.754 8.255 4.628 5.910 3.560 1.355 118.568 Yüzde 29,3 24,7 17,0 9,1 7,0 3,9 5,0 3,0 1,1 100,0 Kaynak: TÜİK, 2011 Türkiye’de 2010 yılında nedenine göre boşanma sayıları Tablo 4.4’te evlilik süresine göre boşanmalar ise Tablo 4.5’te verilmiştir. Tablo 4.4: Türkiye’de 2010 yılında nedenine göre boşanma sayılarının dağılımı Sebep Geçimsizlik Terk Zina Akıl sağlığı Cürüm ve haysiyetsizlik Cana kast ve pek fena muamele Diğer Bilinmeyen Toplam Kaynak: TÜİK, 2011 86 Sayı 113.039 317 90 42 37 32 1.414 3.597 118.568 Yüzde 95,3 ,3 ,1 ,0 ,0 ,0 1,2 3,0 100,0 Tablo 4.5: Türkiye’de 2010 yılında evlilik süresine göre boşanma sayıları Evlilik süresi Sayı 3.967 43.310 24.940 17.528 28.433 390 118.568 1 yıldan az 1-5 yıl 6-10 yıl 11-15 yıl 16+ yıl Bilinmeyen Toplam Yüzde 3,3 36,5 21,0 14,8 24,0 ,3 100,0 Kaynak: TÜİK , 2011 Boşanmalar için sıklıkla kullanılan hız ve oranlar aşağıda tanımlanmış ve hesaplamaları hakkında bilgiler verilmiştir. Boşanmalarla İlgili Hız ve Oranlar Kaba Boşanma Hızı (KBH) Belirli bir yıl içerisinde olan boşanma sayısının o yıla ait yıl ortası nüfusa bölünmesi ile hesaplanır. Binde olarak ifade edilir. Aşağıdaki şekilde hesaplanır. 2007-2010 yılları arasında TÜİK verilerine göre Türkiye’deki kaba boşanma hızları Tablo 6’da verilmiştir. Tablo 4.6: 2007-2010 yılları için Kaba Boşanma Hızları YIL 2007 2008 2009 2010 HIZ (‰) 1,34 1,40 1,58 1,62 Kaynak: TÜİK, 2011 Bir bölgede 2011 yılı içerisinde toplam 4.214 boşanma olmuştur. Anılan yıla ait bölgenin yıl ortası nüfusu 2.417.813 olduğuna göre Kaba Boşanma Hızını hesaplayınız. Genel Boşanma Hızı (GBH) Belirli bir yıl içerisinde olan boşanma sayısının o yıla ait boşanabilir nüfusun yıl ortası nüfusuna (16 ve yukarı yaş) bölünmesi ile hesaplanır. Binde olarak ifade edilir. Aşağıdaki şekilde hesaplanır. 87 Cinsiyete Özel Boşanma Hızı (CÖBH) Bir yıl içerisinde olan boşanma sayısının o yıla ait kadın ya da erkek yıl ortası nüfusuna bölünmesi ile elde edilir. Binde olarak ifade edilir. Aşağıdaki şekilde hesaplanır. ( ) Yaşa ve Cinsiyete Özel Boşanma Hızı (YCÖBH) Bir yıl içerisinde x yaşında ve c cinsiyetinde olan boşanma sayısının o yıla ait x yaş ve c cinsiyetindeki yıl ortası nüfusa bölünmesi ile elde edilir. Binde olarak ifade edilir. Aşağıdaki şekilde hesaplanır. ( ) Bunların dışında, evlilik süresine özel, yaşayan çocuk sayısına özel, mesleğe özel, eğitim düzeyine özel, ilk evlilikte kadın ve kocasının yaşına özel vb. boşanma hızlarıda isteğe bağlı olarak hesaplanılabilmektedir. Doğumlar Hastane hizmetlerinin değerlendirilmesinde doğumlar oldukça önemli bir yer tutmaktadır. Kurum yöneticisi ya da sağlık planlayıcısı bilmelidir ki; özellikle, hastaneler, bölgeler ve ülkeler arası karşılaştırmalarda bebek doğum ve ölüm istatistikleri en önemli sağlık göstergesidir. Bu amaçla bölgeye sağlık hizmeti verecek yönetici ve personele öncelikle bazı tanım ve açıklamaları yapmak uygun olacaktır. Canlı Doğum, çocuğun doğduğu andan itibaren en az birkaç dakika yaşadığı, ağlama, nefes alma ve hareket etme gibi hayat belirtileri gösterdiği doğumdur. Diğer bir ifade ile gebelik süresini dikkate almadan anne vücudundan ayrıldığı anda soluk alan, kalp atımı, kordonda nabız ve çizgili adalelerin hareketi gibi herhangi bir yaşam belirtisi gösteren gebelik sanucuna canlı doğum denir. Fetüs Ölümü (Ölü doğum) ise gebelik süresini dikkate almadan anne vücudundan ayrıldığı anda soluk almayan, kalp atımı, kordonda nabız ve çizgili adalelerin hareketi gibi herhangi bir yaşam belirtisi göstermeyen gebelik sonucuna ölü doğum adı verilir. Erken Fetüs Ölümü (Düşük) : Gebelik süresi 28 haftadan az olan fetüs ölümüdür. Geç Fetüs Ölümü (Ölü Doğum) : Gebelik süresi 28 haftadan çok olan fetüs ölümüdür. Prematüre Doğum: Gebelik süresi 37 haftadan (259 günden) az olan canlı doğum Normal Doğum: Gebelik süresi 38-42 hafta arası olan canlı doğum Sürmatüre Doğum (Gecikmiş doğum, sürmatürasyon): Gebelik süresi 42 haftadan fazla olan canlı doğumdur. Bebeğindoğduğu andaki ağırlığına göre de doğumlar 4’e ayrılmaktadır. Bunlar; <1.500gr Çok düşük Doğum Ağırlığı 1.500-2.499gr Düşük Doğum Ağırlığı 2.500-4.250gr Normal Doğum Ağırlığı >4.250gr Tosuncuk olarak adlandırılmaktadır. 88 Doğum sonrasında bebekle ilgili olarak, bebeğin doğum şekli, canlı doğum, ölü doğum, bebeğin cinsiyeti, doğum ağırlığı, boyu ve baş çevresi, gebelik haftası, doğum yeri, doğuma yardım eden kişi vb gibi veriler kayıt altına alınmaktadır. Bebeğin annesi ile ilgili olarak yaşı, gebelik sayısı, canlı doğum sayısı, düşük sayısı, yaşayan çocuk sayısı, yaşları ve cinsiyetleri, ölen çocuk sayısı, ölüm yaşları ve cinsiyetleri, evlilik süresi, eğitimi, mesleği veya işi, geliri, oturduğu bölge gibi veriler derlenmektedir. Bebeğin babası ile ilgili olarak ise, yaşı, eğitimi, mesleği ve geliri gibi veriler toplanmaktadır. Doğumlarla ilgili olarak birçok istatistik hesaplanmaktadır. Bunlardan en sık kullanılanlar; kaba doğum hızı, genel doğurganlık hızı, evli kadınlara özel doğum hızı, yaşa özel doğurganlık hızı ve toplam doğurganlık hızıdır. Doğumlarla İlgili Hız ve Oranlar Kaba Doğum Hızı (KDH) Belirli bir yıl içindeki canlı doğum sayısının yıl ortası nüfusa bölünmesiyle elde edilir ve her bin nüfusa kaç tane canlı doğum düştüğünü gösterir. UNICEF’in 2005 yılına ait verilerine göre bazı ülkelerin Kaba doğum hızları (KDH) ve Kaba ölüm hızları (KÖH) Tablo 4.7’de verilmiştir. Tablo 4.7: 2005 yılına ait UNICEF verilerine göre seçilmiş bazı ülkelerin KDH ve KÖH değerleri Seçilmiş bazı ülkeler Japonya İngiltere Almanya Türkiye Hindistan Pakistan Etiyopya Kaba Doğum Hızı 9 11 8 20 23 30 40 Kaba Ölüm Hızı 8 10 10 7 9 8 16 Örnek 4.3: A ülkesinde, 2011 yılındaki canlı doğan bebek sayısı 1.380.000 olarak belirlenmiştir. Bu ülkenin 2011 yılına ait yıl ortası nüfusu ise 70.231.000’dir. Eldeki verilere göre ülkenin 2011 yılı kaba doğum hızını hesaplayınız. A ülkesinin 2011 yılı KDH ‰19,6 olarak elde edilmiştir. Genel Doğurganlık Hızı (GDH) Belirli bir yılda doğurgan çağda olan 16-49 yaş grubundaki her 1.000 kadına düşen canlı doğum sayısını gösterir. Aşağıdaki şekilde hesaplanır. 89 Örnek 4.4: 2009 yılında bir ülkede 1.241.617 canlı doğum olmuştur. Bu ülkenin 16-49 yaş kadın yıl ortası nüfusu 1.9109.000’dur. Buna göre genel doğurganlık hızını hesaplayınız. Ülkesinin 2009 yılı GDH ‰64,98 olarak elde edilmiştir. Bir bölgenin 2011 yılına ait 16-49 yaş grubu kadın sayısı 816.411 ve aynı bölgedeki canlı doğum sayısı 62.993’tür. Bölgenin 2011 yılı Genel Doğurganlık Hızını hesaplayınız Yaşa Özel Doğurganlık Hızı (YÖDH) Belirli bir yaş ya da yaş grubundaki kadınların 1 yıl içinde yaptıkları canlı doğum sayısının o yaş grubundaki kadın yıl ortası nüfusuna bölünmesiyle bulunur. Belirli bir yaş grubundaki her 1.000 kadın başına düşen doğum sayısını gösterir. Örnek 4.5: Türkiye’de 2009 yılında, 30-34 yaş grubundaki kadınların yıl içinde yaptıkları canlı doğum sayısı 241.718 olarak saptanmıştır. 30-34 yaş grubu kadınların yıl ortası nüfusu 2.900.000’dir. Buna göre yaşa özel doğurganlık hızını aşağıdaki şekilde hesaplanır. (örnek varsayımsaldır) 30-34 yaş grubundaki her 1000 kadına 83 canlı doğum düşmektedir. Evli Kadınlara Özel Doğurganlık Hızı (EKÖDH) Belirli bir yıl içindeki toplam canlı doğum sayısının 15-49 yaş arası evli kadın yıl ortası nüfusuna bölünmesiyle bulunur. Aşağıdaki şekilde hesaplanır. Toplam Doğurganlık (Fertilite) Hızı (TDH) Toplam doğurganlık hızı, doğurgan çağdaki kadın nüfusun yaş yapısını dikkate almadan ülke yada bölgenin doğurganlık düzeyi hakkında bilgi veren bir istatistiktir. TDH tek tek yaşa özel doğurdanlık hızlarının toplamı alınarak bulunur ve doğurdan çağa giren bir kadının doğurganlık çağı sonuna kadar kaç canlı doğum yapacağını belirtir. Türkiye’nin 2001-2009 yılları arasındaki doğumlarla ilgili bazı istatistikleri Tablo 4.8’de verilmiştir. 90 Tablo 4.8: TÜİK (2011) verilerine göre 2001-2009 yılları arasındaki doğumlarla ilgili bazı istatistikler Yıllar 2001 2002 2003 2004 2005 2006 2007 2008 2009 Doğum sayıları 1.322.703 1.228.717 1.197.452 1.219.343 1.238.463 1.247.445 1.279.087 1.281.302 1.241.617 Kaba Doğum Hızı 20,3 18,6 17,9 18,0 18,1 18,0 18,2 18,0 17,3 Genel doğurganlık hızı 83,8 76,8 73,9 74,4 74,7 74,6 75,8 75,3 72,3 Toplam doğurganlık hızı 2,37 2,17 2,09 2,10 2,12 2,11 2,15 2,14 2,06 Annenin yaş ortalaması 26,2 26,3 26,5 26,5 26,5 26,6 26,7 26,8 27,0 Kaynak: TÜİK, 2011 Ölümler Canlı doğum olayı gerçekleştikten sonra bireyin yaşamının herhangi bir anında yaşamsal fonksiyonların tamamını yitirmesine ölüm adı verilir. Bir bölgedeki ölüm istatistikleri, sağlık hizmetlerinin planlamasında ve bölgeler arasındaki karşılaştırmalarda kullanılan en önemli verilerdendir. Ölümler hem sayısal hem de nitelik olarak değerlendirilebilir. Elde edilen veriler ile bölgedeki sorunlar ve öncelikler saptanabilir, önlemler alınabilir, ileriye yönelik planlamalar yapılabilir. Sağlık kurumu yöneticileri ve sağlık planlayıcıları, bir bölgedeki ölümlerin sayısını ve ölenlerin özelliklerini tam ve doğru olarak bilmelidir. Ölüm istatistiklerinin değerlendirilmesinde ne tür verilerin toplanacağı ve verilerin neleri kapsayacağı sağlık hizmet sistemi ile ilgilidir. Bu veriler genellikle ölen kişinin yaşı, cinsiyeti, mesleği, medeni durumu, eğitimi, oturduğu yer, ölüm tarihi, ölüm yeri, ölüm nedeni gibi verilerdir. Ayrıca, ölüme neden olan sosyal, ekonomik ve kültürel nedenlerin dağılımlarıda araştırılmaktadır. Ölüm olayları ile ilgili istatistiki bilgiler DİE tarafından 1931 yılından itibaren toplanmaya başlanmış ve 1949 yılı sonuna kadar nüfusu en fazla olan 25 il merkezi, 1950-1957 yılları arasında bütün il merkezleri, 1957 yılından itibaren il ve ilçe merkezlerinde tutulmaya başlamıştır. Ölümlerin ülkemizde en geç 10 gün içerisinde ilgili nüfus idaresine bildirilmesi veya gönderilmesi yasal bir zorunluluktur. Ölüm tutanaklarına ölenin nüfus cüzdanı da eklenmektedir. Ülkemizde il ve ilçe merkezlerinde olan ölümleri incelememize yarayan tek kaynak TÜİK tarafından yayınlanan, ölüm istatistik formlarından faydalanılarak oluşturulan “Ölüm İstatistikleri; il ve ilçe merkezleri” adlı yayındır. Bu yayında ölümün meydana geldiği ay, cinsiyet, yaş, süreklii ikametgâh, ölüm nedeni, ölüm nedeninin saptandığı yer, medeni durum, meslek grubu ve bebek ölümlerine ilişkin bilgiler yer almaktadır. Ülkemizedeki ölümlerle ilgili verilere ve diğer verilere ve göstergelere aşağıdaki TÜİK (Türkiye İstatistik Kurumu) web sitesi bağlantısından ulaşabilirsiniz. http://www.tuik.gov.tr/Kitap.do?metod=KitapDetay&KT_ID=11&KITA P_ID=21 Diğer ülkelere ait ölümler ise, Dünya Sağlık Örgütü’nün (WHO) her yıl yayınladığı “Dünya Sağlık İstatistikleri (world health statistics)” ve Birleşmiş Milletler Örgütü’nce her yıl yayınlanan “Demographic Yearbook” isimli yıllıklardan elde edilebilmektedir. http://www.who.int/gho/publications/world_health_statistics/en/index.html (Dünya Sağlık Örgütü’nün, (WHO) Dünya Sağlık İstatistiklerine ait web sitesi) http://unstats.un.org/unsd/demographic/products/dyb/dyb2.htm (Birleşmiş Milletler Örgütünce hazırlanan Demographic Yearbook) 91 Ölümlere ilişkin hesaplamalar yaşa göre, cinsiyete göre, ölümlerin oldukları aylara göre, mesleğe göre, medeni duruma göre, ölüm nedenine göre olmak üzere farklı şekillerde hesaplanabilmektedir. TÜİK verilerine göre Türkiye’de 2000-2009 yılları arasında yaşa göre ölüm sayıları Tablo 4.9’da verilmiştir. Tablo 4.9: Türkiye’de, 2000-2009 yılları arası yaş gruplarına göre ölüm sayıları YIL 0-11 ay 1-4 yaş 5-14yaş 15-34 yaş 35-54 yaş 55-74 yaş 75 + 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 15.543 14.947 13.125 12.878 10.706 10.180 10.199 10.201 9.987 14.348 2.907 2.915 2.365 2.428 2.190 2.249 2.220 2.015 2.017 4.564 2.108 2.123 1.830 2.000 1.997 2.092 1.993 1.978 1.718 5.974 8.515 8.370 7.181 8.219 8.043 7.947 8.205 7.772 7.404 15.432 23.841 24.020 23.417 25.146 24.041 24.957 25.748 25.300 25.590 41.971 72.035 71.131 71.310 73.913 72.131 75.748 78.307 76.951 76.301 122.651 49.366 51.631 56.206 59.746 62.255 67.876 76.735 80.996 86.523 159.064 Ölümlerle İlgili Hız ve Oranlar Ölümlerle ilgili olarak hesaplanan birçok hız ve oran bulunmaktadır. Bunlardan bazıları; Kaba ölüm hızı, yerel ölüm hızı, yaşa özel ölüm hızı, cinsiyete özel ölüm hızı, yaşa ve cinsiyete özel ölüm hızı, ana ölüm hızı, bebek ölüm hızı, ölü doğum hızı, perinatal ölüm hızı, orantılı ölüm hızı, yaşa özel orantılı ölüm hızı, ölüm nedenine göre orantılı ölüm hızıdır. Kaba Ölüm Hızı (KÖH) Bir ülke ya da bölgede belirli bir yıl içindeki toplam ölüm sayısının yıl ortası nüfusa oranlanması ile hesaplanır. Bölge ya da ülkenin kabaca ölüm düzeyi hakkında bilgi verir. Aşağıdaki şekilde hesaplanır. Örnek 4.6: TÜİK 2009 yılı verilerine göre Türkiye genelinde görülen ölüm sayısı 367.971 olarak saptanmıştır. Aynı yıla ait yılortası nüfusumuz 72.561.312 olduğuna göre Kaba ölüm hızını hesaplayınız. 2009 yılında Türkiye’de her 1.000 kişiden 5’i ölmüştür. Bir bölgenin 2010 yılı kaba ölüm hızı ‰3,13 ve aynı yıla ait yıl ortası nüfusu 4.526.410 kişidir. Bölgedeki 2010 yılı ölen sayısını hesaplayınız? Nüfusun yaş ve cinsiyet dağılımları bölgelerde farklı olabilir. Nüfus yapısı içerisinde yaşlıların oranı fazla olan bir ülkenin sağlık düzeyi yüksek olsa bile, yaşlılar ilerleyen zamanlarda daha fazla öleceğinden kaba ölüm hızı yüksek çıkmaktadır. Bu bakımdan bölgeler arası karşılaştırmalar kaba ölüm hızı yerine diğer standartlaştırılmış ölüm hızları ile yapılabilir. Bu hızlarının bazılarının tanımları ve hesaplama biçimleri aşağıda verilmiştir. 92 Cinsiyete Özel Ölüm Hızı (CÖÖH) Genellikle bir yıl için hesaplanır. Bir bölgede bir yıl içinde incelenen cinsiyette ölen sayısının, bu cinsiyete ait yıl ortası nüfusuna bölünmesiyle elde edilir. Aşağıdaki şekilde hesaplanır. Örnek 4.7: TÜİK 2009 yılı verilerine göre Türkiye genelinde kadınlarda görülen ölüm sayısı 172.078 olarak saptanmıştır. Aynı yıla ait kadın yılortası nüfusumuz 36.125.322 olduğuna göre Kadınlara özel ölüm hızını hesaplayınız. 2009 yılında Türkiye’de her 1.000 kadından yaklaşık olarak 5’i ölmüştür. Yaşa Özel Ölüm Hızı (YÖÖH) Bir bölgede bir yıl içinde incelenen yaş grubunda ölen sayısının, bu yaş grubu yıl ortası nüfusuna bölünmesiyle elde edilir. Aşağıdaki şekilde hesaplanır. Genel Mortalite Hızı (GMH) Bir bölgede bir yıl içinde belirli bir hastalıktan ölenlerin (mortalite), yıl ortası nüfusa bölünmesi ile elde edilir. Aşağıdaki gibi hesaplanır ( ) Örnek 4.8: 2008 yılı verilerine göre Türkiye genelinde kalp rahatsızlığına bağlı sebeplerden 72.564 kişi ölmüştür. Aynı yıla ait yılortası nüsus ise 71.517.100 olduğuna göre bu hastalığa ilişkin genel mortalite hızı nedir? Hesaplayınız 2008 yılında Türkiye’de her 10.000 kişiden yaklaşık olarak 1’i kalp rahatsızlığına bağlı nedenlerden ölmüştür. GMH çok küçük bir değer aldığından onbinde olarak hesaplanmıştır. Bebek Ölüm Hızı (BÖH) Bir yıl içinde bölgede bir yaşına (0-364 günlük) girmeden ölen bebeklerin o yılda canlı doğan toplam bebek sayısına oranlanmasıyla elde edilir. Bölgedeki her bin canlı doğuma karşı kaç bebeğin bir yaşına girmeden öldüğünü ifade eder. Bebek ölüm hızı aşağıdaki gibi hesaplanır. 93 ( ) Örnek 4.9: A bölgesinde 2011 yılı içerisinde 1 yaşını doldurmadan ölen bebeklerin sayısı 82 olarak belirlenmiştir. Aynı yıl içerisinde bölgedeki meydana gelen canlı doğum sayısı ise 1.560’tır. Bu bölgenin 2011 yılına ait bebek ölüm hızını hesaplayınız. ( ) Bu bölgede canlı doğan her 1.000 bebekten 53 tanesi ( 53) 1 yaşına girmeden ölmüştür. Bu oldukça yüksek bir hızdır. Bölgenin geri kalmışlığının en önemli ölçüsüdür. Bir bölgede 2010 yılı içinde bir yaşını doldurmadan ölen bebek sayısı 49’dur. Bölgenin aynı yıla ait kaba ölüm hızının ‰7’ye eşit veya daha az (KÖH≤‰7) olduğu bilindiğine göre, bölgeye ait 2010 yılı canlı doğum sayısı en az kaç olmalıdır? Bebek ölüm hızı bölgede ana-çocuk sağlığı hizmetlerinin sağlık kurumları tarafından iyi yürütülüp yürütülmediğini göstermek için kullanılan ve uluslarası kabul gören önemli istatistiklerdendir. Ülkenin ya da bölgenin sağlık düzeyini ve gelişmişliğini gösterir. BÖH gelişmiş ülkelerde ‰10’un altına inmiştir. Avrupa ülkelerinin çoğunda ‰4-6 arasındadır. Bebek ölüm hızı neonatal ve postneonatal dönem olarak ikiye ayrılır. Neonatal dönem 0-27 günlük dönemde ölen bebekler için, postneonatal dönem ise 28-364 günlük dönemde ölen bebekler için kullanılır. Neonatal dönemide kendi içerisinde 0-6 günlük için erken neonatal dönem, 7-27 günlük için ise geç neonatal dönem olarak ikiye ayırmak mümkündür. Neonatal dönemdeki bebek ölümlerin büyük bir kısmı doğuştan normal olmayan bebekler, doğumdaki travmalar, genetik problemler, 37 haftadan daha erken doğan bebekler, düşük doğum ağırlığı gibi önlenmesi zor ve tedavisi güç ya da olanaksız hastalıklara bağlıdır. Postneonatal dönemdeki ölümler genellikle iyi bakım ve beslenme, hijyen, aşılama, zamanında teşhis ve tedavi hizmetleri ile önlenmektedir. Postneonatal dönemdeki bebek ölümlerinin en düşük seviyede olması sağlık sisteminin başarısı olarak değerlendirilmektedir Ölü Doğum Hızı (ÖDH) Gebelikte, 28. haftadan sonraki fetüs ölümü ölü doğum olarak adlandırılır. Ölü doğumlar veya gebeliğin 20. haftasından sonraki ölümler (perinatal) sayı olarak ana ölümlerinden daha fazladır. Bundan dolayı bölgelerin yapısı hakkında, kolay ölçülebilir ve ana ölüm hızından daha geçerli bilgi verir. Fakat bu 94 hızların güvenilir olabilmesi için ölü doğumların doğru bir şekilde kayıt edilmesi gerekir. Bu kayıtların doğru ve güvenilir olmadığı ülke ve bölgelerde, ölü doğum hızının doğru hesaplanması ve doğru yoruma gidilmesi mümkün olmamaktadır. Kurum yöneticisi ve sağlık planlayıcıları bilmelidir ki hizmet verilen bölgede tüberküloz, tifo, dizanteri, kolera vb. hastalıklar ölü doğum hızını arttırdığı gibi hijyenik koşullarda sürdürülemeyen gebeliklerde de ölü doğum hızı yükselmektedir. Perinatal Ölüm Hızı (PÖH) Yıl içerisindeki ölü doğan bebek sayısı ile canlı doğan fakat 0-6 gün arasında ölen bebeklerin, o yılki tüm canlı doğum sayısına bölünmesiyle elde edilmektedir. Aşağıdaki şekilde hesaplanmaktadır. Ana Ölüm Hızı (AÖH) Anne ölüm hızı bir ülkenin sağlık düzeyini gösteren önemli bir ölçüttür. Annenin gebeliği hijyenik koşullarda sürdürülemiyorsa, doğum ve lohusalık dönemlerinde etkili bir sağlık hizmeti alamıyorsa, bu bölgedeki anne ölümleri dolayısıyla yüksek olacaktır. Bu hızın hesaplanmasında eğer gebe, herhangi bir kaza ya da gebelik dışında farklı bir hastalıktan ölmüş ise bu ölümler anne ölümleri dışında tutulmaktadır. Orantılı Ölüm Hızı (OÖH) Orantılı ölüm hızı farklı yaşlara veya ölüm nedenlerine göre ayrı ayrı hesaplanabilmektedir. Bunlara ait tanım ve hesaplamalar aşağıda verilmiştir. Yaşa Göre Orantılı Ölüm Hızı (YGOÖH) Belirli bir yaş veya yaş grubundaki ölümlerin, toplam ölümler içerisindeki yüzdesini gösteren bir istatistiktir. Ülkelerin ve bölgelerin sağlık düzeylerini gösteren en önemli ölçütlerden biridir. Sağlık düzeyi yüksek olan ülkelerde, 50 yaşın üzerindeki ölümler tüm ölümlerin %90’ı veya da daha fazlasını oluşturmaktadır. Yaşa göre orantılı ölüm hızı genellikle üç yaş grubu için hesaplanmaktadır. Bunlar 0-4 yaş grubu, 549 yaş grubu ve 50+ yaş grubudur. Bu yaş gruplarına ait ölüm sayıları ayrı ayrı belirlenir. İstenilen yaş grubuna ait ölüm sayıları, tüm ölümlere (üç gruptaki ölü sayısının tamamına) oranlanarak yaşa göre orantılı ölüm hızı belirlenir. 95 Örnek 4.10: Bir ülkede 2011 yılına ait ölümler yaş gruplarına göre Tablo 4.10’da verilmiştir. Bu verilere göre ülkenin 2011 yılı yaşa göre orantılı ölüm hızlarını hesaplayınız. Tablo 4.10: 2011 yılı yaş gruplarına göre ölümler Yaş grupları 0-4 5-49 50+ Toplam Ölümler 13.047 23.933 173.603 210.583 Ölüm Nedenine Göre Orantılı Ölüm Hızı (ÖNGOÖH) Bir yıl içerisinde belirli bir nedenden dolayı olan ölümlerin, o yıla ait toplam ölümler içerisindeki yüzdesini vermektedir. Örnek 4.11: Bir bölgede 2010 yılında çeşitli nedenlerle toplam 3.127 kişi ölmüştür. Aynı bölgede kalp hastalıkları nedenine bağlı olarak toplam 29 kişi ölmüş ise ölüm nedenine göre orantılı ölüm hızını hesaplayınız. Bölgede kalp hastalıkları nedenine bağlı olan ölümler, tüm ölümlerin %0,927’sini ( oluşturmaktadır. ’sini) HASTALIKLARLA İLGİLİ İSTATİSTİKLER Hedef topluma ait hastalıkların iyi bir şekilde değerlendirilmesi birçok yönden sağlık kurumunun yöneticisine ve personeline, sağlık alanındaki planlamaların daha etkin biçimde yapılması için çok büyük avantajlar sağlamaktadır. Bu verileri değerlendirirken hastalıkların bölgelere, sosyo-kültürel ve ekonomik özelliklere, aylara, yıllara, mevsimlere, göre dağılışlarını hesaba katmak gerekmektedir. Ayrıca bölgede sık görülen hastalıkların görülüş sırasına göre dağılımlarını dikkatlice incelemek gereklidir. Aşağıda hastalıkların kurumlar, bölgeler, ülkeler arasındaki karşılaştırılmalarına imkan veren bazı istatistikler verilmiştir. Hastalıklarla İlgili Hızlar Çalışmalarda, incelenen süre içerisinde hastalık (morbidite) ve hasta kişi sayısı farklı olabileceği için hastalık hızları, hastalık (vaka) ve hasta için ayrı olarak hesaplanmalıdır. İncelenen sürede hastalık hızları, prevelans hızı ve insidans hızı olarak iki değişik biçimde hesaplanabilir. 96 Prevalans hızı: İnceleme süresi (period) içinde mevcut hasta sayısının (eski ve yeni olgular dahil olmak üzere) risk altındaki nüfusa bölünmesiyle elde edilen hastalık hızıdır. Bir hastalığın o toplumda görülme sıklığı olarakta ifade edilir. Prevelans hızı, genellikle kronik hastalıkların görülme sıklıklarını ifade etmekte kullanılmaktadır. Prevelans hızı hastalık ve hasta için ayrı ayrı hesaplanabildiği gibi günlük (nokta) ve aylık ya da yıllık (süre) olarakta hesaplanabilir. Nokta Prevelans Hızı Belirli bir anda (günde) mevcut eski ve yeni olguların risk altındaki topluma oranının yüzde çarpımıdır. Örnek 4.12: Eskişehir’de bir aile hekimliği bölgesinde, 20 Kasım 2011 tarihinde 2.400 çocukta 284 Akut Solunum Yolu Enfeksiyonu (ASYE) vakası tespit edilmiştir. Verilen tarihteki nokta prevelans hızını hesaplayınız. (örnek varsayımsaldır) İnsidans Hızı İncelenen süre içerisinde yeni gözlenen hasta sayısının risk altındaki nüfusa oranlanmasıyla elde edilen yeni olgu gözlenme hızıdır. Bir bölgede, herhangi bir hastalığın mevcutlara ek olarak belirli bir süre içerisinde yeniden görülme sıklığının belirlenmesidir. Akut, sosyal ve bulaşıcı hastalıkların değerlendirilmesinde kullanılmaktadır. İnsidans hızı hastalık ve hasta için iki ayrı biçimde hesaplanabilir. ( ) ( ) Örnek 4.13: Bir sağlık ocağı bölgesinde 2011 yılı Temmuz ayında 2.500 çocuktan yeni ishal olan vaka sayısı 216 ise, vaka insidans hızını hesaplayınız. ( ) 97 Örnek 4.14: Bir sağlık ocağı bölgesinde 2011 yılı Temmuz ayında 2.500 çocuktan yeni ishal olan kişi sayısı 160 ise, şahıs insidans hızını hesaplayınız. ( ) Fatalite Hızı Belirli bir hastalıktan ölenlerin o hastalığa yakalananların sayısına oranlanması ile bulunur. Belirli bir süre içinde X hastalığına yakalananların bu süre içinde %, ‰, … (k) kaçının öldüğünü ifade etmek için kullanılır. Aşağıdaki şekilde hesaplanır. Örnek 4.15: Bir bölgede 2011 yılı içerisinde karaciğer kanserine yakalananların sayısı 1.500 ve aynı hastalıktan ölenlerin sayısı 600’dür. Eldeki verilere göre Fatalite hızını hesaplayınız. Bölgenin 2011 yılı Karaciğer kanserine ilişkin Fatalite hızı %40 olarak elde edilir. Afrika’da bir bölgede 2011 yılı içerisinde AIDS hastalığına yakalanan 4.481 kişiden 2.128’i (AIDS hastalığından) ölmüştür. Bölgenin Fatalite hızını hesaplayınız. Hastalık Riskleri Hastane yöneticisi, hastalık risklerine bağlı olarak bazı durumlarda çalışanlarını, hastaları ve hizmet verdiği nüfusu bilgilendirme toplantıları yapabilir. Hastalıklar hakkında toplumu bilinçlendirerek toplum sağlığı hizmetlerini yürütebilir. Halk sağlığı ve aile hekimliği birimleri ile ortak hareket ederek toplumun sağlık seviyesini arttırma çabasına girebilir. Böylece önlenebilir bazı hastalıklardan toplumu koruyabilir, sağlık konusunda toplumu bilinçlendirebilir ve sağlık giderlerinin azaltılmasını sağlayabilir. Bir hastalığın ortaya çıkmasında kesin etkisi olup olmadığı bilinmeyen, fakat hastalığın ortaya çıkmasında birçok faktör arasında yer alan ve varlığında ise hastalığın gözlenme oranını arttırdığı saptanan değişkenlere risk faktörü denir. Örneğin; sigara alışkanlığı akciğer kanserinin bir risk faktörüdür. Yaş, cinsiyet, günlük içilen sigara sayısı, kolesterol düzeyi, sistolik kan basıncı (SKB), stres, sedanter yaşam gibi faktörler de kalp hastalıklarında birer risk faktörüdür. Hastalık risklerinin hesaplanmasında; bir hastalık durumunda risk faktörünün olması ve hastalık yokluğunda risk faktörünün olması durumlarından yararlanılır. Risk faktörü ile belirli bir hastalık arasındaki bağımlılığı, birlikteliği değerlendirmek için yararlanılan ve olasılık kurallarından yararlanılarak geliştirilen birçok oran bulunmaktadır. Bunlar araında en çok kullanılanlar Odds Oranı (Göreli orantı, olasılıklar oranı, Odds ratio, OR), Göreli Risk Oranı (Relative Risk) ve Atfedilen Risktir (Attributable Risk). Hastalık risklerine ilişkin tanım ve hesaplar aşağıda verilen Tablo 4.11’den yararlanılarak hesaplanmaktadır. 98 Tablo 4.11: Risk faktörünün varlık ya da yokluğuna göre hastalık durumu Hastalık Risk faktörü Var Yok Var a b Yok c d a+c b+d Toplam Göreli Risk Oranı Risk faktörü var iken hastalığın görülme sıklığının, risk faktörü yok iken hastalığın görülme sıklığına oranına Göreli Risk Oranı adı verilmektedir. Tablo 11 incelenecek olursa, risk faktörü var iken, risk faktörü altındaki birey oranı; a/(a+b) ve risk faktörü yok iken, risk faktörü altındaki birey oranı; c/(c+d) olarak alınır. Göreli risk oranı ise bu iki riskin birbirine oranlanması ile elde edilir. Risk faktörü varken, faktörün olmadığı duruma göre hastalığın kaç kat daha fazla gözlendiğini belirten bir orandır. Aşağıdaki formül ile hesaplanmaktadır. ⁄( ⁄( ) ) Örnek 4.16: Bir hastaneye başvuran 1.010 hastadan 106 hastanın sigara içtiği ve bu 106 hastanında 6 tanesinin Akciğer kanserine yakalandığı tespit edilmiştir. Sigara içmeyen diğer 904 hastadan ise 4 tanesinin sigara kullandığı saptanmıştır. Akciğer kanserine yakalanmada sigara içme alışkanlığının önemli bir risk faktörü olduğu bilinmektedir. 1.010 kişi ile yapılan bir araştırmadan elde edilen veriler Tablo 4.12’de verilmiştir. Buna göre Göreli Risk Oranını hesaplayınız. Tablo 4.12: Sigara alışkanlığı risk faktörüne göre akciğer kanserine yakalanma durumu Sigara Alışkanlığı Akciğer Kanseri Var Yok 6 100 İçen İçmeyen 4 10 Toplam ⁄( ⁄( 900 1.000 Toplam 106 904 1.010 ) ) Yukarıda elde edilen sonuca göre, sigara içen kişilerin akciğer kanserine yakalanma riski içmeyenlere göre 12,8 kat daha fazla olduğu yorumu yapılır. Odds Oranı (Odds Ratio): T zaman diliminde toplumda gözlenen bir hastalığın gözlenme oranı P(H) ve gözlenmeme oranı Q(H) olarak tanımlanabilir. Hastalığın gözlenme oranının, gözlenmeme oranına bölünmesine ise odds adı verilir. İki odds un birbirine oranlanması ise odds oranı olarak tanımlanmaktadır. Kısaca risk faktörünün olduğu durumda hastalık görülme oranının, risk faktörü olmadığı durumdaki hastalık görülme oranına bölümü Odds oranı olarak ifade edilmektedir. ⁄ ⁄ Belli bir olayın olasılığının iki grup için aynı ya da benzer olup olmadığını karşılaştırmanın bir yoludur. OR=1 olması her iki grup için olayın olması olasılığı eşit demektir. OR>1 ise olayın olması olasılığı birinci grupta daha fazla, OR<1 ise olayın olması olasılığı birinci grupta daha azdır. 99 Örnek 4.17: Akciğer Kanserine yakalanmada sigara içme alışkanlığının önemli bir risk faktörü olduğu bilinmektedir. Bu nedenle toplam 1.010 kişi ile yapılan bir araştırmadan elde edilen veriler Tablo 4.13’te verilmiştir. Buna göre Odds Oranını (OR) hesaplayınız. (Anlaşılmasının ve karşılaştırmaların kolay olması nedeni ile Örnek 16’nın verileri bu örnekte kullanılmıştır.) Tablo 4.13: Sigara alışkanlığı risk faktörüne göre akciğer kanserine yakalanma durumu Akciğer Kanseri Var Yok Sigara Alışkanlığı Toplam içen 6 100 106 İçmeyen 4 10 900 1.000 904 1.010 Toplam ⁄ ⁄ Yukarıda elde edilen sonuca göre, sigara kullanımına bağlı akciğer kanseri hastalığına yakalanma riski, sigara kullanmayanlara göre 13,5 kat daha fazladır. Sigara kullanan kişiler akciğer kanserine 13,5 kat daha fazla yakalanmaktadır. Atfedilen Risk Belirli bir risk faktörün etkisiyle hastalananların (ya da ölenlerin) hızından bu faktörün etkisinde kalmadan hastalananların (ya da ölenlerin) hızının çıkarılmasıyla elde edilir. ( ⁄( )) ( ⁄( )) Örnek 4.18: Bir bölgede, sigara içenlerde akciğer kanserine yakalanma oranı ‰8,45, bu oran sigara içmeyenlerde ise ‰1,07 olarak saptanmıştır. Eldeki verilere göre akciğer kanserinin sigara kullanımına atfedilen riskini hesaplayınız. Atfedilen risk=8,45-1,07=7,38 Elde edilen sonuca göre akciğer kanserine yakalanmanın sigaraya atfedilen riski ‰7.38’dir. KORUYUCU SAĞLIK HİZMETLERİ Koruyucu sağlık hizmetleri ile ilgili toplanan veriler, sağlık hizmetlerinin örgütlenmesi, bu hizmetleri etkin bir biçimde yürütülme ve yeniden düzenlenmesi, uygun bir biçimde planlaması ve farklı bölgelere ait verilerin karşılaştırılması işlemlerine olanak sağlamaktadır. Sağlık kurumlarının yöneticileri aynı zamanda koruyucu sağlık hizmetlerinde de etkin bir rol oynamaktadır. Yönetici, koruyucu hizmetlerle ilişkili olarak personel, araç, gereç vb. istihdamını sağlama, bunları düzenleme ve sağlıkla ilgili olarak gerekli önlemleri alma çabası içerisinde olmalıdır. Koruyucu sağlık hizmetleri için hesaplanan istatistikler aşağıda verilen ana başlıklar altında sıralanabilmektedir. Aile planlamasına hizmetleri Gebe ve lohusa bakım ve takip hizmetleri Bebek ve çocuk bakım, takip, aşılama hizmetleri Kronik hastalıkların bakım ve takip hizmetleri Çevre sağlığı hizmetleri 100 Kurum yöneticisine ve sağlık planlayıcısına yukarıda sayılan ana başlıklara ait doğru, güvenilir ve güncel verilerin elde edilmesi ve bu ham verilerin yararlı bilgilere (enformasyona) dönüştürülmesi aşamasında büyük iş düşmektedir. SUNULAN SAĞLIK HİZMETLERİNİN DÜZEYİNİ GÖSTEREN İSTATİSTİKLER Sağlık kurumu tarafından hedef topluma sunulan hizmetlerin başarılı olup olmadığını saptamada kullanılan birçok gösterge geliştirilmiştir. Sağlık kuruluşu ya da ülke için düşünüldüğünde sağlık düzeyi göstergeleri olarak adlandırılan bu istatistikler aynı zamanda kurumlar, bölgeler ve ülkeler arası karşılaştırmalar içinde sıklıkla kullanılmaktadır. Bu göstergeler kurumların, bölgelerin ve ülkelerin sağlık açısından zaman içerisindeki değişimlerinin olumlu yönde olup olmadığının değerlendirmelerine de olanak sağlamaktadır. Bu nedenle kullanılan verilerin ve bu verilerden hesaplanan göstergelerin karşılaştırmalara olanak sağlayacak şekilde standart olması gerekmektedir.. Çalışmalardan elde edilen göstergeler öncelikle hastane, sağlık ocağı, il, bölge, ülke için önceki yıllara ait göstergeler ile, ikinci aşamada aynı ya da benzer hizmet veren başka kuruluşlarla karşılaştırılır. Bu tür karşılaştırmalar sağlık hizmetlerinin hangi alanlarda başarılı, hangi alanlarda başarısız olduğunun ortaya konması ve başarısızlığın giderilmesi, eksiklerin tamamlanması için gereken önlemlerin alınması yönünden çok faydalıdır. Ülkeler, bölgeler ve kurumlar arası karşılaştırmalara olanak sağlayan çok sayıda sağlık hizmet düzeyi ölçüsü bulunmaktadır. Bu nedenle, sağlık alanında ülkeler ya da kurumlararası karşılaştırmalarda tek ölçü ile değil çok sayıda ölçü ile karşılaştırmalar yapılmalıdır. Yukarıda da üzerinde durulduğu gibi ölçüler ve ölçülerin hesaplanmasında kullanılan veriler standart olmalıdır. Sağlık kurumların personel, bütçe ve diğer olanakları her zaman göz önünde bulundurulmalıdır. Ölçüleri etkileyebilecek bazı faktörler (eğitim, sağlık, sosyal ve ekonomik özellikler vb.) dikkate alınmalıdır. YAŞAM TABLOLARI Bir ülkede yaşayan insanlar, ülkenin sahip olduğu sosyal, ekonomik ve sağlık koşullarından farklı şekillerde etkilenmekte ve farklı yaş gruplarında değişik risklere maruz kalmaktadırlar. Belirli bir yaş ya da yaş grubu içerisindeki bireylerin sahip oldukları ölüm risklerini, ölüm istatistikleri aracılığı ile değerlendiren ve bireylerin beklenen yaşam sürelerini belirlemeyi amaçlayan tablolara yaşam tabloları denir. Yaşam tabloları belli bir yaşa sağ olarak ulaşan bir kişinin, ortalama daha kaç yıl yaşayacağına ilişkin hesaplamaların yapıldığı bir tablodur. Genellikle 0-4, 5-9, 10-14, …, 80-84, 85+ yaş gruplarına göre hazırlanan yaşam tabloları, her bir yaş grubundaki bireylerin tahmini olarak kaç yıl yaşayacağını belirtir. Kadınlara ve erkeklere göre ayrı ayrı hesaplanabilmektedir. Bunun dışında belli iş kollarına, bekar, evli kalma sürelerine, uygulanan tedavi sonrasında hastanın kaç yıl yaşayacağına göre farklı alanlarda yaşam tabloları da hesaplanabilmektedir. Beklenen yaşam süresi bazı kaynaklarda beklenen yaşam ümidi olarakta adlandırılmaktadır. Tablo 4.14’teki ilk sütun yaş gruplarını, Nx sütunu (2. sütun) yaş gruplarına göre nüfus sayılarını ve Dx sütunu ise (3. sütun) yaş gruplarına göre ölüm sayılarını göstermektedir. Tablonun 2 ve 3. sütundan hareket ederek, bir dizi matematiksel işlem sonucunda ex sütunu (10. sütun) elde edilir ki bu sütun belli bir yaş grubuna ulaşan bireylerin beklenen yaşam süresini göstermektedir. Örneğin Tablo 4.14’te, 2009 yılında Türkiye’de 5-9 yaşındaki bir çocuğun beklenen yaşam süresi 72,78 yıl olarak gösterilmiştir. Tablodan da görüleceği gibi bir yaşını doldurmadan olan ölümler oldukça fazladır. Bu nedenle sıfır “0” yaş grubu nüfusumuzun beklenen yaşam süresi (76,38yıl), 1-4 yaş grubu nüfusa (76,51yıl) göre daha düşüktür. Nüfusun genel yapısı içerisinde, bir yaşını doldurmadan ölen bebek sayısının fazla olmasından dolayı yaşam tablolarında bu iki yaş grubu birbirinden ayrılmıştır. 101 Türkiye’nin 2009 yılına göre düzenlenmiş yaşam tablosu Tablo 4.14’te görülmektedir. Tablo 4.14: Türkiye’nin 2009 yılına göre düzenlenmiş yaşam tablosu Yaş Grupları 0 Nx 1 1231064 Dx 2 17354 mx 3 0,014097 q 4 0,014548 P 5 0,985452 lx 6 100000 d 7 1455 Lx 8 98694 Tx 9 7638126 ex 10 76,38 1-4 4924257 4564 0,000927 0,003701 0,996299 98545 365 393451 7539431 76,51 5-9 6201647 3433 0,000554 0,002764 0,997236 98180 271 490224 7145980 72,78 10-14 6502366 2541 0,000391 0,001952 15-19 6234620 3412 0,000547 0,002733 0,998048 97909 191 489068 6655756 67,98 0,997267 97718 267 487922 6166688 63,11 20-24 6280117 3585 0,000571 0,002850 0,997150 97451 278 486561 5678766 58,27 25-29 6508860 4166 0,000640 0,003195 0,996805 97173 310 485090 5192205 53,43 30-34 5911032 4269 0,000722 0,003605 0,996395 96863 349 483441 4707115 48,60 35-39 5505313 5554 0,001009 0,005032 0,994968 96514 486 481354 4223674 43,76 40-44 4676145 7777 0,001663 0,008281 0,991719 96028 795 478152 3742320 38,97 45-49 4469953 11929 0,002669 0,013255 0,986745 95233 1262 473008 3264168 34,28 50-54 3725743 16711 0,004485 0,022178 0,977822 93970 2084 464642 2791160 29,70 55-59 2945603 21603 0,007334 0,036010 0,963990 91886 3309 451160 2326518 25,32 60-64 2361178 26201 0,011097 0,053985 0,946015 88578 4782 430933 1875358 21,17 65-69 1723714 33378 0,019364 0,092349 0,907651 83796 7738 399632 1444425 17,24 70-74 1323668 41469 0,031329 0,145267 0,854733 76057 11049 352665 1044793 13,74 75-79 1145932 61705 0,053847 0,237291 0,762709 65009 15426 286478 692128 10,65 80-84 611703 53694 0,087778 0,359909 0,640091 49583 17845 203300 405650 8,18 85+ 278397 43665 0,156844 1,000000 0,000000 31737 31737 202350 202350 6,38 72561312 367010 Toplam n n x n x n x n HASTALIK VE ÖLÜM NEDENLERİNİN ULUSLARARASI SINIFLANDIRILMASI Sınırların kalktığı, insanların oldukça kolay bir şekilde ülkeler arasında yolculuk yaptığı dünyamızda hastalıklara ve ölüm nedenlerine her geçen gün yenileri ilave olmakta ve bu kadar çok hastalığın tek tek incelenmesi oldukça zor hale gelmektedir. Bu nedenle hastalıkları sınıflamak, belli alt başlıklarda incelemek bir zorunluluk haline gelmiştir. Hastalık ve ölüm nedenlerinin belirli bir sistematik içerisinde incelenmesi gerekmektedir. Bu nedenle Dünya Sağlık Örgütü (DSÖ) belli zamanlarda hastalık ve ölüm nedenlerini sınıflama yoluna gitmiştir. İlk sınıflama DSÖ tarafından 1946 yılında yapılmış, bunu daha sonra 1955, 1965, 1975 ve 1989 sınıflamaları takip etmiştir. 1989 yılında yapılan düzenleme ICD-10 (International Classification of Diseases-10) olarak adlandırılmıştır. Şu anda ülkemizde ICD-10 uygulanmaktadır. Ülkemizde yapılan bir çok çalışmada ve hazırlanan dökümanlarda sağlık hizmetlerinin yönetilmesi için kaliteli, güvenilir ve doğru sağlık enformasyonuna ihtiyaç olduğu, bu sağlık enformasyonununda toplanabilmesi için ICD-10’un kullanılması gerektiği savunulmuştur. ICD-10’u uygulamak için öncelikle iyi eğitimli bir personele, iyi bir otomasyona (yazılımların yeterli olması) ihtiyaç vardır. Hastanın hastaneye başvurmasından, ayakta ya da yatarak tedavi olmasına kadar, taburcu olup, faturalanmasına kadar tüm aşamalarda bu kodlama sistemlerinden yararlanılmaktadır. ICD-10 düzenlenmesinde hem alfabetik hem de sayısal kodlama sistemlerinden yararlanılmıştır. Tablo 4.15’te genel başlıklar altında ICD-10 listesi verilmiştir. Bu düzenlemede U harfi kullanılmamış, ileride olabilecek ilaveler ya da revizyonlar için boş bırakılmıştır. ICD-10 aynı zamanda bölge ya da ülke hastanelerinin birbirleriylede karşılaştırılmasına olanak sağlamaktadır. Buradan elde edilen veriler değerlendirilerek bölge ya da ülkenin sağlık politikaları belirlenebilmekte, optimum düzeyde sağlık planlamaları yapılabilmektedir. Sağlık hizmetleri belli bir sistematik içerisinde yürütülmekte, kontrol altında tutulabilmektedir. 102 Kurum yöneticilerinin, personeli belli aralıklarla eğitim vermesi, bilgilendirmesi kurumun iyi bir şekilde yönetilmesi, zarar etmemesi bilgilerin doğru ve güvenilir olarak toplanması açısından çok önemlidir. Ayrıca kurum yöneticileri belirli aralıklarka kendi kurumunu, bölgedeki diğer kurumlarla karşılaştırabilmeli ve yeniliklere açık olmalıdır. Tablo 4.15: Hastalıkların Uluslararası sınıflandırılması (1989 düzenlemesine göre ICD-10) Hastalıkların uluslararası sınıflandırılması Kod Aralığı 1. Bölüm - Enfeksiyon ve Paraziter Hastalıklar (A00-B99) 2. Bölüm - Neoplazmlar (C00-D48) 3. Bölüm - Kan ve Kan Yapıcı Organ Hastalıkları ve Bağışıklık Sistemini İçeren Hastalıklar (C00-D48) 4. Bölüm - Endokrin, Nutrisyonel ve Metabolik Hastalıklar (E00-E90) 5. Bölüm - Akıl ve Davranış Bozuklukları (F00-F99) 6. Bölüm - Sinir Sistemi Hastalıkları (G00-G99) 7. Bölüm - Göz ve Gözle Bağlantılı Doku Hastalıkları (H00-H49) 8. Bölüm - Kulak ve Mastoid Oluşum Hastalıkları (H60-H95) 9. Bölüm - Dolaşım Sistemi Hastalıkları (I00-I99) 10. Bölüm - Solunum Sistemi Hastalıkları (J00-J99) 11. Bölüm - Sindirim Sistemi Hastalıkları (K00-K93) 12. Bölüm - Cilt ve Cilt altı Dokusu Hastalıkları (L00-L99) 13. Bölüm - Kas-İskelet ve Bağ Dokusu Hastalıkları (M00-M99) 14. Bölüm - Ürogenital Sistem Hastalıkları (N00-N99) 15. Bölüm - Gebelik, Doğum ve Lohusalık Dönemi Hastalıkları (O00-O99) 16. Bölüm - Perinatal Dönemden Kaynaklanan Hastalıklar (P00-P96) 17. Bölüm - Konjenital Malformasyon, Deformasyon ve Kromozom Anomalileri (Q00-Q99) 18. Bölüm - Semptomlar ve Anormal Klinik ve Laboratuar Bulguları (R00-R99) 19. Bölüm - Yaralanma, Zehirlenme ve Dış Nedenlere Bağlı Diğer Durumlar (S00-T98) 20. Bölüm - Hastalık ve Ölümün Dış Nedenleri (V01-Y98) 21. Bölüm - Sağlık Durumu ve Sağlık Hizmetlerinden Yararlanmayı Etkileyen Faktörler (Z00-Z99) 103 HASTANEDEKİ SAĞLIK HİZMETLERİNİN DEĞERLENDİRİLMESİ Bölge nüfusu, sağlık kurumundan etkin ve yeterli hizmet vermesini beklemektedir. Sadece tedavi hizmetleri değil, otelcilik hizmetleri, yemek hizmetleri gibi birçok alanda da hastaneden beklentiler üst seviyededir. Bu nedenle sağlık kurumu yönetcisi, kurumunu her alanda sürekli denetlemeli, yönetmeli, en iyi sağlık hizmetini bölge halkına sunmalıdır. Hastanelerde mevcut ya da yeni açılacak servisin yatak sayılarına karar verirmede en önemli faktörlerden biri ilgili hastalıkların çeşidi ve görülme sıklığıdır. Bu ise bölgenin demografik yapısını bilmekle, hastalık ile ilgili doğru ve güvenilir bir veri yapısının olması ile mümkündür. Bölgenin demografik yapısını, hasta sayısını bilmeden bir servis açmak, yatak sayısını arttırmak, bu servisi ya da yatakları yararsız kılabilir. Yatak kapasitelerine bağlı olarak hastanelerin belirli bir sabit maliyeti bulunmaktadır. Bu maliyetin içerisine personel harcamaları, ısınma, aydınlatma, fiziki alt yapıya ilişkin giderler dahil edilebilir. Hastanede tedavi edilen hasta sayısı arttıkça, kapasite kullanım oranı artacak, dolayısıyla tedavi hasta birim maliyeti düşecektir. Bu yüzden kapasite kullanım oranı ile hasta birim maliyeti arasında ters yönde bir ilişki mevcuttur. Her alandaki hizmet ögelerinin en iyi şekilde sunulması, kurumun verimliliğini ve tercih edilirliğini de önemli düzeyde etkilemektedir. Bu nedenle yöneticinin, hastane hizmetlerini hem kendi içerisinde (önceki yıllara göre) hemde diğer kurumlara karşı rasyonel olarak değerlendirmesini amaçlayan çeşitli oran ve hızlar geliştirilmiştir. Bu ölçütler aşağıdaki gibi sıralanabilir. Kaba Ölüm Hızı (Hastane için) Belirli bir süre içerisinde hastanedeki ölümlerin, taburcu edilen (ölenler dahil olmak üzere) toplam hasta sayısına bölünmesiyle elde edilir. Aşağıdaki şekilde hesaplanmaktadır. ( ) Örnek 4.19: A hastanesinde bir yılda ölen sayısı 1.217, ölenler dahil toplam taburcu edilen hasta sayısı ise 85.190 olduğuna göre, hastanenin kaba ölüm hızını hesaplayınız A hastanesinin kaba ölüm hızı %1,43 olarak elde edilmiştir. Kaba ölüm hızı, kurumlar arası karşılaştırmalarda kullanılan en önemli ölçülerden biridir. Net Ölüm Hızı Hastaneye yatıştan sonra ilk 48 saatlik dilimdeki ölümler bu hızda dikkate alınmamaktadır. Hastaneye yatan hastanın laboratuvar tetkiklerinin yapılması, tanının konulması, gerekli olan tedaviye başlanması ve tedavinin etkinliğinin görülmesi için belli bir zamanın geçmesi gerekmektedir. Bu nedenle ilk 48 saatlik süredeki ölümler net ölüm hızında hesaplamaya katılmamaktadır. Aşağıdaki şekilde hesaplanmaktadır. ( ) 104 Örnek 4.20: A hastanesinde bir yılda ölen sayısı 1.217’dir. Fakat bunların 41 tanesinin ölüm olayı hastaneye yatışlarından itibaren ilk 48 saat içerisinde gerçekleşmiştir. Aynı hastanede ölenler dahil toplam taburcu edilen hasta sayısı ise 85.190 olduğuna göre, hastanenin net ölüm hızını hesaplayınız A hastanesinin net ölüm hızı %1,38 olarak elde edilmiştir. Yatak Doluluk Oranı (Kapasite Kullanım Oranı) Yatak doluluk oranı, hastane yataklarının ne oranda kullanıldığını gösterir. Hastanenin hizmet potansiyelini ne ölçüde kullandığını gösteren önemli bir ölçüdür. Yatak sayısı baz alındığında doluluk (işgal) oranı, belirli bir zaman diliminde kullanılan yatak gün sayısının, toplam yatak gün sayısına (kapasitesine) oranıdır. Bu oran hastaneler arası performansların değerlendirilmesinde ve maliyetlerin izlenmesinde kapasite kullanım düzeyi hakkında hastane yöneticilerine bilgi vermektedir. Ayrıca Yatak doluluk oranı; hastane kullanımını gösteren ve sağlık planlayıcıları için yataklı tedavi kurumlarının yatak ihtiyaçlarının belirlenmesinde bilinmesi gereken temel ölçütlerdendir. Yatak kapasitesinin altında ya da çok üstünde çalışan hastanelerde, bu sayıların azaltılmasında ya da arttırılmasında kullanılan en önemli istatistiklerdendir. Belirli bir dönemde, yatan hastalara verilen toplam hasta bakımı gün sayısının, maksimum hasta bakım gün sayısına bölünmesi ve sonucun 100 ile çarpılması ile bulunur. Aşağıdaki şekilde hesaplanır. ( ) Örnek 4.21: 2010 yılı içinde Özel B hastanesi, yatan hastalara toplam 13.126 gün bakım hizmeti vermiştir. Hastanenin toplam yatak sayısı 50 olduğuna göre, 2010 yılı için yatak doluluk oranını hesaplayınız. Özel B hastanesi %71,92 dolulukla 2010 yılı içerisinde hizmet vermiştir. Yatak Devir Hızı Bir yatağın yılda kaç hasta tarafından kullanıldığını belirten bir istatistiktir. Bir yıl içerisinde yatan hasta sayısı toplamının, yatak sayısına bölünmesi ile elde edilir. Aşağıdaki gibi hesaplanır. Yatak Devir Aralığı İki devir arasında yatağın ortalama kaç gün boş kaldığını gösteren bir ölçüttür. Yatak devir aralığı hesaplanırken, “kullanılmayan toplam hasta bakım gün sayısı”, toplam taburcu edilen (ölenler dahil olmak üzere) hasta sayısına bölünür ve gün olarak hesaplanır. Hastanelerdeki bir hasta yatağının ne kadar boş kaldığını gösterir. Aşağıdaki biçimde hesaplanır. ( 105 ) Örnek 4.22: 2010 yılı Aralık ayı içinde Özel B hastanesi, yatan hastalara toplam 1.126 gün bakım hizmeti vermiştir. Hastanenin toplam yatak sayısı 50’dir. Aynı ay içerisinde toplam taburcu edilen hasta sayısı (ölenler dahil olmak üzere) 210 olduğuna göre yatak devir aralığını hesaplayınız. Öncelikle Hastanenin bakım hizmeti veremediği gün sayısını hesaplamak için aşağıdaki işlem yapılır Hastanenin bakım hizmeti vermediği gün sayısı=(30x50)-1.126=374 gün Özel B hastanesinin 2010 yılı Aralık ayına ait yatak devir aralığı 1,78 gün olarak hesaplanmıştır Ortalama Hasta Yatış Gün Sayısı Bir hastanın, hastanede kaldığı ortalama gün sayısını belirtmektedir. Belli bir dönemde hastaneden taburcu olan hastaların (ölenler dahil olmak üzere) toplam yattıkları gün sayısının, aynı dönemde hastaneden taburcu olan hastaların (ölenler dahil olmak üzere) toplam sayısına bölümü ile elde edilir. Aşağıdaki şekilde hesaplanır. ( ) Örnek 4.23: 2010 yılı içerisinde B hastanesinde toplam yatılan gün sayısı 13.126’dir. Taburcu olanların sayısı 1.485 ve ölenlerin sayısı ise 143 olduğuna gore hastanede ortalama hasta yatış gün sayısını hesaplayınız. 2010 yılı içinde B hastanesinde ortalama yatış süresi 8.06 gün olarak elde edilmiştir. Yatan Hasta Oranı Belli bir dönemde hastanede yatan toplam hasta sayısı, acil servis ve polikliniklerden başvuran toplam hasta sayısına bölünür ve sonuç 100 ile çarpılır. Kurum yöneticisi bu istatistik ise hem kendi kurumunu yıllar içerisinde değerlendirebilir, hemde diğer sağlık kurumları ile karşılaştırma imkanı bulur. Aşağıdaki şekilde hesaplanır. Örnek 4.24: 2010 yılı içerisinde B hastanesinde toplam yatan hasta sayısı 47.113’dür. Aynı zaman dilimi içerisinde hastanenin acil servisine 81.128 ve diğer servislerine toplam 183.196 başvuru olduğuna gore hastanenin 2010 yılı yatan hasta oranını hesaplayınız 2010 yılı için B hastanesinin yatan hasta oranı %17,82 olarak elde edilmiştir. 106 Onbin Nüfusa Düşen Yatak Sayısı Bölgedeki hastanelerin toplam yatak sayısının, bölge nüfusuna bölümünün 10.000 ile çarpılması ile elde edilir. Her 10.000 kişiye düşen hastane yatağı sayısının belirlenmesinde kullanılır. Bölgeler arası karşılaştırmalarda kullanılır. Aşağıdaki şekilde hesaplanır. Yukarıda hesaplanan istatistikler dışında hastanelerdeki sağlık hizmetlerinin değerlendirilmesinde kullanılan bir çok gösterge bulunmaktadır. Bunlardan bazıları aşağıda verilmiştir. Anestezi ölüm hızı Ameliyat sonrası ölüm hızı Hastanede ana ölüm hızı Hastanede bebek ölüm hızı Enfeksiyon hızları (kaba enfeksiyon hızı, ameliyat sonrası enfeksiyon hızı) Otopsi hızı Sezeryan hızı Yukarıda sayılan istatistikler dışında hastanelerde poliklinik hizmetlerinide değerlendirmede kullanılan çalışmalarda yapılabilmektedir. Genelde poliklinik hizmetleri, muayene edilen hasta sayısı ile değerlendirilir. Bu hasta sayıları hastaların farklı demografik, hastalık, tedavi, vd. özelliklerine göre de ayrıca incelenebilmektedir. Personel ve yatak durumları, laboratuvarlarda yapılan tetkiklerin yıllara göre dağılımı, doğumların yıllara ve oluş biçimlerine göre dağılımı, yatan hastaların yıllara ve yatış durumlarına göre dağılımları hastanelerin değerlendirilmesinde sıklıkla kullanılmaktadır. Ayrıca farklı servislerde muayene edilen hasta sayıları, yaşa ve cinsiyete göre hasta sayıları, sosyo-ekonumik ve kültürel özelliklere göre hasta sayıları, sosyal güvencelerine göre hasta sayıları vb. bir çok özelliklerine göre sayı, hız ve oranları hesaplamak mümkündür. Hastaneler çok karmaşık bir yapıya sahip kurumlardır. Hastanelerde gerek idari gerek sağlık hizmeti veren pek çok birim bulunmaktadır. Sağlık kurumu yöneticisi özellikle ileriye dönük planlama yaparken, mevcut durumu değerlendirirken, önceki yıllara göre kıyaslama yaparken ve diğer sağlık kurumları ile kendi kurumunu karşılaştırırken tek bir ölçüye dayalı değil, bir çok ölçüden yararlanarak karşılaştırmaları yapmalıdır. Kendini sürekli olarak yenilemeli, sağlık yöneticiliği alanındaki gelişmeleri takip etmeli, kurumunu en üst seviyeye çıkarmaya çaba göstermelidir. Bu anılan faaliyetler için doğru, tam, güvenilir, kullanılabilir, güncel ve denetlenebilir verilere ihtiyaç vardır. Bu verilerin, enformasyona dönüştürülmesi işlemi istatistiksel teknikler olmadan asla yerine getirilemez. Yönetici kurumunu yönetirken, mevcudu değerlendiriken ve geleceği planlarken bunları asla gözardı etmemelidir. 107 Özet Bu kitapta sağlık alanında hizmet verecek personelin gerek duyabileceği, nüfus ve nüfusla ilgili hız ve oranlar, nüfusun dinamiklerini oluşturan evlenme, boşanma, doğum, ölüm ve hastalıklarla ilgili bazı hız ve oranlara değinilmiştir. Hastalıklara özel riskler ile ilgili açıklamalar yapılmış, hastane hizm etlerinin değerlendirilmesinde sıklıkla kullanılan yöntemler ünitenin kapsamına alınmış ve örnekler ile çözümler yapılmış, sonuçlar yorumlanmıştır. Günlük hayatımızda sayıların önemli bir yeri vardır. Toplumlar sosyal, ekonomik, kültürel ve sağlık alanlarında çok dinamik bir şekilde ilerleme göstermektedirler. Bilgisayar teknolojisindeki gelişmelerin, toplumların özellikle sağlık düzeyindeki gelişmelere çok büyük katkı sağladığı aşikardır. Sağlıkla ilgili verilerin toplanması, hızlı bir şekilde işlenmesi ve enformasyona dönüştürülmesi işlemleri artık çok kolaylaşmıştır. Oldukça büyük veri setleri bile çok kısa zamanda işlenmekte ve sağlık planlayıcılarına her türlü bilgi kısa bir zamanda sunulmaktadır. Özellikle sağlık alanında kurumlar, bölgeler ve ülkeler arası karşılaştırmalar artık çok kolaylaşmıştır. Unutulmamalıdır ki, periferde ki veriler doğru toplanarak kayıt altına alınmazsa, ülkeye ait hizmet yürütümü ve sağlık planlamasıda doğru olmayacaktır. 108 Kendimizi Sınayalım 6. Geç Neonatal dönem bebek ölümleri için aşağıdakilerden hangisi doğrudur? 1. Bir olayın gerçekleşme olasılığının, olayın gerçekleşmeme olasılığına bölünmesi ile elde edilen hastalık riskine ne ad verilir? a. b. c. d. e. a. Odds Oranı (Odds Ratio) b. Göreli risk oranı c. Atfedilen Risk d. insidans e. prevalans 2. Bir bölgenin nüfus artış hesaplanmasında aşağıdakilerden hangileri kullanılır? 7. Bir ülkenin 2011 yılında 30-34 yaş grubu kadınların yıl ortası nüfusu 974.150 ve 30-34 yaş grubundaki kadınlarınn yaşa özel doğurganlık hızı 78,45’dir. Ülkede 2011 yılı içinde kaç canlı doğum olmuştur? hızının hangisi/ I. Yıl içindeki canlı doğum sayısı II. Yıl içindeki ölü doğum sayısı III. Yıl ortası nüfus a. 7.845 b. c. 764.220 d. 7.642,2 e. a. Sadece I b. Sadece III c. I, II, III d. I ve II e. II vr III 8. Bir bölgede 200 yataklı bir devlet hastanesi ve 50 ve 45 yataklı iki özel hastane bulunmaktadır. 2011 yılı içerisinde bölge nüfusu 480.000 olduğuna göre bölgede onbin nüfusa düşen yatak sayısı kaçtır? 3. Bir hastalığın risk faktörü var iken görülme sıklığının, risk faktörü yok iken görülme sıklığına oranına ne ad verilir? a. b. c. d. e. a. Göreli Risk Oranı b. İnsidans c. Prevelans d. Odds oranı e. Atfedilen risk a. b. c. d. e. %50 %38,75 %100 %61,25 %163,26 72.578.107 1.865.613 82.442.624 36.797.100 45.878.965 10. Sürmatüre (gecikmiş) doğum aşağıdakilerden hangisi doğrudur? a. Gebelik süresi 37 haftadan az olan doğumlar b. Gebelik süresi 38 ile 42 hafta arası olan doğumlar c. Gebelik süresi 28 haftadan az olan doğumlar d. Gebelik süresi 42 haftadan fazla olan doğumlar e. Gebelik süresi 32 ile 38 hafta arası olan doğumlar 5. Bir bölgedeki 2011 yılına ait toplam ölüm sayısı 18.922’dir. Bölgede kalp hastlıklarından ölenlerin sayısının 544 olduğu bilindiğine göre bölgenin ölüm nedenine göre orantılı ölüm hızı kaçtır? a. b. c. d. e. 4,17 1,04 6,15 7,12 61,50 9. 2009 yılı verilerine göre bir ülkede toplam 367.971 ölüm gerçekleşmiştir. Ülkenin aynı yıla ait Kaba Ölüm Hızı 5,07 olduğuna göre ülkenin yıl ortası nüfusu kaçtır? 4. A bölgesinde bölgede 2011 yılı içerisinde pankreas kanserine yakalananların sayısı 320 ve aynı hastalıktan ölenlerin sayısı 196’dır. Bölgenin 2011 yılı Fatalite hızı kaçtır? a. b. c. d. e. 0-6 günlük bebek ölümleri 365 günden daha büyük bebek ölümleri 0-27 günlük bebek ölümleri 7-27 günlük bebek ölümleri 60-364 günlük bebek ölümleri 2.87 %2,87 %28,7 %50 %25 109 için canlı canlı canlı canlı canlı Kendimizi Sınayalım Yanıt Anahtarı Sıra Sizde 2 1. a Yanıtınız yanlış ise “Hastalık Riskleri” başlıklı konuyu yeniden gözden geçiriniz. 2. c Yanıtınız yanlış ise “Nüfusla ilgili hız ve oranlar” başlıklı konuyu yeniden gözden geçiriniz. Eldeki veriler formülde yerine konularak işlemler yapılırsa bölgenin 2011 yılına ait yıl KBH ‰1,74 olarak elde edilir. 3. a Yanıtınız yanlış ise “Hastalık Riskleri” başlıklı konuyu yeniden gözden geçiriniz. 4. d Yanıtınız yanlış ise “Hastalıklarla ilgili istatistikler” başlıklı konuyu yeniden gözden geçiriniz. Sıra Sizde 3 5. b Yanıtınız yanlış ise “Ölümlerle ilgili hız ve oranlar” başlıklı konuyu yeniden gözden geçiriniz. 6. d Yanıtınız yanlış ise “Doğumlar” başlıklı konuyu yeniden gözden geçiriniz. 7. e Yanıtınız yanlış ise “Doğumlarla ilgili hız ve oranlar” başlıklı konuyu yeniden gözden geçiriniz. Bölgenin 2011 yılı Genel Doğurganlık Hızı ‰77,16 olarak elde edilir 8. c Yanıtınız yanlış ise “Hastanedeki sağlık hizmetlerinin değerlendirilmesi” başlıklı konuyu yeniden gözden geçiriniz. Sıra Sizde 4 9. a Yanıtınız yanlış ise “Ölümlerle ilgili hız ve oranlar” başlıklı konuyu yeniden gözden geçiriniz. 10. d Yanıtınız yanlış ise “Doğumlar” başlıklı konuyu yeniden gözden geçiriniz. Eldeki veriler formülde yerine konularak işlemler yapılırsa bölgeye ait 2010 yılı ölen sayısı 14.168 olarak elde edilir. Sıra Sizde Yanıt Anahtarı Sıra Sizde 5 Sıra Sizde 1 BÖH değerinin 7 den küçük olması için canlı doğum sayısı olan paydanın hesaplanarak bulunan değerden daha fazla olması gerekmektedir. Bu açıklamaya göre işlemler yapılırsa; Eldeki veriler formülde yerine konularak işlemler yapılırsa bölgenin o yıla ait yıl ortası nüfusu 413.725 olarak elde edilir. Bölgeye ait 2010 yılı canlı doğum sayısının en az 7000 olması gereklidir. 110 Yararlanılan Kaynaklar Sıra Sizde 6 Sağlık istatistikleri yıllığı (2010), T.C. Sağlık Bakanlığı, Bakanlık Yayın no: 832. Yiğit V., Ağırbaş V.: Hastane işletmelerinde Kapasite kullanım oranının Maliyetlere etkisi: Sağlık Bakanlığı Tokat Doğum ve Çocuk Bakımevi Hastanesinde bir uygulama, Hacettepe Sağlık İdaresi Dergisi, Cilt 7, Sayı 2, 2004. . Sümbüloğlu, K, Sümbüloğlu, V. (2002). Sağlık İstatistiği, Somgür Yayıncılık, Ankara. Bölgenin 2011 yılı AIDS hastalığına ilişkin fatalite hızı %47,49 olarak elde edilir. Sümbüloğlu, K, Sümbüloğlu, V. (1998). Sağlık Enfosmasyon Sistemleri, Somgür Yayıncılık, Ankara. Özdamar, K. (2010) PASW ile Biyoistatistik, Kaan Kitabevi, Eskişehir. Özdamar, K. (1993) Biyoistatistik ve Bilgisayar, Anadolu Üniversitesi Yayınları No:717, AÖF yayınları No:353, Eskişehir. Seçim H., (1991), Hastane yönetim Organizasyonu, Küre Yayıncılık, İstanbul. ve Polat, H. (1998).Sağlık Meslek Liseleri için Sağlık İstatistiği Ders Kitabı, Ankara. Sümbüloğlu, K, (2000). Sağlık Alanına Özel İstatistiksel Yöntemler, ABC matbaacılık San. Tic. Ltd. Şti., Ankara. Gür, E. Sağlık Ölçütleri, http://www.ctf.edu.tr/anabilimdallari/pdf/22/Sagli k_Olcutleri.pdf (download: 19.12.2011) http://www.tuik.gov.tr http://www.tusak.saglik.gov.tr/saglik_istatistikler i_yilligi_2010.pdf http://www.who.int/gho/publications/world_healt h_statistics/en/index.html http://unstats.un.org/unsd/demographic/products/ dyb/dyb2.htm 111 5 Amaçlarımız Bu üniteyi tamamladıktan sonra; Olasılık ile ilgili temel kavramlar açıklayabilecek, Temel olasılık ilkelerini kullanarak örneklem uzayında tanımlanan herhangi bir olayın gerçekleşme olasılığı hesaplayabilecek, Olasılık dağılımlarını tesadüfi değişken tanımına göre sınıflayabilecek, Binom, Poisson ve Normal dağılıma ilişkin olasılıkları hesaplayabilecek bilgi ve becerilere sahip olabilirsiniz. Anahtar Kavramlar Olasılık Olasılık Fonksiyonu Permütasyon Olasılık Yoğunluk Fonksiyonu Örneklem Uzayı Binom Dağılımı Koşullu Olasılık Poisson Dağılımı Venn Diyagramı Normal Dağılım İçindekiler Giriş Olasılığa Giriş Olasılık Hesaplama Olasılık Fonksiyonu 112 Olasılık Kuramı GİRİŞ Önceki ünitelerde istatistiğin betimleyici yönü üzerinde durulmuştu. Bundan sonraki ünitelerde ise örneklem istatistikleri yardımıyla ana kütle parametreleri hakkında tahmin yapma ve karar alma konuları aktarılacaktır. Örneklem ile ana kütle arasında bağıntı kurarak tahmin yapmak ancak olasılık kuramı yardımıyla yapılabileceğinden bu ünitede olasılık kuramı ile ilgili temel kavramlara ve uygulamalarda sıklıkla kullanılan kuramsal olasılık dağılımlarına yer verilmiştir. OLASILIĞA GİRİŞ İstatistik biliminin temelini oluşturan olasılık, belirsizlik durumunda karar almayı sağlar. Rassallığı içeren olasılık, herhangi bir olayın meydana gelme şansıyla ilgilenir. Genel olarak olasılık, meydana gelmesi arzu edilen olay sayısının, olayın nihai tüm sonuçlarının sayısına olan oranı olarak tanımlanır. Örneğin; immün yetmezlik virüsü pozitif olan bir sağlık personelinden hastaya bulaşması, acil hastaların sağlık kurumalarına nakli sırasında meydana gelebilecek bir kazadan refakatçinin etkilenmesi, atopik sağlık çalışanlarında lateks alerjisi gelişimi, ileri yaşlarda depresyonla karşılaşılmasına ilişkin tahminler yapılırken bir belirsizlik durumu söz konusudur. Bu tür belirsizlik durumlarında yoğun bir biçimde olasılık kuramından yararlanılır. Belirsizliğin bir ölçüsü olarak tanımlanan olasılık, aslında bize tesadüfi deneyin çok defa tekrarlanması durumunda bu sonuçlarla hangi şansla karşılaşabileceğimizi tümdengelim yöntemiyle anlatır. Olasılık kavramını açıklayabilmek için üç temel kavramın tanımlanmasına ihtiyaç vardır. Bunlar tesadüfi deney, örneklem uzayı ve olaydır. Deney, Örneklem Uzayı ve Olay Deney, varsayımsal olarak belirli koşullar altında sonsuz defa tekrarlanabilen ve her denemede hangi sonucun gerçekleşeceği konusunda belirsizliğin bulunduğu en az iki sonuçtan oluşan bir süreçtir. Tesadüfi deneye örnek olarak, bir zarın veya bir paranın atılmasını örnek verebiliriz. Bir tesadüfi deneyin tüm olası sonuçlarını içeren kümeye örneklem uzayı denir ve S harfi ile gösterilir. Deney sonuçlarından her birine ise olay denir. Olay örneklem uzayındaki temel sonuçların bir alt kümesidir. Bir deney aynı koşullar altında birçok defa tekrar edildiğinde, sonuçlar belli kurallara bağlı olmaksızın her seferinde değişebiliyorsa, bu deneyin belirli bir sonucuna bağımlı olarak gerçekleşen (ya da gerçekleşmeyen) bir olaya tesadüfi olay denir. Örneğin bir para atma deneyinde hilesiz bir paranın 4 defa üst üste atıldığını varsayalım, bu tesadüfi deneyde belli bir kurala bağlı olmaksızın her seferinde farklı bir sonuç elde edilecektir. Bir deneyin tüm olası sonuçlarının oluşturduğu S kümesinin, örneklem uzayı olarak tanımlandığını belirtmiştik. S’nin her bir elemanına örnek nokta veya örnek denir. S’nin herhangi bir alt kümesine veya örnek sonuçlardan bazılarının kümesi olaydır. Olay A ile gösterilirse A S dir. olayına olanaksız olay, S olayı da kesin olay denir. Bir kesin olayın meydana gelme olasılığının sayısal değeri 1’ dir. 113 Bir tesadüfi deneyin tüm olası sonuçlarını içeren kümeye örneklem uzayı denir ve S harfi ile gösterilir. Örnek 5.1: Hilesiz bir paranın üç defa atıldığını varsayalım örneklem uzayını belirleyerek olası tüm sonuçları yazınız. Çözüm 5.1: Bu deneyde sekiz farklı olası durum vardır. Bu sekiz olası durum, üçlü farklı sonuçlardan meydana gelmektedir. S YYY , YYT , YTY , TYY , YTT , TYT , TTY , TTT Olay, basit ya da bileşik olabilmektedir. Bir deneyin nihai sonuçlarına basit olay denir. Bir bileşik olay ise birden çok sonuçtan oluşmaktadır. Uzman tabipler nöbet ve icapçı nöbet çizelgesi için iki uzman tabibin tesadüfi olarak seçildiği ve cinsiyetlerinin kaydedildiğini varsayalım. Örneklem uzayı; S EE, EK , KE, KK biçiminde olacaktır. Elde edilen dört nihai sonuç bu deneyin basit olaylarıdır, basit bir olayın nihai sonuçları Ei ile gösterilir ve sırasıyla E1 , E2 , E3 , E4 şeklinde tanımlanır. E1 ( EE), E2 ( EK ), E3 ( KE ), E4 ( KK ) Uzman tabipler arasından seçilecek iki tabibin seçilmesi ve cinsiyetlerinin kaydedilmesinin dışında bir A olayı en çok bir erkek uzman tabibin seçilmesi olarak tanımlansın. Bu durumda A olayı birden çok sonuçlu olacaktır. A olayı hiç erkek olmaması ya da bir erkeğin olması durumunda gerçekleyecektir ve bundan dolayı A olayı bir bileşik olaydır, A EK , KE, KK . Venn Diyagramı Venn diyagramı örneklem uzayları ile yapılan işlemleri grafiksel olarak göstermek için kullanılır. Venn diyagramında kullanılan dikdörtgen, kare ya da daire gibi geometrik şekiller bir tesadüfi deneyin tüm sonuçlarını gösterir. Basit ve bileşik olaylar için verdiğimiz örnekten hareketle venn diyagramlarını oluşturursak. Basit olay için; S EE ○ KE ○ EK ○ KK ○ Bileşik olay için; S EE ○ KK ○ KE ○ A EK ○ Olasılık kavramını açıklayabilmek için üç temel kavramın tanımlanmasına ihtiyaç vardır. Bunlar tesadüfi deney, örneklem uzayı ve olaydır. 114 A. F. Yüzer, E. Şıklar, E. Ağaoğlu, H. Tatlıdil, A. Özmen, Editör: A. F. Yüzer (2011). İstatistik, Ünite 4, Eskişehir Anadolu Üniversitesi. Permütasyon ve Kombinasyon Tesadüfi bir deneyin sonuçlarına ilişkin olasılık hesabı yapılırken elverişli sonuçların sayısı ve olası tüm sonuçların sayısının bilinmesi için permütasyon ve kombinasyondan yararlanılır. Permütasyon n sayıda elemandan oluşan bir kümenin herhangi bir alt kümesinde yapılan farklı sıralamadır. n sayıda elemandan oluşan bir kümenin elemanlarının kendi aralarında sıralandığında elde edilecek permütasyon sayısı n P n n ! dir. n tane elemanın hepsini sıralamak yerine sadece r tanesine seçerek ve her sıralanışta her elemanı sadece bir kez kullanmak koşuluyla farklı sıralanışlar yapılabilir. Kısaca permütasyon ile n n! elemanın r li olarak n r koşuluyla kaç farklı şekilde sıralanabileceği elde edilebilir ve n Pr ile n r ! gösterilir. Kombinasyon ise n tane elaman arasından r tanesinin farklı şekilde seçilebileceğini vermektedir. n’ in r’ n n n! n li kombinasyonu n r koşuluyla C ; C r ; veya şeklinde gösterilir. formülü ile r r r ! n r ! hesaplanır. Örnek 5.2: Bir ağız ve diş sağılığı merkezine tedavi için gelen 5 hastanın kuyrukta beklediğini varsayalım; a. Bu beş hasta kaç farklı şekilde sıralanabilir? b. Bu beş hasta içinden 2 hasta kaç değişik şekilde seçilebilir? Çözüm 5.2: Bu sorunun cevabı için permütasyon ve kombinasyon kullanılacaktır. a. n Beş hasta, P n n! 5! 5.4.3.2.1 120 farklı şekilde sıralanabilir. b. Bu beş hasta içinden olabilecek 2’ li seçim sayısı, n 5 n! 5! 5.4.3! C C 10 dur. r 2 r ! n r ! 2! 5 2 ! 2.1.3! Örnek 5.3: 1,2,3,4 rakamlarından birbirinden faklı 2 basamaklı kaç sayı oluşturulabilir? Çözüm 5.3: Bu örneği çözümü için permütasyon kullanılır. n Pr n! 4! 4.3.2.1 4 P2 12 n r ! 4 2 ! 2.1 115 Bir hastanenin acil servisi için 6 sağlık personeli için nöbet çizelgesi hazırlanacaktır; a. 6 sağlık personeli kaç farklı şekilde sıralanabilir? b. 6 sağlık personeli arasından 3 personel kaç farklı şekilde seçilebilir? OLASILIK HESAPLAMA Bir olayın gerçekleşmesi için yapılan tesadüfi bir deneyde birbirinden farklı ve aynı anda olmayan N tane sonuç içinde bir olayın meydana gelme olasılığı P ile gösterilir ve bu bir olayın meydana gelme şansı olarak tanımlanır. Basit bir olayın olasılığı P Ei ile A bileşik olayının olasılığı ise P A ile gösterilir. Herhangi bir basit ya da bileşik olayın olasılığı sıfır ve bir aralığında yer alır; 0 P Ei 1 ve 0 P A 1 . Olasılığı sıfır olan bir olay meydana gelmesi olanaksız olan olaydır. Daha öncede belirtildiği gibi, bir olayın olasılığı bire eşit ise bu olaya kesin olay denir. Tesadüfi bir deneyde, tüm basit olayların olasılıkları toplamı bire eşittir. Toplamı göstermek için (sigma) simgesi kullanılır ve P Ei biçiminde bir basit olayın nihai sonuçlarının toplamları gösterilir. Örneğin hilesiz bir para atma deneyinde iki nihai sonuç varır, S Y , T . Bu deneydeki 2 basit olayın olasılıkları toplamı bire eşit olacaktır. Para atma deneyinde yazı gelme olasılığı 1 , tura gelme 2 1 olasılığı da aynı şekilde ’ dir. O zaman, 2 P E P E P E 1 dir. i 1 2 Olasılıkta her zaman sadece tek bir olay ile ilgilenilmez. İki veya daha fazla olaya ilişkin olasıklıkların hesaplanması istenebilir. Bu durumda S örneklem uzayının A ve B olaylarına ilişkin olasılıklar hesaplandığında; iki olayın birleşimi A B , iki olayın kesişimi A B , A olayının tümleyeni A biçiminde gösterilir. Örnek 5.4: S 1, 2,3, 4,5,6,7,8 , A 1,3,5,7 , B 3,6,7,8 , C= 2, 4,7 olsun. Aşağıda tanımlanan olaylara ilişkin S örneklem uzayının alt kümelerini oluşturunuz. a. A B b. A B c. B C d. B C e. B C A Çözüm 5.4: a. A B 1,3,5,7 3,6,7,8 3,7 b. A B 1,3,5,6 1, 2, 4,5 1,5 c. B C 3,6,7,8 2, 4,7 2,3, 4,6,7,8 d. B C 3,6,7,8 1,3,5,6,8 1, 2,5,6,7,8 e. B C A 3,6,7,8 1,3,5,6,8 1,3,5,7 1, 2,5,6,7,8 1,3,5, 7 1,5,7 İki olay aynı anda meydana gelmiyorsa bu olaylara ayrık olaylar denir. Daha açık bir ifadeyle A ve B ile ifade edilen iki olayın kümelerinin ortak elemanları yoksa A ve B olayları ayrık olaylardır ve bu kümelerin kesişimleri boş kümedir A B . Örneğin; hilesiz bir zar atma deneyinde A olayı zarın üst 116 yüzüne 1, 4 veya 6 gelmesi, B olayı ise zarın üst yüzüne 2,3 veya 5 gelmesi olarak tanımlansın. Bu örnekte A ve B olayları ayrık olaylardır. Çünkü bu iki olayın kümelerinin ortak elemanı yoktur ve kesişimleri boş kümedir. İki olay aynı anda meydana gelmiyorsa bu olaylara ayrık olaylar denir. iki olayın kümelerinin ortak elemanı yoktur ve kesişimleri boş kümedir. Olasılığın Tanımı Bir olayın ortaya çıkma olasılığına ilişkin değişik tanımlar zaman içindeki gelişim sırasına göre ele alınmaktadır. Olasılığın üç farklı tanımı bulunmaktadır: klasik olasılık, oransal frekans yaklaşımı ve çağdaş olasılık. Klasik Olasılık Bir tesadüfi deneyde birbirinden ayrık ve ortaya çıkma bakımından hepsi eşit şansa sahip bütün olası sonuçların sayısı N olsun. Eğer A olarak tanımlanan bir olay toplam N eşit olasılıklı durumdan M tanesinde gerçekleşiyorsa, o zaman A olayının olasılığı P(A)=M/N olarak ifade edilir. Örnek 5.5: Hilesiz bir zar atma deneyinde tek sayı elde edilmesi olasılığını bulunuz. Çözüm 5.5: Hilesiz bir zar atma deneyinde 1,2,3,4,5 ve 6 olmak üzere altı sonuç bulunmaktadır. Tüm sonuçlar eşit olasılıklı sonuçlardır. A olayı 1,3 ve 5 gelmesi olarak tanımlanır, A 1,3,5 . Bu durumda tek sayı gelme olasılığı, P( A) 3 0,5 6 olarak bulunur. Örnek 5.6: Bir sağlık kurumunda istihdam edilen sağlık 100 sağlık çalışanının 30’u 657/4B, 30’ u sözleşmeli 4924, 20’ sinin döner sermaye ve diğer 20’ sininde 657’ ye göre istihdam edildiği bilinmektedir. Bu personel arasından tesadüfi olarak biri seçildiğinde, bu kişinin; a. Sözleşmeli 4924 personel olması olasılığını bulunuz. b. 657’ ye tabii personel olması olasılığını bulunuz. c. Döner sermaye personeli olması olasılığını bulunuz. Çözüm 5.6: Bu örnekte A, B, C ve D olmak üzere 4 olay tanımlanır. A olayı: seçilen bir kişinin 657/4B’ ye göre istihdam edilmiş olması, B olayı: seçilen bir kişinin sözleşmeli 4924’ e göre istihdam edilmiş olması, C olayı: seçilen bir kişinin sözleşmeli döner sermayeye göre istihdam edilmiş olması, D olayı: seçilen bir kişinin 657’ ye göre istihdam edilmiş olmasıdır. O halde; 117 a. P B 30 0,30 100 b. P D 20 0, 20 100 c. P C 20 0, 20 100 Klasik olasılık tanımı eşit olasılıklı olaylarda uygulanabilmektedir. Ancak çoğu problemde eşit şansa sahip olaylara ender rastlanır. Ayrıca M/N oranı matematiksel işlemlere de yeterince uygun değildir. Oransal Frekans Yaklaşımı Bu yaklaşımda tesadüfi deneyin aynı koşullar altında defalarca tekrarlandığı varsayılır. Aynı koşullar altında tesadüfi bir deney çok defa tekrarlandığında elde edilen sonuçlardan ilgilenilen türden olanların sayısının (f), deney sayısına (n) oranı deney sayısı sonsuza büyütüldüğünde f/n değerine yaklaşır. f/n oranının yaklaştığı bu değer ilgilenilen A olayının ortaya çıkma olasılığı olarak tanımlanır ve f P( A) lim olarak gösterilir. Bu gösterimdeki limit matematiksel anlamda olmayıp, deneyin N n olabildiğince çok tekrarlanması anlamındadır. Örneğin bir hastanede A, B, C, D poliklinikleri olsun. Bu polikliniklerden birisi için randevu alan bir hastanın A polikliniğinden randevu istemesi olasılığını hesaplayalım. Bu olasılığı hesaplamak için bir haftalık randevu siteminin örneklem olarak ele alınarak incelendiğini ve A polikliniği için 50, B için 60, C için 90 ve D için 100 hastanın randevu aldığını varsayalım. Belirlenen bu sayılar frekans olarak değerlendirilir ve P(A)= 50/200=0,25 hesaplanır. Ancak örneklem olarak bir hafta değil de bir aylık gözlenen randevular alınsaydı frekanslar değişeceğinden olasılıklarda değişecekti. Bu olasılıklardaki değişmenin azaltılması ancak örneklem hacminin arttırılması yoluyla sağlanır. Bu örnekte bir hafta ve bir ay yerine bir yıllık gözlem yapıldığında bu olasılıkların belirli sayılarda durağanlaştığı görülecektir. Kısaca doğru sonuçlara ulaşabilmemiz için çok sayıda gözlem yapmamız gerekir. Oransal frekans yaklaşımında, n sayıda deneyin aynı koşullar altında yapılmasının zorluğu ve deney sayısının kaçta sonlandırılacağının bilinememesi gibi yetersizlikler vardır. Çağdaş Olasılık Bundan önceki iki tanımın yetersizliklerini gidermek için 1933 yılında Kolmogorov bazı temel özellikler yardımıyla olasılığı matematiksel bir tabana oturtmuş ve günümüzdeki çağdaş olasılık kuramı oluşmuştur. Bu temel özellikler aşağıda verilmiştir. Özellik 1: A, S örneklem uzayında tanımlanmış herhangi bir olay olsun. 0 P A 1 Özellik 2: P S 1 Özellik 3: A ve B, S örneklem uzayında tanımlanmış iki ayrık olay olsun. Bu durumda, P A B P A P B Özellik 4: A, S örneklem uzayında herhangi bir olay ve A bu olayın tümleyeni ise, A olayının gerçekleşme olasılığı P A 1 P A dır. Özellik 5: P 0 Özellik 6: A ve B, S örneklem uzayında tanımlanmış ayrık olmayan herhangi iki olay olsun. Bu durumda P A B P A P B P A B Özellik 7: A, B ve C olayları S örneklem uzayında tanımlanmış ayrık olmayan üç olay olsun. Bu durumda, P A B C P A P B P C P A B P A C P B C P A B C 118 Örnek 5.7: İki tavla zarının birlikte atıldığını varsayalım. A olayı üst yüze gelen sayıların toplamının 8 olması ve B olayı üst yüze gelen sayıların aynı olması olayları olarak tanımlansın. Bu iki olayın birleşiminin olasılığını bulunuz. Çözüm 5.7: S örneklem uzayı 36 nihai sonuçtan meydana gelmektedir. A olayın gerçekleşme durumu, A 2,6 , 3,5 , 4, 4 , 5,3 , 6, 2 , B olayının gerçekleşme durumu ise B 1,1 , 2, 2 , 3,3 , 4, 4 , 5,5 , 6,6 olur. Bu durumda A ve B olaylarının birleşiminin olasılığı P A B P A P B P A B eşitliğiyle elde edilir. P A 5 6 1 dır. , P B , P A B 36 36 36 P A B 5 6 1 10 0, 28 bulunur. 36 36 36 36 1. Bir hastanede 30’u erkek ve 15’i kadın olmak üzere 45 sağlık personeli bulunmaktadır. Bu 45 sağlık personeli içinden tesadüfi olarak seçilen bir çalışanın erkek olma olasılığı nedir? 2. A ve B olayları için olasılıklar P A veriliyor. P A B olasılığını bulunuz. 1 2 2 , P B ve P A B olarak 3 5 3 Koşullu Olasılık İki bağımlı olaydan birincisinin gerçekleştiği bilindiğinde ikincisinin ona bağlı olarak gerçekleşme olasılığına koşullu olasılık denir. Bir olayın gerçekleşme şansı başka bir olayın gerçekleşmesine bağlı olduğunda koşullu olasılık kullanılmaktadır. A ve B olayları herhangi iki olay olsun. A olayının gerçekleştiği bilindiğinde, B olayının ortaya çıkma olasılığı koşullu olasılık olarak tanımlanır ve P B A ile gösterilir. Koşullu olasılık A ve B olayları için aşağıdaki gibidir. P A B : B olayı biliniyorken A olayının ortaya çıkma olasılığı, P B A : A olayı biliniyorken B olayının ortaya çıkma olasılığı, ve bu iki olasılık, P A , P B ve P A B olasılıklarına bağlı olarak, P A B P A B P B , P( B) 0 119 P B A P A B P A , P( A) 0 şeklinde tanımlanır. Aynı zamanda bu tanımlamadan hareketle, P A B P A B P B ve P A B P B A P A olur. Örnek 5.8: Hilesiz bir zar atıldığında zarın üst yüzüne tek sayı gelmiş ise bu sayının 3 olma olasılığı nedir? Çözüm 5.8: S örneklem uzayı 6 nihai sonuçtan meydana gelmektedir, S 1, 2,3, 4,5, 6 . Burada A ve B olaylarının tanımlanması gerekir. A olayı atılan zarın 3 gelmesi ve B olayı ise zarın tek sayı olmasıdır. Zarın 3 gelmesi olasılığı A 3 , P A 1 , 6 Zarın tek sayı gelmesi olasılığı B 1,3,5 , P B 3 dır. 6 A ve B olaylarının kesişimi ise, P A B 1 olur. 6 Bu durumda atılan zar tek gelmiş ise bunun 3 olma olasılığı; P A B P A B P A B P B , P( B) 0 ( B olayı bilindiğinde A olayının ortaya çıkma olasılığı) 16 1 36 3 olarak elde edilir. Örnek 5.9: Bir hastanedeki hastaların % 40’ ı sindirim sistemi, % 30’ u diyabet ve % 30’u kalp damar rahatsızlıkları nedeniyle tedavi edilmektedir. Ayrıca hastaların % 10’ u hem sindirim sistemi hem de kalp damar rahatsızlığı, % 20’ sinde hem diyabet hem de kalp damar rahatsızlığı vardır. a. Tesadüfi olarak seçilen bir hasta diyabetliyse bu hastanın aynı zamanda kalp damar rahatsızlığına sahip olma olasılığı nedir? b. Tesadüfi olarak seçilen bir hasta kalp damar rahatsızlığına sahip ise, bu hastanın sindirim sistemi rahatsızlığına sahip olma olasılığı nedir? Çözüm 5.9: S örneklem uzayında A, B ve C olayları öncelikle tanımlanmalıdır. A olayı: Sindirim sistemi rahatsızlığının olması, B olayı: Diyabetli olması, 120 C olayı: Kalp damar rahatsızlığının olması. P( A) 0, 40, P( B) 0,30, P(C) 0,30 ve bu olayların ilgili kesişimleri, P A B 0,10 ve P B C 0, 20 tir. Bu durumda seçilen hasta diyabetli ise aynı bunun kalp damar rahatsızlığına da sahip olma olasılığı; P C B PB C P B 0, 20 0, 67 0,30 dir. Bu durumda seçilen hasta diyabetli ise aynı bunun kalp damar rahatsızlığına da sahip olma olasılığı; P A C P AC P C 0,10 0,33 tur. 0,30 Ayrık ve Bağımsız Olaylar İki ya da daha fazla olay bir arada meydana gelemiyorsa bu olaylara ayrık olaylar denir. Bu bir olayın otomatik olarak diğer olayın meydana gelmesini engellemek anlamına gelir. Bir araştırmacı A polikliniğine gelen hastaları cinsiyetlerine (kadın, erkek) ve yaşlarına (40’ın altında, 40 ve daha üstü) sınıflandırıyor. Polikliniğe gelen hastalar arasından tesadüfi olarak seçilen bir hasta her iki özelliğe de sahip olabileceğinden bu iki olay ayrık değildir. Ayrık olaylar için A veya B’nin olasılığı P( A B) P( A) P( B) , ayrık olmayan olaylar için ise A veya B’nin olasılığı P( A B) P( A) P( B) P( A B) şeklinde hesaplanır. A polikliniğine gelen 100 hastanın yaş ve cinsiyetleri aşağıdaki iki yönlü tablodaki gibi verilmiş olsun. Polikliniğe gelen hastalardan birisi tesadüfi olarak seçilse, bu hastanın; Erkek ve 40 yaş altında olma olasılığını, Erkek veya 40 yaş altında olma olasılığını bulalım; Cinsiyet / Yaş Grubu 40 yaş altı 40 yaş ve üstü Toplam Erkek 20 10 30 Kadın 40 30 70 Toplam 60 40 100 A ; Hastanın erkek olması olayı, B ; Hastanın 40 yaş altında olması olayı olarak tanımlansın. Erkek ve 40 yaş altında olma olasılığı P( A B) 20 100 Erkek veya 40 yaş altında olma olasılığı P( A B) P( A) P( B) P( A B) 30 60 20 70 100 100 100 100 Şeklinde hesaplanır. A ve B gibi herhangi iki olaydan birinin gerçekleşmesi diğer olayın ortaya çıkma olasılığını etkilemiyorsa bu iki olaya bağımsız olaylar denir. Bağımsız olaylar için A olayı bir hilesiz zarın üst yüzüne gelen sayının 3 olması, B olayı ise bir madeni paranın tura gelmesi olsun. A olayının olması B 121 olayının ortaya çıkıp çıkmamasını etkilemez. Tam tersi B olayı da A olayının ortaya çıkıp çıkmamasını etkilememektedir. Bundan dolayı A ve B olayları bağımsız olaylardır. Bu durumda P A B P A ve P B A P B ise A ve B olayları bağımsız olaylardır. Daha önce tanımlamış olduğumuz P A B P A B P B eşitliğinde bağımsız olaylar söz konusu olduğunda P A B P A olduğundan eşitlik P A B P( A) P B şeklinde olacaktır. P A B P( A B) P B P( A) P( B) Bu eşitlik iki olayın bağımsızlığı için gerek ve yeter koşuldur. Örnek 5.10: Bir sağlık kuruluşunda A çalışanın 30 gün içinde 4’ ten fazla nöbet tutma olasılığı % 60, B çalışanının ise 30 gün içinde 4’ ten fazla nöbet tutma olasılığı % 70’ tir. Her iki çalışanında 30 gün içinde 4’ ten fazla nöbet tutma olasılığı nedir? Çözüm 5.10: A ve B olayları öncelikle tanımlanmalıdır. A olayı: A çalışanının 30 gün içinde 4’ ten fazla nöbet tutması, P( A) 0,60 B olayı: B çalışanının 30 gün içinde 4’ ten fazla nöbet tutması, P( B) 0,70 A ve B olayları bağımsız olaylarıdır. Bu durumda olasılık, P A B P( A) P( B) 0,60 0,70 0, 42 dir. Eğer bir olayın ortaya çıkması öteki olayın ortaya çıkma olasılığını etkilemiyorsa, bu iki olaya bağımsız olaylar denir. A ve B olaylarının bağımsız olabilmeleri için durumda P A B P A veya P B A P B koşulu sağlanmalıdır. Bir sözleşmeli personelin daimi kadroya 2 yıl içinde geçme olasılığı 0,80 ve başka bir sözleşmeli personelin ise daimi kadroya 2 yıl içinde geçme olasılığı 0,60’ tır. Her iki sözleşmeli personelinde 2 yıl içinde daimi kadroya geçme olasılıkları nedir? OLASILIK FONKSİYONU Olasılığa giriş ve olasılık hesaplama konularından sonra, tesadüfi değişken, olasılık fonksiyonları, birikimli olasılık fonksiyonu ve ortak olasılık fonksiyonu kavramı olasılık ile ilgili diğer önemli konulardır. Tesadüfi Değişkenler Tesadüfi değişken, S örnek uzayındaki her bir tesadüfi olaya sayısal değerler atayan bir fonksiyondur. Bu fonksiyon aracılığıyla örnek uzayındaki her bir sonuç reel eksende bir değere taşınır. Kısaca tesadüfi değişken, S örneklem uzayının her bir olayını yalnız bir gerçek değere dönüştürür. Tesadüfi bir denemenin yapılarak olası sonuçlara sayısal değerler verileceğini düşünelim. Bir zar atma ya da bir ailenin gelirini ölçme gibi denemelerde sonuçlar doğal olarak sayısal biçimdedir. Böyle olmadığı durumlarda bile sonuçlara sayılar vermek, özellikle yalnızca iki sonuçlu denemelerde, anlamlı ve yararlı olabilir. Sözgelimi, bir işletmede üretilen bir parça “kusurlu” ya da “kusursuz” diye sınıflandırılabilir. Bu olanaklardan ilkine 1, ikincisine 0 değerini verebiliriz. O zaman tesadüfi değişken: tesadüfi bir denemenin sonuçlarına göre belirlenen sayısal değerleri alan bir değişkendir. Tesadüfi bir değişken ile onun alabileceği değerleri birbirinden ayırmak önemlidir. Simgesel olarak bunu X gibi büyük harflerle, 122 onun alabileceği değerleri ise x gibi küçük harflerle göstererek yapabiliriz. Tesadüfi değişkenin aldığı tüm değerler X’ in değer kümesini oluşturur ve X tesadüfi değişkeninin değer kümesi bir olasılık uzayıdır. Bir X değişkeni, alabileceği her bir değeri belli bir olasılıkla alıyorsa bu değişkene tesadüfi değişken adı verilir. Bir tesadüfi değişken yalnızca sayılabilir sayıda değerler alabiliyorsa kesiklidir. Kesikli tesadüfi değişkenlere örnekler, büyük bir parti mal içinden alınan yirmilik bir örneklemdeki kusurlu parça sayısı, bir polikliniğe bir saat içinde gelen hasta sayısı vb. Bunların tersine, günlük hava sıcaklığıyla ilgilendiğimizi düşünelim. Sıcaklık, sürekli bir ölçekle ölçülür ve sürekli bir tesadüfi değişkendir. Bir tesadüfi değişken tanımlı bir aralıktaki tüm değerleri alabiliyorsa süreklidir. Bir ailenin yıllık geliri, ithal edilen ilaç hammadde miktarı, bir hisse senedi fiyatının aylık değişimi, bir hastaya konulan tanı ile iyileşmesi arasında geçen süre, bir kimyasal maddenin kirlilik oranı sürekli tesadüfi değişkenlere verilebilecek örneklerdir. Olasılık Fonksiyonu Tanımları Olasılık fonksiyonu, bir değişkenin alabileceği değerler ile bu değerleri alabilmesi olasılıkları arasındaki ilişkiyi gösteren bir fonksiyondur. Bu fonksiyon bir tesadüfi değişkenin alabileceği tüm değerlere ilişkin olasılıkların tek tek gösterilmesi yerine, olasılıkların hesaplanmasında kullanılacak bir eşitliktir. Olasılık fonksiyonları tesadüfi değişken tanımına göre; kesikli olasılık fonksiyonu (olasılık fonksiyonu) ve sürekli olasılık fonksiyonu (olasılık yoğunluk fonksiyonu) olarak iki şekilde tanımlanır. Kesikli Olasılık Fonksiyonu X , kesikli bir tesadüfi değişken bunun alabileceği değerlerden biride x olsun. X tesadüfi değişkeninin belli bir x değerini alma olasılığı P (X = x) ile gösterilir. Tesadüfi bir değişkenin, olanak içindeki bütün sonuçları olasılık fonksiyonları kullanılarak gösterilir. Bu gösterim cebirsel, çizimsel yada çizelge biçiminde olabilir. Kesikli tesadüfi değişkenler için uygun bir gösterim, olanak içindeki bütün sonuçların olasılıklarının x’in değerlerine göre dizmektir. X’ in tüm olası x değerleri için tanımlanan P( x) P( X x) fonksiyonu, X değişkeninin olasılık fonksiyonu olarak tanımlanır. X, olasılık fonksiyonu P(x) olan kesikli bir tesadüfi değişken olsun. Bu durumda, 1. Her x değeri için P( x) 0 2. Tekil olasılıkların toplamı 1’dir; yani P( x) 1 x Buradaki gösterim x’in bütün değerleri için toplama yapıldığı anlamına gelir. Özellik (1), yalnızca, olasılıkların negatif olamayacağını gösterir. Özellik (2), x’in bütün olanaklı değerleri için “X=x” olaylarının bağdaşmaz ve bütünü kapsayıcı olduğu olgusundan türemiştir. Dolayısıyla bu olayların olasılıkları toplamı 1 eder. Örnek 5.11: Bir hilesiz zar atıldığında tek sayı gelme olasılığı bulunuz. Çözüm 5.11: Hilesiz bir zar atma deneyinde S örneklem uzayı, S 1, 2,3, 4,5, 6 dır. A olayı zarın tek gelmesi ise, A 1,3,5 dir. P( A) P( x) x A 1 1 1 3 0,5 bulunur 6 6 6 6 123 Örnek 5.11: Bir çift hilesiz zar deneyinde, zarların yüzeyindeki sayıların toplamının 8 olması olasılığını bulunuz. Çözüm 5.11: İki zar atıldığında 36 nihai sonuçtan oluşan bir örneklem uzayı elde edilir. Bu örneklem uzayında A olayı ise zarların üst yüzeyindeki sayıların toplamının 8 olasıdır. A 2,6 , 3,5 , 4, 4 , 5,3 , 6, 2 O zaman, P( A) P( x) xA 1 1 1 1 1 5 0,14 olur. 36 36 36 36 36 36 Örnek 5.12: Bir hastanede çalışan 100 sağlık personelinin, 30’ u sağlık meslek lisesi acil tıp mezunu, 50’ si sağlık meslek lisesi hemşirelik mezunu ve 20’ si de sağlık meslek lisesi laboratuar mezunudur. Ayrıca çalışanların 60’ ı kadındır. Bu hastaneden tesadüfi olarak seçilen bir personelin; a. Sağlık meslek lisesi acil tıp mezunu olma olasılığını, b. Erkek çalışan olma olasılığını, c. Sağlık meslek lisesi laboratuar mezunu olmama olasılığını bulunuz. Çözüm 5.12: 30 0,30 100 a. P x : Acil Tıp Mezunu b. P x : Erkek Çalışan c. P x : Laboratuar Mezunu Olmama 40 0, 40 100 80 0,80 100 Sürekli Olasılık Fonksiyonu - Olasılık Yoğunluk Fonksiyonu X, sürekli bir tesadüfi değişken ve x te bu tesadüfi değişkenin alabileceği değerler aralığındaki herhangi bir sayı olsun. Bu tesadüfi değişkenin olasılık yoğunluk fonksiyonu, f ( x) , aşağıdaki özellikleri taşıyan bir fonksiyondur: i. x’in bütün değerleri için f ( x) 0 ii. f ( x)dx 1 dir. x Sürekli bir tesadüfi değişkenin olasılık yoğunluk fonksiyonu, f ( x)dx şeklinde ifade edilir. Bu fonksiyon aracılığıyla X değişkeninin a ile b arasında bir değeri alma olasılığı ise, b P{ a X b }= f ( x)dx ile bulunur. f(x)’in sürekli olasılık fonksiyonu olabilmesi için aşağıdaki a şartları sağlaması gerekir: 124 f(x)’in integrali alınabilir ve f(x)=0 her x R için, I. II. f(x) 0 her x R için ya da x için, f ( x)dx 1 III. R Birikimli Olasılık Fonksiyonu Bir değişkenin X gibi bir değere eşit ya da daha küçük bir değeri alabilmesi olasılığını gösteren fonksiyon birikimli dağılım fonksiyonudur. X’ in birikimli olasılık fonksiyonu gerçel sayılar kümesinde x’e eşit veya ondan küçük değerleri alan ve S örneklem uzayında X tesadüfi değişkeni ile ilişkili olan olasılıktır. Birikimli olasılık fonksiyonu F(x) ile gösterilir. F ( x) P X x Kesikli ve sürekli tesadüfi değişkenler için birikimli olasılık fonksiyonu aşağıdaki gibidir; Kesikli birikimli olasılık fonksiyonu: F ( x) P( x) x Sürekli birikimli olasılık fonksiyonu: F ( x) f (t )dt . Bir değişkenin a…b aralığında bir değer alabilmesi olasılığı, birikimli olasılık fonksiyonu ile aşağıdaki gibi gösterilir; P a x b F b F a Olasılık Dağılımları Yapılan her tesadüfi deneyde ortaya çıkan sonuçlar için yeni bir fonksiyon aramak hem emek hem de zaman kaybına yol açacağından çeşitli tesadüfi deneylerin aynı koşullar altında aynı özellikler göstermelerinden yararlanılarak kuramsal olasılık dağılımları geliştirilmiştir. Bu kuramsal olasılık dağılımları benzer özellikteki diğer deneylerde de kullanmak amacıyla genelleştirilmiştir. Çok sayıda kuramsal olasılık dağılımdan söz etmek olanaklı ise de bu ünitede kesikli olasılık dağılımlarından Binom dağılımı ve Poisson dağılımı, sürekli olasılık dağılımlarından ise Normal dağılım ele alınacaktır. Binom Dağılımı Yapılan deneylerin sonuçları, olumlu-olumsuz, başarılı-başarısız, iyi-kötü, ölü-sağ, pozitif-negatif gibi ortaya çıkıyorsa, bu tür deneyler sonucunda elde edilen dağılımlar Binom dağılımıdır. Tesadüfi bir deneyin başarılı ve başarısız olarak iki ayrık ve bütüne tamamlayıcı bir şekilde sonuçlanabileceği ve tek bir deneydeki başarı olasılığının p olduğunu düşünelim. Eğer birbirinden bağımsız n tane deney yapılırsa, ortaya çıkan başarı sayısı X’ in dağılımına Binom dağılımı denir. Binom dağılımı kesikli olasılık dağılımıdır. Binom dağılımı, tüm denemelerin aynı koşullarda tekrarlandığı ve her tekrarda birbirinden bağımsız iki olaydan birinin meydana geldiği deneylerde ortaya çıkmaktadır. Örneğin Binom deneyine, bir kadının klasik tüp bebek işlemi sonrasında gebe kalması (başarı) veya kalmaması (başarısılık) örnek olarak verilebilir. 20 adet gebe kalma olasılığı aynı olan kadına klasik tüp bebek işlemi yapıldığını varsayalım burada tesadüfi değişkenimiz başarılı gebeliklerin sayısıdır ve Binom dağılımına sahiptir. Bir deneyin olumlu sonuçlanma olasılığı p, olumsuz sonuçlanma olasılığı da q (1-p) ile gösterilir. Örneğin hilesiz bir para atma deneyinde ilgilenilen olay paranın tura gelmesi olsun. Bu durumda p = 0,5, q = 1-p = 0,5 ve p+q =1 olacaktır. Binom dağılımı aşağıdaki özelliklere sahiptir: 1. Her bir deneme için yalnız iki sonuç vardır. Başarı (p) , Başarısızlık (q) 2. Başarma olasılığı p her bir deneme için aynıdır. Başarısızlık olasılığı q=1-p dir. 125 3. Denemeler birbirinden bağımsızdır. 4. Denemelerin sayısı n sabittir. Aşağıdaki deneyler Binom tesadüfi değişkenleriyle ilgilidir. 1. Bir para 10 kez atılsın. X tesadüfi değişkeni gözlenen turaların sayısıdır, 2. İçinde 4 kusurlu ve 8 kusursuz parça bulunan bir kutudan iadeli 5 parça seçelim. X tesadüfi değişkeni seçilen kusurlu parçaların sayısıdır, 3. İçinde 7 kırmızı ve 5 sarı top bulunan bir kavanozdan iadeli 4 top çekilsin. X tesadüfi değişkeni çekilen kırmızı topların sayısıdır. 4. Bir aşını yan tesir gösterme olasılığı 0,10 dur. 20 kişiye bu aşının denendiği varsayılsın. X tesadüfi değişkeni yan tesir gösteren hasta sayısı olarak tanımlansın. Bu tanıma göre X Binom dağılır. X, bir tek denemede başarma olasılığı p, başaramamanın olasılığı q olan n bağımsız deneme için Binom tesadüfi değişkeni ise, X’in olasılık fonksiyonu; n x n x p q p x x 0 ,x 0,1,2,...,n ,diğer durumlarda dir. X kesikli tesadüfi değişkeni Binom dağılımına sahip ise ortalaması, standart sapması npq ve değişim katsayısı np , varyansı 2 npq , 1 p dir. np Örnek 5.13: Bir sigortacı hayat poliçesi satmak için 5 görüşme yapmaktadır. Bunların her biri için satış yapma olasılığı 0,4 olduğunu düşünelim. O zaman satış sayısı X, n=5, p=0,4 olan bir Binom dağılımına uyar. P( x) 5! 0, 4 x (0,6)5 x x=0,1,2,3,4,5 için başarı (yapılan satış) sayılarının olasılıkları x !(n x)! aşağıdaki gibi hesaplanır: P(0) 5! 0, 40 (0, 6)5 0, 078 0!5! P(2) 0,346 P(3) 0, 230 P(1) 5! 0, 41 (0, 6) 4 0, 259 1!4! P(4) 0,077 P(5) 0,010 Bir sigortacının 2 ile 4 arasında satış yapma olasılığı, P(2 X 4) P( X 2) P( X 3) P( X 4) P(2 X 4) 0,346 0, 230 0, 077 0, 653 Sigortacının en az bir satış yapması olasılığı ise, P( X 1) 1 P( X 0) 1 0,078 0,922 şeklinde hesaplanır. 126 Örnek 5.13 deki verilen problemin excel programında çözümü için önce fonksiyon ekle (fx) tuşuna basılarak buradan istatistiksel fonksiyonlar seçilir. Daha sonra istatistiksel fonksiyonlar arasından Binom dağılımı seçilerek aşağıda verilmiş olan resimdeki gibi ilgili alanlar belirlenerek olasılıklar hesaplanır. Örnek 5,13 de verilen problemin Binom dağılımı yardımıyla excel çözümü yapılarak kümülatif başlığı altında olasılıklar hesaplanır. Bu hesaplanan olasılıkların daha görsel sunumu ve yorumlanması için grafik çizilmek istendiğinde ise başarı sütünü ile kümülatif sütünü seçilerek ekle grafik menüsüne basılır ve istenilen grafik türü belirlenir. Böylece hesaplanan olasılıklar ve başarıya (yapılan satışlar) ilişkin grafik aşağıda ki resimde verildiği gibi elde edilir. 127 Örnek 5.14: Fizyoterapist eşliğindeki Plates gruplarına katılan kadınların % 40’ ı zayıflama programını tamamlayabilmektedir. Tesadüfi olarak 6 kadın seçildiğinde, bunların yarısından fazlasının zayıflama programını tamamlaması olasılığı nedir? Çözüm 5.14: Bu olayda tamamlama ve tamamlamama olmak üzere iki sonuç vardır. X, zayıflama programını tamamlayan kadınların sayısını göstersin, p 1 0, 40 0,60 ’ tır. 6 kadının yarsından fazlasının tamamlamasının olasılığı P X 3 tür. O halde; 128 P X 3 P X 4 P X 4 P X 5 P X 6 6 6 6 4 2 5 1 6 0 0, 6 0, 4 0, 6 0, 4 0, 6 0, 4 4 5 6 0,311 0,187 0, 047 0,545 Binom dağılımı, tüm denemelerin aynı koşullarda tekrarlandığı ve her tekrarda birbirinden bağımsız iki olaydan birinin meydana geldiği deneylerde karşımıza çıkar. F. Er, K.Ö, Peker, Editör: H. Sönmez (2009). Biyoistatistik, Ünite 4, Eskişehir Anadolu Üniversitesi. Bir hastanede çalışanların % 25’ i hizmet içi eğitime katılmıştır. Tesadüfi olarak seçilen 5 kişiden 1 tanesinin hizmet içi eğitime katılmış olma olasılığını bulunuz. Poisson Dağılımı Binom dağılımında p olasılığının oldukça küçük olması (genellikle p<0,05) durumunda Binom dağılımı uygun bir kuramsal olasılık modeli olmamaktadır. Tesadüfi değişken belli bir zaman aralığında veya belli bir mekânda çok az yinelenen olayları göstermesi durumunda ortaya çıkan olasılık dağılımı Poisson dağılımı olarak adlandırılır. Pek çok deney uzayın sürekli bir bölgesinde ya da sürekli bir zaman aralığında sonsuz sayıdaki olanaklı 0,1,2,3,... değerlerinin verilmesiyle oluşur. Birim zaman, dakika, saat, gün, hafta; birim uzay, uzunluk, alan, hacim olabilir. Poisson dağılımı sürekli uzayda kesikli veriler veren deneylere uygulanır. Verilmiş bir zaman aralığında ya da uzayın verilmiş bir bölgesinde başarıların sayısı, X rassal değişkeni olsun. Aşağıdaki koşulları sağlayan X’e Poisson dağılmış tesadüfi değişkeni denir. 1. Farklı bir zaman veya mekân diliminde ilgilenilen türden sonuçların gerçekleşmesi birbirinden bağımsızdır. 2. Küçük bir zaman aralığı veya uzayın küçük bir bölgesi için başarı olasılığı, uzaydaki bölge ya da zaman aralığının uzunluğu ile orantılıdır. 3. Küçük bir zaman aralığı veya uzayın küçük bir bölgesinde iki ya da daha çok başarının olasılığı önemsizdir. 4. Küçük bir zaman ya da mekan diliminde ilgilenilen türde sonuçların bir defa gerçekleşme olasılığı olan p sabittir ve yaklaşık olarak p<0,05 eşitsizliğine uymaktadır. Aşağıdaki örnekler Poisson tesadüfi değişkenleriyle ilgilidir; 1. Büyük bir şehirde ender rastlanan bir hastalıktan her yıl meydana gelen ölümlerin sayısı, 2. Bir üretimdeki kusurlu ürün sayısı, 3. Bir kitabın her bir sayfasındaki eksik basımların (yanlış basımların) sayısı. 4. Bir kentte bir hatta meydana gelen ölümcül kazaların sayısı. 5. Dahiliye polikliniğine gelen hastalarda aylık göğüs kanseri görülme sayısı. 129 X, 0,1,2,... olanaklı değerleri alabilen Poisson teadüfi değişkeni olsun, X’ in olasılık fonksiyonu, e x P( x) x ! 0 ,x 0,1,2,...; 0 ,diğer durumlarda , Poisson dağılımının tek parametresidir ve Poisson dağılımına sahip X değişkeninin ortalamasıdır. X kesikli tesadüfi değişkeni Poisson dağılımına sahip ise ortalaması , varyansı ve değişim katsayısı 1 dır. Toplumda az sayıda ya da seyrek olarak gözlenen olayların belli bir zaman aralığındaki gözlenme sayılarının uyduğu kuramsal dağılıma Poisson dağılımı denir. Örnek 5.15: Bir hastanede yeni doğan servisinde akciğer enfeksiyonundan bir hafta içinde ölenlerin sayısı 4 olan Poisson dağılımına uymaktadır. Belli bir hafta içinde akciğer enfeksiyonundan hiçbir yeni doğanın ölmemiş olma olasılığı nedir? Çözüm 5.15: X: Bir haftada akciğer enfeksiyonundan ölenlerin sayısı P( x) e x , x 0,1,2,... x! 4 ve X 0 olasılık fonksiyonunda yerine konursa; P( X 0) e4 40 0, 0183 olasılığını elde ederiz. Burada e sabit bir sayı olup değeri 2,71828’ dir. 0! Örnek 5.16: Bir hastanenin acil servisine Pazar günleri saat: 16.00 - 17.00 arasında 20 dakikada bir ortalama 3 acil vaka gelmektedir. Saat 16.00-17.00 arasında herhangi bir 20 dakika içinde acil servise 0,1,2,3,4 ve 5 vakanın gelmesi olasılıklarını hesaplayınız. Çözüm 5.16: X: Acil servise Pazar günleri saat: 16.00 - 17.00 arasında 20 dakikada bir gelen hasta sayısı P( x) e x , x 0,1,2,... x! 3 ve X 0,1, 2,3, 4,5 olasılık fonksiyonunda yerine konursa; P( X 0) e3 30 0, 0498 0! P( X 1) e3 31 0,1494 1! P( X 2) e3 32 0, 2241 2! P( X 3) e3 33 0, 2241 3! P( X 4) e3 34 0,1681 4! P( X 5) e3 35 0,1008 5! olasılıkları elde edilir. 130 Örnek 5.16 deki verilen problemin excel programında çözümü için önce fonksiyon ekle (fx) tuşuna basılarak buradan istatistiksel fonksiyonlar seçilir. Daha sonra istatistiksel fonksiyonlar arasından Poisson dağılımı seçilerek aşağıda verilmiş olan resimdeki gibi ilgili alanlar belirlenerek olasılıklar hesaplanır. Örnek 5,16 de verilen problemin Poisson dağılımı yardımıyla excel çözümü yapılarak kümülatif başlığı altında olasılıklar hesaplanır. Bu hesaplanan olasılıkların daha görsel sunumu ve yorumlanması için grafik çizilmek istendiğinde ise X sütünü ile kümülatif sütünü seçilerek ekle grafik menüsüne basılır ve istenilen grafik türü belirlenir. Böylece hesaplanan olasılıklar ve başarıya (yapılan satışlar) ilişkin grafik aşağıda ki resimde verildiği gibi elde edilir. 131 Örnek 5.17: Bir polikliniğe 5 dakikada ortalama 2 hasta gelmektedir. a. 5 dakikalık sürede gelen hasta sayısının olasılıklarını gösteriniz. b. 5 dakika içinde ikiden çok hasta gelmesi olasılığını bulunuz. Çözüm 5.17 : Bekleme yada kuyruk oluşturma sorularının çözümünde Poisson dağılımı kullanılır. 5 dakikalık sürede gelen hasta sayısını X ile gösterelim, ortalaması 2 olan bir Poisson dağılımına uyar. Olasılık fonksiyonu: 132 a. P( x) e2 (2) x x! P( X 0) x= 0, 1, 2,........... e2 (2)0 0,1353 0! P( X 1) e2 (2)1 0, 2706 1! P( X 2) e2 (2)2 0, 2706 2! b. P( X 2) 1 P(0) P(1) P(2) 0,3233 dir. X, Binom dağılımına sahip tesadüfi değişken olsun. Deney sayısı n’nin çok arttırıldığını ve ilgilenilen sonuçların ana kütledeki oranının çok küçük olduğunu varsayalım. Kısaca n ve p 0 iken n. p sabit bir sayı olmak üzere Binom dağılımı Poisson dağılımına yaklaşır. Bu nedenle Binom dağılımı yerine ortalaması n. p olan Poisson dağılımı kullanılır. Örneğin, Bir serumun hastaya verilmesi sonucu yan etkiye neden olma olasılığı 0,02 olduğu varsayılsın. 100 hastadan tesadüfi olarak seçilen 4 tanesinde ilacın yan etki göstermesi olasılığını hesaplayalım; n. p olduğunu biliyoruz, o zaman 0,02 100=2= bulunur. X, yan etki gösteren hasta sayısı olarak tanımlandığında, P( X 4) =2 olan Poisson dağılımına uyar. İstenen olasılık, e2 24 0,135 16 0, 09 4! 24 olarak bulunur. Bir bölgede 1 yıllık periyotta tifodan (typhoid fever) ölen kişi sayısı ortalama 4 olarak belirlenmiştir. Bu bölgede önümüzdeki 1 yıl içinde tifodan 8 kişinin ölme olasılığı nedir? Sağlık kuruluşlarında mesleki kazalar sonucunda her yıl ortalama olarak meydana gelen 1000 kazadan 1’i ölümcül kazadır. Bir yıl içinde 2000 sağlık personelini hiçbirinin ölümcül kaza ile karşılaşmama olasılığı nedir? Normal Dağılım İstatistikte en çok kullanılan ve çok geniş bir uygulama alanına sahip olan normal dağılım ya da LaplaceGauss dağılımı ilk olarak 1733 yılında De Moivre tarafından ortaya atılmış, sonra 1809 da Gauss tarafından geliştirmiştir. Uygulamada ele alınan birçok değişken normale benzer bir dağılım gösterir. Örneğin, ölçme hataları, bebeklerin canlı doğum ağrılıkları, diastolik kan basıncı, hemoglobin düzeyi, kadınların yaşam süresi vb... gibi. Aslında, bu tür tesadüfî değişkenlerin dağılımları tam olarak bir normal dağılıma uymasa da yaklaştıkları görülür. Fakat uygulamada, çok sayıda birbirinden bağımsız olarak ortaya çıkan tesadüfî değişkenlerin bir normal dağılım gösterdikleri kabul edilir. İstatistik teorisinde önemli bir yere sahip olan normal dağılım, tek değişkenli, iki değişkenli ve çok değişkenli olmak üzere üç kısım altında incelenir. Bu kitapta sadece tek değişkenli normal dağılım ele alınmaktadır. Aritmetik ortalaması ve standart sapması farklı değerler olan çok sayıda normal dağılım düşünülebilir; herhangi bir normal dağılımın özel denklemini yazabilmek için dağılımın parametreleri olan değerlerini bilmek yeterlidir. 133 X sürekli tesadüfî değişkeni, gerçel sayılar uzayında tanımlanmak üzere, 1 x 1 e 2 f x 2 0 2 , 2 0, , x ,diğer durumlarda ise X normal dağılıma sahiptir denir. Burada; , normal dağılımın ortalaması, , normal dağılımın standart sapması, e=2,71828 ve 3,14159 dır. Uygulamada insanlara, hayvanlara ve bitkilere ait ölçümlerin normal dağıldıkları görülür. Ayrıca normal dağılımı olmayan bir anakütleden tesadüfi olarak seçilen yeterince büyük örneklemlerin ortalamalarının dağılımı da yaklaşık olarak normaldir. Normal dağılımı özellikleri: a. Normal dağılım olasılık yoğunluk fonksiyonunun, yani f(x)’ eğrisi altında kalan ve X ekseni ile sınırlanan alan 1’ e eşittir. b. Normal dağılım ortalamaya göre simetriktir. c. Normal dağılıma sahip bir değişkenin ortalaması, medyanı ve modu bir birbirine eşittir. Şekil 5.1: Normal dağılım- çan eğrisi Şekil 5.2: Normal eğri altına kalan alan 134 Şekil 5.3: Normal eğri altında kalan simetrik alan Eğrinin altında kalan alan, ve değerleri ile orantılı olarak, belirli % değerlerine göre yoğunlaşmalar gösterir. Bu değerleri ve değerlerine göre aşağıdaki gibi verebiliriz. : toplam alanının % 34,13’ünü : toplam alanının % 34,13’ünü : toplam alanının % 68,26’sını 2 : toplam alanının % 95,44’ünü 1.96 : toplam alanının % 95,00’ini 2.58 : toplam alanının % 99,00’unu belirtir. Şekil 5.4: Normal eğri altında kalan alanlar 135 Standart Normal Dağılım Farklı ortalama ve standart sapmalara sahip normal dağılımlar için X tesadüfi değişkenin verilen iki değer arasında olması olasılığını hesaplamak için integral almaya gerek vardır. Her olasılık değerini hesaplamak için integral almak zor olduğundan, normal dağılım özelliğine sahip bütün tesadüfi değişkenlerin yerine standart normal değişkenler geçirilerek bir tablo hazırlanmıştır. Bahsedilen standart dağılım tablosu kitabın sonunda verilmiştir. Normal dağılım ortalama ve varyans olmak üzere iki parametresi bulunmaktadır. Farklı ortalama ve varyanslara göre çok sayıda normal dağılım eğrisi çizilebilir. Değişen ortalama ve varyanslara göre yeni olasılıkların hesabını yapmak oldukça zordur. Bundan dolayı ortalaması ve varyansı değişmeyen standart normal dağılım için olasılıklar önceden hesaplanıp, ortalama ve varyans değerlerine göre farklılaşan normal dağılımların olasılıkları bu standart dağılım aracılığıyla hesaplanabilir. Bunun için Z harfi ile belirtilen standart bir değişken tanımlanır; z X Bu Z değişkeninin dağılımı, ortalaması 0 ve varyansı 1 olan normal dağılımdır ve standart normal dağılım olarak tanımlanır. Normal dağılım olasılık yoğunluk fonksiyonunda 0 ve 1 yazılırsa standart normal dağılım elde edilir. Standart normal dağılım Z N 0,1 olarak gösterilir. Standart normal dağılımın olasılık değerleri tablolar halinde hazırlanmıştır. Tablonun ilk sütun ve ilk satır rakamlarının bileşimi ile Z değişkeninin değeri bulunur. Tablonun gövde kısmındaki değerler olasılık değerleridir. Bu olasılık değerlerine karşılık gelen Z değerini bulmak için; söz konusu olasılık değerinin bulunduğu satırdaki ilk rakam Z değerinin ilk iki basamağını oluşturur ve olasılık değerinin bulunduğu sütunda en tepedeki rakam da Z değerinin üçüncü basamağını oluşturur. Örneğin tablodan 0,3413 olasılık değerine karşılık gelen Z değeri ilk sütunda 1,0 ve dikey olarak ilk satırdan ,00 rakamının birleştirilmesi ile 1,00 olarak bulunur. Örnek 5.18: Standart Z değişkeninin; a. 1,25’ ten küçük değer alma olasılığını hesaplayınız. b. 1,25’ ten büyük değer alma olasılığını hesaplayınız. Çözüm 5.18: Standart Z değişkeninin 1,25’ ten küçük ve büyük değer alma olasılıkları sırasıyla P Z 1, 25 ve P Z 1, 25 olarak gösterilir. a. 1,25’ ten küçük değer alma olasılığı; Z = 1,25 için olasılım değeri 0,3944’ dur. Bu olasılık değeri Z = 0 ile Z = 1,25 arasındaki alan değeridir. Sonuç itibariyle standart normal dağılım eğrisi altında kalan alanlara göre P Z 1, 25 olasılığı; P Z 1, 25 0,5 0,3944 0,8944 olarak bulunur. 136 Şekil 5.5: Normal eğri altında kalan alan: b. P Z 1, 25 1,25’ ten büyük değer alma olasılığını hesaplayınız. P Z 1, 25 0,5 0,3944 0,1056 olarak bulunur. Şekil 5.6: Normal eğri altında kalan alan: P Z 1, 25 Örnek 5.19: Standart normal dağılımı kullanarak aşağıdaki olasılıkları hesaplayınız. a. P(0,18 Z 1,15) b. P(2,00 Z 1,85) Çözüm 5.19: Standart normal dağılımı kullanarak aşağıdaki olasılıkları hesaplayınız. a. P(0,18 Z 1,15) olasılığını hesaplanırken sırasıyla Z = 0 ile Z = 0,18 değerleri ve Z = 0 ile Z = 1,15 değerleri arasında kalan alan değerleri standart normal dağılım tablosu kullanılarak elde edilir. Z = 0 ile Z = 0,18 arasında olasılık değeri 0,0714 Z = 0 ile Z = 1,15 arasında olasılık değeri 0,3749 dur. O halde; P(0,18 Z 1,15) P(0 Z 1,15) P(0 Z 0,18) 0,3035 0,3749 0,0714 137 P(0,18 Z 1,15) Şekil 5.7: Normal eğri altında kalan alan: b. P(2,00 Z 1,85) için a şıkkında olduğu gibi ilgili olasılık değerleri öncelikle standart normal dağılım tablosu kullanılarak elde edilir. Standart normal dağılım tablosunda Z’ nin negatif değerleri yer almamaktadır. Böyle durumda standart normal dağılımın simetrik olma özelliğinden yararlanılır. Yani Z = 0 ile Z = 2 arasında kalan alan Z = -2 ile Z = 0 arasında kalan alana eşittir. Z = -2 ile Z = 0 arasında olasılık değeri 0,4772 Z = 0 ile Z = 1.85 arasında olasılık değeri 0,4678 dur. O halde; P(2,00 Z 1,85) P(2,00 Z 0) P(0 Z 0,185) 0,9450 bulunur. 0,4772 0,4678 Şekil 5.8: Normal eğri altında kalan alan: P(2,00 Z 1,85) Normal dağılımlarda olasılık hesabı yapılacağı zaman öncelikle standartlaştırılmış değişken elde edilir. Standartlaştırma işleminden sonra standart normal dağılım tablosu kullanılarak istenilen olasılıklar bulunur. Örnek 5.20: İlaçla tedavi edilen hastaların iyileşme süresi ortalaması 30 gün ve varyansı 36 olan bir normal dağılım göstermektedir. Buna göre bir hastanın; a. 25 günden daha fazla sürede iyileşme olasılığı nedir? b. 36 günden daha az sürede iyileşme olasılığı nedir? Çözüm 5.20: İlgili olasılıkları hesaplamak için iyileşme süresi olarak tanımlanan X tesadüfi değişkeninin aldığı değerlere karşılık gelen z değerlerinin hesaplanması gerekmektedir. 138 z X a. burada 30 , 2 36 ve 6 dır. 25 günden daha fazla sürede iyileşme olasılığı P X 25 için öncelikle x = 25 güne karşılık gelen z değeri hesaplanır; z X 25 30 5 0.83 tur. 6 6 Z = -0,83 ile Z = 0 arasında olasılık değeri 0,2967 P Z 0,83 0,5 0, 2967 0, 7967 Bir hastanın 25 günden daha fazla sürede iyileşme olasılığı % 79,67’ dir. Şekil 5.9: Standart normal eğri altında kalan alan: b. P Z 0,83 36 günden daha az sürede iyileşme olasılığı P X 36 için öncelikle x = 36 güne karşılık gelen z değeri hesaplanır; z X 36 30 6 1, 00 6 6 Z = 0 ile Z =1,00 arasında olasılık değeri 0,3413 P Z 1,00 0,5 0,3413 0,8413 Bir hastanın 36 günden daha az sürede iyileşme olasılığı % 84,13’ tür. Şekil 5.10: Standart normal eğri altında kalan alan: 139 P Z 1.00 Örnek 5.21: Şeker hastalarında küçük tansiyon ortalaması 90 mm HG varyansıda 45 mm HG olmak üzere normal dağılım göstermektedir. Buna göre seçilen bir şeker hastanın 85 mm HG ile 95 mm HG arasında olma olasılığını bulunuz. Çözüm 5.21: İlgili olasılığı hesaplamak için X tesadüfi değişkeninin aldığı değerlere karşılık gelen z değerlerinin hesaplayalım; z1 x1 x 95 90 85 90 0,56 ve z2 2 0,56 9 9 P 85 X 90 P 0,56 Z 0,56 olasılığını elde edilir. Z = -0,56 ile Z = 0 arasında olasılık değeri 0,2123 Z = 0 ile Z = 0,56 arasında olasılık değeri 0,2123 tur. P 0,56 Z 0,56 P 0,56 Z 0 P 0 Z 0,56 P 0,56 Z 0,56 0, 2123 0, 2123 0, 4246 Buna göre seçilen bir şeker hastanın 85 mm HG ile 95 mm HG arasında olma olasılığı % 42,46’ tır. Z=0,56 0,4246 Şekil 5.11: Standart normal eğri altında kalan alan: P 0,56 Z 0,56 Standart normal Z değişkeni için aşağıdaki olasılıkları bulunuz. a. P Z 2, 2 b. P Z 2, 6 c. P Z 1, 75 d. P 1, 45 Z 1, 76 e. P 0,97 Z 2, 21 Bir bölgedeki bebeklerin canlı doğum ağırlıkları 2,85 kg ve satandart sapması da 0,25 kg dır. Ayrıca canlı doğum ağrılıklarının normal dağılım gösterdiği bilinmektedir. Yeni doğmuş bir bebeğin ağırlığının 2,80 kg ile 3,15 kg arasında olma olasılığını bulunuz. 140 Özet tam olarak bir normal dağılıma uymasa da yaklaştıkları görülür. Fakat uygulamada, çok sayıda birbirinden bağımsız olarak ortaya çıkan tesadüfî değişkenlerin bir normal dağılım gösterdikleri kabul edilir. İstatistik teorisinde önemli bir yere sahip olan normal dağılım, tek değişkenli, iki değişkenli ve çok değişkenli olmak üzere üç kısım altında incelenir. Bu kitapta sadece tek değişkenli normal dağılım ele alınmaktadır. Aritmetik ortalaması ve standart sapması farklı değerler olan çok sayıda normal dağılım düşünülebilir; herhangi bir normal dağılımın özel denklemini yazabilmek için dağılımın değerlerini bilmek yeterlidir. İstatistik biliminin temelini oluşturan olasılık, belirsizlik durumunda karar almayı sağlar. Tesadüfiliği (rassallık) içeren olasılık, herhangi bir olayın meydana gelme şansıyla ilgilenir. Genel olarak olasılık, meydana gelmesi arzu edilen olay sayısının, olayın nihai tüm sonuçlarının sayısına olan oranı olarak tanımlanır. Belirsizliğin bir ölçüsü olarak tanımlanan olasılık, aslında bize tesadüfi deneyin çok defa tekrarlanması durumunda bu sonuçlarla hangi şansla karşılaşabileceğimizi tümdengelim yöntemiyle anlatır. Olasılık kavramını açıklayabilmek için üç temel kavramın tanımlanmasına ihtiyaç vardır. Bunlar tesadüfi deney, örneklem uzayı ve olaydır. Farklı ortalama ve standart sapmalara sahip normal dağılımlar için X tesadüfi değişkenin verilen iki değer arasında olması olasılığını hesaplamak için integral almaya gerek vardır. Her olasılık değerini hesaplamak için integral almak zor olduğundan, normal dağılım özelliğine sahip bütün tesadüfi değişkenlerin yerine standart normal değişkenler geçirilerek bir tablo hazırlanmıştır. Bahsedilen standart normal dağılım tablosu kitabın sonunda verilmiştir. İki bağımlı olaydan birincisinin gerçekleştiği bilindiğinde ikincisinin ona bağlı olarak gerçekleşme olasılığına koşullu olasılık denir. Bir olayın gerçekleşme şansı başka bir olayın gerçekleşmesine bağlı olduğunda koşullu olasılık kullanılmaktadır. A ve B olayları herhangi iki olay olsun. A olayının gerçekleştiği bilindiğinde, B olayının ortaya çıkma olasılığı koşullu olasılık olarak tanımlanır ve P B A ile gösterilir. Tesadüfi değişken, S örnek uzayındaki her bir tesadüfi olaya sayısal değerler atayan bir fonksiyondur. Bu fonksiyon aracılığıyla örnek uzayındaki her bir sonuç reel eksende bir değere taşınır. Kısaca tesadüfi değişken, S örneklem uzayının her bir olayını yalnız bir gerçek değere dönüştürür. Normal dağılım ortalama ve varyans olmak üzere iki parametresi bulunmaktadır. Farklı ortalama ve varyanslara göre çok sayıda normal dağılım eğrisi çizilebilir. Değişen ortalama ve varyanslara göre yeni olasılıkların hesabını yapmak oldukça zordur. Bundan dolayı ortalaması ve varyansı değişmeyen standart normal dağılım için olasılıklar önceden hesaplanıp, ortalama ve varyans değerlerine göre farklılaşan normal dağılımların olasılıkları bu standart dağılım aracılığıyla hesaplanabilir. Bunun için Z harfi ile belirtilen standart bir değişken tanımlanır; Yapılan her tesadüfi deneyde ortaya çıkan sonuçlar için yeni bir fonksiyon aramak hem emek hem de zaman kaybına yol açacağından çeşitli tesadüfi deneylerin aynı koşullar altında aynı özellikler göstermelerinden yararlanılarak kuramsal olasılık dağılımları geliştirilmiştir. Bu kuramsal olasılık dağılımları benzer özellikteki diğer deneylerde de kullanmak amacıyla genelleştirilmiştir. Çok sayıda kuramsal olasılık dağılımdan söz etmek olanaklı ise de bu ünitede kesikli olasılık dağılımlarından Binom dağılımı ve Poisson dağılımı, sürekli olasılık dağılımlarından ise Normal dağılım ele alınacaktır. Uygulamada ele alınan birçok değişken normale benzer bir dağılım gösterir. Örneğin, ölçme hataları, bebeklerin canlı doğum ağrılıkları, diastolik kan basıncı, hemoglobin düzeyi, kadınların yaşam süresi vb... gibi. Aslında, bu tür tesadüfî değişkenlerin dağılımları z x Bu Z değişkeninin dağılımı, ortalaması 0 ve varyansı 1 olan normal dağılımdır ve standart normal dağılım olarak tanımlanır. 141 Kendimizi Sınayalım b. Olay 5. İki tavla zarının birlikte atıldığını varsayalım. A olayı üst yüze gelen sayıların toplamının 8 olması ve B olayı üst yüze gelen sayıların aynı olması olayları olarak tanımlansın. Bu iki olayın birleşiminin olasılığını bulunuz. c. Deney a. 0,28 d. Değişken b. 0,14 e. Ortalama c. 0,17 2. Bir çocuk hastalıkları polikliniğine tedavi için gelen 4 hasta kaç farklı şekilde sıralanabilir? d. 0,46 1. Örneklem uzayındaki temel sonuçların bir alt kümesine ……………. denir. a. Örneklem e. 0,24 a. 24 6. A ve B olayları için olasılıklar b. 36 P A 2 , 3 d. 64 3 3 ve P A B olarak veriliyor. 5 4 P A B olasılığını bulunuz. e. 112 a. 0,67 3. S a, b, c, d , e, f , g , A a, c, e, g , B c, d , e b. 0,75 P B c. 48 c.0,82 olsun. A B alt kümesini oluşturunuz. d. 0,18 a. A B a, b, c, d , e, f , g e. 0,94 b. A B a c. A B g 7. Bir toplumun 0,20’si X hastalığı taşıyıcısıdır. Bu toplumdan tesadüfi olarak seçilen 10 kişiden yarısının bu hastalığın taşıyıcısı olma olasılığını bulunuz. d. A B a, g a. 0,015 e. A B b, c, d , e, f b. 0,026 c. 0,032 4. İki olayın kümelerinin ortak elemanı yok ve kesişimleri boş küme ise bu tür olaylara nedir? d. 0,044 a. Tesadüfi olay e.0,075 b. Bağımsız olay d. Örneklem uzayı 8. Bir kırsal yerleşim alanında yılda kuduz vakası oranı 0,00003’ tür. Belli bir zaman diliminde 200000 vakadan hiçbirinde kuduz vakası ile karşılaşmama olasılığı nedir? e. Bağımlı olay a. 0,0025 c. Ayrık olay b. 0,02 c. 0,44 d. 0,001 e. 0,00003 142 9. Z, standart normal dağılıma sahip bir değişken olduğuna göre, P 0,50 Z 2 olasılığı kaçtır? Kendimizi Sınayalım Yanıt Anahtarı a. 0,4772 1. b Yanıtınız yanlış ise “Olasılığa Giriş” başlıklı konuyu yeniden gözden geçiriniz. b. 0,6687 2. a Yanıtınız yanlış ise “Permütasyon” başlıklı konuyu yeniden gözden geçiriniz. c. 0,2857 d. 0,1915 3. d Yanıtınız yanlış ise “Olasılık Hesaplama” başlıklı konuyu yeniden gözden geçiriniz. e. 0,500 10. Z, standart normal dağılıma sahip bir değişken olduğuna göre, P 0,50 Z 1,65 4. c Yanıtınız yanlış ise “Olasılık Hesaplama” başlıklı konuyu yeniden gözden geçiriniz. olasılığı kaçtır? 5. a Yanıtınız yanlış ise “Olasılık Hesaplama” başlıklı konuyu yeniden gözden geçiriniz. a. 0,4505 6. c Yanıtınız yanlış ise “Olasılık Hesaplama” başlıklı konuyu yeniden gözden geçiriniz. b. 0,1915 c. 0,700 7. b Yanıtınız yanlış ise “Binom Dağılımı” başlıklı konuyu yeniden gözden geçiriniz. d. 0,8200 8. a Yanıtınız yanlış ise “Poisson Dağlımı” başlıklı konuyu yeniden gözden geçiriniz. e. 0,6412 9. c Yanıtınız yanlış ise “Normal Dağılım” başlıklı konuyu yeniden gözden geçiriniz. 10. e Yanıtınız yanlış ise “Normal Dağılım” başlıklı konuyu yeniden gözden geçiriniz. 143 Sıra Sizde Yanıt Anahtarı Sıra Sizde 7 Sıra Sizde 1 n P n n! 6! 6.5.4.3.2.1 720 a. P Z 2, 2 0,9861 b. P Z 2,6 0,0047 n 6 n! 6! 6.5.4.3! C C 20 3!3! r r ! n r ! 3 3! 6 3! c. P Z 1, 75 0, 0401 Sıra Sizde 2 d. P 1, 45 Z 1,76 0,8873 e. P 0,97 Z 2, 21 0,8204 1.45 personel içinden seçilen bir kişinin erkek 30 0, 667 olma olasılığı; P E 45 Sıra Sizde 8 2. P A B P A P B P A B z1 eşitliğiyle hesaplanır; P A B 2 2 1 0, 73 5 3 3 z2 P A B P A P B 0,80 0,60 0, 48 Sıra Sizde 4 olasılığın hesaplanması için Binom dağılımı kullanılır; n 5 P( x) p x q n x = 0, 251 (0, 75) 4 0,396 x 1 Sıra Sizde 5 P( x) e x e4 48 P( x 8) 0, 0298 x! 8! Sıra Sizde 6 İlgili olasılığın hesaplanması için Poisson dağılımı kullanılır; n 2000 , olayın 1 p 0, 001 dir. 1000 görülme olasılığı O zaman Poisson dağılımının np 2000 0,001 2 dir. parametresi P( x) 2,80 2,85 0, 20 ve 0, 25 x2 3,15 2,85 1, 20 0, 25 P 0, 20 Z 1, 20 0, 4642 Sıra Sizde 3 İlgili x1 e x e2 20 P( x 0) 0,135 x! 0! 144 Yararlanılan Kaynaklar Anadolu Üniversitesi Açık Öğretim Fakültesi, İstatistik, Editör: Prof. Dr. Ali Fuat Yüzer, AÖF Yayın No: 771, Anadolu Üniversitesi, Eskişehir. Çömlekçi, N. (1997). Temel İstatistik İlke ve Teknikleri, Bilim Teknik Yayınevi, Eskişehir. F. Er, K.Ö, Peker, Editör: H. Sönmez (2009). Biyoistatistik, Ünite 4, Eskişehir Anadolu Üniversitesi. Esin, A.A., Ekni, M., ve Gamgam, H. (2006). İstatistik, Gazi Kitapevi, Ankara. Gürsakal, N. (2007). Çıkarımsal İstatistik, Bursa: Dora Basım Yayın Dağıtım. Lwanga, S.K. and Tye, C.Y. (1986) Teaching Health Statistics. Geneva: World Health Organization. Serper, Ö (2004). Uygulamalı İstatistik 1 ve 2 Bursa: Ezgi Kitabevi. 145 6 Amaçlarımız Bu üniteyi tamamladıktan sonra; Tam sayım ve örnekleme kavramlarını ayırt edebilecek, Örneklemeye başvurmanın yararlarını açıklayabilecek, Örnekleme planı hazırlayabilecek, Bir örnek araştırma için örnekleme uygulaması yapabilecek ve istenen bilgileri üretebilecek bilgi ve becerilere sahip olabilirsiniz. Anahtar Kavramlar Tam sayım Örnekleme Çerçeve Örneklem Parametre İstatistik Değişken İçindekiler Giriş Tam Sayım ve Örnekleme Örnekleme Yapmayı Gerekli Kılan Nedenler Örnekleme Sürecinin Aşamaları Örnekleme Yöntemleri Bazı Örnekleme Dağılımları 146 Örnekleme ve Bazı Örnekleme Dağılımları GİRİŞ İstatistiğin önemli bir konusu olan örnekleme, bilimsel araştırma sürecinin en önemli aşamasıdır ve bu konu sürecin diğer aşamalarıyla önemli bir ilişkiye sahiptir. Örnekleme, ana kütlenin birim sayısı bakımından daha az fakat araştırmaya konu olan özellikleri bakımından ana kütlenin temsili bir modeli olan örneklemin oluşturulması ve örneklemden yararlanarak ana kütle parametrelerine ait tahminde bulunma faaliyetidir. Bütün bilim dallarında olduğu gibi sağlık bilimlerinde de yapılacak bilimsel araştırmalarda genellikle tam sayım değil örneklemeye başvurulmaktadır. TAM SAYIM VE ÖRNEKLEME Anahtar kelimeler başlığı altında verilen kavramlar örnekleme konusunu açıklayabilmek için de bilinmesi gereken kavramlardır. Bu kavramlar birinci ünitede açıklandığı için bu üniteye sadece tam sayım ve örnekleme kavramlarıyla ilgili hatırlatıcı bilgiler verilerek başlanmıştır. Bu ünitedeki konuları kolayca anlayabilmeniz için birinci ünitede açıklanan temel kavramları tekrar okuyunuz. Bilindiği gibi istatistiksel araştırmaların amacı tanımlanan ve hakkında araştırma yapılacak birimler topluluğu olan ana kütlenin özellikleriyle ilgili bilgiler üretmektir. Bu bilgiler ya tam sayım sonucu elde edilen veri kümesinin (ana kütle veri kümesinin) çözümlenmesiyle ya da örneklemden elde edilen veri kümesinin (örneklem veri kümesinin) çözümlenmesiyle üretilebilir. Tam Sayım Planlanan bir istatistiksel araştırma için tanımlanan sonlu ana kütlenin bütün birimleri üzerinden araştırmaya konu olan değişkenler itibariyle veri derleniyorsa yapılan işleme tam sayım denir. Tam sayım sonucu elde edilen veri kümesinin çözümlenmesiyle elde edilen bilgiler (parametre değerleri) veri derleme ve çözümleme hatası işlenmemiş ise kesin ve doğru bilgilerdir. Tam sayım sonucu elde edilen veriler kullanılarak hesaplanan sayısal değerlere parametre denir. Tam sayım genellikle sonlu ve küçük hacimli ana kütlelere uygulanır. Bununla birlikte büyük hacimli sonlu ana kütlelerin bütün birimlerine ulaşabilmek olanaklıysa, karşılaşılan özel problemin çözümü için mümkün bütün verilerin elde edilmesine gereksinim varsa tam sayım yapılmalıdır. 147 Örnek 6.1: Bir tıp fakültesi hastanesinde çalışan 100 uzman hekimin uygulamaya geçen tam gün çalışma yasasına ilişkin görüşlerinin belirlenmesini konu alan bir araştırma planlanıyor. Tamsayım yapılabilir mi? Çözüm 6.1: Tam gün yasası ile ilgili görüşlerin alınacak hekim sayısı N=100 dür, küçük hacimli sonlu bir ana kütledir. 100 hekimden tam gün yasası ile ilgili görüşlerinin alınması mümkün ve üretilmesi istenen bilgi için zaman yeterli ise tam sayım yapılabilir. Ancak tanımlanan ana kütlenin bütün birimleri üzerinden veri derlemek veya tam sayım yapmak her zaman izleyen kısımda açıklanacak çeşitli nedenlerle mümkün olamaz, parametre değerleri hesaplanamaz. Böyle bir durumda ana kütlenin özellikleriyle ilgili bilgiler ve genellemeler örnekleme uygulamasıyla elde edilebilir. Örnekleme Tanımlanan ana kütleden onu ilgilenilen değişkenler bakımından temsil eden sınırlı sayıda birimin belirli yöntemler kullanılarak seçilmesi ile ana kütle için tahmine dahalı bilgi edinme işlemine örnekleme, seçilen birimlerin oluşturduğu topluluğa örneklem denir. Örnek 6.2: Bir anaokulu işletmecisinin 5 ayrı bölgedeki okullarında 1000 öğrencisi bulunmaktadır. Bu işletmeci öğrencilerine uyguladığı beslenme programıyla ilgili öğrenci ailelerinin görüşlerini almak amacıyla bir araştırma planlıyor. Araştırmanın Amacı: Uygulanan beslenme programıyla ilgili ailelerin görüşlerinin alınması. Araştırmanın Ana kütlesi: 5 bölgedeki okullarda okuyan öğrencilerin ailelerinin oluşturduğu topluluktur. Örnekleme: Her bölgedeki okuldan 20şer olmak üzere toplam n=100 aile seçiliyor. Ailelerin seçim işlemine örnekleme; seçilen 100 ailenin oluşturduğu topluluğa örneklem adı verilir. Değişken: Öğrencilerin annelerinin beslenme programıyla ilgili görüşleri ise değişkendir. Örnekleme Birimi, Gözlem Birimi: Seçilen ailelerin oluşturduğu topluluk örneklem, aileler örnekleme birimi ve öğrencilerin anneleri ise gözlem birimidir. Ana kütleyi temsil eden, onun bir modeli olan örneklemden elde edilen veri kümesi kullanılarak yapılacak çözümlemenin sonucu olan bilgi (örneklem istatistiği) ana kütle bilgisi anlamında kullanılabilir. Başka bir deyişle örneklem istatistiği değeri bilinmeyen ana kütle parametre değeri hakkında genelleme yapmak amacıyla kullanılabilir. Örneklemede önemli olan, ana kütle doğru tanımlanmış ise örneklemin araştırmaya konu olan değişkenler itibariyle ana kütleyi temsil edip etmemesi konusudur. Temsili bir örneklem, ana kütlenin sadece birim sayısı bakımından küçük, özellikleri bakımından benzeri ve modeli olan örneklemdir. Eğer ilgilenilen değişkenler bakımından ana kütledeki ve örneklemdeki birimler benzer dağılım gösteriyorsa oluşturulan örneklem temsili bir örneklemdir. Örnek 6.3: Bir ilde yaşayan ve 2010-2011 yıllarında prostat kanseri teşhisi sonucu ameliyat olan yaşları 45-70 grubundaki 500 kişinin yaşam kalitesi araştırılmak isteniyor. Bu kişilerin %40’ının 45-55 yaş grubunda olduğu biliniyor. Diyelim ki n=50 hastadan oluşan bir örneklem seçilmiş ve bu hastaların %40’ının (20 Kişinin) 45-55 yaş grubunda yer aldığı belirlenmiş ise bu örneklem yaş grubu değişkeni bakımından temsili örneklemdir. 148 Bir hastaneye başvuran kişilerin rahatsızlık türlerinin günlük dağılımını belirlemek amacıyla bir araştırma yapılması isteniyor. Tam sayım yapılabilir mi, tartışınız. Örneklem istatistiğinin değeri her zaman parametre değeri için bilgi niteliği taşır mı, tartışınız. Örneklemenin temel amacı nedir, açıklayınız. Bu ünitenin izleyen kısımlarındaki konular için A. F. Yüzer, E. Şıklar, E. Ağaoğlu, H. Tatlıdil, A. Özmen, Editör: A. F. Yüzer (2011). İstatistik, Ünite 7 ve 8, Eskişehir Anadolu Üniversitesi Yayını İsimli kitaptan, editör ve ünite yazarlarının izni alınarak yararlanılmıştır. ÖRNEKLEME YAPMAYI GEREKLİ KILAN NEDENLER Ana kütlenin sonsuz olması durumu Tanımlanan ana kütlenin sonsuz ana kütle olması durumunda tam sayım mümkün olmaz. Çünkü incelenecek birimler X tesadüfi değişkeninin teorik olasılık dağılımının türettiği sonuçlardır. Dolayısıyla incelencek birim sayısında ve gözlem değeri sayısında bir sınır yoktur. Bu nedenle örnekleme uygulamasına başvurmak kaçınılmazdır. Örnek 6.4: Bir sağlık ocağından poliklinik hizmeti alan kişilerin memnuniyeti araştırılmak isteniyor. Tamsayım yapılıp yapılamayacağını açıklayınız. Çözüm 6.4: Sağlık ocağında verilen poliklinik hizmeti bir süreçtir. Bu hizmet geçmişte verilmiştir, bugün verilmektedir ve verilmeye de devam edecektir. Bu nedenle geçmişte poliklinik hizmeti alan, bugün almakta olanlar ve gelecekte alacak olan hastalar ana kütleyi oluşturur. Poliklinik hizmeti devam ettikçe bu hizmetten yararlananlar ana kütlesine yenileri ilave olacağı için ana kütle sonsuz ana kütledir. Söz konusu araştırma için tamsayım yapılamaz, örnekleme uygulaması zorunludur. Neter J., Wasserman W., Whitmore G. A. (1993). Applied Statistics 4. Edition, Allyn and Bacon Ana kütlenin sonlu olması durumu Daha önce de açıklanmış olduğu gibi tanımlanan ana kütle sonlu ana kütle olduğunda ana kütle ile ilgili bilgiler hem tam sayım uygulayarak hem de örneklemeye başvurularak elde edilebilir. Bu durumda tam sayım mı?, örnekleme mi? uygulanacağına karar verebilmek için aşağıdaki kriterler değerlendirilir. Maliyet: Örnekleme bütçesi, örneklemeyi tam sayıma tercih etmede en önemli belirleyicidir. Örnekleme tam sayıma göre daha az maliyetle bilgi üretme imkanı sağlar. Öte yandan eğer ana kütle hacmi küçükse veya tam sayım yapmak bütçe olanaklarıyla da mümkünse tam sayım tercih edilmelidir. Burada dikkat edilmesi gereken nokta tam sayım yapma maliyetinin, elde edilecek bilginin değerinden küçük olması gerekir. Aksi durumda örneklemeye başvurmak uygun olacaktır. Zaman: Bir araştırma sonunda ulaşılacak bilgiye duyulan ihtiyacın zaman sınırları, araştırmanın tam sayımla mı yoksa örneklemeyle mi yapılacağına karar verirken değerlendirilecek diğer önemli bir etkendir. Örnekleme, tam sayıma göre daha kısa zamanda ve yeterli ayrıntıda bilgi elde etme olanağı verir. Örneklemenin bu özelliği ve üstünlüğü bilgiye çok hızlı gereksinim olduğu durumlarda bilhassa önemlidir. 149 Hem bir tam sayımdan hem de bir örneklemden elde edilecek bilgi için gerekli olan zaman bir alternatif maliyet üstlenmeyi de gerektirir. Çünkü bilgi elde etme süresine bağlı olarak verilecek kararın erken ya da geç oluşu kazanç kadar kayıplara da neden olabilir. Doğru veri elde etme: Her ne kadar tam sayım yapılınca kesin, doğru bilgiye ulaşılır denilse de tam sayımın yapılabilmesi için gerekli olan sayıda ve istenen özelliklere sahip, veri derleme hatası yapmayacak gözlemci ya da görüşmeci bulmak ya da yetiştirmek oldukça zor hatta olanaksızdır İncelenecek birimlerin fiziksel zarara uğraması: Tanımlanan ana kütlede yer alan birimlerin, gözlemi ya da ölçümü yapılırken fiziksel zarara uğratılıyorsa örneklemeye başvurmak zorunludur. Örneğin bir enjektör iğnesi üreten bir sanayi kuruluşunda belirlenen bir gün içinde üretilen enjektör iğnelerinin içerisindeki hatalı iğne oranının belirlenmesi için yapılacak bir araştırmada tam sayım benimsenirse gerekli verilerin derlenmesi amacıyla üretilen tüm iğnelerin hatasız olup olmadığının teste tabi tutulması gerekir ki bu da anlamsızdır. Bu gibi durumlarda örneklemeden yararlanmak kaçınılmaz olur. Ana kütleyi oluşturan birimlerin değişkenliği: Ana kütleyi oluşturan birimler araştırmaya konu olan değişkenler bakımından heterojen olduğunda mümkün ise tam sayım yapmak, değil ise büyük hacimli örneklem seçmek gerekir. Ana kütle hacmi küçük, parasal imkanların yeterli olduğu bir araştırma için tam sayım mı yoksa örnekleme mi tercih edersiniz, açıklayınız. 1,5 milyon öğrencinin olduğu Açıköğretim Sisteminin değerlendirileceği bir araştırma için gerekli olan zaman ve parasal imkanlar yeterli ise tam sayım mı yoksa örnekleme mi uygularsınız, tartışınız. ÖRNEKLEM İÇİN BİRİM SEÇME YÖNTEMLERİ Örnekleme girecek birimlerin seçiminde kullanılan yöntemler keyfi seçim yöntemi ve tesadüfi seçim yöntemi şeklinde sınıflandırılmaktadır. Keyfi Seçim Örneklem oluşturulurken tanımlanan tanımlanan ana kütleyi oluşturan birimler arasında fark gözetilir, yani bütün birimlere bilinen bir olasılıkla seçilme şansı verilmez ise bu türden birim seçimine keyfi seçim adı verilir. Bu seçim yönteminde araştırmacı, hangi birimlerin örnekeleme seçileceğini bilerek ve isteyerek belirler. Tesadüfi Seçim Sonlu Ana kütlelerde Tesadüfi Örneklem Seçimi Sonlu ana kütlelerde tesadüfi birim seçim imkânı veren iki seçim uygulaması bulunmaktadır. Bunlar kura seçimi ve sistematik seçimdir. Serper Ö. (2004). Uygulamalı İstatistik 2, Genişletilmiş 5. Baskı, Bursa: Ezgi Kitabevi Kura Seçimi Tesadüfi birim seçimi için kura usulü uygulanacak ise aşağıdaki adımlar izlenir: Tanımlanan anakütle ile ilgili oluşturulacak güncel çerçevedeki bütün birimlere birden N e kadar numara verilir. Bu numaralar fişlere yazılır ve bir torbaya veya bir kaba atılır. 150 Fişler iyice karıştırıldıktan sonra n tane fişin çekilmesi işlemine başlanır. Çekilen fiş her çekilişten sonra torbaya iade edilir veya edilmez. Çekilen fiş torbaya iade ediliyorsa birim seçimine iadeli seçim, iade edilmiyorsa iadesiz seçim adı verilir. Seçilen n sayıdaki birim örneklemi oluşturur. Bu birim seçim uygulamasıyla ana kütleyi oluşturan çerçevede yer alan birimler arasında örneklemde yer almaları bakımından ayrıcalık yapılmamış ve eşit seçilme olasılığı tanınmış olur. Birim seçimi iadeli yapıldığında aynı birim tekrar tekrar örnekleme seçilmiş olabilir. Bu durumda örnekleme kuramının önemli koşullarından biri olan bağımsızlık koşulu sağlanmış olur ve herhangi bir birimin seçilmesi bir başka birimin seçilmesi olasılığını etkilememiş olur. Gerçekte uygulanan örnekleme planlarında iadeli seçim genellikle uygulanmaz. Birim seçimi iadesiz yapıldığında, seçilen bir birimin tekrar seçilmesi engellenmiş olur. Ancak, ana kütle hacmi N çok büyük, örneklem hacmi n küçük olduğunda her birimin seçiminin diğerinden bağımsız olduğu ve iadeli seçimdeki bağımsızlık koşulunun sağlanabilecek olduğu varsayılır. Belirlenen sonlu ana kütlede yer alması gereken birim oluşturulacak çerçevede yer almıyorsa veya birden fazla yer alıyorsa kura seçiminin tesadüfîliği etkilenir. N hacimli sonlu bir ana kütlede tesadüfi iadeli seçimle Nn tane farklı örneklem seçmek mümkün iken, aynı ana kütlede iadesiz seçim uygulandığında aynı hacimli C N n N! tane farklı örneklem seçmek mümkün olur. n !( N n)! Sistematik Seçim Eğer tesadüfi seçim için sistematik seçim uygun görülürse aşağıdaki aşamalar izlenir: Güncel çerçevedeki birimler birden N ye kadar numaralandırılır. Örneklem hacmi belirlenir. k = N / n oranı hesaplanır. Bu oran “büyütme faktörü” olarak isimlendirilir. 1, 2, ….. , k adet sayı arasından tesadüfi olarak bir sayı çekilir. Çekilen sayı a ile gösterilsin. a, örnekleme girecek birinci birimin sıra numarasını gösterir. a’ıncı, a + k’ıncı, ….. , a + (n – 1)k’ıncı sıra nolu birimlerin seçilmesiyle n hacimli örneklem oluşturulur. Hem kura usulü seçimde hem de sistematik seçimde seçilecek bir birimin belirlenen n hacimli örneklemde yer alması olasılıkları aynı (n / N) olmasına rağmen olası örneklemlerden birinin incelenen N örneklem olma olasılıkları farklıdır. Bu olasılıklar kura usulü (iadesiz) seçimde 1/ Cn olduğu halde, sistematik seçimde örneklemi oluşturabilme şansına sahip kombinasyonların her biri için eşit 1 / k , diğerlerininkinde ise 0 (sıfır) dır. Olasılıklı örneklemenin üç önemli üstünlüğü vardır: Örneklemden elde edilen verilerden hesaplanan istatistikler ana kütle parametreleri hakkında genelleme yapmak üzere kullanılabilir. Örneklem hatasının büyüklüğü hakkında bilgi elde edilebilir. Keyfi seçimde söz konusu olabilecek yanlılık (sistematik hata) giderilmiş olur. Olasılıklı örneklem oluşturma prensibi esas olmak üzere, uygulamada ya birim seçim işlemini kolaylaştırmak ya da ana kütleyi temsil edecek daha iyi bir örneklemin oluşturulmasını sağlamak üzere çeşitli tesadüfi örnekleme yöntemleri geliştirilmiştir. Bu yöntemler izleyen başlıklar altında açıklanmıştır. 151 Bu örnekleme yöntemlerinden herhangi birini bir örnekleme uygulaması için seçerken yöntemlerin etkinlik ve doğruluk kriterlerine göre değerlendirilmesi gerekir. Örnekleme yöntemlerinin etkinlikleri farklılık gösterir. Etkinlik, örnekleme maliyeti ve doğruluğu arasındaki dengeyi yansıtan bir kavramdır. Doğruluk ise ölçülecek özelliğin belirsizliği ile ilgili düzeyi gösterir. Doğruluk ile örnekleme hataları arasında ters ilişki varken maliyetle aynı yönde ilişki vardır. Yani daha çok maliyet daha doğru bilgi, daha doğru bilgi daha az hatalı karar, tahmin demektir. ÖRNEKLEME SÜRECİNİN AŞAMALARI Genel olarak örnekleme süreci 5 aşamadan oluşmaktadır. Birbirleriyle ve bir araştırma sürecinin diğer aşamalarıyla sıkı sıkıya ilişki içinde olan bu aşamalar Şekil 6.1 de gösterilmiştir. Şekil 6.1: Örnekleme sürecinin aşamaları. Kaynak: N. K. Malhotra, Marketing Research An Applied Orientation, Prentice Hall International Inc. , 1996 Ana kütlenin Tanımlanması Bir araştırma sürecinde araştırmacının ilk yapacağı işlerden biri olan örnekleme süreci ana kütlenin tanımlanmasıyla başlar. Ana kütle, araştırmacı tarafından belirlenen bir tanıma uyan ve hakkında bilgilerin üretileceği, çıkarımların yapılacağı birimlerden oluşan topluluktur. Ana kütlenin ayrıntılı bir biçimde tanımlanmasıyla, hangi birimlerin araştırma kapsamına alınacağı, hangilerinin alınmayacağı belirlenmiş olur. Bu, başka bir ifadeyle örneklemde yer alabilecek ve yer alamayacak birimlerin belirlenmesi anlamına gelir. Ana kütlenin tanımlanması genel olarak örnekleme birimi, gözlem birimi, yer ve zaman kavramlarıyla yapılmaktadır. Araştırmanın konusunu tanımlayan değişkenlerle ilgili verilerin derlendiği birimlere gözlem birimi adı verilir. Örnekleme birimi ise örnekleme seçilecek birimlerdir. Örnek 6.5: Araştırmanın konusu: Bir il merkezindeki kamuya ait ilköğretim okullarında öğrenim gören öğrencilere uygulanan sağlık taraması sonucu ağız ve diş sağlığı sorunu tespit edilmiş 1200 öğrencinin ailelerinin ağız ve diş sağlığı konusundaki bilgilerinin araştırılması. Ana kütle: Yapılan tarama sonucu ağız ve diş sağlığı sorunu olan 1200 öğrencinin ailelerinin oluşturduğu topluluktur. Sonlu bir ana kütledir. Ana kütle hacmi N=1200 ailedir. Örnekleme Birimi: Ağız ve diş sağlığı sorunu tespit edilen her bir öğrencinin ailesi. Gözlem Birimi: Ailede çocuğun ağız ve diş sağlığı konularında eğitimini verecek olan anne ve/veya baba. Yer: Belirlenen il ve kamu ilköğretim okulları. Zaman: Araştırmanın yapıldığı tarih. 152 Örnekten anlaşılabileceği gibi önce örnekleme aile seçilecek sonra ailedeki ağız ve diş sağlığı konusunda bilgisi ölçülecek anne ve/veya babadan veri derlenecektir. Bu örnekte olduğu gibi her araştırmada gözlem birimi ve örnekleme birimi ayrımı olmayabilir. Örnekleme seçilen ve veri derlenen birim aynı olabilir. Bu durumda sadece birim kavramı kullanılır. Örnek 6.6: Araştırmanın Konusu: 2010-2011 öğretim yılında Anadolu Üniversitesi Sağlık Programında öğrenim gören öğrencilerin kitap okuma alışkanlığını araştırmak. Ana kütle: 2010-2011 öğretim yılında Sağlık Programına kayıtlı olan öğrenciler topluluğudur. Birim: Sağlık Programında kayıtlı olan her bir öğrenci hem gözlem birimi hem de örnekleme birimidir. Çünkü örnekleme seçilecek birim de, veri derlenecek birim de öğrencilerdir. Örnekleme ve gözlem birimi aynı olduğu zaman araştırmalarda sadece birim kavramı kullanılmaktadır. Gözlem birimi ve örnekleme birimi ayrımına gidilmesinin nedeni, gözlem birimleri ile ilgili bir çerçevenin temin edilmesinin veya hazırlanmasının zor, maliyetli ve çok zaman alacak olmasıdır. Örnekleme birimi birden çok gözlem birimini kapsayacak şekilde de tanımlanabilir. Örnek 2 üzerinden açıklamak gerekirse, beslenme programıyla ilgili öğrencinin hem annesinin hem de babasının görüşlerine başvurulabilir. Bu durumda gözlem birimi öğrencinin hem annesi hem de babası olur. Ana kütlenin tanımlanması yukarıda yapılan açıklamalarda olduğu gibi her zaman kolay olmayabilir. Örnek 5 üzerinden açıklama yapılacak olursa ana kütle tanımı yapılırken örneğin, yabancı uyruklu olup araştırmanın yapılacağı ile merkezinde ikamet eden ve söz konusu okullarda çocuğunu okutan aileler, araştırmada ifade edilen aile tanımı içine alınacak mı yoksa alınmayacak mı karar verilmelidir. Gözlem birimi olarak ailedeki anne mi? Baba mı? olacak, yoksa çocuğunu eğitimi için görevli annenin yardımcısı olarak çalışan kişi mi seçilecektir? Bir araştırmanın ana kütlesini tanımlarken açıklık, kesinlik, amaca uygunluk ve örnekleme uygulaması için güçlük yaratmaması gibi ilkelerin de göz önünde bulundurulması gerekir. Çerçevenin Belirlenmesi Çerçeve sonlu bir ana kütlenin bütün birimlerinin kayıtlı olduğu bir listedir. Nüfus kayıtları, seçmen kütükleri, hasta kayıt listeleri, hastane personel listeleri, telefon rehberi, öğrenci kayıt listeleri, su, elektrik abonelik listeleri vb. çerçeve olarak kullanılabilecek araçlardır. Sonsuz ana kütleler için yapılacak örnekleme uygulamalarında çerçeve söz konusu olmaz. Örneklemeye başlamadan önce öncelikle amaca uygun bir çerçevenin var olup olmadığı, yoksa sağlanıp sağalanamayacağı araştırılmalıdır. Araştırmaya uygun bir çerçevenin var olması durumunda bu çerçevenin güncel olup olmadığının araştırılması da önemli bir konudur. Çerçeve olmadan ne tam sayım ne de örneklemenin yapılabileceği unutulmamalıdır. Bir çerçeve yoksa yeni bir çerçevenin hazırlanması problemiyle karşılaşılır. Yeni bir çerçevenin hazırlanmasında çerçeve maliyeti ve kapsam hatası özellikle göz önünde tutulmalıdır. Bazen tanımlanan ana kütlenin bazı birimleri çerçevede yer almadığı gibi tanımlanan ana kütlenin dışında kalması gereken birimler de çerçevede yer alabilir ya da bazı birimler tekrar tekrar çerçevede yer alabilir. Bu özellikteki çerçevelerde kapsam hatası işlenmiş olur. Güncel çerçeve bulmak zordur. Kapsam hatası işlenen mevcut çerçevelerin de güncelleştirilmesi uzun zaman alır ve maliyetli olur. Bu nedenlerle uygulamada güncel olmayan bir çerçevenin kabul edilebilirliği onun güncelleştirilmesinin maliyeti ve sağladığı zaman 153 tasarrufu ile ilişkilendirilerek belirlenir. Çerçeve, kabul edilebilir bir çerçeve hatası düzeyinde ana kütle birimlerinin çok büyük kısmını kapsamalıdır. Şüphesiz amaç ana kütle tanımında yer alan bütün birimleri kapsayan bir çerçeve elde etmek veya oluşturmaktır. Örnekleme Yönteminin Seçimi Örneklemeye girecek birimlerin belirlenmesine imkân veren yöntemlere örnekleme yöntemleri denir. Bu yöntemler örneklem için birim seçiminde uygulanan usulün keyfi ya da teadüfi oluşuna göre iki sınıfa ayrılır. Birinci durumda olasılıklı olmayan örnekleme, ikinci durumdaysa olasılıklı örnekleme söz konusu olur. Örnekleme yönteminin seçimiyle ilgili en önemli karar bir örnekleme planında ne tür bir örnekleme yöntemi uygulanacağıdır. Bu konu örnekleme yöntemleri başlığı altında ayrıntılı bir biçimde ele alınacaktır. Örneklem Hacminin Belirlenmesi Örneklem hacmi, örnekleme girecek birimlerin sayısını gösterir ve “n” simgesiyle gösterilir. Bu sayının ne olacağına ilişkin kesin yanıt vermek mümkün değildir. Ancak, bu sorunun yanıtlanabilmesi için aşağıda açıklanan faktörlere ilişkin yapılacak nitel değerlendirmelere ve örnekleme dağılımı başlığı altında açıklanacak olan nicel yöntemlere başvurulur. Malhotra N. K. (1996). Marketing Research An Applied Orientation, Prentice Hall International Inc. Örneklem Hacminin Belirlenmesine Etki Eden Faktörler Ana kütlenin homojenliği: Ele alınan ana kütlenin ilgilenilen değişken bakımından homojen ya da heterojen olması örneklem hacminin belirlenmesine etki eder. Birimlerin özellikler bakımından farklılığı arttıkça ana kütleyi temsil edebilecek bir örneklem oluşturabilmek için örneklem hacminin de giderek büyümesi gerekir. Araştırmada verilecek kararın önemi: Önemli kararlar için olabildiğince çok veriye ve ayrıntılı bilgiye gereksinim vardır. Bu gibi durumlar büyük hacimli bir örneklem üzerinde araştırma yapmayı gerekli kılar. Ancak örneklem hacmi arttıkça maliyet ve gereksinim duyulan zaman ve nitelikli personel sayısı da artar. Burada dikkat edilmesi gereken husus, bir yandan küçük hacimli örneklem oluşturmak suretiyle, bu örneklemin ana kütleyi temsil etmesi bakımından yetersiz kalmasını engellemek, diğer taraftan da gereksiz yere çok büyük hacimli örneklem seçerek zaman ve maliyet yönünden kayba uğramamak için uygun büyüklükte bir örneklem hacmini belirlemektir. Araştırmanın yapısı: Araştırmanın doğası da örneklem hacmi üzerinde etkilidir. Uygulamada genellikle nitel araştırmalarda küçük hacimli örneklemlerde; nicel araştırmalarda ise örneğin betimsel araştırmalarda daha büyük hacimli örneklemlerle çalışılır. Ayrıca araştırmalarda değişken sayısı arttıkça örneklem hacminin artırılması bilginin niteliği açısından ihtiyaç olur. Örneğin çok değişkenli analiz teknikleri ve yöntemlerinin kullanıldığı araştırmalarda örneklem hacmi büyük olmalıdır. Örneklemin Seçimi Örnekleme sürecinin bu son aşamasında örnekleme girecek birimler keyfi veya tesadüfi seçim uygulamalarıyla seçilirler. Gerekli veriler seçilen birimlerden gözlem veya ölçüm yoluyla derlenir. Bu aşamada yapılacak işlemleri; uygun özellikte büro ve çalışma ortamı ile nitelikli işgörenlerin temini gibi sayabiliriz. Önceki aşamalarda yapılan yanlış uygulamalar ve dikkatsizlikler bu aşamada büyük sorunların yaşanmasına neden olur. 154 ÖRNEKLEME YÖNTEMLERİ Örnekleme yöntemleri ana kütleden örnekleme birim seçiminde uygulanan usule göre Şekil 6.2 de gösterildiği gibi olasılıklı olmayan örnekleme yöntemleri ve olasılıklı örnekleme yöntemleri gibi iki sınıfa ayrılır. Şekil 6.2: Örnekleme Yöntemleri. Malhotra N. K. (1996). Marketing Research An Applied Orientation, Prentice Hall International Inc. Olasılıklı Olmayan Örnekleme Yöntemleri Araştırmayı planlayan ya da örnekleme uygulamasını yapan kişi ya da grubun istekleri ve değer yargıları örnekleme seçilecek birimlerin ve örneklem hacminin belirlenmesinde etkili oluyorsa yapılan örnekleme olasılıklı olmayan örneklemedir. Bu örnekleme yöntemleri, örneklem için birim seçiminde keyfi seçim usulünün uygulandığı örnekleme yöntemleridir. Örneklem oluşturulurken, tanımlanan ana kütleyi oluşturan birimler arasında fark gözetilir ve bütün birimlere, bilinen bir olasılıkla seçilme şansı verilmezse yapılan seçim keyfi seçimdir. Keyfi seçimle oluşturulan olasılıklı olmayan örneklemenin ana kütleyi temsil etmeyeceği anlamına gelmez. Ancak olasılık kuramının uygulanamayacağı anlamına gelir. Olasılıklı olmayan örnekleme uygulandığında örneklemin ana kütleyi temsil etme olasılığı bilinemez. Oysa bu bilgi araştırmacılar için çok önemlidir. Temsili örneklem oluşturma ve uygulama kolaylığı sağlaması amacıyla çeşitli olasılıklı olmayan örnekleme yöntemleri geliştirilmiştir. Uygulamada sıkça kullanılan ve aşağıda incelenen bu yöntemlerin ortak özellikleri: Örneklem için birim seçimi keyfidir. Örneklem hacmi keyfi olarak belirlenir. Örneklemden hesaplanan istatistikler ana kütle parametreleri hakkında genelleme amacıyla kullanılamaz. Kolayda Örnekleme Burada amaç, araştırma konusu ile ilgili ve kolayca ulaşılabilir olan birimlerden bir örneklemin oluşturulmasıdır. Araştırma konusu ile ilgili olan ve doğru yerde, doğru zamanda bulunan birimler arasından keyfi olarak birimler seçiliyorsa yapılan örneklemeye kolayda örnekleme denir. Kolayda örnekleme gönüllülük esasına göre katılan birimlerden oluşur. 155 Örnek 6.7: Daha önce ele alınan 4 numaralı örnek üzerinden kolayda örnekleme uygulamasını açıklayalım. 4 nolu örnekte sözü edilen sağlık ocağından poliklinik hizmeti almak için herhangi bir günde gelenler arasından keyfi olarak belirlenen ve araştırmanın amacıyla ilgili mülakata katılmayı kabul eden kişilere verilen hizmetten memnuniyetleri ile ilgili görüşleri soruluyor ve görüşleri alınıyorsa mülakata katılanların oluşturduğu topluluk kolayda örnekleme uygulamasıyla oluşturulmuş bir örneklemdir. Bu örnekte doğru yer ilgili sağlık ocağıdır. Doğru zaman ise, poliklinik hizmetlerinin verildiği bir günün ilgili zaman dilimidir. Uygun görülen sokaktan, uygun görülen zamanda gelip geçen bireylerle görüşme yapılması ya da bir konferansa katılan belirli sayıdaki katılımcıdan araştırma konusuyla ilgili görüşlerinin alınması, birer kolayda örnekleme uygulamasıdır. Bu örnekleme uygulamasında örnekleme birimlerine kolayca ulaşılabilir, ilgilenilen değişkenlerle ilgili veriler kolayca derlenebilir ve birimlerle işbirliği sağlanabilir. En kısa zamanda ve en az maliyetle bilgi üretilmesine ihtiyaç duyulduğu durumlarda kolayda örnekleme yöntemi bir seçenektir. Bu örnekleme yönteminde en önemli sorun, seçilen örneklemin seçildiği ana kütleyi ne kadar temsil edebildiğidir. Kolayda örnekleme uygulaması ile oluşturulan örneklem, birim seçimindeki yanlılık nedeniyle tanımlanan bir ana kütleyi temsil etmeyebilir. Betimleyici ve ilişki araştırıcı araştırmalarda kolayda örnekleme uygun bir yöntem değildir. Kolayda örnekleme odak (focus) gruplar, soru kâğıtlarının (anket formlarının) ön testi veya pilot çalışmalar için kullanılabilir. Yargısal Örnekleme Bu örnekleme de bir tür kolayda örneklemedir. Yargısal örnekleme, örneklemin araştırmacının ya da örneklemecinin kişisel arzu, düşünce ve deneyimlerine göre seçilmiş olduğu örneklemedir. Bu yöntemin kolayda örneklemeden farkı örnekleme birim seçimi için araştırmacının uzman fikirleriyle belirlediği ölçütler kullanması ve bu ölçütlerin temsili bir örneklem oluşturacak ölçütler olduğuna inanıyor olmasıdır. Örnek 6.8: A Üniversitesinin sorunlarını araştırmak amacıyla bu üniversitenin üst düzey yöneticilerinden seçim yapılması yargısal örnekleme için bir örnektir. Çünkü üniversitenin üst düzey yöneticileri üniversite sorunlarını en iyi bilen kişilerdir. Bu düşünceyle seçimin bu kişiler arasından yapılması temsili bir örneklem oluşturabilir. Kolayda örneklemede olduğu gibi yargısal örneklemede de örnekleme birimlerine kolayca ulaşılabilir ve verilerin çok hızlı biçimde derlenmesi mümkün olur. Yargısal örnekleme pazarlama araştırmasında, kamuoyu araştırmalarında ve biyolojik araştırmalarda yaygın olarak kullanılmaktadır. Eğer ana kütleyi oluşturan birimler araştırmaya konu olan değişkenler bakımından homojen ise kolayda ve yargısal örnekleme uygulamaları temsili örneklem oluşturma imkanı verir. Bu örnekleme uygulamalarının maliyeti, uzman çalıştırılacağı için kolayda örneklemeye göre daha yüksektir. Kota Örneklemesi Örneklem için birim seçiminin keyfi olarak yapıldığı yöntemlerden biri de kota örneklemesidir. Tanımlanan sonlu ana kütle heterojen özelliklere sahip birimlerden oluşuyorsa olasılıklı olmayan örnekleme yöntemleri grubundan kota örneklemesi temsili örneklem oluşturma amacıyla tercih edilmelidir. Bu yöntemin başarıyla uygulanabilmesi için; 1. Tanımlanan sonlu ana kütleyle ilgili bir çerçevenin var olması, 2. İlgili ana kütlenin homojen veya heterojen özelliğe sahip olup olmadığının sorgulanabilmesi için ana kütle hakkında öncül bilgilere sahip olunması, 156 3. Ana kütlenin heterojen olduğuna karar verilmiş ise hangi kritere göre heterojen birimlerden oluşan bu ana kütlenin homojen birimlerden oluşacak tabakalara ayırmada kullanılacak kriterin belirlenmesi, 4. tabaka hacimlerinin bilinmesi gerekir. Kota örneklemesi sürecindeki adımlar aşağıdaki gibidir: Ana kütle hacmi N ve tabaka hacimleri Nh , (Tabaka sayısı h = 1, 2, …) belirlenir. Örneklem hacmi n keyfi olarak belirlenir. Her tabakanın, ana kütle hacmi içindeki oranı Nh / N belirlenir. Her tabakada keyfi seçimle nh = (Nh / N) . n sayıda birim seçilir ve bu seçilen birimler örneklemi oluşturur. Örnek 6.9: Bir hastane yönetimi 2012 yılının ilk iki ayında kardiyoloji ve dahiliye poliklinik hizmetlerinden memnun olan kişilerin oranını belirlemek amacıyla bir araştırma planlıyor. Araştırmayı gerçekleştirecek grup kota örneklemesi uygulamayı düşünmektedir. Çözüm 6.9: Poliklinik türü tabakalama türü kriterine göre hastalara ilişkin bilgiler: N = 600 Ana kütle hacmi. NK = 400 Kardiyoloji polikiliniğine iki ayda başvuran hasta sayısı. ND = 200 Dahiliye polikiliniğine iki ayda başvuran hasta sayısı. n = 100 Örneklem hacmi. Kardiyoloji polikliniğinden son iki ay içinde hizmet alan hastalar tabakasından (NK) seçilecek hasta sayısı: nK = (NK / N) . n = (400 /600) . 100 = 66.67 67 kişi Benzer hesaplama dahiliye polikliniğinden son iki ay içinde hizmet alan hastalar için de yapılırsa: nK = 33 kişi bulunur. Kardiyoloji ve dahiliye polikiliniklerinden hizmet alan hasta tabakalarından sırasıyla 67 ve 33 hasta keyfi seçimle seçilmek suretiyle n = 67 + 33 = 100 hacimli örneklem seçilmiş olur. Bu örneklemdeki birimler üzerinden gerekli veriler derlenir ve istenilen bilgi üretilir. Kota örneklemesi kolayda ve yargısal örneklemeye göre daha temsili örneklem oluşturma çalışmasıdır. Ancak bu örnekleme yönteminin uygulanması sonucu oluşturulan örneklemin ana kütleyi temsil etmesinin garantisi yoktur. Çünkü kota örneklemesi uygulamasında belirlenen tabakalardaki birimlerin homojen özellikli birimlerden oluştuğunun, tabaka oranlarının doğruluğunun garantisi yoktur. Ayrıca tabakalardan birimler keyfi olarak seçildiği için yanlılık söz konusu olabilir. Bu örnekleme uygulaması sonucu oluşturulan örneklemden elde edilen bilgiler ana kütle bilgisi için genelleme amacıyla kullanılamaz. 157 Kartopu Örneklemesi Kartopu örneklemesi, özellikle bir çerçevenin mevcut olmaması ya da oluşturulmasının imkansız olduğu durumlarda faydalı bir örneklemedir. Bu yöntemde örnekleme süreci tanımlanan ana kütlede yer alan bir bireyin genellikle tesadüfi olarak seçilmesiyle başlar. Belirlenen bu birey örnekleme giren birinci birimdir. Bu bireyden aynı ana kütle tanımında yer alan tanıdığı bir bireyin olup olmadığı öğrenilir. Varsa bu bireye ulaşılır. Böylece örneklemde yer alacak ikinci birime ulaşılmış olur. Benzer şekilde bu süreç, referanslarla keyfi olarak belirlenen hacimde örnekleme ulaşılıncaya kadar sürdürülür. Örnek 6.10: Bir bölgedeki uyuşturucu madde kullananlar üzerinde bir araştırma yapılacak olsun. Bu bölgede uyuşturucu kullananlarla ilgili bir liste bulmak mümkün değildir. Bölgede bir ya da iki uyuşturucu kullanan tanımlanabilirse kartopu örnekleme süreci başlar. Örnekleme seçilmiş olan bu kişi ya da kişilere uyuşturucu kullanan arkadaşları ya da tanıdıklarının olup olmadığı sorulur. Varsa adresleri öğrenilir, bu kişilere ulaşılır ve bunlar da bu örnekleme seçilirler. Bu süreç keyfi olarak belirlenen n hacimli örneklem oluşturulncaya kadar sürdürülür. Çete üyeleri ve bir ülkeye yasal olamayan yollarla girmiş kişilerle ilgili araştırmalarda, bir kentte internet üzerinden alışveriş yapanlarla ilgili araştırmalarda kartopu örneklemesi uygulanır. Bu örnekleme, endüstriyel ürün alan ve satanlar hakkında yapılacak araştırmalarda da kullanılabilir. Bu yöntem uygulandığında temsili örneklem oluşturmak olanaklıdır. Kartopu örneklemesinin maliyeti ve örneklem değişkenliği düşüktür. Tüm olasılıklı olmayan örnekleme yöntemlerinde örnekleme girecek birimlerin seçiminin keyfi olması tek yönlü hatalara neden olur. Bu tür hatalardan kaçınmak için izleyen kısımlarda ele alınacak olan olasılıklı örnekleme yöntemleri tercih edilmelidir. Kolayda örnekleme mi yargısal örnekleme mi daha temsili örneklem oluşturur? Ana kütlenin birimleri ilgilenilen özellik bakımından heterojen ise hangi olasılıklı olmayan örnekleme yöntemi kullanılır? Açıklayınız. Olasılıklı Örnekleme Yöntemleri Olasılıklı örnekleme, ilgilenilen ana kütledeki her örnekleme birimine hesaplanabilir ve sıfırdan farklı bir olasılıkla seçilme imkânı veren örneklemedir. Tesadüfi örnekleme yöntemleri olarak da alınan bu örnekleme yöntemleri örnekleme planlarında yaygın olarak uygulanır. Bu tür örneklemede örnekleme girecek birimlerin seçimi tesadüfi olarak yapılır. Tesadüfi seçim ana kütleden örnekleme girecek birimleri seçerken herhangi bir ayrıcalığın uygulanmadığı seçimdir. Basit Tesadüfi Örnekleme Sonlu Ana kütlelerde Basit Tesadüfi Örnekleme Serper Ö. (2004). Uygulamalı İstatistik 2, 5. Baskı, Bursa; Trochim W. M. (2001). Research Methods Knowledge Base, Cornell University Örnekleme planlarında uygulanan en temel olasılıklı örnekleme basit tesadüfi örneklemedir. Basit tesadüfi örnekleme hacmi N olan sonlu bir ana kütleden birbirinden farklı ve n hacimli oluşturulabilecek CnN sayıdaki olası örneklemlerin her birine incelenecek örneklem olması bakımından eşit şans tanıyan 158 N örnekleme yöntemidir. Bu tanımda belirtilen özellikleri taşıyan Cn sayıdaki mümkün örneklemlerin her birine basit tesadüfi örneklem denir. Bu örnekleme yöntemi ana kütledeki bütün birimlere hacmi n olarak belirlenen örnekleme girmeleri bakımından bilinen ve birbirine eşit seçilme olasılığı sağlar. Örnek 6.11: Kan tahlili yapılan 4 hastanın ölçülen LDL kolesterol düzeyi incelenecektir. Ölçülen sonuçlar 60, 40, 50 ve 70 mg/dl dir. Sonlu ana kütleyi oluşturan bu 4 hastayı, A, B, C ve D olarak simgelendirelim ve 2 hastadan oluşan C N n N! 4! 4 ; 6 tane mümkün farklı örneklem aşağıdaki gibi oluşturulabilir. n !( N n)! C 2 2!(4 2)! Tablo 6.1: 4 birimlik ana kütleden iadesiz seçimle oluşturulabilecek 2 hacimli mümkün örneklemler. BİRİMLER MÜMKÜN ÖRNEKLEMLER A A, B B A, C C A, D D B, C B, D C, D Bu mümkün farklı 6 tesadüfi örneklemden birinin incelenen örneklem olması olasılığı olur. Burada herhangi bir birimin yapılacak bir tesadüfi seçimde seçilmesi olasılığı ; herhangi bir birimin n = 2 hacimlik örneklemde yer alması olasılığı da olacaktır. Örnekleme uygulamalarında mümkün örneklemler oluşturulmaz; oluşturulabileceği varsayılır. Sadece bu mümkün örneklemlerin birisi oluşturulur ve araştırma bu örneklem üzerinden yapılır. Sonlu bir ana kütleden iadesiz seçimle n hacimli bir tesadüfi örneklem oluşturmak için aşağıdaki adımlar izlenir: Güncel çerçeve temin edilir ya da hazırlanır. Örneklem hacmi belirlenir. Çerçevede yer alan n sayıdaki birime tanımlayıcı numara ya da işaret verilir. Ana kütledeki her birime eşit seçilme şansı vermek suretiyle örnekleme girecek birinci birim tesadüfi seçim araçları kullanılarak belirlenir. Geriye kalan (N – 1) birimin her birine yine eşit şans vermek suretiyle ikinci birim seçilir. Bu birim seçim süreci n hacimli örneklem seçilinceye kadar tekrarlanır. 159 Açıklanan seçim sürecinde her çekilişte seçilen birim incelendikten sonra ana kütleye iade edilmediği için bu seçim sürecine iadesiz tesadüfi seçim süreci adı verilir. Eğer basit tesadüfi örnekleme planlarında önceki çekilişte seçilen birim incelendikten sonra ana kütleye iade ediliyorsa, başka bir ifadeyle birimler tekrar tekrar seçilme şansına sahipse bu seçim sürecine iadeli tesadüfi seçim süreci adı verilir. Bu seçim sürecinde ana kütle hacmi çekilişten çekilişe değişmez. Sonlu bir ana kütleden iadeli seçimle bir tesadüfi örneklem seçilirse sonsuz ana kütleden basit tesadüfi örnekleme yapılıyormuş gibi bir anlam ifade eder. Bu çekiliş sürecinde ana kütledeki her birimin yapılacak çekilişlerin her birinde birbirine eşittir. olan seçilme olasılığına sahiptir ve birbirini izleyen çekilişler bağımsızdır. Sonlu ana kütlelerde ana kütle hacminin büyük ya da küçük oluşu iadeli ya da iadesiz seçimler için önemli farklılıklar gösterir. Ana kütle hacmi büyük, örnekleme oranı küçük olduğu zaman iadeli ve iadesiz örneklemler benzer özellikler gösterirler. Çünkü iadeli çekiliş uygulandığında önceki çekilişlerde seçilmiş olan bir birimin yeniden örnekleme seçilmiş olma olasılığı çok küçüktür. Ancak ana kütle hacmi küçükse iadeli ve iadesiz tesadüfi seçimlerle oluşturulan aynı hacimli örneklemler için hesaplanan örneklem istatistikleri ile ana kütle parametreleri karşılaştırılırsa iadesiz basit tesadüfi seçimle oluşturulan örneklem iadeli olana göre daha az hatayla tahminleme imkanı sağlar. Bu özellik nedeniyle de iadesiz tesadüfi seçim uygulamada genellikle başvurulan yöntem olmaktadır. İlgilenilen özellik bakımından ana kütlenin homojen olması durumunda basit tesadüfi örnekleme tercih edilmesi gereken bir yöntemdir. Örnekleme planlarında basit tesadüfi örnekleme yöntemlerinin tercihlerini etkileyen önemli sınırlayıcılar vardır. Bunlardan birincisi güncel bir çerçeve oluşturma ya da hazırlama güçlüğüdür. İkincisi ana kütlenin birimleri geniş bir coğrafi alana yayılmışsa basit tesadüfi örnekleme uygulaması çok zaman alır ve veri derleme maliyeti giderek artar. Üçüncüsü ana kütle homojen değilse basit tesadüfi örneklem sonuçlarının başarısı diğer olasılıklı örnekleme yöntemleri sonuçlarının başarısından düşüktür. Sonsuz Ana kütlelerde Basit Tesadüfi Örnekleme Daha önce açıklandığı gibi sonsuz ana kütle “aynı koşullar altında işleyen bir sürecin sonuçlarının oluşturduğu topluluktur” şeklinde tanımlanmıştı ve bir sağlık ocağında verilen poliklinik hizmeti süreci örnek verilmişti. Bu sağlık ocağında verilen poliklinik hizmeti sonucu olan her bir hizmet (hizmet verilen her bir hasta) bir birim, poliklinik hizmeti süreci devam ettikçe hizmet alan yeni hastalar ana kütleye dahil olduğu için bu sürecin sonuçları olan poliklinik hizmeti alan hastalar sonsuz ana kütleyi oluşturur. Örnekten de anlaşılabileceği gibi sonsuz ana kütledeki bir başka ifadeyle aynı koşullar altında işleyen bir sürecin bütün sonuçları listelenemez. Bütün birimlerle ilgili bir çerçeve hazırlanamaz, bunun yerine bu birimlerin ilgilenilen bir değişken X için bir teorik olasılık dağılımı tarif edilebilir. Tarif edilen bu teorik olasılık dağılımına sonsuz ana kütle adı verilir. Sonsuz ana kütlelerde basit tesadüfi örnekleme ile ilgili bilgiler için Neter J., Wasserman W., Whitmore G. A. (1993). Applied Statistics, (Boston: Fourth Edition, Allyn and Bacon) adlı kitaptan yararlanmıştır. Sonsuz ana kütlenin birimlerinin X değişkeni için ölçümlenen değerleri (gözlem değerleri) bu birimler için X değişkeninin gerçekleşen değerleridir. Eğer sonsuz ana kütlenin birimleri kararlı (aynı koşullar altında meydana gelen) bir sürecin sonuçları, birimleri ise n sayıdaki birimin ilgilenilen X değişkeni bakımından aldığı x1 x2, … , xn değerleri (gözlem değerleri), X1, X2, … Xn tesadüfi değişkenlerinin birer gerçekleşmesi olduğu düşünülür. Buna göre, bir süreç tarafından türetilen birbirinden bağımsız ve benzer olasılık dağılımına sahip n sayıdaki X1, X2, … Xn tesadüfi değişkenlerinin oluşturduğu topluluğa sonsuz ana kütleden seçilmiş basit tesadüfi örneklem denir. Bu tesadüfi değişkenlerin teorik olasılık dağılımına sonsuz ana kütle adı verilir. 160 Örnek 6.12: Bir hastanede yataklı tedavi gören hastaların hastanede yatma sürelerinin ortalamasını hesaplamak amaçlanıyor. Yataklı tedavi gören hastaların hastanede kalış süresi kararlı bir süreçtir. Aynı koşullar altında işleyen bir süreçtir. Yataklı tedavi gören, görmekte olan ve görecek olan her bir hasta sonsuz ana kütlenin birimleridir. İncelenen değişken yataklı tedavi gören ve görecek olan hastaların yatma süreleridir. Bu hastalardan tesadüfi olarak seçilecek n tanesinin hastanedeki yatma süreleri x1 x2, … , xn sırasıyla X1, X2, … Xn tesadüfi değişkenlerinin gerçekleşmeleridir. Buna göre hastaların hastanede kalış sürecinden tesadüfi olarak seçilen n tane hastanın ölçülen kalış sürelerini kullanılarak hesaplanan olasılık dağılımı X1, X2, … Xn teorik olasılık dağılımını ifade eden sonsuz ana kütleden seçilmiş basit tesadüfi örneklemi oluşturduğu söylenebilir. Tabakalı Örnekleme Tanımlanan ana kütlenin birimleri araştırmaya konu olan değişkenler bakımından heterojen ise, önemli farklılıklar gösteriyorsa tabakalı örnekleme temsili örneklem oluşturabilmek için tercih edilmelidir. Tabakalı örnekleme ana kütle birimlerinin tabakalara ayrıldığı ve her tabakadan tesadüfi seçimle örneklemin oluşturulduğu örneklemedir. Tabakalı örnekleme, üzerinde araştırma yapılacak ana kütle ilgilenilen değişkenler yönünden heterojen olduğunda örnekleme dağılımının varyansın olabildiğince küçük olmasını sağlayan bir örnekleme yöntemidir. Tabakalı örnekleme 4 aşamalı bir süreçtir. Tabakalama kriterinin belirlenmesi. Tabakalı örnekleme uygulaması yapacak araştırmacı önce incelenecek değişkenler açısından önemli farklılıklar gösteren N hacimli ana kütlenin birimlerini homojen birimlerden oluşacak tabakalara ayırmada kullanılacak kriter belirler. Burada önemli olan belirlenecek kriterin tabakalar içindeki birimleri olabildiğince homojen, tabakalar arasında ise birimlerin heterojen olmasını sağlayacak kriter olmasıdır. Aynı zamanda bu kriterin uygulama ve ölçme kolaylığı da sağlamak suretiyle maliyet artırmadan tahminleme hatasını azaltması gerekir. Tabakalama kriteri ilgilenilen parametre ile sıkı sıkıya ilişki içindedir. Belirlenen tabakalama kriterinin uygunluğu örneklem değişkenliğinin etkinliği üzerinde olumlu yönde etkilidir. Bu nedenle asimetrik bölünmeye sahip ana kütlelerde tabakalı örnekleme uygulamasını tercih etmek bir zorunluluktur. Tabakalama amacıyla kullanılabilecek kriterlere demografik özellik (yaş, cinsiyet…vb), tüketici türü, sosyoekonomik sınıf, meslek grubu, firma büyüklüğü, coğrafi yerleşim yeri, fakülte türü vb. örnek olarak gösterilebilir. Tabakaların oluşturulması. Belirlenen tabakalama kriteri itibariyle N hacimli bir ana kütle daha homojen, L sayıda ve hacimleri N1 , N2 , …. , NL olan tabakalara ayrılır. Bu aşamada önemli olan tanımlanan ana kütledeki her bir birimin yalnız bir tabakaya ait olması ve hiçbir birimin açıkta kalmamasının sağlanmasıdır. Başka bir ifadeyle N1 N 2 N L L N h N h 1 olmalıdır. Tabaka sayısı L arttıkça tabakaların homojenliği de artacağından tabaka varyansları giderek küçülecek ve buna bağlı olarak da tahminlerin güvenilirliği giderek artacaktır. Tabaka sayısının artması maliyetleri yükseltir ve uygulama zorluğu yaratır. Bu nedenlerle tabaka sayısı L belirlenirken tabaka sayısının yaratacağı maliyet, uygulama zorluğu ve elde edilecek tahminlerin güvenilirliği birlikte değerlendirilmelidir. Deneyimler ve uygulamalar tabaka sayısının 6 ’dan fazla olmamasını önermektedir. Tabakalardan birimlerin seçilmesi. 161 Her tabakadan basit tesadüfi seçimle sırasıyla n1 , n2 , … , nL hacimli alt örneklemler oluşturulur. Alt örneklem hacimleri toplamı örneklem hacmine eşittir. Başka bir ifadeyle n örneklem hacmini göstermek üzere L n1 n2 nL nh n h 1 olmalıdır. Verilerin derlenmesi. Oluşturulan alt örneklem birimleri üzerinden veriler derlenir, bu veriler kullanılarak araştırma amaçları için gerekli olan istatistikler hesaplanır ve bu istatstiklere dayanarak istatistiksel çıkarımlar yapılır. Daha önce de vurgulandığı gibi tabakalar içi homojenlik arttıkça tabakalar içi varyanslar küçülür. Bu da ilgili ana kütle parametre tahminleyicisinin varyansını küçültür. Bu sonuca göre heterojen ana kütlelerde aynı örneklem hacmi için basit tesadüfi örnekleme uygulamasının örnekleme hatası, tabakalı örneklemenin örnekleme hatasından büyük olur. Heterojen ana kütleler için tabakalı örnekleme yöntemi daha etkindir. Tabakalı örneklemenin diğer bir üstünlüğü ilgilenilen ana kütlenin yanısıra her tabaka içinde ayrı bilgi elde etme olanağı sağlamasıdır. Uygulamada ana kütleye göre tabakalar için çerçeve oluşturmak daha kolay olabilir. Ancak sağladığı kolaylıklara rağmen tabakalı örneklemenin bazı güçlükleri de vardır. Örneğin tabaka hacimleri ve bunların toplamı olan ana kütle hacminin bilinmesi gerekir. Bu her zaman mümkün olamamaktadır. Ayrıca ilgilenilen ana kütlenin homojenliğinin sorgulanması için de bu ana kütle hakkında pek çok öncül bilgiye gereksinim vardır. Bu öncül bilgilerin yetersizliği ve geçersizliği oluşturulacak örneklemin temsil niteliğini olumsuz yönde etkiler. Tabakalı örnekleme sürecinin adımlarıyla ilgili yukarıdaki kuramsal bilgileri örnek araştırma üzerinde uygulayalım. Örnek 6.13: Araştırmanın Amacı: Türkiye’de guatr hastalığının genel ve coğrafi bölgeler itibariyle dağılımını araştırmak. Ana kütle: Bu araştırma için Türkiye’nin N1, N2, N3 ve N4 olmak üzere dört coğrafi bölgeye ayrıldığını düşünelim. Araştırma için bu coğrafi bölgelerdeki sağlık kuruluşlarına son bir hafta içerisinde başvuran hastalardan oluşan topluluğun ana kütle olarak tanımlandığını düşünelim. Tanımlanan bu ana kütle sonlu bir ana kütledir, varsayalım ki hacmi N= 10000 hastadır. Örnekleme Yöntemi: Ana kütle, sonlu ana kütle olduğu için araştırmacı tam sayım da uygulayabilir, örneklemeye de başvurabilir. Araştırmacı örnekleme yapmayı gerekli kılan nedenleri değerlendirmiş ve örnekleme yapmaya karar vermiştir. Araştırmacının gözlemlerine ve öncül bilgilerine göre bölgeler itibariyle guatr hasta dağılımı farklılık göstermektedir. Çünkü araştırmacının öncül bilgilere göre bazı coğrafi bölgelerde guatr hasta sayısı düşükken bazı bölgelerde yüksek olduğu kanaati bulunmaktadır. Başka bir ifadeyle guatr hasta sayısı değişkeni bakımından coğrafi bölgeler heterojen özelliğe sahiptir. Bu değerlendirmeye göre araştırmacı tabakalı örnekleme yöntemini örnekleme amacıyla tercih etmiş ve uygulama adımlarını aşağıdaki gibi izlemiştir: Heterojen birimlerden oluşan ana kütlenin coğrafi bölge kriterine göre guatr hasta sayısı bakımından homojen tabakalara ayrılabileceği düşünülmüştür. Tabakalar (coğrafi bölgeler) N1, N2, N3 ve N4 şeklinde isimlendirilmiş olsun. Elde edilen bilgilere göre tabaka hacimleri N1 = 4000, N2 = 3000 , N3 = 2000 ve N4 = 1000 birimden oluştuğu düşünülsün. 162 n = 1000 olarak belirlenen örneklem hacmi tabaka hacimlerinin (Nh) ana kütle hacmi N=10000 içindeki paylarıyla orantılı olarak aşağıdaki şekilde dağıtılır: nh = ( ).n n1 = ( ) . n = (4000 / 10000) . 1000 = 400 Burada h tabaka numarasıdır. Örneğimizde h = 1, 2, 3, 4 değerlerini alır. Benzer şekilde h = 2, 3, 4 için hesaplama yapılırsa n2 = 300, n3 = 200, n4 = 100 bulunur. Her tabakadan (coğrafi bölgeden) yukarıda hesaplanan sayıda tesadüfi seçimle birim (hasta) seçilir, (n1 = 400 )+ (n2 = 300) +( n3 = 200) + (n4 = 100) = n = 1000 hasta örneklemi oluşturur. Seçilen birimler (hastalar) üzerinden guatr hastası olup olmadığı değişkeni itibariyle birinci elden veri derleme yöntemiyle veriler derlenip çözümleme yapılır ve gerekli bilgiler üretilebilir. Sistematik Örnekleme Örneklem için birim seçimi aşağıda ele alınan bir sistematiğe uygun olarak yapıldığı örnekleme sürecine sistematik örnekleme adı verilir. Bu yöntemin sınırlayıcıları ilgili ana kütleye ilişkin bir çerçevenin var olup olmaması veya birimlerin doğal bir sıraya sahip olup olmamasıdır. Bir sistematik örneklem oluşturmak için aşağıdaki adımlar izlenir: Ana kütledeki birimler 1’den N’ye kadar numaralandırılır. Araştırma için yeterli olacak örneklem hacmi n belirlenir. k= 1 ile k arasında bir tamsayı tesadüfi olarak seçilir. Bu sayı a ile gösterilirse, a örnekleme girecek birinci birimin sıra numarası olur. a‘ıncı birimi k aralıklarıyla izleyen a + k’ıncı , a + 2k’ıncı , … , a + (n - 1)k’ıncı sıra nolu birimler örnekleme seçilir ve n hacimli sistematik örneklem oluşturulur. Oluşturulan örneklemden elde edilen veriler kullanılarak gerekli istatistikler hesaplanır. Bütün bu adımları daha açık bir şekilde bir örnek üzerinden gösterelim: Örneğin, Ana kütledeki birim sayısı N = 1000 sağlık personeli çalışanı olsun. Bu personelin ünvan türü, soyadı sırası itibariyle listelenip 1’den N’ye kadar numaralandırılır. Diyelim ki n = 100 birimlik bir örneklem seçileceği tasarlandı. k = 1000 / 100 = 10, hesaplandı. Bunun anlamı, her 10’uncu birim örnekleme alınacak demektir. 1, 2, … , 10 arasından tesadüfi olarak bir sayı seçildi. Seçilen sayı 4 olsun. A = 4. Sıradaki sağlık personeli çalışanı örnekleme girecek birinci birimdir. Sıra nolu sağlık personeli çalışanından başlayarak her 10. ( 4, 14, 24, 34,…) sıra nolu sağlık personeli çalışanı örnekleme alınarak n = 100 birimlik tesadüfi örneklem oluşturulmuş olur. büyütme faktörü hesaplanır. Bu oran örnekleme aralığını gösterir. 163 Tablo 6.2: Örnek problem için sistematik örnekleme uygulama tablosu. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1000 Sistematik örneklemede uygulanacak sistematiğin belirlenmesi her zaman yukarıdaki hesaplamalarda olduğu gibi yapılmayabilir. Ana kütleyi oluşturan birimlere sıra numarası verilemiyorsa veya numaralandırma çok zaman alıyor ve masraflı oluyorsa ve fakat sonlu veya sonsuz ana kütle birimleri rastgele dizilişlere veya gelişlere sahip ise sistematik örnekleme uygulanabilir. Örneğin bir üniversitenin 20.000 öğrencisi üzerinde yapılacak bir araştırma için haftanın seçilen bir öğretim günü saat 8:30 da başlayıp her yarım saat aralıklarla üniversite kampüs kapısından giren öğrencinin örnekleme alınması uygulaması da bir sistematik seçimdir. Bir süpermarketten ayrılan her k’ıncı müşteriyle görüşme yapılarak yürütülen araştırmalar da bu örneklemin uygulandığı araştırmalardır. Sistematik örnekleme ana kütledeki her birimin örneklemde yer alma olasılığı bakımından basit tesadüfi örneklemeye benzer ve bu olasılık n / N dir. Ancak mümkün örneklemlerden herhangi birinin incelenen örneklem olması olasılığı N basit tesadüfi örneklemede 1/ Cn olduğu halde sistematik örneklemede belirlenen sistematiğe göre örneklem olma şansına sahip kombinasyonların her biri için eşit 1 / k diğerlerininki için 0’dır. Sistematik örnekleme uygulaması sonucu oluşturulacak örneklemin temsil niteliği ana kütle birimlerinin sıralandırılması ve k aralığı ile ilişkilidir. Bu sıralandırma araştırmaya konu olan değişkenlerle ilişkilendirilerek yapılırsa sistematik örnekleme basit tesadüfi örneklemeye göre daha temsili örneklem oluşturma imkanı verir. Örneğin firmaların düşük ciroya sahip olandan büyük ciroya sahip olana doğru sıralanması, otellerin yıldız sayıları bakımından büyükten küçüğe doğru sıralanması, öğrencilerin küçük boyludan büyük boyluya doğru sıralandırılması durumunda sistematik örnekleme her gruptan birimin örnekleme girmesini temin edebilir. Ancak örnekleme aralığının uygun şekilde belirlenememesi halinde sistematik örneklemenin basit tesadüfi örneklemeye olan yukarıda açıklanan üstünlüğü ortadan kalkar. Çünkü belirli özelliğe sahip birimlerin gereksiz oranda örnekleme girmesi söz konusu olabilir. Bu durum örneklemin temsil niteliğini olumsuz yönde etkiler. Sistematik örnekleme önceki tesadüfi örnekleme yöntemlerine göre daha az maliyetli ve uygulaması kolaydır. Çerçevenin doğal yapısında tekrarlamalar varsa sistematik örnekleme kullanılmamalıdır. Örneğin, veriler aylık olarak düzenlenmiş ve k = 12 alınmışsa her yılın aynı ayı örnekleme gireceğinden bu tür bir uygulama tek yönlü hatalara neden olabilir. Tek Aşamalı ve Çok Aşamalı Küme Örneklemesi Tabakalı örneklemede olduğu gibi ana kütlenin birimleri küme adı verilen gruplara ayrılır. Bu gruplar genellikle doğal olarak vardır. Her küme bir örnekleme birimi olarak tanımlanır. Kümeler arasından tesadüfi olarak belirli sayıda küme seçilir ve seçilen kümelerdeki gözlem birimlerinin tamamı örneklemi oluşturur. Örneğin bir organize sanayi bölgesinde faaliyette bulunan işyerlerinde çalışan işgörenler hakkında bir araştırma planlandığında bu organize sanayi bölgesinde her bir işyerinde çalışan işgörenler bir küme olarak tanımlanabilir. Hanehalkı geliriyle ilgili bir araştırmada her mahalledeki hanehalkı topluluğu bir küme olarak tanımlanır. Örneklerden de anlaşılabileceği gibi kümeler genellikle bir coğrafi kritere göre tanımlanmaktadır. Küme örneklemesi bir ve daha fazla kümeleme aşamaları ile de uygulanabilir. Bir kümeleme aşaması ile gözlem birimlerine ulaşılıyorsa tek aşamalı kümeleme; iki veya daha fazla kümeleme aşaması ile gözlem birimlerine ulaşılıyorsa çok aşamalı kümeleme adı verilir. 164 Bu örnekleme yöntemleri ana kütledeki birimlerin homojen, hacimlerinin çok büyük ve geniş bir coğrafi alana yayılmış olmaları ya da örnekleme girecek birimlere ilişkin bir çerçeve oluşturmanın mümkün olmadığı durumlarda tercih edilmesi gereken yöntemlerdir. Tek aşamalı (küme) örneklemesi sürecinde aşağıdaki adımlar izlenir. İlgilenilen ana kütledeki birimler genellikle coğrafi kritere göre kümelere ayrılır. Bu, birinci düzey kümelemedir. Kümeler doğal olarak bir mekânda var olan birimlerden oluşur. Küme sayısı “M” simgesiyle gösterilir. Üniversiteler, sağlık ocakları, araştırma ve uygulama hastaneleri, kamu kurumları, ortaöğretim okulları birer kümedir. Çünkü örneğin sağlık ocakları ele alalım. Bu kuruluşlarda çalışan işgörenler kümeleri oluşturur. Kümeler arasından tesadüfi seçimle “m” sayıda küme seçilir. Seçilen kümelerdeki birimlerin toplamı tek aşamalı küme hacmini gösterir. Tanımlanan birinci aşama kümelerine, benzer kritere göre ikinci, üçüncü ve n’inci aşama kümelere ayrılır ve son kümeleme aşamasındaki kümeler arasından tesadüfi seçimle m sayılı küme seçilir ve seçilen kümelerdeki birimlerden örneklem oluşturulursa yapılan örneklemeye çok aşamalı küme örneklemesi denir. Tek ve çok aşamalı küme örneklemesi ile ilgili kuramsal açıklamaları bir araştırma örneği üzerinden açıklayalım. Örnek 6.14: Araştırmanın Amacı: Türkiye’deki tıp fakülteleri hastanelerinde görev yapan uzman hekimlerin tam gün yasası uygulaması ile ilgili görüşlerini araştırmak. Ana kütle: Bu araştırmanın ana kütlesi Türkiye’de tıp fakülteleri hastanelerinde uzman hekimlerin oluşturduğu topluluktur. Sonlu ve büyük hacimli bir ana kütledir. Ana kütle hacminin büyük olması, bütün uzman hekimlere ulaşmanın güçlükleri gibi nedenlerle araştırma için örneklemeye başvurulması düşünülmüştür. Örnekleme Yöntemi: Uzman hekimler Türkiye’de pek çok ilde kurulmuş üniversitelerin bünyesinde açılmış olan tıp fakültelerinde görev yapmaktadırlar. Yani coğrafi olarak ülkenin büyük bir kısmına yayılmış durumdadırlar. Araştırmacı, tıp fakültelerinde görev yapan bu uzman hekimlerin tam gün yasasını değerlendirmeleri bakımından homojen olduğu öncül bilgisine sahiptir. Bu değerlendirmelere göre araştırma için uygun örnekleme yöntemi olarak önce tek aşamalı, sonra iki aşamalı örnekleme yöntemi seçilmiştir. Tek aşamalı örnekleme uygulamasının adımları: Uzman hekimler görev yaptıkları üniversite türü kriterine göre kümelere ayrılmıştır. Kümeler örneğin Eskişehir Osmangazi Üniversitesi Tıp Fakültesi, Hacettepe Üniversitesi Tıp Fakültesi, Ege Üniversitesi Tıp Fakültesi, İnönü Üniversitesi Tıp Fakültesi, Gazi Üniversitesi Tıp Fakültesi, İstanbul Üniversitesi Çapa Tıp Fakültesi vb. uzman hekimleri topluluğu şeklinde tanımlanabilir. Bu tanıma göre küme sayısı M=6 ‘dır. M=6 tıp fakülteleri arasından m=2 fakülte tesadüfi olarak seçilir. Varsayalım ki seçilen 2 fakülte Hacettepe Üniversitesi Tıp Fakültesi, Ege Üniversitesi Tıp Fakültesi olsun. Seçilen birinci fakültedeki uzman hekimlerin tamamı N1=250 ve ikinci fakültedeki uzman hekimlerin tamamı N4=300 ise örneklem hacmi n=N1+N4=250+300=550 uzman hekim olur. İki aşamalı örnekleme uygulaması benimsendiğinde birinci aşamada seçilen Hacettepe Üniversitesi Tıp Fakültesi, Ege Üniversitesi Tıp Fakültesi uzman hekimleri anabilimdalı türü kriterine göre tekrar kümelere ayrılırsa ikinci aşama kümeleme yapılmış olur. İkinci aşamada her iki üniversitenin oluşturulan kümeleri (anabilimdalları) arasından tesadüfi seçimle m2 sayıda anabilimdalı seçilir ve bu anabilim dallarındaki bütün uzman hekimler örneklemi oluşturur. Bu uzman hekimlerin tam gün yasası ile ilgili görüşlerine ilişkin veriler derlenir. Tek ve çok aşamalı örnekleme uygulamasında tanımlanan kümeler örnekleme birimi olarak benimsendiğinden basit tesadüfi örneklemede olduğu gibi ana kütle ile ilgili bir çerçeveye gerek yoktur. 165 Sadece seçilen kümelerle ilgili çerçeveye gereksinim vardır. Bu durum örnekleme uygulamasında zaman, maliyet tasarrufu yanında uygulama kolaylığı sağlamaktadır. Eğer birimler kümeler arasında homojen değilse seçilen kümelerdeki birimlerden oluşacak örneklemin ana kütleyii temsil niteliği tartışılır, çünkü ana kütleyi oluşturan her türden birim örnekleme girmemiş olur. Tek aşamalı ve çok aşamalı örnekleme yöntemleri örnekleme maliyetini azaltarak onun etkinliğini artırırken tabakalı örnekleme doğruluğu artırmaktadır. Küme örneklemesinde kümelerdeki birimlerin mümkün oldukça heterojen olması, tabakalı örneklemede tanımlanan tabakaların ise mümkün oldukça homojen olması istenir. Olasılıklı örnekleme ile olasılıklı olmayan örneklem yöntemleri arasındaki temel fark nedir, açıklayınız. ÖRNEKLEME DAĞILIMI Daha önce de değinildiği gibi tanımlanan ana kütleye ilişkin sayısal karakteristiklere parametre adı verilir ve parametre genel olarak θ (theta) simgesiyle gösterilir. Tam sayım yapılamadığı durumlarda araştırmacılar istatistiksel tahminleme ve karar verme (istatistiksel çıkarım) problemleri ile karşılaşırlar. Bu çıkarımlar örneklem istatistiklerine dayanır. Örneklem istatistiklerinin genel gösterimi daha önce ifade edildiği gibi ˆ simgesiyle yapılır. Örneklem istatistiği bilindiği gibi tesadüfi olarak seçilen n hacimli örneklemden elde edilen x1, x2, … ,xn gözlem değerlerinin kullanılmasıyla hesaplanan karakteristiklerin genel adıdır. Örnekleme sürecinde tesadüfi olarak seçilen n hacimli bir örneklem için hesaplanan istatistikler sadece ait oldukları örneklem için bilgi niteliğindedirler. Çünkü incelenen n hacimli bir örneklem aynı hacimli ve fakat farklı birimlerden oluşabilecek mümkün örneklemlerden sadece birisidir ve mümkün örneklemlerin her biri için hesaplanacak istatistikler birbirinden farklı ve ana kütle parametre değerlerine eşit ( ˆ) , büyük ( ˆ) veya küçük ( ˆ) olabilir. Bu nedenle örneklem istatistiklerinden yararlanarak ana kütle parametreleri hakkında tahminleme ve karar verme sürecinde tesadüfi olarak seçilen n hacimli bir örneklemin hesaplanan test istatistiğinden değil; o istatistiğin mümkün örneklemlerde alacağı değerlerin dağılımından ve bu dağılımın özelliklerinden yararlanılır. N hacimli sonlu bir ana kütleden iadesiz seçimle tesadüfi olarak seçilebilecek n hacimli sayıdaki mümkün bütün örneklemlerin seçildiğini ve her örneklem için ˆ1 ,ˆ2 , ,ˆC N n C N n istatistiklerin hesaplandığını varsayalım. Hesaplandığını varsaydığımız bu istatistiklerin dağılımına örnekleme dağılımı denir. Tesadüfi örneklemden hesaplanan ̂ istatistiğinin olasılık dağılımına bu istatistiğin örnekleme dağılımı denir. Eğer N hacimli ana kütleden n hacimli örneklemler iadeli seçimle oluşturulursa mümkün örneklem sayısı ve hesaplanacak istatistik sayısı Nn olacaktır. Uygulamada, n hacimli bir tek örneklem seçilir ve bu örneklem için tahminlenecek veya karar verilecek parametre hakkında bilgi üreten istatistik hesaplanır. n hacimli mümkün örneklemler seçilmez, örneklem istatistikleri hesaplanmaz ve bu istatistiğin dağılımı oluşturulmaz. Mümkün örneklemler seçilmiş gibi düşünülerek bu istatistiğin varsayımsal dağılımından yararlanmak suretiyle ana kütle parametreleri hakkında çıkarımlar yapılabilir. Bu durum, örneklem istatistiğinin aynı hacimli örneklemden örnekleme farklı değerler alan tesadüfi değişken olduğu esasına dayanır. Bir ana kütleden örneklem seçilmeden önce örneklem gözlem değerleri x1 , x2 , … , xn tesadüfi değişkenlerdir ve bu gözlem değerlerinden hesaplanan istatistikleri de bir tesadüfi değişkendir. Yapılan açıklama bağlamında 166 örnekleme dağılımı bir tesadüfi değişken olan örneklem istatistiğinin olasılık dağılımı şeklinde yapılabilir. Çeşitli amaçlar için örnekleme karar verildiği zaman dikkatlerin en çok odaklandığı parametreler ana kütle aritmetik ortalaması (µ) ve ana kütle oranı (π) olmaktadır. Bu nedenle bu ünitenin izleyen kısımlarında bu parametreler hakkında bilgi üreten örneklem istatistiklerinin sırasıyla örneklem aritmetik ortalaması ̅ ve örneklem oranı p ‘nin örnekleme dağılımları ve özellikleri incelenecektir. Ortalamanın ( X Örnekleme Dağılımı Bir örneklem istatistiği olan örneklem aritmetik ortalaması ( X ) tesadüfi bir değişkendir. X tesadüfi değişkeninin olasılık dağılımına ortalamanın örnekleme dağılımı adı verilir. Bir başka anlatımla tanımlanan ana kütleden n hacimli bir tesadüfi örneklem değil de aynı hacimli C N n (veya Nn) sayıdaki mümkün tesadüfi örneklemlerin seçildiğini ve her mümkün örneklem için X hesaplandığını varsaydığımızda dan oluşan bir frekans dağılımı elde edilebilir. Bu dağılıma ortalamanın X i örnekleme dağılımı adı verilir. Bir örnek üzerinde X nın örnekleme dağılımını oluşturalım. Örnek 6.14: Kan tahlili yapılan 4 hastanın ölçülen LDL kolesterol düzeyi incelenecektir. Bu hastaların simgesel isimleri ve kolesterol ölçüm değerleri aşağıda verilmiştir. Ana kütle ortalamasını hesaplayınız ve örnekleme dağılımını oluşturunuz. Hastalar (Birimler) LDL Kolesterol Değerleri A 90 B 80 C 60 D 70 X nın Toplam=300 Çözüm 6.15: Ana kütle ortalaması µ, tam sayım yapıldığında, gözlem değerleri x1 , x2 , … , xN olarak gösterildiğinde ve yukarıdaki veriler kullanıldığında; N x i i 1 N 300 75 mg/dl 4 şeklinde hesaplanır. Hesaplama hatası yapılmamış ise, 75 mg/dl kesin, doğru olan ortalama kolesterol düzeyini gösterir. Tam sayım yapılamadığı durumlarda açıktır ki, yukarıdaki kolesterol düzeyleri (xi değerleri) derlenememiş ve µ=75 mg/dl bilgisi hesaplanamamış olur. Bu durumda µ hakkında tahminleme ve karar verme (istatistiksel çıkarım) problemleriyle karşılaşılır. Bu türden problemlerin çözümlenebilmesi için µ hakkında bilgi üreten örneklem istatistiği gereksinim vardır. X nın örnekleme dağılımının özellikleriyle ilgili bilgilere 167 ̅ ların örnekleme dağılımının oluşturulması için aşağıdaki adımlar izlenir. N=4 birimlik ana kütleden iadeli veya iadesiz seçimle belirlenen n hacimli mümkün örneklemler seçilir. Örneğin n=2 için iadesiz seçimle oluşturulabilecek mümkün örneklem sayısı; C N n N! n !( N n)! C 4 2 4! 6 adet 2!(4 2)! olup aşağıdaki tabloda verilmiştir. Tablo 6.3: N=4 hacimli ana kütleden n=2 hacimli mümkün örneklemlerin ̅ larının örnekleme dağılımı. Örneklem No Mümkün Örneklemler Örneklem Gözlem Değerleri ̅ 1 A, B 90, 80 85 2 A, C 90, 60 75 3 A, D 90, 70 80 4 B, C 80, 60 70 5 B, D 80, 70 75 6 C, D 60, 70 65 450 ̅ lar serisinin dağılımına, ̅ nın örnekleme dağılımı adı verilir. Bu dağılımın ortalaması ̅ simgesiyle gösterilir ve aşağıdaki gibi hesaplanır: N Cn x X i i 1 C N n 450 75 mg/dl 6 Görüldüğü gibi ana kütle ortalaması µ, ̅ nın örnekleme dağılımının ortalaması x ̅ ya eşittir ve 75 mg/dl şeklinde yazılır. Tablo 6.3 teki ̅ lar frekans dağılımı olarak düzenlendiğinde n=2 hacimli farklı örneklem ortalamalarının olasılığı Tablo 6.4 teki gibi gösterilmiş olur. 168 Tablo 6.4: N=4 hacimli ana kütleden n=2 hacimli mümkün örneklemlerin ̅ larının frekans dağılımı. ̅ ni Örneklem Ortalamalarının Elde Edilmesi Olasılıkları 65 1 1/6 = 0,167 70 1 1/6 = 0,167 75 2 2/6 = 0,333 80 1 1/6 = 0,167 85 1 1/6 = 0,166* Toplam 6 1,000 *: Olasılıklar toplamını 1’e eşitlemek için düzeltme yapılmıştır. Tablodaki bilgilere göre, örneğin ̅=75 puan değerini elde etme olasılığı %33,3’tür bilgisi üretilebilir. Örnekleme girecek birimlerin seçimi iadeli yapılmış olsaydı, N=4 birimden, n=2 birimlik Tablo 6.5 teki Nn = 42 = 16 farklı örneklem oluşurdu. 16 farklı örneklem için yukarıdaki işlemler yapılırsa ̅ ların örnekleme dağılımı oluşturulabilir. Bu durumda da x 75 puan olduğu görülebilir. Tablo 6.5: N=4 birimlik ana kütleden iadeli seçimle oluşturulabilecek mümkün örneklemler. A B C D A A, A A, B A, C A, D B B, A B, B B, C B, D C C, A C, B C, C C, D D D, A D, B D, C D, D Özetle; Her örneklem hacmi için bir istatistiğe ilişkin örnekleme dağılımı olduğu düşünülür. Örnekleme birim seçimi iadeli de yapılsa, iadesiz de yapılsa hesaplanan örneklem ortalamalarının dağılımı ana kütle ortalamasına eşit olur. Ancak, hiçbir araştırmada istatistiksel çıkarsama amacıyla yukarıda açıkladığımız işlemler yapılmaz. Bunun yerine, n hacimli tek bir örneklem seçilir, bunun X ortalaması hesaplanır ve örnekleme dağılımı ile ilgili yukarıda açıklanan bilgilerden yararlanılarak µ hakkında çıkarım yapılır. 169 X ‘nın Dağılımının Özellikleri X tesadüfi değişkeninin örnekleme dağılımının özellikleri, bu dağılımın ortalaması µ (ana kütle ortalaması, X nın örnekleme dağılımının ortalaması x ya eşit olduğu için x yerine µ kullanılmıştır) ve standart sapması x (standart hata) ile açıklanır. Standart hatanın karesi ise ortalamalar örnekleme dağılımının varyansı olarak isimlendirilir ve x2 simgesi ile gösterilir. X ‘nın Dağılımının Ortalaması X nın örnekleme dağılımının ortalaması veya aynı anlama gelen, X nın beklenen değeri E ( X ) şeklinde gösterilirse; E( X ) yazılabilir. Bu sonuca göre yapılabilir; X nın örnekleme dağılımının ortalaması ile ilgili aşağıdaki değerlendirmeler X nın örnekleme dağılımının ortalaması ana kütle ortalamasına Örneklem hacmi n arttıkça yaklaşır. Ana kütlenin dağılım şekli çarpık bir dağılım gösterse bile, örneklem hacmi arttıkça dağılımı normal dağılıma yaklaşır. X nın Örneğin, kolesterol ölçümü yapılan hastalarlarla ilgili örnek ele alındığında ve tesadüfi olarak seçilen n=2 hacimli örneklemdeki birimler A ve D birimleri olduğunda örneklem ortalaması; n 2 x x i X= olarak hesaplanır ve µ nün tahmini i 1 n i 1 2 i 90 70 80 mg/dl 2 E ( X ) µ 80 mg / dl şeklinde yazılabilir. X ‘nın Dağılımının Standart Hatası X nın standart sapması veya aynı anlama gelecek şekilde, X nın örnekleme dağılımının standart hatası x simgesiyle gösterilir ve standart hata olarak da isimlendirilir. Standart hata x ortalamanın örnekleme dağılımının değişkenliğini gösterir. Yani, mümkün örneklem ortalamalarının ( X i 'ların) ana kütle ortalamasından farklarının ( X i µ hata) ortalama ölçüsüdür. Standart hatanın karesi ( x ) ise 2 X nın dağılımının varyansını ifade eder. Ana kütle, sonsuz bir ana kütle ise basit tesadüfi örneklemede birim seçimi iadeli seçimle yapılıyorsa örneklem hacmi n 30 birim veya örnekleme oranı n/N 0,05 ise x aşağıdaki eşitlik yardımıyla hesaplanır. x Bu eşitliklerden n x nın özellikleri ile ilgili aşağıdaki değerlendirmeler yapılabilir. Standart hata ana kütle standart sapması σ ya ve örneklem hacmi n’e bağlıdır. Bir başka ifadeyle ana kütle değişkenliği σ büyük ise herhangi bir örneklem hacmi için x da büyük olur. 170 Örneklem hacmi arttıkça, örneklem istatistiğinden yararlanarak µ hakkında daha az hatalı, daha güvenilir bilgi üretmek mümkün olur. Örneklem hacminin karekökü ile artırdıkça x x arasında ters yönde ilişki vardır. Yani örneklem hacmini küçülür. Ancak örneklem hacmini artırarak x yı düşürmeye çalışmak örnekleme başvurmayı gerekli kılan nedenlerden dolayı bazı güçlüklere yol açar. Örneğin n=100 birim iken X standart sapmasını yarıya indirebilmek için örneklem hacmi 4 kat artırılmalıdır. Ana kütle standart sapması genellikle bilinmediğinden x hesaplanırken yerine onun yansız bir taminleyicisi olan örneklem standart sapması s kullanılır. Bu durumda standart hata s x simgesiyle s eşitliğiyle hesaplanır. Burada “s” hesaplanan örneklem standart sapma değeri n serinin değişkenlik ölçüsüdür. Ancak ana kütlenin standart sapması ( ) tahmini amacıyla kullanılacağı gösterilir ve s x zaman örneklem standart sapması hesaplanırken formülde payda da n yerine n-1 yazılarak hesaplanır. Örneklem standart sapması, n (x X ) s i 1 2 i n Ana kütle standart sapması tahmini için hesaplanan örneklem standart sapması ise, n s (x X ) 2 i i 1 n 1 şeklinde hesaplanır. Eğer ilgilenilen ana kütle sonlu bir ana kütle ve örnekleme oranı n/N hesaplanırken 0,05 ise standart hata N n şeklindeki bir çarpan, düzeltme faktörü olarak kullanılır ve standart hata N 1 hesaplanması x n . N n N 1 veya s x s n N n N 1 eşitlikleriyle yapılır. Basit tesadüfi örneklemede örneklem hacmi arttıkça X nın örnekleme dağılımı normal dağılıma yaklaşır. Bu sonuca, istatistikte önemli bir yeri olan aşağıdaki teorem yardımıyla ulaşılır: Merkezi Limit Teoremi Ana kütlenin dağılım şekli ne olursa olsun, örneklem hacmi büyüdükçe, X nın örneklem dağılımı normal dağılıma yaklaşır. Bu dağılımın ortalaması µ, varyansı / n dir. Örneklem hacmi n için yeterli büyüklük,kesin olmamakla birlikte uygulamada n 30 birim olarak kabul edilmektedir. 171 Eğer X ortalaması µ ve varyansı olan normal dağılımlı bir ana kütleden seçilmiş n hacimlik basit bir tesadüfi örneklemin ortalaması ise, ortalamalar örnekleme dağılımı, ortalaması µ ve varyansı olan bir normal dağılımdır. /n X tesadüfi değişkeninin dağılımı normal olduğunda, z i Xi / n Eşitliğiyle standart değişkene dönüştürülür. Böylece, normal dağılımın özellikleri kullanılarak örneklem aritmetik ortalamasından ana kütle aritmetik ortalaması hakkında bilgi üretmek kolaylaşır. Normal dağılan bir ana kütleden, tesadüfi olarak seçilebilecek birbirinden farklı mümkün bütün örneklemlerin seçildiğini, her örneklem için X i değerlerini hesaplandığını düşünelim. Değerler aralığı X s birimlik X i ları ve onların standart s x olan istatistiğin dağılımı x (n 1) serbestlik derecesi (sd = n-1) ile t dağılımı adı verilen sürekli bir dağılım gösterir ve bu istatistik t X s x şeklinde hesaplanır. t dağılımı ortalaması sıfır olan tek modlu ve simetrik bir dağılımdır. Dağılımın şekli standart normal dağılıma benzer fakat değişkenliği daha büyüktür. Bu değişkenlik serbestlik derecesi ile ters orantılıdır. Örneklem hacmi artarken, (sd = n-1) büyür, t değerinin hesaplanmasında s x nın kullanılması nedeniyle ortaya çıkan değişkenlik küçülür ve t dağılımı standart normal dağılım (z dağılımına) yaklaşır. t örnekleme dağılımının özelliklerinden yararlanarak ana kütle ortalaması µ ile ilgili bilgilerin nasıl üretileceği de izleyen ünitede örneklerle açıklanacaktır. Örnek 6.16: Bir hastanede belirli bir hastalıktan şikayetçi olarak hastaneye yatan hastaların ortalama olarak kaç gün kaldıkları tahminlenmek isteniyor. Bu amaçla tesadüfi olarak n=100 hasta seçiliyor. Seçilen bu hastaların ortalama kalış süresi 5,4 gün ve standart sapması 2 gün olarak hesaplanmıştır. Bu hastanede daha önce yapılan araştırmalara göre hastaların ortalama kalış süresinin 6,4 gün olduğu bilinmektedir. Bu bilgileri kullanarak; X nın örnekleme dağılımının ortalaması nedir? Hesaplayınız. İstenen tahminleme yapılırken işlenebilecek hata nedir? Hesaplayınız. X nın standart z değerini hesaplayınız. Çözüm 16: E ( X ) 5, 4 gün hasta bilinmediği için) olduğu için standart hata (ana kütle standart sapması s x s 2 2 0, 2 gün 10 n 100 172 hesaplanır. Hastaların ortalama kalış süresini yukarıdaki verilere göre tahminlerken işlenebilecek hata düzeyi 0,2 gündür bilgisi elde edilebilir. Z X s x 5, 4 6, 4 5 0, 2 Örneklem Oranı p’nin Örnekleme Dağılımı Örnekleme planlarında ele alınan ana kütlenin araştırılmak istenen değişkenin düzeyleri (şıkları) iki, üç dört,…… sayıda olabilir. Uygulamalarda çoğunlukla ilgilenilen değişken iki düzeye sahip olmaktadır. Örneğin bir fabrikada üretilen ürünler, hatalı ya da hatasız ürün, bir fakültedeki öğrenciler, başarılı ya da başarısız öğrenci olmak üzere iki grupta toplanabilir. Bu iki sonuçtan birinde örneğin A sonucunda yer alan birimlerin oranıyla ilgilenilebilir. Bu durumda ana kütle oranı ana kütlenin birimleri içindeki ilgilenilen türden özelliğe sahip olanların oranı biçiminde tanımlanır. Örnek 6.17: Y sınıfındaki öğrencilerin genel başarı durumu aşağıda verilmiştir. Bu sınıfın başarılı öğrenci oranı nedir? ÖĞRENCİ ADI BAŞARI DURUMU A Başarılı B Başarısız C Başarılı D Başarılı Örnekte sınıftaki başarılı öğrenci oranı, ana kütle oranıdır ve П ile gösterilir. Bu ana kütledeki ilgilenilen türden özelliğe sahip (başarılı) birim (öğrenci) sayısı R ile gösterilirse, ana kütle oranı П, Eşitliği ile hesaplanır. Burada R = 0, 1, 2, … , N değerlerini alabileceği için nin değer aralığı olur. Sınıftaki başarısız öğrenci saısı (ilgilenilmeyen türden özelliğe sahip birim sayısı) NR olduğu için, başarısız öğrenci oranı Q, Olur. Yukarıdaki örnekte başarılıöğrenci sayısı, R=3 olduğu için = Olarak bulunur. Bu sonuca göre sınıftaki öğrencilerin %75 i başarılıdır. Bu kesin bir sonuçtur. Tam sayım yapılamadığı zaman R bilinemez ve hesaplanamaz. Örnekleme planlarında parametresi hakkında bilgi, bu parametre hakkında bilgi reten örneklem istatistiklerinden yararlanılarak üretilebilir. Hacmi n olan bir basit tesadüfi örneklemden, bu örneklemin seçildiği ana kütlenin parametresi hakkında bilgi üretebilmek için iki örneklem istatistiği söz konusudur. Birincisi, hacmi n olan bir basit tesadüfi örneklemdeki ilgilenilen türden özelliğe sahip olan birimlerin sayısıdır ve r ile gösterilir. İkincisi, 173 ilgilenilen türden özelliğe sahip olan örneklemdeki birimlerin oranıdır. Örneklem oranı p simgesiyle gösterilir ve p= eşitliği ile hesaplanır. Burada r =0, 1, 2, … , n değerlerini alabilir. r’nin değerlerine bağlı olarak p de aralığında bir değer alır. Örneklemi oluşturan birimler arasında ilgilenilen türden sonuca sahip olmayan birimlerin oranıysa q ile gösterilir. Bu sonuca sahip birimlerin sayısı n- r olduğu için, olur. Yukarıda verilen örnekte ele alınan N=4 birimlik bir ana kütleden basit tesadüfi örneklemeyle hacmi n=2 olan bir örneklem seçildiğinde ve örneklemdeki birimler öğrenci B ve C olduğunda başarılı öğrenci oranı, olarak hesaplanmış olur. Öte yandan, ana kütle oranına ilişkin varyans, şeklinde ifade edilir. Varyansın karekökü de standart sapmayı verdiğinden, π (1 π) şeklinde yazılır. örneklem varyansı ve standart sapması da benzer şekilde sırasıyla s 2 p (1 p) ve s p (1 p) olarak gösterilir. İki sonuçlu bir ana kütleden, mümkün bütün n hacimli basit tesadüfi örneklemlerin seçildiğini ve her örneklem için p oranının hesaplandığı varsayıldığında pi oranlarından oluşan bir dağılım elde edilir. Bir ana kütleden seçilebilecek aynı hacimli mümkün bütün örneklemler için hesaplanan örneklem oranlarının oluşturduğu dağılıma oranların örnekleme dağılımı adı verilir. Örnekleme planlarında tanımlanan ana kütleden tesadüfi olarak n hacimli sadece tek bir örneklem oluşturulur ve bu örneklem için p oranı hesaplanır. Bu p oranı bir rasal değişkenin gerçekleşen bir değeridir. Buna göre P tesadüfi değişkeninin çekilmesi mümkün bütün n hacimli örneklemlerde aldığı değerlerin dağılımına “oranların örnekleme dağılımı” adı verilir. Ortalama ve Varyans Ana kütle oranı hakkında araştırılmak istenin bilgi n hacimli tek bir örneklem için hesaplanan p istatistiğine değil, bir tesadüfi değişken olan p istatistiğinin örnekleme dağılımının özelliklerinden yararlanılarak üretilir. Bu dağılımın özellikleri dağılımın aritmetik ortalaması ve varyansıyla belirlenebilir. 174 Sonsuz bir ana kütleden seçilen n hacimli basit tesadüfi örneklem için hesaplanan p oranının örnekleme dağılımının aritmetik ortalaması µp ana kütle oranı ye eşittir. Bu durum örneklem oranı p’nin ana kütle oranı nin yansız (sistematik hata içermeyen) tahminleyicisi olduğunu göserir. Bu sonuca göre, p’nin beklenen değeri E(p) = yazılır. Sonsuz ana kütlelere ya da örnekleme oranı n/N 0,05 olan bütün sonlu ana kütlelere uygulanan basit tesadüfi örnekleme planlarında örneklem oranı p nin dağılımının varyansı gösterilir. ve standart hatası da ile Oranlar örnekleme dağılımının statndart sapması; Eğer ana kütle varyansı biliniyorsa, p eşitlikleriyle, ana kütle varyansı π (1 π) n bilinmiyorsa, sp p (1 p) n eşitlikleriyle hesaplanır. Dağılım Şekli ve Merkezi Limit Teoremi Oranların örnekleme dağılımının şekli eğer E(p) = < 0,5 ise sağa çarpık, E(p) = > 0,5 ise sola çarpık ve E(p) = = 0.5 ise simetrik bir dağılım gösterir. Kolaylıkla görülebileceği gibi, E(p) = nin değeri 0 ve 1 e yaklaşırken dağılımın çarpıklığı artar. Merkezi limit teoremine göre bir örnekleme planında seçilen basit tesadüfi örneklemin hacmi n büyürken örneklem oranı p’nin örnekleme dağılımı normal dağılıma yaklaşır. Uygulamada (n 5 ve [n (1- )] 5 koşullarını birlikte sağlayan örneklem büyüklüğü, yeterli örneklem büyüklüğü olarak birim olması ve ana kütle oranı nin kabul edilir. Aynı teoreme göre tesadüfi örneklem hacmi 0 ya da 1 e yakın değerler almaması koşuluyla oranların örnekleme dağılımı normal dağılıma yaklaşır. Bu koşulları sağlayan oranların örnekleme dağılımıyla ilgili problemlerin çözümlerinde normal dağılımın özelliklerinden yararlanılır. Bu amaçla örneklem oranı p standartlaştırılmış Z değişkenine Z= şeklinde dönüştürülerek çeşitli olasılıklar hesaplanabilir ve istatistiksel çıkarımlar kolayca yapılır. Örnekleme dağılımı kavramını açıklayınız. Merkezi limit teoremi istatistiğe ne tür kolaylıklar getirmiştir, açıklayınız. 175 Örnek 6.18: Bir hastaneye çeşitli hastalık şikâyetleri nedeniyle yılda 8000 kişi başvurmuştur. Hastane yönetimi ilgili yılda hastaneye başvuranlardan yataklı tedavi görenlerin oranları tahminlemek amacıyla 100 başvuru tesadüfi olarak seçiyor. Seçilen başvuruların 15 tanesinin yataklı tedavi gören hasta olduğu belirlenmiştir. Bu verileri kullanarak istenen tahminleme yapılırken işlenecek hata düzeyi nedir? Çözüm 6.18: Bilindiği gibi, tahminleme yaparken işlenebilecek hata düzeyini belirleme imkânı veren istatistik standart hatadır. Bu; sP P (1 P) n eşitliği ile hesaplanır. Burada; ve sP 0,15 . 0,85 0,127 0, 032 100 100 Bu bilgilere göre, söz konusu hastaneye başvuran hastaların içerisinde yataklı tedavi gören hasta oranını tahminlerken işlenebilecek hata düzeyi ortalama olarak SP = 0,032 gün olacaktır. Örneklem Hacminin Belirlenmesinde Nicel Yöntemler Karşılanabilecek Maliyeti Esas Alan Yöntem: Örneklem hacmi n, araştırma bütçesine bağlı olarak, n eşitliği ile hesaplanır. Burada, C = Araştırma bütçesini, = Araştırmanın sabit maliyetini, = Örnekleme birimi için değişken maliyeti gösterir. Örnek 6.19: Araştırma bütçesinin 2200 TL. ile sınırlı olduğu bir araştırmada, sabit maliyet 800 TL. ve örnekleme seçilecek her örnekleme birimi için maliyet ise 5 TL. dır. Bu bütçeyle oluşturulabilecek örneklem hacmi en fazla ne olabilir? Çözüm 6.19: n 280 birim Örneklem hacmi en az 280 birim olmalıdır. Kabul Edilebilir Hata Düzeyini Esas Alan Yöntem: Örneklem istatistiğinin dağılımının normal olduğu varsayımı altında bu yöntemle örneklem hacminin belirlenmesi için aşağıdaki eşitlikten yararlanılır. 176 Kabul Edilebilir Hata Düzeyi ( X µ) d Olduğunda; Kabul Edilebilir Hata Düzeyi ( n Olduğunda; z 2 [ (1 )] d2 Bu eşitliklerde = Örneklem hacmini d ( X µ) veya ( = Belirlenen 1 araştırmacının belirlediği kabul edilebilir değeri güven düzeyinde standart normal dağılım tablo değerini σ = Standart sapmayı = Ana kütle oranını gösterir. Örneğin, kabul edilebilir hata düzeyi d ( X µ) esas alındığında örneklem hacminin eşitliği ile hesaplanabilmesi için araştırmacının α anlamlılık düzeyini ve değerini belirlemesi ve ana kütle varyansı hakkında bilgiye sahip olması gerekir. Ana kütle varyansı genellikle bilinmez. Bu durumda, ile ilgili bilgi geçmiş yıllarda yapılmış olan aynı ya da benzer konudaki çalışmalardan elde edilebileceği gibi, bir pilot çalışmadan ya da en büyük değerli gözlem değeri xenb ve en küçük değerli gözlem değeri xenk biliniyorsa ve xi tesadüfi değişkeni normal dağılıyorsa, α=0,01 için tahmincisi kullanılarak da hesaplanabilir. Örnek 6.20: Bir araştırmacı X ilinin merkeç ilçesinde ikamet eden ailelerin ortalama aylık mutfak harcama tutarını tahminlemek istiyor. Ayrıca bu tahminlemede 0,05 anlamlılık düzeyinde 10 TL’lik bir yanılgı payı amaçlıyor. Örneklem hacmi ne olmalıdır? Benzer amaçla bu il merkezinde yapılan araştırmalardan ailelerin aylık mutfak giderleriyle ilgili standart sapmanın 150 TL olduğu öğrenilmiştir. Çözüm 20: d = 10 TL. z = 1,96, α= 0,05 σ= 150 TL. n 864.36 865 birim en az 865 aile tesadüfi olarak seçilmelidir. 177 Özet Örneklemden derlenen veriler için araştırmada istenen bilgileri üreten istatistikler; örneklem aritmetik ortalaması, örneklem oranı vb. gibi istatistikler hesaplanır. Bu istatistikler ve bu istatistiklerle ilgili dağılımın özellikleri kullanılarak bu istatistiklerin bilgi ürettiği parametreler; ana kütle aritmetik ortalaması µ, ana kütle oranı π için gerekli çıkarım bilgileri üretilebilir. Ana kütle sonlu ana kütle ise gerekli bilgilerin üretilebilmesi için tam sayım yapılabilir veya örneklemeye başvurulur. Araştırma için gerekli zamana, ekonomik imkanlara ve araçlara sahip olunduğunda tam sayım yapılmalıdır. Çünkü tam sayım sonucu elde edilen verileri kullanarak hesaplanan bilgiler kesin bilgilerdir. Tanımlanan ana kütle sonsuz ana kütle ise, örnekleme zoruludur. Tam sayım uygulamasının imkansız, örneklemeye başvurmanın gerekli olduğu durumlarda örneklemeye başvurmak kaçınılmazdır. Örneklemeye başvurulduğunda araştırmacı zaman ve ekonomik tasarruf sağlar. Ayrıca tam sayım yapmayı engelleyen diğer nedenlerin varlığında örnekleme araştırma yapmaya imkan verir. Örnekleme planı beş aşamalı bir süreçtir. Bu aşamalarda araştırmacı araştırma yapacağı ana kütleyi tanımlar. Bu ana kütle sonlu ana kütle olduğunda ana kütle ile ilgili güncel bir çerçeve hazırlar veya belirli bir kaynaktan nasıl temin edilebileceğini belirler. Daha sonra olasılıklı ve olasılıklı olmayan örnekleme yöntemlerinden hangisini temsili bir örneklem oluşturma amacıyla araştırmasında kullanacağına karar verir. Seçilecek örneklem hacminin ne olacağını belirler ve örnekleme uygulaması sonucu oluşturduğu örneklemdeki birimler üzerinden araştırmaya konu olan değişkenler itibariyle veriler derlenir. 178 Kendimizi Sınayalım 1. Bir örneklemin özelliklerine ilişkin değerlere ne ad verilir? b. Ana kütle 5. X tesadüfi değişkeni, ortalaması (µ) 50 ve standart sapması (σ) 10 olmak üzere normal dağılmıştır. Buna göre, hacmi n=100 olan örneklemin ortalaması X 55 değerinin standart normal değeri (z) kaçtır? c. Anlamlı fark a. 0,5 d. Örnekleme b. 1 e. Parametre c. 1,5 2. Bir ana kütleden rastgele seçilen birden fazla örneğin sonuçlarının birbirinden farklı olduğu gözlenmiştir. d. 2 Bu farklılığın nedeni aşağıdakilerden hangisidir? 6. Örneklem oranının aşağıdakilerden hangisidir? a. Örnek istatistiği e. 5 a. Beklenen frekans değer aralığı a. b. Yöntem farklılığı b. c. Örnek değişkenliği c. d. Örnek istatistiği d. e. Parametre e. 3. İki sonuçlu bir ana kütleden, mümkün n hacimli basit tesadüfi örneklemlerin seildiğini ve her iki örneklem için p oranı hesaplandığı varsayımı altında, lerin dağılımına (i=1, 2, … , n) ne ad verilir? 7. Bir örneklemin gözlem değerleri için hesaplanan karakteristik değerlere ne ad verilir? a. Ortalama a. Oranların örnekleme dağılımı b. İstatistik b. Örneklem istatistiği c. Frekans c. Binom dağılımı d. Anlamlı fark d. Normal dağılım e. Parametre e. Ortalamaların örnekleme dağılımı 8. Aşağıdakilerden hangisi, tam sayım yapmayı engelleyen nedenlerden biri değildir? 4. Aşağıdakilerden hangisi olasılıklı örnekleme yöntemlerinden biri değildir? a. Maliyet a. Tabakalı örnekleme b. Ölçüm için birimlerin tahrip edilmesi olasılığı b. Basit tesadüfi örnekleme c. Ana kütle hacminin küçük olması c. Kartopu örneklemesi d. Zaman d. Küme örneklemesi e. Ana kütle hacminin sonsuz sayıda olması e. Sistematik örnekleme 179 9. Tabaka hacimleri sırasıyla 50, 250 ve 200 birimden oluşan bir ana kütleden kota örneklemesiyle 50 birimlik örneklem oluşturulmak istenmektedir. Bu örneklem hacmi tabaka hacimlerinin ana kütle içindeki paylarıyla orantılı olarak dağıtılırsa üçüncü sıradaki tabakadan seçilecek birim sayısı kaç olmalıdır? Kendimizi Sınayalım Yanıt Anahtarı 1. a Cevabınız yanlışsa “Tam Sayım ve Örnekleme” tanımlarını yeniden gözden geçiriniz. 2. c Cevabınız yanlışsa “Olasılıklı Örnekleme ve Örnekleme Dağılımı” konularını yeniden gözden geçiriniz. a. 4 b. 15 3. a Cevabınız yanlışsa “Oranların Örnekleme Dağılımı” tanımını yeniden gözden geçiriniz. c. 20 d. 35 4. c Cevabınız yanlışsa, “Olasılıklı ve Olasılıklı Olmayan Örnekleme” tanımlarını yeniden gözden geçiriniz. e. 40 10. Ana kütle hacmi küçük olduğunda, örnekleme seçilen bir birimin diğerlerinin seçilme şansını etkilememesi için aşağıdaki seçim yöntemlerinden hangisi kullanılır? 5. e Cevabınız yanlışsa, “Ortalamanın Örnekleme Dağılımının özelliklerini” yeniden gözden geçiriniz. 6. a Cevabınız yanlışsa, “Oranların Örnekleme Dağılımının Özellikleri” ile ilgili bilgileri yeniden gözden geçiriniz. a. Tesadüfi b. Kolayda c. Kartopu ve sistematik birlikte 7. b Cevabınız yanlışsa, “Örneklem ve Örneklemenin Amaçları” ile ilgili bilgileri yeniden gözden geçriniz. d .Keyfi ve sistematik birlikte e. Keyfi 8. c Cevabınız yanlışsa, “Örnekleme Başvurma Nedenlerini” yeniden gözden geçiriniz. 9. c Cevabınız yanlışsa, “Kota Örneklemesi uygulaması” ile ilgili açıklamaları yeniden gözden geçiriniz. 10. a Cevabınız yanlışsa, “Keyfi ve Tesadüfi Seçim” uygulamalarıyla ilgili açıklamaları yeniden gözden geçiriniz. 180 Sıra Sizde Yanıt Anahtarı Sıra Sizde 5 Sıra Sizde 1 Tam sayım yapılamaz. Çünkü hastaneye gelen hastalar ana kütleyi sonsuz ana kütledir. Örnekleme giren birimlerin tesadüfi olarak seçilmesi ve örneklemin temsil örneklem olması durumunda örneklem istatistikleri ana kütle parametreleri için bilgi niteliğindedir. Örneklemin temel amacı temsili örneklem oluşturmaktır. Sıra Sizde 2 Tam sayım yapmayı imkansız kılan nedenler söz konusu olmadıkça ve kesin bilgi istediği sürece tam sayım yapılır. Yararlanılan Kaynaklar Fink, A. (1995). How To Sampling in Surveys, London: Sage Publication. Her ne kadar tam sayım için gerekli koşullar mümkün ise de örneklemeye başvurulur. Çünkü, öğrencilerin bazılarına ulaşmak imkansız olabilir, ulaşılsa bile bazıları bilgi vermeyebilir. Gürsakal, N. (1997). Bilgisayar Uygulamalı İstatistik 1, Bursa: Marmara Kitabevi. Malhotra, N. K. (1996). Marketing Research An Applied Orientation, New Jersey: Prentice Hall International. Sıra Sizde 3 Neter, J., Wasserman, W., Whitmore, G. A. (1993). Applied Statistics, Boston: Simon and Schuster. Yargısal örnekleme daha temsili örneklem oluşturur. Çünkü, bu örnekleme uygulamasında örnekleme birim seçimini yapacak kişi incelenecek ana kütle ile ilgili temsili örneklem oluşturma bakımından öncül bilgilere sahiptir. Serper, Ö., Aytaç, M. (2000). Örnekleme, Bursa: Ezgi Kitabevi Serper, Ö. (1986). Uygulamalı İstatistik 2, İstanbul: Filiz Kitabevi Kota örneklemesi seçilir. Sıra Sizde 4 N sonlu bir ana kütleden tesadüfi olarak n hacimli bir örneklem değil de mümkün aynı hacimli bütün örneklemleri seçtiğimiz ve her örneklem için bir istatistik hesapladığımızda meydana gelen dağılıma örnekleme dağılımı denir. Bu teorem herhangi bir örnekleme uygulamasında hesaplanan n hacimli bir örneklem için hesaplanan istatistiğin dağılım şekli ve özellikleri ile ilgili ispatlanmış bilgileri verdiği için istatistiksel çıkarımlar bu teoreme dayandırılmaktadır. Tryfos, P. (1996). Sampling Methods for Applied Research, New York: John Wiley and Sons Inc. Temel fark, olasılıklı olmayan örnekleme yöntemlerinde birim seçimi keyfi yapılırken bu örneklem uygulamaları ile oluşturulan örneklem için hesaplanan istatistiklerin ana kütle parametreleri hakkında genelleme yapmak amacıyla kullanılmamasıdır. Olasılıklı örnekleme uygulandığında birim seçimi tesadüfi yapılır ve örneklem istatistikleri parametreler hakkında genelleme amacıyla kullanılır. Trochim, W. M. (2001). Research Methods Knowledge Base, Cornell University. Hirsch, W. Z. (1963). Introduction to Modern Statistics, New York: The Macmillan Company 181 7 Amaçlarımız Bu üniteyi tamamladıktan sonra; İstatistiksel tahmin ve hipotez testi kavramlarını açıklayabilecek, Bir hipotez testi problemini aşamalarıyla gerçekleştirebilecek, Varyans analizi problemlerini çözümleyebilecek, Ki-Kare analizini gerçekleştirebilecek bilgi ve becerilere sahip olabilirsiniz. Anahtar Kavramlar İstatistiksel tahmin Ki-kare testi Güven aralığı I. ve II. Tip hata Hipotez testi Anlamlılık düzeyi Varyans analizi Serbestlik derecesi İçindekiler Giriş İstatistiksel Tahmin Hipotez Testleri Tek-Yönlü Varyans Analizi Ki-Kare 2 Testi 182 İstatistiksel Tahmin ve Hipotez Testleri GİRİŞ İstatistiksel tahmin ve örnekleme iç içe kavramlardır. Ana kütleyi oluşturan birimlerin sayısının çok fazla olması durumunda çeşitli nedenlerden dolayı birimlerin tamamına ulaşılamadığında örneklemeye başvurmanın gerekliliği önceki bölümde belirtilmişti. Örneklem istatistiklerine dayanarak ana kütle parametrelerine ilişkin çıkarsama yapma, örnekleme yaklaşımı olmakla birlikte bir tahmin işlemidir. İstatistiksel tahmin belirli bir ana kütleden tesadüfi olarak alınan örneklemden yararlanarak, ana kütlenin belirli bir parametresi ya da parametrelerinin değerinin araştırılması işlemidir. Dolayısıyla ana kütle parametreleri, örneklem istatistikleri yardımıyla tahmin edilmektedir. Tahmin işlemi istatistiğin çıkarsama işlevi ile ilgilidir. İstatistiksel tahmin gibi örneklem istatistiklerinden yararlanarak ana kütle parametrelerine ilişkin hipotezlerin test edilmesi çıkarsama işlevinin bir başka konusudur. Hipotez testlerinde araştırmanın amacına göre kullanılacak uygun testin seçimi oldukça önemli bir konudur. Kullanılacak testin koşullarının sağlanıp sağlanmamasına göre testin seçimi önem kazanır. Buna göre testler parametrik ve parametrik olmayan biçiminde iki gruba ayrılır. Parametrik testler, bazı varsayımları gerektiren testlerdir ve incelenen değişkenin en az aralıklı ölçme düzeyinde ölçülmüş olmasını gerektirirler. Parametrik olmayan testler, iddialı varsayım ileri sürmezler ve genellikle sınıflayıcı ve sıralayıcı ölçme düzeyindeki verilere uygulanırlar. Bu ünitede açıklanan t-testi, z-testi ve varyans analizi parametrik testlerdir. Ki-Kare testi ise parametrik olmayan testlerdendir. t-testi ve z-testi tek ve iki ana kütle aritmetik ortalamasına ilişkin testlerdir. İkiden çok ana kütle ortalamasına ilişkin test ise varyans analizi olarak adlandırılmaktadır. Ki-Kare testi iki ya da daha fazla grubun sınıflayıcı veya sıralayıcı ölçme düzeyinde ölçülmüş değişken bakımından farklılığını araştıran bir testtir. Bir araştırma probleminin çözümlenmesinde kullanılacak tekniğin seçiminde değişkenlerin hangi ölçekle ölçülebileceğinin belirlenmesinin önemli olduğu ilk ünitede belirtilmişti. Sınıflayıcı ve sıralayıcı ölçekle ölçülebilen değişkenlerden elde edilen verilerle parametrik olmayan tekniklerden, aralıklı ve oranlı ölçekteki verilerle hem parametrik olmayan hem de parametrik tekniklerden yararlanılabilir. Bu ünitede istatistiksel tahmin ve parametrik hipotez testleri konuları ele alınacaktır. Parametrik olmayan testlerden sadece Ki-Kare testine yer verilecektir. İSTATİSTİKSEL TAHMİN Bir ana kütle parametresinin değerinin örneklem istatistiğinden yararlanarak belirlenmeye çalışılması istatistiksel tahmindir. İstatistiksel tahminde “nokta tahmin” ve “aralık tahmini” olmak üzere iki tür tahmin söz konusudur. Nokta (Tek Değer) Tahmin Ana kütle parametresini çekilen örneklemden elde edilecek örneklem istatistiğinden hareketle tek bir değerle tahmin etmek nokta tahmin(tek değer tahmin) olarak adlandırılır. Genel gösterim olarak ana kütle parametresi “ ”, örneklem istatistiği ise “T” simgeleri ile gösterilecektir. Örneğin; bir ana kütle aritmetik 183 ortalaması tahmin edilmek istendiğinde örneklem ortalaması x , ana kütle oranı istendiğinde p , ya da ana kütle varyansı 2 tahmin edilmek tahmin edilmek istendiğinde örneklemden hesaplanan s2 yardımıyla nokta tahmin işlemi gerçekleştirilir. Nokta tahmininde genel olarak ana kütle ortalaması, ana kütle oranı ya da bunlar arasındaki farklar için tahmin yapılır. Sözü edilen tahminlerde kullanılacak eşitlikler aşağıdaki gibi gösterilebilir. n ˆ X x i 1 i n n r ˆ p n 2 2 s (x X ) i 1 2 i n 1 Nokta tahmin işleminin başarılı sayılabilmesi için nokta tahmininin belirli bazı özelliklere sahip olması gerekir. Bu özellikler tahminleri değerlendirmede kullanılan ölçütler olarak da nitelendirilmektedir. Nokta tahmininin “sapmasızlık”, “tutarlılık”, “etkinlik” ve “yeterlilik” olmak üzere dört özelliğinden söz edilir. Sapmasızlık bir ana kütle parametresinin tahmincisi olan örneklem ortalamasının bu parametreye eşit olması özelliğidir. Sapmasızlık şu şekilde de açıklanabilir: eğer örneklem istatistikliğinin beklenen değerinin tahmin edilmek istenen ana kütle parametresine eşit ise, söz konusu istatistik ana kütle parametresinin sapmasız bir tahminidir. Sözü edilen eşitlik gerçekleşmiyorsa tahmin yanlı olacaktır. Örneğin E x ifadesi örneklem ortalamasının ana kütle ortalamasının sapmasız bir tahmin olduğunu göstermektedir. Örneklem hacmi n, ana kütle hacmine yaklaşacak biçimde arttırıldığında örneklem istatistiğiyle ana kütle parametresi arasındaki farkın azalarak sıfıra yaklaştığı görülür. Bu durumda tahmin tutarlı bir tahmin olarak değerlendirilir. Tutarlılık özelliği “ ” çok küçük pozitif bir sayı olmak üzere, lim Pr T 1 biçiminde gösterilebilir. Etkinlik tahminlerin örnekleme dağılımının n N varyansı ile ilgilidir. Bir ana kütle parametresinin alternatif tahminleri arasında varyansı küçük olanın etkin olduğu ifade edilmektedir. Örneğin ana kütle aritmetik ortalamasının iki tahmincisi örneklem ortalaması ve medyanıdır. Bu tahminciler hem sapmasız hem de tutarlılık özelliklerine sahiptir. Örneklem hacmi n yeterince büyük olduğunda aritmetik ortalamaların örnekleme dağılımının varyansı 2 , n 2 medyanlarınki ise dir. “ =3,14” olduğundan örneklem aritmetik ortalaması, varyansı daha n küçük olduğundan örneklem meydanına göre daha etkin bir tahmincidir. Yeterlilik özelliği, tahmin değerinin hesaplanmasında örneklem verilerinin tamamının kullanılıp kullanılmadığı ile ilgilidir. Örneklem verilerinin tamamının kullanılması ilgili tahminin yeterli olduğunu göstermektedir. Bilindiği gibi örneklem ortalamasının hesaplanmasında tüm örneklem verileri, mod ve medyanın hesaplanmasında ise bazı örneklem verileri kullanılmaktadır. Bu durumda örneklem ortalamasının yeterli bir tahminci olduğu görülmektedir. Aralık Tahmini Nokta tahmin, ana kütle parametresinin tahmininde kullanılan genel bir yaklaşımdır. Ancak kesin değildir. Dolayısıyla, gerçekleştirilen bir nokta tahmini sonucunda tahminin gerçek parametre değerine ne kadar yakın olduğu bilinemez. Bundan dolayı güvenilir bir tahmin yapma gerekliliği doğar. Güvenilirliğin somut olarak ortaya konulması için “güven aralığı” kavramı geliştirilmiştir. Bu nedenle güvenilir bir tahmin yapılabilmesi için aralık tahmini yaklaşımı geliştirilmiştir. Ana kütle parametresinin değerinin örneklem istatistiğinden hareketle bir aralık biçiminde tahmin edilmesi “aralık tahmin” olarak tanımlanır. Aralık tahmininde, ana kütle parametresinin belirli bir olasılık düzeyinde içerisinde yer alabileceği simetrik bir aralık belirlenir. Belirtilen olasılık düzeyi, tahminin doğruluğundan ne kadar emin olunacağını belirtir ve aralığı oluşturan güven sınırlarının belirlenmesinde kullanılır. Aralık tahmininde oluşacak aralığa “güven aralığı”, aralığın alt ve üst sınır değerlerine ise “güven sınırları” adı verilir. Bilindiği gibi bir ana kütleden çekilen “n” birimlik mümkün örneklemlerin 184 içerisinde bir tanesi tesadüfi olarak çekilir ve elde edilen verilerden hareketle ana kütle hakkında çıkarsama yapılmaktadır. Herhangi bir ana kütleden çekilen farklı örneklemler için hesaplanan güven aralıklarının bir kısmı değeri araştırılan ana kütle parametresini kapsamaz. Dolayısıyla ana kütle parametresinin tahmininde güven aralığı yaklaşımı kullanıldığında, yapılan tahminin doğruluk derecesi, yani hesaplanan güven aralığının ana kütle parametresini içermesi olasılığı (1-α) belirlenebilmektedir. Bu olasılık “güven düzeyi” olarak adlandırılır. Burada α tahminin hata payını ifade etmektedir. Böylece yukarıda belirtildiği gibi, aralık tahminini oluşturan güven sınırları güven düzeyine göre belirlenmektedir. Örneğin, aralık tahminin %95 olasılıkla (güven düzeyinde) yapılması, belirlenen güven aralığının ana kütle parametresini içermesi olasılığı 0,95 olacaktır. Aralık tahmininde güven aralığının genişliğini güven düzeyi belirler: güven düzeyi yükseldikçe güven aralığı genişler. Buna bağlı olarak doğru tahmin yapma şansı artar, ancak tahminin duyarlılığı azalır. Bundan dolayı, güven aralığının mümkün olduğunca dar tutulması arzulanır. Bunun için ya güven düzeyi düşürülür ya da tahminin standart hatası küçültülmeye çalışılır. Örneklem hacminin mümkün olduğu kadar büyütülmesiyle standart hata küçültülebilir. Uygulamada genellikle alışkanlığa bağlı olarak 0,95 ve 0,99 güven düzeyleri kullanılmaktadır. İzleyen kesimlerde ana kütle aritmetik ortalaması, ana kütle oranı, ortalamalar arasındaki fark ve oranlar arasındaki fark için güven aralıkları incelenecektir. “Güven aralığı” kavramını açıklayınız ANA KÜTLE PARAMETRESİNİN ARALIK TAHMİNİ Aralık tahmininde ana kütle parametresinin güven sınırlarının belirlenmesinde ilgili örneklem istatistiğinin örnekleme dağılımının şeklinin bilinmesine gereksinim vardır. İlgili ana kütle parametrelerine ilişkin güven sınırları güven düzeyi de belirtilerek aşağıdaki genel biçimiyle ifade edilebilir: Pr (Alt sınır< < Üst sınır) = 1- (Eşitlikte “Pr”, “olasılık” için kullanılmıştır) Alt ve üst sınırlar, örnekleme dağılımına bağlı olarak güven düzeyi ve standart hata değeriyle belirlenir. Ana Kütle Ortalaması µ’nün Aralık Tahmini Ana kütle aritmetik ortalamasının aralık tahmininde örneklem hacminin yeterince büyük olup olmamasına göre iki farklı dağılımın olasılık kurallarından yararlanılır. İzleyen kesimlerde μ nün aralık tahmini “büyük örneklemler (n 30)” ve “küçük örneklemler (n<30)” için ayrı ayrı ele alınacaktır. Büyük Örneklemler İçin µ’nün Aralık Tahmini Ortalamalar örnekleme dağılımının normal olabilmesi için, ana kütlenin normal dağılması ya da örneklem hacminin yeterince büyük olması (n 30) gerektiği önceki ünitede belirtilmişti. Bu dağılımın olasılık kurallarından yararlanarak, ana kütleden tesadüfi olarak çekilecek tek bir örneklem yardımıyla örneklem aritmetik ortalaması kullanılarak ana kütle aritmetik ortalaması µ için aralık tahmini aşağıdaki güven sınırlarıyla yapılabilir. Pr( X z x X z x ) 1 veya X z x Yukarıdaki formülde z değeri, başlangıçta belirlenen güven düzeyine karşılık gelen standart normal eğri alanları tablosundan bulunacak değerdir. Aralık tahmininde genellikle %95 ve %99 güven düzeylerinin kullanıldığı daha önce ifade edilmişti. Bu güven düzeyleri için güven sınırları aşağıdaki gibidir: 185 Ana kütle ortalamasının güven sınırları (n 30) %95 Güven Düzeyinde X 1,96 x %99 Güven Düzeyinde X 2,58 x Ana kütle aritmetik ortalamasının tahmincisi olan örneklem aritmetik ortalamasının standart hatası x , ana kütle standart sapması bilindiğinde, x n eşitliğinden elde edilir. Ana kütle aritmetik ortalamasının tahmini ile ilgili açıklamalar Ana kütle standart sapması “σ” nın bilinmesi durumunda geçerli olmaktadır. Günlük yaşamda bazı ender durumlar dışında karşılaşılan problemlerin çözümünde genel olarak “σ” bilinmemektedir. Bu durumda Ana kütle standart sapması yerine onun sapmasız tahmincisi olan örneklem standart sapması “ s ” kullanılır. Bu tahminci aşağıdaki eşitlikle hesaplanır: n s (x X ) 2 i i 1 n 1 Ortalamaların örnekleme dağılımı “merkezi limit teoremi” uyarınca n 30 olduğunda normale uyduğu daha önce belirtilmişti. Buna göre, Ana kütle aritmetik ortalaması μ’nün aralık tahmini aşağıdaki eşitlikle bulunur: Pr( X zsx X zsx ) 1 Ortalamanın standart hatasının tahmini, örneklem standart hatası kullanılarak sx s n eşitliğinden yararlanarak gerçekleştirilir. Örnek 7.1: Belirli bir bölgede canlı doğum ağırlık ortalamasını tahmin etmek amacıyla tesadüfi olarak 100 doğum ağırlığı belirlenmiştir. Ortalama doğum ağırlığı 3250 gr, standart sapma ise 450 gr olarak hesaplanmıştır. Buna göre söz konusu bölgedeki canlı doğum ağırlık ortalamasını %99 güvenle tahmin ediniz. İlgili araştırmada, n =100 doğum X = 3250 gr ve s = 450 gr olarak belirlenmiştir. Tahmin %99 güvenle yapılacağından, ana kütle ortalamasının tahmininin güven düzeyi (1- ) 0,99 olacaktır. Örneklem hacmi yeterince büyüktür (n>30). Buna göre, yukarıda da belirtildiği gibi standart normal dağılım tablosundan z /2 = z 0,01 = 2,58 değeri belirlenir. Ana kütle standart sapması 2 bilinmediğinden örneklem standart sapmasından yararlanarak %99 güven sınırları aşağıdaki gibi belirlenir: 186 sx s = 450 = 45 gr n 100 Pr( X zsx X zsx ) 1 Pr(3250-(2,58)(45)< <3250+(2,58)(45))=0,99 Pr(3133,9< <3366,1)=0,99 Söz konusu bölgede ortalama canlı doğum ağırlığı, %99 güvenle 3133,9 gr ile 3366,1 gr arasında herhangi bir değer alır. Küçük Örneklemler İçin µ’nün Aralık Tahmini Örneklem hacminin küçük (n<30) olması durumunda büyük örneklemler için söz konusu olan açıklamalar geçerli olmaz. Normal dağılan bir ana kütleden çekilmesi mümkün tüm “n” birimlik küçük örneklemlerin çekildiği ve her biri için, t X sx biçimindeki t istatistiği hesaplandığı düşünülsün. Tanım aralığı “- ve + ” arasında olan bu istatistikler önceki ünitede anlatıldığı gibi Student-t Dağılımı adı verilen sürekli bir dağılım oluşturur. Küçük örneklemler durumunda t dağılımından yararlanarak µ’nün Aralık Tahmininde z değerleri yerine, ilgili güven düzeyi ve n-1 serbestlik derecesi için “kritik t değerleri tablosu”ndan bulunacak t değerleri kullanılır. Bu değerler, t biçiminde gösterilir. Ana kütle aritmetik ortalaması µ için aralık tahmini 2 ;( n 1) aşağıdaki güven sınırlarıyla yapılabilir. Pr X t sx X t sx 1 ;( n 1) ;( n 1) 2 2 veya X t 2 ;( n 1) sx Örnek 7.2 Örnek 7.1’deki çalışmanın n= 25 birimlik bir örneklemle yapıldığı düşünülsün. Ortalama doğum ağırlığı 3200 gr, standart sapma ise 550 gr olarak hesaplanmıştır. Buna göre söz konusu bölgedeki canlı doğum ağırlık ortalamasını %95 güvenle tahmin ediniz. İlgili araştırmada, n = 25 doğum x = 3200 gr ve s = 550 gr olarak belirlenmiştir. Tahmin %95 güvenle yapılacağından, ana kütle ortalamasının tahmininin güven düzeyi (1- ) 0,95 olacaktır. Örneklem hacmi yeterince küçüktür (n<30). Buna göre, yukarıda da belirtildiği gibi Student-t dağılım tablosundan (çift yönlü =0,05) t = t0.025;(251) = 2,064 değeri belirlenir. Ana kütle 2 ;( n 1) standart sapması bilinmediğinden örneklem standart sapmasından yararlanarak %95 güven sınırları aşağıdaki gibi belirlenir: sx s 550 = = 110 gr n 25 Pr X t sx X t sx 1 Pr(3200-(2,064)(110)< <3200+(2,064)(110))=0,99 ;( n 1) ;( n 1) 2 2 Pr(2972,96< <3427,04)=0,95 Söz konusu bölgede ortalama canlı doğum ağırlığı, %95 güvenle 2972,96gr ile 3427,04gr arasında herhangi bir değer alır. 187 ANA KÜTLE PARAMETRELERİ ARASINDAKİ FARKIN ARALIK TAHMİNİ N1 ve N2 hacimlik iki farklı ana kütleden tesadüfi olarak ve birbirinden bağımsız olarak çekilen n1 ve n2 birimlik örneklemler için hesaplanan istatistikler T1 ve T2 biçiminde gösterilsin. Ana kütle parametreleri arasındaki farkın 1 2 aralık tahmininin yapılabilmesi için, T1- T2 istatistiğinin örnekleme dağılımının bilinmesi gerekir. İlgili dağılımın olasılık kurallarından hareketle seçilen güven düzeyinde, ana kütle parametreleri arasındaki farkın aralık tahmini aşağıdaki biçimde genel olarak yapılabilir. Pr (Alt sınır< 1 2 < Üst sınır) = 1-α Ana kütle Ortalamaları Arasındaki Farkın 1 2 Aralık Tahmini Ana kütle ortalamaları arasındaki farkın aralık tahmininde de örneklemlerin büyük ya da küçük örneklem olmaları durumları dikkate alınacaktır. İzleyen kısımlarda büyük örneklemler için ve küçük örneklemler için 1 2 ‘in aralık tahmini aktarılacaktır. Büyük Örneklemler İçin 1 2 ’nin Aralık Tahmini Ortalama farklarının örnekleme dağılımının normal olabilmesi için, ana kütlelerinin normal dağılması ya da örneklemlerin hacminin yeterince büyük olması (n1,n2 30) gerekmektedir. Bu dağılımın olasılık kurallarından yararlanarak, ilgili ana kütlelerden tesadüfi olarak çekilecek birer örneklem yardımıyla örneklem aritmetik ortalamaları arasındaki fark arasındaki fark 1 2 X 1 X 2 kullanılarak, ana kütle aritmetik ortalamaları için aralık tahmini aşağıdaki güven sınırlarıyla yapılabilir. Pr[( X1 X 2 ) z x1 x2 1 2 ( X1 X 2 ) z x1 x2 ] 1 veya ( X1 X 2 ) z x1 x2 Yukarıdaki formülde z değerinin, başlangıçta belirlenen güven düzeyine karşılık gelen standart normal eğri alanları tablosundan bulunacak değer olduğu önceki kesimde açıklanmıştı. %95 ve %99 düzeyleri için µ1-µ2’nin güven sınırları aşağıdaki gibidir: Ana kütle ortalamaları arasındaki farkın güven sınırları (n1,n2 30) %95 Güven Düzeyinde ( X1 X 2 ) 1,96 x1 x2 %99 Güven Düzeyinde ( X1 X 2 ) 2,58 x1 x2 Güven sınırlarındaki ortalama farklarının standart hatası x x 1 2 , ana kütle standart sapmaları bilindiğinde, x x 1 2 12 n1 22 n2 eşitlğine göre hesaplanır. Yukarıda yapılan açıklamalar ana kütle standart sapmaları “σ1 ve σ2” nin bilinmesi durumunda geçerli olmaktadır. Günlük yaşamda bazı ender durumlar dışında karşılaşılan problemlerin çözümünde genel olarak “σ1 ve σ2” bilinmemektedir. Bu durumda ana kütle standart sapmaları yerine onun sapmasız 188 tahmincileri olan örneklem standart sapmaları “s1 ve s2” kullanılır. Buna göre, ana kütle aritmetik ortalamaları arasındaki fark 1 2 için aralık tahmini aşağıdaki güven sınırlarıyla yapılabilir: Pr[( X1 X 2 ) zsx1 x2 1 2 ( X1 X 2 ) zsx1 x2 ] 1 Ana kütle standart sapmaları bilinmediği durumda ortalamalar arasındaki farkın standart hatasının tahmini sx1 x2 aşağıdaki gibi belirlenir: sx1 x2 s12 s22 n1 n2 Örnek 7.3 A ve B gibi iki ilacın ortalama etki süreleri arasındaki farkı tahmin etmek isteyen bir araştırmacı, A ilacını uyguladığı 35, B ilacını uyguladığı 50 hasta için elde ettiği etki sürelerinden hareketle aşağıdaki bulgulara ulaşmıştır. Buna göre iki ilacın ortalama etki süresi arasındaki farkı %95 güvenle tahmin ediniz. A İlacı (1) B İlacı (2) X 1 =15 dk. X 2 =11 dk. s12 =12,25 dk. s22 =5,29 dk. n1 =35 n2 =50 Tahmin %95 güvenle yapılacağından, ana kütle ortalamaları arasındaki farkın tahmininin güven düzeyi (1- ) 0,95 olacaktır. Örneklem hacimleri yeterince büyüktür (n1 ve n2>30). Buna göre, yukarıda da belirtildiği gibi standart normal dağılım tablosundan z = z 0,05 = 1,96 değeri belirlenir. Ana kütle 2 2 standart sapmaları bilinmediğinden örneklem standart sapmalarından yararlanarak %95 güven sınırları aşağıdaki gibi belirlenir: sx1 x2 s12 s22 12, 25 5, 29 = 0, 46 = 0,68 n1 n2 35 50 Pr[( X1 X 2 ) zsx1 x2 1 2 ( X1 X 2 ) zsx1 x2 ] 1 Pr((15-11)-(1,96)(0,68)< 1 2 <(15-11)-(1,96)(0,68))=0,95 Pr(2,67< <5,33)=0,95 A ve B gibi iki ilacın ortalama etki sürelerinin arasındaki fark, %95 güvenle 2,67 dk ile 5,33 dk arasında herhangi bir değer alır. Küçük Örneklemler İçin 1 2 ’nin Aralık Tahmini Örneklem hacmlerinin küçük (n1,n2<30) olması durumunda büyük örneklemlerdekine benzer biçimde ana kütle ortalamaları arasındaki farkın aralık tahmini gerçekleştirilebilir. Bu durumda, t dağılımından yararlanarak, ilgili güven düzeyi ve n1 n2 2 serbestlik derecesi için “kritik t değerleri tablosu”ndan 189 bulunacak t değerleri kullanılır. Bu değerler, ortalamaları arasındaki fark 1 2 t 2 ;( n1 n2 2) biçiminde gösterilir. Ana kütle aritmetik için aralık tahmini aşağıdaki güven sınırlarıyla yapılabilir: Pr ( X 1 X 2 ) t sx1 x2 1 2 ( X 1 X 2 ) t sx1 x2 1 ;( n1 n2 2) ;( n1 n2 2) 2 2 veya ( X 1 X 2 ) t 2 ;( n1 n2 2) sx1 x2 Yukarıda verilen güven aralığındaki ortalamalar arasındaki farkın standart hatasının tahmini sx1 x2 aşağıdaki gibi belirlenir: sx1 x2 (n1 1) s12 (n2 1) s22 n1 n2 2 1 1 n1 n2 Örnek 7.3’te n1=16 n2=12 kabul ederek %99 güven sınırlarını bulunuz Ana kütle Oranı ’nin Aralık Tahmini Sayısal olmayan değişkenler için ölçme düzeyi sınıflayıcı (kategorik) olduğunda söz konusu olan ana kütle oranı, önceki ünitede “ana kütlenin birimleri içindeki ilgilenilen türden özelliğe sahip olanların oranı” biçiminde tanımlanmıştı. Ana kütle oranı için güven aralıkları, ana kütle ortalamasının aralık tahminine paralel olarak gerçekleştirilebilir. Böyle bir tahminin yapılabilmesi için, örneklem hacminin yeterince büyük (n≥30) olması gerekmektedir. Bu durumda oranların örnekleme dağılımı merkezi limit teoremi uyarınca normale yaklaşım gösterir. Örneklem oranı p kullanılarak ana kütle oranı için aralık tahmini aşağıdaki güven sınırlarıyla yapılabilir. Pr( P z.s p P z.s p ) 1 p z.s p veya Yukarıdaki formülde z değerleri, %95 ve %99 güven düzeyleri için kullanıldığında güven sınırları aşağıdaki gibidir: Ana kütle oranının güven sınırları (n 30) %95 Güven Düzeyinde p 1,96.s p %99 Güven Düzeyinde p 2,58.s p Oranın standart hatasının tahmini s p , sp p(1 p) n eşitliğinden hesaplanır. Örnek 7.4 Gelişmiş ülkelerde sigara içme oranı hızla düşerken, Türkiye'de sigaraya başlayanların sayısı sürekli artmaktadır ve bu önemli bir sağlık sorunu olarak kabul edilmektedir. Sağlık Bakanlığı'nın ilk ve orta dereceli okullarda yaptığı araştırmaya 61 ilden 202 okul ve bu okullarda öğrenim gören 15957 öğrenci katılmıştır. Bu öğrencilerden 4628 i sigara içtiğini belirtmiştir. Buna göre sigara içenlerin oranını %95 güven düzeyinde tahmin ediniz. 190 Araştırmada, n=15957 öğrenci ve sigara içen sayısı r = 4628 buradan, p r 4628 = = 0,29 n 15957 Tahmin %95 güvenle yapılacağından, ana kütle oranının tahmininin güven düzeyi (1- ) 0,95 olacaktır. Örneklem hacmi yeterince büyüktür (n>30). Buna göre, yukarıda da belirtildiği gibi standart normal dağılım tablosundan z = z 0,05 = 1,96 değeri belirlenir. Burada örneklem oranından yararlanarak 2 2 ana kütle oranı için %95 güven sınırları aşağıdaki gibi belirlenir: sp p(1 p) 0, 29(1 0, 29) = sp =0,004 n 15957 Pr( p z.s p p z.s p ) 1 Pr(0,29-(1,96)(0,004)< <0,29+(1,96)(0,004))=0,95 Pr(0,282< <0,298)=0,95 Bu sonuca göre sigara içen öğrencilerin ana kütle düzeyindeki oranı %95 güvenle 0,282 ile 0,298 arasında bir değer alır. Ana Kütle Oranları Arasındaki Farkın 1 2 Aralık Tahmini Ana kütle oranları arasındaki farkı için güven aralıkları, ana kütle ortalamaları arasındaki farkın aralık tahminine paralel olarak gerçekleştirilebilir. Böyle bir tahminin yapılabilmesi için, örneklem hacmlerinin yeterince büyük (n1,n2>30) olması gerekmektedir. Ana kütle oranları arasındaki fark 1 2 için aralık tahmini aşağıdaki güven sınırlarıyla yapılabilir. Pr ( p1 p2 ) zs p1 p2 1 2 ( p1 p2 ) zs p1 p2 1 veya ( p1 p2 ) zs p1 p2 Oranlar arasındaki farkın standart hatasının tahmini sP1 P2 , s p1 p2 p1 (1 p1 ) p2 (1 p2 ) n1 n2 eşitlğine göre hesaplanır. Örnek 7.5 Özel bir sağlık kuruluşu, büyük bir ildeki iki hastanesi arasındaki memnuniyet farkını araştırmak amacıyla bir araştırma yaptırmıştır. A hastanesinden tesadüfi olarak belirlenen 500 hastadan 350’si, B hastanesinden tesadüfi olarak belirlenen 450 hastadan ise 270’i memnun olduklarını belirtmişlerdir. Bu duruma göre iki hastane arasındaki memnuniyet oranları arasındaki farkın güven sınırlarını %95 olasılıkla belirleyiniz. Araştırmada memnuniyet oranları arasındaki farkın güven sınırları istenmektedir. Bu durumda aralık tahmini söz konusudur. n1 =500 hasta ve memnun olan sayısı r1=350, n2 =450 ve memnun olan sayısı r2=270 buradan, p1 r1 350 = = 0,70 n1 500 p2 r2 270 = = 0,60 n2 450 191 Tahmin %95 güvenle yapılacağından, ana kütle oranının tahmininin güven düzeyi (1- ) 0,95 olacaktır. Örneklem hacimleri yeterince büyüktür (n1 ve nn>30). Buna göre, yukarıda da belirtildiği gibi standart normal dağılım tablosundan z /2 = z0,05/2 = 1,96 değeri belirlenir. Burada örneklem oranından yararlanarak ana kütle oranları arasındaki fark için %95 güven sınırları aşağıdaki gibi belirlenir: s p1 p2 p1 (1 p1 ) p2 (1 p2 ) 0, 70(1 0, 70) 0, 60(1 0, 60) =0,03 500 450 n1 n2 Pr ( p1 p2 ) zs p1 p2 1 2 ( p1 p2 ) zs p1 p2 1 Pr((0,70-0,60)-(1,96)(0,03)< 1 2 <(0,70-0,60)-(1,96)(0,03))=0,95 Pr(0,04< 1 2 <0,16)=0,95 Bu sonuca göre iki hastane arasındaki memnuniyet oranları arasındaki farkın güven sınırları %95 olasılıkla 0,04 ile 0,16 olarak belirlenir. HİPOTEZ TESTLERİ Hipotez testleri, istatistiğin çeşitli bilim dallarındaki uygulamalı çalışmalarda yoğun bir biçimde kullanılan önemli bir dalıdır. Hipotez testleri de istatistiksel tahminde olduğu gibi örnekleme konusu ile iç içe kavramlardır. Örnekleme yapan bir araştırmacının genel olarak ana kütle parametrelerine ilişkin çeşitli kararları örneklem istatistiklerinden elde edilen bilgilere dayanarak vermesi gerekmektedir. Bağlı olarak tahmin sürecinde olduğu gibi hipotez testlerinde de ana kütle parametreleri hakkında çıkarsamalarda bulunulur. Tasarlanan araştırmanın amacına göre, cevaplanması gereken çok sayıda soru akla gelebilir. Örneğin bir ilaç firması uygulayacağı bir yeniliğin üretim miktarını artırıp artırmadığını araştırmak isteyebilir. Hastane yönetimi müşteri memnuniyet oranın önceden bilinen orandan daha yükseğe çıkarılıp çıkarılmadığını araştırmak isteyebilir. Bir araştırmacı uyguladığı bir tedavi yönteminin ilgili hastalığa ilişkin ölçümleri değiştirip değiştirmediğini araştırmak isteyebilir. Bu tür soruların cevaplarını İstatistiksel Hipotez Testleri yardımıyla verebiliriz. Hipotez, genel olarak belirli bir konuda ileri sürülen iddia (önerme) dır. İstatistiksel Hipotez ise, bir araştırmada araştırma amacına uygun olarak ilgilenilen bir veya daha fazla ana kütle parametresi hakkında ileri sürülen, doğruluğu konusunda kuşku duyulan ve bundan dolayı doğruluğu (veya geçerliliği) olasılık kurallarına göre test edilme gerekliliği olan özel önermelerdir. Sıfır Hipotezi ve Karşıt Hipotez Hipotez testlerinde, araştırmacının doğruluğundan kuşku duyduğu hipotez sıfır hipotezi (yokluk hipotezi), doğru olduğuna inandığı hipotez ise karşıt hipotez (alternatif hipotez) adı verilir. Ana kütle parametresinin belirli bir değere eşitliği, iki ya da daha fazla ana kütle parametresi arasında fark olmadığı biçimindeki hipotez; sıfır hipotezidir ve H 0 ile gösterilir. Buna karşın, ana kütlenin ilgilenilen parametresinin belirli bir değerden farklılığını, iki ya da daha fazla ana kütle parametresi arasında fark olduğunu ifade eden hipotez ise karşıt hipotezdir ve H1 ile gösterilir. Sözü edilen hipotezler, ana kütle parametresi, 0 ana kütle parametresi için iddia edilen değeri olmak üzere tek bir ana kütle parametresi için genel biçimde aşağıdaki gibi ifade edilirler: 192 H 0 : 0 0 H1 : 0 0 Yukarıda görüldüğü gibi, test için eşitlik biçiminde kurulabilecek bir tane sıfır hipotezi kurulmasına karşın, alternatif hipotez araştırmanın amacına uygun olarak üç durumdan biriyle ifade edilir. Farklı bir ifadeyle, sıfır hipotezi ana kütle parametresinin değişmezliğini ifade eder ve bütün karar alma problemleri için geçerli olan standart bir eşitliğe sahiptir. Buna karşılık olarak, karşıt hipotez verilecek kararın niteliğine göre çeşitli problemlerde üç farklı durumdan biri ile ifade edilir. BİRİNCİ VE İKİNCİ TİP HATALAR Hipotez testlerinde de aralık tahmininde olduğu gibi belirli bir güven düzeyinde karar verilir. Dolayısıyla varılan kararın bir hata içermesi söz konusudur. Araştırmacı araştırmanın amacına uygun olarak H 0 ’ı reddetmeye çalışır. Sıfır hipotezinin gerçekte doğru olup olmadığı bilinememektedir. Hipotez testi sonucunda ise sıfır hipotezi ya reddedilecek ya da reddedilemeyecektir (Başka bir ifade ile, sıfır hipotezini reddetmek için yeterli kanıt olmadığına karar verilecektir). O halde hipotez testinde örneklem istatistiği kanıt olarak kullanıldığında şu dört karar durumuyla karşı karşıya kalınacaktır: I. Sıfır hipotezi gerçekte doğrudur, reddedilememiştir. II. Sıfır hipotezi gerçekte doğrudur, reddedilmiştir. III. Sıfır hipotezi gerçekte yanlıştır, reddedilememiştir. IV. Sıfır hipotezi gerçekte yanlıştır, reddedilmiştir. Bu karar durumlarının ikisinde doğru karar, diğer ikisinde ise yanlış karar söz konusu olur. Bunu aşağıdaki tabloda açıklamak mümkündür. Tablo 7.1: Hipotez testinde hata tipleri Hipotez Testi Sonucu Karar H 0 Reddedilir Sıfır Hipotezinin Gerçek Durumu H 0 Doğru H 0 Yanlış YANLIŞ KARAR I. TİP HATA VERİLEN KARAR DOĞRU (1-∝) (∝) H0 Reddedilemez VERİLEN KARAR DOĞRU (1- β) YANLIŞ KARAR II. TİP HATA (β) Tablo 7.1’de görüldüğü gibi dört karar durumundan ikisinde yanlış karar verilmesi söz konusudur, yani iki tip hata yapılmaktadır. Bu hatalar şu biçimde tanımlanabilir: I. TİP HATA: Gerçekte doğru olan sıfır hipotezini test sonucunda yanlıştır diye reddetmeye I. Tip Hata adı verilir. α-Hatası olarak da adlandırılan bu hatayı işleme olasılığı tabloda belirtildiği gibi α kadardır. II. TİP HATA: Gerçekte yanlış olan sıfır hipotezini test sonucunda doğrudur diye “reddedilemez” kararı vermeye II. Tip Hata adı verilir. β-Hatası olarak da adlandırılan bu hatayı işleme olasılığı da β kadardır. Dolayısıyla tablodaki; 193 α: Birinci tip hatayı işleme olasılığı, β: İkinci tip hatayı işleme olasılığı, 1-α: H 0 gerçekte doğru olduğunda onu reddetmeme olasılığıdır ve aralık tahmininde olduğu gibi “Güven Düzeyi” olarak adlandırılır. 1-β: H 0 gerçekte yanlış olduğunda onu reddetme olasılığıdır ve “Testin Gücü” olarak adlandırılır. Hipotez testlerinde, α hatası üzerinde daha çok durulur ve bu hatayı işlemekten kaçınılır. Uygulamada bu hatayı işleme olasılığı araştırmacı tarafından belirlenebilmektedir. I. ve II. Tip hatayı ve bunlara ilişkin olasılıkları açıklayınız Hipotez Testinin Aşamaları Araştırmanın amacına uygun olarak yürütülecek bir hipotez testinde genel olarak izlenecek aşamalar şu biçimde sıralanabilir: 1. Sıfır hipotezi ve alternatif hipotezin ifade edilmesi 2. Anlamlılık düzeyi 3. Örnekleme dağılımının belirlenmesi 4. Red bölgesinin (kritik değerin) belirlenmesi 5. Uygun test istatistiğinin hesaplanması 6. İstatistiksel kararın verilmesi nın seçilmesi Hipotez testinin belirtilen aşamaları izleyen kesimde “Tek Ana kütle Ortalamasına İlişkin Hipotez Testleri” başlığı altında ayrıntılı olarak anlatılacaktır. Ana Kütle Ortalamasına İlişkin Hipotez Testleri Bu bölümde ana kütle ortalamasına ilişkin uygulamada çoğunlukla kullanılan tek ana kütle ortalamasına ve iki ana kütle ortalaması arasındaki farka ilişkin olarak gerçekleştirilen testlere değinilecektir. Bu testler anlatılırken, büyük örneklem-küçük örneklem ve ana kütle varyanslarının bilirip bilinmemesi ayrımları dikkate alınacaktır. İzleyen kesimde tek ana kütle ortalamasına ilişkin hipotez testi ayrıntılı olarak ele alınacak, diğer testler mümkün olduğunca kısaltılarak verilecektir. Tek Ana Kütle Ortalamasına İlişkin Hipotez Testi Tek bir ana kütle aritmetik ortalamasına ilişkin hipotez testinde, ilgili ana kütle aritmetik ortalamasının belirli bir değere 0 eşitliği biçiminde ifade edilen sıfır hipotezinin test edilmesi işlemleri gerçekleştirilir. Sözü edilen test, hipotez testi aşamaları izlenerek aşağıdaki gibi uygulanır: 1. Sıfır Hipotezi ve Alternatif Hipotezin İfade Edilmesi Sıfır hipotezi her zaman eşitlik şeklinde ifade edilir. Alternatif hipotez ise bizim araştırmak istediğimiz hipotezdir. Daha sonra testin tek taraflı mı yoksa çift taraflı mı olacağına, dolayısıyla alternatif hipotezin yönüne karar verilir. Ana kütle ortalamasının iddia edilen değerden büyük olduğu ya da küçük olduğu biçimindeki iddialar için test tek taraflı olarak adlandırılır. Yön belirtilmeden ana kütle ortalamasının iddia edilen değerden farklı olduğu ileri sürülecekse alternatif hipotez eşitsizlik biçiminde kurulur ve testin çift taraflı olduğu ifade edilir. Tek taraflı testlerde eşitsizliğin yönü belirlenirken dikkat edilmelidir. Hipotezler aşağıdaki gibi kurulur: 194 H 0 : 0 H 0 : 0 H 0 : 0 H1 : 0 H1 : 0 H1 : 0 Çift Taraflı Test Tek Taraflı Test Tek Taraflı Test Yukarıda da belirtildiği gibi belirli bir araştırmada, araştırmanın amacına uygun olarak bu üç hipotez çiftinden biri kurulur. 2. Anlamlılık Düzeyi nın Seçilmesi Anlamlılık düzeyi, bir hipotez testinde I. Tip hatayı işleme olasılığı idi. Bu hata miktarı çoğunlukla 0,05 ve 0,01 olarak belirlenir. Ancak, araştırmanın önemi dikkate alınarak daha büyük ya da küçük bir değer de belirlenebilir. Anlamlılık düzeyine bağlı olarak testin güven düzeyi de belirlenmiş olur. Buna göre 0.05 Güven düzeyi 1 0.95 ve 0.01 Güven düzeyi 1 0.99 olarak belirlenmiş olur. 3. Örnekleme Dağılımının Belirlenmesi Önceki ünitede anlatıldığı gibi, örneklemeye başvurulduğunda, istatistiksel tahminde olduğu gibi hipotez testlerinde de, örneklem istatistiğinin örnekleme dağılımından ve onun olasılık kurallarından yararlanılmaktadır. Dolayısıyla araştırmanın amacına uygun olarak hangi örnekleme dağılımından yararlanılacağı bu aşamada belirlenir ve örneklem istatistikleri ( x ve s gibi) kullanılarak standart hata hesaplanır. 4. Red Bölgesinin (Kritik Değerin) Belirlenmesi Test istatistiğinin hesaplanan değerlerinin bizi sıfır hipotezinin reddi kararına götüreceği değerler kümesi red bölgesidir. Red bölgesinin sınırında bulunan değere kritik değer adı verilir. Red bölgesinin büyüklüğü Tip I hata olasılığı olan α’ya bağlıdır. Buna göre anlamlılık düzeyinin belirlenmesiyle red bölgesinin büyüklüğü de ortaya çıkmış olur. Karşıt hipotez ise, red bölgesinin yerini belirlemede yardımcı olur. Karşıt hipotez, ana kütle ortalamasının iddia edilen değerinden büyük ya da küçük bir değer olduğu biçiminde ise, yani tek taraflı bir test gerçekleştirilecekse, red bölgesi birinci durumda dağılımın pozitif (sağ) ucunda yer alır. İkinci durumda ise dağılımın sol ucunda gösterilir. Eğer karşıt hipotez ana kütle ortalamasının iddia edilen değerinden farklı olduğu biçiminde ise, red bölgesi dağılımın iki ucunda olmak üzere iki eşit bölgede yer alır. Tek taraflı, sağ veya sol uçtaki testler için red bölgesinin alanı α’ya; `çift taraflı testler için ise ‘ye eşittir. Bu açıklamalar, normal dağılım eğrisinden yararlanılarak aşağıdaki 2 gibi gösterilebilir. Şekil 7.1: Çift taraflı test için red bölgesi 195 H1 : 0 Şekil 7.2: Tek (sol uç) taraflı test için red bölgesi H1 : 0 Şekil 7.3: Tek (sağ uç) taraflı test için red bölgesi H1 : 0 Red bölgesinin sınırında bulunan kritik değer/değerler, anlamlılık düzeyine ve testin tek ya da çift taraflı oluşuna göre değişik değerler alır. Büyük örneklemler için z tablo değerleri, küçük örneklemler için de t tablo değerleri kullanılır. Örneğin, tek taraflı bir test kullanıldığında ve 0,05 anlamlılık düzeyi belirlendiğinde, büyük örneklemler için kritik z değeri 1,64 olarak belirlenir. Bazı kritik z değerleri aşağıdaki gibi tablolaştırılabilir: z Bazı kritik değerleri Anlamlılık Düzeyi Testin Yönü Tek Taraflı Test Çift Taraflı Test 0,05 0,01 z =1,64 z =1,96 z =2,33 z =2,58 5. Uygun Test İstatistiğinin Hesaplanması İstatistiksel karar, örneklemden elde edilen ortalama ile ana kütle ortalamasının iddia edilen değeri arasındaki farkın istatistiksel olarak anlamlı olup olmadığı biçiminde verilecektir. Bunun için, sözü edilen farkın standart hataya göre standartlaştırılarak elde edilen değer olan test istatistiğine gereksinim vardır. Test istatistiği tek ana kütle ortalamasına ilişkin test için büyük örneklem durumunda, ana kütle varyansı bilindiğinde: z eşitliği yardımıyla hesaplanır. Burada x X 0 x bilindiği gibi aşağıdaki eşitlik yardımıyla hesaplanır. x n Uygulamada ana kütle varyansının genellikle bilinmediği daha önce belirtilmişti. Bu durumda aralık tahmininde olduğu gibi ana kütle varyansının tahmincisi olan örneklem varyansından yararlanılır. Dolayısıyla, test istatistiği aşağıdaki gibi olacaktır. 196 z Burada X 0 sx sx da aşağıdaki gibi hesaplanır: sx s n 6. İstatistiksel Kararın Verilmesi Hesaplanan test istatistiğinin daha önce belirlenen red bölgesinin içinde yer alıp almamasına göre birinci aşamada ileri sürülen sıfır hipotezinin reddedilip reddedilemeyeceği, hipotez testinin son aşaması olan istatistiksel kararı ifade eder. Sıfır hipotezinin reddedilmesi durumunda ana kütle ortalamasının iddia edilen değerden farklı olduğuna, hipotezin reddedilememesi durumunda ise sıfır hipotezini reddetmek için yeterli kanıt bulunamadığına, yani ana kütle aritmetik ortalamasının iddia edilen değerden farklı olmadığına belirlenen güven düzeyinde karar verilir. İstatistiksel kararın verilmesinde hesaplanan test istatistiğinin red bölgesine düşüp düşmediğinin belirlenmesinde pratik bir yol; test istatistiğinin mutlak değerinin kritik değerden büyük olup olmadığının belirlenmesidir. Bu durumda karar kuralı aşağıdaki gibi tanımlanabilir. Tek taraflı test için: zhesap z H 0 Reddedilir zhesap z H 0 Reddedilemez İki taraflı test için: zhesap z H 0 Reddedilir zhesap z H 0 Reddedilemez 2 2 Örnek 7.6 En az 20 kez milli olmuş, 18 yaşın üzerindeki erkek orta mesafe yüzücülerinin oksijen tüketim kapasitelerinin 68 ml/kg/dk olup olmadığı araştırılmak istenmiştir. Bu amaçla, belirtilen özelliklere sahip yüzücüler içerisinden 36’sı tesadüfi olarak seçilmiştir. Örnekleme seçilen 36 yüzücünün oksijen tüketim kapasiteleri ölçülmüş ve ortalama 62, varyans tahmini 29,38 ml/kg/dk olarak belirlenmiştir. %99 güven düzeyinde sözü edilen yüzücülerin oksijen tüketim kapasitelerinin 68 ml/kg/dk olup olmadığını araştırınız. Hipotez testleri için verilen ilk örnek olduğundan çözümleme hipotez testi adımları belirtilerek verilecektir. 68 X =62 s 2 =29,38 s =5,42 n =36 Araştırmada tek örneklem ile çalışılmıştır ve örneklem hacmi büyüktür. Bundan dolayı büyük örneklemler için ana kütle ortalamasına ilişkin hipotez testi gerçekleştirilecektir. Ayrıca ana kütle standart sapmasına ilişkin bir bilgi bulunmamaktadır. 197 1) Sıfır hipotezi ve alternatif hipotezin ifade edilmesi; H 0 : 0 68 H1 : 0 68 biçiminde olacaktır. Araştırmada sözü edilen yüzücülerin oksijen tüketim kapasitelerinin 68 ml/kg/dk olup olmadığı araştırıldığı için çift taraflı test uygulanacaktır. 2) Anlamlılık düzeyinin belirlenmesi; Karar %99 güvenle verileceğinden anlamlılık düzeyi =0,01 olarak belirlenir. 3) Örnekleme dağılımı Ana kütle ortalamasına ilişkin hipotez testi gerçekleştirileceğinden, ortalamaların örnekleme dağılımı kullanılacaktır. Ayrıca büyük örneklemlerden yararlanıldığından standart normal dağılım olan z dağılımından ve olasılık kurallarından yararlanılacaktır. 4) Red Bölgesi; anlamlılık düzeyi ve H1 ’in yönü dikkate alınıyordu. Çift taraflı bölgesi dağılımın her iki ucunda kadar olmak üzere toplam Red bölgesinin belirlenmesinde bir test uygulanacağından red kadardır. Buna göre kritik 2 z değerleri tablosundan z = z0,025 =1,96 belirlenir. 2 5) Test İstatistiğinin hesaplanması; sx z s 5, 42 0,9 olmak üzere, n 36 X 0 62 68 = -6,67 , sx 0,9 zhesap 6,67 Olarak hesaplanır. 6) İstatistiksel kararın verilmesi; zhesap =6,67> z =1,96 H 0 Reddedilir. Dolayısıyla, %99 güven düzeyinde sözü edilen 2 yüzücülerin oksijen tüketim kapasitelerinin 68 ml/kg/dk olmadığı söylenebilir. Hipotez testlerinde red bölgesi neye göre belirlenir? Küçük Örneklemler Durumu Küçük örneklem durumunda (n<30), yukarıda izlenen aşamalar benzer biçimde gerçekleştirilir. Kullanılacak test istatistiği, örnekleme dağılımı (n-1) serbestlik dereceli Student-t dağılımına uygun olarak, t X 0 sx biçiminde olacaktır. Hesaplanan test istatistiği tek taraflı test için t ;n 1 , iki taraflı test için t 2 ; n 1 kritik değeri ile yukarıdaki gibi karşılaştırılarak karar verilir. Yukarıda verilen pratik yol t-testi için de geçerlidir. 198 Ana Kütle Ortalamaları Arasındaki Farka 1 2 İlişkin hipotez Testi Uygulamada genellikle birbirinden bağımsız iki grubun, iki türün, iki işletmenin, iki ilacın v.b. incelenen sayısal değişken bakımından karşılaştırıldığı problemler ve bunların çözümlenmesi ile sıklıkla karşılaşılır. Bu tür problemlerde iki ana kütle ortalaması arasındaki farkın karşılaştırılması genellikle uygulanan hipotez testidir. Hipotezler aşağıdaki gibi kurulur. H 0 : 1 2 H 0 : 1 2 H 0 : 1 2 H1 : 1 2 H1 : 1 2 H1 : 1 2 Çift Taraflı Test Tek Taraflı Test Tek Taraflı Test İki ana kütle ortalaması arasındaki farkın test edilmesinde ilişkin test için büyük örneklemler durumunda, ana kütle varyansları bilindiğinde kullanılacak test istatistiği aşağıdaki gibidir: z X1 X 2 12 n1 22 n2 2 2 Ana kütle varyansları bilinmediğinde ise test istatistiği, bunların tahmincileri olan s1 ve s2 yardımıyla hesaplanır. z X1 X 2 s12 s22 n1 n2 Küçük Örneklemler Durumu İki ana kütle ortalaması arasındaki farkın aralık tahmininde olduğu gibi hipotez testinde de örneklemler yeterince büyük değilse (n1,n2<30), Student t dağılımından yararlanılır. Bu durumda test istatistiği aşağıdaki gibi olacaktır: t X1 X 2 (n1 1) s (n2 1) s22 n1 n2 2 2 1 1 1 n1 n2 Testin diğer aşamaları benzer biçimdedir. Burada istatistiksel kararın verilmesi aşamasında, hesaplanan test istatistiğinin karşılaştırılacağı kritik değer tek taraflı test için t ;n1 n2 2 , iki taraflı test için t 2 ;( n1 n2 2) olacaktır. Örnek 7.7 Bir araştırmacı akü fabrikasında çalışan işçiler ile tekstil fabrikasında çalışan işçiler arasında kandaki kurşun konsantrasyonu bakımından farklılık olup olmadığını araştırmak istemiştir. Bu amaçla akü fabrikasından 17, tekstil fabrikasından 10 işçiyi tesadüfi olarak seçmiş ve kandaki kurşun konsantrasyonu değerlerini( mg/100gr)*100 olarak kaydetmiştir. Verilerden hareketle her işçi grubu için aşağıdaki bulguları elde etmiştir. Buna göre iki işçi grubu arasında sözü edilen değerler bakımından farklılık olup olmadığını %95 güven düzeyinde belirleyiniz. 199 Akü Fabrikası (1) Tekstil Fabrikası(2) X 1 =8,157 X 2 =3,943 s12 =0,45 s22 =0,13 n1 =17 n2 =10 Araştırmada iki örneklem ile çalışılmıştır ve örneklem hacimleri küçüktür. Bundan dolayı küçük örneklemler için ana kütle ortalamaları arasındaki farka ilişkin hipotez testi gerçekleştirilecektir. Ayrıca ana kütle standart sapmalarına ilişkin bir bilgi bulunmamaktadır. 1) Hipotezler; H 0 : 1 2 H1 : 1 2 biçiminde olacaktır. Buna göre çift taraflı test uygulanacaktır. 2) Anlamlılık Düzeyi; Karar %95 güvenle verileceğinden anlamlılık düzeyi =0,05 olarak belirlenir. 3) Örnekleme dağılımı Ana kütle ortalamaları arasındaki farka ilişkin hipotez testi gerçekleştirileceğinden, ortalama farklarının örnekleme dağılımı kullanılacaktır. Ayrıca küçük örneklemlerden yararlanıldığından n1 n2 2 serbestlik dereceli Student-t dağılımından ve olasılık kurallarından yararlanılacaktır. 4) Red Bölgesi; anlamlılık düzeyi ve H1 ’in yönü dikkate alınıyordu. Buna göre red bölgesi dağılımın her iki ucunda / 2 kadar olmak üzere toplam kadardır. Küçük örneklemler ile çalışıldığından Student-t dağılımından yararlanılacaktır. Buna göre kritik değer t = Red bölgesinin belirlenmesinde 2 ;( n1 n2 2) t0,025;17 102 =2,06 5) Test İstatistiği; t X1 X 2 (n1 1) s12 (n2 1) s22 n1 n2 2 1 1 n1 n2 8,157 3,943 (17 1)(0, 45) (10 1)(0,13) 1 1 17 10 2 17 10 4, 214 18,32 0, 23 6) İstatistiksel karar; thesap =18,32> t0,025;17 102 =2,06 H 0 Reddedilir. Dolayısıyla, akü fabrikasında çalışan işçiler ile tekstil fabrikasında çalışan işçiler arasında kandaki kurşun konsantrasyonu bakımından istatistiksel olarak anlamlı bir farklılık olduğu söylenebilir. 200 Tek Ana Kütle Oranına İlişkin Hipotez Testi Tek bir ana kütle oranına ilişkin hipotez testinde, ilgili ana kütle oranının belirli bir değere 0 eşitliği biçiminde ifade edilen sıfır hipotezinin test edilmesi işlemleri gerçekleştirilir. Sözü edilen test için hipotezler aşağıdaki gibi kurulur: H0 : 0 H0 : 0 H0 : 0 H1 : 0 H1 : 0 H1 : 0 Çift Taraflı Test Tek Taraflı Test Tek Taraflı Test Burada da anlamlılık düzeyinin belirlenmesi, örneklem hacminin belirlenmesi ve red bölgesinin belirlenmesi aşamaları “ana kütle ortalamasına ilişkin test” başlığındaki gibidir. Büyük örneklem durumu için test istatistiği aşağıdaki gibi hesaplanır: z P 0 P Oranın standart hatası ise, ana kütle oranı için iddia edilen değeri kullanılarak aşağıdaki gibi hesaplanır: P 0 (1 0 ) n Örnek 7.8 Belirli bir bölgede faaliyet gösteren devlet hastanelerinde görevli hemşirelerin işi bırakma niyeti oranı 0,15’ten büyük olduğu iddia edilmektedir. Bu iddianın doğruluğunu araştırmak amacıyla yapılan bir araştırmada tesadüfi olarak seçilen 350 hemşireye bir anket uygulanmıştır. “işten ayrılmayı düşünüyor musunuz?” sorusuna “evet” diyen hemşirelerin sayısı 73 olarak belirlenmiştir. İddianın doğruluğunu 0,01 anlamlılık düzeyinde araştırınız. n =350 hemşire ve r = 73 olarak belirlenmiştir. Buradan, p r 73 0,21 olarak hesaplanır. n 350 Araştırmada tek örneklem ile çalışılmıştır ve örneklem hacmi büyüktür. Bundan dolayı büyük örneklemler için ana kütle oranına ilişkin hipotez testi gerçekleştirilecektir 1) Sıfır hipotezi ve alternatif hipotezin ifade edilmesi; H 0 : 0 H 0 : 0,15 H1 : 0 H1 : 0,15 biçiminde olacaktır. Araştırmada sözü edilen hemşirelerin işi bırakma niyeti oranının 0,15’ten büyük olduğu iddia edildiğinden tek taraflı test uygulanacaktır. 2) Anlamlılık düzeyinin belirlenmesi; Anlamlılık düzeyi =0,01 olarak verilmiştir. 3) Örnekleme dağılımı Ana kütle oranına ilişkin hipotez testi gerçekleştirileceğinden, oranların örnekleme dağılımı kullanılacaktır. Ayrıca büyük örneklemlerden yararlanıldığından standart normal dağılım olan z dağılımından ve olasılık kurallarından yararlanılacaktır. 201 4) Red Bölgesi; Red bölgesinin belirlenmesinde bir test uygulanacağından ve dağılımın sağ ucunda tablosundan anlamlılık düzeyi ve H1 ’in yönü dikkate alınıyordu. Tek taraflı H1 : 0 H1 : 0,15 kadar olmak üzere toplam biçiminde olduğundan red bölgesi kadardır. Buna göre kritik z değerleri z = z0,01 =2,33 belirlenir. 5) Test İstatistiğinin hesaplanması; P 0 (1 0 ) n z P 0 P 0.15(1 0,15) 0,019 olmak üzere, 350 0, 21 0,15 = 3,16 0, 019 olarak hesaplanır. 6) İstatistiksel kararın verilmesi; zhesap =3,16> z =2,33 H 0 Reddedilir. Dolayısıyla, %99 güven düzeyinde belirtilen bölgede faaliyet gösteren devlet hastanelerinde görevli hemşirelerin işi bırakma niyeti oranı 0,15’ten büyük olduğuna karar verilir. Ana Kütle Oranları Arasındaki Farka 1 2 İlişkin Hipotez Testi Ana kütle oranları arasındaki farka ilişkin hipotez testlerinde aralık tahmininde belirtildiği gibi, ana kütlelerden tesadüfi olarak çekilen birbirinden bağımsız n1 ve n2 hacimli örneklemler yeterince büyük olduğunda oran farklarının örnekleme dağılımı normal dağılıma uymaktadır. Buna göre hipotezler ve test istatistiği aşağıdaki gibi olacaktır. H 0 : 1 2 H 0 : 1 2 H 0 : 1 2 H1 : 1 2 H1 : 1 2 H1 : 1 2 Çift Taraflı Test Tek Taraflı Test Tek Taraflı Test z p1 p2 p1 (1 p1 ) p2 (1 p2 ) n1 n2 Tek-Yönlü Varyans Analizi Önceki kesimlerde, tek ana kütle ve iki ana kütle aritmetik ortalamalası arasındaki farka ilişkin hipotez testlerine değinilmişti. Uygulamada ikiden çok ana kütle ortalamasının karşılaştırılması problemleriyle yoğun bir biçimde karşılaşılmaktadır. Başka bir ifadeyle, ikiden çok grubun incelenen değişken bakımından karşılaştırılması söz konusu olabilir. Özellikle deneysel araştırmalarda grup değişkeni olarak tanımlanan bağımsız değişkenin incelenen bağımlı değişken üzerindeki etkisi, grup ortalamaları arasındaki farklılığın belirlenmesiyle ortaya konabilir. Bu amaçla kullanılan çözümleme yaklaşımı Varyans Analizi olarak adlandırılmaktadır. Çözümleme bağımlı değişkendeki toplam değişimi unsurlarına ayrıştırmayı amaçlamaktadır. Böylece bağımsız değişkenin bağımlı değişken üzerindeki salt etkileri ortaya çıkarılabilmektedir. Araştırmanın amacına uygun olarak çeşitli varyans analizi yaklaşımları söz konusudur. Burada, tek bir bağımsız değişkenin varlığı durumundaki Tek-Yönlü Varyans Analizi (TekYönlü ANOVA) açıklanacaktır. 202 Tek-Yönlü Varyans Analizi, bağımlı değişken üzerinde sadece bir bağımsız değişkenin etkisinin araştırıldığı, dolayısıyla bağımsız değişkenin düzeyleri olarak ortaya çıkan gruplar arasındaki farkların istatistiksel olarak anlamlılığının araştırıldığı bir yaklaşımdır. Çözümlemede F-Testinden yararlanılır. Bu amaçla test istatistiği olarak F istatistiği kullanılır. F istatistiği, aynı varyansın bağımsız iki tahmincisinin birbirine oranıdır. Bu oran, pyın serbestlik derecesi 1 =(k-1) ve paydanın serbestlik derecesi 2 =(N-k) serbestlik dereceleriyle dağılan F örnekleme dağılımının bir terimidir. Tek-Yönlü Varyans Analizinde, her hangi bir gözlem değerinin bileşenlerini gösteren doğrusal toplamsal model aşağıdaki gibidir: yij j ij i=1,2,...,k j=1,2,...,n j Burada; yij : Ana kütlenin herhangi bir terimi (j’inci gruptaki i’nci birimin aldığı değer) : Genel ortalama j : Grup etkisi ij : Deneysel hatadır. Tek-Yönlü Varyans Analizinde, “kareler toplamı” ve “kareler ortalaması” kavramları özel önem taşımaktadır. Söz konusu kareler toplamı verideki toplam değişkenliği açıklar. Özellikle deneysel araştırmalarda belirlenen gözlemlerin genel ortalamadan olan sapmalarının kareleri toplamını, bu sapmalara neden olan öğelere göre kısımlara ayırmak ve çözümlemek, varyans analizinin temelini oluşturmaktadır. Buna göre toplam değişim aşağıdaki gibi iki öğeye ayrılır: Toplam Değişim = Gruplararası Değişim Gruplariçi Değişim( Hata) Toplam değişim ve unsurlarını hesaplamada kullanılan formülleri oluşturmada kullanılmak üzere aşağıdaki üç temel nicelik tanımlanabilir. ni k Yi 2 i 1 ni k A yij2 T i 1 j 1 Burada; yij gözlem değerlerini, toplamını ve C Y2 N Yi i’nci gruptaki gözlem değerleri toplamını, Y tüm gözlemlerin ni ise i’nci gruptaki gözlem değeri (terim) sayısını ifade etmektedir. Buna göre kareler toplamları; Gruplararası kareler toplamı : T C (k-1 serbestlik dereceli) Gruplariçi (Hata) kareler toplamı: A T (N-k serbestlik dereceli) Genel kareler toplamı : A C (N-1 serbestlik dereceli) biçiminde yazılabilir. Burada toplam değişimin ifadesi olan genel kareler toplamının diğer iki kareler toplamının toplamı olduğuna dikkat edilmelidir. Kareler toplamlarının serbestlik derecesine oranlanmasıyla kareler ortalamalarına ulaşılır. 2 2 Gruplararası kareler ortalaması sB ve gruplariçi kareler ortalaması sW aşağıdaki gibi yazılabilir: sB2 T C k 1 sW2 A T N k 203 Buradan Tek-Yönlü Varyans Analizi için hipotezler aşağıdaki gibi yazılabilir. H 0 : i 0 ya da H 0 : 1 2 ... k H1 : En az bir i 0 ya da H1 : 1 , 2 ..., k ' ların en az biri farklıdır Çözümlemede kullanılacak test istatistiği yukarıda açıklanan iki varyans tahmincisinin birbirine oranı biçiminde şu biçimde yazılabilir. F sB2 sW2 Varyans analizinde yukarıda açıklanan çeşitli hesaplamalar genel olarak aşağıdaki tabloda topluca gösterilebilir. Tablo 7.2: Tek-Yönlü varyans analizi tablosu Değişim Kaynağı Serbestlik Derecesi Kareler Toplamı Gruplar Arası 1 =k-1 T C Gruplar İçi (Hata) 2 =N-k A T Genel N-1 AC Kareler Ortalaması sB2 T C k 1 sW2 A T N k F Değeri sB2 F 2 sW Hesaplanan F istatistiğinin anlamlılığının belirlenmesinde F-Dağılımının anlamlılık düzeyi, (k-1) ve (N-k) serbestlik dereceli kritik değerinden yararlanılır. Red bölgesi dağılımın sağ ucunda yer alır. Buna göre, Fhesap F ; k 1, N k H 0 Reddedilir. Şekil 7.4: F dağılımı için red bölgesi Varyans analizi bütünleşik bir çözümlemedir. Yani, H 0 reddedildiğinde gruplar arasındaki farkın anlamlı olduğunu belirtir, buna karşın hangi gruplar arasında farklılığın bulunduğu konusunda bilgi içermez. Bunun için farklı grupların belirlenmesi amacıyla çeşitli yaklaşımlar geliştirilmiştir. Burada bu konuya değinilmeyecektir. Çömlekçi, N. (2003). Deney Tasarımı İlke ve Teknikleri, Alfa Yayınları 204 Örnek 7. 9 Bir araştırmacı, üç farklı hastalık grubunun (Kronik hepatit (1), Siroz (2) ve Malignite (3) ) hastaların albüminleri (gr/dl) bakımından farklı olup olmadığını araştırmak istemiştir. Her bir grup hastalardan tesadüfi olarak 15 hasta için sözü edilen ölçümleri almıştır. Veriler aşağıdaki tabloda sunulmuştur. Hastalık grupları arasında albümin ölçümleri bakımından farklılık olup olmadığını 0,05 anlamlılık düzeyinde belirleyiniz. Tablo 7.3: Hastalık gruplarına ilişkin Örnek 7.9 verileri Hastalık Grupları Toplam Yi Kronik Hepatit Siroz Malignite 5,0 3,0 0,8 5,1 4,3 1,3 4,5 3,4 2,2 4,7 1,8 2,7 5,3 2,2 1,9 4,7 2,7 1,4 4,5 2,5 2,5 3,6 3,1 1,0 2,8 2,8 1,5 3,8 2,2 0,7 Y1=44 Y2=28 Y3=16 Y=88 1) Hipotezler; H 0 : i 0 ya da H 0 : 1 2 3 H1 : En az bir i 0 ya da H1 : 1 , 2 , 3 ' lerin en az biri farklıdır 2) Anlamlılık düzeyi; Anlamlılık düzeyi soruda 0,05 olarak verilmiştir. Dolayısıyla %95 güven düzeyinde karar verilecektir. 3) Örnekleme dağılımı; İkiden çok grup ortalamasının karşılaştırılması söz konusu olduğundan gruplararası değişimin gruplariçi değişime oranlanmasından yararlanılacaktır. Bu nedenle F-testi uygulanacak, bağlı olarak F dağılımından yararlanılacaktır. 4) Red bölgesi; F dağılımı 0 ile ∞ arasında tanımlı bir dağılımdır. Dolayısıyla red bölgesi dağılımın sağ ucunda yer alacaktır. Karar kuralı aşağıdaki biçimde ifade edilmişti: Fhesap F ; k 1, N k H 0 Reddedilir. Bu durumda örneğimiz için F tablo değeri; F0.05;31,303 =3,35 olarak belirlenir. 5) Test istatistiği; Test istatistiği için önce toplam değişimin unsurlarının elde edilmesi gerekir. Önce yukarıda tanımlanan temel nicelikler aşağıdaki gibi hesaplanır. 205 A temel niceliği tüm gözlem değerlerinin kareleri toplamından oluşur, k ni 2 2 2 2 2 2 2 2 A yij2 =[(5,0) +(5,1) +…+(3,0) +(4,3) +…+(0,8) +(1,3) +…+(1,5) +(0,7) ]=312 i 1 j 1 T temel niceliği grup toplamlarına dayandırılmıştır, Yi 2 i 1 ni k T 2 2 2 = 44 28 16 =297,6 10 10 10 C niceliği ise terimler toplamına dayandırılmıştır, Y 2 882 C 258,13 olarak hesaplanır. Burada A>T>C sıralaması daima gerçekleşir. N 30 Hesaplamalar varyans analizi tablosunda özetlenir: Tablo 7.4: Örnek 7.9 verileri için varyans analizi tablosu Değişim Kaynağı Serbestlik Derecesi Kareler Toplamı Gruplar Arası 1 =k-1 T C =297,6-258,13 (Hastalık Grupları) 3-1=2 = 39,47 Kareler Ortalaması F Değeri T C k 1 39, 47 2 sB 19, 74 2 sB2 F F Gruplar İçi 2 =N-k A T =312-297,6 (Hata) 30-3 =27 = 14,4 Genel N-1 A C =312-258,13 30-1 =29 = 53,87 AT N k 14, 4 sW2 0,53 27 sB2 sW2 19, 74 37, 25 0,53 sW2 6) İstatistiksel karar; Fhesap 37, 25 F ; k 1, N k 3,35 H 0 Reddedilir. Buna göre Üç hastalık grubundaki hastaların albumin ölçümleri arasındaki farkın istatistiksel olarak anlamlı olduğuna karar verilir. Ki-Kare ( 2 ) Testi Önceki kesimlerde anlatılan hipotez testleri, sayısal değişkenlere ilişkin testler idi. Uygulamada sayısal olmayan, başka bir ifadeyle sınıflayıcı ve sıralayıcı ölçekle ölçülmüş veri setleri ile sıkça karşılaşılmaktadır. Bu durumda sık başvurulan hipotez testi yaklaşımı 2 Testidir. Bu test, uygunluk, bağımsızlık ve homojenlik testi olmak üzere üç biçimde uygulanmaktadır. Ki-Kare Uygunluk Testi, n birimlik bir örneklemin belirli bir teorik dağılıma uyan bir ana kütleden gelip gelmediğinin belirlenmesinde kullanılır. Ki-Kare Bağımsızlık Testi, sınıflayıcı ya da sıralayıcı ölçekle ölçülmüş iki veya daha fazla düzeye sahip iki sayısal olmayan değişken arasında ilişki olup olmadığının belirlenmesinde kullanılır. Ki- Kare Homojenlik testi ise, birbirinden bağımsız olarak seçilen iki veya daha fazla örneklemin aynı ana kütleden gelip gelmediği konusunda karar verilmeye çalışılır. Burada önceki testlere paralel olarak Homojenlik testi açıklanacaktır. Ki-Kare Homojenlik testinde biri örneklemlerin ait olduğu değişken (grup değişkeni), diğeri incelenen değişken olmak üzere, birinin düzeyleri satırlarda diğerinin düzeyleri de sütunlarda olacak biçimde çapraz 206 tablo (kontenjans tablosu) olarak adlandırılan tablo oluşturulur. Bu çapraz tabloda oluşan hücrelerde ilgili birim sayısına (hücre frekansı) yer verilir. Ki-Kare homojenlik testi aşağıda verilen örnekle açıklanacaktır. Örnek 7.10 200 yetişkinden oluşan bir örneklem için sigara içme durumunun cinsiyete göre değişiklik gösterip göstermediğinin araştırıldığı bir çalışmada aşağıdaki gibi bir çapraz tablo oluşturulabilir: Tablo 7.5: 2x2 lik çapraz tablo Sigara İçme Durumu Cinsiyet İçiyor TOPLAM İçmiyor Erkek 55 34 25 46 80 Bayan 30 51 90 69 120 TOPLAM 85 115 200 Oluşturulan çapraz tabloda, gözlenen frekanslara karşılık beklenen (teorik) frekanslar hesaplanır ve gözlenen frekanslar ile beklenen frekanslar arasındaki farklara dayanan bir test istatistiği hesaplanır. Beklenen frekanslar şu şekilde hesaplanır: Örneğin erkek*içiyor hücresi için 55 gözlenen frekansa karşılık beklenen frekans, ilgili hücrenin satır toplamı ile sütun toplamı çarpılır ve toplam birim sayısı olan 200 değerine bölünür. Bu işlem yapıldığında beklenen frekans, (80)(85)/200 = 34 olarak hesaplanır. Diğer hücrelerin beklenen frekansları da benzer biçimde hesaplanır. Beklenen frekanslar da tabloda hücrelerin sağında italik olarak yazılmıştır. Test için hipotezler şu biçimde kurulur: H 0 = Erkek ve bayanlar sigara içme durumu bakımından homojendir. H1 = Erkek ve bayanlar sigara içme durumu bakımından heterojendir. = 0,05 alalım. Serbestlik derecesi, R satır sayısı, C sütun sayısı olmak üzere (R-1)(C-1)= (2-1)(21)= 1 olarak belirlenir. Test istatistiği aşağıdaki eşitlik yardımıyla hesaplanır: R C 2 (Gij Bij )2 Bij i 1 j 1 Formülde Gij : Gözlenen frekanslar, Bij : Beklenen frekanslardır. Buna göre örneğimiz için test istatistiği, 2 (55 34)2 (25 46)2 (30 51) 2 (90 69) 2 = 37,6 olarak bulunur. 34 46 51 69 Hesaplanan test istatistiği Ki-Kare tablo değeri, karar verilir. Örneğimiz için olduğundan (2 ;( R 1)(C 1)) tablo kritik değeri ile karşılaştırılarak 2 2 =37,6> 0,05;1 = 3,84 20,05;1 = 3,84 olarak belirlenir. Bu durumda, hesap H 0 reddedilir. Sonuç olarak erkek ve bayanların sigara içme durumu bakımından heterojen olduklarına (birbirine benzemediklerine) %95 güvenle karar verilir. 207 Özet İstatistiksel tahmin ve hipotez testleri istatistiğin çıkarsama işlevi ile ilgilidir. İstatistiksel tahmin, ana kütle parametrelerinin değerinin örneklem istatistikleri yardımıyla araştırılması çalışmalarıdır. İstatistiksel tahmin, nokta tahmini ve aralık tahmini olmak üzere iki grupta incelenmektedir. t-testi ve z-testi tek ve iki ana kütle aritmetik ortalamasına ilişkin testlerdir. İkiden çok ana kütle ortalamasına ilişkin test ise varyans analizi olarak adlandırılmaktadır. Ki-Kare testi iki ya da daha fazla grubun sınıflayıcı veya sıralayıcı ölçme düzeyinde ölçülmüş değişken bakımından farklılığını araştıran bir testtir. İstatistiksel hipotez, ana kütle parametreleri hakkında belirli bir amaca yönelik olarak ileri sürülen iddialardır. Hipotez testi, ana kütle parametreleri hakkındaki iddiaların doğruluğunun örneklem istatistikleri ve onların örnekleme dağılımının olasılık kurallarından yararlanarak test edilmesi işlemlerini gerçekleştirir. Hipotez testlerinde iki tür hata söz konusudur. Gerçekte doğru olan sıfır hipotezinin test sonucunda reddedilmesi I. Tip hata olarak adlandırılır. Bu hatayı işleme olasılığı anlamlılık düzeyidir. II. Tip hata gerçekte yanlış olan sıfır hipotezini reddetmemektir. Hipotez testinde şu aşamalar izlenir: Bir araştırma probleminin çözümlenmesinde kullanılacak tekniğin seçiminde değişkenlerin hangi ölçekle ölçülebileceğinin belirlenmesinin önemli olduğu ilk ünitede belirtilmişti. Sınıflayıcı ve sıralayıcı ölçekle ölçülebilen değişkenlerden elde edilen verilerle parametrik olmayan tekniklerden, aralıklı ve oranlı ölçekteki verilerle hem parametrik olmayan hem de parametrik tekniklerden yararlanılabilir. 1. Hipotezlerin ifade edilmesi 2. Anlamlılık düzeyi nın seçilmesi 3. Örnekleme dağılımının belirlenmesi 4. Red bölgesinin belirlenmesi 5. Test istatistiğinin Hesaplanması 6. İstatistiksel kararın verilmesi Hipotez testleri parametrik ve parametrik olmayan testler biçiminde iki temel gruba ayrılır. Parametrik testler, bazı varsayımları gerektiren testlerdir ve incelenen değişkenin en az aralıklı ölçme düzeyinde ölçülmüş olmasını gerektirirler. Parametrik olmayan testler, iddialı varsayım ileri sürmezler ve genellikle sınıflayıcı ve sıralayıcı ölçme düzeyindeki verilere uygulanırlar. Bu ünitede açıklanan t-testi, z-testi ve varyans analizi parametrik testlerdir. Ki-Kare testi ise parametrik olmayan testlerdendir. 208 Kendimizi Sınayalım 5. Anlamlılık düzeyi hangi hatayı işleme olasılığıdır? 1. Gerçekte doğru olan sıfır hipotezinin test sonucu reddedilmesi durumunda hangi hata işlenmiş olur? a. Sistematik hata b. Tesadüfi hata c. hatası d. hatası e. a. hatası b. hatası c. Standart hata d. Tesadüfi hata e. Sistematik hata Standart hata 2-4. sorular aşağıdaki cevaplandırılacaktır. probleme 6-8. sorular aşağıdaki cevaplandırılacaktır. göre probleme göre Zamanında doğum yapan, sigara içen kadınların çocuklarına ilişkin baş çevresi ortalamasının içmeyenlerin çocuklarına göre küçük olup olmadığı araştırılmak istenmiştir. Her iki gruptan tesadüfi olarak seçilen 10’ar kadının çocuklarının baş çevresi ölçümleri sonuçları aşağıdaki gibidir: Bir hastanede hasta memnuniyet oranı tahmin edilmek istenmektedir. Bu amaçla tesadüfi olarak 500 hasta ile görüşülmüştür. 300 hasta memnun olduğunu belirtmiştir. 2. Hastanenin memnuniyet oranının %95 güven sınırlarından üst sınır değeri kaçtır? Sigara içen (1) a. 0,75 X 1 =34 X 2 =37 b. 0,95 s12 =2,25 s22 =4,0 n1 =10 n2 =10 c. 0,56 d. 0,64 Sigara içmeyen (2) e. 0,05 6. Bu test için karşıt hipotez aşağıdakilerden hangisidir? 3. Oranın standart hatasının tahmin değeri aşağıdakilerden hangisidir? a. 1 2 b. 1 2 c. 1 2 d. 1 2 e. 1 2 a. 0,05 b. 0,04 c. 0,02 d. 0,06 e. 0,5 4. Hastanenin tahmini kaçtır? memnuniyet oranının nokta 7. Bu test için hesaplanacak test istatistiğinin değeri aşağıdakilerden hangisidir? a. 0,75 a. 3,80 b. 0,70 b. -3,80 c. 0,90 c. -4,80 d. 0,60 d. 4,80 e. 0,80 e. -2,80 209 8. 0,05 anlamlılık düzeyindeki test sonucunda aşağıdaki kararlardan hangisi doğrudur? Kendimizi Sınayalım Yanıt Anahtarı a. Sigara içen kadınların çocuklarına ilişkin baş çevresi ortalaması içmeyenlerin çocuklarına göre daha küçüktür 1. c Yanıtınız yanlış ise “Hipotez Testleri” başlıklı konuyu yeniden gözden geçiriniz. 2. d Yanıtınız yanlış ise “Ana kütle Oranına İlişkin Aralık Tahmini ” başlıklı konuyu yeniden gözden geçiriniz. b. Sigara içen kadınların çocuklarına ilişkin baş çevresi ortalaması içmeyenlerin çocuklarına göre daha büyüktür 3. c Yanıtınız yanlış ise “Ana kütle Oranına İlişkin Aralık Tahmini” başlıklı konuyu yeniden gözden geçiriniz. c. Sigara içen kadınların çocukları ile içmeyenlerin çocuklarının baş çevresi ortalaması aynıdır 4. d Yanıtınız yanlış ise “Nokta Tahmin” başlıklı konuyu yeniden gözden geçiriniz. d. Sigara içen kadınların çocukları ile içmeyenlerin çocuklarının baş çevresi ortalaması farklıdır 5. a Yanıtınız yanlış ise “Hipotez Testleri” başlıklı konuyu yeniden gözden geçiriniz. e. Sigara içen kadınların çocukları ile içmeyenlerin çocuklarının baş çevresi ortalaması benzerdir 6. d Yanıtınız yanlış ise “İki ana kütle ortalaması arasındaki farkın hipotez testi” başlıklı konuyu yeniden gözden geçiriniz. 9. Hipotez testlerinde işlenebilecek II.Tip Hata aşağıdakilerden hangisidir? 7. b Yanıtınız yanlış ise “İki ana kütle ortalaması arasındaki farkın hipotez testi” başlıklı konuyu yeniden gözden geçiriniz. a. Gerçekte doğru reddedilmesi olan b. Gerçekte doğru reddedilememesi olan c. Gerçekte doğru reddedilmesi olan sıfır hipotezinin sıfır hipotezinin 8. a Yanıtınız yanlış ise “İki ana kütle ortalaması arasındaki farkın hipotez testi” başlıklı konuyu yeniden gözden geçiriniz. karşıt hipotezinin 9. e Yanıtınız yanlış ise “Hipotez Testleri” başlıklı konuyu yeniden gözden geçiriniz. 10. c Yanıtınız yanlış ise “Varyans analizi” başlıklı konuyu yeniden gözden geçiriniz. d. Gerçekte yanlış reddedilmesi olan sıfır hipotezinin e. Gerçekte yanlış reddedilememesi olan sıfır hipotezinin 10. İkiden çok ana kütle ortalamasına ilişkin test aşağıdakilerden hangisidir? Sıra Sizde Yanıt Anahtarı Sıra Sizde 1 a. t-testi Aralık tahmininde, ana kütle parametresinin belirli bir olasılık düzeyinde içerisinde yer alabileceği bir aralık belirlenir. Belirtilen olasılık düzeyi, tahminin doğruluğundan ne kadar emin olunacağını belirtir ve aralığı oluşturan güven sınırlarının belirlenmesinde kullanılır. Aralık tahmininde oluşacak aralığa “güven aralığı”, aralığın alt ve üst sınır değerlerine ise “güven sınırları” adı verilir. b. z-testi c. F-testi d. Ki-Kare testi e. Oran testi 210 α: Birinci tip hatayı işleme olasılığı, Sıra Sizde 2 A İlacı (1) β: İkinci tip hatayı işleme olasılığı, B İlacı (2) X 1 =15 dk. X 2 =11dk. s12 =12,25 dk. s22 =5,29 dk. n1 =16 n2 =12 1-α: reddetmeme olasılığıdır ve aralık tahmininde olduğu gibi “Güven Düzeyi” olarak adlandırılır. 1-β: Sıra Sizde 4 Red bölgesinin büyüklüğü Tip I hata olasılığı olan α’ya bağlıdır. Buna göre anlamlılık düzeyinin belirlenmesiyle red bölgesinin büyüklüğü de ortaya çıkmış olur. Karşıt hipotez ise, red bölgesinin yerini belirlemede yardımcı olur. Karşıt hipotez, ana kütle ortalamasının iddia edilen değerinden büyük ya da küçük bir değer olduğu biçiminde ise, yani tek taraflı bir test gerçekleştirilecekse, red bölgesi birinci durumda dağılımın pozitif (sağ) ucunda yer alır. İkinci durumda ise dağılımın sağ ucunda gösterilir. Eğer karşıt hipotez ana kütle ortalamasının iddia edilen değerinden farklı olduğu biçiminde ise, red bölgesi dağılımın iki ucunda olmak üzere iki eşit bölgede yer alır. n1 n2 2 serbestlik derecesi için “kritik t değerleri tablosu”ndan bulunacak t değerleri kullanılır. Buna göre, 2 ;( n1 n2 2) t0.005;(16122) = 2,779 değeri belirlenir. Ana kütle standart sapmaları bilinmediğinden örneklem standart sapmalarından yararlanarak %95 güven sınırları aşağıdaki gibi belirlenir: sx1 x2 (n1 1) s12 (n2 1) s22 n1 n2 2 1 1 = n1 n2 (16 1)12, 25 (12 1)5, 29 1 1 = 1,36 16 12 2 16 12 = 1,16 P[( X1 X 2 ) t 2 s ;( n1 n2 2) x1 x2 1 2 ( X1 X 2 ) t Pr((15-11)-(2,779)(1,16) < 2 s ;( n1 n2 2) x1 x2 H 0 gerçekte yanlış olduğunda onu reddetme olasılığıdır ve “Testin Gücü” olarak adlandırılır. Tahmin %99 güvenle yapılacağından, ana kütle ortalamaları arasındaki farkın tahmininin güven düzeyi (1- ) 0,99 olacaktır. Örneklem hacimleri küçüktür (n1 ve n2<30). Bu durumda, t dağılımından yararlanarak, ilgili güven düzeyi ve t H 0 gerçekte doğru olduğunda onu Yararlanılan Kaynaklar ] 1 Alpar, R. (2011). Uygulamalı Çok Değişkenli İstatistiksel Yöntemler. Ankara: Detay Yayıncılık. 1 2 < (15-11)+(2,779)(1,16))=0,99 Çömlekçi, N. (1998). Temel İstatistik İlke ve Teknikleri. İstanbul: Bilim Teknik Yayınevi. Pr(0,78< 1 2 <7,22)=0,99 Çömlekçi, N. (2003). Deney Tasarımı İlke ve Teknikleri. İstanbul: Alfa Basım Yayın Dağıtım. A ve B gibi iki ilacın ortalama etki sürelerinin arasındaki fark, %99 güvenle 0,78 dk ile 7,22 dk arasında herhangi bir değer alır. Gürsakal, N. (2007). Çıkarımsal İstatistik, Bursa: Dora Basım Yayın Dağıtım. Sıra Sizde 3 Lwanga, S.K. and Tye, C.Y. (1986) Teaching Health Statistics. Geneva: World Health Organization. I. TİP HATA: Gerçekte doğru olan sıfır hipotezini test sonucunda yanlıştır diye reddetmeye I. Tip Hata adı verilir. α-Hatası olarak da adlandırılan bu hatayı işleme olasılığı α kadardır. Serper, Ö (2004). Uygulamalı İstatistik 2. Bursa: Ezgi Kitabevi. II. TİP HATA: Gerçekte yanlış olan sıfır hipotezini test sonucunda doğrudur diye “reddedilemez” kararı vermeye II. Tip Hata adı verilir. β-Hatası olarak da adlandırılan bu hatayı işleme olasılığı da β kadardır. Dolayısıyla; 211 8 Amaçlarımız Bu üniteyi tamamladıktan sonra; Korelasyon ve regresyon kavramlarını açıklayabilecek, İki değişken arasındaki korelasyonu hesaplayabilecek, Regresyon denkleminin nasıl kurulacağını ifade edebilecek bilgi ve becerilere sahip olabilirsiniz. Anahtar Kavramlar Korelasyon Sıra korelasyon Regresyon Belirlilik katsayısı Bağımlı değişken Bağımsız değişken İçindekiler Giriş Korelasyon kuramı Pozitif ve negatif korelasyon Ana kütle ve örneklemden korelasyon katsayısı Sıra korelasyon katsayısı Basit doğrusal regresyon analizi Belirlilik katsayısı Eğim katsayısının anlamlılık testi Excel uygulamaları 212 Korelasyon ve Regresyon Analizi GİRİŞ Bölüm 7’de sözel değişkenler arasındaki ilişkinin Ki-Kare analiziyle belirlenebileceği ifade edilmişti. Eğer değişkenler sayısal ise, bu değişkenler arasındaki ilişkinin belirlenmesi “korelasyon analizi” nin konusudur. Korelasyon analizi x ve y gibi herhangi iki değişken arasındaki ilişkinin yönünü (aynı veya ters yönlü) ve derecesini (kuvvetli veya zayıf) verir. Oysa çoğu analizde, değişkenler arasındaki ilişkinin matematiksel bir fonksiyonla da ifade edilmesi istenir. Yani bağımlı ve bağımsız değişken(ler) arasındaki ilişkinin sabit terimi ve eğim katsayısı belirlenmek istenir. İşte bunu sağlayan analize de “regresyon analizi” adı verilir. Bu ünitede de önce korelasyon analizi anlatılacak, daha sonra da korelasyonun yeterli olmadığı durumlardan bahsedilerek, daha ayrıntılı analizler yapılmasını sağlayan regresyon analizi açıklanacaktır. KORELASYON KURAMI Aralarında ilişki araştırılan değişkenlerden birinde değerler azalırken, diğerinin değerleri de azalıyorsa ya da değişkenlerden birinin değerleri artarken diğerinin değerleri de artıyorsa (veya zıt yönlü değişmeler gösteriyorsa), bu değişkenler arasında bir ilişki olduğu söylenebilir. Çünkü bu durumda değişkenlerin birinin değerlerindeki değişmeler diğerinin değerlerindeki değişmelerden etkileniyor demektir. Buna karşılık birinin değerleri azalır veya çoğalırken diğerinin değerleri hiç değişmiyorsa, değişkenler arasında bir ilişkinin varlığından söz edilemez. Örneğin öğrencilerin bir derse ilişkin çalışma süresi arttıkça, başarı notları da yükselecektir. Buna karşın özel hastanelerin tedavi ücretleri arttıkça, bu hastaneye olan talep azalacaktır. Değişkenler arasında var olan ilişkileri ölçmek için çeşitli teknikler kullanılabilir. Bunlardan en basiti ise “korelasyon analizi” dir. Korelasyon iki ya da daha çok değişken arasındaki ilişkinin derecesi olarak tanımlanabilir. İki değişken arasındaki ilişkinin derecesine ise ”basit korelasyon” denir. Bir serpilme çiziminde (diyagramında), bütün (xi,yi) noktaları bir doğruya yakın yerlerde toplanıyorlarsa korelasyon “doğrusaldır”. Anlaşılacağı gibi eğer değişkenler arasında bir ilişki varsa, bu ilişki pozitif (aynı yönlü) veya negatif (ters yönlü) olabilir. Pozitif ve Negatif Korelasyon İki değişken aynı yönde birlikte değişiyorlarsa, yani değerleri birlikte artıp birlikte azalıyorlarsa, aralarında pozitif korelasyon var demektir. Örneğin, büyük bir yerleşim yerinde nüfus arttıkça, hastane sayısı da artar. Dolayısıyla bir yerleşim yerinin nüfusuyla, hastane sayısı arasında aynı yönlü yani pozitif bir ilişki var demektir. Örneğin, y ve x değişkenleri için veriler Tablo 8.1’deki gibi elde edilmiş olsun. Tablo 8.1’deki veriler incelendiğinde değişkenlerin her ikisinin de birlikte arttığı görülmektedir. Bu verilerin bir grafiği çizildiğinde de Şekil 1’deki gibi doğrusal artan bir grafik elde edilecektir. 213 Tablo 8.1: Pozitif Doğrusal Korelasyon İçin Veri Tablosu yi xi 5 120 8 123 12 125 15 128 17 132 20 134 22 138 25 140 28 145 30 152 Şekil 8.1: Pozitif Doğrusal Korelasyon Grafiği İki değişken ters yönlerde değişme eğilimi gösteriyorlarsa, negatif korelasyonlu oldukları ifade edilir. (xi) arttığında (yi) azalıyorsa ya da tersi söz konusu olduğunda x ve y değişkenleri arasında ters yönlü yani negatif bir ilişki var demektir. Örneğin özel bir hastanenin hastalara sunduğu hizmet bedeli arttığında hasta sayısında bir azalma oluyorsa, bu durumda bu değişkenler arasında negatif yönlü bir ilişkiden söz edilir. Tablo 8.2’deki verilerin grafiği Şekil 8.2’de verilmiştir. Şekil 8.2’den de görüleceği gibi değişkenler arsında ters yönlü bir ilişki vardır. Tablo 8.2: Negatif Doğrusal Korelasyon İçin Veri Tablosu yi xi 5 152 8 12 145 140 15 17 138 134 20 22 132 128 25 28 125 123 30 120 214 Şekil 8.2: Negatif Doğrusal Korelasyon Grafiği Ana Kütle ve Örneklem Korelasyon Katsayısı İki değişken arasındaki korelasyonun yönünü, doğrudan serpilme çizimine bakarak belirleyebiliriz. Ancak, bir serpilme çiziminin incelenmesi, x ve y değişkenleri arasındaki ilişki hakkında yaklaşık bir fikir verebilir. x ve y değişkenleri arasındaki korelasyonun derecesini tam ve sayısal olarak ölçmek için “korelasyon katsayısı” adıyla anılan ve genellikle Yunanca harf " " (ro) ile gösterilen bir parametre kullanılır. , ana kütle korelasyon katsayısını ifade eder. Bunun belli bir örneklemden kestiricisi (tahmincisi) ise “r” harfiyle gösterilir. Korelasyon katsayısı x ve y değişkenlerinin ne derece birlikte değiştiklerinin bir ölçüsüdür ve alabileceği değerler –1 ve 1 arasında değişir. Korelasyon katsayısı pozitif ise, x ve y birlikte artar ya da azalırlar. Korelasyon katsayısının negatif olması ise x ve y arasında ters yönlü bir ilişki olduğunu ifade eder. Korelasyon katsayısının +1 ya da –1 değerlerine yakın olması değişkenler arasında çok kuvvetli bir ilişki olduğunu, sıfıra yakın olması ise değişkenler arasında hiç bir ilişki olmadığını ifade eder. Ana kütle korelasyon katsayısı, N (x x )( yi y ) i i N (x x )2 i i (y i veya y )2 i ( xi xi X , ' x y ' i N yi' yi Y ) olmak üzere ' i x y '2 i '2 i şeklinde belirlenir. Ancak çoğu durumda ana kütle verileri elde edilemeyeceğinden, örneklem korelasyon katsayısı benzer şekilde aşağıdaki gibi hesaplanır: n r (x i i n (x i x)2 i ( xi' xi x , x y ' i x )( y i y ) = n (y ' i i y )2 i x y '2 i yi' yi y ) 215 '2 i Örnek 8.1: Özel bir hastanenin yıllık reklam harcamaları ve hastaneye gelen hasta sayıları Tablo 8.1’deki gibi elde edilmiş olsun. Buna göre bu iki değişken arasındaki örneklem korelasyon katsayısını hesaplayarak yorumlayınız. (Bu unite içinde aksi belirtilmedikçe, tüm soru ve örnek verileri, örneklem için olacaktır.) Tablo 8.3 Reklam Harcamaları ve Hasta Sayıları Hasta Sayısı (Bin Kişi) (yi) 10 12 13 15 17 19 22 Reklam Harcaması (Milyon TL) (xi) 1,2 1,5 2,2 2,6 3,2 3,5 3,6 Çözüm 8.1 Korelasyon katsayısının hesaplanabilmesi için öncelikle değişkenlere ait ortalamalara ihtiyaç vardır. Bu ortalamalar hesaplandığında x 2,56 , y 15, 43 olarak bulunacaktır. Ortalamalardan sapmalar ve diğer gerekli hesaplamalar da Tablo 8.4’de verilmiştir. Tablo 8.4: Örneklem Korelasyon Katsayısı İçin Gerekli İşlemler Tablosu yi xi 10 12 13 15 17 19 22 Toplam 1,2 1,5 2,2 2,7 3,2 3,5 3,6 yi' yi y xi' xi x yi'2 xi'2 xi' yi' -5,43 -3,43 -2,43 -0,43 1,57 3,57 6,57 -1,36 -1,06 -0,36 0,14 0,64 0,94 1,04 29,48 11,76 5,90 0,18 2,46 12,74 43,16 105,68 1,85 1,12 0,13 0,02 0,41 0,88 1,08 5,49 7,38 3,64 0,87 -0,06 1 3,36 6,83 23,02 Gerekli toplamlar örneklem korelasyon formülünde yerine yazıldığında korelasyon katsayısı, r x y ' i ' i x y '2 i r '2 i 23, 02 23, 02 5, 49. 105, 68 2,34(10, 28) 23, 02 0,96 24, 06 olarak hesaplanır. Görüldüğü gibi korelasyon katsayısının değeri pozitif ve oldukça yüksek bir değerdir (1’e çok yakındır). O halde, reklam harcamalarıyla hastaneye gelen hasta sayıları arasında aynı yönlü (pozitif) ve oldukça kuvvetli bir ilişki vardır. 216 Aşağıdaki veriler için korelasyon katsayısını hesaplayarak yorumlayınız. yi: 81 85 88 92 95 102 105 110 xi: 28 25 20 18 19 16 12 10 Sıra Korelasyon Katsayısı Birçok durumda değişkenler sayısal olarak ölçülemez. Örneğin meslek, hastanın sosyal güvence durumu, çeşitli marka tercihleri v.b değişkenler sözel değişkenlerdir. Diğer taraftan, bazı durumlarda gözlem değerlerine “sıra numarası“ verilmesi daha uygun olabilir veya gözlem değerleri herhangi bir ölçüte göre zaten sıralanmış olabilir. Değişkenlerin değerleri yerine sıralarının önem kazandığı böyle durumlarda doğrusal korelasyon katsayısı yerine, “sıra korelasyon katsayısı“ (Spearman korelasyon katsayısı) kullanılır. Sıra korelasyon katsayısının hesaplanmasında gözlemler, büyüklük, önem vb. özelliklerine göre sıraya dizilir. Bir başka deyişle verilere sıra numarası verilir ve gerçek sayısal değerleri yerine bu sıra numaraları arasındaki ilişki belirlenmeye çalışılır. Bazen de veriler zaten sıralanmış olarak elde edilir. Örneğin hastalar A bölgesinde bulunan hastaneleri, çeşitli kriterlere göre 1 nci, 3 ncü, 4 ncü v.b sıralayabilirler. Sıra korelasyon katsayısı aşağıdaki formülle hesaplanır: rs 1 6 d i2 n(n 2 1) Formüldeki, di:sıralamalar arasındaki fark, n:gözlem sayısı’dır. Örnek 8.2: Z hastanesinde yatarak tedavi gören hastalar için bir X ürünü kullanılmaktadır. Ancak bu X ürününün 6 faklı markası bulunmaktadır. Hastane yönetimi bu ürünleri iki hastaya uygulayarak, memnuniyet derecelerine göre, tercihlerini sıralamalarını istemiştir. İki hasta bu 6 farklı ürün için tercihlerini Tablo 8,5’deki gibi sıralamışlardır. Tercih sıralamaları arasında bir ilişki olup olmadığını belirleyiniz. Tablo 8.5: İki Hastanın Tercih Sıralamaları Markalar A B C D E F 1.Hastanın Tercih Sıralaması 5 3 1 6 2 4 2.Hastanın Tercih Sıralaması 6 3 1 5 2 4 Çözüm 8.2: Sıra korelasyon katsayısının hesaplanabilmesi için öncelikle tercih sıralamaları arasındaki farkın 2 ( d i ) belirlenmesi gerekir. Daha sonra da d i değerleri hesaplanarak, bunların toplamı alınacaktır. Bu işlemleri Tablo 8.6’ da verilmiştir. 217 Tablo 8.6: Sıra Korelasyon İçin Gerekli İşlemler Tablosu Markalar A B C D E F Toplam n=6 ve d 2.Hastanın Tercih Sıralaması 4 3 1 5 2 6 di d i2 -1 0 0 1 0 2 1 0 0 1 0 4 6 6 olduğuna göre sıra korelasyon katsayısının değeri, 2 i rs 1 1.Hastanın Tercih Sıralaması 5 3 1 6 2 4 6 d i2 n(n 1) 2 1 6(6) 36 36 1 1 1 0,17 2 6(6 1) 6(35) 210 rs 0,87 olarak hesaplanacaktır. Bu durumda, iki hastanın tercih sıralamaları arasında aynı yölü ve kuvvetli bir ilişki vardır. Korelasyon katsayısı, değişkenlerin birlikte değişiminin bir ölçüsü olmakla birlikte, ilgili değişkenler arasında fonksiyonel bir ilişki kurmaz. Yani hangi değişkenin bağımlı, hangi değişkenin bağımsız değişken olduğunu göstermez. Sadece değişkenler arasındaki ilişkinin yönünü ve derecesini vermektedir. Ayrıca korelasyon analizi ilişkinin katsayıları hakkında sayısal değerler vermez. Yani fonksiyonun eğimi ve sabit terimi için tahminler yapmaz. Bundan dolayı, sayısal iki değişken arasındaki ilişkinin matematiksel bir fonksiyonla ifade edilmesini sağlayacak olan, regresyon analiziyle çözümleme yapılır. BASİT DOĞRUSAL REGRESYON ANALİZİ Korelasyon analizinde bir değişkenin bağımlı veya bağımsız değişken konumunda olması hiç önemli olmamasına rağmen, regresyon analizinde bağımlı ve bağımsız değişken kavramları çok önemlidir. O halde bağımlı ve bağımsız değişken kavramlarını kısaca tanımlayalım. Sonuç niteliğindeki değişkene “bağımlı (açıklanan) değişken”, “neden” niteliğindeki değişkene ise “bağımsız (açıklayan) değişken” adı verilir. Örneğin, özel bir hastaneye gelen hasta sayısı arttıkça, hastanenin geliri de artacaktır. O halde hasta sayısı “neden” durumunda olduğu için “bağımsız değişken”, hastane geliri de “sonuç” niteliğinde olduğu için “bağımlı değişken” konumunda olacaktır. Bağımlı değişken “y”, bağımsız değişken de “x” olmak üzere, N birimli bir ana kütle için regresyon denklemi yˆi b0 b1 xi i=1, 2, 3,..........., N şeklinde yazılır. Bu denkleme “y’nin x’e göre regresyon doğrusu” adı verilir. Denklemdeki; b0 :Sabit terim (y eksenini kestiği nokta), b1 : Eğim katsayısı’dır. Bu katsayı bağımsız değişkendeki bir birimlik değişimin, bağımlı değişken üzerindeki artış veya azalış olarak yaptığı etkiyi gösterir. 218 Ancak tüm istatistik çalışmalarında olduğu gibi, genellikle ana kütlenin tamamı gözlemlenemediğinden, n birimlik örneklem seçilerek analiz yapılır. n birimlik örneklem için regresyon doğrusu denklemi ise “en küçük kareler tekniği” ne göre aşağıdaki gibi tahmin edilir: yˆi bˆ0 bˆ1 xi i=1, 2, 3, ............., n Denklemdeki; ŷi :x’in belli bir değeri için y’nin kestiricisi, b̂0 :b0’ın kestiricisi, b̂1 :b1’ın kestiricisi’dir. Regresyon doğrusu denklemi için önce eğim katsayısı ( b̂1 ) değeri xi' yi' bˆ1 xi'2 formülüyle belirlenir. Eğim katsayısı, “regresyon katsayısı” olarak da isimlendirilir. Daha sonra da sabit terim aşağıdaki gibi hesaplanır: bˆ0 y bˆ1 x Örnek 8.3: Örnek 8.1’deki veriler için örneklem regresyon denklemini belirleyiniz. Çözüm 8.3: Regresyon denkleminin belirlenebilmesi için eğim (regresyon) katsayısı ve sabit terim için formüllerdeki gerekli toplamlar Tablo 8.4’te verilmişti. O halde bu toplamlar yardımıyla önce eğim katsayısı hesaplanacaktır. xi yi 23, 02 4,19 bˆ1 xi'2 5, 49 ' ' Değişkenlere ait ortalamalar da daha önce, x 2,56 , y 15, 43 olarak elde edilmişti. O halde bu değerler sabit terim formülünde yerine yazıldığında, sabit terimin kestirim değeri aşağıdaki gibi bulunacaktır: bˆ0 y bˆ1 x 15, 43 (4,19).2,56 15, 43 10,73 4,70 Dolayısıyla regresyon denklemi, yˆi 4,70 4,19.xi olacaktır. Bu denklemin anlamı şudur: Bağımsız değişken (x) bir birim arttığında (azaldığında bağımlı değişken 4,19 birim artacaktır (azalacaktır). Başka bir ifadeyle reklam harcamalarındaki 1 milyon TL’lik bir artış hastaneye gelen hasta sayısını 4,19 birim (4,19*1000=4190 kişi) artıracaktır. Herhangi bir reklam harcaması yapılmadığında ise (x=0 olduğunda) hastaneye gelen hasta sayısının 4,70 birim (4,70*1000=4700 kişi) olması beklenir. 219 Sıra sizde 1”deki veriler için örneklem regresyon doğrusu denklemini belirleyiniz. Belirlilik Katsayısı (r2) Regresyon doğrusu belirlendikten sonra bağımsız değişkenin, bağımlı değişkeni hangi oranda açıkladığının da bilinmesi gerekir. Eğer bağımsız değişkenin, bağımlı değişkeni açıklama oranı yüksek ise, bağımsız değişken önemli bir değişken demektir ve denklemde yer almalıdır. Bağımsız değişkenin, bağımlı değişkeni açıklama oranı ise, korelasyon katsayısının karesi olan ve “Belirlilik Katsayısı” olarak isimlendirilen r2 değeridir. Belirlilik katsayısının sınırları da 0 r 2 1 dir. Örnek 8.4: Örnek 8.1’deki veriler için belirlilik katsayısını hesaplayarak yorumlayınız. Çözüm 8.4: Örnek 8.1’deki veriler için korelasyon katsayısı 0,96 olarak hesaplanmıştı. Belirlilik katsayısı da korelasyon katsayısının karesi olduğuna göre, r 2 0,962 0,92 olarak hesaplanacaktır. O halde bağımsız değişken (reklam harcaması), bağımlı değişkeni (hastaneye gelen hasta sayısı) % 92 oranında açıklamaktadır. Bu oldukça yüksek bir orandır. Dolayısıyla hastane için yapılan reklam harcamaları, hastaneye gelen hasta sayılarındaki artış için oldukça etkilidir. Belirlilik katsayısı, bağımsız değişkenin bağımlı değişken üzerindeki etkisi konusunda bir fikir vermekle beraber, bağımsız değişkenin anlamlı (önemli) olduğunu kesin olarak belirtmez. Bunun için de eğim katsayısının anlamlılık testi yapılmalıdır. Eğim (Regresyon) Katsayısının Anlamlılık Testi Regresyon denklemindeki tüm katsayıların anlamlılık testleri yapılabilir. Ancak sabit terimin anlamlılığı çok önemli olmadığından bu ünitede sadece eğim katsayısının anlamlılık testi anlatılacaktır. Eğer eğim katsayısı anlamlıysa, bağlı olduğu bağımsız değişken anlamlı demektir. Dolayısıyla bu bağımsız değişken, bağımlı değişkeni açıklamada önemli bir değişkendir. Eğim katsayısının anlamlılık sınamaları da iki şekilde yapılır. Bunlar z ve t sınamalarıdır. Ancak ana kütle varyansı genellikle bilinmediğinden ve n<30 olduğundan, t testi uygulanır. Hipotezler, H0:b1=0 (katsayı anlamsız) H1:b1 0 (katsayı anlamlı) olmak üzere, test istatistiği ise, th bˆ1 ˆ bˆ 1 olarak belirlenecektir. Test istatistiğinin paydasında yer alan değere ise standart hata kestiricisi denir ve aşağıdaki gibi belirlenir: ˆ bˆ se 1 1 xi'2 220 Artıkların standart sapması olan se değeri de, se ( y yˆ ) i 2 i n2 e 2 i n2 formülüyle belirlenir. Buna “tahminin standart hatası” da denir. ei = yi yˆi olarak hesaplanır ve “artık terimi” olarak ifade edilir. Formülden de görüldüğü gibi artık terimleri bağımlı değişkenin gözlem değerlerinden, regresyon denklemi yardımıyla tahmin edilen değerlerin çıkartılmasıyla elde edilirler. Şunu unutmamak gerekir ki artık değerlerinin toplamı daima sıfırdır. Bunların kareleri toplamına ise “artık kareler toplamı” denir ( ei2 ) . Test istatistiğinin değeri de belirli bir anlam düzeyi ve (n-2) serbestlik derecesi ile tablo değeriyle karşılaştırılır. Eğer sıfır hipotezi reddedilirse eğim katsayısının anlamlı, yani bağımsız değişkenin bağımlı değişkeni açıklamakta önemli olduğu sonucuna varılır. Örnek 8.5: Örnek 8.1’deki veriler için yˆ i , artık ( ei )değerlerini ve artık kareler toplamını hesaplayınız. Çözüm 8.5: Bundan önce de ifade edildiği gibi yˆ i değerleri regresyon denklemi yardımıyla hesaplanacak değerlerdir. Daha önce regresyon denklemi yˆi 4,70 4,19.xi şeklinde elde edilmişti. Bağımsız değişkenin değerleri denklemde yerine yazılarak, y’nin kestirim değerleri hesaplanır. O halde 1. kestirim değeri yˆ1 4, 70 4,19.x1 yˆ1 4, 70 4,19.(1, 2) yˆ1 4, 70 5, 03 yˆ1 9, 73 olarak hesaplanacaktır. x2’nin değeri olan 1,5 denklemde yerine yazıldığında da yˆ 2 4, 70 4,19.(1,5) yˆ 2 4, 70 6, 29 yˆ 2 10,99 değeri bulunur. Daha sonra sırasıyla bağımsız değişkenin değerleri denklemde yerine yazıldığında, Tablo 8.7’deki değerler elde edilecektir. Artık değerlerinin ise ei yi yˆi formülüyle belirleneceği ifade edilmişti. O halde 1. artık değeri e1 y1 yˆ1 e1 10 9, 73 e1 0, 27 olacaktır. 2. Artık değeri ise benzer şekilde aşağıdaki gibi hesaplanır: 221 e2 12 10,99 e2 1, 01 Diğer artık değerleri ve bunların kareleri yine Tablo 8.7’de verilmiştir. Artıkların kareleri alınarak toplandığında da artık kareler toplamı, e 2 i 9, 26 olarak bulunur. Tablo 8.7: yˆ i , artık ( ei ) ve artık karelerinin değerleri. yi xi yˆ i ei ei2 10 12 13 15 17 19 22 Toplam 1,2 1,5 2,2 2,7 3,2 3,5 3,6 9,73 10,99 13,92 16,01 18,11 19,37 19,78 0,27 1,01 -0,92 -1,01 -1,11 -0,37 2,22 0,07 1,02 0,85 1,02 1,23 0,14 4,93 9,26 Örnek 8.6 Örnek 8.1’deki veriler için eğim katsayısının anlamlılığını %5 anlam düzeyinde test ediniz. Çözüm 8.6 Bu bir hipotez testi olduğuna göre önce hipotezler yazılmalıdır. Hipotezler ise konunun başında belirtildiği gibi, H0:b1=0 (eğim katsayı anlamsız) H1:b1 0 (eğim katsayı anlamlı) şeklinde ifade edilir. Ana kütle varyansı bilinmediği için ve n<30 olduğundan dolayı th bˆ1 ˆ bˆ 1 test istatistiği kullanılacaktır. Eğim katsayısı 4,19 olarak bulunmuştu. O halde paydada yer alan ˆ bˆ 1 değerinin hesaplanması gerekir. Bunun için de öncelikle se değeri belirlenmelidir. Artık kareler toplamı 9,26 olduğuna göre, se e 2 i n2 9, 26 9, 26 72 5 se 1,85 1,36 değeri elde edilecektir. Dolayısıyla eğim katsayısı için standart hatanın kestirim değeri de 222 ˆ bˆ se 1 1 1 1,36 '2 5, 49 xi ˆ bˆ 0,58 1 olarak hesaplanır. Buradan da test istatistiğinin değeri aşağıdaki gibi bulunur: th bˆ1 4,19 = ˆ bˆ 0,58 1 th 7, 22 Hesaplanan test istatistiğinin 7,22 değeri, %5 anlam düzeyi ve n-2=7-2=5 serbestlik dereceli Student t tablo değeri 2,571’den büyük olduğundan, sıfır hipotezi reddedilecektir. Dolayısıyla eğim katsayısının anlamlı olduğuna karar verilecektir. Buradan da bağımsız değişken olan reklam harcamalarının, hastaneye gelen hasta sayısında etkili olduğu sonucuna ulaşılacaktır. Ayrıca bu denklem x’in çeşitli değerleri için, y’nin alabileceği değerlerin tahmininde de kullanılabilir demektir. Örneğin reklam harcaması 4 milyon TL olduğunda, hastaneye gelecek hasta sayısı yˆ 4, 70 4,19.(5) yˆ 4, 70 20, 95 yˆ 25, 65 (25,65*1000)=21460 kişi olarak tahmin edilir. “Sıra sizde 1”deki verileri kullanarak, eğim katsayısının anlamlılığı için test istatistiğinin (t) değerini hesaplayınız. 223 EXCEL UYGULAMALARI Excel’de regresyon analizinin yapılabilmesi için “veri çözümleme” nin kurulu olması gerekir. Her zaman olduğu gibi yeni bir çalışma sayfası açılarak önce veriler girilir. Örnek uygulama için Tablo 8.3’deki verileri girelim. Önce “veri” menüsü, daha sonra da “veri çözümleme” menüsü tıklanır. Karşımıza çıkan pencereden yapmak istediğimiz analiz olan “korelasyon” tıklanır. Daha sonra korelasyonu hesaplanacak değişkenler seçilir ve “Tamam” tıklanarak sonuca ulaşılır. Bu işlemler ayrıca aşağıda da gösterilmiştir. 224 Tablo 8.8: Korelasyon İçin Excel Çıktısı Bu değer yuvarlatıldığında 0,96 olacaktır. Örnek çözümde de 0,96 olarak bulunduğu görülecektir. 225 Şimdi de Tablo 8.3.’deki veriler için regresyon analizi uygulaması yapalım. Regresyon analizi için de, “veri” ve “veri çözümleme” menüsü tıklanır. Karşımıza çıkan pencereden yapmak istediğimiz analiz olan “regresyon” tıklanır. Daha sonra bağımlı değişken “Y Giriş Aralığı”na, bağımsız değişken de “X Veri Aralığı”na girilir. “Tamam” tıklanarak “ÖZET ÇIKIŞI” olarak belirtilen sonuç tablosuna ulaşılır. Bu işlemler de yine aşağıda ayrıntılı olarak gösterilmiştir 226 Tablo 8.9: Basit Regresyon İçin Excel Çıktısı 227 Tablo 8.9’daki “Özet Çıkışı” olarak ifade edilen sonuçların ne anlama geldiğini kısaca açıklayalım: Çoklu R : r değeridir. Bu değer örnek çözümde de 0,96 olarak hesaplanmıştı. (Çoklu R, çoklu korelasyon katsayısı olmasına rağmen, basit korelasyon için de aynı şekilde ifade edilmektedir. Bu ayırımı analizi yapan kişi yapacaktır). R Kare: r2 değeridir. Ayarlı R Kare: Düzeltilmiş çoklu belirlilik katsayısıdır ve çoklu regresyon analizinde kullanılır. Standart Hata: se değeridir. “Katsayılar sütunu”, denklemin sabit terimini ve değişkenlere ait tahmin edilen katsayıları verir . Sabit terim 4,72 ve eğim katsayısı ise 4,19’dur. Örnek çözümde sabit terim 4,70 olarak bulunmuştu. Meydana gelen bu çok az fark, ortalamalar ve eğim katsayısının yuvarlatılmış değerler alınmasındandır. Bu değerler tam olarak alınırsa yine 4,72 olarak bulunacaktır. “Standart hata” sütunu ise katsayılara ilişkin standart hata kestirimlerini verir ( ˆ ˆ 0,58 ). Katsayılar b 1 sütunu standart hata sütunundaki değerler bölündüğünde ise test istatistiği olan t değerleri elde edilir. “F” denklemdeki tüm katsayıların aynı anda anlamlılığı için hesaplanan test istatistiğidir. “P değeri” sütunu ise katsayıların anlamlı olup olmadığını belirtir. 1-P değeri katsayıların % kaç anlamlı olduğunu ifade eder. Gerçek uygulamalarda ise, bağımlı değişkeni etkileyen çok sayıda bağımsız değişken alınarak analiz yapılır. Bağımsız değişken sayısının iki ve daha fazla olduğu regresyon analizine ise “çoklu regresyon” adı verilir. Bağımsız değişken sayısının üç veya daha fazla olması durumunda ise elle çözüm yapmak neredeyse imkansız hale gelir. Böyle durumlarda istatistik paket programlarının veya Excel’in kullanılması zorunludur. Burada da iki bağımsız değişken için bir analiz yapılacaktır. Çoklu regresyon konusunda ayrıntılı bilgi sahibi olmak isteyen öğrenciler, aşağıda belirtilen kaynaktan yararlanabilirler. Basit regresyon ve çoklu regresyon hakkında daha ayrıntılı bilgi sahibi olabilmek için Ümit Şenesen ve Gülay Günlük Şenesen’nin çevirisini yaptığı, A. Koutsoyiannis’in Verso yayınevi tarafından basılmış olan “Ekonometri Kuramı (1999) adlı kitabını okuyabilirsiniz. Tablo 8.10: Çoklu Regresyon Analiz Verileri. yi 125 139 135 142 178 196 198 200 219 225 x1i 700 715 723 732 740 751 756 762 768 775 x2i 23 24 25 26 26 27 29 29 30 32 Çoklu regresyon analizi için işlemler aynı basit regresyondaki gibidir. Farklı olarak sadece bağımsız değişkelerin her ikisi (ya da daha fazla) de “X Veri Aralığı”na girilir. “Tamam” tıklanarak “ÖZET ÇIKIŞI” olarak belirtilen sonuç tablosu elde edilir. 228 Tablo 8.11: Çoklu Regresyon İçin Excel Çıktısı Çıktı sonuçlarından da görüldüğü gibi, tek bağımsız değişkenli analizden farklı olarak “X değişkeni 2” satırı görülmektedir. Sonuçlara ilişkin açıklamalar basit regresyon içinde verildiğinden, burada tekrar edilmeyecektir. 229 Özet Çoğu zaman değişkenler arasındaki ilişkinin yönü ve derecesi dışında, daha ayrıntılı analizlere ihtiyaç duyulur. Böyle durumlarda da “regresyon analizi” ne başvurulur. Regresyon analizinde amaç, önceden belirlenen bağımlı değişken ve bağımsız değişken (değişkenler) arasındaki ilişkiyi, matematiksel bir fonksiyonla yazmaktır. Değişkenler arasındaki regresyon denklemi belirlendikten sonra, bu denklemin anlamlı olup olmadığının belirlenmesi gerekir. Bu ölçütlerden bir tanesi, bağımsız değişkenin bağımlı değişkeni açıklama oranı olan “belirlilik katsayısıdır”. Ancak belirlilik katsayısı denklemin anlamlılığı konusunda kesin bir ölçüt değildir. Bununla beraber eğim (regresyon) katsayısının anlamlılık testi yapılır. Eğer eğim katsayısı anlamlı ise bağımsız değişkenin, bağımlı değişken üzerinde etkili olduğu ve denklemde yer alması gerektiği sonucuna varılır. Denklem anlamlı ise artık bu denklem tahminler için kullanılabilir demektir. Sayısal değişkenler arasındaki ilişkinin analizi iki şekilde yapılabilir. Bunlar korelasyon ve regresyon analizidir. Korelasyon analizinde bağımlı ve bağımsız değişken ayırımı olmaksızın, sadece değişkenler arasındaki ilişkinin yönü ve derecesi belirlenir. Korelasyon katsayısının değeri sıfıra yakınsa, değişkenler arasında bir ilişki yok demektir. 1 değerlerine yakınsa, değişkenler arasında aynı veya zıt yönlü kuvvetli bir ilişki olduğu ifade edilir. Bazen de değişkenler sözel değişken olabilir ya da değişkenlerin gözlem değerleri yerine, sıralamaları arasındaki ilişki önemli olabilir. Böyle durumlarda da “sıra korelasyon katsayısı” hesaplanır. 230 Kendimizi Sınayalım 1. İki değişken arasındaki korelasyon -0,85 olduğuna göre aşağıdaki ifadelerden hangisi doğrudur? edilmiştir. Bu denklem için ˆ ˆ 0, 42 olarak b a. İki değişken arasında aynı yönlü kuvvetli bir ilişki vardır. hesaplandığına göre test istatistiğinin değeri aşağıdakilerden hangisidir? b. İki değişken arasında ters yönlü kuvvetli bir ilişki vardır. a. -13,33 4. n=12 için yˆi 3,8 5, 6.xi 1 b. 13,33 c. İki değişken arasında aynı yönlü zayıf bir ilişki vardır. c. 9,05 d. 10 d. İki değişken arasında ters yönlü zayıf bir ilişki vardır. e. 25 e. İki değişken arasında hiç ilişki yoktur. 2. 5. n= 14 ve r 0, 76 değerinin yorumu için aşağıdaki 2 c. 0,42 d. 0,29 İki değişken arasında ters yönlü kuvvetli bir ilişki vardır. e. 0,65 6 ve 7. soruları aşağıdaki verilere göre cevaplandırınız: e. İki değişken arasında aynı yönlü zayıf bir ilişki vardır. yˆi 8 4.xi 325 olduğuna göre sıra b. 0,51 d. İki değişken arasında ters yönlü zayıf bir ilişki vardır. 3. 2 i a. 0,98 değişkeni b. Bağımlı değişkenin bağımsız değişkenin açıklama oranı %76’dir. c. d korelasyon değeri aşağıdakilerden hangisidir? ifadelerden hangisi doğrudur? a. Bağımsız değişkenin bağımlı açıklama oranı%76’dir. denklemi elde denklemi için x bir birim arttığında, y’nin değeri ne olur? a. 8 birim azalır b. 4 birim azalır yi xi 22 24 28 32 35 38 3 5 7 8 11 14 6. Eğim katsayısının aşağıdakilerden hangisidir? c. 4 birim artar d. 5 birim artar a. -2,43 e. 8 birim artar b. 5,87 c. 1,54 d. 17,51 e. 4,67 231 kestirim değeri 7. Sabit terimin kestirim aşağıdakilerden hangisidir? değeri 10. se değeri aşağıdakilerden hangisidir? a. 2,12 a. -2,43 b. 0,66 b. 5,87 c. 4,6 c. 1,54 d. 1,46 d. 17,51 e. 0,47 e. 4,67 8.-10. soruları cevaplandırınız: aşağıdaki yi xi 10 13 16 18 20 24 28 34 36 40 46 49 52 55 Yukarıdaki veriler için verilere göre yˆi 15 0, 75.xi denklemi elde edimiştir. Bu denklem için ei2 10,62 olarak hesaplandığına göre; 8. ŷ3 değeri aşağıdakilerden hangisidir? a. 10,5 b. 12 c. 15 d. 19,5 e. 24 9. e3 değeri aşağıdakilerden hangisidir? a. -0,5 b. 1 c. -1,5 d. 1,75 e. 0 232 Kendimizi Sınayalım Yanıt Anahtarı Sıra Sizde Yanıt Anahtarı Sıra Sizde 1 1. b Yanıtınız yanlış ise “korelasyon kuramı” başlıklı konuyu yeniden gözden geçiriniz. 2. a Yanıtınız yanlış ise “belirlilik katsayısı” başlıklı konuyu yeniden gözden geçiriniz. 3. c Yanıtınız yanlış ise “basit doğrusal regresyon analizi” başlıklı konuyu yeniden gözden geçiriniz. 4. a Yanıtınız yanlış ise “eğim katsayısının analamlılık testi” başlıklı konuyu yeniden gözden geçiriniz. yi xi yi' xi' 81 85 88 92 95 102 105 110 28 25 20 18 19 16 12 10 -13,75 -9,75 -6,75 -2,75 0,25 7,25 10,25 15,25 9,5 6,5 1,5 -0,5 0,5 -2,5 -6,5 -8,5 y 94,75 5. d Yanıtınız yanlış ise “sıra korelasyon katsayısı” başlıklı konuyu yeniden gözden geçiriniz. x x y ' i 7. d Yanıtınız yanlış ise “basit doğrusal regresyon analizi” başlıklı konuyu yeniden gözden geçiriniz. r y 256 '2 i 6. c Yanıtınız yanlış ise “basit doğrusal regresyon analizi” başlıklı konuyu yeniden gözden geçiriniz. x 18,5 ' i '2 i 417, 02 x y ' i ' i x y '2 i 8. c Yanıtınız yanlış ise “eğim katsayısının analamlılık testi” başlıklı konuyu yeniden gözden geçiriniz. r 9. b Yanıtınız yanlış ise “eğim katsayısının analamlılık testi” başlıklı konuyu yeniden gözden geçiriniz. 727, 48 '2 i 417, 02 417, 02 256. 727, 48 16.(26,97) 417, 02 0,97 431,52 x ve y değişkenleri arasında arasında ters yönlü ve oldukça kuvvetli bir ilişki vardır. Sıra Sizde 2 10. d Yanıtınız yanlış ise “eğim katsayısının analamlılık testi” başlıklı konuyu yeniden gözden geçiriniz. xi yi 417, 02 1, 63 bˆ1 256 xi'2 ' ' bˆ0 y bˆ1 x 94, 75 (1, 63).18,5 bˆ0 94, 75 30,16 124,91 yˆi 124, 91 1,63.xi 233 Yararlanılan Kaynaklar Sıra Sizde 3 yˆ i ei 79,27 84,16 92,31 95,57 93,94 98,83 105,35 108,61 Toplam se 1,73 0,84 -4,31 -3,57 1,06 3,17 -0,35 1,39 e 2 i n2 Koutsoyiannis, A. (1999). Ekonometri Kuramı, Verso Yayıncılık, Ankara. ei2 2,99 0,71 18,58 12,74 1,12 10,05 0,12 1,93 48,24 Montgomery, D.C. and Peck, E.A. (1991). Introduction to Linear Regression Analysis, John Wiley & Sons, New York. Serper, Ö. (2004). Uygulamalı İstatistik 2, Ezgi Kitabevi, Bursa. 48, 24 48, 24 82 6 se 8, 04 2,84 ˆ bˆ se 1 1 1 2,84 '2 256 xi ˆ bˆ 0,18 1 th bˆ1 1, 63 = ˆ bˆ 0,18 1 th 9, 06 234 TIBBİ İSTATİSTİK SORULARININ CEVAPLANMASINDA GEREKLİ OLABİLECEK TABLOLAR Tablo 1. Normal Eğri Alanları z 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 0,00 0,0000 0,0398 0,0793 0,1179 0,1554 0,1915 0,2257 0,2580 0,2881 0,3159 0,3413 0,3643 0,3849 0,4032 0,4192 0,4332 0,4452 0,4554 0,4641 0,4713 0,4772 0,4821 0,4861 0,4893 0,4918 0,4938 0,4953 0,4965 0,4974 0,4981 0,4987 0,01 0,0040 0,0438 0,0832 0,1217 0,1591 0,1950 0,2291 0,2611 0,2910 0,3186 0,3438 0,3665 0,3869 0,4049 0,4207 0,4345 0,4463 0,4564 0,4649 0,4719 0,4778 0,4826 0,4864 0,4896 0,4920 0,4940 0,4955 0,4966 0,4975 0,4982 0,4987 0,02 0,0080 0,0478 0,0871 0,1255 0,1628 0,1985 0,2324 0,2642 0,2939 0,3212 0,3461 0,3686 0,3888 0,4066 0,4222 0,4357 0,4474 0,4573 0,4656 0,4726 0,4783 0,4830 0,4868 0,4898 0,4922 0,4941 0,4956 0,4967 0,4976 0,4982 0,4987 0,03 0,0120 0,0517 0,0910 0,1293 0,1664 0,2019 0,2357 0,2673 0,2967 0,3238 0,3485 0,3708 0,3907 0,4082 0,4236 0,4370 0,4484 0,4582 0,4664 0,4732 0,4788 0,4834 0,4871 0,4901 0,4925 0,4943 0,4957 0,4968 0,4977 0,4983 0,4988 0,04 0,0160 0,0557 0,0948 0,1331 0,1700 0,2054 0,2389 0,2704 0,2995 0,3264 0,3508 0,3729 0,3925 0,4099 0,4251 0,4382 0,4495 0,4591 0,4671 0,4738 0,4793 0,4838 0,4875 0,4904 0,4927 0,4945 0,4959 0,4969 0,4977 0,4984 0,4988 235 0,05 0,0199 0,0596 0,0987 0,1368 0,1736 0,2088 0,2422 0,2734 0,3023 0,3289 0,3531 0,3749 0,3944 0,4115 0,4265 0,4394 0,4505 0,4599 0,4678 0,4744 0,4798 0,4842 0,4878 0,4906 0,4929 0,4946 0,4960 0,4970 0,4978 0,4984 0,4989 0,06 0,0239 0,0636 0,1026 0,1406 0,1772 0,2123 0,2454 0,2764 0,3051 0,3315 0,3554 0,3770 0,3962 0,4131 0,4279 0,4406 0,4515 0,4608 0,4686 0,4750 0,4803 0,4846 0,4881 0,4909 0,4931 0,4948 0,4961 0,4971 0,4979 0,4985 0,4989 0,07 0,0279 0,0675 0,1064 0,1443 0,1808 0,2157 0,2486 0,2794 0,3078 0,3340 0,3577 0,3790 0,3980 0,4147 0,4292 0,4418 0,4525 0,4616 0,4693 0,4756 0,4808 0,4850 0,4884 0,4911 0,4932 0,4949 0,4962 0,4972 0,4979 0,4985 0,4989 0,08 0,0319 0,0714 0,1103 0,1480 0,1844 0,2190 0,2517 0,2823 0,3106 0,3365 0,3599 0,3810 0,3997 0,4162 0,4306 0,4429 0,4535 0,4625 0,4699 0,4761 0,4812 0,4854 0,4887 0,4913 0,4934 0,4951 0,4963 0,4973 0,4980 0,4986 0,4990 0,09 0,0359 0,0753 0,1141 0,1517 0,1879 0,2224 0,2549 0,2852 0,3133 0,3389 0,3621 0,3830 0,4015 0,4177 0,4319 0,4441 0,4545 0,4633 0,4706 0,4767 0,4817 0,4857 0,4890 0,4916 0,4936 0,4952 0,4964 0,4974 0,4981 0,4986 0,4990 Tablo 2. Kritik t Değerleri Tablosu α (Anlam düzeyi) Tek Yönlü Test Çift Yönlü Test V 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 0,45 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,025 0,01 0,005 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,05 0,02 0,01 0,158 0,142 0,137 0,134 0,132 0,131 0,130 0,130 0,129 0,129 0,129 0,128 0,128 0,128 0,128 0,128 0,128 0,127 0,127 0,127 0,127 0,127 0,127 0,127 0,127 0,127 0,127 0,127 0,127 0,127 0,1257 0,325 0,289 0,277 0,271 0,267 0,265 0,263 0,262 0,261 0,260 0,260 0,259 0,259 0,258 0,258 0,258 0,257 0,257 0,257 0,257 0,257 0,256 0,256 0,256 0,256 0,256 0,256 0,256 0,256 0,256 0,2533 0,510 0,445 0,424 0,414 0,408 0,404 0,402 0,399 0,398 0,397 0,396 0,395 0,394 0,393 0,393 0,392 0,392 0,392 0,391 0,391 0,391 0,390 0,390 0,390 0,390 0,390 0,389 0,389 0,389 0,389 0,3853 0,727 0,617 0,584 0,569 0,559 0,553 0,549 0,546 0,543 0,542 0,540 0,539 0,538 0,537 0,536 0,535 0,534 0,534 0,533 0,533 0,532 0,532 0,532 0,531 0,531 0,531 0,531 0,530 0,530 0,530 0,5244 1,000 0,816 0,765 0,741 0,727 0,718 0,711 0,706 0,703 0,700 0,697 0,695 0,694 0,692 0,691 0,690 0,689 0,688 0,688 0,687 0,686 0,686 0,685 0,685 0,684 0,684 0,684 0,683 0,683 0,683 0,6745 1,376 1,061 0,978 0,941 0,920 0,906 0,896 0,889 0,883 0,879 0,876 0,873 0,870 0,868 0,866 0,865 0,863 0,862 0,861 0,860 0,859 0,858 0,858 0,857 0,856 0,856 0,855 0,855 0,854 0,854 0,8416 1,963 1,386 1,250 1,190 1,156 1,134 1,119 1,108 1,100 1,093 1,088 1,083 1,079 1,076 1,074 1,071 1,069 1,067 1,066 1,064 1,063 1,061 1,060 1,059 1,058 1,058 1,057 1,056 1,055 1,055 1,0364 3,078 1,886 1,638 1,533 1,476 1,440 1,415 1,397 1,383 1,372 1,363 1,356 1,350 1,345 1,341 1,337 1,333 1,330 1,328 1,325 1,323 1,321 1,319 1,318 1,316 1,315 1,314 1,313 1,311 1,310 1,2816 6,314 2,920 2,353 2,132 2,015 1,943 1,895 1,860 1,833 1,812 1,796 1,782 1,771 1,761 1,753 1,746 1,740 1,734 1,729 1,725 1,721 1,717 1,714 1,711 1,708 1,706 1,703 1,701 1,699 1,697 1,6449 12,706 4,303 3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228 2,201 2,179 2,160 2,145 2,131 2,120 2,110 2,101 2,093 2,086 2,080 2,074 2,069 2,064 2,060 2,056 2,052 2,048 2,045 2,042 1,9600 31,821 6,965 4,541 3,747 3,365 3,143 2,998 2,896 2,821 2,764 2,718 2,681 2,650 2,624 2,602 2,583 2,567 2,552 2,539 2,528 2,518 2,508 2,500 2,492 2,485 2,479 2,473 2,467 2,462 2,457 2,3264 63,657 9,925 5,841 4,604 4,032 3,707 3,499 3,355 3,250 3,169 3,106 3,055 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,750 2,5759 V; Serbestlik Derecesi 236 Tablo 3. Ki-kare Tablosu α 0,995 0,990 0,975 0,950 0,050 0,025 0,010 0,005 0,001 0,0002 0,0201 0,1148 0,2971 0,5543 0,8721 1,2390 1,6465 2,0879 2,5582 3,0535 3,5706 4,1069 4,6604 5,2293 5,8122 6,4078 7,0149 7,6327 8,2604 8,8972 9,5425 10,1957 10,8564 11,5240 12,1981 12,8785 13,5647 14,2565 14,9535 22,1643 29,7067 70,0649 0,0010 0,0506 0,2158 0,4844 0,8312 1,2373 1,6899 2,1797 2,7004 3,2470 3,8157 4,4038 5,0088 5,6287 6,2621 6,9077 7,5642 8,2307 8,9065 9,5908 10,2829 10,9823 11,6886 12,4012 13,1197 13,8439 14,5734 15,3079 16,0471 16,7908 24,4330 32,3574 74,2219 0,0039 0,1026 0,3518 0,7107 1,1455 1,6354 2,1673 2,7326 3,3251 3,9403 4,5748 5,2260 5,8919 6,5706 7,2609 7,9616 8,6718 9,3905 10,1170 10,8508 11,5913 12,3380 13,0905 13,8484 14,6114 15,3792 16,1514 16,9279 17,7084 18,4927 26,5093 34,7643 77,9295 3,8415 5,9915 7,8147 9,4877 11,0705 12,5916 14,0671 15,5073 16,9190 18,3070 19,6751 21,0261 22,3620 23,6848 24,9958 26,2962 27,5871 28,8693 30,1435 31,4104 32,6706 33,9244 35,1725 36,4150 37,6525 38,8851 40,1133 41,3371 42,5570 43,7730 55,7585 67,5048 124,3421 5,0239 7,3778 9,3484 11,1433 12,8325 14,4494 16,0128 17,5345 19,0228 20,4832 21,9200 23,3367 24,7356 26,1189 27,4884 28,8454 30,1910 31,5264 32,8523 34,1696 35,4789 36,7807 38,0756 39,3641 40,6465 41,9232 43,1945 44,4608 45,7223 46,9792 59,3417 71,4202 129,5612 6,6349 9,2103 11,3449 13,2767 15,0863 16,8119 18,4753 20,0902 21,6660 23,2093 24,7250 26,2170 27,6882 29,1412 30,5779 31,9999 33,4087 34,8053 36,1909 37,5662 38,9322 40,2894 41,6384 42,9798 44,3141 45,6417 46,9629 48,2782 49,5879 50,8922 63,6907 76,1539 135,8067 7,8794 10,5966 12,8382 14,8603 16,7496 18,5476 20,2777 21,9550 23,5894 25,1882 26,7568 28,2995 29,8195 31,3193 32,8013 34,2672 35,7185 37,1565 38,5823 39,9968 41,4011 42,7957 44,1813 45,5585 46,9279 48,2899 49,6449 50,9934 52,3356 53,6720 66,7660 79,4900 140,1695 10,8276 13,8155 16,2662 18,4668 20,5150 22,4577 24,3219 26,1245 27,8772 29,5883 31,2641 32,9095 34,5282 36,1233 37,6973 39,2524 40,7902 42,3124 43,8202 45,3147 46,7970 48,2679 49,7282 51,1786 52,6197 54,0520 55,4760 56,8923 58,3012 59,7031 73,4020 86,6608 149,4493 V 1 0,000039 0,0100 2 0,0717 3 0,2070 4 0,4117 5 0,6757 6 0,9893 7 1,3444 8 1,7349 9 2,1559 10 2,6032 11 3,0738 12 3,5650 13 4,0747 14 4,6009 15 5,1422 16 5,6972 17 6,2648 18 6,8440 19 7,4338 20 8,0337 21 8,6427 22 9,2604 23 9,8862 24 25 10,5197 26 11,1602 27 11,8076 28 12,4613 29 13,1211 30 13,7867 40 20,7065 50 27,9907 100 67,3276 V; Serbestlik Derecesi α; Anlam düzeyi 237 Tablo 4. F Tablo Değerleri Anlam düzeyi = α = 0,05) Ho Red Bölgesi α Serbestlik derecesi v v 1 1 2 3 4 5 6 7 8 12 24 ∞ 5 661 579 541 519 5,05 4,95 4,88 4,82 4,68 4,53 4,37 6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,00 3,84 3,67 7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,57 3,41 3,23 8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,28 3,12 2,93 9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,07 2,90 2,71 10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 2,91 2,74 2,54 11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,79 2,61 2,41 12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,69 2,51 2,30 13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,60 2,42 2,21 14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,53 2,35 2,13 15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,48 2,29 2,07 16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,42 2,24 2,01 17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,38 2,19 1,96 18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,34 2,15 1,92 19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,31 2,11 1,88 20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,28 2,08 1,84 21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,25 2,05 1,81 22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,23 2,03 1,78 23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,20 2,01 1,76 24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,18 1,98 1,73 25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,16 1,96 1,71 26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,15 1,95 1,69 27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,13 1,93 1,67 28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,12 1,91 1,66 29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,10 1,90 1,64 30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,09 1,89 1,62 40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,00 1,79 1,51 60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 1,92 1,70 1,39 2 80 3,96 3,11 2,72 2,49 2,33 2,21 2,13 2,06 1,88 1,65 1,33 100 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,85 1,63 1,28 120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,83 1,61 1,26 ∞ 3,84 3,00 2,61 2,37 2,22 2,10 2,01 1,94 1,75 1,52 1,00 v : Pay için serbestlik derecesi v : Payda için serbestlik derecesi 1 2 238 Tablo 5. F Tablo Değerleri (Anlam düzeyi= α = 0,01) Ho Red Bölgesi α Serbestlik derecesi v v 1 1 2 3 4 5 6 7 8 12 24 ∞ 5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 9,89 9,47 9,02 6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,72 7,31 6,88 7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,47 6,07 5,65 8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,67 5,28 4,86 9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,11 4,73 4,31 10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,71 4,33 3,91 11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,40 4,02 3,60 12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,16 3,78 3,36 13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 3,96 3,59 3,17 14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 3,80 3,43 3,01 15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,67 3,29 2,87 16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,55 3,18 2,75 17 8,40 6,11 5,18 4,67 4,34 4,10 3,93 3,79 3,46 3,08 2,65 18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,37 3,00 2,57 19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,30 2,92 2,49 20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,23 2,86 2,42 21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,17 2,80 2,36 22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,12 2,75 2,31 23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,07 2,70 2,26 24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,03 2,66 2,21 25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 2,99 2,62 2,17 26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 2,96 2,58 2,13 27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 2,93 2,55 2,10 28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 2,90 2,52 2,07 29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 2,87 2,49 2,04 30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 2,84 2,47 2,01 40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,66 2,29 1,81 60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,50 2,12 1,60 80 6,96 4,88 4,04 3,56 3,26 3,04 2,87 2,74 2,42 2,03 1,50 100 6,90 4,82 3,98 3,51 3,21 2,99 2,82 2,69 2,37 1,98 1,43 120 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,34 1,95 1,38 ∞ 6,64 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,19 1,79 1,00 2 v : Pay için serbestlik derecesi v : Payda için serbestlik derecesi 1 2 239