tıbbi istatistik - Kitap Okur Yazar

advertisement
T.C. ANADOLU ÜNİVERSİTESİ YAYINI NO: 2534
AÇIKÖĞRETİM FAKÜLTESİ YAYINI NO: 1505
TIBBİ İSTATİSTİK
Yazarlar
Doç.Dr. Zeki YILDIZ (Ünite 1, 7)
Prof.Dr. Veysel YILMAZ, Yrd.Doç.Dr. H. Eray ÇELİK (Ünite 2, 5)
Yrd.Doç.Dr. Cengiz AKTAŞ (Ünite 3, 8)
Yrd.Doç.Dr. Cengiz BAL (Ünite 4)
Prof.Dr. Ahmet ÖZMEN (Ünite 6)
Editör
Prof.Dr. Veysel YILMAZ
ANADOLU ÜNİVERSİTESİ
i
Bu kitabın basım, yayım ve satış hakları Anadolu Üniversitesine aittir.
“Uzaktan Öğretim” tekniğine uygun olarak hazırlanan bu kitabın bütün hakları saklıdır.
İlgili kuruluştan izin almadan kitabın tümü ya da bölümleri mekanik, elektronik, fotokopi, manyetik kayıt
veya başka şekillerde çoğaltılamaz, basılamaz ve dağıtılamaz.
Copyright © 2012 by Anadolu University
All rights reserved
No part of this book may be reproduced or stored in a retrieval system, or transmitted
in any form or by any means mechanical, electronic, photocopy, magnetic, tape or otherwise, without
permission in writing from the University.
UZAKTAN ÖĞRETİM TASARIM BİRİMİ
Genel Koordinatör
Doç.Dr. Müjgan Bozkaya
Genel Koordinatör Yardımcısı
Doç.Dr. Hasan Çalışkan
Öğretim Tasarımcıları
Yrd.Doç.Dr. Seçil Banar
Öğr.Gör.Dr. Mediha Tezcan
Grafik Tasarım Yönetmenleri
Prof. Tevfik Fikret Uçar
Öğr.Gör. Cemalettin Yıldız
Öğr.Gör. Nilgün Salur
Kitap Koordinasyon Birimi
Yrd.Doç.Dr. Feyyaz Bodur
Uzm. Nermin Özgür
Kapak Düzeni
Prof. Tevfik Fikret Uçar
Öğr.Gör. Cemalettin Yıldız
Grafiker
Gülşah Yılmaz
Dizgi
Açıköğretim Fakültesi Dizgi Ekibi
Tıbbi İstatistik
ISBN
978-975-06-1208-4
1. Baskı
Bu kitap ANADOLU ÜNİVERSİTESİ Web-Ofset Tesislerinde 22.800 adet basılmıştır.
ESKİŞEHİR, Haziran 2012
ii
İçindekiler
Önsöz ………………………………………………………………………………………………....
iv
1. İstatistiğin Tanımı ve Temel Kavramlar………………………………………………………
2
2. Verilerin Derlenmesi, İşlenmesi ve Grafikler ile Gösterimi……………………………….
14
3. Ortalamalar ve Değişkenlik Ölçüleri……………………………..…………………………… 54
4. Sağlık Alanına Özel İstatistiksel Yöntemler……………………………..…………………..
76
5. Olasılık Kuramı……………………………..……………………………………………………. 112
6. Örnekleme ve Bazı Örnekleme Dağılımları……………………………..…………………… 146
7. İstatiksel Tahmin ve Hipotez Testleri……………………………..…………………………. 182
8. Korelasyon ve Regresyon Analizi……………………………..……………………………… 212
iii
Önsöz
Anadolu Üniversitesi Açıköğretim Fakültesi önlisans programlarından Sağlık Kurumları İşletmeciliği
Programında yürütülecek olan Tıbbi İstatistik dersi için hazırlanan bu kitap sekiz üniteden oluşmaktadır.
Bu programda öğrenim görecek siz değerli öğrencilerimiz sağlık kurumları işletmelerinde gelecekte birer
yönetici olarak yer alacasınız. Bu amaçla sizlerin vereceği kararlarda ve planlamalarınızda doğru ve
sağlıklı kararlar alabilmeniz için, karar verme sürecinde riski en aza indirecek istatistik bilgisiyle
donatılmış olmanız gerekmektedir.
İstatistik, verilerin elde edilmesinden başlayarak bilgiye dönüştürülmeleri ve veri sayısının azaltılarak
kullanım değerlerinin artması sürecinde çeşitli alanlarda çalışan kişilere birçok yararlar sağlar. Ekonomik,
sosyal, tıbbi, biyolojik, jeolojik v.b. herhangi bir olayın sayısal yapısının anlaşılmasında ve elde edilen
verilerden sonuçlar çıkarılmasında istatistik başvurulabilecek önemli bir araçtır.
Sağlık kurumu yöneticileri özellikle ileriye dönük planlama yaparken, mevcut durumu
değerlendirirken, önceki yıllara göre kıyaslama yaparken ve diğer sağlık kurumları ile kendi kurumunu
karşılaştırırken tek bir ölçüye dayalı değil, bir çok ölçüden yararlanarak karşılaştırmalar yapmalıdır.
Kendini sürekli olarak yenilemeli, sağlık yöneticiliği alanındaki gelişmeleri takip etmeli, kurumunu en üst
seviyeye çıkarmaya çaba göstermelidir. Bu anılan faaliyetler gerçekleştirebilmek için doğru, tam,
güvenilir, kullanılabilir, güncel ve denetlenebilir verilere ihtiyaç vardır. Bu verilerin, bilgiye
dönüştürülmesi işlemi istatistiksel teknikler olmadan asla yerine getirilemez. Bu nedenle müfredatınızda
okutulan Tıbbi İstatistik dersini bu açıdan değerlendirmekte yarar vardır.
Sağlık kurumları işletmeciliği programında okutulacak olan bu kitapda, öncelikle istatistiğe ilişkin
temel konular ile alana ilişkin karar verme durumunda kalabileceğiniz çok sayıda probleme ve çözülmüş
örneklere yer verilmiştir. Her ünite içinde yer alan sıra sizde soruları konuları kavrayıp kavramadınız
hakkında sizlere geribildirim sunmak için verilmiştir. Ayrıca ünite içindeki konularda bilginizi
değerlendirebileceğiniz ve sizleri sınavlara hazırlamak için her ünite sonunda yer alan kendimizi
sınayalım sorularına yer almıştır.
Hazırlamış olduğumuz Tıbbi istatistik kitabı sadece öğrenim gördüğünüz süre içinde değil aynı
zamanda sağlık kurumu işletmelerinde birer yönetici olarak yer aldığınızda da bir başvuru kitabı olarak
karar verme sürecinizde belirsizlikleri en aza indirgemenizde yardımcı olmasını dilerim..
Bu kitabın meydana gelmesinde, başta Anadolu Üniversitesi Rektörlüğüne, Açıköğretim Fakültesi
Dekanlığına, koordinatörler ve ile kitabın hazırlanması için emeği geçen çalışanlara, editör ve yazarlar
olarak teşekkür ederiz.
Editör
Prof.Dr. Veysel Yılmaz
iv
1
Amaçlarımız
Bu üniteyi tamamladıktan sonra;
İstatistiğin tanımı ve işlevini açıklayabilecek,
İstatistiğin temel kavramlarını açıklayabilecek,
Değişken kavramını açıklayabilecek ve çeşitli açılardan sınıflandırabilecek,
Değişkenin hangi ölçekle ölçülebileceğini belirleyebilecek
bilgi ve becerilere sahip olabilirsiniz.
Anahtar Kavramlar
İstatistik
Ana kütle
Birim
Örneklem
Yığın olay
Ölçekler
Değişken
İçindekiler

Giriş

İstatistik Kelimesinin Anlamı

İstatistiğin Tanımı ve İşlevi

İstatistiğin Bilim Dalları ve Hastane Yöneticiliği Açısından Önemi

Temel Kavramlar
2
İstatistiğin Tanımı ve
Temel Kavramlar
GİRİŞ
Bilimsel araştırma, belirli bir o1gular kümesinin niteliği, ortaya çıkış nedenleri ile ortaya çıkardığı
sonuçlar konusunda bilgilenme olarak tanımlanabilir. Araştırma amacının gerçekleştirilmesi için
benimsenen genel yaklaşım araştırma yöntemi olarak ifade edilebilir. Bilimsel bir araştırma yöntemi soru
biçiminde bir araştırma probleminin ortaya konulması, eldeki bilgilerin değerlendirilmesi, araştırmanın
planlanması, araştırmanın gerçekleştirilmesi, elde edilen verilerin bilgiye dönüştürülerek yorumlanması,
sonuçlara varılması ve sonuçların yarara sunulması aşamalarını içerir. Gözlem yapıldığında istatistik,
bilimsel yöntemdeki yerini almaktadır. Gözlemler sonucunda verilerin elde edilmesi, düzenlenmesi,
kullanıma sunulması ve çözümlenmesi istatistiğin görevidir. Ayrıca, bilimsel araştırmalarda ulaşılan
sonuçların çoğu kesin olmayan yargı, birer çıkarsama niteliğindedir. Bu durumun ölçülmesi de istatistiğin
işlevlerinden biridir. Dolayısıyla istatistiğin bilimsel yöntemde betimleme ve çıkarsama görevleri vardır.
İstatistik, verilerin elde edilmesinden başlayarak bilgiye dönüştürülmeleri ve hacimlerinin azaltılarak
kullanım değerlerinin artması sürecinde çeşitli alanlarda çalışan kişilere birçok yararlar sağlar. Ekonomik,
sosyal, tıbbi, biyolojik, jeolojik v.b. herhangi bir olayın sayısal yapısının anlaşılmasında ve elde edilen
verilerden sonuçlar çıkarılmasında istatistik başvurulabilecek önemli bir araçtır.
Bu ünitede, istatistiğin tanımı ve işlevine, ayrıca istatistiğin öğrenilmesinde belirli bir temelin
oluşmasında önemli rol oynayacak bazı temel kavramlar açıklanmaya çalışılacaktır. Temel kavramlar
öğrenilmeden sayısal problemlere odaklanılmasının araştırmacıyı yanlış yönlendireceği unutulmamalıdır.
İSTATİSTİK KELİMESİNİN ANLAMI
İstatistik kelimesi üç farklı anlamda kullanılmaktadır. Birinci anlamda istatistik kelimesi, çeşitli olaylar
hakkında toplanan verileri belirtmek için kullanılmaktadır. Örneğin “sağlık istatistikleri” denildiğinde
sağlık alanındaki olaylar hakkındaki sayısal veriler anlatılmak istenmektedir. Benzer biçimde “eğitim
istatistikleri”, “dış ticaret istatistikleri” ve “bir spor karşılaşmasına ilişkin istatistikler” ifadelerindeki
“istatistikler” kelimesi bu anlamda kullanılmaktadır.
İkinci anlamda istatistik kelimesi, çeşitli alanlardaki bilimsel araştırmalardan elde edilen verilerin
düzenlenmesi, özetlenmesi, çözümlenmesi ve yorumlanması işlemlerinin gerçekleştirildiği teknikler
bütününü ifade etmektedir. İstatistik yöntembiliminin adıdır.
Üçüncü anlamda istatistik, hakkında bilgi elde etmek amacıyla hedeflenen ana kütleden tesadüfi
olarak çekilen bir örneklemin aritmetik ortalama, standart sapma, oran v.b. herhangi bir özetleyici
değerine verilen addır. Ana kütleden hesaplanan bu özet değerlere “parametre”, örneklemeye
başvurulduğunda ise “istatistik” adı verilir.
İSTATİSTİĞİN TANIMI VE İŞLEVİ
İstatistik, belirli bir amaç için incelenen bir olayın (olgunun, gerçekliğin) sayısal doğasının anlaşılmasına
ve başkalarına anlatılmasına yarar. Çeşitli bilim dallarındaki araştırmalarda, herhangi bir olayın sayısal
yapısının anlaşılmasında ve elde edilen verilerden yararlanarak sonuçlar çıkarılmasında kullanılan bir
araçtır. İstatistik sayılarla ilgilidir ve istatistiksel çözümlemelerin yapılabilmesi için sayısal verilere veya
3
sayısal görünüm kazandırılmış verilere gereksinim vardır. İstatistiğin tanımı şu biçimde yapılabilir;
İstatistik, belirli bir amaca yönelik veri elde etme (derleme), elde edilen verileri işleme, özetleme,
çözümleme ve elde edilen sonuçları yorumlama işlemlerinin gerçekleştirildiği teknikler bilimidir.
İstatistik, belirli bir amaç için hakkında bilgi edinilmek istenen birimleri ve bunların oluşturduğu
kütleleri inceler. Söz konusu birimler canlı varlıklar, cansız varlıklar ya da “ortaya çıkan durum”
biçiminde ifade edilebilecek olaylar olabilir. Örneğin, bir hastanede yatan hastalar çeşitli nitelikleri
bakımından, belirli bir bölgedeki özel, devlet ve üniversite hastaneleri çeşitli nitelikleri bakımından ya da
belirli bir hastanedeki doğumlar, acil vakalar çeşitli açıdan incelenebilir. Ancak birimlerin istatistiğin
konusu olabilmesi için “yığın (kollektif) olay” niteliğinde olması gerekir. Yığın olay, bir olaylar
kütlesinde bir olayın kendi türünden olayları incelenen nitelikleri bakımından tam anlamıyla temsil
etmeyen olaylardır. Birbirinin tam benzeri olan olaylar “tipik olaylardır. Bu tür olaylardan ele alınan
değişken açısından sadece biri incelense ait olduğu kütleyi temsil eder. Bu tür olaylar birim anlamında
istatistiğin konusunu oluşturmaz. Örneğin bir hastane işletmesinde görev yapan doktorların meslek
açısından incelenmesinde doktorlar tipik olay durumundadır. Dolayısıyla bu çalışmada doktorlar birim
olma niteliğinde olmazlar.
İşlevleri açısından istatistik, “betimsel istatistik” ve “çıkarsamalı istatistik” biçiminde iki ana gruba
ayrılabilir. İncelenen birimlere ilişkin verilerin elde edilmesi, elde edilen verilerin sayısal yapılarının
anlaşılabilmesi amacıyla işlenip düzenlenmesi, tablolar ve grafiklerle görsel olarak sunulması, aritmetik
ortalama, standart sapma gibi değerlerle özetlenmesi betimsel istatistiğin konusudur. Buna karşılık
örnekleme temeline dayanan çıkarsamalı istatistikte bir ana kütleden tesadüfî olarak seçilen örneklem
yardımıyla ana kütle parametrelerine ilişkin tahmin, hipotez testleri ve gelecek dönemlere ilişkin
öngörüler yapılır.
İstatistiğin kelime anlamını ve işlevlerini açıklayınız.
İSTATİSTİĞİN BİLİM DALLARI VE HASTANE YÖNETİCİLİĞİ
AÇISINDAN ÖNEMİ
İstatistik yığın olayları, yani birbirine benzemeyen, bazı ortak özelliklere sahip olmakla birlikte genelde
aralarında önemli farklılıklar da bulunan olayları, konu aldığı için bu tür olayları konu alan çeşitli alanlara
uygulanabilmektedir. İstatistik, hangi amaçlar için, hangi verilerin toplanacağını, verilerin nasıl
işleneceğini, çözümleme aşamasında amaca uygun olarak hangi teknik ya da tekniklerin kullanılacağını
ve sonuçların nasıl yorumlanacağı konusunda araştırmacıya ışık tutmaktadır. Bu açıdan istatistik çeşitli
bilim dallarındaki uygulamalı çalışmalarda yoğun bir biçimde kullanılmaktadır.
Günümüzde hastaneler hizmet üreten işletmeler olarak değerlendirilmektedir. Bu amaçla işletme
faaliyetlerinde istatistiksel tekniklerden yoğun bir biçimde yararlanılmaktadır. Örneğin;
Hastane işletmesinin bütünü veya hastane bölümleri için faaliyetlerin planlanmasında,
Üretilen veya satın alınan mal ve hizmetlerin kalitesi, miktarı, finansal değerler gibi işletme yönetimi
için önem taşıyan değerlerin belirlenmesinde,
Hasta memnuniyeti, çalışan personelin memnuniyeti veya tükenmişlik durumlarının tespiti,
Planlanan hedeflere ulaşılıp ulaşılmadığının ortaya konulması ve bunların nedenlerini belirlemek
üzere başvurulan denetim işlemlerinde istatistikten yararlanılmaktadır.
Çalışma hayatında rasyonel hareket edebilmek için yöneticilerin yerel, ulusal ve uluslar arası
istatistiklerden yararlanmaları kaçınılmaz olmaktadır. Ancak, bu anlamda yararlanılacak istatistiklerin
tümünün hazır olarak bulunması mümkün gözükmemektedir. Bu durumda işletmelerin faaliyetleri için
gerekli olan bazı istatistikleri kendi bünyesinde hazırlaması bir zorunluluktur. İşletmeler gerekli
istatistikleri toplamanın yanında bunların değerlendirilmesi ve çözümlenmesi, ayrıca işletmeye özel
istatistiksel araştırmaları yapmak üzere büyük ölçekli kuruluşlarda istatistik ve araştırma birimi
kurulmaktadır.
4
TEMEL KAVRAMLAR
Bu bölümde, istatistiğin öğrenilmesinde belirli bir temelin (alt yapının) oluşturulmasını sağlayacak bazı
temel kavramlar açıklanacaktır. İstatistik öğrenilmek isteniyorsa öncelikle onun temel kavramları iyi bir
biçimde öğrenilmelidir. Dolayısıyla istatistik öğreniminde temel kavramlar öğrenilmeden sayısal
problemlere ve bunlardan elde edilen sonuçlara odaklanma bireyi yanılgıya düşürebilir.
Birim ve Türleri
Araştırmanın amacına uygun olarak incelenen ve hakkında bilgi edinilmek istenen yığın olayların her
birine “birim” adı verilir. Birimler canlı veya cansız varlıklar olabileceği gibi ortaya çıkan durumlar (fiili
olaylar) da olabilir. Canlı varlıklara insan, hayvan, bitki, cansız varlıklara bina, otomobil, aile, banka,
işletme gibi sosyal bir kuruluş, fiili olaylara ise doğum, ameliyat, trafik kazası örnek olarak verilebilir.
Birimler çeşitli açılardan sınıflandırılabilir. Bunlardan önemli görülen bazılarına aşağıda
değinilecektir.
Birimler öncelikle belirli bir maddi varlığa sahip olup olmamasına göre “maddi birim” veya “maddi
olmayan birim” biçiminde sınıflandırılmaktadır. Bu sınıflama biçiminde birimlerin boyutlarının olup
olmaması dikkate alınır. Maddi birim, elle tutulur ve gözle görülür, yani uzunluk, genişlik ve yükseklik
boyutlarına sahip olan birimlerdir. Maddi olmayan birim ise boyutları olmayan birimlerdir. Örneğin,
insan, bitki, bina v.b. birimler maddi, doğum, ölüm, hastalık, bir ilaç denemesi gibi birimler maddi
olmayan birimlerdir.
Birimleri incelendikleri zaman diliminde hazır oluş durumlarına göre de sınıflandırmak mümkündür.
Ömür süreleri oldukça uzun olan, dolayısıyla herhangi bir anda incelenebilecek durumdaki birimler
“devamlı birim”, çok kısa bir ömür süresine sahip, dolayısıyla ortaya çıktığı anda incelenebilecek
birimler “ani birim” olarak sınıflandırılır. Genel olarak maddi birimler aynı zamanda devamlı birimler,
maddi olmayan birimler ise ani birimler niteliğindedir.
Birimlerin sınıflandırılmasında “doğal birim” ve “doğal olmayan birim” biçiminde bir ayrım da
yapılmaktadır. Doğal birim, parçalara ayrıldığında veya birleştirildiğinde birim olma özelliklerini yitiren
birimlerdir. Örneğin, deneysel bir çalışmada denek olarak kullanılan bir farenin ikiye bölünmesi
durumunda iki canlı fare oluşmaz. Benzer biçimde otomobil, bina doğal birime örnek olarak verilebilir.
Doğal olmayan birim ise bir bütün olma niteliğinde olmayan, dolayısıyla parçalandığında ya da
birleştirildiğinde birim olma niteliğini koruyan birimlerdir. Bu durumda birimlerin sadece büyüklükleri
değişmektedir. Örneğin, deneysel bir çalışmada büyük hacimli bir sıvı daha küçük miktarlara ayrılarak
denemede birim olarak kullanılabilir. Bir arazi parçası daha küçük parsellere ayrılarak tarımsal
denemelerde birim olarak kullanılabilmektedir. Verilen iki örnekte de birimler aynı araştırma düzeninde
parçalandıklarında veya birleştirildiklerinde birim olma niteliğini kaybetmezler.
Bir başka sınıflandırmada birimler “gerçek birim” ve “varsayımsal birim” biçiminde iki kategoriye
ayrılabilir. Gerçekte somut olarak var olan birimler gerçek birim, buna karşılık fiili olarak var olmayan
ancak kuramsal olarak var olacağı düşünülebilen birimler varsayımsal birim olarak nitelendirilirler.
Gerçek birimlerin maddi bir varlığa sahip olması gerekliliği yoktur. Maddi olmayan birimler de gerçek
birim olabilir. Ayrıca doğal veya doğal olmayan birimler de gerçek birimdir.
İstatistiğin konusu olan “birim” kavramını açıklayınız. Her olay
istatistiğe konu olur mu?
Ana kütle (Popülâsyon) ve Örneklem
Üzerinde araştırma yapmak amacıyla hakkında bilgi elde edinilmek istenen ve belirli bir tanıma uyan,
yani yığın olay niteliğindeki birimlerin tamamının oluşturduğu topluluğa “ana kütle” adı verilmektedir.
Ana kütleyi oluşturan birimlerin aralarında farklılıklar olmakla birlikte biçimsel homojenlik açısından
bazı ortak özellikleri bulunmalıdır. Ekonomik, zaman kısıtı, deneysel çalışmalarda birimlerin deforme
5
olması v.b. nedenlerden dolayı her araştırmada hedeflenen ana kütleyi oluşturan birimlerin tamamı
incelenemez. Böyle durumlarda gözlemlemek üzere ana kütleden tesadüfî olarak seçilen birimlerden
oluşan ve ana kütlenin doğal bir parçası olan alt kütleye “örneklem” adı verilir.
Ana kütle ve örneklem birimlerden oluştuğuna göre bu birimlerden ayrı bir yapıya sahip olmaması
gerekir. Örneğin bir üniversitenin çeşitli bölümleri birim olarak tanımlandığında üniversite ana kütle
olarak ifade edilemez. Sözü edilen bölümlerin oluşturduğu topluluk ana kütledir.
Ana kütle ve örneklemi oluşturan birimlerin zaman ve mekân bakımından sınırlandırılması
zorunluluğu vardır. Araştırmanın amacına uygun olarak belirli bir tanıma uyan belirli bir mekândaki
(hastane, şehir, bölge, ülke v.b.) birimler ile ilgilenildiğinde kütle mekân bakımından, benzer biçimde
belirli bir zaman noktası veya zaman aralığındaki (gün, hafta, ay, yıl v.b.) birimler ile ilgilenildiğinde ise
kütle zaman bakımından sınırlandırılmış olur. Örneğin, 2011 yılı Mart ayında Eskişehir’deki özel
hastanelere başvuran hastaların oluşturduğu kütle zaman ve mekân bakımından sınırlandırılmıştır.
Böylece hedeflenen kütle net olarak belirtilmiş olur.
Değişken ve Türleri
İncelenen birimlerin sahip olduğu ve birimden birime farklı değerler alabilen, dolayısıyla birimlerin ayırt
edilmesini sağlayan niteliklerine “değişken” adı verilir. Örneğin, insanlar için yaş, cinsiyet, öğrenim
durumu, medeni durum, bir bina için inşaat türü, oda sayısı, kullanım alanı, bir hastane işletmesi için
yatak sayısı, hizmet verdiği servisler, doktor sayısı v.b. değişken olarak sayılabilir.
Bir değişken kütleyi oluşturan birimlerde çeşitli biçimlerde ortaya çıkabilir. Belirli bir değişkenin
birimlerde ortaya çıkış biçimine “düzey” adı verilir. Düzeyler araştırma için verileri (gözlem değerleri,
ölçüm sonuçları) oluşturur. Bu anlamda değişken, birimler topluluğunu veriler topluluğuna dönüştüren bir
işleve sahiptir. Değişkenler çeşitli açılardan sınıflandırılabilirler. Bu sınıflandırma biçimleri bir
araştırmanın istatistiksel olarak tanımlanmasında ele alınacak değişkenlerin belirlenmesinde yararlı
olmaktadır.
Sayısal ve Sayısal Olmayan Değişken
Düzeyleri sayılarla ifade edilebilen ve matematiksel işlemlere elverişli olan değişkenlere sayısal (nicel)
değişken adı verilir. Matematiksel işlemlere elverişlilik, incelenen değişkene ilişkin elde edilen veriler
üzerinde aritmetik işlemlerin bir anlam ifade etmesidir. Örneğin yaş, boy uzunluğu, ağırlık, işletmenin
geliri, yatan hastaların yatış süresi sayısal değişkenlerdir. Sayısal değişkenler ayrıca “sürekli sayısal
değişken” ve kesikli sayısal değişken” olmak üzere iki gruba ayrılabilir. Sayısal bir değişkenin herhangi
iki düzeyi arasına düşünsel olarak sonsuz sayıda yeni düzey ilave edilebiliyorsa sürekli, sınırlı sayıda yeni
düzey ilave edilebiliyorsa kesikli sayısal değişken söz konusu olur. Örneğin ağırlık değişkeninin iki
düzeyi arasına sonsuz sayıda yeni düzey getirilebilir, ancak ailedeki çocuk sayısı değişkeninin iki düzeyi
arasına sınırlı sayıda düzey ilave edilebilir. Buna göre ağırlık sürekli, çocuk sayısı kesikli sayısal
değişkendir.
Düzeyleri sözcüklerle ifade edilebilen ya da sayılarla ifade edilse bile matematiksel işlemlere elverişli
olmayan değişkenler sayısal olmayan (nitel) değişken olarak adlandırılır. Cinsiyet, medeni durum,
hastaların yattığı servis türü, hastanın mesleği değişkenleri sayısal olmayan değişkene örnek olarak
verilebilir.
Bağımsız, Bağımlı ve Kontrol Edilecek Değişken
Araştırmalarda ele alınan problemler genellikle çok değişkenli yapıdadır. Dolayısıyla bazı araştırmaların
amacı değişkenler arasındaki nedensellik (sebep-sonuç) ilişkisini belirlemek olabilir. Değişkenler bu tür
bir araştırmada üstlendikleri işlevlere göre bağımsız, bağımlı ve kontrol edilecek (etkisi arındırılacak)
değişken olarak üç grupta toplanabilir. Bağımlı (açıklanan) değişken, bir araştırmada özellikle inceleme
konusu olan ve başka değişken ya da değişkenler tarafından açıklanan değişkendir. Bağımsız (açıklayıcı)
değişken ise bağımlı değişken üzerinde etkisi araştırılan değişkendir. Bir araştırmada bağımlı ve bağımsız
değişkenler üzerinde etkili olabilecek bazı değişkenler bulunabilir. Bağımlı ve bağımsız değişkenler
6
arasındaki salt ilişkiyi ortaya koyabilmek bakımından bu tür değişkenlerin kontrol altına alınması ya da
etkilerinin giderilmesi gerekebilir. Bu tür değişkenler kontrol edilecek (etkisi arındırılacak) değişken
olarak ifade edilir.
Bir araştırmada herhangi bir değişkenin bağımsız, bağımlı ya da kontrol edilecek değişken işlevini
üstlenmesi araştırmanın amacı ile ilgilidir. Başka bir anlatımla, bir değişken belirli bir araştırmada
bağımsız değişken işlevi görürken başka bir araştırmada araştırmanın amacına uygun olarak bağımlı ya
da kontrol edilecek değişken işlevini üstlenebilir.
Değişken nedir? Sayısal ve sayısal olmayan değişkeni açıklayınız,
matematiksel işlemlere elverişliliğini değerlendiriniz.
Değişkenin Ölçülmesi ve Ölçekler
Bir araştırmada ele alınan belirli bir değişkenin birimlerde ortaya çıkış biçimi olan düzeyler değişkenin
ölçülmesiyle belirlenebilir. Ölçme, herhangi bir değişkene ilişkin gözlem sonuçlarının sayı ve simgelerle
gösterilmesidir. Birimlerin ele alınan değişken ya da değişkenlerin hangi düzeyine karşılık olduklarının
ölçme yoluyla belirlenmesi sonucu sayısal ve sayısal olmayan değerlere ulaşılır. Bilimsel araştırmalarda
bu değerler veri (gözlem değeri) olarak isimlendirilir. Bu verilerden yararlanılarak kullanılacak
çözümleme tekniklerinin belirlenmesinde değişkenlerin ölçme düzeyi olarak ifade edilebilecek ölçekler
önemli rol oynarlar. İstatistiksel araştırmalarda değişkenlere ilişkin elde edilen verilerin matematiksel
özelliklerine göre sınıflayıcı, sıralayıcı, aralıklı ve oranlı olmak üzere dört ölçek kullanılmaktadır. Bu
ölçekler izleyen alt kesimlerde incelenecektir.
Sınıflayıcı Ölçek
Sınıflayıcı ölçek, incelenen değişken bakımından birimlerin eşdeğer olup olmadıklarını ortaya koyan
ölçme düzeyidir. Bu ölçekte incelenen değişken bakımından benzer birimlere diğer birimlerden ayırmak
için aynı simge verilir. Bu simgeler sayılar olsa bile bunlar sadece birimlerin hangi sınıfa (kategoriye) ait
olduklarını belirler. Örneğin bir hastaneye başvuranların meslek bakımından incelenmesiyle çeşitli
meslek sınıflarına ayrılması ve her bir sınıfın da bir sayı veya simgeyle gösterilmesi durumunda
sınıflayıcı ölçek söz konusu olur. Sınıflayıcı ölçekte gözlem sonuçlarıyla sadece birimlerin
sınıflandırılması işlemi yapılabilir. Buna karşın sıralama ve aritmetik işlemler yapılamaz.
Sınıflayıcı ölçekle ölçülebilen değişkenlere ilişkin cinsiyet, medeni durum, hastanın yattığı servis,
hastane türü v.b. örnek olarak verilebilir.
Sıralayıcı Ölçek
Sıralayıcı ölçek ele alınan birimlerin incelenen değişken bakımından sınıflandırılması yanında önem
sıralarını da belirleyen ölçektir. Bu ölçekte gözlem sonuçları sayı ile ifade edildiğinde bunlar sıra
sayılarıdır. Örneğin bir yerleşim yerinde en çok tercih edilen hastaneye “1.”, ondan sonra tercih edilene
“2.”, … sıra sayılarının verilmesiyle tercih sırasının oluşturulması durumunda sıralayıcı ölçek söz konusu
olur. Burada sayıların sırasının bir anlamı olmakla birlikte, bunlar arasındaki farkın bir anlamı yoktur.
Başka bir anlatımla sıralayıcı ölçekte gözlem sonuçlarıyla sınıflama ve sıralama işlemleri yapılabilirken
aritmetik işlemler yapılamaz.
Sıralayıcı ölçekle ölçülebilen değişkenlere öğrenim düzeyi, ordu ve emniyet mensuplarının rütbeleri,
başarı düzeyi örnek olarak verilebilir.
Aralıklı Ölçek
Aralıklı ölçekte değişkenler için elde edilen gözlem değerleri sayılarla ifade edilirler ve bunlar
arasındaki farklar bir anlam taşımaktadır. Ele alınan bir değişkenin aralıklı ölçekle ölçülebilmesi için bir
ölçü biriminin tanımlanması gerekir. Ayrıca aralıklı ölçme düzeyinde gözlem değerleri için bir başlangıç
noktasının belirlenmesi gerekir. Örneğin sıcaklık değişkenini incelediğimizde gözlem değerleri 150C,
200C, 300C gibi ölçü birimi ile birlikte ifade edilir. Ayrıca 00C değeri -17,780F değerine karşılık
7
gelmektedir. Burada farklı ölçü birimlerinde farklı değerler elde edilmektedir. Aralıklı ölçekte sıfır değeri
bir anlam ifade eder, yani yokluk anlamına gelmez.
Aralıklı ölçekle ölçülebilen değişkenler için elde edilen gözlem sonuçlarıyla sınıflama, sıralama ve
aritmetik işlemler yapılabilir. Ancak herhangi iki değer arasındaki farkın bir anlamı varken iki değer
arasındaki kattan söz edilemez. Aralıklı ölçekle ölçülebilen değişkenlere takvim zamanı, başarı örnek
olarak verilebilir.
Oranlı Ölçek
Oranlı ölçekte aralıklı ölçeğin özellikleriyle birlikte sıfır değerinin bir başlangıç değeri olması söz
konusudur. Buna bağlı olarak sıfır değeri yokluk anlamı ifade eder ve herhangi iki değer arasındaki katın
(veya oranın) bir anlamı vardır. Bu ölçme düzeyinde ölçülebilen değişkenlere ilişkin elde edilen gözlem
değerleriyle sınıflama, sıralama ve aritmetik işlemler yapılabilir. Örneğin ağırlık değişkeni için elde
edilen değerler yardımıyla birimler 50 kg’dan az ve 50 kg ve daha fazla biçiminde sınıflandırılabilir.
Ayrıca gözlem değerleri en küçük değerden en büyüğüne doğru sıralandığında birimler de ağırlık sırasına
konmuş olur. Herhangi iki birime ilişkin ağırlık değerleri arasında 10 kg’lık bir fark olduğunu ve bir
birimin diğerinin iki katı ağırlığa sahip olduğunu söyleyebiliriz.
Oranlı ölçekle ölçülebilecek değişkenlere örnek olarak boy uzunluğu, hastane işletmesinin geliri,
yatan hasta sayısı, yatış süresi verilebilir.
Ölçekler arasında sınıflayıcıdan oranlıya doğru geçiş söz konusu değildir. Buna karşın oranlıdan
başlayarak sınıflayıcı ölçeğe doğru geçiş yapılabilir, ancak bu durum bilgi kaybına neden olur.
Bir araştırmanın amacına uygun olarak ele alınan herhangi bir değişkenin hangi ölçme düzeyinde
ölçülebileceğini belirleyebilmek için aşağıdaki sorulardan yararlanabiliriz.
a) Gözlem değerlerinin sırasının anlamı var mı?
b) Gözlem değerleri arasında farkın anlamı var mı?
c) Gözlem değerleri arasında katın anlamı var mı?
Ölçeklerin yukarıdaki sorulara verecekleri cevaplar dikkate alınarak aşağıdaki karar tablosu
oluşturulabilir.
Tablo 1.1: Ölçek Türü Belirlemede Karar Tablosu
Gözlem değerlerinin
sırasının anlamı var mı?
Gözlem değerleri arasında
farkın anlamı var mı?
Gözlem değerleri arasında
katın anlamı var mı?
Sınıflayıcı
Hayır
Hayır
Hayır
Sıralayıcı
Evet
Hayır
Hayır
Aralıklı
Evet
Evet
Hayır
Oranlı
Evet
Evet
Evet
Ölçek Türü
Verilerin elde edilmesinde kullanılan ölçeklerin önemi, istatistiksel çözümlemede kullanılacak teknik
seçiminde ortaya çıkmaktadır. Sayısal değişkenler oranlı ve aralıklı ölçme düzeyinde, buna karşın sayısal
olmayan değişkenler ise sıralayıcı ve sınıflayıcı ölçekle ölçülebilmektedir. Dolayısıyla sınıflayıcı ve
sıralayıcı ölçekle elde edilen veriler “parametrik olmayan”, aralıklı ve oranlı ölçekle elde edilen veriler
hem “parametrik” hem de “parametrik olmayan” tekniklerden yararlanılarak çözümlenebilir. Ancak
parametrik olmayan tekniklerin kullanımı bilgi kaybına neden olabilir. Özet olarak, sayılarla ifade edilen
her veri her türlü istatistiksel işlem ve çözümlemeye elverişli değildir. Bu nedenle, incelenen değişkene
ilişkin elde edilen verilerin hangi ölçekle ölçülmüş oldukları bilinmeli ve yeri geldiğinde hatırlanmalıdır.
8
Ölçek türlerini kısaca açıklayınız. Çözümleme tekniğinin seçimi
açısından önemini açıklayınız.
Likert Ölçeği
Sosyal bilimlerde bireylerin duyguları, düşünceleri, tutumları, beğeni düzeyleri, kaygıları ile ilgili veriler
anket yoluyla toplanmaktadır. Buna bağlı olarak elde edilen veriler genellikle sınıflayıcı ve sıralayıcı
ölçme düzeyinde olmaktadır. Likert ölçeği, insanların belirli bir konudaki tavırlarını ölçmek amacıyla
geliştirilmiş bir yaklaşımdır. Likert ölçeğinin oluşturulmasında yanıtlayıcılara belirli bir konuya ilişkin
çeşitli ifadeler (maddeler) sunulur ve bunlara karşı tavırlarını ifade eden seçeneği işaretlemeleri istenir.
Örneğin, hasta memnuniyetinin belirlenmesine ilişkin bir araştırmada “hemşirelik hizmetleri yeterlidir”,
“hastanenin genel temizliği iyidir”, “doktorum hastalığım konusunda doğruları söyler” biçimindeki
ifadeler için yanıtlayıcının ifadelere katılma derecesi genellikle 5’li ölçekle “kesinlikle katılmıyorum” ile
“kesinlikle katılıyorum” arasında seçenekleri işaretlemesi biçiminde belirlenir. Yanıtlayıcının bu
biçimdeki çok sayıda soruya verdikleri cevaplardan hareketle toplam skoru hesaplanabilir. Ancak
soruların oluşturulmasında farklı tavırları ortaya çıkarmada geçerli ve güvenilir olduklarının belirlenmesi
gerekir. Bu amaçla çeşitli yaklaşımlardan yararlanılmaktadır.
Örneğin; Bir hastane yöneticisi hastaneden hizmet alan kişilerin hizmetlere göre memnuniyetlerini
belirlemek istemektedir. Bu amaçla Likert ölçeği ile hazırlanan tutum ifadeleri Tablo 1.1’de örnek olarak
verilmiştir.
Tablo 1.1: Hastane Memnuniyetinin Belirlenmesi Amacıyla Likert Ölçeği Örneği
9
Özet
Değişkenlerin birimlerdeki ortaya çıkış biçimine
düzey adı verilir. Düzeyler verileri oluştururlar.
Değişkenlerin ölçülmesinde istatistikte ölçek
olarak adlandırılan dört ölçme düzeyinden
yararlanılır. Bunlar sınıflayıcı, sıralayıcı, aralıklı
ve oranlı ölçektir.
İstatistik
kelimesi
değişik
anlamlarda
kullanılmaktadır. Belirli amaçlar için kişi ve
kuruluşlar tarafından toplanan verileri belirtmek
için istatistikler kelimesi kullanılmaktadır. İkinci
anlamda istatistik, yöntembilimi açısından
verilerin elde edilmesi, düzenlenmesi, belirli
değerlerle özetlenmesi ve
çözümlenmesi
işlemlerinin gerçekleştirildiği teknikler bütününü
ifade eder. Üçüncü anlamda istatistik, ana kütle
olarak adlandırılan kütleye ilişkin parametreleri
tahmin etmek amacıyla örneklemden hesaplanan
özetleyici bilgileri ifade eder.
Bir araştırma probleminin çözümlenmesinde
kullanılacak tekniğin seçiminde değişkenlerin
hangi ölçekle ölçülebileceğinin belirlenmesi
önemlidir. Sınıflayıcı ve sıralayıcı ölçekle
ölçülebilen değişkenlerden elde edilen verilerle
parametrik olmayan tekniklerden, aralıklı ve
oranlı ölçekteki verilerle hem parametrik
olmayan hem de parametrik tekniklerden
yararlanılabilir.
İstatistik yığın olayları ve bunların oluşturduğu
kütleleri inceler. İstatistik, yığın olayları
incelemek suretiyle verilerin elde edilmesini,
düzenlenmesini, özetlenmesini, çeşitli tekniklerle
çözümlenmesini ve elde edilen sonuçların yarara
sunulmasını mümkün kılan teknikler bütünüdür.
Hakkında bilgi edinilmek istenen birimlerin
tamamının oluşturduğu topluluk ana kütle, bu ana
kütleden çekilen ve ana kütleyi araştırmanın
amacına uygun olarak temsil eden alt kütleye
örneklem adı verilir.
İstatistiğin betimleme ve çıkarsama olmak üzere
en genel olarak iki işlevi vardır. Betimsel
istatistik, elde edilen verilerin sayısal ve grafiksel
yaklaşımlarla özetler ve sunar. Çıkarsamalı
istatistik, bir ana kütleden tesadüfî olarak seçilen
örneklem yardımıyla ana kütle parametrelerine
ilişkin kestirim, hipotez testleri ve gelecek
dönemlere ilişkin öngörüler yapar.
Hakkında bilgi edinilmek istenen birimlerin sahip
olduğu ve birimden birime farklı değerler
alabilen niteliklere değişken adı verilir.
Değişkenler çeşitli açılardan sınıflandırılırlar.
Değişkenler sayılarla ifade edildiklerinde ve
sayıların aritmetik işlemlere elverişli olmaları
durumunda sayısal değişken, sayılarla ifade
edilemediği durumda ise sayısal olmayan
değişken olarak ifade edilirler. Sayısal
değişkenler ayrıca sürekli ve kesikli olmak üzere
iki sınıfta toplanır. Değişkenler ayrıca bir
araştırmada üstlendikleri işlevler açısından
bağımlı, bağımsız ve kontrol edilecek değişken
biçiminde üç sınıfa ayrılır.
10
Kendimizi Sınayalım
1. Aşağıdaki
değişkendir?
değişkenlerden
hangisi
6.
nicel
Aşağıdakilerden hangisi ani birim değildir?
a. Doğum
a. Cinsiyet
b. Grev
b. Yaş
c. Ölüm
c. Öğrenim durumu
d. Ameliyat
d. Meslek
e. Doktor
e. Medeni durum
7. Aralıklı ölçekle elde edilen verilerle hangi
işlem sonucu anlamlı olmaz?
2. Değişkenlerin ortaya çıkış biçimine ne ad
verilir?
a. Sınıflama
a. Birim
b. Sıralama
b. Kütle
c. Toplama
c. Düzey
d. İki değer arası fark
d. Örneklem
e. İki değer arası oran
8.
e. Ölçek
3. Aşağıdakilerden
kullanılmaz?
hangisi
birim
Aşağıdaki ifadelerden hangisi doğrudur?
a. İstatistik yığın olayları inceler
olarak
b. Aralıklı ölçekte sıfır değeri yokluk ifade eder
c. Doğal birimler parçalandığında birim olma
özelliğini yitirmez
a. Bina
b. Öğrenci
d. Bağımsız değişken açıklanan değişkendir
c. Hastane
e. Tipik olaylar istatistiğin konusudur
d. Renk
9. Ölçekler ile ilgili aşağıdaki ifadelerden
hangisi yanlıştır?
e. Trafik kazası
a. Sınıflayıcı ölçekle elde edilen verilerle sıralama yapılabilir
4. Araştırma amacına uygun olarak hakkında
bilgi edinilmek istenen birimlerin tamamının
oluşturduğu kütle hangisidir?
b. Sıralayıcı ölçekle elde edilen verilerle sıralama
yapılabilir
a. Ana kütle
c. Aralıklı ölçekle elde edilen verilerle sıralama
yapılabilir
b. Grup
c. Yığın
d. Oranlı ölçekle elde edilen verilerle sıralama
yapılabilir
d. Örneklem
e. Aralıklı ve oranlı ölçekle elde edilen verilerle
sınıflama yapılabilir
e. Üniversite
5. Aşağıdaki değişkenlerden hangisi aralıklı
ölçekle ölçülebilir?
10. Aşağıdakilerden
değişken değildir?
a. Hastalık türü
hangisi
a. Hastanenin yatak kapasitesi
b. Sıcaklık
b. Yatan hasta sayısı
c. Ağırlık
c. Çocuk sayısı
d. Göz rengi
d. Doğum ağırlığı
e. Gelir
e. Doktor sayısı
11
kesikli
sayısal
istatistiğin konusu olabilmesi için “yığın (yığın)
olay” niteliğinde olması gerekir. Dolayısıyla
istatistik her olayla ilgilenmez.
Kendimizi Sınayalım Yanıt
Anahtarı
1. b Yanıtınız yanlış ise “Değişken ve Türleri”
başlıklı konuyu yeniden gözden geçiriniz.
Sıra Sizde 3
İncelenen birimlerin sahip olduğu ve birimden
birime farklı değerler alabilen, dolayısıyla
birimlerin ayırt edilmesini sağlayan niteliklerine
“değişken” adı verilir. Düzeyleri sayılarla ifade
edilebilen ve matematiksel işlemlere elverişli
olan değişkenlere sayısal (nicel) değişken adı
verilir. Düzeyleri sözcüklerle ifade edilebilen ya
da sayılarla ifade edilse bile matematiksel
işlemlere elverişli olmayan değişkenler sayısal
olmayan (nitel) değişken olarak adlandırılır.
2. c Yanıtınız yanlış ise “Değişken ve Türleri”
başlıklı konuyu yeniden gözden geçiriniz.
3. d Yanıtınız yanlış ise “Birim ve Türleri”
başlıklı konuyu yeniden gözden geçiriniz.
4. a Yanıtınız yanlış ise “Ana kütle ve
Örneklem” başlıklı konuyu yeniden gözden
geçiriniz.
5. b Yanıtınız yanlış ise “Değişken ve Türleri ile
Değişkenin Ölçülmesi ve Ölçekler” başlıklı
konuyu yeniden gözden geçiriniz.
Sıra Sizde 4
6. e Yanıtınız yanlış ise “Birim ve Türleri”
başlıklı konuyu yeniden gözden geçiriniz.
Sınıflayıcı ölçek, incelenen değişken bakımından
birimlerin eşdeğer olup olmadıklarını ortaya
koyan ölçme düzeyidir. Sıralayıcı ölçek ele
alınan birimlerin incelenen değişken bakımından
sınıflandırılması yanında önem sıralarını da
belirleyen ölçektir. Bu ölçekte gözlem sonuçları
sayı ile ifade edildiğinde bunlar sıra sayılarıdır.
Aralıklı ölçekte değişkenler için elde edilen
gözlem değerleri sayılarla ifade edilirler ve
bunlar arasındaki farklar bir anlam taşımaktadır.
Ele alınan bir değişkenin aralıklı ölçekle
ölçülebilmesi
için
bir
ölçü
biriminin
tanımlanması gerekir. Oranlı ölçekte aralıklı
ölçeğin özellikleriyle birlikte sıfır değerinin bir
başlangıç değeri olması söz konusudur. Buna
bağlı olarak sıfır değeri yokluk anlamı ifade eder
ve herhangi iki değer arasındaki katın (veya
oranın) bir anlamı vardır. Bir araştırma
probleminin
çözümlenmesinde
kullanılacak
tekniğin seçiminde değişkenlerin hangi ölçekle
ölçülebileceğinin
belirlenmesi
önemlidir.
Sınıflayıcı ve sıralayıcı ölçekle ölçülebilen
değişkenlerden elde edilen verilerle parametrik
olmayan tekniklerden, aralıklı ve oranlı ölçekteki
verilerle hem parametrik olmayan hem de
parametrik tekniklerden yararlanılabilir.
7. e Yanıtınız yanlış ise “Değişkenin Ölçülmesi
ve Ölçekler” başlıklı konuyu yeniden gözden
geçiriniz.
8. a Yanıtınız yanlış ise “Temel Kavramlar”
başlıklı konuyu yeniden gözden geçiriniz.
9. a Yanıtınız yanlış ise “Değişkenin Ölçülmesi
ve Ölçekler” başlıklı konuyu yeniden gözden
geçiriniz.
10. d Yanıtınız yanlış ise “Değişken ve
Türleri” başlıklı konuyu yeniden gözden
geçiriniz.
Sıra Sizde Yanıt Anahtarı
Sıra Sizde 1
İstatistik, belirli bir amaca yönelik veri elde etme
(derleme), elde edilen verileri işleme, özetleme,
çözümleme ve elde edilen sonuçları yorumlama
işlemlerinin gerçekleştirildiği teknikler bilimidir.
İstatistiğin betimleme ve çıkarsama olmak üzere
en genel olarak iki işlevi vardır. Betimsel
istatistik, elde edilen verilerin sayısal ve grafiksel
yaklaşımlarla özetler ve sunar. Çıkarsamalı
istatistik, bir ana kütleden tesadüfi olarak seçilen
örneklem yardımıyla ana kütle parametrelerine
ilişkin kestirim, hipotez testleri ve gelecek
dönemlere ilişkin öngörüler yapar.
Sıra Sizde 2
Araştırmanın amacına uygun olarak incelenen ve
hakkında bilgi edinilmek istenen yığın olayların
her birine “birim” adı verilir. Ancak birimlerin
12
Yararlanılan Kaynaklar
Çömlekçi, N. (1998). Temel İstatistik İlke ve
Teknikleri. İstanbul: Bilim Teknik Yayınevi.
Çömlekçi, N. (1998). Bilimsel Araştırma
Yöntemi
ve
İstatistiksel
Anlamlılık
Sınamaları. İstanbul: Bilim Teknik Yayınevi.
Gürsakal, N. (2007). Betimsel
İstanbul: Nobel Yayın Dağıtım.
İstatistik,
Serper, Ö (2004). Uygulamalı İstatistik 1,
Bursa: Ezgi Kitabevi.
13
2
Amaçlarımız
Bu üniteyi tamamladıktan sonra;
İstatistiksel bir araştırmada verilerin nasıl derleneceğini açıklayabilecek,
Derleme türlerini ifade edebilecek,
Veri toplama tekniklerini sıralayabilecek,
Verileri tablo ve grafiklerle gösterebilecek,
bilgi ve becerilere sahip olabilirsiniz.
Anahtar Kavramlar
Veri
Anket
Derleme
Tablo
Derleme Türleri
Grafik
Veri Toplama Teknikleri
Histogram
Gözlem
İçindekiler

Giriş

Veri ve Derleme

Derleme Türleri

Verinin Özellikleri

Veri Toplama Teknikleri

Tablolar

Grafikler
14
Verilerin Derlenmesi,
İşlenmesi ve Grafiklerle
Gösterimi
GİRİŞ
Modern yaşamda karşılaşılan birçok sorunun çözümü için istatistiksel veriye ve istatistiksel çözümleme
tekniklerine gereksinim vardır. İstatistiksel teknikleri öğrenmek kolaydır, zor olan doğru ve veri için
uygun tekniğin doğru yerde kullanımıdır. Bu nedenle, yeni bilgilerin verilerin özenle derlenmesi, analiz
edilmesi ve yorumlanmasıyla elde edilebileceğini dikkate alarak, maksimum bilginin mümkün olan en
düşük maliyette sağlanabilmesi için verilerin derlenmesiyle ilgili kullanılacak tekniklerin seçiminde
özenli davranılması gerekir. İstatistiksel bir araştırma; araştırma probleminin tanımlanması, verilerin
derlenmesi, derlenen verilerin işlenmesi ve düzenlenmesi, verilerin belirli kurallar çerçevesinde
gösterilmesi, analiz ve sonuçların yorumlanması aşamalarından oluşur. Araştırmanın en önemli
basamaklarından biri olan veri derleme aşamasında hata yapıldığında, bundan sonraki tüm aşamalar
zincirleme olarak bu hatalı durumdan etkileneceğinden, doğru ve güvenilir veri uygun veri derleme
tekniği kullanılarak derlenmelidir.
Sağlık kurumları yöneticileri, kurumlarının geçmiş ve bugünkü hizmet göstergelerini anlayarak
kurumlarına ilişkin etkin planlamalar yapabilmesi için, öncelikle güvenilir verilere ve bu verileri
değerlendirebilmek için de istatistiksel tekniklere ihtiyacı vardır. Sağlık kurumları yöneticileri açısından
doğru verilerin derlenmesi, hizmetleri etkin ve uygun biçimde planlanarak doğru kararlar alınabilmesi
için çok önemlidir.
Bu ünitede verinin tanımı, veri derleme, verilerin sahip olması gereken özellikler, veri toplama
teknikleri ve verilerin gösterimi konuları işlenecektir.
VERİ VE DERLEME
Bir problemi çözmek, bir olayı aydınlatmak ya da belli bir konuda planlama yapmak amacıyla; istatistik
birimlerinin ilgilenilen değişken ya da değişkenler dikkate alınarak yapılan gözlem, ölçme ve sayma
yoluyla elde edilen özelliklerine veri denmektedir. Veriler sayısal, sözel, simge ya da herhangi bir şekil
ile gösterilebilir. Veriler, belirli bir amaca göre bir araya getirilip düzenlendikten sonra istatistiksel
tekniklerle analiz edilmesi sonucu bilgiye dönüşür. Bilgi, çok sayıda rakam topluluğundan oluşan verinin
istatistiksel teknikler kullanılarak daha az sayıda rakamla özetlenmesinden oluşur. Herhangi bir
hastanede muayene olan hastaların aldıkları hizmetlerden memnuniyet düzeyleri; “memnun değilim, orta
ve memnunum” cevapları veri, verilerin analizi sonucunda hastaların % 70’ inin memnun olduğu
bulgusu ise bilgi olarak değerlendirilir. Bu örnekten de anlaşılabileceği gibi karar alma sürecinde bilgi,
veriden daha değerlidir. Bu nedenle verinin bilgiye dönüştürülerek karar alıcıya sunulması gerekir. Bu
dönüştürme işlemi de ancak istatistiksel tekniklerin kullanımıyla olabilir.
Sağlık yöneticileri için veri kaynakları ölümler, doğumlar, hastalıklar ve sağlık hizmetleri konusunda
sürekli olarak tutulan kayıtlar veya deneylerle saptanan veriler olabilir. İstatistikte toplanan ilk veriler
ham veri olarak tanımlanır. Ham veriler üzerinde herhangi bir düzenleme ve işlem yapılmamış verilerdir.
Veri derleme, derlenen verilerin düzenlenmesi ve sunulması bir araştırmanın ilk basamaklarını
oluşturmaktadır. Veri derleme; belirlenen amaçlar doğrultusunda gözlenecek birimlerin ölçülmesi ya
15
da sayılması, sonra da bunların, ilgilenilen değişkenlere göre, hangi düzeylere sahip olduğunun
belirlenmesi ve kaydedilmesi işlemlerini içermektedir.
Derlemenin yapılabilmesi için derlemeye ilişkin konu ve gözlenecek birimlerin açık bir şekilde
tanımlanması gerekir. Bir kütleyi oluşturan öğelere birim adı verilmektedir. Bir olayın birim olabilmesi
için ölçülmeye ve sayılmaya uygun olması gerekir. Örneğin insan, evlilik, intihar, bekleme süresi,
kırmızı ışık ihlali, hastane, hastalık gibi canlı ve cansız varlıklar ölçülmeye ve sayılmaya elverişleri olan
istatistik birimleridir. Sayılmaya ve ölçülmeye uygun olmayan, kâbuslar, sevinçler ve rüyalar gibi olaylar
istatistik açısından birim olamazlar. Gözlem birimlerinden meydana gelen kütlenin, zaman ve mekânın
kesin olarak sınırlandırılmış olması gerekir. Araştırma nerede, ne zaman, kimlerle, ne kadar sürede
tamamlanacağı ve ölçmenin nasıl yapılacağı bilinmelidir. Hastanede belli bir ameliyatı olmuş hastalar,
bir hastalıktan dolayı yatan hastalar ya da meydana gelen bebek ölümlerine ilişkin derleme yapılacağı
zaman kimlerin gözleneceği açıklanmış olmakla birlikte, ne zaman ve nerede gözleneceklerine dair
sorular cevapsız kalmaktadır. Bu örnekteki belirsizliklerin giderilmesi için ana kütle zaman ve mekân
bakımından tanımlanmalı ve sınırlandırılmalıdır.
Verileri derlemeye başlamadan önce ana kütleyi zaman ve mekân
bakımından sınırlandırarak tanımlayınız.
Derleme Türleri
Derlemeleri farklı kriterlere göre sınıflandırmak mümkündür. Derlemenin ilk sınıflandırılması verilerin
elde ediliş biçimine göre doğrudan(dolaysız) ve dolaylı derlemedir. Araştırılması söz konusu olan ana
kütle birimleri doğrudan gözlenip kayıt altına alınıyorsa doğrudan derleme, ilgilenilen ana kütle
birimlerinin gözlenmesi yerine farklı bir ana kütlenin birimleri gözlenerek asıl ana kütle hakkında veri
derlenmesi ise dolaylı derleme türü olarak tanımlanır. Nüfusun miktarı ve çeşitli niteliklere göre dağılımı
belirlenmek istendiğinde doğrudan nüfusu oluşturan bireyler gözlemlendiğinden derleme doğrudandır.
Buna karşılık, bir ülkede nüfusun miktarını bulmak için bu ülkedeki konutların sayısı belirlenebilir ki, bu
dolaylı derlemedir. Böyle bir durumda asıl hakkında bilgi edinilmek istenen kütleye varabilmek için
tahmin yapmak gerekir. Bu örnek için ülke nüfusu, konut sayısının bir konutta yaşayan ortalama kişi
sayısı tahminiyle çarpılarak belirlenir. Dolaylı derleme ile elde edilen verilerin güvenirliği doğrudan
derlemeye göre daha az olacağından uygulamalarda dolaylı derleme türü tercih edilmemektedir.
Derleme genel ve kısmi olarak da sınıflandırılabilir. Bu sınıflandırma istatistiksel açıdan oldukça
önemlidir. Ana kütleyi oluşturan birimlerin tamamının gözlenmesi genel derleme olarak
tanımlanmaktadır. Nüfus sayımları genel derlemeye ilişkin en belirgin örnektir. Bazı durumlarda
üzerinde araştırma yapılan ana kütlenin tamamının gözlenmesi maliyet, zaman ve işgücü açısından
imkansızdır. Bu gibi durumlarda ana kütleyi oluşturan birimlerin tamamının gözlenmesi yerine olası
gözlem birimlerinin bir bölümü seçilerek incelenir. Bu derleme türü kısmi derleme olarak tanımlanır.
Genel derlemede ana kütleyi oluşturan bütün birimler-denekler gözlenirken kısmi derlemede ana kütle
içinden tesadüfi bir örneklem seçilerek gözlem yapılır. Bundan dolayı genel derleme “tamsayım”, kısmi
derleme ise “örnekleme” olarak da tanımlanmaktır. Doğu Anadolu Bölgesindeki yetişkinlerin beslenme
alışkanlıklarının belirlenmesi için yürütülen bir araştırmada, söz konusu bölgedeki yetişkin bireylerin
tamamı gözlendiğinde genel derleme, ancak bu bölgeden tesadüfî olarak seçilen 1000 kişinin gözlenmesi
ise kısmi derlemeye örnektir.
Derleme, derlemenin zamanına göre ani ya da devamlı olarak da sınıflandırılabilmektedir. Kütleyi
oluşturan gözlem birimlerinin belli bir zaman aralığındaki durumlarının belirlenmesi için yapılan
derleme ani derlemedir. Ani derlemede kütleyi oluşturan birimler devamlı birimlerdir. Bu birimler,
tanımlanan bir zaman aralığında toplu halde var olan ve gözlenen birimlerdir. Nüfus, hastane, tarım ve
sanayi işyeri sayımları ani derlemeye örnektir. Araştırılması söz konusu olayın gözlenmesi olay
gerçekleştiği anda oluyorsa bu derleme devamlı derlemedir. Bu olaylar belli bir zaman aralığı boyunca
meydana geldikçe kayıt altına alınmaktadırlar. Devamlı derlemede kütle ani birimlerden oluşmaktadır. Bu
birimlerin belli bir zaman aralığında gözlenmeleri ve kaydedilmeleri gerekmektedir. Doğum, ölüm,
16
intihar, bir acil servise gelen hastaların yaralanma türü, evlenme ve bir hastanenin hasta hakları birimine
gelen şikâyetler devamlı derlemeye örnek olarak gösterilebilir.
Genel ve kısmi derleme kavramlarını örneklendirerek açıklayınız.
Verinin Özellikleri
Derlenen verilerden anlamlı sonuçlar çıkarabilmek için verinin taşıması gereken bazı özellikler vardır. Bu
özellikler verinin yararlılık derecesinin belirlenmesini sağlamaktadır. Öncelikle bir veri doğru olmalı ve
var olan durumu objektif bir biçimde yansıtmalıdır. Doğruluk, en basit tanımıyla gözlenen veya ölçülen
bir olgunun gerçeği en yakın biçimde yansıtmasıdır. Bir hastanede yürütülen hasta memnuniyeti
çalışmasında söz konusu hastanenin hizmetlerinden hiç faydalanmamış bir kişiye anket uygulayarak elde
edilen verinin doğruluğu tartışmalıdır. “Hastane Afet Planı” na ilişkin eğitim almamış ve hiç tatbikata
katılmamış yönetici hemşirelerin, deprem afet planları konusundaki görüşlerinden oluşan veriler var olan
durumu objektif olarak yansıtmadığından doğru veri değildir.
Verilerin taşıması gereken diğer bir özellik ise güvenilir olmasıdır. Güvenirlik aynı şeyin tekrarlamalı
ölçme sonuçlarının birbirine yakın değerler almasıdır. Doğru veri aynı zamanda güvenilir veri olma
özelliğini de taşımaktadır. Güvenilir bir verinin ise aynı zamanda doğru bir veri olduğu söylenemez.
Bir veri güncel olmalıdır. Bir araştırmada derlenen veriler o zamana kadar olan durumu belirleyerek,
geleceğe ilişkin tahminlerde bulunmak ve planlama yapmak için kullanılır. Verilerin gereksinimleri
karşılayabilmesi ve onlardan yararlanılabilmesi için zamanında elde edilerek kullanıma sunulması
gereklidir. Bir afet bölgesinde, risk gruplarının temel sağlık ihtiyaçlarına ilişkin verilerin afet durumu
ortadan kalktıktan sonra ya da derleme işleminin çok uzun sürmesi durumunda veriler güncel olma
özelliğini taşımayacaktır.
Verinin taşıması gereken son özellik maliyettir. Verinin faydası derlenmesi için yapılan harcamadan
daha yüksek olmalıdır.
Verinin taşıması gereken dört özelliği açıklayınız.
Veri Derleme Teknikleri
Araştırma sorununun çözümlenebilmesi için gerekli olan veri farklı kaynaklardan sağlanabilir. İstatistik
yayınları, dergiler, raporlar ve arşivler hazır veri kaynaklarıdır. Bir istatistiksel araştırmada hazır veri; iç
veya dış kaynaklardan sağlanabilir. Örneğin bir hastanenin acil servisine gelen hastaların şikayet
nedenlerini araştırmak isteyen bir yönetici gereksinim duyduğu verileri hastanenin kayıtlarından
sağlayabilir, böyle bir araştırmada iç veri kaynağı kullanmış olacaktır. Çeşitli illerdeki özel hastanelerin
yoğun bakım ünitelerinin kapasiteleri hakkında araştırma yapan yöneticinin yararlanacağı veriler, Sağlık
Bakanlığı Sağlık İstatistikleri Yıllığından veya TSİM’ den (Temel Sağlık İstatistikleri Müdürlüğü) elde
edilebilir. Bu yolla elde edilen veriler dış veri niteliğindedir.
Sağlık alanında veri toplama teknikleri; sistematik veri toplama teknikleri ve özel veri toplama
teknikleri olmak üzere iki başlık altında ele alınmaktadır. Sistematik veri derleme, istatistik birimlerinin
çeşitli niteliklerine ait bilgilerin ortaya çıktığı yer ve zamanda belgelenerek kayıt altına alınmasıyla
yapılır. Özel amaca yönelik verilerin toplanması için başvurulan teknikler ise özel veri toplama
teknikleri olarak adlandırılır.
Sistematik Veri Toplama Teknikleri
Sağlık alanında kullanılan sistematik veri kaynakları, kayıtlar, sayımlar ve özel bildirimlerdir. Sistematik
veri toplama tekniğinde hazır veri kaynaklarından faydalanılır.
17
Sağlık kayıtları; hasta ya da sağlıklı tüm bireylerin sağlık ve hastalıkla ilgili bilgileri ile sağlık
yönetimiyle ilgili bilgilerin yazıldığı defter, kart, dosya, form ya da formlar topluluğudur. Doğum, ölüm
ve hastalık kayıtları sağlık hizmetlerinin planlanmasında kullanılan en önemli veri kaynaklardır.
Belirli zaman aralıklarında yapılan sayımlarla bölge ya da ülke hakkında bazı veriler derlenir. Genel
nüfus sayımı en önemli veri derleme tekniğidir. Nüfus sayımı; bir ülkede veya herhangi bir toplumda
belirli bir zaman kesitinde yaşayanların sayısını, niteliklerini saptamak amacıyla yapılan sayımlardır.
Özel bildirimler; sağlık kurum ve kuruluşları ile sağlık personelinin bazı sağlık olaylarını (doğum,
anne ölümleri, ölümler, bulaşıcı hastalıklar vb.) gözledikleri anda belirli süre içinde sağlık otoritelerine
bildirmeyle elde edilen verilerdir. Bazı sağlık olayları sağlık bakanlığınca, bildirimi zorunlu olaylar ya da
hastalıklar olarak tanımlanmıştır. Bu sağlık olayları gözlendiği an ya da her ayın sonunda ilgili birimlere
bildirilmesi zorunludur.
Sağlık Bakanlığı Sağlıkta Dönüşüm Programı kapsamında Bilgi İşlem Daire Başkanlığı
sorumluluğunda yürütülen çalışmalarla, sağlık verilerinin ve temel süreçlerin standart hâle getirilmesi
üzerinde yoğunlaşmaktadır. Sağlık alanından toplanan veriler, il sağlık müdürlükleri aracılığıyla
elektronik ortamda sağlık bakanlığı veri sistemine aktarılmaktadır. Bakanlık sağlık hizmetlerini planlama,
yürütme, değerlendirme ve denetim işlevlerinde bu verileri ölçü olarak kullanmaktadır. Sağlık bakanlığı;
Sağlık-NET ile sağlık kurumlarında üretilen her türlü veriyi, doğrudan üretildikleri yerden, standartlara
uygun şekilde toplamayı, toplanan verilerden tüm paydaşlar için uygun bilgiler üreterek sağlık
hizmetlerinde verim ve kaliteyi artırmayı hedefleyen, entegre, güvenli, hızlı ve genişleyebilen bir bilgi ve
iletişim platformu kurmayı amaçlamaktadır.
http://www.sagliknet.saglik.gov.tr/
Sağlık Bakanlığı Tedavi Hizmetleri Genel Müdürlüğü tarafından “Çekirdek Kaynak Yönetim
Sistemi” ile toplanan veriler hazır veri kaynakları için önemli örneklerden biridir. Sağlık Bakanlığı
“Çekirdek Kaynak Yönetim Sistemi” ile standart olarak geliştirilmiş formlara uygun olarak kayıtlar
yapılmaktadır. İlgili birimlerin sağlıkla ilgili verileri kayıt altına alması sağlık bilgi kaynağını
oluşturmaktadır.
TC. Sağlık Bakanlığı Tedavi Hizmetleri Genel Müdürlüğü:
http://www.tedavi.saglik.gov.tr/
Sağlık Bakanlığının sahadan toplayacağı minimum içeriğe sahip veri grupları Minimum Veri Setleri
(MVS) olarak adlandırılmaktadır. MVS ile şimdiye kadar kâğıt ortamda toplanan veriler, gelişen
haberleşme ve bilişim teknolojisi altyapısını kullanarak daha hızlı ve doğru bir şekilde doğrudan verinin
üretildiği bilgi sisteminden elektronik ortamda Sağlık Bakanlığına iletilebilmektedir. Sağlık Kurumları,
veri setleri içerisinde yer alan veri elemanlarını kullandıkları bilgi sistemleri aracılığıyla veya Sağlık-NET
portalı üzerindeki veri seti bildirim ekranları aracılığıyla Sağlık Bakanlığına iletilmektedir. Minimum
Sağlık Veri Setleri (MSVS) ile başlangıçta büyük ölçüde sağlık verisi toplama amacıyla geliştirilen veri
setlerine, idari ve mali veri setlerinin de eklenmesiyle daha kapsamlı bir yapı ortaya çıkartılması
planlanmaktadır. Sağlık bakanlığı bünyesinde İdari Veri Setleri ve Mali Veri Setleri çalışmaları
önümüzdeki dönemde yerine getirileceğe öngörülmektedir. İdari Veri Setleri, sağlık kurumlarının altyapı
ve idari bilgilerini toplamayı hedeflerken; Mali Veri Setleri ise sağlık kurumlarının maliyet bilgilerini
toplamayı hedeflemektedir. MSVS veri seti içerikleri Şekil 2.1’ de gösterilmiştir.
18
Şekil 2.1: Sağlık Bakanlığı Minimum Sağlık Veri Setleri
Sağlık-NET bünyesinde Aralık 2011 tarihine kadar hazırlanmış olan Minimum Sağlık Veri Seti adedi
46 tanedir. Bu veri setlerinin listesine ve içeriklerine Ulusal Sağlık Veri Sözlüğü Web Browser üzerinden
ulaşılabilmektedir. Veri setlerini ana gruplar halinde ifade etmek gerekirse 10 farklı veri seti grubundan
bahsetmek mümkündür;

Kayıt Veri Setleri

Doğum-Ölüm Veri Setleri

Bebek-Çocuk Veri Setleri

Kadın Sağlığı Veri Setleri

Bulaşıcı Hastalık Veri Setleri

Muayene Grubu Veri Setleri

Yatan Hasta Veri Setleri

Kronik Hastalık Veri Setleri

Organ ve Kök Hücre Nakil Veri Setleri

Akıl ve Ruh Sağlığı Veri Setleri
Sağlık Bakanlığının veri şeması Temel Sağlık İstatistikleri Müdürlüğü (TSİM), İnsan Kaynakları
Yönetimi Sistemi (İKYS), Sağlık Kuruluşları Yönetim Sistemi (SKYS), Malzeme Kaynakları Yönetim
Sistemi (MKYS) ve Çekirdek Kaynak Yönetim Sisteminden (ÇKYS) meydana gelmektedir. Veri şeması
Şekil 2.2’de verilmiştir.
Şekil 2.2: Sağlık Bakanlığı veri tabanı şeması
19
Sağlık Bakanlığı veri akış şeması ise Şekil 2.3’ te ayrıntılı olarak verilmiştir.
Şekil 2.3 Sağlık Bakanlığı veri akış şeması
http://www.istatistik.saglik.gov.tr
Özel Veri Toplama Teknikleri
Veri kaynakları çok çeşitli olmakla birlikte her zaman yeterli olmayabilir. Bazen gerekli olan veri, iç ve
dış veri kaynaklarından elde edilemeyebilir. Bu gibi durumlarda yeni veri derlemek zorunlu hale gelir.
İstatistiksel bir araştırmada, yeni veri derlemesine karar verildiğinde, öncelikle uygun veri derleme
tekniğinin seçilmesi gerekir. Yürütülecek istatistiksel bir araştırma ister deneysel araştırma isterse de alan
araştırması yöntemi olsun, kullanılacak özel veri toplama teknikleri; gözlem, görüşme, anket, taramalar
ve muayenelerdir. İzleyen kısımda sözü edilen bu tekniklere yer verilecektir.
Gözlem Tekniği
Gözlem tekniği, veri derleme teknikleri arasında en yaygın olarak kullanılanıdır. Gözlem bakma ve
dinleme olarak tanımlanabilir. Her araştırıcının dikkatli gözlemler yapabilmesi gerekir. Çok farklı
şekillerde yapılabilen gözlem, özel veri derleme tekniklerinin hem en eskisi, hem en modern olanıdır.
Gözlem tekniği laboratuvar deneylerinde kullanıldığı gibi, alan araştırması niteliğindeki araştırmalarda da
kullanılabilir. Araştırmacı gözlemi, veri derleme tekniği olarak seçtiğinde, bu seçiminin araştırmasına
sağlayacağı yarar ve sakıncaları dikkate almalıdır.
Gözlem tekniğinin sağladığı yararlar;
1.
Bu veri derleme tekniğinde ölçme işlemi ilgilenilen birim üzerinde doğrudan doğruya yapıldığı
için, veri derlemesi sırasında “eksik hatırlama” veya “gerçeklerin çarpıtılması” gibi sorunlar
ortaya çıkmaz.
2.
Gözlem tekniği uygulanarak veriler oldukça uzun bir zaman aralığı boyunca sürekli olarak elde
edilebilir.
Gözlem tekniğinin sakıncaları ise;
1.
Gözlem tekniğini benimseyen araştırmacı yanlı davranabilir, ilgilenilen değişken veya
değişkenlere ilişkin ölçüm değerlerini doğru bir biçimde kaydetmeyebilir.
2.
Gözlemi yapanlar yanlı davranabilecekleri gibi, gözlenenler de yanlı gözlemlere neden
olabilirler. Gözlemi yapılan ve bunun farkında olan kişiler davranışlarını değiştirebilir. Böylece
derlenen veriler yanlı olabilir.
İstatistiksel bir araştırmada veri derleme tekniği olarak gözlem benimsendiğinde aynı zamanda
gözlemlerin (derlenen verilerin) hangi koşullarda yapıldığı ve veri setinin sınırlılıkları da açıklanmış olur.
20
Görüşme Tekniği
Görüşme tekniğiyle veri derlemede görüşmeci daha önce hazırlanmış olan soru kâğıdındaki soruları
ilgiliye sorar, yanıtları da soru kâğıdında yanıtlara ayrılmış olan yerlere kaydeder. Görüşmeci ve
yanıtlayıcı kişi arasındaki doğrudan ilişkiyle derlenen verilerin birtakım yararları olduğu gibi sakıncaları
da olabilir;
1.
Kendileriyle doğrudan ilişki kurulan kişiler, yöneltilen sorulara cevap verme eğilimindedir.
Görüşülen kişilerin büyük bir bölümü yararlı yanıtlar verebilir.
2.
Görüşme tekniği soruların yanlış anlaşılmasını engellerken, tamamlayıcı bir takım verilerin de
derlenmesine imkân sağlayabilir.
Veri derleme tekniği olarak görüşme seçildiğinde bazı sakıncalar ortaya çıkabilir;
1.
Görüşmeci yanıtlayanların seçiminde objektif davranmayabilir. Bu durum verilerde bir yanlılığa
neden olur.
2.
Görüşmeci tutum ve davranışlarıyla yanıtlayanı etkileyebilir.
3.
Görüşmeci yanıtları kaydetmede hatalar yapabilir.
Anket Tekniği
Anket tekniği doğrudan yanıtlayanın doldurması gereken bir soru kâğıdına dayandırılmış bir veri
derleme tekniğidir. Anketler; yanıt ya da yanıtları yazmayı gerektiren açık uçlu sorulardan oluşabileceği
gibi daha önceden belirlenmiş yanıt seçeneklerinden birini veya birkaçını işaretlemeyi gerektiren kapalı
uçlu sorulardan oluşur. Soru kâğıdı yanıtlayıcıya posta veya başka bir şekilde kendisine ulaştırılır. Anket
ile veri derlemenin yarar ve sakıncalar, görüşmecinin olmamasından kaynaklanabilir. Görüşme tekniğinde
görüşmeci nedeniyle ortaya çıkan yanılgılar anket yoluyla veri derlemede ortadan kalkar; ancak bu defa
da görüşmecinin olmaması nedeniyle bazı sorunlar ortaya çıkabilir:
1.
Anket soruları bir kuruma veya bir aileye ulaştırıldığında, yanıtlayıcı konusunda bir denetim
uygulanması söz konusu değildir.
2.
Görüşmecinin olmaması nedeniyle yanıtlama oranının düşük düzeyde kalmasıyla karşılaşılabilir.
Düşük yanıtlama oranı özellikle alan araştırmalarında yanlılığın ortaya çıkmasına neden olabilir.
Taramalar
Toplumda görülen veya görülebilecek sağlık olaylarının tespiti için çeşitli araştırmalar yapılır. Bu
araştırmalarda özel veri derleme tekniği olarak taramalar kullanılır. Bulaşıcı hastalıkların tespitinde en
çok kullanılan bu teknikte;
1.
Risk altındaki grupların belirlenmesiyle araştırmanın sınırları çizilir,
2.
Taramada kullanılacak teknik ve formlar tespit edilir,
3.
Taramada görev alacak, yapılacak araştırma alanında eğitimli personel seçilir,
4.
Tarama sonucu kullanılacak değerlendirme şekli belirlenir,
5.
Değerlendirme sonucu rapor hâlinde sunulur.
Muayeneler
Toplumda görülen hastalıkların durumu ve seyrinin nasıl devam ettiğini tespit etmek için uygulanan veri
toplama tekniğidir. Muayenede hangi tekniklerin uygulanacağı, hangi tetkiklerin yapılacağı ve bireylere
hangi soruların sorulacağı önceden belirlenir.
Yukarıda ifade edilen teknikler kullanılarak derlenen verilerin daha iyi anlaşılabilir duruma
getirilebilmesi için tablolar veya grafikler şeklinde düzenlenmesi gerekir. Araştırmada ele alınan değişken
türüne göre oluşturulan tablo ve grafikler izleyen kısımda aktarılacaktır.
21
Özel veri toplama teknikleri; gözlem, görüşme, anket, taramalar ve
muayenelerdir.
Sistematik veri derleme teknikleri nelerdir?
Tablolar ve Grafikler
İstatistiğin üç temel işlevi betimleme, çözümleme ve tahmindir. Betimleme işlevinin temel amacı
istatistiksel verilerin özetlenerek en iyi şekilde kullanıma sunmaktır. Gözlenen veya kayıt altına alınan
veriler başlangıçta anlaşılması zor karmaşık bir niteliktedir. Derleme sonucunda elde edilen istatistiksel
veriler belli bir düzende olmayan niceliklerdir. Fişler, anketler veya listeler şeklinde toplanmış verilere
bakarak ilk bakışta bir sonuç çıkarmak oldukça zordur. Belli bir niteliğe ilişkin toplanmış ham verilerin
düzenlenerek sunulması gereklidir. Ham verilerin düzenlenmesi ve sunumu ele alınan verilerin niteliğine
göre yapılmaktadır. Bundan dolayı veriler tablolar veya grafikler yardımıyla sunulabilir.
Tablo, elde edilen sayısal veya sözel verilerin satır ve sütunler halinde düzenlenmiş halidir. Tablolar
verilerin daha kolay anlaşılmasını sağlar. İstatistiksel verilerin sunulduğu tabloların üç temel özelliği:
tablonun hangi bilgiyi içerdiğini gösterir bir başlığının, satır ve sütunlarının olmasıdır. Tablonun satır ve
sütunlarında hangi bilgilerin temsil edildiği açık bir biçimde belirtilmelidir. Tablolarda sunulan bilgiler
anlaşılabilir olmalı ve çok fazla bilgiyi aynı anda karmaşık olarak sunmamalıdır. Ayrıca tabloda
kullanılan verilerin varsa ölçü birimi (TL, kg., saat, vb.) açık bir şekilde ifade edilmelidir.
Verilerin daha anlaşılır bir şekilde sunumunu sağlayan diğer bir gösterim şekli ise grafiklerdir. Bir
grafik kolayca anlaşılabilir ve çiziminin objektif olmasının yanı sıra konusunu açıklayan bir başlığa da
sahip olmalıdır. Grafik çiziminde; histogram, çizgi grafiği, çubuk grafiği ve daire grafik gibi grafik türleri
kullanılabilir.
İstatistiksel verilerin sunulduğu tabloların üç temel özelliğini yazınız.
Tablolar
Nicel (sayısal) bir değişken (yaş, canlı doğum ağırlığı, kolesterol düzeyleri vb.) dikkate alınarak gözlem
yapıldıysa, söz konusu bu gözlem değerleri belli bir sıraya göre dizilir ve değişkenin aldığı değerlere göre
sınıflanır. Nitel (sözel-sayısal olmayan) bir değişken (cinsiyet, medeni durum, göz rengi vb.) söz konusu
olduğunda ise gözlenen özelliğin gözlem birimlerindeki görünme sayıları saptanarak tablo halinde
sunulur. İlgilenilen nitel değişken sayısı iki veya daha çok olduğunda çapraz tablolar (kontenjans)
kullanılarak verilerin sunumu gerçekleştirilir.
Nicel Verilerin Tablolaştırılması
Bir tablo oluşturulurken yapılacak işlemlerden ilki, derlenen ham verilerin küçükten büyüğe veya
büyükten küçüğe sıralayarak istatistiksel bir dizi oluşturmaktır. Belli bir amaca göre düzenlenmiş veriler
tabloya aktarılırken tablonun bir başlığı olmalıdır. Tablo başlığı bilgiyi kısa ve anlaşılır bir biçimde
tanımlamalıdır. Satır ve sütun başlıkları açık bir biçimde belirtilmelidir. Ayrıca satır ve sütunlarda yer
alan değişkenlerin ölçülmesinde kullanılan ölçü birimlerine yer verilmelidir ( kg, saat, %, lt vb.).
Örneğin; bir aile hekimine gün içerisinde gelen 30 kadın hastanın ağırlıkları (kg) ile ilgilendiğimizi
varsayalım. Kadınların ağırlıkları (kg) şöyledir: 68, 57, 50, 47, 61, 49, 68, 57, 68, 55,49, 52, 61, 50, 55,
68, 55, 57, 57, 61, 52, 72, 63, 65, 50, 72, 61, 63, 68, 49. Bu 30 kadına ait ağırlıkları kullanarak bir tablo
hazırlayalım. Yukarıda verilen ağırlıklar incelendiğinde verilerin karmaşık bir halde olduğu ve bir anlam
ifade etmediği anlaşılmaktadır. Öncelikle bu veriler küçükten büyüğe dizilmelidir.
Ağırlık (kg) : 47, 49, 49, 49,50, 50, 50, 52, 52, 55, 55, 55, 57, 57, 57, 57, 61, 61, 61, 61, 63, 63, 65,
68, 68, 68, 68, 68, 72, 72
22
Bu düzenlemeyle veriler derli toplu bir görünüş kazanmış olmaktadır. Verilerin bu şekilde bir dizi
olarak gösterilmesi kolaylıkla algılanmasına ve yorumlanmasına imkan vermektedir. Ağırlıklar
incelendiğinde çok sayıda ağırlığın tekrarlanan değerleri olduğu görülmektedir. Ölçümlerin tekrar
sayıları frekans (sıklık) olarak tanımlanır.
Bu durumda iki sütundan oluşan bir tablo oluşturarak verilerin düzenlenmesi sağlanabilir. Tablonun
birinci sütununda ağırlık değişkeninin almış olduğu farklı değerlere, ikinci sütununda ise her değerin
gözlem sayısını gösteren frekanslara yer verilir.
Tablo 2.1: 30 Kadının ağırlıklarına ait frekans dağılımı
Ağırlık (kg)
47
49
50
52
55
57
61
63
65
68
72
Toplam
Frekans
1
3
3
2
3
4
4
2
1
5
2
30
Tablon 2.1’ in ikinci sütunda yer alan frekansların toplamı toplam gözlem sayısına eşit olmalıdır.
Tablo incelendiğinde en düşük ağırlığın 47 kg, en yüksek ağırlığın 72 kg ve en çok gözlenen ağırlığın ise
68 kg olduğu görülmektedir.
Tablo 2.1’ de sunulan frekans dağılımına gruplandırılmamış frekans dağılımı da denilmektedir.
Gruplandırılmamış frekans dağılımı gözlenen birim sayısı az olduğunda verilerin sunulması için oldukça
elverişlidir. Oluşturulan tablonun matematiksel simgelerle gösteriminde
olduğu değeri, ni ise i. değerin frekansını göstermek için kullanılır.
xi , değişkenin i. sıradaki almış
Frekans
Değişken
ni
xi
x1
n1
x2
n2
.
.
.
.
.
.
xk
nk
Toplam
n
Frekansların toplamı yukarıda değinildiği gibi toplam gözlem sayısına eşit olmalıdır. O zaman;
k
n   ni  n1  n2 
i 1
 nk dır.
Nicel Verilerin Gruplandırılarak Tablolaştırılması
Tablo 2.1’ de ele alınan örnekte ağırlık değişkeninin ölçülmesi sonucunda elde edilen veriler
gruplandırılmadan tablolaştırıldı. Derlenen verilerin çok fazla sayıda olduğunda verileri gruplandırmadan
sunmak oldukça zordur. Gözlenen denek veya birim sayısı çok fazla olduğunda ve ölçümü yapılan
değişkenin almış olduğu değerler bir birinden oldukça farklı olduğunda gruplandırılmamış frekans
23
dağılımları çok uzun olabilmektedir. Böyle durumlarda gruplandırılmamış frekans dağılımı veriyi temsil
etmede kolayca anlamada yetersiz kalabilir. Bundan dolayı verilerin gruplandırılarak tablolaştırılması en
iyi çözümdür. Yaş, kişi başı ilaç harcaması, hastane yatış süresi, fiili yatak sayısı, döner sermaye
harcamaları gibi değişkenlerin tablo halinde sunumunda verilerin gruplandırılmış frekans dağılımı
biçiminde verilmesi sıklıkla tercih edilmektedir. Gruplandırılmış frekans dağılımları kullanıldığında bilgi
kaybı olmakla birlikte genel yapının daha kolay bir biçimde betimlenmesine olanak tanınmaktadır.
Verilerin gruplandırılmasında en önemli konular; ilgilenilen değişkenin kesikli ya da sürekli olması,
grup sayısı ve grup aralığıdır. Öncelikle elde edilen ham verilerin dizi biçiminde düzenlenmesi
gereklidir. Küçükten büyüğe sıralanmış olarak düzenlenen verilerin kaç grupta sınıflandırılacağının
belirlenmesi için genellikle Sturges Kuralı kullanılır. Sturges kuralı uygun grup sayısının ve grup
aralığının hesaplanmasını olanak sağlamaktadır. Gruplandırma yapılırken ilgilenilen değişken nicel ve
sürekli ise gruplandırma işleminde genellikle ortak sınıf yaklaşımı benimsenirken, değişken nicel ve
kesikli olduğunda ise ortak sınıf yaklaşımı benimsenmez.
Sturges kuralı yardımıyla grup sayısını hesaplamak için aşağıdaki matematiksel eşitlik kullanılır:
k  1   3,3  log n 
k, grup sayısını n ise toplam gözlem sayısını göstermektedir. Grup sayısı belirlendikten sonra grup
aralıklarını hesaplamak için veri setindeki gözlenen en küçük ve en büyük değer yardımıyla aşağıdaki
eşitlik kullanılır;
c
xenbüyük  xenküçük
k
Örnek 2.1: Bir hastanede çalışanların örgüt kültürünü belirlemek amacıyla yapılan bir çalışmada, 50
personelin kıdem yılına ilişkin veriler derlenmiştir. Elde edilen sonuçlar Tablo 2.2’ de verilmiştir.
Tablo 2.2: Kıdem yıları
1
6
15
1
7
15
1
8
16
2
8
16
2
9
17
2
9
17
3
9
18
Kıdem Yılı
3
3
3
10
10
10
18
20
20
4
11
21
4
11
21
5
11
22
5
13
23
5
14
26
5
14
28
6
15
Çözüm 2.1: Tablo 2.2’de yer alan veri setinin gruplandırılarak tablolaştırılması için aşağıdaki işlem
adımları sırasıyla gerçekleştirilir.
1. Grup Sayısının Hesaplanması
k  1   3,3  log n 
n  50 (toplam gözlem sayısı)
log50  1,699
k  1   3,3 1,699   6,61  7
Veriler 7 grup altında düzenlenecektir.
2. Grup Aralığının Hesaplanması
Veri setinde kayıt altına alınan en küçük kıdem yılı 1 yıl ve en yüksek kıdem yılı 28 yıldır.
xenb  28
xenk  1
c
28  1
4
7
Grup aralığının genişliği 4 yıl olacaktır.
24
3. Grup sayısı 7 ve grup aralığı 4 yıla göre verilerin tablolaştırılması
Kayıt altına alınan en küçük değerden başlanarak (1 yıl) grup aralıkları 4 yıl ve grup sayısı 7 olacak
biçimde veriler gruplandırılır. Gruplar oluşturulduktan sonra bu gruplarda yer alan değerlerin sayısı
frekans olarak tablonun ikinci sütununa yazılır.
Tablo 2.3: Kıdem yıllarına ilişkin gruplandırılmış frekans dağılımı
Kıdem Yılı
Frekans
1 - 5’den az
12
5 - 9’dan az
9
9 - 13’den az
9
13 - 17’den az
8
17 - 21’den az
6
21 - 25’den az
4
25 - 29’dan az
2
Toplam
50
Tablo 2.3’ te yer alan gruplandırılmış frekans dağılımı oluşturulurken kayıt altına alınan en büyük
değer grup aralığı dışında kaldığında “açık grup” biçiminde düzenlenir. Örneğin en büyük kıdem yılı 29
yıl olarak belirlenseydi bu durumda 7.grup “25 yıl ve üzeri” biçiminde düzenlenecekti.
Tablo 2.3 kullanarak üçüncü grubu ilişkin sonuçları yorumlayalım. Üçüncü grup 9-13 yıl grubudur. 50
hastane çalışanından dokuzunun kıdem yılı 9-13 yıl arasındadır. Bu dokuz çalışanın kıdem yılı 9 yıla eşit
ve daha fazla ancak 13 yıldan daha azdır. Kıdem yılı 13 yıl olanlar dördüncü grup (13-17 yıl) içindedir.
Bu grubun alt sınırı 9 yıl, üst sınırı ise 13 yıl ve grup aralığı = grubun üst sınırı – grubun alt sınır = 4
yıldır. Her grubun orta noktasının o grubu en iyi şekilde temsil ettiği varsayılır. Üçüncü grubun orta
noktası  9  13 / 2  11 yıldır. Tabloda yer alan diğer gruplar içinde ayrı ayrı yorumlar yapılabilir.
Aşağıda yönetici hemşirelerin aylık ayakta geçirdikleri süre saat
olarak verilmiştir, frekans dağılımını oluşturarak elde ettiğiniz sonuçları tabloda
gösteriniz ve kısaca yorumlayınız.
Süre (saat)
60
61
62
62
62
62
63
63
64
64
64
64
65
65
65
65
66
66
66
66
66
66
66
66
67
67
67
67
67
67
67
67
68
68
68
69
69
69
69
70
70
70
71
71
71
72
72
73
73
73
Birikimli Frekans Dağılımları
Bir frekans dağılımında, her sınıfın frekansına bir önceki sınıfın frekansının birikimli olarak eklenmesiyle
oluşturulan dağılıma birikimli dağılımı, bu şekilde oluşturulan dağılımlara da birikimli frekans
dağılımları adı verilir. Birikimli frekanslar, küçükten büyüğe ya da büyükten küçüğe oluşturulabilir. Eğer
birikimli frekanslar küçükten büyüğe oluşturulmuşsa “-den az”, büyükten küçüğe oluşturulmuşsa “-den
çok” olarak isimlendirilir. Birikimli frekanslar, gözlem değerlerinin büyüklüklerine göre kaçıncı sırada
yer aldıklarının belirlenmesinde kullanılır.
25
Tablo 2.3’ te 50 çalışanın kıdem yıllarına ilişkin gruplandırılmış frekans dağılımını kullanarak “-den
az” ve “-den çok” birikimli frekansları oluşturarak, bu birikimli frekansları nasıl yorumlayacağını
görelim.
Tablo 2.4: Kıdem yıllarına ilişkin gruplandırılmış frekans dağılımı
Kıdem Yılı
Frekans
“-den az”
“-den çok”
1 - 5’den az
12
12
38 + 12= 50
5 - 9’dan az
9
9 + 12 = 21
29 + 9= 38
9 - 13’den az
9
9 + 21 = 30
20 + 9= 29
13 - 17’den az
8
8 + 30 = 38
12 + 8= 20
17 - 21’den az
6
6 + 38 = 44
6 + 6= 12
21 - 25’den az
4
4 + 44= 48
2+ 4= 6
25 - 29’dan az
2
2 + 48 = 50
2
Toplam
50
Tablo 2.4’ ün ikinci ve üçüncü sütunlarında birikimli frekanslara yer verilmiştir. “-den az” birikimli
frekanslar oluşturulurken ilk grubun frekansından başlanılır. İkinci grubun “-den az” birikimli frekansı ilk
grubun frekansı ile ikinci grubun frekansının toplanmasıyla elde edilir. Son gruba kadar frekanslar
toplanarak devam eder, son grubun “-den az” birikimli frekansı toplam frekansa eşit olmalıdır. “-den çok”
birikimli frekansta ise işlem “-den az” birikimli frekansların tam tersidir ve “-den çok” birikimli
frekanslarda birinci grubun birikimli frekansı toplam frekans sayısına eşit olmalıdır.
Tablo 2.4’ deki örnekte kıdem yılı grupları göz önüne alınırsa “-den az” birikimli frekanslar
yardımıyla 38 personelin kıdem yılının 17 yıldan daha az olduğu, “-den çok” birikimli frekanslar
yardımıyla 6 personelin kıdem yılının ise 21ve 21 yıldan daha fazla olduğu söylenir.
Örnek 2.2:
Aşağıda verilen gruplandırılmış frekans dağılımını kullanarak,
Kıdem Yılı
Frekans
0 - 10
7
10 - 20
12
20 - 30
16
30 - 40
24
40 - 50
32
50 - 60
28
60 - 70
21
a.
Frekans dağılımındaki toplam gözlem sayısını belirleyiniz.
b.
“-den az” ve “-den çok” birikimli frekansları oluşturunuz.
c.
Kıdem yılı 40’ tan küçük olan gözlem sayısını belirleyiniz.
d.
Kıdem yılı 60 ve daha büyük gözlem sayısını belirleyiniz.
26
Çözüm 2.2:
a.
Toplam gözlem sayısı frekanslar toplamına eşittir. Bu örnekte toplam gözlem sayısı 140’ tır.
k
n   ni  7  12  16  24  32  28  28  21  140
i 1
b.
“-den az” ve “-den çok” birikimli frekanslar:
Kıdem Yılı
Frekans
“-den az”
“-den çok”
0 - 10
7
7
140
10 - 20
12
19
133
20 - 30
16
35
121
30 - 40
24
59
105
40 - 50
32
91
81
50 - 60
28
119
49
60 - 70
21
140
21
Toplam
140
c.
Kıdem yılı 40’ tan küçük olan gözlem sayısı 59’ dur.
d.
Kıdem yılı 60 ve daha büyük gözlem sayısı 21’dir.
Nitel Verilerin Tablolaştırılması
Nicel bir değişkene ait verilerin tablolaştırılmasından sonra, şimdi nitel bir değişkenin nasıl
tablolaştıracağımızı ele alalım. Medeni durum, cinsiyet, öğrenim düzeyi, psikiyatrik tanı, hastaların
hastane tercih nedenleri gibi nitel değişkenlerin kullanıldığı durumlarda değişkenin sözel karşılıkları tablo
haline getirilir. Nitel değişkenlerin kullanıldığı durumlarda frekanslarla birlikte yüzdelik oranlara da yer
verilmesi önemlidir. Gerçek frekansların yanında verilen yüzdelikler oransal frekanslar olarak
tanımlanmaktadır. Oransal frekanslar nitel değişkenin düzeylerine katılma yüzdesini ya da tercih oranını
göstermektedir. Değişken düzeylerinin tekrarlanma sayısı (frekansı) sadece değişkenin o değerinin
gözlenme sayısını gösterir ve elde edilen diğer sonuçlardan bağımsızdır. Oransal frekans ise değişkenin
almış olduğu değerin toplam içindeki oranını gösterir ve bu tüm veri setiyle ilişkilendirilir.
Birim sayısı en az 50 ve daha fazla olan kütlenin oransal
frekanslarının hesaplanması ve yorumlanması anlamlıdır.
Zaman kavramı sağlık hizmetlerinin yönetimi alanında oldukça önemli bir konudur. Hastane
yöneticilerinin zaman yönetimine ilişkin tutumlarının belirlenmesi için bir çalışma yapıldığını varsayalım.
Bu çalışmada 250 hastane yöneticisinin “zaman planlaması yönetimi yapıyor musunuz?” ifadesine
verdiği yanıtlar özet olarak aşağıda verilmiştir. Bu yanıtları kullanarak ilgili tabloyu oluşturalım.
Yönetici
Cevap
Birinci Yönetici
Bazen
İkinci Yönetici
Her Zaman
Üçüncü Yönetici
Hiçbir Zaman
.
.
.
İki Yüz Ellinci Yönetici
.
.
.
Her Zaman
27
Elde edilen ham verileri yorumlamak oldukça zordur. Zaman Planlaması nitel değişkeninin 5 farklı
düzeyi; Hiçbir Zaman, Nadiren, Bazen, Genellikle, Her Zaman şeklindedir. Beş farklı sonucun tercih
sıklıkları belirlenerek tablonun ikinci sütununda yer alan frekans kısmına yazılır. Tablonun üçüncü
sütununda yer alan oransal frekanslar, değişkenin i. sıradaki almış değerin frekansı ni’ nin toplam
frekansına oranlanmasıyla hesaplanır, ni  ni . Örneğin, “Hiçbir Zaman” düzeyi için oransal frekans
30/250=0,12 dir.
Tablo 2.4: 250 Hastane yöneticisinin zaman planlamasına ilişkin tutumları
Tutum
Frekans
Oransal Frekans
Hiçbir Zaman
30
0,12
Nadiren
20
0,08
Bazen
50
0,20
Genellikle
80
0,32
Her Zaman
70
0,28
Toplam
250
1,00
Hastane yöneticilerinin % 32’ si zaman planlanmasını genellikle, % 28’ i ise her zaman yaptıklarını
bildirmiştir. Zaman planlamasına ilişkin “Hiçbir Zaman” yanıtı verenlerin oranı ise % 12 dir. Tablo 2.4’
te nitel değişken için oluşturulan tablonun matematiksel simgelerle ifadesi aşağıda verilmiştir.
Değişken
Frekans
Oransal Frekans
n
xi
ni
x1
n1
n1
x2
n2
n2
.
.
.
.
.
.
.
.
.
xk
nk
Toplam
n
ni
i
n
n
nk
i
i
n
i
1,00
Örnek 2.3:
Tablo 2.5’ te 262 hastanın A hastanesinde aradıkları birimleri bulma konusunda kullandıkları yönteme
ilişkin elde edilen veriler düzenlenmiş biçimde verilmiştir. Tablo 2.5’ i kullanarak elde edilen sonuçları
yorumlayınız. Hastaların aradıkları birimi bulma konusunda en sık kullandıkları yöntemin ne olduğunu
açıklayınız.
28
Tablo 2.5: Hastaların aradıkları birimleri bulma teknikleri
Teknik
Frekans
Oransal Frekans
Levhalar
84
0,32
Danışma Memuru
65
0,25
Herhangi Bir Hastane Personeli
90
0,34
Diğer
23
0,09
Toplam
262
1,00
Tablo 2.5. incelendiğinde hastaların A hastanesinde ilgili birimi bulmak için 4 farklı teknik kullandığı
görülmektedir: levhalar, danışma memuru, herhangi bir hastane personeli ve diğer. Hastalar aradıkları
birimi bulmak için en sık olarak herhangi bir hastane personeline danışmaktadırlar, 262 hastanın % 34’ u
bu yöntemi tercih etmiştir. Danışma memuruna sorarak aradıkları birimi bulan hastaların oranı ise % 25’
dir. Levhaları takip ederek ilgili birimi bulanların oranı % 32 iken diğer herhangi bir yöntemi
kullananların oranı ise % 9’ dur.
Hastaların poliklinik hizmeti aldıkları hastaneleri genel olarak
değerlendirme sonuçları hastane yöneticileri açısından oldukça önemlidir. Hastanelerin
hastalarda bıraktığı genel imajının belirlenmesine yönelik sonuçlar Tablo 2.6’ da
verilmiştir. Tabloda yer alan sonuçlardan hareketle oransal frekansları hesaplayarak elde
edilen sonuçları yorumlayınız.
Tablo 2.6: Hastaların hastanenin genel imaj değerlendirmeleri
İmaj
Frekans
Çok İyi
25
İyi
80
Orta
64
Zayıf
19
Çok Zayıf
12
Toplam
200
Oransal Frekans
Çapraz Tablo
Derlenen veriler aynı anda iki veya daha fazla değişken göz önünde bulundurularak tablolaştırıldığında
çapraz tablo elde edilir. Bir gözlem kümesi iki değişkene göre tablolaştırıldığında 2×2 veya genelde R×C
tabloları ortaya çıkar. Bu tablolar R kadar sıra ve C kadar sütundan oluşur. Söz konusu tabloların
gözelerinde (hücre) frekanslar yer alır. Y hastanesinde yatarak tedavi görüp taburcu olan 500 hastaya,
hastanede kalış süreleri ve bu hastaneden tekrar hizmet alıp almayacakları sorulmuş olsun. Veriler
aşağıdaki 2×2 çapraz tabloda verilmiştir.
Hastanede yatma
süresi
Hastaneden tekrar hizmet alma
Tekrar Hizmet
Tekrar Hizmet
Alacağım
Almayacağım
Toplam
En fazla Bir hafta
260
20
280
Bir haftadan fazla
80
140
220
29
Bu tablodan şu yorumlar çıkarılabilir;

Hastanede en fazla bir hafta yatan 280 hastanın %93’ü (260/280) tekrar bu hastaneden hizmet
almaya devam edeceğini,

Hastanede bir haftadan daha fazla yatan 220 hastanın %36’ı (80/220) tekrar bu hastaneden
hizmet almaya devam edeceğini, %64’ü (140/220) ise bu hastaneden tekrar hizmet almayacağını
belirtmiştir.
Hastane yöneticisi, bu sonuçlardan hastanede kalış süresi arttıkça hastaların Y hastanesinden tekrar
hizmet alma eğiliminde bir azalma olduğu bulgusuna ulaşabilir. Ancak, bu bulgunun idari karara
dönüşebilmesi için kitabın ilerleyen ünitelerinde yer alan hipotez testlerinin uygulanmasına gerek vardır.
Grafikler
Verileri kolay anlaşılabilir hale getirerek sunmanın en iyi yollarından biri de grafiklerdir. Grafikler
verilerin geometrik şekilleridir. Grafik çizimi belli kurallar çerçevesinde yapılır. Tablolarda olduğu gibi
grafiklerin de konusunu gösteren bir başlığı olmalıdır. Bir grafikte yer alan şekil ve çizgilerin anlamları
grafik üzerinde belirtilmelidir. Grafiğin apsis (yatay eksen –x) ve ordinat (düşey eksen –y) eksenlerinin
ölçeklendirilmesi ve bu eksenlerin tanımları grafik üzerinde gösterilmelidir. Grafikte anlaşılması ve
yorumlanması zor olan işaretlemelere ve şekillere yer verilmemelidir. Ayrıca çizilen grafiğin kaynağının
da belirtilmesi gerekir. Veri türlerinin yanında grafikler oluşturulma amaçları, kullanış biçimleri ve
şekilleri itibariyle de farklı başlıklar altında ele alınmaktadır. Verilerin görsel bir biçimde sunumunda
sıklıkla kullanılan grafikler: çubuk grafiği, histogram, serpilme diyagramları, alan grafikleri, çizgi grafiği,
kare ve daire grafikleridir.
Histogram
Birbirine bitişik dikdörtgenlerden oluşan grafiğe histogram adı verilir. Histogram sürekli nicel veriler
için uygun bir gösterim biçimidir. Histogram çizilirken apsis ekseninde değişkenin almış olduğu farklı
değerler, ordinat ekseninde ise frekanslar yer alır. Apsis ekseninde grup sınırları işaretlenerek; tabanı grup
aralığına, alanı ise grup frekansına karşılık gelen bir birine bitişik dikdörtgenler çizilerek histogram
oluşturulur. Çizilen dikdörtgenlerin orta noktalarının birleştirilmesi ile frekans poligonu elde edilir.
Histogram çiziminde diğer önemli konulardan biri grupların bölüm aralıklarının eşit olmasıdır. Grup
aralıkları eşit olmadığında frekansların ayarlanması gerekmektedir. Histogramda grup aralıkları eşit
olduğunda dikdörtgenlerin tabanlarının bir birim olduğu kabul edilmektedir. Grup aralıkları eşit
olmadığında dikdörtgen tabanlarının bir birim olacak şekilde düzenlenmesi için frekansların basit
matematiksel işlemler ile ayarlanır. Bunun için frekanslar grup aralığına bölünerek dikdörtgenlerin
alanları ile grupların frekansları eşit hale getirilir. Frekanslar ayarlanırken en fazla görülen grup aralığı
standart birim olarak tanımlanır. Aralığı bir standart birim olan grupların frekansları değerlerini korurken,
grup aralığı standart birimden farklı olan grupların frekansları grupların standart birim cinsinden aralık
değerlerine oranlanarak frekanslar ayarlanır (Bakınız: örnek 2.4). Dikdörtgenlerin alanlar toplamı her
zaman toplam frekansa eşit olmalıdır.
Hastanede çalışan hekim ve hemşireleri geçirdikleri iş kazaları ve meslek hastalıkları yönünden
değerlendirmek amacıyla yapılan bir çalışmada A hastanesinin çalışanlarının haftalık çalışma sürelerine
ait veriler toplanmış ve Tablo 2.7 de sunulmuştur. Bu frekans dağılımı için histogramı çizelim.
Tablo 2.7: Haftalık çalışma sürelerine ilişkin gruplandırılmış frekans dağılımı
Çalışma Süresi
(saat)
30 - 40
40 - 50
50 - 60
60 - 70
Toplam
30
Frekans
4
29
23
40
96
Tablo 2.7’ deki çalışma sürelerinin grup aralıkları incelendiğinde, 4 grupta da grup aralıklarının 10
saat olduğu görülmektedir. Frekanslara ilişkin her hangi bir matematiksel işlem yapmadan histogram
çizilebilir.
Şekil 2.4: Tablo 2.7’deki veriler için histogram
Şekil 2.4’ te yer alan histogramda her bir dikdörtgenin alanı o grubun frekansına eşittir.
Dikdörtgenlerin alanları toplamı ise toplam frekansı vermektedir. Dikdörtgenlerin orta noktalarını
birleştirerek çizdiğimiz doğru ise frekans poligonunu göstermektedir. Grup aralıkları bu histogramda (10)
birbirine eşit olduğundan her bir dikdörtgenin tabanı 1 birim olarak kabul edilir. O halde 30-40 grubunu
temsil eden dikdörtgenin yüksekliği h = 4, tabanı 1 birimdir ve dikdörtgenin alanı 4 birimdir (4×1=4).
Dikdörtgenlerin alanları sırasıyla; 4, 29, 23 ve 40’ tır, alanlar toplamı ise 96’ dır.
Örnek 2.4:
Aşağıda verilen gruplandırılmış frekans dağılımının histogramını çiziniz.
Gruplar
15 - 30
30 - 40
40 - 50
50 - 60
60 - 75
75 - 80
Toplam
Frekans
15
25
60
44
30
16
190
Çözüm 2.4:
Bu örnekte grup aralıklarının eşit olmadığı görülmektedir. En sık görülen grup aralığı 10’dur ve 10 bir
standart birim olarak kabul edilir. Bölüm aralığı 10’ dan farklı olan; birinci, beşinci ve altıncı grupların
frekansları ayarlanmalıdır. Bu grupların aralıkları 10’ a bölünerek standartlaştırıldıktan sonra bu grupların
gerçek frekansları standart değerlere bölünerek ayarlamış frekanslar elde edilir. Örneğin birinci grubun
“15-30” grup aralığı 15, bir standart birim olarak belirlediğimiz grup aralığı 10 için 1,5 birimdir. O zaman
birinci grubun ayarlanmış frekansı 15 /1,5  10 olarak hesaplanır. Ayarlanmısş frekans hesabı tablo
üzerinde gösterilmiştir. O halde ayarlanmış frekanslar kullanılarak histogram çizimi yapılabilir
31
Gruplar
Frekans
Grup Aralığı
Standart Birim
Ayarlanmış
Frekans
15 - 30
15
15
15 /10  1,5
15 /1,5  10
30 - 40
40 - 50
50 - 60
60 - 75
25
60
44
30
10
10
10
15
10/10=1
10/10=1
10/10=1
25
60
44
15 /10  1,5
30 /1,5  20
75 - 80
16
5
5 /10  0,5
16 / 0,5  32
Toplam
190
Şekil 2.5: Ayarlanmış frekanslara göre histogram
Tablo 2.8’de verilen gruplandırılmış frekans dağılımı için histogramı
çiziniz.
Tablo 2.8: Gruplandırılmış frekans dağılımı
Gruplar
0 - 15
15 - 30
30 - 45
45 - 60
60 - 75
75 - 90
Frekans
10
15
20
30
15
5
Çubuk Grafiği
Nitel verilerin gösteriminde sıklıkla çubuk grafikleri kullanılmaktadır. Bu grafikte, sıralayıcı veya
sınıflayıcı ölçekle ölçülmüş değişkenlere ait verilerin sayılarını veya oranlarını gösterilmektedir. Çubuk
grafiklerinde gruplar tabanları eşit ve birbirine bitişik olmayan dikdörtgenler ile çizilir. Dikdörtgenler bir
birini izleyen bir seriyi temsil eder. Çubuk grafiği dikey ya da yatay olabilir. Eksenlerden birinde
değişkenin düzeyleri, diğerinde ise frekans veya yüzdelere yer verilir.
32
Örnek 2.5:
2010 yılı Sağlık İstatistikleri Yıllığına göre tüm sektörler itibariyle sağlık personeli sayıları Tablo 2.9’ da
verilmiştir. Bu verileri kullanarak çubuk grafiğini çiziniz.
Tablo 2.9: 2010 Yılı Sağlık Personeli Sayıları
Sağlık Personeli
Personel
Sayısı
Uzman Hekim
63563
Pratisyen Hekim
38818
Asistan Hekim
21066
Diş Hekimi
21432
Eczacı
26506
Sağlık Memuru
94443
Hemşire
114772
Ebe
50343
Kaynak: Sağlık İstatistikleri Yıllığı 2010
120000
100000
80000
60000
40000
20000
0
Uzman
Hekim
Pratisyen
Hekim
Asistan Diş Hekimi Eczacı
Hekim
Sağlık Hemşire
Memuru
Şekil 2.6: Tablo 2.9’daki veriler için çubuk grafiği
33
Ebe
Örnek 2.6:
Yıllara ve sektörlere göre hastane sayılarını gösteren çubuk grafiği Şekil 2.7’ de verilmiştir.
1000
Hastane Sayıları
900
800
700
600
Sağlık bakanlığı
500
Özel
400
300
Üniversite
200
Diğer
100
0
2006
2007
2008
2009
2010
Yıllar
Şekil 2.7: Yıllara ve Sektörlere Göre Hastane Sayısı, Türkiye
Kaynak: Sağlık İstatistikleri Yıllığı 2010
Çubuk grafiğinde 4 sektöre göre hastaneler farklı renklerde gösterilmiştir. Çubukların üzerinde
sektörler itibariyle hastane sayıları görülmektedir.
Örnek 2.7: Bir hastane hastalarına sunmuş oldukları hizmetlerin hastalar tarafından değerlendirilmesi
amacıyla bir değerlendirme formu hazırlayarak 300 hastanın görüşlerini almıştır. Elde edilen görüşlerin
oransal dağılımları Tablo 2.10 da verilmiştir. Tablo 2.10 kullanılarak birikimli grafiğin çizimi şekil 2.8 de
verilmiştir. Elde edilen sonuçları yorumlayınız.
Tablo 2.10: Hastane hizmetlerinin değerlendirilmesinde verilen yanıtların oransal dağılımı (%)
Mükemmel
İyi
Orta
Yetersiz
Çok
Yetersiz
Toplam
Randevu Alma
% 35
% 30
% 15
% 10
% 10
100
Kayıt Yaptırma
% 25
% 30
% 25
% 10
% 10
100
Acil Servis Hizmet
% 30
% 35
% 10
% 10
% 15
100
Laboratuvar
% 30
% 20
% 10
% 15
% 25
100
Doktorlar
% 35
% 25
% 10
% 20
% 10
100
Hemşireler
% 20
% 20
% 30
% 10
% 20
100
Güvenlik
% 15
% 15
% 20
% 20
% 30
100
Temizlik
% 25
% 15
% 20
% 15
% 25
100
Hizmetler
34
Şekil 2.8: Hastane hizmetlerinin değerlendirilmesinde verilen yanıtların oransal dağılımı (%)
Bir ildeki Devlet, Özel ve Fakülte hastanelerinin acil servislerine hafta
sonu (Cumartesi – Pazar) başvuran hasta sayıları Tablo 2.11 de verilmiştir. Tablo 2.11’e
göre çubuk grafiğini çiziniz.
Tablo 2.11: Hastanelere göre hafta sonu Acil servise gelen hasta sayıları
Hasta Başvuru Sayısı (Kişi)
Cumartesi
Pazar
Devlet Hastaneleri Acil Servisleri
Hastaneler
52
68
Özel Hastaneler Acil Servisleri
54
46
Fakülte Hastanesi Acil Servisi
64
55
Daire Grafiği
Daire grafikleri tek bir değişken dikkate alınarak çizilen grafiklerdir. Nitel verilerin grafik gösteriminde
kullanılmaktadır. Bir nitel değişkenin düzeyleri az olduğunda çoğunlukla daire grafikleri tercih
edilmektedir. Dairenin alanı değişkenin düzeylerinin 360 lik daire içindeki paylarına göre parçalara
ayrılır. Her bir düzeyin daire içindeki payını bulmak için; önce her bir düzeye ait frekans toplam frekans
sayısına oranlanır, sonra bunların derece cinsine dönüştürülmesi için bu oranlar 360’ la çarpılır. Böylece
her grubun daire içinde kaç derecelik bir merkez açıyla yer aldığı belirlenmiş olur.
35
Örnek 2.8:
Sektörlere göre 2010 yılı için erişkin yoğun bakım yatağı sayıları aşağıda verilmiştir. Bu verileri
kullanarak daire grafiğini çizelim.
Tablo 2.12: Sektörlere göre 2010 yılı için erişkin yoğun bakım yatağı sayısı
Sektör
Yatak Sayısı
Sağlık Bakanlığı
6130
Üniversite
2900
Özel
4142
Kaynak: Sağlık İstatistikleri Yıllığı 2010
Çözüm 2.8:
Tablo 2.12’de Sağlık Bakanlığı’na ait erişkin yoğun bakım yatağı sayısı 6130 ve toplam yatak sayısı
13172’dir. Sağlık Bakanlığına ait erişkin yoğun bakım yatağı sayısının daire içindeki payı
6120 /13172  0.47 dir. Diğer düzeyler içinde aynı işlem sırasıyla tekrarlanarak tüm düzeylerin daire
içindeki payları elde edilir.
Tablo 2.13: Sektörlere göre 2010 yılı için erişkin yoğun bakım yatağı sayısı ve oranları
Sektör
Yatak Sayısı
Yüzde
Daire Üzerindeki Açı
Sağlık Bakanlığı
6130
0,47
0, 47  360 
167,5
Üniversite
2900
0,22
0, 22  360 
79,3
Özel
4142
0,31
0,31 360 
113, 2
Şekil 2.9: 2010 Yılı sektörlere göre yoğun bakım yatağı sayısı, Türkiye
36
Örnek 2.9:
Bir hastanenin hasta hakları birimi hastanelerine gelen hastalardan tesadüfi olarak gelen 250 hastaya
sunulan hizmetlerden memnuniyetlerini sormuş ve Tablo 2.14’deki sonuçları elde etmiştir. Hasta
memnuniyeti için daire grafiğini çiziniz ve kısaca sonuçları yorumlayınız.
Tablo 2.14: 250 Hastanın Memnuniyet Düzeyi
Memnuniyet Düzeyi
Yatak Sayısı
Yüzde
Daire Üzerindeki Açı
Memnun
187
0,75
0,75  360 
269,3
Orta
33
0,13
0,13  360 
47,5
Memnun Değil
30
0,12
0,12  360 
43, 2
Şekil 2.10: 250 Hastanın Memnuniyet Düzeyi
250 hastanın % 75’ i hastanenin hizmetlerinden memnun, % 13’ u orta derece memnun ve % 12’ si
memnun olmadığını bildirmiştir. Söz konusu hastanenin hizmet sunumu hasta memnuniyeti
sağlamaktadır.
2000 yılı Sağlık Bakanlığı istatistiklerine göre ölüm sayılarının
hastalık nedenlerine göre dağılımı Tablo 2.15’ te yer almaktadır. Verilere ilişkin daire
grafiğini çiziniz, hastalık nedenlerinin oranlarını hesaplayarak kısaca açıklayınız.
Tablo 2.15: 2000 yılı ölüm sayılarının hastalık nedenlerine göre dağılımı
Hastalık Nedeni
Ölüm Sayısı
Enfeksiyon Hastalıkları
38071
Yaralanmalar
25025
Kardiyovasküler Hastalıklar
205457
Kanserden Ölüm
56250
Solunum Sistemi Hastalıkları
34211
Diabet
9549
Kaynak: Sağlık İstatistikleri Yıllığı, 2000
37
Çizgi Grafiği
Çizgi grafikleri nicel bir değişkenin almış olduğu değerlerin frekanslarının dağılımını göstermek için
kullanılmaktadır. Çizgi grafikleri, basit ve çoklu çizgi grafikleri olmak üzere ikiye ayrılmaktadır. Çizgi
grafikleri belli bir aralıkta grafik üzerinde işaretlenen noktaların bir çizgi ile birleştirilmesi ile oluşturulur.
Zaman serisi grafiği olarak ta adlandırılan çizgi grafikleri değişkenin zaman içindeki değişimini görsel
olarak gösterir. Diğer grafiklere göre zamana bağlı değişimleri daha iyi bir şekilde açıklamaktadır.
Çubuk ve histograma göre çizimi daha kolay olmakla birlikte büyük veri setlerinin özet bir biçimde
gösterimini de sağlamaktadır. Ancak verilerin doğruluğu ve kaynağına ilişkin kesin kanıtlar sunmada
yetersiz kalmaktadır. Yıllara göre ölüm hızı, yıllara göre birinci basamak sağlık kuruluşlarına müracaat
sayısı, kişi başına düşen ilaç harcamaları gibi değişkenlerin çiziminde basit çizgi grafiği kullanılır. Yıllara
göre faiz dışı harcamalar ve kamu sağlık harcamaları aynı grafik üzerinde gösterilecekse bu durumda
çoklu çizgi grafiği kullanılır. Çizgi grafiklerinde bir değişkenin almış olduğu değerler ve bunların
frekansları varsa; apsis ekseninde değişkenin almış olduğu değerler ordinat ekseninde ise frekanslar yer
alır. Ancak iki değişkenin olduğu durumlarda ise apsis ve ordinat eksenleri birer değişkeni temsil eder.
Şimdi farklı örnekler üzerinde basit ve çoklu çizgi grafiklerini ele alalım. Örneğin; yıllara göre Sağlık
Bakanlığı birinci basamak kuruluşları sevk oranlarına ilişkin bir grafik çizmeye karar verelim. Tablo
2.16’ da yıllara göre Sağlık Bakanlığı birinci basamak kuruluşları sevk oranları verilmiştir.
Tablo 2.16: Yıllara Göre Sağlık Bakanlığı Birinci Basamak Kuruluşları Sevk Oranı
Yıllar
2002
2006
2007
2008
2009
2010
Oran
16,7
6,4
2,4
1,3
1,0
0,4
Kaynak: Sağlık İstatistikleri Yıllığı 2010
Bu durumda farklı grafikler çizilebilir. Ancak yıllar itibariyle birinci basamak sağlık kuruluşlarına
sevk oranlarındaki değişimi veya farklılaşmayı gösterecek en iyi grafik çizgi grafiktir. Verileri önce
çubuk grafiği ile gösterelim.
Oran(%)
18
16
14
12
10
8
6
4
2
0
2002
2006
2007
2008
2009
2010
Yıllar
Şekil 2.11: Yıllara Göre Sağlık Bakanlığı Birinci Basamak Kuruluşları Sevk Oranı
38
Çubuk grafiği (Şekil 2.11) incelendiğinde yıllar itibariyle sevk oranının azaldığı görülmektedir. Ancak
bu grafik azalım eğilimini iyi bir şekilde temsil etmemektedir. Çubuk grafiği yerine çizgi grafiği verilerin
daha kolay anlaşılmasını sağlayacaktır. Grafik çizilirken apsiste oranlar ordinat ekseninde ise yıllar yer
alacaktır. Her bir yıla karşılık gelen sevk oranı analitik düzlemde birer nokta olarak işaretlenecek ve daha
sonra bu noktalar birleştirilerek çizgi grafiği elde edilecektir.
18
16
16,7
14
12
10
8
Oran(%)
6,4
6
4
2,4
2
1,3
1
0
2002
2006
2007
2008
0,4
2009
2010
Yıllar
Şekil 2.12: Yıllara göre sağlık bakanlığı birinci basamak kuruluşları sevk oranı
Şekil 2.12’ de verilen çizgi grafik ile Tablo 2.16’daki veriler daha kolay anlaşılabilir duruma
getirilmiştir. 2002 yılında birinci basamak sağlık kuruluşlarında sevk oranı 16,7 iken bu oran 2010 yılında
0,4’ e kadar düşmüştür.
Örnek 2.10:
Yıllara göre kemik iliği nakli merkezlerindeki değişime ilişkin veriler Tablo 2.17’de verilmiştir. Uygun
grafiğin hangisi olduğunu belirterek, çiziniz ve grafiği kısaca yorumlayınız.
Tablo 2.17: Yıllara göre kemik iliği nakli merkezleri
Yıllar
Pediatrik
Erişkin
Toplam
2004
7
12
19
2005
7
13
20
2006
7
14
21
2007
8
18
26
2008
9
21
30
2009
9
25
34
2010
10
28
38
Kaynak: Sağlık İstatistikleri Yıllığı, 2010
Verileri özetlemek için farklı grafikler kullanabilir. Ancak kemik iliği nakli merkezi sayılarını yıllar
itibariyle, pediatri, erişkin ve toplam açısından göstermek için kullanılacak en iyi grafik çoklu çizgi
grafiğidir. Çoklu çizgi grafiği, sonuçların bütünsel bir çerçevede değerlendirmesini sağlamaktadır
Grafiğin apsis ekseninde yıllar ordinat ekseninde ise sayılar yer alır. Analitik düzlemde sırasıyla pediatri,
yetişkin ve toplam için yıllara karşılık gelen nakil merkezleri sayıları işaretlenir. Bu işaretlenen noktaların
birleştirilmesi ile çoklu çizgi grafiği çizilir. Çoklu çizgi grafikleri çiziminde her bir değişken için çizilen
değişkenin diğer değişken veya değişkenlerden ayrımının yapılması çok önemlidir. Şekil 2.13’ teki çoklu
39
çizgi grafiği incelendiğinde pediatri, erişkin ve toplam için farklı desenlerin kullanıldığı görülmektedir.
Çizgiler üzerinde yıllar için alınan değerleri göstermek için kullanılan işaretçiler görülmektedir. Örneğin
pediatrik için kullanılan işaretçi karelerdir. İstendiğinde işaretçiler etiketlenerek ilgili sayılar da
gösterilebilir.
Şekil 2.13: Yıllara Göre Kemik İliği Nakil Merkezleri 2004-2010
Şekil 2.13’ teki çoklu çizgi grafiği incelendiğinde 2006 yılı itibariyle kemik iliği nakil merkezleri
sayısında bir artış olduğu görülmektedir. Yeni açılan kemik iliği nakil merkezleri büyük oranda erişkinler
için olduğu görülmektedir.
Yıllara göre Sağlık Bakanlığı bütçesinin GSYİH (Gayri Safi Yurtiçi
Hasıla) içindeki oranına ilişkin veriler aşağıdaki Tablo 2.18’ de gösterilmiştir. Çizgi
grafiğini çiziniz.
40
Tablo 2.18: Yıllara göre sağlık bakanlığı bütçesinin GSYİH içindeki oranı
Yıllar
Oran
1999
0,77
2000
0,68
2001
0,76
2002
0,87
2003
0,81
2004
0,80
2005
1,04
2006
1,13
2007
1,23
2008
1,26
2009
1,53
Kaynak: Sağlık İstatistikleri Yıllığı 2010
Birikimli Frekansların Grafikle Gösterilmesi
Birikimli dağılımların grafikleri çizilirken gruplar apsiste, birikimli frekanslarda ordinat ekseninde yer
alır. Terim sayısı çok olduğu ya da özellikle birkaç dağılımın aynı grafik üzerinde gösterilmesi ve
karşılaştırılması söz konusu olduğunda histogram yerine birikimli frekans grafikleri tercih edilmektedir.
“-den az” birikimli frekanslar için grafik çizilirken, koordinat sisteminde grup üst sınıflarıyla ilgili gruba
karşılık gelen birikimli frekansların belirledikleri noktalar birleştirilerek grafik oluşturulur. “-den çok”
grafikleri oluşturulurken ise, grup alt sınırlarıyla ilgili gruba karşılık gelen birikimli frekansların
belirledikleri noktalar birleştirilerek grafik çizimi yapılır. “-den az” birikimli frekanslara ait eğri ilk
grubun frekansından başlayarak sürekli artan, “-den çok” birikimli frekanslar ise son grubun frekansına
kadar sürekli azalan bir eğridir.
Örnek 2.11:
Aşağıda verilen gruplandırılmış frekans dağılımı için birikimli frekansları oluşturarak grafiğini çizelim.
Gruplar
Frekans
25 - 30
15
30 - 35
25
35 - 40
68
40 - 45
54
45 - 50
20
50 - 55
18
Toplam
200
41
Çözüm 2.11:
Gruplar
Frekans
“-den az”
“-den çok”
20-30
15
15
200
30-40
25
40
185
40-50
68
108
160
50-60
54
162
92
60-70
20
182
38
70-80
18
200
18
Toplam
200
250
Frekans
200
150
den az
100
den çok
50
0
25
35
45
55
65
75
Gruplar
Şekil 2.14: Birikimli frekans eğrileri
MICROSOFT OFFICE EXCEL UYGULAMASI
Microsoft Office Excel ortamında kolayca grafikler oluşturulabilir. Oluşturduğunuz bu grafikler, anlamlı
olacak şekilde verileri görüntülemenize ve daha kolay yorumlanmasına yardımcı olur. Excel, sayısız
grafik türünü destekler. Excel'de yeni bir grafik oluşturmak için öncelikle sayısal girdilerden oluşan bir
veri aralığına sahip olmanız gerekir.
Aşağıdaki resimde gösterilen çalışma sayfası verilerinin grafiklerinin çizilmesi için gerekli adımları
gösterelim.
42
1. Adım: Grafiği çizilecek veri aralığı içinden bir hücre seçerek Ekle sekmesine tıklayarak, Grafikler
grubunu görüntüleyiniz.
2. Adım: Grafikler grubunda bulunan Sütun düğmesine daha sonra açılan menüden 2-b Sütun grubunda
bulunan ve seçtiğiniz grafik türünün alt türü olan Kümelenmiş Sütun tıklayınız. Elde ettiğiniz grafik
üzerinde fare sağ tuşa basarak veri seç ve buradan da satır/sütün değiştir öğesini tıklayınız. Böylece
aşağıdaki grafiği elde edeceksiniz.
43
3.
Adım: Başlık eklemek istediğiniz grafiği fare ile tıklayınız. Tasarım, Düzen ve Biçim sekmeleri
eklenerek Grafik Araçları görüntülenir.
44
Buradan Düzen sekmesinde, Etiketler grubundaki Grafik Başlığını fare ile tıklayınız. Grafik Başlığı
metin kutusuna grafik başlığı olmasını istediğiniz metni yazınız.
Şimdi aynı veriler için çizgi grafik çizelim. Bunun için yukarıdaki adımlar da ekle sekmesinden grafik
grubundan ise çizgi seçilerek çizgi grafik elde edilir. Elde ettiğiniz grafik üzerinde fare sağ tuşa üzerinde
istediğiniz değişiklikleri yapabilirsiniz. Böylece aşağıdaki grafiği elde edeceksiniz.
45
Özet
grafik konusunu açıklayan bir başlığa sahip
olmalıdır. Grafik çiziminde; histogram, çizgi
grafiği, çubuk grafiği ve daire grafik gibi grafik
türleri kullanılabilir.
Sağlık kurumu yöneticileri işletmenin geçmiş ve
bugünkü durumunu betimleyerek, geleceğe
yönelik planlamalar yapabilmesi ancak amaca
yönelik verileri derleyip bu verileri analiz etmesi
ile mümkün olabilir.
Verilerin gruplandırılmasında en önemli konular;
ilgilenilen değişkenin kesikli ya da sürekli
olması, grup sayısı ve grup aralığıdır. Öncelikle
elde edilen ham verilerin dizi biçiminde
düzenlenmesi gereklidir. Küçükten büyüğe
sıralanmış olarak düzenlenen verilerin kaç grupta
sınıflandırılacağının belirlenmesi için genellikle
Sturges Kuralı kullanılır. Sturges kuralı uygun
grup sayısının ve grup aralığının hesaplanmasını
sağlamaktadır.
Veri derlemek, gözlemi yapılacak birimleri
ölçmek veya saymak, sonara da bunları göz
önünde buldurulan değişken ya da değişkenlerin
hangi
konumlarına
karşılık
geldiklerini
belirlemek ve kaydetmektir.
Sağlık yöneticileri için veri kaynakları ölümler,
doğumlar, hastalıklar ve sağlık hizmetleri
konusunda sürekli olarak tutulan kayıtlar veya
deneylerle saptanan veriler olabilir. İstatistikte
toplanan ilk verilere ham veri olarak tanımlanır.
Ham veri herhangi bir düzenleme ve işleme tabii
tutulmamış veridir.
Sturges kuralı yardımıyla grup sayısını
hesaplamak için aşağıdaki matematiksel eşitlik
kullanılır:
k
1  (3,3  log n)
Derlemenin yapılabilmesi için derlemeye ilişkin
konu ve gözlenecek birimlerin açık bir biçimde
tanımlanarak zaman – mekan dikkate alınarak
sınırlandırılması gerekir.
k, grup sayısını n ise toplam gözlem sayısını
göstermektedir. Grup sayısı belirlendikten sonra
grup aralıklarını hesaplamak için veri setindeki
gözlenen en küçük ve en büyük değer yardımıyla
aşağıdaki eşitlik kullanılır;
Derleme verilerin elde ediliş biçimine göre,
doğrudan veya dolaylı; hakkında bilgi edinilmek
istenin
kütlenin
tamamının
incelenip
incelenmemesine göre genel ve kısmi; birimlerin
belirli bir anda ve yerde mi yoksa belirli bir
zaman
aralığı
boyunca
sürekli
olarak
kaydedilmesine göre ani veya devamlı derleme
olarak sınıflandırılır.
c
xenb  xenk
k
Bir frekans dağılımında, her sınıfın frekansına bir
önceki sınıfın frekansı eklenerek oluşturulan
dağılıma birikimli dağılım, bu tür oluşturulan
frekanslara da birikimli frekans dağılımları adı
verilir. Birikimli frekanslar, küçükten büyüğe ya
da büyükten küçüğe oluşturulabilir. Eğer
birikimli
frekanslar
küçükten
büyüğe
oluşturulmuşsa “-den az”, büyükten küçüğe
oluşturulmuşsa “-den çok” olarak isimlendirilir.
Birikimli frekanslar, gözlem değerlerinin
büyüklüklerine göre kaçıncı sırada yer
aldıklarının belirlenmesinde kullanılır.
Derlenen veriler doğru, güvenilir, güncel ve en az
maliyetle elde edilmiş olmalıdır.
Veri toplama teknikleri sistematik veri toplama
teknikleri ve özel veri toplama teknikleri olmak
üzere ikiye ayrılmaktadır. Sistematik veri
kaynakları, kayıtlar, sayımlar ve özel bildirimler,
özel veri toplama teknikleri ise; gözlem,
görüşme, anket, taramalar ve muayenelerdir.
Tablo, elde edilen sayısal veya sözel verilerin
satır ve sütünler halinde düzenlenmiş halidir.
Tablolar verilerin daha kolay anlaşılmasını
sağlar. İstatistiksel verilerin sunulduğu tabloların
üç temel özelliği: tablonun hangi bilgiyi
içerdiğini gösterir bir başlığının, satır ve
sütunlarının olmasıdır.
Verileri kolay anlaşılabilir hale getirerek
sunmanın bir yolu da grafiklerdir. Grafikler
verilerin geometrik şekilleridir. Grafik çizimi
belli
kurallar
çerçevesinde
yapılmalıdır.
Tablolarda olduğu gibi grafiklerin de konusunu
gösteren bir başlığı olmalıdır. Bir grafikte yer
alan şekil ve çizgilerin anlamları grafik üzerinde
belirtilmelidir. Grafiğin apsis ve ordinat
eksenlerinin ölçeklendirilmesi ve bu eksenlerin
tanımları grafik üzerinde gösterilmelidir. Grafikte
anlaşılması ve yorumlanması zor olan
Verilerin daha anlaşılır bir şekilde sunumunu
sağlayan diğer bir gösterim grafiklerdir. Bir
grafiğin kolayca anlaşılabilir ve çiziminin
objektif olması oldukça önemlidir. Aynı zamanda
46
Daire grafikleri tek bir değişkene göre çizilen
grafiklerdir. Nitel verilerin grafiksel gösteriminde
kullanılmaktadır. Bir nitel değişkenin düzeyleri
az olduğunda çoğunlukla daire grafikleri tercih
edilmektedir.
Dairenin
alanı
değişkenin
düzeylerinin 360 lik daire içindeki paylarına
göre parçalara ayrılır.
işaretlemeler ve şekillere yer verilmemelidir.
Tüm bunlara ek olarak çizilen grafiğin
kaynağının da belirtilmesi oldukça önemlidir.
Birbirine bitişik dikdörtgenlerden oluşan grafiğe
histogram adı verilir. Histogram sürekli nicel
veriler için uygun bir gösterim biçimidir.
Özellikle aralıklı ölçekle ölçülmüş ve
gruplandırılmış
verilerin
gösteriminde
kullanılmaktadır. Histogram çiziminde diğer
önemli konulardan biri grupların bölüm
aralıklarının eşit olmasıdır. Grup aralıkları eşit
olmadığında
frekansların
ayarlanması
gerekmektedir. Histogramda grup aralıkları eşit
olduğunda dikdörtgenlerin tabanlarının bir birim
olduğu kabul edilmektedir. Grup aralıkları eşit
olmadığında dikdörtgen tabanlarının bir birim
olacak şekilde düzenlenmesi için frekansların
basit matematiksel işlemler ile ayarlanır. Bunun
için frekanslar grup aralığına bölünerek
dikdörtgenlerin alanları ile grupların frekansları
eşit hale getirilir.
Çizgi grafikleri nicel bir değişkenin almış olduğu
değerlerin frekanslarının dağılımını göstermek
için kullanılmaktadır. Çizgi grafikleri, basit ve
çoklu çizgi grafikleri olmak üzere ikiye
ayrılmaktadır. Çizgi grafikleri belli bir aralıkta
grafik üzerinde işaretlenen noktaların bir çizgi ile
birleştirilmesi ile oluşturulur.
Birikimli dağılımların grafikleri çizilirken gruplar
apsiste, birikimli frekanslarda ordinat ekseninde
yer alır. Terim sayısı çok olduğu ya da özellikle
birkaç
dağılımın
aynı
grafik
üzerinde
gösterilmesi ve karşılaştırılması söz konusu
olduğunda histogram yerine birikimli frekans
grafikleri tercih edilmektedir.
Nitel verilerin gösteriminde sıklıkla çubuk
grafikleri kullanılmaktadır. Bu grafikte, sıralayıcı
veya sınıflayıcı ölçekle ölçülmüş değişkenlere ait
verilerin
sayılarını
veya
oranlarını
gösterilmektedir. Çubuk grafiklerinde gruplar
tabanları eşit ve birbirine bitişik olmayan
dikdörtgenler ile çizilir.
47
Kendimizi Sınayalım
1. Aşağıdakilerden hangisi istatistik birimi
değildir?
6. Aşağıdakilerden hangisiz özel veri toplama
tekniklerinden biri değildir?
a. Hastane
a. Gözlem
b. Doktor
b. Kayıtlar
c. İntihar
c. Anket
d. Kabus
d. Görüşme
e. Yangın
e. Tarama
2. Bir psikiyatri kliniğine gelen hastaların
memnuniyet düzeyleri araştırılmak istenmektedir.
Bu olaydaki birim nedir?
7.
a. Hastane
X
Frekans
5
3
7
6
b. Doktor
9
8
c. Memnuniyet
11
11
d. Tanı
13
7
e. Hasta
15
5
Toplam
40
3. Aşağıdaki olaylardan hangisi ani veri
derlemeye konu oluşturur?
Yukarıda verilen frekans dağlımı için “-den az”
birikimli frekanslar oluşturulmak istendiğinde,
birikimli frekanslar aşağıdakilerden hangisidir?
a. Belli bir yer ve zaman aralığındaki doğumlar
b. Belli bir yer ve zamandaki aralığındaki
intiharlar
a. "-den az"
b. "-den az"
c. "-den az"
c. Nüfus sayımı
3
3
40
d. Belli bir yer ve zamandaki trafik kazaları
9
9
37
e. Belli bir yer ve zamandaki hasta hakları
birimine gelen şikayetler
17
15
31
28
25
23
35
38
12
40
40
5
d. "-den az"
e. "-den az"
4. Aşağıdakilerden
değildir?
hangisi
derleme
türü
a. Genel derleme
b. Devamlı derleme
c. Kısmi derleme
3
3
d. Olay derleme
6
11
e. Ani derleme
8
17
5. Aşağıdakilerden hangisi bir verinin taşıması
gereken özelliklerden değildir?
11
32
7
35
40
38
a. Soyut
b. Güvenilir
c. Güncel
d. Doğru
e. Düşük maliyet
48
8. Aşağıdaki “-den az” ve “-den çok” birikimli
frekanslar birlikte verilmiştir.
10. Aşağıdakilerden hangisi bir
taşıması gereken özellik değildir?
Gruplar
Frekans
“-den az”
“-den çok”
a. Her tablonun bir başlığı olmalıdır.
0-6
20
20
127
6-12
24
44
107
b. Tablo karmaşık olmalı ve çok sayıda bilgi
içermelidir.
12-18
35
79
83
c. Tablonun satır ve sütun başlıkları yazılmalıdır.
18-24
26
105
48
d. Tablonun kaynağı belirtilmelidir.
24-30
22
127
22
e. Tabloda kullanılan değişkenin varsa ölçü
birimi belirtilmelidir.
Yukarıdaki tabloya göre sayısal değeri 18’ den
büyük gözlem sayısı kaçtır?
a. 105
b. 79
c. 44
d. 48
e. 26
9. Bir hastanenin acil servisine haftanın
günlerine göre geliş yoğunluğu aşağıda yer alan
daire grafiğinde gösterilmiştir.
Pazar
18%
Pazartesi
13%
Salı
13%
Cumartesi
16%
Cuma
14%
Çarşamba
13%
Perşembe
13%
Daire grafiği yorumlandığında
ifadelerden hangisi yanlıştır?
tablonun
aşağıdaki
a. Acil servise en çok Pazar günleri hasta
gelmektedir.
b. Salı, Çarşamba ve Perşembe günleri hasta
yoğunluğu aynı düzeydedir.
c. Pazartesi günü hasta yoğunluğu Cuma
gününden fazladır.
d. Cumartesi hasta yoğunluğu haftalık hasta
yoğunluğunun % 16’ sıdır.
e. Hafta sonları acil servis hafta içine göre daha
yoğun olmaktadır.
49
Kendimizi Sınayalım Yanıt
Anahtarı
Sıra Sizde Yanıt Anahtarı
1. d Yanıtınız yanlış ise “Veri ve Derleme”
başlıklı konuyu yeniden gözden geçiriniz.
Anakütleyi oluşturan birimlerin tamamının
gözlenmesi
genel
derleme
olarak
tanımlanmaktadır.
Anakütleyi
oluşturan
birimlerin tamamının gözlenmesi yerine olası
gözlem birimlerinin bir bölümü seçilerek
incelenir. Bu derleme türü kısmi derleme olarak
tanımlanır .
Sıra Sizde 1
2. e Yanıtınız yanlış ise “Veri ve Derleme”
başlıklı konuyu yeniden gözden geçiriniz.
3. c Yanıtınız yanlış ise “Veri ve Derleme”
başlıklı konuyu yeniden gözden geçiriniz.
4. d Yanıtınız yanlış ise “Derleme Türleri”
başlıklı konuyu yeniden gözden geçiriniz.
Sıra Sizde 2
5. a Yanıtınız yanlış ise “Verinin Özellikleri”
başlıklı konuyu yeniden gözden geçiriniz.
Verinin taşıması gereken dört özellik; doğru,
güvenilir, güncel ve düşük maliyetli olmasıdır.
6. b Yanıtınız yanlış ise “Özel Veri Toplama
Teknikleri” başlıklı konuyu yeniden gözden
geçiriniz.
Sıra Sizde 3
Sağlık alanında kullanılan sistematik
kaynakları;
kayıtlar,
sayımlar
ve
bildirimledir.
7. a Yanıtınız yanlış ise “Birikimli Frekans
Dağılımları” başlıklı konuyu yeniden gözden
geçiriniz.
veri
özel
Sıra Sizde 4
İstatistiğin üç temel işlevi betimleme, çözümleme
ve tahmindir.
8. d Yanıtınız yanlış ise “Birikimli Frekans
Dağılımları” başlıklı konuyu yeniden gözden
geçiriniz.
Sıra Sizde 5
9. c Yanıtınız yanlış ise “Daire Grafiği” başlıklı
konuyu yeniden gözden geçiriniz.
1.Grup Sayısının Hesaplanması
10. b Yanıtınız yanlış ise “Tablolar” başlıklı
konuyu yeniden gözden geçiriniz.
n  50 (toplam gözlem sayısı)
log50  1,699
k  1  (3,3 1,699)  6,61  7
Veriler 7 grup altında düzenlenecektir.
2. Grup Aralığının Hesaplanması
Veri setimizde kayıt altına alınan en küçük değer
60 yıl ve en büyük değer 73’tür.
xenb  73
xenk  60
c
73  60
2
7
Grup aralığının genişliği 2 olacaktır.
50
Sıra Sizde 8
3. Grup sayısı 7 ve grup aralığı 2’ ye göre
verilerin tablolaştırılması
Gruplar
Grafiği çizebilmek için Microsoft Excel
kullanılabilir.
Tablonun
tümünü
seçerek
kopyalayınız ve Excel’de bir çalışma sayfasına
yapıştırınız. Excel’e yapıştırdığınız tablonun
tamamını seçerek ekle sekmesinden çubuk grafiği
seçilerek grafik çizilir.
Frekans
60 - 62’den az
2
62 - 64’den az
6
64 - 66’dan az
8
66 - 68’den az
16
68 - 70’den az
7
70 - 72’den az
6
72 - 74’den az
5
Toplam
50
Sıra Sizde 6
İmaj
Oransal
Frekans
Çok İyi
0,125
İyi
0,400
Orta
0,320
Zayıf
0,095
Çok Zayıf
0,060
Toplam
1,000
Sıra Sizde 9
Sıra Sizde 7
30
Sıra Sizde 10
20
15
10
5
15
30
45
60
75
90
Gruplar
51
Yararlanılan Kaynaklar
Anadolu Üniversitesi Açık Öğretim Fakültesi,
İstatistik, Editör: Prof. Dr. Ali Fuat Yüzer, AÖF
Yayın No: 771, Anadolu Üniversitesi, Eskişehir.
Çömlekçi, N. (1997). Temel İstatistik İlke ve
Teknikleri, Bilim Teknik Yayınevi, Eskişehir.
Çömlekçi, N. (1998). Bilimsel Araştırma
Yöntemi
ve
İstatistiksel
Anlamlılık
Sınamaları, Bilim Teknik Yayınevi, Eskişehir
Gürsakal, N. (2007). Betimsel İstatistik, Nobel
Yayın Dağıtım, İstanbul.
Serper, Ö. (1988). Uygulamalı İstatistik I, Filiz
Kitabevi, İstanbul.
Sümbüloğlu, K. (2001). Sağlık Alanına Özel
İstatistiksel Teknikler, Somgür Yayıncılık,
Ankara.
Sağlık istatistikleri yıllığı (2010), T.C. Sağlık
Bakanlığı, Bakanlık Yayın no: 832.
http://www.tedavi.saglik.gov.tr
http://www.sagliknet.saglik.gov.tr
http://www.istatistik.saglik.gov.tr
52
3
Amaçlarımız
Bu üniteyi tamamladıktan sonra;
İstatistik serileri için duyarlı ortalamaları hesaplayabilecek,
İstatistik serileri için duyarlı olmayan ortalamaları hesaplayabilecek,
İstatistik serileri için değişkenlik ölçülerini hesaplayabilecek
bilgi ve becerilere sahip olabilirsiniz.
Anahtar Kavramlar
Aritmetik ortalama
Medyan
Tartılı aritmetik ortalama
Standart sapma
Geometrik ortalama
Varyans
Mod
Değişim katsayısı
İçindekiler
 Giriş
 Verilerin Özetlenmesi
 Aritmetik Ortalama
 Geometrik Ortalama
 Tartılı Aritmetik Ortalama
 Mod
 Medyan
 Değişkenlik ölçüleri
 Standart Sapma
 Değişim katsayısı
54
Ortalamalar ve Değişkenlik
Ölçüleri
GİRİŞ
Bundan önceki bölümlerde, verilerin toplanması, düzenlenmesi (dizi, frekans serisi, gruplandırılmış seri)
ve grafiklerle gösterilmesi ayrıntılı olarak anlatıldı. Frekans dağılımları ve grafikler, bir veri seti içindeki
değerlerin dağılımı hakkında genel bir fikir vermede etkilidir. Bununla birlikte, daha ileri analizler için,
verilerin tek bir değerle ifade edilebileceği, kesin bilgilere ihtiyaç vardır. Bu ünitede, bir veri setinin tek
bir değerle ifade edilmesini sağlayan ortalamalar anlatılacaktır. Daha sonra da verilerin bir değer etrafında
nasıl dağıldıklarının ölçüsü olarak, değişkenlik ölçüleri açıklanacaktır.
VERİLERİN ÖZETLENMESİ
Bir araştırma sonucu toplanan verilerin frekans serisi veya gruplandırılmış seri halinde gösterilmesi,
veriler hakkında genel fikir verebilir. Yine bu verilerin grafikle gösterilmesi, verilerin nasıl dağıldıkları
hakkında genel bir eğilim yansıtır. Ancak bunların hiç biri verilerin tek bir değerle gösterilmesini
sağlamazlar. Oysa derlenen verileri “tek bir sayıda” özetleyecek kolay ölçütlere de ihtiyaç vardır. Bu özet
veri, araştırma sonunda derlenen verilerin hangi değer etrafında toplandıklarının bir göstergesi olacaktır.
Bir seriyi temsil etmeye ve özetlemeye yarayan tek bir rakama “ortalama” denir. Dolayısıyla
ortalamalar veri setindeki en küçük değerden daha küçük, en büyük değerden de daha büyük olamazlar.
xenk  Ortalama  xenb
Hesaplanan ortalamanın serideki terimlerin çoğuna yakın değer alması, söz konusu ortalamanın
seriyi iyi temsil ettiğini gösterir. Ortalamalar hesaplanırken, serideki bütün gözlem değerleri hesaba
katılarak hesaplanıyorsa buna “duyarlı ortalamalar”, bazı gözlem değerlerine göre hesaplanıyorsa buna
da “duyarlı olmayan ortalamalar” adı verilir. Başka bir ifadeyle ortalama hesaplanırken, gözlem
değerlerinden birinin değiştirilmesiyle ortalama değeri değişiyorsa bu duyarlı ortalamadır. Aksi
durumda gözlem değerlerinden birinin değiştirilmesi ortalama değerini etkilemiyorsa buna da duyarlı
olmayan ortalama denir. Bu ünitede, duyarlı ortalamalardan aritmetik ortalama ve geometrik ortalama,
duyarlı olmayan ortalamalardan da mod ve medyan anlatılacaktır.
Aritmetik Ortalama
Hesaplanması kolay ve çok geniş bir uygulama alanına sahip olduğu için, istatistikte en çok kullanılan ve
ortalama denilince akla gelen ilk ortalama “aritmetik ortalama” dır. Aritmetik ortalama, veriler
toplamının veri sayısına bölünmesi şeklinde tanımlanabilir. Bir ortalama, ana kütlenin tamamı için
hesaplanacağı gibi, ana kütleden seçilen bir örneklem kütlesi için de hesaplanır. Kütledeki birimlerin
sayısı, yani kütle büyüklüğü genellikle N ve kütle ortalaması da  ile gösterilir. Örneğin, A hastanesinde
yatan toplam hasta sayısı 120 kişi ise ve amacımız bu hastaların tamamını incelemek ise kütle mevcudu
N=120 olacaktır. Bu hastaların yaş ortalamasını belirlemek istediğimizde, hasta yaşlarının toplamı,
120’ye bölünerek hesaplanacaktır. Yaş değişkeni x ile gösterildiğinde, kütle ortalaması;
55

x1  x2  ....  x120
120
olarak hesaplanacaktır. Bilindiği gibi toplam simgesi

sembolüyle gösterilir. Bu durumda kütle
ortalaması kısaca
N

x
i 1
i
N
formülüyle belirlenir.
Ancak kütle çok büyük olduğunda, bunun tamamını gözlemlemek daha çok maliyet ve zaman
gerektirir ya da bazen kütlenin tamamı incelemek imkansız olabilir. Böyle durumlarda daha az sayıda
birimle araştırma yapılır. Örneğin Türkiye’deki tüm hastanelerde yatan hastaların incelenmesi oldukça
zor olacağından, bunlar arasından çeşitli tekniklerle belirlenen ve “örneklem “olarak ifade edilen, daha az
sayıda hasta ile araştırma yapılır. Kütle içinden seçilen birim sayısı da genellikle n simgesiyle gösterilir. n
birim için hesaplanılan ortalamaya “örneklem ortalaması” denir ve aşağıdaki gibi hesaplanır:
n
x
x
i 1
i
n
Eğer istatistik serisi, frekans serisi veya gruplandırılmış seri ise aritmetik ortalama,
k
x
 x .n
i 1
k
i
i
n
i
i 1
formülüyle hesaplanacaktır.
Bu ünitenin ilerleyen sayfalarındaki örnek çözümler aksi belirtilmedikçe örneklem verileri için
çözülecektir.
Örnek 3.1:
Eskişehir Yunus Emre Devlet hastanesi dâhiliye kliniğinde yatarak tedavi gören ve taburcu edilen 10
hastanın, hastanede kalış süreleri gün olarak aşağıdaki gibi elde edilmiştir. Buna göre örneklem
ortalamasını hesaplayınız.
xi : 8 10 12 15 16 18 20 21 23 25
Çözüm 3.1:
Yukarıda ifade edilen örneklem ortalaması formülüne göre, verilerin toplanıp veri sayısına bölünmesi
gerekir. O halde veriler toplamı;
10
 x =8+10+12+15+16+18+20+21+23+25=168
i 1
i
olarak hesaplanacaktır. 168 değeri aynı zamanda terimler toplamı olarak da ifade edilir. Terimler
toplamının, terim sayısına bölünmesiyle elde edilecek aritmetik ortalama,
n
x
x
i 1
n
i

168
 16,8 gün olarak hesaplanacaktır.
10
56
Örnek 3.2:
A hastanesinin çeşitli kliniklerinde yatan 25 hastalık örneklem seçilmiş ve bu hastaların tedavisi için
kullanılan B maddesi tüketimi değerleri ölçülmüş ve tüketen hasta sayılarıyla beraber Tablo 3.1’deki
değerler elde edilmiştir. B maddesi tüketim ortalamasını hesaplayınız.
Tablo 3.1: B maddesi Tüketim Verileri
B Maddesi Tüketimi ( xi )
Hasta Sayısı ( ni )
120
125
130
135
140
145
150
2
3
5
7
5
2
1
Çözüm 3.2:
Yukarıdaki örnekte verilen seri bir frekans serisidir. Frekans serileri için terimler toplamı ise;
x
i
 120+120+125+125+125+…………..+145+145+150
şeklinde belirlenecektir. Ancak bu şekilde hesaplama işlemi uzatacağından, terimler frekanslarla çarpılıp,
toplamı alınır. Bu değerler de Tablo 3.2’de verilmiştir:
Tablo 3.2: Frekans Serisi İçin Gerekli İşlemler Tablosu
x
Hasta Sayısı ( ni )
xi .n i
120
125
130
135
140
145
150
Toplam
2
3
5
7
5
2
1
240
375
650
945
700
290
150
3350
Terimler toplamı 3350 olarak hesaplandığına göre, bu değerin frekanslar toplamına bölünmesiyle,
verilen frekans serisinin ortalaması hesaplanmış olacaktır. Dolayısıyla B maddesi tüketim ortalaması
k
x
 x .n
i 1
k
i
i
n
i 1
=
3350
 134
25
i
olarak elde edilecektir.
57
Örnek 3.3:
A hastanesinde yatan hastaları arasından tesadüfi olarak seçilen 40 hastanın tedavi süreleri ve hasta
sayıları Tablo 3.3’deki gibi elde edilmiştir. Aritmetik ortalamayı hesaplayınız.
Tablo 3.3: Örnek 3.3 Verileri
Tedavi Süresi (Gün)
Hasta Sayısı ( ni )
3-5
5-7
7-9
9-11
11-13
13-15
15-17
3
5
9
12
7
3
1
Çözüm 3.3:
Verilen seri gruplandırılmış bir seridir. Gruplandırılmış serilerin aritmetik ortalaması da frekans
serilerindeki gibi hesaplanır. Ancak
xi değerlerinin hesaplanması gerekir. xi değerleri de her bir grubun
(3  5)
 4 olarak elde edilecektir.
2
Diğer gruplara ilişkin grup ortalamaları da benzer şekilde hesaplandığında Tablo 3.4’de verilen sonuçlara
ulaşılacaktır.
ortalaması alınarak hesaplanır. Örneğin, 3-5 grubu için
xi değeri
Tablo 3.4: Gruplandırılmış Seri İçin Gerekli İşlemler Tablosu
Grup Ortalaması
ni
xi .n i
4
6
8
10
12
14
16
Toplam
3
5
9
12
7
3
1
40
12
30
72
120
84
42
16
376
Yine, terimler toplamı olan 376 değeri, frekanslar toplamı olan 40 değerine bölündüğünde, istenilen
ortalama değeri,
k
x
 x .n
i 1
k
i
i
n
i 1
=
376
 9, 4
40
i
gün olarak hesaplanacaktır.
Ancak belirtmek gerekir ki, gruplandırılmış serilerde aritmetik ortalama hesaplanırken, her bir
grubun ortalaması alındığından, gruplandırılmış serilerdeki aritmetik ortalama yaklaşık olarak
hesaplanabilmektedir.
Aritmetik ortalama, aşırı küçük veya büyük değerlerden etkilenen bir ortalamadır. Dolayısıyla veriler
içinde, diğer verilere nazaran aşırı küçük veya büyük değerler olması durumunda, aritmetik ortalama tüm
58
verileri temsil eden bir ortalama olmayacaktır. Böyle durumlarda ise temsili olabilecek yani, verilerin
geneline yakın olabilecek ortalama geometrik ortalamadır.
Geometrik Ortalama
Bir istatistik serisindeki veriler geometrik olarak artıyorsa ya da diğer verilere nazaran aşırı büyük ya
da küçük değerler varsa, bu durumda aritmetik ortalama temsili olmayacağından, geometrik ortalama
hesaplanır. Mikroorganizmaların çoğalması, nüfus artışı, gibi birbirinin katları olarak çoğalan yani
geometrik artış gösteren verilerde geometrik ortalama kullanılır. Diziler için geometrik ortalama
aşağıdaki gibi hesaplanır:
G.O  n x1.x2 .......xn
Ancak veri sayısı çok olduğunda bu şekilde hesaplamak zorlaşacağından, önce
xi ’lerin her birinin e
tabanına göre doğal logaritması olan “ln” leri alınır, daha sonra bunların toplamı terim sayısına bölünür.
En sonunda bulunan bu sayının exponansiyeli alınır ve aşağıdaki gibi hesaplanır.
G.O  e
(
 ln xi )
n
Gruplandırılmış ve frekans serilerinde ise aşağıdaki formülle belirlenir:
 ni ln xi )
n
G.O  e  i
(
Örnek 3.4:
Bir hafta boyunca A hastanesinin acil servisine gelen hasta sayıları aşağıdaki gibi elde edilmiştir. Buna
göre en uygun (temsili) ortalamayı hesaplayınız.
Tablo 3.5: Acil Servise Gelen Hasta Sayıları
Günler
xi
1
2
3
4
5
6
7
12
15
10
18
13
11
100
Çözüm 3.4:
Seri incelendiğinde, son değerin diğer verilerden oldukça büyük olduğu görülecektir. Böyle durumlarda
aritmetik ortalama, serideki aşırı büyük verilerden etkileneceğinden temsili olmayacaktır. Dolayısıyla
duyarlı ortalamalardan geometrik ortalamanın hesaplanması gerekir. Çözümleme için önce verilerin “ln”
değerleri hesaplanacaktır. Bu değerler de Tablo 3.6’da verilmiştir.
59
Tablo 3.6: Geometrik Ortalama İçin ln Değerleri
Günler
xi
ln( xi )
1
2
3
4
5
6
7
Toplam
12
15
10
18
13
11
100
2,48
2,71
2,30
2,89
2,56
2,40
4,61
19,95
ln değerlerinin toplamı formülde yerine yazıldığında,
G.O  e
(
 ln xi )
n
e
(
19,95
)
7
 e2,85  17, 29
olarak bulunacaktır. Aynı serinin aritmetik ortalaması hesaplandığında ise 25,57 olarak elde edilecekti.
Dolayısıyla serideki 100 değeri, aritmetik ortalamayı gerçek değerinin çok üzerine çıkarttığından,
aritmetik ortalama temsili ortalama olmayacaktır.
Aşağıdaki istatistik serisi için temsili olabilecek duyarlı ortalamayı
hesaplayınız.
xi
ni
5
3
7
7
10
10
13
4
500
1
Tartılı Aritmetik Ortalama
Ortalamaların ve oranların ortalamaları hesaplanmak istendiğinde ya da farklı zaman ve yerde yapılan
deney sonuçlarını birleştirerek ortak bir değer hesaplama gerektiğinde, “tartılı aritmetik ortalama”
ni ‘ler tartı olmak üzere, ortalamaların ortalaması,
hesaplanır.
k
xt 
 x .n
i 1
k
i
i
n
i
i 1
formülüyle belirlenirken,
oranları göstermek üzere oranların ortalaması da aşağıdaki gibi hesaplanır:
k
pt 
n p
i 1
k
i
i
n
i 1
i
60
Örnek 3.5:
A ilacı ile tedavi edilen akut ishalli hastalardaki serum gereksinimleri, Tablo 3.7‘deki gibi olsun. Buna
göre 5 klinikte hastalar için kullanılan serum miktarı ortalamasını hesaplayınız.
Tablo 3.7: Örnek 3.5 Verileri
Klinik Adı
Ortalama Serum Miktarı(kg)
Tedaviye Katılan Hasta Sayısı( ni )
A
B
C
D
E
75
92
71
18
60
4,5
3,6
3,9
5,9
4,8
Çözüm 3.5:
Veriler incelendiğinde, kliniklerde tedaviye katılan hasta sayıları farklı olduğundan, bu verilerin çözümü
için tartılı aritmetik ortalama kullanılacaktır. Verilen serum miktarları da ortalama değerler olduğundan,
ortalamaların ortalaması için verilen formül yardımıyla hesaplanacaktır. Tedaviye katılan hasta sayıları
tartı olmak üzere, gerekli hesaplamalar Tablo 3.8‘de verilmiştir:
Tablo 3.8: Tartılı Aritmetik Ortalama İçin Gerekli İşlemler Tablosu
Klinik
Adı
Tedaviye Katılan Hasta
A
B
C
D
E
Toplam
75
92
71
18
60
316
Ortalama serum
Sayısı ( ni )
miktarı (kg)
4,5
3,6
3,9
5,9
4,8
xi
xi ni
337,5
331,2
276,9
106,2
288,0
1339,8
Hesaplanılan toplam formülde yerine yazıldığında, 5 klinikte kullanılan serum miktarı ortalaması
5
xt 
 x .n
i 1
5
i
i
n
=
1339,8
 4, 24 kg olarak belirlenecektir.
316
i
i 1
Örnek 3.6:
4 farklı klinikte, B anti-kanser ilacının deneme sonuçları aşağıdaki gibi elde edilmiştir. 4 klinikteki
hayatta kalan hasta oranını hesaplayınız.
Tablo 3.9: Örnek 3.6 Verileri
Klinik Adı
Denemeye Katılan Hasta Sayısı( ni )
A
B
C
D
98
65
76
28
61
3. yılda hayatta kalan kanserli
hasta oranı (%)
53,9
28,5
61,2
38,6
Çözüm 3.6:
Bu örnekte de kliniklerdeki denemeye katılan hasta sayıları farklı olduğundan tartılı ortalama
hesaplanacaktır. Ancak bir önceki örnekten farklı olarak, ortalamalar yerine oranlar söz konusudur. O
halde oranlar için tartılı ortalama formülü kullanılacaktır. Bir önceki soruda olduğu gibi
ni ‘ler tartı
olmak üzere gerekli hesaplamalar Tablo 3.10‘da verilmiştir:
Tablo 3.10: Oranların Ortalaması İçin Gerekli İşlemler Tablosu
Klinik Adı
ni
pi (%)
ni pi
A
B
C
D
Toplam
98
65
76
28
267
53,9
28,5
61,2
38,6
5282,2
1852,5
4651,2
1080,8
12866,7
Gerekli toplamlar formülde yerine yazıldığında, 4 klinik için oranların ortalaması aşağıdaki gibi elde
edilecektir:
Gerekli toplamlar formülde yerine yazıldığında, 4 klinik için oranların ortalaması aşağıdaki gibi elde
edilecektir:
5
pt 
n p
i 1
5
i
i
n
i 1

12866, 7
 48,19
267
i
Dolayısıyla 4 klinikte, 3 yılsonunda hastaların hayatta kalma oranları %48,19 dur.
Şimdiye kadar anlatılan ortalamalar serideki tüm verilere göre hesaplanan ortalamalardı. Oysa bazı
ortalamalar, bir serideki tüm gözlemleri dikkate almadan hesaplanır. Bundan sonraki kısımda da tüm
verileri hesaba katmadan belirlenen ve “duyarlı olmayan ortalamalar” olarak isimlendirilen “mod” ve
“medyan” açıklanacaktır.
Mod
İstatistikte, diziler ve frekans serileri için hesaplanması en kolay ortalama mod değeridir. Bir dizide en
çok tekrarlanan değere “Mod” değeri denir. Frekans serlerinde bu değer en yüksek frekansa sahip olan
değer olacaktır. Dizilerde ve frekans serilerinde mod değerini belirlemek oldukça basit olmasına rağmen,
gruplandırılmış serilerde ise aşağıdaki formül yardımıyla belirlenecektir:
Mod  La 
1
 cm
1   2
La : Mod grubunun alt değeri,
1 : Mod grubunun frekansı ile bir önceki grubun frekansı arasındaki fark,
 2 : Mod grubunun frekansı ile bir sonraki grubun frekansı arasındaki fark,
cm : Mod grubunun aralığıdır.
Gruplandırılmış serilerde frekans değeri en yüksek olan grup mod grubu olarak tanımlanır. Eğer grup
aralıkları farklı ise grup aralıkları ünite 2’de anlatıldığı gibi ayarlanır.
62
Örnek 3.7:
B hastanesinde çalışan 15 personelin kullandığı yıllık izin süreleri gün olarak aşağıda verilmiştir. Bu
veriler için mod değerini hesaplayınız.
13 12 14 15 18 22 25 15 30 18
24 18 17 23 16
Çözüm 3.7:
Veriler incelendiğinde en fazla görülen izin süresinin 18 olduğu yani, 3 defa yer aldığı görülecektir.
Dolayısıyla aranılan mod değeri 18 gün olacaktır.
Örnek 3.2’deki veriler için mod değerini hesaplayınız.
Örnek 3.8:
Tablo 3.11’deki gruplandırılmış seri için mod değerini hesaplayınız.
Tablo 3.11: B Maddesi Tüketim Verileri
B Maddesi Tüketimi
Hasta Sayısı ( ni )
6
8
12
17
9
7
5
110-115
115-120
120-130
130-140
140-150
150-155
155-160
Çözüm 3.8:
En yüksek frekansın (17) bulunduğu grup, mod grubudur (130-140). Dolayısıyla mod grubunun alt değeri
130’dur. Mod grubunun frekansı 17 ve bir önceki grubun frekansı da 12 olduğuna göre, arasındaki fark
17-12=5 olacaktır. Yine mod grubundan sonraki frekans 9 olduğuna göre, bunun farkı da 17-9=8’dir.
Mod grubunun aralığı da 140-130=10 olduğuna göre, formülde yer alan değerler aşağıdaki gibi olacaktır:
La =130
1 =5
 2 =8
cm =10
Belirlenen bu değerler formülde yerine yazıldığında mod değeri,
Mod  La 
1
5
50
 cm  130 
 10  130 
 130  3,85  133,85
1   2
58
13
olarak hesaplanacaktır.
63
Medyan
Küçükten büyüğe sıralanmış verileri, iki eşit kısma ayıran ve tam ortaya düşen değere Medyan
(ortanca değer) adı verilir.
Dizilerde medyan hesabı oldukça kolaydır. Önce gözlem sayısı 2’ye bölünür (n/2).
Eğer (n/2) bir tamsayı değilse, bu değer tamsayıya çevrilir. Aranan medyan değeri de tam ortaya düşen bu
gözlem değeridir. Örneğin, veri sayısı 17 olsun. 17/2 değeri 8,5 olacağından, bu değer tamsayıya
çevrildiğinde 9 olacaktır. (
n 1
). Dolayısıyla medyan değeri küçükten büyüğe sıralanmış veri setindeki
2
9. değer olacaktır (x9). Eğer (n/2) tamsayı ise aranılan medyan değeri aşağıdaki gibi belirlenir:
M1/ 2 
xn / 2  x( n / 2) 1
2
Frekans serilerinde medyan değerini hesaplayabilmek için frekans serisindeki gözlem değerlerinin
sırasının bilinmesi gerekir. Bu nedenle küçükten büyüğe “birikimli frekanslar” oluşturulur ve medyan
değeri dizilerdeki gibi hesaplanır.
Gruplandırılmış serilerde medyan hesabı ise aşağıdaki formülle hesaplanacaktır:
M 1/ 2
n
 na
 La  2
 cm
nm
Formüldeki;
La : Medyan grubunun alt değeri,
na : Medyan grubundan önceki grupların frekanslar toplamı,
nm : Grup frekansı,
cm : Medyan grubunun aralığı’dır.
Örnek 3.9:
Örnek 3.1 ‘deki veriler için medyan değerini hesaplayınız.
Çözüm 3.9:
Çözüm için önce n/2 değerini hesaplamak gerekir. Örneğimizde n=10 olduğuna göre 10/2=5 olarak
hesaplanacaktır. 5 değeri bir tamsayı olduğuna göre medyan değeri
M1/ 2 
x10/ 2  x(10/ 2) 1
2

x5  x6
formülünden,
2
5 ve 6. terimin ortalaması olarak elde edilecektir. Terimleri küçükten büyüğe sıralanmış serideki 5 nci
değer 16, 6 ncı değer de 18 olduğuna göre, medyan değeri
M1/ 2 
16  18
 17 gün olacaktır.
2
64
Örnek 3.10:
Örnek 3.2’deki veriler için medyan değerini hesaplayınız.
Çözüm 3.10:
Veriler frekans serisi şeklinde olduğundan, medyan değerinin hesaplanabilmesi için, birikimli frekanslara
ihtiyaç vardır. Birikimli frekansların bulunduğu tablo ise aşağıda verilmiştir:
Tablo 3.12: Örnek 3.10 İçin Birikimli Frekanslar Tablosu
B Maddesi Tüketimi ( xi )
Hasta Sayısı ( ni )
Birikimli Frekanslar
n
i
120
125
130
135
140
145
150
2
3
5
7
5
2
1
2
5
10
17
22
24
25
n 25

 12,5 olduğundan ve tamsayı olmadığından
2 2
bu değer yuvarlatılarak tamsayıya 13 olarak çevrilir. Yani medyan değeri 13. değerdir. Bu da birikimli
frekanslarda 11. değerden 18. değere kadar olan 135 değeri olacaktır.
Şimdi de (n/2) değerinin belirlenmesi gerekir.
Örnek 3.11:
Örnek 3.3’deki veriler için medyan değerini hesaplayınız.
Çözüm 3.11:
Örnek 3.3’deki veriler gruplandırılmış bir seri olduğuna göre önce medyan grubunun bulunduğu grubu
belirlemek gerekir. Bunun için de yine birikimli frekanslar hesaplanacaktır. Birikimli frekanslar Tablo
3.13’de verilmiştir:
Tablo 3.13: Örnek 3.11 İçin Birikimli Frekanslar Tablosu
Tedavi Süresi (Gün)
Hasta Sayısı ( ni )
Birikimli Frekanslar
3-5
5-7
7-9
9-11
11-13
13-15
15-17
3
5
9
12
7
3
1
3
8
17
29
36
39
40
n
i
Birikimli frekanslar belirlendikten sonra medyan grubunu belirleyebilmek için n/2=40/2=20 değeri
belirlenir. 18. değerden 29. değere kadar olan veriler 9-11 grubundadır. O halde aranılan medyan grubu 911 grubudur. Dolayısıyla medyan grubunun alt değeri 9 olacaktır. Birikimli frekanslara bakıldığında,
medyan grubundan önceki frekanslar toplamının 17 olduğu görülmektedir. Medyan’nın grup frekansı 12
ve medyan grubunun grup aralığı da 11-9=2 olarak hesaplanacaktır. Formülde yer alan bu değerler
düzenli bir şekilde yazılırsa aşağıdaki gibi elde edilecektir:
65
La = 9
na = 17
nm = 12
cm : 2
Bu değerler formülde yerine yazılarak gerekli işlemler yapıldığında,
M1/ 2
n
40
 na
 17
2
 La 
 cm  9  2
2
nm
12
M1/ 2  9 
3
 2  9  0,5  9,5
12
olarak hesaplanacaktır. O halde aranılan medyan 9,5 değeridir.
DEĞİŞKENLİK ÖLÇÜLERİ
Ortalamalar, serileri özetlemek için gerekli olsa da gözlem değerlerinin birbirine yakınlık derecesini
belirlemediğinden yeterli değildir. Ortalamaları aynı olan seriler birbirinden çok farklı olabilir.
Dolayısıyla bir istatistik serisi incelenirken gözlem değerlerinin ortalaması yanında, ortalama etrafındaki
dağılımlarına da ihtiyaç vardır. Bir istatistik serisini oluşturan gözlem değerlerinin birbirlerinden ya da
ortalamadan uzaklıkları, verilerin nasıl değişim gösterdiğini belirtir. Bunları hesaplamaya yarayan
ölçülere de “değişkenlik ölçüleri” denir. Ortalamalarda olduğu gibi yine bu ünitede istatistikte en sık
kullanılan değişkenlik ölçüleri olan standart sapma ve değişim katsayısı anlatılacaktır.
Standart Sapma
İstatistikte en sık kullanılan değişkenlik ölçüsü standart sapmadır. Standart sapma ve karesi olan varyans
pek çok istatistiksel analize temel oluşturur. Dizilerde ana kütle standart sapması,

 (x  )
2
i
N
formülüyle hesaplanır. Bunun karesi olan  2 ise “ana kütle varyansı” olarak ifade edilir. Örneklem
standart sapması ise s ile ifade edilir ve aşağıdaki gibi belirlenir:
s
 (x  X )
2
i
n
2
Bunun karesi olan s değerine ise “örneklem varyansı” denir. Frekans serilerinde ve gruplandırılmış
serilerde örneklem standart sapması,
s
 n (x  X )
i
2
i
n
formülü yardımıyla hesaplanır.
66
Örnek 3.12:
Özel bir hastanede çalışan personelin tamamının yaşları Tablo 3.14’de verilmiştir. Standart sapmayı
hesaplayarak yorumlayınız.
Tablo 3.14: Hastanede Çalışan Personelin Yaşları
56
32
36
41
45
48
41
56
48
26
33
56
55
42
32
53
34
35
32
53
27
48
44
40
42
39
54
28
47
30
36
29
32
38
41
42
43
28
22
43
40
38
53
35
43
33
28
54
36
33
Çözüm 3.12:
Çalışan personelin tamamı incelendiğinden, hesaplanacak standart sapma ana kütle için olacaktır.
Terimlerin ortalamadan sapmalarının kareleri toplamını belirleyebilmek için, ana kütle ortalamasını
hesaplamak gerekir. Bunun için de ana kütledeki tüm terimlerin toplamına ihtiyaç vardır. Terimlerin
tamamı toplandığında 2000 olarak elde edilecektir. Dolaylısıyla ana kütle ortalaması,
N
x
i
2000

 40
olarak hesaplanacaktır. Şimdi de tüm terimlerin ana kütle ortalaması olan
N
50
40 değerinden çıkartılarak karelerinin alınması gerekmektedir. Yani sırasıyla

i 1
(56-40)2+(32-40)2+(36-40)2+(41-40)2+…+(54-40)2+(36-40)2+(33-40)2 hesaplanarak, bunların toplamı
alınacaktır. Bu değer ise 4104 olarak bulunacaktır. Buradan da ana kütle standart sapması,

 (x  )
i
N
2

4104
 82, 08  9, 06
50
olarak hesaplanacaktır. O halde incelenen serinin terimleri, ortalaması olan 40 değerinden, ortalama
olarak 9,06 birimlik bir sapma gösterecektir.
Örnek 3.11’deki verilerden 8 birimlik bir örneklem çekilerek 54, 43, 30,
34, 48, 35, 53 ve 39 değerleri elde edilmiştir. Standart sapmayı hesaplayınız.
67
Örnek 3.13:
Örnek 3.3’deki veriler için standart sapmayı hesaplayınız.
Çözüm 3.13:
Standart sapmayı hesaplayabilmek için öncelikle serinin ortalaması hesaplanmalıdır. Serinin ortalaması
Örnek 3.3’te 9,4 olarak hesaplanmıştı. Bu seri bir frekans serisi olduğuna göre, terimlerin ortalamadan
sapmalarının kareleri, frekanslarla çarpılarak toplanacaktır. Bu işlemler de izleyen tabloda açık bir şekilde
verilmiştir:
Tablo 3.15: Standart Sapmanın Hesaplanması İçin Gerekli İşlemler Tablosu
Grup Ortalaması
ni
ni .( xi  x )2
4
6
8
10
12
14
16
Toplam
3
5
9
12
7
3
1
40
3.(4-9,4)2=87,48
5.(6-9,4)2=57,80
9.(8-9,4)2=17,64
12.(10-9,4)2=4,32
7.(12-9,4)2=47,32
3.(14-9,4)2=63,48
1.(16-9,4)2=43,56
321,60
Gerekli toplamlar, frekans serisi için verilen standart sapma formülünde yerine yazıldığında,
s
 n (x  x )
i
i
n
2

321, 60
 8, 04  2,84
40
gün olarak bulunur. Dolayısıyla “terimler ortalama 9,4 değerinden ortalama olarak 2,84 günlük bir sapma
gösterir” şeklinde yorumlanır. Mutlak bir ölçü olan standart sapma, gözlem değerlerinin büyüklüğünden
etkilenen bir ölçüdür. Ayrıca ölçü birimleri farklı olan serilerin karşılaştırılmasında da standart sapma
kullanılamaz. Dolayısıyla ölçü birimleri (cm, lt, hg v.b), ve terimlerin değeri farklı olan serilerin
karşılaştırılmasında değişim katsayısı kullanılır.
Değişim Katsayısı
Standart sapmanın, aritmetik ortalamaya bölünmesiyle elde edilen değişim katsayısı, oransal bir ölçüdür.
Dolayısıyla değişim katsayısı terimlerin büyüklüğünden ve ölçü birimlerinden etkilenmez. Değişim
katsayısı aşağıdaki formülle hesaplanır:
D.K 
s
x
Mutlak bir ölçü olan standart sapmanın aksine, değişim katsayısının ölçü birimi yoktur. Çünkü
formülün pay ve paydasında yer alan ve aynı ölçü birimine sahip olan standart sapma ve aritmetik
ortalama birbirine bölündüğü için, sonuçta ölçü birimine sahip olmayan bir oran kalır. Tek bir serinin
değişkenliğini belirlemek için çok kullanışlı olmayan değişim katsayısı, daha çok iki ve daha fazla serinin
karşılaştırılması için kullanılır. Değişim katsayısı küçük olan serilerin, diğerlerine göre daha az değişken
olduğu ifade edilecektir. Bunun anlamı ise değişim katsayısı küçük olan serinin daha homojen yani
birbirine daha yakın terimlerden oluştuğudur.
68
Örnek 3.14:
Tablo 3.16’da verilen serilerden hangisinin değişkenliğinin daha fazla olduğunu belirleyiniz.
Tablo 3.16: A ve B Maddesi Tüketim Verileri
A Maddesi Tüketimi (gr)
110
115
120
130
140
150
160
B Maddesi Tüketimi (cm)
125
132
140
160
200
225
300
Çözüm 3.14:
Hatırlanacağı gibi serilerin değişkenliğini belirleyebilmek için kullanılan ölçüler, standart sapma ve
değişim katsayısıdır. Ancak bu iki serinin ölçü birimleri farklı olduğundan, bunların karşılaştırılabilmesi
için kullanılacak değişkenlik ölçüsü, değişim katsayısı olacaktır. Değişim katsayısının hesaplanabilmesi
için de serilerin ortalaması ve standart sapmasına ihtiyaç vardır. Bu iki seri için hesaplanılan ortalama ve
standart sapma Tablo 3.17’de verilmiştir.
Tablo 3.17: Değişim Katsayısı İçin Hesaplanan Ortalama ve Standart Sapma Verileri
s
x
A Maddesi Tüketimi (gr)
17,29
132,14
B Maddesi Tüketimi (cm)
58,66
183,14
A maddesinin tüketimi için değişim katsayısı,
D.K 
s 17, 29

 0,13
x 132,14
olarak hesaplanırken, B maddesinin tüketimi için,
D.K 
s 58, 66

 0,32
x 183,14
şeklinde belirlenecektir. Bu sonuçlara göre, B maddesi tüketimi için hesaplanılan %32 değeri, A
maddesinin tüketimi için belirlenen %13 değerinden daha büyüktür. Dolayısıyla, B maddesi tüketimi
serisinin değişkenliği, A maddesi tüketimi serisinin değişkenliğinden daha fazladır.
MICROSOFT EXCEL OFFICE UYGULAMALARI
Şimdiye kadar ortalamalar ve değişkenlik ölçülerinin teorik yapısı anlatılarak, konuya ilişkin sayısal
örnekler çözüldü. Bu kısımda da bazı örneklerin Excel’de nasıl çözümlendiği anlatılacaktır. Ancak hemen
belirtmek gerekir ki, Excel’in doğrudan hesapladığı seriler, basit seri şeklindedir.
Öncelikle basit bir seri için aritmetik ortalamanın nasıl hesaplandığı anlatılacaktır. Bunun için
Excel’de yeni bir çalışma sayfası açarak, daha önce çözülen Örnek 3.1’deki verileri A kolonuna giriniz.
Daha sonra “Formüller” menüsü tıklanarak buradan “Tüm İşlevler” ve “İstatistiksel” menüsü tıklanır.
Şimdi karşımıza çıkan pencereden, “ORTALAMA” işlevi tıklanır. Bunların nasıl yapılacağı ayrıca
aşağıda gösterilmiştir.
69
Şimdi karşımıza çıkan pencerede, ortalaması hesaplanacak verilerin seçilmesi gerekir. Veriler A2-A11
arasında olduğu için, bu aralık seçilerek “Tamam” tıklandığında, aritmetik ortalamanın hesaplanarak A13
kolonuna yazıldığı görülecektir (İşlem yapılırken hangi hücre seçilmişse, değer oraya yazılır).
70
Şimdi de sırasıyla geometrik ortalama, mod, medyan ve standart sapma’nın hesaplanmasına ilişkin
uygulama yapılacaktır. Bunun için aşağıda da görüldüğü gibi, A kolonuna Örnek 3.4, C kolonuna Örnek
3.6, E kolonuna Örnek 3.1 ve G kolonuna da Sıra Sizde 3 verilerini giriniz. Aritmetik ortalamanın
hesaplanmasında olduğu gibi yine “Formüller-Tüm İşlevler ve İstatistiksel” menüsü tıklanarak karşımıza
çıkan pencerede geometrik ortalama için “GEOORT”, mod için “ENÇOK_OLAN”, medyan için
“ORTANCA” ve standart sapma için de “STDSAPMAS” tıklanarak işlemler yaptırılır. Bu işlemlerin
sonucunu da ayrıntılı olarak aşağıda verilmiştir.
71
Özet
Verilerin tek bir değerle ifade edilebilmelerini
sağlayan ortalamalar, verilerin nasıl dağıldıkları
konusunda yeterince fikir veremezler. Bazı
serilerde veriler birbirine yakın yani, homojen
olabilirler. Bazen de gözlem değerleri
birbirinden oldukça farklı dağılmış yani,
heterojen olabilirler. İşte verilerin nasıl bir
dağılım gösterdiklerini belirleyebilmek için de
değişkenlik ölçülerine gereksinim vardır.
İstatistikte verilerin nasıl bir değişkenlik
gösterdiğini belirleyebilmek için kullanılan ve
yine ilk akla gelen ölçü ise standart sapmadır.
Ancak standart sapma verilerin büyüklüğünden
etkilenen bir ölçüdür. Yani büyük rakamlardan
oluşan bir serinin standart sapması, küçük
rakamlardan
oluşan
serinin
standart
sapmasından daima daha büyüktür. Dolayısıyla
terim büyüklükleri veya ölçü birimleri farklı
serilerin
karşılaştırılmasında
kullanılacak
değişkenlik ölçüsü ise değişim katsayısıdır.
Bir araştırmada toplanan verilerin tek bir
değerle gösterilmesi, hem verilerin özetlenmesi
açısından hem de daha ileri analizlerin
kullanılabilmesi için oldukça önemlidir.
Verilerin tek bir değerle gösterilebildiği bu
ölçütlere ortalama denir.
Serideki tüm verileri dahil ederek hesaplanan
ortalamalar duyarlı, verilerin tamamı dahil
edilmeden hesaplanan ortalamalar ise duyarlı
olmayan ortalamalar olarak adlandırılır.
Duyarlı ortalamalardan aritmetik ortalama ise,
ortalama denilince akla gelen ilk ortalamadır.
Ancak bazı durumlarda aritmetik ortalamanın
hesaplanması mümkün olmayabilir. Böyle
durumlarda
ise
duyarlı
ortalamalardan
geometrik ortalama veya duyarlı olmayan
ortalamalardan mod ve medyan hesaplanabilir.
Dolayısıyla aritmetik ortalama çok sık
kullanılan bir ortalama olmasına rağmen, özel
durumlarda uygun ortalamaların kullanılması
gerekir.
Eğer elimizde farklı zamanlarda veya farklı
yerlerde elde edilmiş deney sonuçları varsa ve
bunlar da ortalama veya oran şeklinde ise,
bunların ortalamaları için tartılı aritmetik
ortalama kullanılacaktır.
72
Kendimizi Sınayalım
1. 6 çocuğun vücut ağılığı 30, 32, 28, 34, 24
ve 32 olarak belirlenmiştir. Aritmetik
ortalamasının değeri aşağıdakilerden hangisidir?
5. 3. sorudaki veriler için
aşağıdakilerden hangisidir?
a. 28
b. 127,37
b. 30
c. 98,56
c. 32
d. 114,44
d. 34
e. 102,65
e. 24
6. 3. sorudaki veriler için varyans değeri
aşağıdakilerden hangisidir?
a. 135,46
a. 10,67
b. 165,86
b. 9,26
c. 19,92
c. 6,78
d. 17,65
d. 5,52
e. 142,10
e. 3,27
7. Bir hafta boyunca A hastanesi acil servisine
başvuran hasta sayıları aşağıdaki gibi elde
edilmiştir:
Kişi Sayısı
95-100
10
100-110
14
110-120
18
120-130
13
130-140
8
değeri
a. 111,56
2. 1. sorudaki veriler için standart sapmanın
değeri aşağıdakilerden hangisidir?
Gruplar
mod
20, 28, 17, 25, 12, 23, 15
Bu veriler için medyan değeri aşağıdakilerden
hangisidir?
a. 25
b. 15
3. Yukarıda verilen gruplandırılmış seri için
aritmetik ortalama değeri aşağıdakilerden
hangisidir?
c. 17
d. 23
a. 114,60
e. 20
b. 120,87
8. 7. Sorudaki veriler için değişim
katsayısının değeri aşağıdakilerden hangisidir?
c. 105,45
a. 0,13
d. 130,58
b. 0,52
e. 118,79
c. 0,44
4. 3. Sorudaki veriler için medyan değeri
aşağıdakilerden hangisidir?
d. 0,26
e. 0,72
a. 121,44
b. 132,42
c. 114,17
d. 118,26
e. 125,19
73
9. Aşağıdakilerden
hangisi
varyansının simgesidir?
ana
kütle
Kendimizi Sınayalım Yanıt
Anahtarı
a. s
b. s
c.
1. b Yanıtınız yanlış ise “aritmetik ortalama”
başlıklı konuyu yeniden gözden geçiriniz.
2
2. e Yanıtınız yanlış ise “standart sapma”
başlıklı konuyu yeniden gözden geçiriniz.

d. 
e.

3. a Yanıtınız yanlış ise “aritmetik ortalama”
başlıklı konuyu yeniden gözden geçiriniz.
2
4. c Yanıtınız yanlış ise “Medyan” başlıklı
konuyu yeniden gözden geçiriniz.
10. Bir istatistik serisinde diğer verilerden aşırı
büyük bir değer varsa duyarlı ortalamalardan
hangisi hesaplanmalıdır?
5. d Yanıtınız yanlış ise “Mod” başlıklı konuyu
yeniden gözden geçiriniz.
a. Aritmetik ortalama
6. e Yanıtınız yanlış ise “Standart sapma”
başlıklı konuyu yeniden gözden geçiriniz.
b. Geometrik ortalama
c. Tartılı aritmetik ortalama
7. a Yanıtınız yanlış ise “Medyan” başlıklı
konuyu yeniden gözden geçiriniz.
d. Mod
e. Medyan
8. d Yanıtınız yanlış ise “Değişim katsayısı”
başlıklı konuyu yeniden gözden geçiriniz.
9. e Yanıtınız yanlış ise “Standart sapma”
başlıklı konuyu yeniden gözden geçiriniz.
10. b
Yanıtınız yanlış ise “Geometrik
ortalama” başlıklı konuyu yeniden gözden
geçiriniz.
74
Sıra Sizde Yanıt Anahtarı
Yararlanılan Kaynaklar
Sıra Sizde 1
Çömlekçi, N. (1998). Temel İstatistik İlke ve
Teknikleri, Bilim Teknik Yayınevi, Eskişehir.
xi
ni
ln xi
5
3
1,61
4,83
7
7
1,95
13,65
10
10
2,3
23
13
4
2,56
10,24
500
1
6,21
6,21
Toplam
ni ln xi
Devore, J. ve Peck, R. (1990), Introductory
Statistics, West.
Freund, J.E. ve Simon, G.A. (1 997), Modern
Elementary Statistics, Prentice Hall, New
Jersey.
Özdamar, (1985). Biyoistatistik, Bilim Teknik
Yayınevi, Eskişehir.
57,93
Serper, Ö. (2004). Uygulamalı İstatistik 1,
Ezgi Kitabevi, Bursa.
 ni ln xi )
57,93
ni
2,32

25
G
.O e
 e
e
10,18
(
Sümbüloğlu, K. ve Sümbüloğlu. V. (2002),
Biyoistatistik, Hatipoğlu Yayınevi, Ankara.
Sıra Sizde 2
Örnek 3.2’deki veriler için en yüksek frekans 7
olduğuna göre, aranılan mod değeri 135
olacaktır.
Sıra Sizde 3
( xi  x )2
2
54
(54-42) =144
43
(43-42) =
2
1
2
30
(30-42) =144
34
(34-42) = 64
48
(48-42) = 36
35
(35-42) = 49
53
(53-42) =121
39
(39-42) =
2
2
2
2
2
336
9
568
n
x

x
i
336
 42
8

n
i 1
)
 ( x  X
2
s
i
n
568

8

71 8, 43
75
4
Amaçlarımız
Bu üniteyi tamamladıktan sonra;
Nüfusun yapısı ve dinamiklerini tanımlayabilecek,
Sağlık alanında, nüfus ile ilgili verilerin önemini açıklayabilecek,
Sağlık alanında sıklıkla kullanılan istatistiksel yöntemleri tanımlayarak, hesaplayabilecek,
Hastanelerdeki sağlık hizmetlerinin değerlendirilmesini yapabilecek,
İstatistiklere ait formülleri belirleyerek, verilen istatistikleri hesaplayabilecek
bilgi ve becerilerine sahip olabilirsiniz.
Anahtar Kavramlar
Nüfus ve yapısı
Mortalite
Hız
Odds Oranı
Oran
Göreli risk
Nüfus piramidi
Yaşam tablosu
İnsidans, prevelans
İçindekiler

Giriş

Nüfusun yapısı ve özellikleri

Hız ve oran

Hastalıklarla ilgili istatistikler

Koruyucu sağlık hizmetleri

Sunulan sağlık hizmetlerinin düzeyini gösteren ölçütler

Yaşam tabloları

Hastalık ve ölüm nedenlerinin uluslararası sınıflandırılması

Hastanedeki sağlık hizmetlerinin değerlendirilmesi
76
Sağlık Alanına Özel
İstatistiksel Yöntemler
GİRİŞ
Bu bölümde, toplumun nüfus yapısı, bu yapıyı etkileyen faktörler tanımlanacak ve sıklıkla kullanılan
sağlık alanına özel istatistiksel teknikler hakkında bilgi verilecektir. Çözümlü örnekler aracılığı ile
konuların kavranması sağlanacaktır.
Sağlık alanında kullanılan istatistiksel yöntemlerin temel amacı;

Bölgenin uzun, orta ve kısa vadede sağlıkla ilgili hizmet planlamasını yapmak,

Sağlık kurumlarındaki tedavi hizmetlerinin aksamadan yürümesini sağlamak, doktor ve personel
sayısını düzenlemek,

Sağlık kurumlarındaki hastaların bakım ve tedavi hizmetlerinin sürekliliğini sağlamak, toplum
dinamiklerine göre yeniden düzenlemek ve değerlendirmek,

Sağlık kurumlarında verilen hizmetin kalitesini arttırmak,

Belirli aralıklarla, doktor, yardımcı sağlık personeli, hasta ve hasta yakınlarının bilgi, tutum ve
davranışlarını araştırarak sağlık hizmetlerinin en iyi şekilde yürütülmesini sağlamak,

Yapılacak olan bilimsel çalışmalara en doğru bilgiyi sağlamak, bu çalışmalara yol göstermek,

Sağlık çalışanlarının, kendi alanlarında
değerlendirebilmesini sağlamaktır.
yayınlanan
güncel
bilimsel
çalışmaları
Başka bir tanımla sağlık istatistiği; sağlık hizmetlerinde, sağlık hizmetlerinin planlanmasında, sağlıkla
ilgili bilimsel araştırmaların yürütülmesinde, hizmet göstergesi olarak, koruyucu sağlık hizmetlerinde,
tedavi edici sağlık hizmetlerinde, toplumun sağlık düzeyinin belirlenmesinde, yükseltilmesinde ve
toplumda sağlık alanındaki değişimlerin incelenmesinde kullanılmaktadır.
İlgilenilen bölgenin coğrafi, sosyal, ekonomik, demografik ve sağlık açısından göstergelerini
belirlemek için sağlık örgütünün hangi tür verilere gereksinim duyacağı ve toplanan verilerin içeriğinin
ne olacağı, bu sağlık sisteminin yönetim biçimine, sağlıkta ulaşılması istenen hedeflere ve içeriğine
bağlıdır. Sağlık enformasyon sistemlerinin etkin ve yaygın olmadığı bir ülke ya da bölgede iyi bir sağlık
planlaması ve sağlığın iyi bir şekilde yönetilmesinden sözetmek oldukça zordur.
NÜFUSUN YAPISI VE ÖZELLİKLERİ
Hastane yöneticileri hizmet verecekleri bölgenin nüfus yapısını iyi bilmeli ve ona göre vereceği sağlık
hizmetlerini planlama yoluna gitmelidir. Bir bölgedeki sağlık ile ilgili hizmetlerin örgütlenmesi, tedavi
hizmetlerinin yürütmesi ve zaman içerisinde yeniden düzenlenmesi çalışmalarında bölgenin nüfusu ve
nüfusun yapısal özelliklerine öncelikle başvurulmaktadır. Günümüzde nüfus yapısını ayrıntılı olarak
incelemeden yapılacak olan hizmet planlamasının başarılı olması neredeyse imkânsızdır. Buna ilave
olarak nüfus; bölgeye ait hız ve oranların hesaplanılmasında kullanılan önemli bir veridir. Bu bakımdan
nüfus ve nüfusun yapısı sağlık yöneticilerinin, planlayıcıların, ekonomistlerin ve istatistikçilerin en çok
yararlandıkları veridir.
77
Nüfus, belirli bir zamanda sınırları belirlenmiş bir bölgede yaşayan insan sayısı olarak tanımlanabilir.
Bir ülkenin ya da bölgenin sağlık ile ilgili istatistiklerinin, hız ve oranlarının hesaplanmasında bölgenin
nüfusu ve nüfusun yapısal özelliklerinden yararlanılmaktadır. Bölgede belirli bir zamandaki yaşayan
bireylerin sayılarak çeşitli özelliklerinin kaydedilmesi işlemine nüfus sayımı denir. Nüfus sayımları iki
farklı yöntemle yapılmaktadır. Bunlar;
De facto, sayım anında bireylerin bulundukları bölge içerisinde sayılmasıdır.
De jure, sayım anında bireylerin bulundukları bölge içerisinde değil sürekli oturma yerlerindeki
nüfusta sayılması yöntemidir.
Nüfus sayımları yoluyla belirli bir zamanda, bir yerleşim birimindeki insan
grubunun demografik özellikleri saptanmaya çalışılır. Bu sayımların amacı, erkek-kadın nüfusu
belirlemek, eğitim durumunu belirlemek, nüfusun yaşa göre dağılımını belirlemek vb. olarak sayılabilir.
Ülkemizde, nüfusumuzun sayı ve demografik özelliklerini belirlemek amacıyla Cumhuriyet’in
kuruluşundan günümüze kadar pek çok nüfus sayımı yapılmıştır. Birincisi 1927 yılında, ikincisi 1935
yılında ve bu tarihten sonra 1990'a kadar her 5 yılda bir aksatılmadan nüfus sayımı tekrarlanmıştır.
1990'dan sonra ise nüfus sayımı 2000 yılında yapılmış ve her 10 yılda yapılmasına karar verilmiştir. Bu
arada 1997 yılında bir sayım yapılmıştır. Fakat bu sayım nüfus tesbiti olarak adlandırılmıştır. Seçmen
kütüklerinin güncelleştirilmesine yönelik bu sayımda, yerleşim yerleri itibariyle ikametgâha dayalı sayısal
sonuçlar elde edilmiş, sosyal ve ekonomik bilgiler bu sayımda yer almamıştır. Ülkemizde yapılan nüfus
sayımlarına ait tarihler, nüfusumuz ve artış hızları Tablo 4.1’de görülmektedir. 2000 yılı sonuçlarındaki
yıllık nüfus artış hızı rakamı 1990-2000 dönemine aittir.
Tablo 4.1: Yıllara ilişkin nüfusumuz ve artış hızları
YILLAR
NÜFUS
Artış Hızı (binde)
20.10.1927
13.648.270
-
20.10.1935
16.158.018
21,10
20.10.1940
21.10.1945
17.820.950
18.790.174
19,59
10,59
22.10.1950
20.947.188
21,73
23.10.1955
24.064.763
27,75
23.10.1960
27.754.820
28,53
24.10.1965
31.391.421
24,63
25.10.1970
26.10.1975
35.605.176
40.347.719
25,19
25,01
12.10.1980
44.736.957
20,65
20.10.1985
50.664.458
24,88
21.10.1990
56.473.035
21,71
30.11.1997
62.865.574
15,08
22.10.2000
67.803.927
18,28
2007(1)
2008(1)
70.586.256
71.517.100
13,10
2009(1)
72.561.312
14,50
(1)
73.722.988
15,88
2010
(1)
Adrese Dayalı Nüfus Kayıt Sistemi (ADNKS)
78
Sağlık kurumu yöneticisinin hizmet verdiği bölgeye ait bir takım düzenlemeleri yapabilmesi için
bölgeye ait nüfus yapısı hakkında öncelikle bilmesi gereken tanım, açıklamalar ve hesaplamalar aşağıda
verilmiştir.
Yıl ortası nüfus (YON)
Bir bölgenin belirli bir yıl içindeki 30 Haziran ya da 1 Temmuz tarihindeki nüfusudur. 3 farklı şekilde
hesaplanır.
ı
şı
ü
ı
ü
(
)
(
)
Eğer sadece her yılın başında nüfus sayımı yapılıyor ise yıl ortası nüfus,
Ülkelerin veya bölgelerin nüfusları, belli yaş gruplarındaki insanların yoğunluklarına göre farklı
isimlerle anılmaktadır. Eğer, 65 ve daha üzeri yaştaki insanlar (65+), toplumun %10’undan fazla ise bu
tür toplumların nüfus yapısına yaşlı nüfus adı verilmektedir. Endüstriyel toplumların nüfus yapıları yaşlı
nüfusa örnek olarak verilebilir.
15 yaş altı nüfusun, genel nüfus içerisindeki oranı yüksek ise bu tür toplumların nüfus yapısına genç
nüfus adı verilir. Özellikle bu oran %40’ın üzerinde ise bu tür toplumlara genç nüfuslu toplumlar denir.
Genellikle geri kalmış ülkeler ya da bölgelerin nüfusları bu özelliği taşımaktadır.
0-14 yaş nüfusu tüm topluma oranlandığında %30-40, 15-64 yaş nüfusu %50-60, 65+ yaş nüfusu ise
%5-9 oranlarında yoğunluğa sahip olan bölgelere orta yaşlı nüfus adı verilir. Kalkınmakta olan ülkelerin
nüfus yapıları bu formdadır.
Sağlık kurumlarının yöneticileri ve planlayıcılar nüfusun genel yapısını bilmeli ve faaliyetlerini
toplumun nüfus yapısı doğrultusunda şekillendirmelidir. Nüfusun yapısını etkileyen başlıca faktörler;
doğumlar, ölümler, göçler, evlenme ve boşanmalardır. Doğumlar ve ölümler genellikle nüfusun sayısını,
içe ve dışa göçler hem nüfusun sayısını hem de yapısını etkiler. Evlenmeler ve boşanmalar ise nüfusun
medeni durum yapısındaki değişikliğe, dolayısıyla da doğumlarda artış ya da azalışa neden olur. Bu
olaylar kısaca nüfus hareketleri olarak isimlendirilmektedir.
Nüfusla İlgili Hız ve Oranlar
Sağlık kurumu yönetcisi, nüfusun bölgedeki dağılımı, hizmet verilen bölgedeki nüfusun yoğunluğunu,
kadın- erkek oranını, bölgedeki nüfus artış hızını, nüfusun yaşa ve cinsiyete göre dağılımını bilmek
zorundadır. Sağlık hizmeti verilecek olan hedef toplumun nüfus yapısı ve özellikleri bilinmiyorsa, yapılan
hizmetin etkinliğinden sözetmekte mümkün olamaz. Bu nedenle bölgenin nüfus yapısına göre yönetici,
kurumunu organize etmeli, hizmet vereceği hedef toplumu tanımalı, toplumdaki hastalık profillerini
çıkarmalı, personel eksikliklerini tamamlamalı ve verilecek olan sağlık hizmetini hasta kabulünden,
hastanın tedavisi sonlanıncaya kadar planlamalıdır. Aşağıda bazı hız ve oranlara ait tanım ve
hesaplamalar verilmiştir
79
Nüfus yoğunluğu
Bir bölgedeki kilometre kare başına düşen nüfusu gösteren bir ölçüdür. Aşağıdaki biçimde hesaplanır.
(
)
Nüfus Artış Hızı (NAH)
Bir bölgenin nüfusunda bir yıl içerisindeki doğumlar ve ölümlere bağlı olarak nasıl bir artış ya da azalışın
olduğunu ifade eden bir kavramdır. Aşağıdaki gibi hesaplanmaktadır.
(
)
[
]
Cinsellik Oranı (CO)
Bölge nüfusunda her 100 kadına düşen erkek sayısını belirleyen bir ölçüdür. Cinsellik oranı aşağıdaki
gibi hesaplamaktadır.
(
)
Nüfus Piramidi
Nüfus pramidi, nüfusun yaş ve cinsiyet yapısını incelemeyi sağlayan grafiksel bir yöntemdir. Aynı
zamanda nüfusun yaş ve cinsiyet yapısını bir zaman dilimi içerisinde değerlendirme olanağı
sağlamaktadır. Bu grafiksel yöntemde nüfusun yaşa ve cinsiyete göre dağılımı beşerli yaş gruplarına göre
gösterilir. 0-4 yaş grubu tabanda, 90+ yaş grubu tavanda olacak şekilde artan beşli yaş grupları yukarıya
doğru orantılı olarak yatay dikdörtgen çubuklar dizilerek çizilmektedir. Farklı iki cinsiyete ait aynı yaş
grubundaki verileri, toplam nüfus içerisindeki yoğunluğunu da dikkate alarak karşılaştırma olanağı sağlar.
Nüfus pramitleri ülkelerin sosyo-ekonomik yapıları hakkında da önemli bilgiler vermektedir. Aşağıda
Şekil 4.1’de nüfus piramitlerine ilişkin bazı örnekler verilmiştir.
Geri kalmış
ülkeler
Gelişmekte olan
ülkeler
Gelişmiş
ülkeler
Sanayileşmiş
Ülkeler
Şekil 4.1: Nüfus pramitlerine ilişkin bazı örnekler
Seçilmiş bazı ülkelerin 2010 yılı nüfus piramitleri Şekil 4.2’de verilmiştir. (Kaynak: U.S. Census
Bureau http://www.census.gov)
80
Şekil 4.2: Seçilmiş bazı ülkelerin 2010 yılı nüfus piramitleri
TÜİK verilerine göre, Türkiye’nin kadın ve erkek nüfusundan ve yaş gruplarından yararlanılarak
çizilen 2007 yılına ait nüfus piramidi Şekil 4.3’te, 2010 yıllarına ait nüfus piramidi ise Şekil 4.4’te
verilmiştir. Üç yıl gibi kısa bir sürede, nüfustaki değişim karşılaştırmalı olarak bu piramitlerden
görülmektedir.
81
90+
85-89
80-84
75-79
70-74
65-69
60-64
55-59
50-54
45-49
40-44
35-39
30-34
25-29
20-24
15-19
10-14
5-9
0-4
-4000000
90+
85-89
80-84
75-79
70-74
65-69
60-64
55-59
50-54
45-49
40-44
35-39
30-34
25-29
20-24
15-19
10-14
5-9
0-4
-4000000
Kadın
Erkek
-2000000
0
2000000
Şekil 4.3: Türkiye’nin 2007 yılına ait nüfus pramidi
4000000
Kadın
Erkek
-2000000
0
2000000
Şekil 4.4: Türkiye’nin 2010 yılına ait nüfus pramidi
82
4000000
HIZ VE ORAN
Birçok alanda olduğu gibi sağlık alanında da bölgelere ait nüfus profillerinin belirlenmesi aşamasında hız,
oran ve diğer istatistiklerden sıklıkla yararlanılmaktadır. Oran (proportion) ve hız (rate) bir bölgede
meydana gelen olayların yüzde (%), binde ( ), onbinde,… gibi değerlerle sunulmasını sağlayan
göstergelerdir. Hesaplanılan hız ve oranlar sağlıkta verilen hizmetlerin kalitesi hakkında bilgiler
vermekte, standartlar yardımıyla da önceki yıllara göre kurumun kendini değerlendirmesine veya
kurumlararası karşılaştırmalara olanak sağlamaktadır. Sayılarla karşılaştırma yerine hız ve oranlarla
yapılan karşılaştırmalar sağlık kurumlarının yöneticilerine pek çok yönden avantajlar sağlamaktadır.
Hız, sağlık olaylarının belirli bir bölgede görülme sıklığını belirlemek amacıyla kullanılır. Olayın
görülme sayısının, bölgedeki tüm nüfusa bölünmesiyle elde edilir. (belli bir zaman diliminde ölenlerin
sayısının (a), ölen ve yaşayanların (b) toplamına oranıdır (a/a+b)). Örnek olarak, “2011 yılında trafik
kazalarında ölenlerin toplam nüfusa (kazalarda ölenlerde dahil tüm nüfus) bölünmesi” verilebilir.
Oran, bir olayının diğerine göre ne boyutta olduğunu ifade eder. Bir miktarın kendi bütünü
içerisindeki payı olarakta tanımlanabilir. Hasta sayısının sağlam nüfusa oranı, 15-49 yaş grubundaki
sigara kullanan erkeklerin kullanmayanlara oranı ya da kontrol yöntemi olarak RİA (rahim içi araç)
kullanan kadınların, kullanmayan kadınlara oranıdır (a/b).
Sağlık kurumu yöneticileri ve sağlık planlayıcıları bölgenin demografik yapısını belli aralıklarla takip
etmelidir. Toplum dinamiklerinin ne yönde değiştiğini saptamalı ona göre kurumlarını yönetmelidirler.
Dünya’da, sağlık alanına ilişkin demografik göstergeler, nüfus, evlenmeler, boşanmalar, doğum, ölüm ve
hastalıklara göre benzer şekillerde hesaplanmaktadır.
Sağlık hizmetlerinin değerlendirilmesinde sıklıkla kullanılan hız ve oranlar aşağıda açıklanmıştır.
Evlenmeler
Evlenme; Türk Medeni Kanunu’na göre evlenmeye ehil erkek ve kadının, yetkili kanuni merci önünde
yapmış oldukları çift taraflı bir akittir. Bölgede olan evlenmelerin sayısı ve evlenen çiftlerin özellikleri
hakkındaki veriler, ana-çocuk sağlığı ve aile planlaması hizmetlerinin örgütlenmesi, yürütümü ve yeniden
düzenlenmesi aşamalarının planlanmasında kullanılır. Evlenmelerle ilgili olarak evlenme akdinin
yapıldığı il, ilçe, bucak veya köy verileri derlenmektedir. Bunun yanında evlenen kadın ve erkeğin;
doğum yeri ve yılı, uyruğu, ana dili, dini, eğitimi, evlenmeden önceki medeni durumu, kaçıncı evliliği
olduğu, önceki evliliklerinden olup da bakmakla yükümlü olduğu çocuk sayısı, evlenmeden önceki daimi
oturduğu yer, mesleği gibi bilgiler toplanmaktadır. Evlenmelerle ilgili veri kaynakları ise TÜİK’in
yayınladığı Evlenme İstatistikleri, Türkiye nüfus araştırmaları ve özel araştırmalardır.
Evlenme verilerinin değerlendirilmesinde evlenenlerin; cinsiyete göre yaş ortalamaları, oturulan
bölgeye göre yaş ortalamaları, cinsiyete göre eğitim düzeyleri, evlenme sayıları, evlenmeden önceki
medeni durumları, oturdukları illere göre dağılımı, mesleklere göre dağılımı, önceki evliliklerindeki
çocuk sayıları, evlendikleri yaşlara göre dağılımları, din ve ana dillerine göre dağılımları, uyruklarına
göre dağılımı hesaplanabilmektedir. 2010 yılı TÜİK verilerine göre Türkiye’de yaş gruplarına göre damat
ve gelin sayıları Tablo 4.2’de verilmiştir.
Tablo 4.2: Türkiye’de 2010 yılında yaş gruplarına göre Damat ve Gelin sayıları
Damat
Gelin
16-19
14.824
134.874
20-24
163.791
212.923
25-29
237.474
132.952
30-34
91.054
45.817
35-39
30.276
19.409
40-44
13.729
9.326
Kaynak: (TÜİK, 2010, http://www.tuik.gov.tr)
83
45-49
9.237
6.057
50-54
6.326
3.675
55+
12.679
4.470
Tablo 4.2 verilerinden yararlanılarak çizilen Şekil 4.5 incelenecek olursa, yaş grupları ile damat ve
gelin sayıları arasındaki ilişki daha iyi anlaşılabilir. Grafikte, bayanların büyük çoğunluğunun 20-24 yaş
grubunda, erkeklerin ise büyük çoğunluğunun 25-29 yaş grubunda evlenmiş oldukları açıkça
görülmektedir.
Damat
Gelin
400
350
300
250
200
150
100
50
0
16-19
20-24
25-29
30-34
35-39
40-44
45-49
50-54
55+
Şekil 4.5: 2010 yılında yaş gruplarına göre damat ve gelin sayıları
Sağlık kurumları yöneticisi hizmet verdiği toplumdaki evlenmelerle ilgili olarak ana ve çocuk sağlığı,
aile planlaması, aşılama hizmetleri vb. sağlık hizmetlerinide düzenlemelidir.
Evlenmelerle İlgili Hız ve Oranlar
Evlenmelerle ilgili olarak sıklıkla kullanılan hızlar aşağıdaki gibi sıralanabilir.

Genel Evlenme Hızı

Evlenelebilecek Yaşa Özel Evlenme Hızı

Kadınlara Özel Evlenme Hızı

Erkeklere Özel Evlenme Hızı
Genel Evlenme Hızı (GEH)
Belirli bir yıl içerisindeki evlenme sayısının o yıla ait yıl ortası nüfusa bölünmesi ile hesaplanır. Binde
olarak yorumlanır.
Örnek 4.1:
Bir bölgede 2010 yılı içerisinde 178 evlenme gerçekleşmiştir. Bu bölgenin yıl ortası nüfusu ise
327.147’dir. Eldeki bilgilere göre genel evlenme hızını hesaplayınız.
(
Bölgenin 2010 yılı genel evlenme hızı
’tür
84
)
Erkeklere Özel Evlenme Hızı (EÖEH)
Belirli bir yıl içerisindeki evlenen erkek sayısının o yıla ait evlenebilecek yaşta olan erkeklerin yıl ortası
nüfusuna bölünmesi ile hesaplanır. Binde olarak yorumlanır.
Kadınlara Özel Evlenme Hızı (KÖEH)
Belirli bir yıl içerisindeki evlenen kadın sayısının o yıla ait evlenebilecek yaşta olan kadınların yıl ortası
nüfusuna bölünmesi ile hesaplanır. Binde olarak yorumlanır.
Örnek 4.2:
Bir bölgede 2010 yılı içerisinde evlenen kadın sayısı 347’dir. 2010 yılı evlenebilecek yaştaki kadın yıl
ortası nüfusu 6.219 ise kadınlara özel evlenme hızını hesaplayınız.
Bölgenin 2010 yılı kadınlara özel evlenme oranı
’dir.
Evlenilebilecek Yaşa Özel Evlenme Hızı (EYÖEH)
Belirli bir yıl içerisindeki evlenme sayısının o yıla ait evlenebilecek yaşta olan erkek ve kadın yıl ortası
nüfusuna bölünmesi ile hesaplanır. Binde olarak yorumlanır.
Bir bölgede 2011 yılı içerisinde 422 evlenme gerçekleşmiştir. Bu
bölgenin Genel Evlenme Hızı
olduğuna göre yıl ortası nüfusu kaçtır?
Boşanmalar
Boşanma, evlenmenin yasal olarak sona erdirilmesidir. Diğer bir ifade ile erkek ile kadının, yeniden
evlenmelerine hukuki bir engel kalmayacak şekilde hukuki bir kararla evliliklerini tamamen sona
erdirmeleridir.
Boşanmalara ilişkin veriler, Medeni Kanun'un 4 Ekim 1926 tarihinde yürürlüğe girmesinden sonra
Türkiye geneli için toplanmaktadır. Boşanmalara ait bilgiler 2003 yılına kadar Türkiye İstatistik Kurumu
tarafından asliye hukuk ve aile mahkemeleri kanalıyla üçer aylık dönemler halinde derlenmekteydi.
İçişleri Bakanlığı Nüfus ve Vatandaşlık İşleri Genel Müdürlüğü ile Türkiye İstatistik Kurumu arasında 7
Şubat 2006 tarihinde yapılan bir protokol ile 2003 yılından sonra boşanmalara ait bilgiler, Merkezi Nüfus
İdaresi Sistemi (MERNİS) veri tabanından elde edilerek yayımlanmaya başlanmıştır.
Bölgede olan boşanmaların sayısı ve boşanan çiftlerin belirli özellikleri hakkında toplanan verilerden,
Ana-çocuk sağlığı, aile planlaması hizmetlerinin örgütlenmesi, yürütülmesi ve yeniden yapılandırılarak
düzenlenmesi aşamalarının planlanmasında yararlanılır. Ayrıca sağlık kurumu yöneticisi boşanmaların sık
olduğu bir bölgede, boşanan çiftlerin ve çocuklarının ruh-sinir hastalıkları tedavilerinin planlanması ve
85
düzenlenmesi, psikolojik danışmanlıkların arttırılması ve sağlıklı birey, aile ve toplum yapısının
oluşturulması, korunması çabalarını desteklemelidir.
Boşanmalarla ilgili olarak birçok veri toplanmaktadır. Bunlar; boşanma davasını açan taraf, boşanma
nedeni, kadın ve erkeğin doğum tarihi, eğitim durumu ve mesleği, evlenme tarihi, boşanma davasının
açıldığı tarih, boşanma davasının sonuçlandığı tarih, bu evlilik içinde doğan çocuk sayısı gibi verilerdir.
Sonlanan her boşanma davası için yetkili mahkemenin doldurduğu ve savcılıkça altı ayda bir TÜİK’e
gönderilen Boşanma İstatistik Formu ve bu formların derlenmesiyle her yıl TÜİK tarafından yayınlanan
Boşanma İstatistikleri isimli yayın konu ile ilgili önemli bir veri kaynağıdır. Buna ilaveten, özel
araştırmalar ve nüfus sayımı yoluyla da boşanmalar hakkında veri toplanabilmektedir.
Boşanmalara ilişkin verilerin analiz edilmesinde, yıllara göre boşanma sayıları ve oranları, illere göre
dağılımı, yaşlara göre dağılımı, cinsiyete göre dağılımı, boşanma nedenlerine göre dağılımı, evlilik
süresine göre dağılımı, davanın süresine göre dağılımı, çocuk sayısına göre dağılımı, kadın-erkek
yaşlarına göre dağılımı, davayı açan tarafa göre dağılımı, eğitim düzeyine göre dağılımı, mesleklere göre
dağılımı gibi istatistikler için hız ve oranlar yardımıyla hesaplanmaktadır.
Türkiye’de 2010 yılında dava süresine göre boşanma sayıları Tablo 4.3’te verilmiştir. Bu verilere göre
2010 yılında toplam 118.568 boşanma olmuştur.
Tablo 4.3: Türkiye’de 2010 yılında dava sürelerine göre boşanma sayılarının dağılımı
Dava Süresi (Ay)
<2
2-4
5-8
9-12
13-18
19-24
25-35
36 +
Bilinmeyen
Toplam
Sayı
34.738
29.254
20.114
10.754
8.255
4.628
5.910
3.560
1.355
118.568
Yüzde
29,3
24,7
17,0
9,1
7,0
3,9
5,0
3,0
1,1
100,0
Kaynak: TÜİK, 2011
Türkiye’de 2010 yılında nedenine göre boşanma sayıları Tablo 4.4’te evlilik süresine göre boşanmalar
ise Tablo 4.5’te verilmiştir.
Tablo 4.4: Türkiye’de 2010 yılında nedenine göre boşanma sayılarının dağılımı
Sebep
Geçimsizlik
Terk
Zina
Akıl sağlığı
Cürüm ve haysiyetsizlik
Cana kast ve pek fena muamele
Diğer
Bilinmeyen
Toplam
Kaynak: TÜİK, 2011
86
Sayı
113.039
317
90
42
37
32
1.414
3.597
118.568
Yüzde
95,3
,3
,1
,0
,0
,0
1,2
3,0
100,0
Tablo 4.5: Türkiye’de 2010 yılında evlilik süresine göre boşanma sayıları
Evlilik süresi
Sayı
3.967
43.310
24.940
17.528
28.433
390
118.568
1 yıldan az
1-5 yıl
6-10 yıl
11-15 yıl
16+ yıl
Bilinmeyen
Toplam
Yüzde
3,3
36,5
21,0
14,8
24,0
,3
100,0
Kaynak: TÜİK , 2011
Boşanmalar için sıklıkla kullanılan hız ve oranlar aşağıda tanımlanmış ve hesaplamaları hakkında
bilgiler verilmiştir.
Boşanmalarla İlgili Hız ve Oranlar
Kaba Boşanma Hızı (KBH)
Belirli bir yıl içerisinde olan boşanma sayısının o yıla ait yıl ortası nüfusa bölünmesi ile hesaplanır. Binde
olarak ifade edilir. Aşağıdaki şekilde hesaplanır.
2007-2010 yılları arasında TÜİK verilerine göre Türkiye’deki kaba boşanma hızları Tablo 6’da
verilmiştir.
Tablo 4.6: 2007-2010 yılları için Kaba Boşanma Hızları
YIL
2007
2008
2009
2010
HIZ (‰)
1,34
1,40
1,58
1,62
Kaynak: TÜİK, 2011
Bir bölgede 2011 yılı içerisinde toplam 4.214 boşanma olmuştur.
Anılan yıla ait bölgenin yıl ortası nüfusu 2.417.813 olduğuna göre Kaba Boşanma Hızını
hesaplayınız.
Genel Boşanma Hızı (GBH)
Belirli bir yıl içerisinde olan boşanma sayısının o yıla ait boşanabilir nüfusun yıl ortası nüfusuna (16 ve
yukarı yaş) bölünmesi ile hesaplanır. Binde olarak ifade edilir. Aşağıdaki şekilde hesaplanır.
87
Cinsiyete Özel Boşanma Hızı (CÖBH)
Bir yıl içerisinde olan boşanma sayısının o yıla ait kadın ya da erkek yıl ortası nüfusuna bölünmesi ile
elde edilir. Binde olarak ifade edilir. Aşağıdaki şekilde hesaplanır.
(
)
Yaşa ve Cinsiyete Özel Boşanma Hızı (YCÖBH)
Bir yıl içerisinde x yaşında ve c cinsiyetinde olan boşanma sayısının o yıla ait x yaş ve c cinsiyetindeki yıl
ortası nüfusa bölünmesi ile elde edilir. Binde olarak ifade edilir. Aşağıdaki şekilde hesaplanır.
(
)
Bunların dışında, evlilik süresine özel, yaşayan çocuk sayısına özel, mesleğe özel, eğitim düzeyine
özel, ilk evlilikte kadın ve kocasının yaşına özel vb. boşanma hızlarıda isteğe bağlı olarak
hesaplanılabilmektedir.
Doğumlar
Hastane hizmetlerinin değerlendirilmesinde doğumlar oldukça önemli bir yer tutmaktadır. Kurum
yöneticisi ya da sağlık planlayıcısı bilmelidir ki; özellikle, hastaneler, bölgeler ve ülkeler arası
karşılaştırmalarda bebek doğum ve ölüm istatistikleri en önemli sağlık göstergesidir. Bu amaçla bölgeye
sağlık hizmeti verecek yönetici ve personele öncelikle bazı tanım ve açıklamaları yapmak uygun
olacaktır.
Canlı Doğum, çocuğun doğduğu andan itibaren en az birkaç dakika yaşadığı, ağlama, nefes alma ve
hareket etme gibi hayat belirtileri gösterdiği doğumdur. Diğer bir ifade ile gebelik süresini dikkate
almadan anne vücudundan ayrıldığı anda soluk alan, kalp atımı, kordonda nabız ve çizgili adalelerin
hareketi gibi herhangi bir yaşam belirtisi gösteren gebelik sanucuna canlı doğum denir.
Fetüs Ölümü (Ölü doğum) ise gebelik süresini dikkate almadan anne vücudundan ayrıldığı anda soluk
almayan, kalp atımı, kordonda nabız ve çizgili adalelerin hareketi gibi herhangi bir yaşam belirtisi
göstermeyen gebelik sonucuna ölü doğum adı verilir.
Erken Fetüs Ölümü (Düşük) : Gebelik süresi 28 haftadan az olan fetüs ölümüdür.
Geç Fetüs Ölümü (Ölü Doğum) : Gebelik süresi 28 haftadan çok olan fetüs ölümüdür.
Prematüre Doğum: Gebelik süresi 37 haftadan (259 günden) az olan canlı doğum
Normal Doğum: Gebelik süresi 38-42 hafta arası olan canlı doğum
Sürmatüre Doğum (Gecikmiş doğum, sürmatürasyon): Gebelik süresi 42 haftadan fazla olan canlı
doğumdur.
Bebeğindoğduğu andaki ağırlığına göre de doğumlar 4’e ayrılmaktadır. Bunlar;
<1.500gr
 Çok düşük Doğum Ağırlığı
1.500-2.499gr
 Düşük Doğum Ağırlığı
2.500-4.250gr
 Normal Doğum Ağırlığı
>4.250gr
 Tosuncuk olarak adlandırılmaktadır.
88
Doğum sonrasında bebekle ilgili olarak, bebeğin doğum şekli, canlı doğum, ölü doğum, bebeğin
cinsiyeti, doğum ağırlığı, boyu ve baş çevresi, gebelik haftası, doğum yeri, doğuma yardım eden kişi vb
gibi veriler kayıt altına alınmaktadır. Bebeğin annesi ile ilgili olarak yaşı, gebelik sayısı, canlı doğum
sayısı, düşük sayısı, yaşayan çocuk sayısı, yaşları ve cinsiyetleri, ölen çocuk sayısı, ölüm yaşları ve
cinsiyetleri, evlilik süresi, eğitimi, mesleği veya işi, geliri, oturduğu bölge gibi veriler derlenmektedir.
Bebeğin babası ile ilgili olarak ise, yaşı, eğitimi, mesleği ve geliri gibi veriler toplanmaktadır.
Doğumlarla ilgili olarak birçok istatistik hesaplanmaktadır. Bunlardan en sık kullanılanlar; kaba
doğum hızı, genel doğurganlık hızı, evli kadınlara özel doğum hızı, yaşa özel doğurganlık hızı ve toplam
doğurganlık hızıdır.
Doğumlarla İlgili Hız ve Oranlar
Kaba Doğum Hızı (KDH)
Belirli bir yıl içindeki canlı doğum sayısının yıl ortası nüfusa bölünmesiyle elde edilir ve her bin nüfusa
kaç tane canlı doğum düştüğünü gösterir.
UNICEF’in 2005 yılına ait verilerine göre bazı ülkelerin Kaba doğum hızları (KDH) ve Kaba
ölüm hızları (KÖH) Tablo 4.7’de verilmiştir.
Tablo 4.7: 2005 yılına ait UNICEF verilerine göre seçilmiş bazı ülkelerin KDH ve KÖH değerleri
Seçilmiş bazı ülkeler
Japonya
İngiltere
Almanya
Türkiye
Hindistan
Pakistan
Etiyopya
Kaba Doğum Hızı
9
11
8
20
23
30
40
Kaba Ölüm Hızı
8
10
10
7
9
8
16
Örnek 4.3:
A ülkesinde, 2011 yılındaki canlı doğan bebek sayısı 1.380.000 olarak belirlenmiştir. Bu ülkenin 2011
yılına ait yıl ortası nüfusu ise 70.231.000’dir. Eldeki verilere göre ülkenin 2011 yılı kaba doğum hızını
hesaplayınız.
A ülkesinin 2011 yılı KDH ‰19,6 olarak elde edilmiştir.
Genel Doğurganlık Hızı (GDH)
Belirli bir yılda doğurgan çağda olan 16-49 yaş grubundaki her 1.000 kadına düşen canlı doğum sayısını
gösterir. Aşağıdaki şekilde hesaplanır.
89
Örnek 4.4:
2009 yılında bir ülkede 1.241.617 canlı doğum olmuştur. Bu ülkenin 16-49 yaş kadın yıl ortası nüfusu
1.9109.000’dur. Buna göre genel doğurganlık hızını hesaplayınız.
Ülkesinin 2009 yılı GDH ‰64,98 olarak elde edilmiştir.
Bir bölgenin 2011 yılına ait 16-49 yaş grubu kadın sayısı 816.411 ve
aynı bölgedeki canlı doğum sayısı 62.993’tür. Bölgenin 2011 yılı Genel Doğurganlık Hızını
hesaplayınız
Yaşa Özel Doğurganlık Hızı (YÖDH)
Belirli bir yaş ya da yaş grubundaki kadınların 1 yıl içinde yaptıkları canlı doğum sayısının o yaş
grubundaki kadın yıl ortası nüfusuna bölünmesiyle bulunur. Belirli bir yaş grubundaki her 1.000 kadın
başına düşen doğum sayısını gösterir.
Örnek 4.5:
Türkiye’de 2009 yılında, 30-34 yaş grubundaki kadınların yıl içinde yaptıkları canlı doğum sayısı
241.718 olarak saptanmıştır. 30-34 yaş grubu kadınların yıl ortası nüfusu 2.900.000’dir. Buna göre yaşa
özel doğurganlık hızını aşağıdaki şekilde hesaplanır. (örnek varsayımsaldır)
30-34 yaş grubundaki her 1000 kadına 83 canlı doğum düşmektedir.
Evli Kadınlara Özel Doğurganlık Hızı (EKÖDH)
Belirli bir yıl içindeki toplam canlı doğum sayısının 15-49 yaş arası evli kadın yıl ortası nüfusuna
bölünmesiyle bulunur. Aşağıdaki şekilde hesaplanır.
Toplam Doğurganlık (Fertilite) Hızı (TDH)
Toplam doğurganlık hızı, doğurgan çağdaki kadın nüfusun yaş yapısını dikkate almadan ülke yada
bölgenin doğurganlık düzeyi hakkında bilgi veren bir istatistiktir. TDH tek tek yaşa özel doğurdanlık
hızlarının toplamı alınarak bulunur ve doğurdan çağa giren bir kadının doğurganlık çağı sonuna kadar kaç
canlı doğum yapacağını belirtir. Türkiye’nin 2001-2009 yılları arasındaki doğumlarla ilgili bazı
istatistikleri Tablo 4.8’de verilmiştir.
90
Tablo 4.8: TÜİK (2011) verilerine göre 2001-2009 yılları arasındaki doğumlarla ilgili bazı istatistikler
Yıllar
2001
2002
2003
2004
2005
2006
2007
2008
2009
Doğum
sayıları
1.322.703
1.228.717
1.197.452
1.219.343
1.238.463
1.247.445
1.279.087
1.281.302
1.241.617
Kaba Doğum
Hızı
20,3
18,6
17,9
18,0
18,1
18,0
18,2
18,0
17,3
Genel doğurganlık
hızı
83,8
76,8
73,9
74,4
74,7
74,6
75,8
75,3
72,3
Toplam
doğurganlık hızı
2,37
2,17
2,09
2,10
2,12
2,11
2,15
2,14
2,06
Annenin yaş
ortalaması
26,2
26,3
26,5
26,5
26,5
26,6
26,7
26,8
27,0
Kaynak: TÜİK, 2011
Ölümler
Canlı doğum olayı gerçekleştikten sonra bireyin yaşamının herhangi bir anında yaşamsal fonksiyonların
tamamını yitirmesine ölüm adı verilir. Bir bölgedeki ölüm istatistikleri, sağlık hizmetlerinin
planlamasında ve bölgeler arasındaki karşılaştırmalarda kullanılan en önemli verilerdendir. Ölümler hem
sayısal hem de nitelik olarak değerlendirilebilir. Elde edilen veriler ile bölgedeki sorunlar ve öncelikler
saptanabilir, önlemler alınabilir, ileriye yönelik planlamalar yapılabilir.
Sağlık kurumu yöneticileri ve sağlık planlayıcıları, bir bölgedeki ölümlerin sayısını ve ölenlerin
özelliklerini tam ve doğru olarak bilmelidir.
Ölüm istatistiklerinin değerlendirilmesinde ne tür verilerin toplanacağı ve verilerin neleri kapsayacağı
sağlık hizmet sistemi ile ilgilidir. Bu veriler genellikle ölen kişinin yaşı, cinsiyeti, mesleği, medeni
durumu, eğitimi, oturduğu yer, ölüm tarihi, ölüm yeri, ölüm nedeni gibi verilerdir. Ayrıca, ölüme neden
olan sosyal, ekonomik ve kültürel nedenlerin dağılımlarıda araştırılmaktadır.
Ölüm olayları ile ilgili istatistiki bilgiler DİE tarafından 1931 yılından itibaren toplanmaya başlanmış
ve 1949 yılı sonuna kadar nüfusu en fazla olan 25 il merkezi, 1950-1957 yılları arasında bütün il
merkezleri, 1957 yılından itibaren il ve ilçe merkezlerinde tutulmaya başlamıştır. Ölümlerin ülkemizde en
geç 10 gün içerisinde ilgili nüfus idaresine bildirilmesi veya gönderilmesi yasal bir zorunluluktur. Ölüm
tutanaklarına ölenin nüfus cüzdanı da eklenmektedir. Ülkemizde il ve ilçe merkezlerinde olan ölümleri
incelememize yarayan tek kaynak TÜİK tarafından yayınlanan, ölüm istatistik formlarından
faydalanılarak oluşturulan “Ölüm İstatistikleri; il ve ilçe merkezleri” adlı yayındır. Bu yayında ölümün
meydana geldiği ay, cinsiyet, yaş, süreklii ikametgâh, ölüm nedeni, ölüm nedeninin saptandığı yer,
medeni durum, meslek grubu ve bebek ölümlerine ilişkin bilgiler yer almaktadır. Ülkemizedeki ölümlerle
ilgili verilere ve diğer verilere ve göstergelere aşağıdaki TÜİK (Türkiye İstatistik Kurumu) web sitesi
bağlantısından ulaşabilirsiniz.
http://www.tuik.gov.tr/Kitap.do?metod=KitapDetay&KT_ID=11&KITA
P_ID=21 Diğer ülkelere ait ölümler ise, Dünya Sağlık Örgütü’nün (WHO) her yıl yayınladığı
“Dünya Sağlık İstatistikleri (world health statistics)” ve Birleşmiş Milletler Örgütü’nce her
yıl yayınlanan “Demographic Yearbook” isimli yıllıklardan elde edilebilmektedir.
http://www.who.int/gho/publications/world_health_statistics/en/index.html (Dünya Sağlık
Örgütü’nün, (WHO) Dünya Sağlık İstatistiklerine ait web sitesi)
http://unstats.un.org/unsd/demographic/products/dyb/dyb2.htm
(Birleşmiş Milletler Örgütünce hazırlanan Demographic Yearbook)
91
Ölümlere ilişkin hesaplamalar yaşa göre, cinsiyete göre, ölümlerin oldukları aylara göre, mesleğe
göre, medeni duruma göre, ölüm nedenine göre olmak üzere farklı şekillerde hesaplanabilmektedir.
TÜİK verilerine göre Türkiye’de 2000-2009 yılları arasında yaşa göre ölüm sayıları Tablo 4.9’da
verilmiştir.
Tablo 4.9: Türkiye’de, 2000-2009 yılları arası yaş gruplarına göre ölüm sayıları
YIL
0-11 ay
1-4 yaş
5-14yaş
15-34 yaş
35-54 yaş
55-74 yaş
75 +
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
15.543
14.947
13.125
12.878
10.706
10.180
10.199
10.201
9.987
14.348
2.907
2.915
2.365
2.428
2.190
2.249
2.220
2.015
2.017
4.564
2.108
2.123
1.830
2.000
1.997
2.092
1.993
1.978
1.718
5.974
8.515
8.370
7.181
8.219
8.043
7.947
8.205
7.772
7.404
15.432
23.841
24.020
23.417
25.146
24.041
24.957
25.748
25.300
25.590
41.971
72.035
71.131
71.310
73.913
72.131
75.748
78.307
76.951
76.301
122.651
49.366
51.631
56.206
59.746
62.255
67.876
76.735
80.996
86.523
159.064
Ölümlerle İlgili Hız ve Oranlar
Ölümlerle ilgili olarak hesaplanan birçok hız ve oran bulunmaktadır. Bunlardan bazıları; Kaba ölüm hızı,
yerel ölüm hızı, yaşa özel ölüm hızı, cinsiyete özel ölüm hızı, yaşa ve cinsiyete özel ölüm hızı, ana ölüm
hızı, bebek ölüm hızı, ölü doğum hızı, perinatal ölüm hızı, orantılı ölüm hızı, yaşa özel orantılı ölüm hızı,
ölüm nedenine göre orantılı ölüm hızıdır.
Kaba Ölüm Hızı (KÖH)
Bir ülke ya da bölgede belirli bir yıl içindeki toplam ölüm sayısının yıl ortası nüfusa oranlanması ile
hesaplanır. Bölge ya da ülkenin kabaca ölüm düzeyi hakkında bilgi verir. Aşağıdaki şekilde hesaplanır.
Örnek 4.6: TÜİK 2009 yılı verilerine göre Türkiye genelinde görülen ölüm sayısı 367.971 olarak
saptanmıştır. Aynı yıla ait yılortası nüfusumuz 72.561.312 olduğuna göre Kaba ölüm hızını hesaplayınız.
2009 yılında Türkiye’de her 1.000 kişiden 5’i ölmüştür.
Bir bölgenin 2010 yılı kaba ölüm hızı ‰3,13 ve aynı yıla ait yıl ortası
nüfusu 4.526.410 kişidir. Bölgedeki 2010 yılı ölen sayısını hesaplayınız?
Nüfusun yaş ve cinsiyet dağılımları bölgelerde farklı olabilir. Nüfus yapısı içerisinde yaşlıların oranı
fazla olan bir ülkenin sağlık düzeyi yüksek olsa bile, yaşlılar ilerleyen zamanlarda daha fazla öleceğinden
kaba ölüm hızı yüksek çıkmaktadır. Bu bakımdan bölgeler arası karşılaştırmalar kaba ölüm hızı yerine
diğer standartlaştırılmış ölüm hızları ile yapılabilir. Bu hızlarının bazılarının tanımları ve hesaplama
biçimleri aşağıda verilmiştir.
92
Cinsiyete Özel Ölüm Hızı (CÖÖH)
Genellikle bir yıl için hesaplanır. Bir bölgede bir yıl içinde incelenen cinsiyette ölen sayısının, bu
cinsiyete ait yıl ortası nüfusuna bölünmesiyle elde edilir. Aşağıdaki şekilde hesaplanır.
Örnek 4.7:
TÜİK 2009 yılı verilerine göre Türkiye genelinde kadınlarda görülen ölüm sayısı 172.078 olarak
saptanmıştır. Aynı yıla ait kadın yılortası nüfusumuz 36.125.322 olduğuna göre Kadınlara özel ölüm
hızını hesaplayınız.
2009 yılında Türkiye’de her 1.000 kadından yaklaşık olarak 5’i ölmüştür.
Yaşa Özel Ölüm Hızı (YÖÖH)
Bir bölgede bir yıl içinde incelenen yaş grubunda ölen sayısının, bu yaş grubu yıl ortası nüfusuna
bölünmesiyle elde edilir. Aşağıdaki şekilde hesaplanır.
Genel Mortalite Hızı (GMH)
Bir bölgede bir yıl içinde belirli bir hastalıktan ölenlerin (mortalite), yıl ortası nüfusa bölünmesi ile elde
edilir. Aşağıdaki gibi hesaplanır
(
)
Örnek 4.8:
2008 yılı verilerine göre Türkiye genelinde kalp rahatsızlığına bağlı sebeplerden 72.564 kişi ölmüştür.
Aynı yıla ait yılortası nüsus ise 71.517.100 olduğuna göre bu hastalığa ilişkin genel mortalite hızı nedir?
Hesaplayınız
2008 yılında Türkiye’de her 10.000 kişiden yaklaşık olarak 1’i kalp rahatsızlığına bağlı nedenlerden
ölmüştür. GMH çok küçük bir değer aldığından onbinde olarak hesaplanmıştır.
Bebek Ölüm Hızı (BÖH)
Bir yıl içinde bölgede bir yaşına (0-364 günlük) girmeden ölen bebeklerin o yılda canlı doğan toplam
bebek sayısına oranlanmasıyla elde edilir. Bölgedeki her bin canlı doğuma karşı kaç bebeğin bir yaşına
girmeden öldüğünü ifade eder. Bebek ölüm hızı aşağıdaki gibi hesaplanır.
93
(
)
Örnek 4.9:
A bölgesinde 2011 yılı içerisinde 1 yaşını doldurmadan ölen bebeklerin sayısı 82 olarak belirlenmiştir.
Aynı yıl içerisinde bölgedeki meydana gelen canlı doğum sayısı ise 1.560’tır. Bu bölgenin 2011 yılına ait
bebek ölüm hızını hesaplayınız.
(
)
Bu bölgede canlı doğan her 1.000 bebekten 53 tanesi ( 53) 1 yaşına girmeden ölmüştür. Bu
oldukça yüksek bir hızdır. Bölgenin geri kalmışlığının en önemli ölçüsüdür.
Bir bölgede 2010 yılı içinde bir yaşını doldurmadan ölen bebek sayısı
49’dur. Bölgenin aynı yıla ait kaba ölüm hızının ‰7’ye eşit veya daha az (KÖH≤‰7)
olduğu bilindiğine göre, bölgeye ait 2010 yılı canlı doğum sayısı en az kaç olmalıdır?
Bebek ölüm hızı bölgede ana-çocuk sağlığı hizmetlerinin sağlık kurumları tarafından iyi yürütülüp
yürütülmediğini göstermek için kullanılan ve uluslarası kabul gören önemli istatistiklerdendir. Ülkenin ya
da bölgenin sağlık düzeyini ve gelişmişliğini gösterir. BÖH gelişmiş ülkelerde ‰10’un altına inmiştir.
Avrupa ülkelerinin çoğunda ‰4-6 arasındadır.
Bebek ölüm hızı neonatal ve postneonatal dönem olarak ikiye ayrılır. Neonatal dönem 0-27 günlük
dönemde ölen bebekler için, postneonatal dönem ise 28-364 günlük dönemde ölen bebekler için
kullanılır. Neonatal dönemide kendi içerisinde 0-6 günlük için erken neonatal dönem, 7-27 günlük için ise
geç neonatal dönem olarak ikiye ayırmak mümkündür.
Neonatal dönemdeki bebek ölümlerin büyük bir kısmı doğuştan normal olmayan bebekler,
doğumdaki travmalar, genetik problemler, 37 haftadan daha erken doğan bebekler, düşük doğum ağırlığı
gibi önlenmesi zor ve tedavisi güç ya da olanaksız hastalıklara bağlıdır.
Postneonatal dönemdeki ölümler genellikle iyi bakım ve beslenme, hijyen, aşılama, zamanında teşhis
ve tedavi hizmetleri ile önlenmektedir. Postneonatal dönemdeki bebek ölümlerinin en düşük seviyede
olması sağlık sisteminin başarısı olarak değerlendirilmektedir
Ölü Doğum Hızı (ÖDH)
Gebelikte, 28. haftadan sonraki fetüs ölümü ölü doğum olarak adlandırılır. Ölü doğumlar veya gebeliğin
20. haftasından sonraki ölümler (perinatal) sayı olarak ana ölümlerinden daha fazladır. Bundan dolayı
bölgelerin yapısı hakkında, kolay ölçülebilir ve ana ölüm hızından daha geçerli bilgi verir. Fakat bu
94
hızların güvenilir olabilmesi için ölü doğumların doğru bir şekilde kayıt edilmesi gerekir. Bu kayıtların
doğru ve güvenilir olmadığı ülke ve bölgelerde, ölü doğum hızının doğru hesaplanması ve doğru yoruma
gidilmesi mümkün olmamaktadır.
Kurum yöneticisi ve sağlık planlayıcıları bilmelidir ki hizmet verilen bölgede tüberküloz, tifo,
dizanteri, kolera vb. hastalıklar ölü doğum hızını arttırdığı gibi hijyenik koşullarda sürdürülemeyen
gebeliklerde de ölü doğum hızı yükselmektedir.
Perinatal Ölüm Hızı (PÖH)
Yıl içerisindeki ölü doğan bebek sayısı ile canlı doğan fakat 0-6 gün arasında ölen bebeklerin, o yılki tüm
canlı doğum sayısına bölünmesiyle elde edilmektedir. Aşağıdaki şekilde hesaplanmaktadır.
Ana Ölüm Hızı (AÖH)
Anne ölüm hızı bir ülkenin sağlık düzeyini gösteren önemli bir ölçüttür. Annenin gebeliği hijyenik
koşullarda sürdürülemiyorsa, doğum ve lohusalık dönemlerinde etkili bir sağlık hizmeti alamıyorsa, bu
bölgedeki anne ölümleri dolayısıyla yüksek olacaktır. Bu hızın hesaplanmasında eğer gebe, herhangi bir
kaza ya da gebelik dışında farklı bir hastalıktan ölmüş ise bu ölümler anne ölümleri dışında tutulmaktadır.
Orantılı Ölüm Hızı (OÖH)
Orantılı ölüm hızı farklı yaşlara veya ölüm nedenlerine göre ayrı ayrı hesaplanabilmektedir. Bunlara ait
tanım ve hesaplamalar aşağıda verilmiştir.
Yaşa Göre Orantılı Ölüm Hızı (YGOÖH)
Belirli bir yaş veya yaş grubundaki ölümlerin, toplam ölümler içerisindeki yüzdesini gösteren bir
istatistiktir. Ülkelerin ve bölgelerin sağlık düzeylerini gösteren en önemli ölçütlerden biridir. Sağlık
düzeyi yüksek olan ülkelerde, 50 yaşın üzerindeki ölümler tüm ölümlerin %90’ı veya da daha fazlasını
oluşturmaktadır.
Yaşa göre orantılı ölüm hızı genellikle üç yaş grubu için hesaplanmaktadır. Bunlar 0-4 yaş grubu, 549 yaş grubu ve 50+ yaş grubudur. Bu yaş gruplarına ait ölüm sayıları ayrı ayrı belirlenir. İstenilen yaş
grubuna ait ölüm sayıları, tüm ölümlere (üç gruptaki ölü sayısının tamamına) oranlanarak yaşa göre
orantılı ölüm hızı belirlenir.
95
Örnek 4.10:
Bir ülkede 2011 yılına ait ölümler yaş gruplarına göre Tablo 4.10’da verilmiştir. Bu verilere göre ülkenin
2011 yılı yaşa göre orantılı ölüm hızlarını hesaplayınız.
Tablo 4.10: 2011 yılı yaş gruplarına göre ölümler
Yaş grupları
0-4
5-49
50+
Toplam
Ölümler
13.047
23.933
173.603
210.583
Ölüm Nedenine Göre Orantılı Ölüm Hızı (ÖNGOÖH)
Bir yıl içerisinde belirli bir nedenden dolayı olan ölümlerin, o yıla ait toplam ölümler içerisindeki
yüzdesini vermektedir.
Örnek 4.11:
Bir bölgede 2010 yılında çeşitli nedenlerle toplam 3.127 kişi ölmüştür. Aynı bölgede kalp hastalıkları
nedenine bağlı olarak toplam 29 kişi ölmüş ise ölüm nedenine göre orantılı ölüm hızını hesaplayınız.
Bölgede kalp hastalıkları nedenine bağlı olan ölümler, tüm ölümlerin %0,927’sini (
oluşturmaktadır.
’sini)
HASTALIKLARLA İLGİLİ İSTATİSTİKLER
Hedef topluma ait hastalıkların iyi bir şekilde değerlendirilmesi birçok yönden sağlık kurumunun
yöneticisine ve personeline, sağlık alanındaki planlamaların daha etkin biçimde yapılması için çok büyük
avantajlar sağlamaktadır. Bu verileri değerlendirirken hastalıkların bölgelere, sosyo-kültürel ve ekonomik
özelliklere, aylara, yıllara, mevsimlere, göre dağılışlarını hesaba katmak gerekmektedir. Ayrıca bölgede
sık görülen hastalıkların görülüş sırasına göre dağılımlarını dikkatlice incelemek gereklidir. Aşağıda
hastalıkların kurumlar, bölgeler, ülkeler arasındaki karşılaştırılmalarına imkan veren bazı istatistikler
verilmiştir.
Hastalıklarla İlgili Hızlar
Çalışmalarda, incelenen süre içerisinde hastalık (morbidite) ve hasta kişi sayısı farklı olabileceği için
hastalık hızları, hastalık (vaka) ve hasta için ayrı olarak hesaplanmalıdır. İncelenen sürede hastalık hızları,
prevelans hızı ve insidans hızı olarak iki değişik biçimde hesaplanabilir.
96
Prevalans hızı: İnceleme süresi (period) içinde mevcut hasta sayısının (eski ve yeni olgular dahil olmak
üzere) risk altındaki nüfusa bölünmesiyle elde edilen hastalık hızıdır. Bir hastalığın o toplumda görülme
sıklığı olarakta ifade edilir. Prevelans hızı, genellikle kronik hastalıkların görülme sıklıklarını ifade
etmekte kullanılmaktadır.
Prevelans hızı hastalık ve hasta için ayrı ayrı hesaplanabildiği gibi günlük (nokta) ve aylık ya da yıllık
(süre) olarakta hesaplanabilir.
Nokta Prevelans Hızı
Belirli bir anda (günde) mevcut eski ve yeni olguların risk altındaki topluma oranının yüzde çarpımıdır.
Örnek 4.12:
Eskişehir’de bir aile hekimliği bölgesinde, 20 Kasım 2011 tarihinde 2.400 çocukta 284 Akut Solunum
Yolu Enfeksiyonu (ASYE) vakası tespit edilmiştir. Verilen tarihteki nokta prevelans hızını hesaplayınız.
(örnek varsayımsaldır)
İnsidans Hızı
İncelenen süre içerisinde yeni gözlenen hasta sayısının risk altındaki nüfusa oranlanmasıyla elde edilen
yeni olgu gözlenme hızıdır. Bir bölgede, herhangi bir hastalığın mevcutlara ek olarak belirli bir süre
içerisinde yeniden görülme sıklığının belirlenmesidir. Akut, sosyal ve bulaşıcı hastalıkların
değerlendirilmesinde kullanılmaktadır.
İnsidans hızı hastalık ve hasta için iki ayrı biçimde hesaplanabilir.
(
)
(
)
Örnek 4.13:
Bir sağlık ocağı bölgesinde 2011 yılı Temmuz ayında 2.500 çocuktan yeni ishal olan vaka sayısı 216 ise,
vaka insidans hızını hesaplayınız.
(
)
97
Örnek 4.14:
Bir sağlık ocağı bölgesinde 2011 yılı Temmuz ayında 2.500 çocuktan yeni ishal olan kişi sayısı 160 ise,
şahıs insidans hızını hesaplayınız.
(
)
Fatalite Hızı
Belirli bir hastalıktan ölenlerin o hastalığa yakalananların sayısına oranlanması ile bulunur. Belirli bir
süre içinde X hastalığına yakalananların bu süre içinde %, ‰, … (k) kaçının öldüğünü ifade etmek için
kullanılır. Aşağıdaki şekilde hesaplanır.
Örnek 4.15:
Bir bölgede 2011 yılı içerisinde karaciğer kanserine yakalananların sayısı 1.500 ve aynı hastalıktan
ölenlerin sayısı 600’dür. Eldeki verilere göre Fatalite hızını hesaplayınız.
Bölgenin 2011 yılı Karaciğer kanserine ilişkin Fatalite hızı %40 olarak elde edilir.
Afrika’da bir bölgede 2011 yılı içerisinde AIDS hastalığına yakalanan
4.481 kişiden 2.128’i (AIDS hastalığından) ölmüştür. Bölgenin Fatalite hızını hesaplayınız.
Hastalık Riskleri
Hastane yöneticisi, hastalık risklerine bağlı olarak bazı durumlarda çalışanlarını, hastaları ve hizmet
verdiği nüfusu bilgilendirme toplantıları yapabilir. Hastalıklar hakkında toplumu bilinçlendirerek toplum
sağlığı hizmetlerini yürütebilir. Halk sağlığı ve aile hekimliği birimleri ile ortak hareket ederek toplumun
sağlık seviyesini arttırma çabasına girebilir. Böylece önlenebilir bazı hastalıklardan toplumu koruyabilir,
sağlık konusunda toplumu bilinçlendirebilir ve sağlık giderlerinin azaltılmasını sağlayabilir.
Bir hastalığın ortaya çıkmasında kesin etkisi olup olmadığı bilinmeyen, fakat hastalığın ortaya
çıkmasında birçok faktör arasında yer alan ve varlığında ise hastalığın gözlenme oranını arttırdığı
saptanan değişkenlere risk faktörü denir. Örneğin; sigara alışkanlığı akciğer kanserinin bir risk
faktörüdür. Yaş, cinsiyet, günlük içilen sigara sayısı, kolesterol düzeyi, sistolik kan basıncı (SKB), stres,
sedanter yaşam gibi faktörler de kalp hastalıklarında birer risk faktörüdür.
Hastalık risklerinin hesaplanmasında; bir hastalık durumunda risk faktörünün olması ve hastalık
yokluğunda risk faktörünün olması durumlarından yararlanılır. Risk faktörü ile belirli bir hastalık
arasındaki bağımlılığı, birlikteliği değerlendirmek için yararlanılan ve olasılık kurallarından
yararlanılarak geliştirilen birçok oran bulunmaktadır. Bunlar araında en çok kullanılanlar Odds Oranı
(Göreli orantı, olasılıklar oranı, Odds ratio, OR), Göreli Risk Oranı (Relative Risk) ve Atfedilen Risktir
(Attributable Risk).
Hastalık risklerine ilişkin tanım ve hesaplar aşağıda verilen Tablo 4.11’den yararlanılarak
hesaplanmaktadır.
98
Tablo 4.11: Risk faktörünün varlık ya da yokluğuna göre hastalık durumu
Hastalık
Risk faktörü
Var
Yok
Var
a
b
Yok
c
d
a+c
b+d
Toplam
Göreli Risk Oranı
Risk faktörü var iken hastalığın görülme sıklığının, risk faktörü yok iken hastalığın görülme sıklığına
oranına Göreli Risk Oranı adı verilmektedir. Tablo 11 incelenecek olursa, risk faktörü var iken, risk
faktörü altındaki birey oranı; a/(a+b) ve risk faktörü yok iken, risk faktörü altındaki birey oranı; c/(c+d)
olarak alınır. Göreli risk oranı ise bu iki riskin birbirine oranlanması ile elde edilir. Risk faktörü varken,
faktörün olmadığı duruma göre hastalığın kaç kat daha fazla gözlendiğini belirten bir orandır. Aşağıdaki
formül ile hesaplanmaktadır.
⁄(
⁄(
)
)
Örnek 4.16:
Bir hastaneye başvuran 1.010 hastadan 106 hastanın sigara içtiği ve bu 106 hastanında 6 tanesinin
Akciğer kanserine yakalandığı tespit edilmiştir. Sigara içmeyen diğer 904 hastadan ise 4 tanesinin sigara
kullandığı saptanmıştır. Akciğer kanserine yakalanmada sigara içme alışkanlığının önemli bir risk faktörü
olduğu bilinmektedir. 1.010 kişi ile yapılan bir araştırmadan elde edilen veriler Tablo 4.12’de verilmiştir.
Buna göre Göreli Risk Oranını hesaplayınız.
Tablo 4.12: Sigara alışkanlığı risk faktörüne göre akciğer kanserine yakalanma durumu
Sigara Alışkanlığı
Akciğer Kanseri
Var
Yok
6
100
İçen
İçmeyen
4
10
Toplam
⁄(
⁄(
900
1.000
Toplam
106
904
1.010
)
)
Yukarıda elde edilen sonuca göre, sigara içen kişilerin akciğer kanserine yakalanma riski içmeyenlere
göre 12,8 kat daha fazla olduğu yorumu yapılır.
Odds Oranı (Odds Ratio): T zaman diliminde toplumda gözlenen bir hastalığın gözlenme oranı P(H) ve
gözlenmeme oranı Q(H) olarak tanımlanabilir. Hastalığın gözlenme oranının, gözlenmeme oranına
bölünmesine ise odds adı verilir. İki odds un birbirine oranlanması ise odds oranı olarak
tanımlanmaktadır. Kısaca risk faktörünün olduğu durumda hastalık görülme oranının, risk faktörü
olmadığı durumdaki hastalık görülme oranına bölümü Odds oranı olarak ifade edilmektedir.
⁄
⁄
Belli bir olayın olasılığının iki grup için aynı ya da benzer olup olmadığını karşılaştırmanın bir
yoludur. OR=1 olması her iki grup için olayın olması olasılığı eşit demektir. OR>1 ise olayın olması
olasılığı birinci grupta daha fazla, OR<1 ise olayın olması olasılığı birinci grupta daha azdır.
99
Örnek 4.17:
Akciğer Kanserine yakalanmada sigara içme alışkanlığının önemli bir risk faktörü olduğu bilinmektedir.
Bu nedenle toplam 1.010 kişi ile yapılan bir araştırmadan elde edilen veriler Tablo 4.13’te verilmiştir.
Buna göre Odds Oranını (OR) hesaplayınız. (Anlaşılmasının ve karşılaştırmaların kolay olması nedeni ile
Örnek 16’nın verileri bu örnekte kullanılmıştır.)
Tablo 4.13: Sigara alışkanlığı risk faktörüne göre akciğer kanserine yakalanma durumu
Akciğer Kanseri
Var
Yok
Sigara Alışkanlığı
Toplam
içen
6
100
106
İçmeyen
4
10
900
1.000
904
1.010
Toplam
⁄
⁄
Yukarıda elde edilen sonuca göre, sigara kullanımına bağlı akciğer kanseri hastalığına yakalanma
riski, sigara kullanmayanlara göre 13,5 kat daha fazladır. Sigara kullanan kişiler akciğer kanserine 13,5
kat daha fazla yakalanmaktadır.
Atfedilen Risk
Belirli bir risk faktörün etkisiyle hastalananların (ya da ölenlerin) hızından bu faktörün etkisinde
kalmadan hastalananların (ya da ölenlerin) hızının çıkarılmasıyla elde edilir.
( ⁄(
))
( ⁄(
))
Örnek 4.18:
Bir bölgede, sigara içenlerde akciğer kanserine yakalanma oranı ‰8,45, bu oran sigara içmeyenlerde ise
‰1,07 olarak saptanmıştır. Eldeki verilere göre akciğer kanserinin sigara kullanımına atfedilen riskini
hesaplayınız.
Atfedilen risk=8,45-1,07=7,38
Elde edilen sonuca göre akciğer kanserine yakalanmanın sigaraya atfedilen riski ‰7.38’dir.
KORUYUCU SAĞLIK HİZMETLERİ
Koruyucu sağlık hizmetleri ile ilgili toplanan veriler, sağlık hizmetlerinin örgütlenmesi, bu hizmetleri
etkin bir biçimde yürütülme ve yeniden düzenlenmesi, uygun bir biçimde planlaması ve farklı bölgelere
ait verilerin karşılaştırılması işlemlerine olanak sağlamaktadır. Sağlık kurumlarının yöneticileri aynı
zamanda koruyucu sağlık hizmetlerinde de etkin bir rol oynamaktadır. Yönetici, koruyucu hizmetlerle
ilişkili olarak personel, araç, gereç vb. istihdamını sağlama, bunları düzenleme ve sağlıkla ilgili olarak
gerekli önlemleri alma çabası içerisinde olmalıdır. Koruyucu sağlık hizmetleri için hesaplanan istatistikler
aşağıda verilen ana başlıklar altında sıralanabilmektedir.

Aile planlamasına hizmetleri

Gebe ve lohusa bakım ve takip hizmetleri

Bebek ve çocuk bakım, takip, aşılama hizmetleri

Kronik hastalıkların bakım ve takip hizmetleri

Çevre sağlığı hizmetleri
100
Kurum yöneticisine ve sağlık planlayıcısına yukarıda sayılan ana başlıklara ait doğru, güvenilir ve
güncel verilerin elde edilmesi ve bu ham verilerin yararlı bilgilere (enformasyona) dönüştürülmesi
aşamasında büyük iş düşmektedir.
SUNULAN SAĞLIK HİZMETLERİNİN DÜZEYİNİ GÖSTEREN
İSTATİSTİKLER
Sağlık kurumu tarafından hedef topluma sunulan hizmetlerin başarılı olup olmadığını saptamada
kullanılan birçok gösterge geliştirilmiştir. Sağlık kuruluşu ya da ülke için düşünüldüğünde sağlık düzeyi
göstergeleri olarak adlandırılan bu istatistikler aynı zamanda kurumlar, bölgeler ve ülkeler arası
karşılaştırmalar içinde sıklıkla kullanılmaktadır. Bu göstergeler kurumların, bölgelerin ve ülkelerin sağlık
açısından zaman içerisindeki değişimlerinin olumlu yönde olup olmadığının değerlendirmelerine de
olanak sağlamaktadır. Bu nedenle kullanılan verilerin ve bu verilerden hesaplanan göstergelerin
karşılaştırmalara olanak sağlayacak şekilde standart olması gerekmektedir..
Çalışmalardan elde edilen göstergeler öncelikle hastane, sağlık ocağı, il, bölge, ülke için önceki yıllara
ait göstergeler ile, ikinci aşamada aynı ya da benzer hizmet veren başka kuruluşlarla karşılaştırılır. Bu tür
karşılaştırmalar sağlık hizmetlerinin hangi alanlarda başarılı, hangi alanlarda başarısız olduğunun ortaya
konması ve başarısızlığın giderilmesi, eksiklerin tamamlanması için gereken önlemlerin alınması
yönünden çok faydalıdır.
Ülkeler, bölgeler ve kurumlar arası karşılaştırmalara olanak sağlayan çok sayıda sağlık hizmet düzeyi
ölçüsü bulunmaktadır. Bu nedenle, sağlık alanında ülkeler ya da kurumlararası karşılaştırmalarda tek ölçü
ile değil çok sayıda ölçü ile karşılaştırmalar yapılmalıdır. Yukarıda da üzerinde durulduğu gibi ölçüler ve
ölçülerin hesaplanmasında kullanılan veriler standart olmalıdır. Sağlık kurumların personel, bütçe ve
diğer olanakları her zaman göz önünde bulundurulmalıdır. Ölçüleri etkileyebilecek bazı faktörler (eğitim,
sağlık, sosyal ve ekonomik özellikler vb.) dikkate alınmalıdır.
YAŞAM TABLOLARI
Bir ülkede yaşayan insanlar, ülkenin sahip olduğu sosyal, ekonomik ve sağlık koşullarından farklı
şekillerde etkilenmekte ve farklı yaş gruplarında değişik risklere maruz kalmaktadırlar. Belirli bir yaş ya
da yaş grubu içerisindeki bireylerin sahip oldukları ölüm risklerini, ölüm istatistikleri aracılığı ile
değerlendiren ve bireylerin beklenen yaşam sürelerini belirlemeyi amaçlayan tablolara yaşam tabloları
denir.
Yaşam tabloları belli bir yaşa sağ olarak ulaşan bir kişinin, ortalama daha kaç yıl yaşayacağına ilişkin
hesaplamaların yapıldığı bir tablodur. Genellikle 0-4, 5-9, 10-14, …, 80-84, 85+ yaş gruplarına göre
hazırlanan yaşam tabloları, her bir yaş grubundaki bireylerin tahmini olarak kaç yıl yaşayacağını belirtir.
Kadınlara ve erkeklere göre ayrı ayrı hesaplanabilmektedir. Bunun dışında belli iş kollarına, bekar, evli
kalma sürelerine, uygulanan tedavi sonrasında hastanın kaç yıl yaşayacağına göre farklı alanlarda yaşam
tabloları da hesaplanabilmektedir. Beklenen yaşam süresi bazı kaynaklarda beklenen yaşam ümidi
olarakta adlandırılmaktadır.
Tablo 4.14’teki ilk sütun yaş gruplarını, Nx sütunu (2. sütun) yaş gruplarına göre nüfus sayılarını ve Dx
sütunu ise (3. sütun) yaş gruplarına göre ölüm sayılarını göstermektedir. Tablonun 2 ve 3. sütundan
hareket ederek, bir dizi matematiksel işlem sonucunda ex sütunu (10. sütun) elde edilir ki bu sütun belli
bir yaş grubuna ulaşan bireylerin beklenen yaşam süresini göstermektedir.
Örneğin Tablo 4.14’te, 2009 yılında Türkiye’de 5-9 yaşındaki bir çocuğun beklenen yaşam süresi
72,78 yıl olarak gösterilmiştir. Tablodan da görüleceği gibi bir yaşını doldurmadan olan ölümler oldukça
fazladır. Bu nedenle sıfır “0” yaş grubu nüfusumuzun beklenen yaşam süresi (76,38yıl), 1-4 yaş grubu
nüfusa (76,51yıl) göre daha düşüktür. Nüfusun genel yapısı içerisinde, bir yaşını doldurmadan ölen bebek
sayısının fazla olmasından dolayı yaşam tablolarında bu iki yaş grubu birbirinden ayrılmıştır.
101
Türkiye’nin 2009 yılına göre düzenlenmiş yaşam tablosu Tablo 4.14’te görülmektedir.
Tablo 4.14: Türkiye’nin 2009 yılına göre düzenlenmiş yaşam tablosu
Yaş
Grupları
0
Nx
1
1231064
Dx
2
17354
mx
3
0,014097
q
4
0,014548
P
5
0,985452
lx
6
100000
d
7
1455
Lx
8
98694
Tx
9
7638126
ex
10
76,38
1-4
4924257
4564
0,000927
0,003701
0,996299
98545
365
393451
7539431
76,51
5-9
6201647
3433
0,000554
0,002764
0,997236
98180
271
490224
7145980
72,78
10-14
6502366
2541
0,000391
0,001952
15-19
6234620
3412
0,000547
0,002733
0,998048
97909
191
489068
6655756
67,98
0,997267
97718
267
487922
6166688
63,11
20-24
6280117
3585
0,000571
0,002850
0,997150
97451
278
486561
5678766
58,27
25-29
6508860
4166
0,000640
0,003195
0,996805
97173
310
485090
5192205
53,43
30-34
5911032
4269
0,000722
0,003605
0,996395
96863
349
483441
4707115
48,60
35-39
5505313
5554
0,001009
0,005032
0,994968
96514
486
481354
4223674
43,76
40-44
4676145
7777
0,001663
0,008281
0,991719
96028
795
478152
3742320
38,97
45-49
4469953
11929
0,002669
0,013255
0,986745
95233
1262
473008
3264168
34,28
50-54
3725743
16711
0,004485
0,022178
0,977822
93970
2084
464642
2791160
29,70
55-59
2945603
21603
0,007334
0,036010
0,963990
91886
3309
451160
2326518
25,32
60-64
2361178
26201
0,011097
0,053985
0,946015
88578
4782
430933
1875358
21,17
65-69
1723714
33378
0,019364
0,092349
0,907651
83796
7738
399632
1444425
17,24
70-74
1323668
41469
0,031329
0,145267
0,854733
76057
11049
352665
1044793
13,74
75-79
1145932
61705
0,053847
0,237291
0,762709
65009
15426
286478
692128
10,65
80-84
611703
53694
0,087778
0,359909
0,640091
49583
17845
203300
405650
8,18
85+
278397
43665
0,156844
1,000000
0,000000
31737
31737
202350
202350
6,38
72561312
367010
Toplam
n
n x
n x
n x
n
HASTALIK VE ÖLÜM NEDENLERİNİN ULUSLARARASI
SINIFLANDIRILMASI
Sınırların kalktığı, insanların oldukça kolay bir şekilde ülkeler arasında yolculuk yaptığı dünyamızda
hastalıklara ve ölüm nedenlerine her geçen gün yenileri ilave olmakta ve bu kadar çok hastalığın tek tek
incelenmesi oldukça zor hale gelmektedir. Bu nedenle hastalıkları sınıflamak, belli alt başlıklarda
incelemek bir zorunluluk haline gelmiştir. Hastalık ve ölüm nedenlerinin belirli bir sistematik içerisinde
incelenmesi gerekmektedir. Bu nedenle Dünya Sağlık Örgütü (DSÖ) belli zamanlarda hastalık ve ölüm
nedenlerini sınıflama yoluna gitmiştir. İlk sınıflama DSÖ tarafından 1946 yılında yapılmış, bunu daha
sonra 1955, 1965, 1975 ve 1989 sınıflamaları takip etmiştir. 1989 yılında yapılan düzenleme ICD-10
(International Classification of Diseases-10) olarak adlandırılmıştır. Şu anda ülkemizde ICD-10
uygulanmaktadır. Ülkemizde yapılan bir çok çalışmada ve hazırlanan dökümanlarda sağlık hizmetlerinin
yönetilmesi için kaliteli, güvenilir ve doğru sağlık enformasyonuna ihtiyaç olduğu, bu sağlık
enformasyonununda toplanabilmesi için ICD-10’un kullanılması gerektiği savunulmuştur. ICD-10’u
uygulamak için öncelikle iyi eğitimli bir personele, iyi bir otomasyona (yazılımların yeterli olması)
ihtiyaç vardır. Hastanın hastaneye başvurmasından, ayakta ya da yatarak tedavi olmasına kadar, taburcu
olup, faturalanmasına kadar tüm aşamalarda bu kodlama sistemlerinden yararlanılmaktadır. ICD-10
düzenlenmesinde hem alfabetik hem de sayısal kodlama sistemlerinden yararlanılmıştır. Tablo 4.15’te
genel başlıklar altında ICD-10 listesi verilmiştir. Bu düzenlemede U harfi kullanılmamış, ileride
olabilecek ilaveler ya da revizyonlar için boş bırakılmıştır.
ICD-10 aynı zamanda bölge ya da ülke hastanelerinin birbirleriylede karşılaştırılmasına olanak
sağlamaktadır. Buradan elde edilen veriler değerlendirilerek bölge ya da ülkenin sağlık politikaları
belirlenebilmekte, optimum düzeyde sağlık planlamaları yapılabilmektedir. Sağlık hizmetleri belli bir
sistematik içerisinde yürütülmekte, kontrol altında tutulabilmektedir.
102
Kurum yöneticilerinin, personeli belli aralıklarla eğitim vermesi, bilgilendirmesi kurumun iyi bir
şekilde yönetilmesi, zarar etmemesi bilgilerin doğru ve güvenilir olarak toplanması açısından çok
önemlidir. Ayrıca kurum yöneticileri belirli aralıklarka kendi kurumunu, bölgedeki diğer kurumlarla
karşılaştırabilmeli ve yeniliklere açık olmalıdır.
Tablo 4.15: Hastalıkların Uluslararası sınıflandırılması (1989 düzenlemesine göre ICD-10)
Hastalıkların uluslararası sınıflandırılması
Kod Aralığı
1.
Bölüm - Enfeksiyon ve Paraziter Hastalıklar
(A00-B99)
2.
Bölüm - Neoplazmlar
(C00-D48)
3.
Bölüm - Kan ve Kan Yapıcı Organ Hastalıkları
ve Bağışıklık Sistemini İçeren Hastalıklar
(C00-D48)
4.
Bölüm - Endokrin, Nutrisyonel ve Metabolik
Hastalıklar
(E00-E90)
5.
Bölüm - Akıl ve Davranış Bozuklukları
(F00-F99)
6.
Bölüm - Sinir Sistemi Hastalıkları
(G00-G99)
7.
Bölüm - Göz ve Gözle Bağlantılı Doku
Hastalıkları
(H00-H49)
8.
Bölüm - Kulak ve Mastoid Oluşum Hastalıkları
(H60-H95)
9.
Bölüm - Dolaşım Sistemi Hastalıkları
(I00-I99)
10. Bölüm - Solunum Sistemi Hastalıkları
(J00-J99)
11. Bölüm - Sindirim Sistemi Hastalıkları
(K00-K93)
12. Bölüm - Cilt ve Cilt altı Dokusu Hastalıkları
(L00-L99)
13. Bölüm - Kas-İskelet ve Bağ Dokusu Hastalıkları
(M00-M99)
14. Bölüm - Ürogenital Sistem Hastalıkları
(N00-N99)
15. Bölüm - Gebelik, Doğum ve Lohusalık Dönemi
Hastalıkları
(O00-O99)
16. Bölüm - Perinatal Dönemden Kaynaklanan
Hastalıklar
(P00-P96)
17. Bölüm - Konjenital Malformasyon, Deformasyon
ve Kromozom Anomalileri
(Q00-Q99)
18. Bölüm - Semptomlar ve Anormal Klinik ve
Laboratuar Bulguları
(R00-R99)
19. Bölüm - Yaralanma, Zehirlenme ve Dış
Nedenlere Bağlı Diğer Durumlar
(S00-T98)
20. Bölüm - Hastalık ve Ölümün Dış Nedenleri
(V01-Y98)
21. Bölüm - Sağlık Durumu ve Sağlık
Hizmetlerinden Yararlanmayı Etkileyen
Faktörler
(Z00-Z99)
103
HASTANEDEKİ SAĞLIK HİZMETLERİNİN DEĞERLENDİRİLMESİ
Bölge nüfusu, sağlık kurumundan etkin ve yeterli hizmet vermesini beklemektedir. Sadece tedavi
hizmetleri değil, otelcilik hizmetleri, yemek hizmetleri gibi birçok alanda da hastaneden beklentiler üst
seviyededir. Bu nedenle sağlık kurumu yönetcisi, kurumunu her alanda sürekli denetlemeli, yönetmeli, en
iyi sağlık hizmetini bölge halkına sunmalıdır. Hastanelerde mevcut ya da yeni açılacak servisin yatak
sayılarına karar verirmede en önemli faktörlerden biri ilgili hastalıkların çeşidi ve görülme sıklığıdır. Bu
ise bölgenin demografik yapısını bilmekle, hastalık ile ilgili doğru ve güvenilir bir veri yapısının olması
ile mümkündür. Bölgenin demografik yapısını, hasta sayısını bilmeden bir servis açmak, yatak sayısını
arttırmak, bu servisi ya da yatakları yararsız kılabilir.
Yatak kapasitelerine bağlı olarak hastanelerin belirli bir sabit maliyeti bulunmaktadır. Bu maliyetin
içerisine personel harcamaları, ısınma, aydınlatma, fiziki alt yapıya ilişkin giderler dahil edilebilir.
Hastanede tedavi edilen hasta sayısı arttıkça, kapasite kullanım oranı artacak, dolayısıyla tedavi hasta
birim maliyeti düşecektir. Bu yüzden kapasite kullanım oranı ile hasta birim maliyeti arasında ters yönde
bir ilişki mevcuttur.
Her alandaki hizmet ögelerinin en iyi şekilde sunulması, kurumun verimliliğini ve tercih edilirliğini de
önemli düzeyde etkilemektedir. Bu nedenle yöneticinin, hastane hizmetlerini hem kendi içerisinde
(önceki yıllara göre) hemde diğer kurumlara karşı rasyonel olarak değerlendirmesini amaçlayan çeşitli
oran ve hızlar geliştirilmiştir. Bu ölçütler aşağıdaki gibi sıralanabilir.
Kaba Ölüm Hızı (Hastane için)
Belirli bir süre içerisinde hastanedeki ölümlerin, taburcu edilen (ölenler dahil olmak üzere) toplam hasta
sayısına bölünmesiyle elde edilir. Aşağıdaki şekilde hesaplanmaktadır.
(
)
Örnek 4.19:
A hastanesinde bir yılda ölen sayısı 1.217, ölenler dahil toplam taburcu edilen hasta sayısı ise 85.190
olduğuna göre, hastanenin kaba ölüm hızını hesaplayınız
A hastanesinin kaba ölüm hızı %1,43 olarak elde edilmiştir.
Kaba ölüm hızı, kurumlar arası karşılaştırmalarda kullanılan en önemli ölçülerden biridir.
Net Ölüm Hızı
Hastaneye yatıştan sonra ilk 48 saatlik dilimdeki ölümler bu hızda dikkate alınmamaktadır. Hastaneye
yatan hastanın laboratuvar tetkiklerinin yapılması, tanının konulması, gerekli olan tedaviye başlanması ve
tedavinin etkinliğinin görülmesi için belli bir zamanın geçmesi gerekmektedir. Bu nedenle ilk 48 saatlik
süredeki ölümler net ölüm hızında hesaplamaya katılmamaktadır. Aşağıdaki şekilde hesaplanmaktadır.
(
)
104
Örnek 4.20:
A hastanesinde bir yılda ölen sayısı 1.217’dir. Fakat bunların 41 tanesinin ölüm olayı hastaneye
yatışlarından itibaren ilk 48 saat içerisinde gerçekleşmiştir. Aynı hastanede ölenler dahil toplam taburcu
edilen hasta sayısı ise 85.190 olduğuna göre, hastanenin net ölüm hızını hesaplayınız
A hastanesinin net ölüm hızı %1,38 olarak elde edilmiştir.
Yatak Doluluk Oranı (Kapasite Kullanım Oranı)
Yatak doluluk oranı, hastane yataklarının ne oranda kullanıldığını gösterir. Hastanenin hizmet
potansiyelini ne ölçüde kullandığını gösteren önemli bir ölçüdür. Yatak sayısı baz alındığında doluluk
(işgal) oranı, belirli bir zaman diliminde kullanılan yatak gün sayısının, toplam yatak gün sayısına
(kapasitesine) oranıdır. Bu oran hastaneler arası performansların değerlendirilmesinde ve maliyetlerin
izlenmesinde kapasite kullanım düzeyi hakkında hastane yöneticilerine bilgi vermektedir. Ayrıca Yatak
doluluk oranı; hastane kullanımını gösteren ve sağlık planlayıcıları için yataklı tedavi kurumlarının yatak
ihtiyaçlarının belirlenmesinde bilinmesi gereken temel ölçütlerdendir. Yatak kapasitesinin altında ya da
çok üstünde çalışan hastanelerde, bu sayıların azaltılmasında ya da arttırılmasında kullanılan en önemli
istatistiklerdendir. Belirli bir dönemde, yatan hastalara verilen toplam hasta bakımı gün sayısının,
maksimum hasta bakım gün sayısına bölünmesi ve sonucun 100 ile çarpılması ile bulunur. Aşağıdaki
şekilde hesaplanır.
(
)
Örnek 4.21:
2010 yılı içinde Özel B hastanesi, yatan hastalara toplam 13.126 gün bakım hizmeti vermiştir. Hastanenin
toplam yatak sayısı 50 olduğuna göre, 2010 yılı için yatak doluluk oranını hesaplayınız.
Özel B hastanesi %71,92 dolulukla 2010 yılı içerisinde hizmet vermiştir.
Yatak Devir Hızı
Bir yatağın yılda kaç hasta tarafından kullanıldığını belirten bir istatistiktir. Bir yıl içerisinde yatan hasta
sayısı toplamının, yatak sayısına bölünmesi ile elde edilir. Aşağıdaki gibi hesaplanır.
Yatak Devir Aralığı
İki devir arasında yatağın ortalama kaç gün boş kaldığını gösteren bir ölçüttür. Yatak devir aralığı
hesaplanırken, “kullanılmayan toplam hasta bakım gün sayısı”, toplam taburcu edilen (ölenler dahil
olmak üzere) hasta sayısına bölünür ve gün olarak hesaplanır. Hastanelerdeki bir hasta yatağının ne kadar
boş kaldığını gösterir. Aşağıdaki biçimde hesaplanır.
(
105
)
Örnek 4.22:
2010 yılı Aralık ayı içinde Özel B hastanesi, yatan hastalara toplam 1.126 gün bakım hizmeti vermiştir.
Hastanenin toplam yatak sayısı 50’dir. Aynı ay içerisinde toplam taburcu edilen hasta sayısı (ölenler dahil
olmak üzere) 210 olduğuna göre yatak devir aralığını hesaplayınız.
Öncelikle Hastanenin bakım hizmeti veremediği gün sayısını hesaplamak için aşağıdaki işlem yapılır
Hastanenin bakım hizmeti vermediği gün sayısı=(30x50)-1.126=374 gün
Özel B hastanesinin 2010 yılı Aralık ayına ait yatak devir aralığı 1,78 gün olarak hesaplanmıştır
Ortalama Hasta Yatış Gün Sayısı
Bir hastanın, hastanede kaldığı ortalama gün sayısını belirtmektedir. Belli bir dönemde hastaneden
taburcu olan hastaların (ölenler dahil olmak üzere) toplam yattıkları gün sayısının, aynı dönemde
hastaneden taburcu olan hastaların (ölenler dahil olmak üzere) toplam sayısına bölümü ile elde edilir.
Aşağıdaki şekilde hesaplanır.
(
)
Örnek 4.23:
2010 yılı içerisinde B hastanesinde toplam yatılan gün sayısı 13.126’dir. Taburcu olanların sayısı 1.485
ve ölenlerin sayısı ise 143 olduğuna gore hastanede ortalama hasta yatış gün sayısını hesaplayınız.
2010 yılı içinde B hastanesinde ortalama yatış süresi 8.06 gün olarak elde edilmiştir.
Yatan Hasta Oranı
Belli bir dönemde hastanede yatan toplam hasta sayısı, acil servis ve polikliniklerden başvuran toplam
hasta sayısına bölünür ve sonuç 100 ile çarpılır. Kurum yöneticisi bu istatistik ise hem kendi kurumunu
yıllar içerisinde değerlendirebilir, hemde diğer sağlık kurumları ile karşılaştırma imkanı bulur. Aşağıdaki
şekilde hesaplanır.
Örnek 4.24:
2010 yılı içerisinde B hastanesinde toplam yatan hasta sayısı 47.113’dür. Aynı zaman dilimi içerisinde
hastanenin acil servisine 81.128 ve diğer servislerine toplam 183.196 başvuru olduğuna gore hastanenin
2010 yılı yatan hasta oranını hesaplayınız
2010 yılı için B hastanesinin yatan hasta oranı %17,82 olarak elde edilmiştir.
106
Onbin Nüfusa Düşen Yatak Sayısı
Bölgedeki hastanelerin toplam yatak sayısının, bölge nüfusuna bölümünün 10.000 ile çarpılması ile elde
edilir. Her 10.000 kişiye düşen hastane yatağı sayısının belirlenmesinde kullanılır. Bölgeler arası
karşılaştırmalarda kullanılır. Aşağıdaki şekilde hesaplanır.
Yukarıda hesaplanan istatistikler dışında hastanelerdeki sağlık hizmetlerinin değerlendirilmesinde
kullanılan bir çok gösterge bulunmaktadır. Bunlardan bazıları aşağıda verilmiştir.

Anestezi ölüm hızı

Ameliyat sonrası ölüm hızı

Hastanede ana ölüm hızı

Hastanede bebek ölüm hızı

Enfeksiyon hızları (kaba enfeksiyon hızı, ameliyat sonrası enfeksiyon hızı)

Otopsi hızı

Sezeryan hızı
Yukarıda sayılan istatistikler dışında hastanelerde poliklinik hizmetlerinide değerlendirmede
kullanılan çalışmalarda yapılabilmektedir. Genelde poliklinik hizmetleri, muayene edilen hasta sayısı ile
değerlendirilir. Bu hasta sayıları hastaların farklı demografik, hastalık, tedavi, vd. özelliklerine göre de
ayrıca incelenebilmektedir.
Personel ve yatak durumları, laboratuvarlarda yapılan tetkiklerin yıllara göre dağılımı, doğumların
yıllara ve oluş biçimlerine göre dağılımı, yatan hastaların yıllara ve yatış durumlarına göre dağılımları
hastanelerin değerlendirilmesinde sıklıkla kullanılmaktadır. Ayrıca farklı servislerde muayene edilen
hasta sayıları, yaşa ve cinsiyete göre hasta sayıları, sosyo-ekonumik ve kültürel özelliklere göre hasta
sayıları, sosyal güvencelerine göre hasta sayıları vb. bir çok özelliklerine göre sayı, hız ve oranları
hesaplamak mümkündür.
Hastaneler çok karmaşık bir yapıya sahip kurumlardır. Hastanelerde gerek idari gerek sağlık hizmeti
veren pek çok birim bulunmaktadır. Sağlık kurumu yöneticisi özellikle ileriye dönük planlama yaparken,
mevcut durumu değerlendirirken, önceki yıllara göre kıyaslama yaparken ve diğer sağlık kurumları ile
kendi kurumunu karşılaştırırken tek bir ölçüye dayalı değil, bir çok ölçüden yararlanarak karşılaştırmaları
yapmalıdır. Kendini sürekli olarak yenilemeli, sağlık yöneticiliği alanındaki gelişmeleri takip etmeli,
kurumunu en üst seviyeye çıkarmaya çaba göstermelidir. Bu anılan faaliyetler için doğru, tam, güvenilir,
kullanılabilir, güncel ve denetlenebilir verilere ihtiyaç vardır. Bu verilerin, enformasyona dönüştürülmesi
işlemi istatistiksel teknikler olmadan asla yerine getirilemez. Yönetici kurumunu yönetirken, mevcudu
değerlendiriken ve geleceği planlarken bunları asla gözardı etmemelidir.
107
Özet
Bu kitapta sağlık alanında hizmet verecek
personelin gerek duyabileceği, nüfus ve nüfusla
ilgili hız ve oranlar, nüfusun dinamiklerini
oluşturan evlenme, boşanma, doğum, ölüm ve
hastalıklarla ilgili bazı hız ve oranlara
değinilmiştir. Hastalıklara özel riskler ile ilgili
açıklamalar yapılmış, hastane hizm etlerinin
değerlendirilmesinde
sıklıkla
kullanılan
yöntemler ünitenin kapsamına alınmış ve
örnekler ile çözümler yapılmış, sonuçlar
yorumlanmıştır.
Günlük hayatımızda sayıların önemli bir yeri
vardır. Toplumlar sosyal, ekonomik, kültürel ve
sağlık alanlarında çok dinamik bir şekilde
ilerleme
göstermektedirler.
Bilgisayar
teknolojisindeki
gelişmelerin,
toplumların
özellikle sağlık düzeyindeki gelişmelere çok
büyük katkı sağladığı aşikardır. Sağlıkla ilgili
verilerin toplanması, hızlı bir şekilde işlenmesi ve
enformasyona dönüştürülmesi işlemleri artık çok
kolaylaşmıştır. Oldukça büyük veri setleri bile
çok kısa zamanda işlenmekte ve sağlık
planlayıcılarına her türlü bilgi kısa bir zamanda
sunulmaktadır.
Özellikle
sağlık
alanında
kurumlar,
bölgeler
ve
ülkeler
arası
karşılaştırmalar artık çok kolaylaşmıştır.
Unutulmamalıdır ki, periferde ki veriler doğru
toplanarak kayıt altına alınmazsa, ülkeye ait
hizmet yürütümü ve sağlık planlamasıda doğru
olmayacaktır.
108
Kendimizi Sınayalım
6. Geç Neonatal dönem bebek ölümleri için
aşağıdakilerden hangisi doğrudur?
1. Bir olayın gerçekleşme olasılığının, olayın
gerçekleşmeme olasılığına bölünmesi ile elde
edilen hastalık riskine ne ad verilir?
a.
b.
c.
d.
e.
a. Odds Oranı (Odds Ratio)
b. Göreli risk oranı
c. Atfedilen Risk
d. insidans
e. prevalans
2. Bir
bölgenin
nüfus
artış
hesaplanmasında
aşağıdakilerden
hangileri kullanılır?
7. Bir ülkenin 2011 yılında 30-34 yaş grubu
kadınların yıl ortası nüfusu 974.150 ve 30-34 yaş
grubundaki kadınlarınn yaşa özel doğurganlık
hızı
78,45’dir. Ülkede 2011 yılı içinde kaç
canlı doğum olmuştur?
hızının
hangisi/
I. Yıl içindeki canlı doğum sayısı
II. Yıl içindeki ölü doğum sayısı
III. Yıl ortası nüfus
a. 7.845
b.
c. 764.220
d. 7.642,2
e.
a. Sadece I
b. Sadece III
c. I, II, III
d. I ve II
e. II vr III
8. Bir bölgede 200 yataklı bir devlet hastanesi ve
50 ve 45 yataklı iki özel hastane bulunmaktadır.
2011 yılı içerisinde bölge nüfusu 480.000
olduğuna göre bölgede onbin nüfusa düşen
yatak sayısı kaçtır?
3. Bir hastalığın risk faktörü var iken görülme
sıklığının, risk faktörü yok iken görülme sıklığına
oranına ne ad verilir?
a.
b.
c.
d.
e.
a. Göreli Risk Oranı
b. İnsidans
c. Prevelans
d. Odds oranı
e. Atfedilen risk
a.
b.
c.
d.
e.
%50
%38,75
%100
%61,25
%163,26
72.578.107
1.865.613
82.442.624
36.797.100
45.878.965
10. Sürmatüre (gecikmiş) doğum
aşağıdakilerden hangisi doğrudur?
a. Gebelik süresi 37 haftadan az olan
doğumlar
b. Gebelik süresi 38 ile 42 hafta arası olan
doğumlar
c. Gebelik süresi 28 haftadan az olan
doğumlar
d. Gebelik süresi 42 haftadan fazla olan
doğumlar
e. Gebelik süresi 32 ile 38 hafta arası olan
doğumlar
5. Bir bölgedeki 2011 yılına ait toplam ölüm
sayısı 18.922’dir. Bölgede kalp hastlıklarından
ölenlerin sayısının 544 olduğu bilindiğine göre
bölgenin ölüm nedenine göre orantılı ölüm hızı
kaçtır?
a.
b.
c.
d.
e.
4,17
1,04
6,15
7,12
61,50
9. 2009 yılı verilerine göre bir ülkede toplam
367.971 ölüm gerçekleşmiştir. Ülkenin aynı yıla
ait Kaba Ölüm Hızı
5,07 olduğuna göre
ülkenin yıl ortası nüfusu kaçtır?
4. A bölgesinde bölgede 2011 yılı içerisinde
pankreas kanserine yakalananların sayısı 320 ve
aynı hastalıktan ölenlerin sayısı 196’dır. Bölgenin
2011 yılı Fatalite hızı kaçtır?
a.
b.
c.
d.
e.
0-6 günlük bebek ölümleri
365 günden daha büyük bebek ölümleri
0-27 günlük bebek ölümleri
7-27 günlük bebek ölümleri
60-364 günlük bebek ölümleri
2.87
%2,87
%28,7
%50
%25
109
için
canlı
canlı
canlı
canlı
canlı
Kendimizi Sınayalım Yanıt
Anahtarı
Sıra Sizde 2
1. a Yanıtınız yanlış ise “Hastalık Riskleri”
başlıklı konuyu yeniden gözden geçiriniz.
2. c Yanıtınız yanlış ise “Nüfusla ilgili hız ve
oranlar” başlıklı konuyu yeniden gözden
geçiriniz.
Eldeki veriler formülde yerine konularak
işlemler yapılırsa bölgenin 2011 yılına ait yıl
KBH ‰1,74 olarak elde edilir.
3. a Yanıtınız yanlış ise “Hastalık Riskleri”
başlıklı konuyu yeniden gözden geçiriniz.
4. d Yanıtınız yanlış ise “Hastalıklarla ilgili
istatistikler” başlıklı konuyu yeniden gözden
geçiriniz.
Sıra Sizde 3
5. b Yanıtınız yanlış ise “Ölümlerle ilgili hız ve
oranlar” başlıklı konuyu yeniden gözden
geçiriniz.
6. d Yanıtınız yanlış ise “Doğumlar” başlıklı
konuyu yeniden gözden geçiriniz.
7. e Yanıtınız yanlış ise “Doğumlarla ilgili hız ve
oranlar” başlıklı konuyu yeniden gözden
geçiriniz.
Bölgenin 2011 yılı Genel Doğurganlık Hızı
‰77,16 olarak elde edilir
8. c Yanıtınız yanlış ise “Hastanedeki sağlık
hizmetlerinin değerlendirilmesi” başlıklı konuyu
yeniden gözden geçiriniz.
Sıra Sizde 4
9. a Yanıtınız yanlış ise “Ölümlerle ilgili hız ve
oranlar” başlıklı konuyu yeniden gözden
geçiriniz.
10. d Yanıtınız yanlış ise “Doğumlar” başlıklı
konuyu yeniden gözden geçiriniz.
Eldeki veriler formülde yerine konularak işlemler
yapılırsa bölgeye ait 2010 yılı ölen sayısı 14.168
olarak elde edilir.
Sıra Sizde Yanıt Anahtarı
Sıra Sizde 5
Sıra Sizde 1
BÖH değerinin 7 den küçük olması için canlı
doğum sayısı olan paydanın hesaplanarak
bulunan
değerden
daha
fazla
olması
gerekmektedir. Bu açıklamaya göre işlemler
yapılırsa;
Eldeki veriler formülde yerine konularak işlemler
yapılırsa bölgenin o yıla ait yıl ortası nüfusu
413.725 olarak elde edilir.
Bölgeye ait 2010 yılı canlı doğum sayısının en az
7000 olması gereklidir.
110
Yararlanılan Kaynaklar
Sıra Sizde 6
Sağlık istatistikleri yıllığı (2010), T.C. Sağlık
Bakanlığı, Bakanlık Yayın no: 832.
Yiğit V., Ağırbaş V.: Hastane işletmelerinde
Kapasite kullanım oranının Maliyetlere etkisi:
Sağlık Bakanlığı Tokat Doğum ve Çocuk
Bakımevi Hastanesinde bir uygulama, Hacettepe
Sağlık İdaresi Dergisi, Cilt 7, Sayı 2, 2004.
.
Sümbüloğlu, K, Sümbüloğlu, V. (2002). Sağlık
İstatistiği, Somgür Yayıncılık, Ankara.
Bölgenin 2011 yılı AIDS hastalığına ilişkin
fatalite hızı %47,49 olarak elde edilir.
Sümbüloğlu, K, Sümbüloğlu, V. (1998). Sağlık
Enfosmasyon Sistemleri, Somgür Yayıncılık,
Ankara.
Özdamar, K. (2010) PASW ile Biyoistatistik,
Kaan Kitabevi, Eskişehir.
Özdamar, K. (1993) Biyoistatistik ve Bilgisayar,
Anadolu Üniversitesi Yayınları No:717, AÖF
yayınları No:353, Eskişehir.
Seçim H., (1991), Hastane yönetim
Organizasyonu, Küre Yayıncılık, İstanbul.
ve
Polat, H. (1998).Sağlık Meslek Liseleri için
Sağlık İstatistiği Ders Kitabı, Ankara.
Sümbüloğlu, K, (2000). Sağlık Alanına Özel
İstatistiksel Yöntemler, ABC matbaacılık San.
Tic. Ltd. Şti., Ankara.
Gür,
E.
Sağlık
Ölçütleri,
http://www.ctf.edu.tr/anabilimdallari/pdf/22/Sagli
k_Olcutleri.pdf (download: 19.12.2011)
http://www.tuik.gov.tr
http://www.tusak.saglik.gov.tr/saglik_istatistikler
i_yilligi_2010.pdf
http://www.who.int/gho/publications/world_healt
h_statistics/en/index.html
http://unstats.un.org/unsd/demographic/products/
dyb/dyb2.htm
111
5
Amaçlarımız
Bu üniteyi tamamladıktan sonra;
Olasılık ile ilgili temel kavramlar açıklayabilecek,
Temel olasılık ilkelerini kullanarak örneklem uzayında tanımlanan herhangi bir olayın
gerçekleşme olasılığı hesaplayabilecek,
Olasılık dağılımlarını tesadüfi değişken tanımına göre sınıflayabilecek,
Binom, Poisson ve Normal dağılıma ilişkin olasılıkları hesaplayabilecek
bilgi ve becerilere sahip olabilirsiniz.
Anahtar Kavramlar
Olasılık
Olasılık Fonksiyonu
Permütasyon
Olasılık Yoğunluk Fonksiyonu
Örneklem Uzayı
Binom Dağılımı
Koşullu Olasılık
Poisson Dağılımı
Venn Diyagramı
Normal Dağılım
İçindekiler
 Giriş
 Olasılığa Giriş
 Olasılık Hesaplama
 Olasılık Fonksiyonu
112
Olasılık Kuramı
GİRİŞ
Önceki ünitelerde istatistiğin betimleyici yönü üzerinde durulmuştu. Bundan sonraki ünitelerde ise
örneklem istatistikleri yardımıyla ana kütle parametreleri hakkında tahmin yapma ve karar alma konuları
aktarılacaktır. Örneklem ile ana kütle arasında bağıntı kurarak tahmin yapmak ancak olasılık kuramı
yardımıyla yapılabileceğinden bu ünitede olasılık kuramı ile ilgili temel kavramlara ve uygulamalarda
sıklıkla kullanılan kuramsal olasılık dağılımlarına yer verilmiştir.
OLASILIĞA GİRİŞ
İstatistik biliminin temelini oluşturan olasılık, belirsizlik durumunda karar almayı sağlar. Rassallığı içeren
olasılık, herhangi bir olayın meydana gelme şansıyla ilgilenir. Genel olarak olasılık, meydana gelmesi
arzu edilen olay sayısının, olayın nihai tüm sonuçlarının sayısına olan oranı olarak tanımlanır.
Örneğin; immün yetmezlik virüsü pozitif olan bir sağlık personelinden hastaya bulaşması, acil hastaların
sağlık kurumalarına nakli sırasında meydana gelebilecek bir kazadan refakatçinin etkilenmesi, atopik
sağlık çalışanlarında lateks alerjisi gelişimi, ileri yaşlarda depresyonla karşılaşılmasına ilişkin tahminler
yapılırken bir belirsizlik durumu söz konusudur. Bu tür belirsizlik durumlarında yoğun bir biçimde
olasılık kuramından yararlanılır.
Belirsizliğin bir ölçüsü olarak tanımlanan olasılık, aslında bize tesadüfi deneyin çok defa
tekrarlanması durumunda bu sonuçlarla hangi şansla karşılaşabileceğimizi tümdengelim yöntemiyle
anlatır. Olasılık kavramını açıklayabilmek için üç temel kavramın tanımlanmasına ihtiyaç vardır. Bunlar
tesadüfi deney, örneklem uzayı ve olaydır.
Deney, Örneklem Uzayı ve Olay
Deney, varsayımsal olarak belirli koşullar altında sonsuz defa tekrarlanabilen ve her denemede hangi
sonucun gerçekleşeceği konusunda belirsizliğin bulunduğu en az iki sonuçtan oluşan bir süreçtir.
Tesadüfi deneye örnek olarak, bir zarın veya bir paranın atılmasını örnek verebiliriz. Bir tesadüfi deneyin
tüm olası sonuçlarını içeren kümeye örneklem uzayı denir ve S harfi ile gösterilir. Deney sonuçlarından
her birine ise olay denir. Olay örneklem uzayındaki temel sonuçların bir alt kümesidir.
Bir deney aynı koşullar altında birçok defa tekrar edildiğinde, sonuçlar belli kurallara bağlı olmaksızın
her seferinde değişebiliyorsa, bu deneyin belirli bir sonucuna bağımlı olarak gerçekleşen (ya da
gerçekleşmeyen) bir olaya tesadüfi olay denir. Örneğin bir para atma deneyinde hilesiz bir paranın 4 defa
üst üste atıldığını varsayalım, bu tesadüfi deneyde belli bir kurala bağlı olmaksızın her seferinde farklı bir
sonuç elde edilecektir.
Bir deneyin tüm olası sonuçlarının oluşturduğu S kümesinin, örneklem uzayı olarak tanımlandığını
belirtmiştik. S’nin her bir elemanına örnek nokta veya örnek denir. S’nin herhangi bir alt kümesine veya
örnek sonuçlardan bazılarının kümesi olaydır. Olay A ile gösterilirse A  S dir.  olayına olanaksız
olay, S olayı da kesin olay denir. Bir kesin olayın meydana gelme olasılığının sayısal değeri 1’ dir.
113
Bir tesadüfi deneyin tüm olası sonuçlarını içeren kümeye örneklem
uzayı denir ve S harfi ile gösterilir.
Örnek 5.1:
Hilesiz bir paranın üç defa atıldığını varsayalım örneklem uzayını belirleyerek olası tüm sonuçları
yazınız.
Çözüm 5.1:
Bu deneyde sekiz farklı olası durum vardır. Bu sekiz olası durum, üçlü farklı sonuçlardan meydana
gelmektedir.
S  YYY , YYT , YTY , TYY , YTT , TYT , TTY , TTT 
Olay, basit ya da bileşik olabilmektedir. Bir deneyin nihai sonuçlarına basit olay denir. Bir bileşik
olay ise birden çok sonuçtan oluşmaktadır. Uzman tabipler nöbet ve icapçı nöbet çizelgesi için iki uzman
tabibin tesadüfi olarak seçildiği ve cinsiyetlerinin kaydedildiğini varsayalım. Örneklem uzayı;
S  EE, EK , KE, KK biçiminde olacaktır. Elde edilen dört nihai sonuç bu deneyin basit olaylarıdır,
basit bir olayın nihai sonuçları Ei ile gösterilir ve sırasıyla E1 , E2 , E3 , E4 şeklinde tanımlanır.

E1 (
EE), E2 ( EK

), E3 ( KE

), E4 ( KK )
Uzman tabipler arasından seçilecek iki tabibin seçilmesi ve cinsiyetlerinin kaydedilmesinin dışında bir A
olayı en çok bir erkek uzman tabibin seçilmesi olarak tanımlansın. Bu durumda A olayı birden çok
sonuçlu olacaktır. A olayı hiç erkek olmaması ya da bir erkeğin olması durumunda gerçekleyecektir ve
bundan dolayı A olayı bir bileşik olaydır, A  EK , KE, KK .
Venn Diyagramı
Venn diyagramı örneklem uzayları ile yapılan işlemleri grafiksel olarak göstermek için kullanılır. Venn
diyagramında kullanılan dikdörtgen, kare ya da daire gibi geometrik şekiller bir tesadüfi deneyin tüm
sonuçlarını gösterir. Basit ve bileşik olaylar için verdiğimiz örnekten hareketle venn diyagramlarını
oluşturursak.
Basit olay için;
S
EE
○
KE
○
EK
○
KK
○
Bileşik olay için;
S
EE
○
KK
○
KE
○
A
EK
○
Olasılık kavramını açıklayabilmek için üç temel kavramın
tanımlanmasına ihtiyaç vardır. Bunlar tesadüfi deney, örneklem uzayı ve olaydır.
114
A. F. Yüzer, E. Şıklar, E. Ağaoğlu, H. Tatlıdil, A. Özmen, Editör: A. F.
Yüzer (2011). İstatistik, Ünite 4, Eskişehir Anadolu Üniversitesi.
Permütasyon ve Kombinasyon
Tesadüfi bir deneyin sonuçlarına ilişkin olasılık hesabı yapılırken elverişli sonuçların sayısı ve olası tüm
sonuçların sayısının bilinmesi için permütasyon ve kombinasyondan yararlanılır. Permütasyon n sayıda
elemandan oluşan bir kümenin herhangi bir alt kümesinde yapılan farklı sıralamadır. n sayıda elemandan
oluşan bir kümenin elemanlarının kendi aralarında sıralandığında elde edilecek permütasyon sayısı
n P n  n ! dir. n tane elemanın hepsini sıralamak yerine sadece r tanesine seçerek ve her sıralanışta her
elemanı sadece bir kez kullanmak koşuluyla farklı sıralanışlar yapılabilir. Kısaca permütasyon ile n
n!
elemanın r li olarak n  r koşuluyla kaç farklı şekilde sıralanabileceği elde edilebilir ve n Pr 
ile
n
  r !
gösterilir.
Kombinasyon ise n tane elaman arasından r tanesinin farklı şekilde seçilebileceğini vermektedir. n’ in r’
n
n
n!
n
li kombinasyonu n  r koşuluyla C   ; C r ; veya   şeklinde gösterilir.
formülü ile
r
r
r
!
n
  r !
 
 
hesaplanır.
Örnek 5.2:
Bir ağız ve diş sağılığı merkezine tedavi için gelen 5 hastanın kuyrukta beklediğini varsayalım;
a.
Bu beş hasta kaç farklı şekilde sıralanabilir?
b.
Bu beş hasta içinden 2 hasta kaç değişik şekilde seçilebilir?
Çözüm 5.2:
Bu sorunun cevabı için permütasyon ve kombinasyon kullanılacaktır.
a.
n
Beş hasta,
P n  n!  5!  5.4.3.2.1  120 farklı şekilde sıralanabilir.
b.
Bu beş hasta içinden olabilecek 2’ li seçim sayısı,
n
 5
n!
5!
5.4.3!
C  
 C  

 10 dur.
r
2
r
!
n

r
!
2!
5

2
!



 2.1.3!
 
 
Örnek 5.3:
1,2,3,4 rakamlarından birbirinden faklı 2 basamaklı kaç sayı oluşturulabilir?
Çözüm 5.3:
Bu örneği çözümü için permütasyon kullanılır.
n
Pr 
n!
4!
4.3.2.1
 4 P2 

 12
 n  r !
 4  2 ! 2.1
115
Bir hastanenin acil servisi için 6 sağlık personeli için nöbet çizelgesi
hazırlanacaktır;
a. 6 sağlık personeli kaç farklı şekilde sıralanabilir?
b. 6 sağlık personeli arasından 3 personel kaç farklı şekilde seçilebilir?
OLASILIK HESAPLAMA
Bir olayın gerçekleşmesi için yapılan tesadüfi bir deneyde birbirinden farklı ve aynı anda olmayan N tane
sonuç içinde bir olayın meydana gelme olasılığı P ile gösterilir ve bu bir olayın meydana gelme şansı
olarak tanımlanır. Basit bir olayın olasılığı P  Ei  ile A bileşik olayının olasılığı ise P  A ile gösterilir.
Herhangi bir basit ya da bileşik olayın olasılığı sıfır ve bir aralığında yer alır; 0  P  Ei   1 ve
0  P  A  1 . Olasılığı sıfır olan bir olay meydana gelmesi olanaksız olan olaydır. Daha öncede
belirtildiği gibi, bir olayın olasılığı bire eşit ise bu olaya kesin olay denir.
Tesadüfi bir deneyde, tüm basit olayların olasılıkları toplamı bire eşittir. Toplamı göstermek için
 (sigma) simgesi kullanılır ve  P  Ei  biçiminde bir basit olayın nihai sonuçlarının toplamları
gösterilir. Örneğin hilesiz bir para atma deneyinde iki nihai sonuç varır, S  Y , T  . Bu deneydeki 2 basit
olayın olasılıkları toplamı bire eşit olacaktır. Para atma deneyinde yazı gelme olasılığı 1 , tura gelme
2
1
olasılığı da aynı şekilde
’ dir. O zaman,
2
 P  E   P  E   P  E   1 dir.
i
1
2
Olasılıkta her zaman sadece tek bir olay ile ilgilenilmez. İki veya daha fazla olaya ilişkin olasıklıkların
hesaplanması istenebilir. Bu durumda S örneklem uzayının A ve B olaylarına ilişkin olasılıklar
hesaplandığında; iki olayın birleşimi A  B , iki olayın kesişimi A  B , A olayının tümleyeni A
biçiminde gösterilir.
Örnek 5.4:
S  1, 2,3, 4,5,6,7,8 , A  1,3,5,7 , B  3,6,7,8 , C= 2, 4,7 olsun.
Aşağıda tanımlanan olaylara
ilişkin S örneklem uzayının alt kümelerini oluşturunuz.
a.
A B
b. A  B
c. B  C
d. B  C
e.  B  C   A
Çözüm 5.4:
a.
A  B  1,3,5,7  3,6,7,8  3,7
b.
A  B  1,3,5,6  1, 2, 4,5  1,5
c.
B  C  3,6,7,8  2, 4,7  2,3, 4,6,7,8
d.
B  C  3,6,7,8  1,3,5,6,8  1, 2,5,6,7,8
e.
 B  C   A  3,6,7,8 1,3,5,6,8 1,3,5,7  1, 2,5,6,7,8  1,3,5, 7  1,5,7
İki olay aynı anda meydana gelmiyorsa bu olaylara ayrık olaylar denir. Daha açık bir ifadeyle A ve B
ile ifade edilen iki olayın kümelerinin ortak elemanları yoksa A ve B olayları ayrık olaylardır ve bu
kümelerin kesişimleri boş kümedir A  B   . Örneğin; hilesiz bir zar atma deneyinde A olayı zarın üst
116
yüzüne 1, 4 veya 6 gelmesi, B olayı ise zarın üst yüzüne 2,3 veya 5 gelmesi olarak tanımlansın. Bu
örnekte A ve B olayları ayrık olaylardır. Çünkü bu iki olayın kümelerinin ortak elemanı yoktur ve
kesişimleri boş kümedir.
İki olay aynı anda meydana gelmiyorsa bu olaylara ayrık olaylar
denir. iki olayın kümelerinin ortak elemanı yoktur ve kesişimleri boş kümedir.
Olasılığın Tanımı
Bir olayın ortaya çıkma olasılığına ilişkin değişik tanımlar zaman içindeki gelişim sırasına göre ele
alınmaktadır. Olasılığın üç farklı tanımı bulunmaktadır: klasik olasılık, oransal frekans yaklaşımı ve
çağdaş olasılık.
Klasik Olasılık
Bir tesadüfi deneyde birbirinden ayrık ve ortaya çıkma bakımından hepsi eşit şansa sahip bütün olası
sonuçların sayısı N olsun. Eğer A olarak tanımlanan bir olay toplam N eşit olasılıklı durumdan M
tanesinde gerçekleşiyorsa, o zaman A olayının olasılığı P(A)=M/N olarak ifade edilir.
Örnek 5.5:
Hilesiz bir zar atma deneyinde tek sayı elde edilmesi olasılığını bulunuz.
Çözüm 5.5:
Hilesiz bir zar atma deneyinde 1,2,3,4,5 ve 6 olmak üzere altı sonuç bulunmaktadır. Tüm sonuçlar eşit
olasılıklı sonuçlardır. A olayı 1,3 ve 5 gelmesi olarak tanımlanır, A  1,3,5 . Bu durumda tek sayı gelme
olasılığı,
P( A) 
3
 0,5
6
olarak bulunur.
Örnek 5.6:
Bir sağlık kurumunda istihdam edilen sağlık 100 sağlık çalışanının 30’u 657/4B, 30’ u sözleşmeli 4924,
20’ sinin döner sermaye ve diğer 20’ sininde 657’ ye göre istihdam edildiği bilinmektedir. Bu personel
arasından tesadüfi olarak biri seçildiğinde, bu kişinin;
a.
Sözleşmeli 4924 personel olması olasılığını bulunuz.
b.
657’ ye tabii personel olması olasılığını bulunuz.
c.
Döner sermaye personeli olması olasılığını bulunuz.
Çözüm 5.6:
Bu örnekte A, B, C ve D olmak üzere 4 olay tanımlanır.
A olayı: seçilen bir kişinin 657/4B’ ye göre istihdam edilmiş olması,
B olayı: seçilen bir kişinin sözleşmeli 4924’ e göre istihdam edilmiş olması,
C olayı: seçilen bir kişinin sözleşmeli döner sermayeye göre istihdam edilmiş olması,
D olayı: seçilen bir kişinin 657’ ye göre istihdam edilmiş olmasıdır. O halde;
117
a.
P  B 
30
 0,30
100
b.
P  D 
20
 0, 20
100
c.
P C  
20
 0, 20
100
Klasik olasılık tanımı eşit olasılıklı olaylarda uygulanabilmektedir. Ancak çoğu problemde eşit şansa
sahip olaylara ender rastlanır. Ayrıca M/N oranı matematiksel işlemlere de yeterince uygun değildir.
Oransal Frekans Yaklaşımı
Bu yaklaşımda tesadüfi deneyin aynı koşullar altında defalarca tekrarlandığı varsayılır. Aynı koşullar
altında tesadüfi bir deney çok defa tekrarlandığında elde edilen sonuçlardan ilgilenilen türden olanların
sayısının (f), deney sayısına (n) oranı deney sayısı sonsuza büyütüldüğünde f/n değerine yaklaşır. f/n
oranının yaklaştığı bu değer ilgilenilen A olayının ortaya çıkma olasılığı olarak tanımlanır ve
f
P( A)  lim olarak gösterilir. Bu gösterimdeki limit matematiksel anlamda olmayıp, deneyin
N  n
olabildiğince çok tekrarlanması anlamındadır. Örneğin bir hastanede A, B, C, D poliklinikleri olsun. Bu
polikliniklerden birisi için randevu alan bir hastanın A polikliniğinden randevu istemesi olasılığını
hesaplayalım. Bu olasılığı hesaplamak için bir haftalık randevu siteminin örneklem olarak ele alınarak
incelendiğini ve A polikliniği için 50, B için 60, C için 90 ve D için 100 hastanın randevu aldığını
varsayalım. Belirlenen bu sayılar frekans olarak değerlendirilir ve P(A)= 50/200=0,25 hesaplanır. Ancak
örneklem olarak bir hafta değil de bir aylık gözlenen randevular alınsaydı frekanslar değişeceğinden
olasılıklarda değişecekti. Bu olasılıklardaki değişmenin azaltılması ancak örneklem hacminin arttırılması
yoluyla sağlanır. Bu örnekte bir hafta ve bir ay yerine bir yıllık gözlem yapıldığında bu olasılıkların
belirli sayılarda durağanlaştığı görülecektir. Kısaca doğru sonuçlara ulaşabilmemiz için çok sayıda
gözlem yapmamız gerekir. Oransal frekans yaklaşımında, n sayıda deneyin aynı koşullar altında
yapılmasının zorluğu ve deney sayısının kaçta sonlandırılacağının bilinememesi gibi yetersizlikler vardır.
Çağdaş Olasılık
Bundan önceki iki tanımın yetersizliklerini gidermek için 1933 yılında Kolmogorov bazı temel özellikler
yardımıyla olasılığı matematiksel bir tabana oturtmuş ve günümüzdeki çağdaş olasılık kuramı
oluşmuştur. Bu temel özellikler aşağıda verilmiştir.
Özellik 1: A, S örneklem uzayında tanımlanmış herhangi bir olay olsun. 0  P  A  1
Özellik 2: P  S   1
Özellik 3: A ve B, S örneklem uzayında tanımlanmış iki ayrık olay olsun. Bu durumda,
P  A  B   P  A  P  B 
Özellik 4: A, S örneklem uzayında herhangi bir olay ve A bu olayın tümleyeni ise, A olayının
gerçekleşme olasılığı P  A   1  P  A dır.
Özellik 5: P     0
Özellik 6: A ve B, S örneklem uzayında tanımlanmış ayrık olmayan herhangi iki olay olsun. Bu
durumda
P  A  B   P  A  P  B   P  A  B 
Özellik 7: A, B ve C olayları S örneklem uzayında tanımlanmış ayrık olmayan üç olay olsun. Bu
durumda,
P  A  B  C   P  A  P  B   P  C   P  A  B   P  A  C   P  B  C   P  A  B  C 
118
Örnek 5.7:
İki tavla zarının birlikte atıldığını varsayalım. A olayı üst yüze gelen sayıların toplamının 8 olması ve B
olayı üst yüze gelen sayıların aynı olması olayları olarak tanımlansın. Bu iki olayın birleşiminin
olasılığını bulunuz.
Çözüm 5.7:
S örneklem uzayı 36 nihai sonuçtan meydana gelmektedir. A olayın gerçekleşme durumu,
A   2,6  ,  3,5 ,  4, 4  , 5,3 ,  6, 2  ,
B olayının gerçekleşme durumu ise
B  1,1 ,  2, 2  ,  3,3 ,  4, 4  , 5,5 ,  6,6  olur.
Bu durumda A ve B olaylarının birleşiminin olasılığı
P  A  B   P  A  P  B   P  A  B  eşitliğiyle elde edilir.
P  A 
5
6
1
dır.
, P  B  , P  A  B 
36
36
36
P  A  B 
5
6
1 10
 

 0, 28 bulunur.
36 36 36 36
1. Bir hastanede 30’u erkek ve 15’i kadın olmak üzere 45 sağlık personeli
bulunmaktadır. Bu 45 sağlık personeli içinden tesadüfi olarak seçilen bir
çalışanın erkek olma olasılığı nedir?
2. A ve B olayları için olasılıklar
P  A 
veriliyor. P  A  B  olasılığını bulunuz.
1
2
2
, P  B 
ve P  A  B  
olarak
3
5
3
Koşullu Olasılık
İki bağımlı olaydan birincisinin gerçekleştiği bilindiğinde ikincisinin ona bağlı olarak gerçekleşme
olasılığına koşullu olasılık denir. Bir olayın gerçekleşme şansı başka bir olayın gerçekleşmesine bağlı
olduğunda koşullu olasılık kullanılmaktadır. A ve B olayları herhangi iki olay olsun. A olayının
gerçekleştiği bilindiğinde, B olayının ortaya çıkma olasılığı koşullu olasılık olarak tanımlanır ve
P  B A ile gösterilir. Koşullu olasılık A ve B olayları için aşağıdaki gibidir.
P  A B  : B olayı biliniyorken A olayının ortaya çıkma olasılığı,
P  B A : A olayı biliniyorken B olayının ortaya çıkma olasılığı,
ve bu iki olasılık, P  A , P  B  ve P  A  B  olasılıklarına bağlı olarak,
P  A B 
P  A  B
P  B
, P( B)  0
119
P  B A 
P  A  B
P  A
, P( A)  0
şeklinde tanımlanır. Aynı zamanda bu tanımlamadan hareketle,
P  A  B  P  A B P  B
ve
P  A  B   P  B A P  A olur.
Örnek 5.8:
Hilesiz bir zar atıldığında zarın üst yüzüne tek sayı gelmiş ise bu sayının 3 olma olasılığı nedir?
Çözüm 5.8:
S örneklem uzayı 6 nihai sonuçtan meydana gelmektedir, S  1, 2,3, 4,5, 6 . Burada A ve B olaylarının
tanımlanması gerekir. A olayı atılan zarın 3 gelmesi ve B olayı ise zarın tek sayı olmasıdır.
Zarın 3 gelmesi olasılığı A  3 , P  A 
1
,
6
Zarın tek sayı gelmesi olasılığı B  1,3,5 , P  B  
3
dır.
6
A ve B olaylarının kesişimi ise,
P  A  B 
1
olur.
6
Bu durumda atılan zar tek gelmiş ise bunun 3 olma olasılığı;
P  A  B
P  A B 
P  A B 
P  B
, P( B)  0 ( B olayı bilindiğinde A olayının ortaya çıkma olasılığı)
16 1

36 3
olarak elde edilir.
Örnek 5.9:
Bir hastanedeki hastaların % 40’ ı sindirim sistemi, % 30’ u diyabet ve % 30’u kalp damar rahatsızlıkları
nedeniyle tedavi edilmektedir. Ayrıca hastaların % 10’ u hem sindirim sistemi hem de kalp damar
rahatsızlığı, % 20’ sinde hem diyabet hem de kalp damar rahatsızlığı vardır.
a.
Tesadüfi olarak seçilen bir hasta diyabetliyse bu hastanın aynı zamanda kalp damar
rahatsızlığına sahip olma olasılığı nedir?
b.
Tesadüfi olarak seçilen bir hasta kalp damar rahatsızlığına sahip ise, bu hastanın sindirim sistemi
rahatsızlığına sahip olma olasılığı nedir?
Çözüm 5.9:
S örneklem uzayında A, B ve C olayları öncelikle tanımlanmalıdır.
A olayı: Sindirim sistemi rahatsızlığının olması,
B olayı: Diyabetli olması,
120
C olayı: Kalp damar rahatsızlığının olması.
P( A)  0, 40, P( B)  0,30, P(C)  0,30 ve bu olayların ilgili kesişimleri,
P  A  B   0,10 ve P  B  C   0, 20 tir.
Bu durumda seçilen hasta diyabetli ise aynı bunun kalp damar rahatsızlığına da sahip olma olasılığı;
P C B  
PB C
P  B
0, 20
 0, 67
0,30

dir.
Bu durumda seçilen hasta diyabetli ise aynı bunun kalp damar rahatsızlığına da sahip olma olasılığı;
P A C 
P AC
P C 
0,10
 0,33 tur.
0,30

Ayrık ve Bağımsız Olaylar
İki ya da daha fazla olay bir arada meydana gelemiyorsa bu olaylara ayrık olaylar denir. Bu bir olayın
otomatik olarak diğer olayın meydana gelmesini engellemek anlamına gelir. Bir araştırmacı A
polikliniğine gelen hastaları cinsiyetlerine (kadın, erkek) ve yaşlarına (40’ın altında, 40 ve daha üstü)
sınıflandırıyor. Polikliniğe gelen hastalar arasından tesadüfi olarak seçilen bir hasta her iki özelliğe de
sahip olabileceğinden bu iki olay ayrık değildir. Ayrık olaylar için A veya B’nin olasılığı
P( A  B)  P( A)  P( B) , ayrık olmayan olaylar için ise A veya B’nin olasılığı
P( A  B)  P( A)  P( B)  P( A  B) şeklinde hesaplanır.
A polikliniğine gelen 100 hastanın yaş ve cinsiyetleri aşağıdaki iki yönlü tablodaki gibi verilmiş
olsun. Polikliniğe gelen hastalardan birisi tesadüfi olarak seçilse, bu hastanın;

Erkek ve 40 yaş altında olma olasılığını,

Erkek veya 40 yaş altında olma olasılığını
bulalım;
Cinsiyet / Yaş Grubu
40 yaş altı
40 yaş ve üstü
Toplam
Erkek
20
10
30
Kadın
40
30
70
Toplam
60
40
100
A ; Hastanın erkek olması olayı,
B ; Hastanın 40 yaş altında olması olayı
olarak tanımlansın.
Erkek ve 40 yaş altında olma olasılığı P( A  B) 
20
100
Erkek veya 40 yaş altında olma olasılığı
P( A  B)  P( A)  P( B)  P( A  B) 
30 60 20
70



100 100 100 100
Şeklinde hesaplanır.
A ve B gibi herhangi iki olaydan birinin gerçekleşmesi diğer olayın ortaya çıkma olasılığını
etkilemiyorsa bu iki olaya bağımsız olaylar denir. Bağımsız olaylar için A olayı bir hilesiz zarın üst
yüzüne gelen sayının 3 olması, B olayı ise bir madeni paranın tura gelmesi olsun. A olayının olması B
121
olayının ortaya çıkıp çıkmamasını etkilemez. Tam tersi B olayı da A olayının ortaya çıkıp çıkmamasını
etkilememektedir. Bundan dolayı A ve B olayları bağımsız olaylardır. Bu durumda P  A B   P  A ve
P  B A  P  B  ise A ve B olayları bağımsız olaylardır. Daha önce tanımlamış olduğumuz
P  A  B  P  A B P  B
eşitliğinde bağımsız olaylar söz konusu olduğunda
P  A B   P  A
olduğundan eşitlik P  A  B   P( A) P  B  şeklinde olacaktır.
P  A  B   P( A B) P  B  P( A) P( B)
Bu eşitlik iki olayın bağımsızlığı için gerek ve yeter koşuldur.
Örnek 5.10: Bir sağlık kuruluşunda A çalışanın 30 gün içinde 4’ ten fazla nöbet tutma olasılığı % 60, B
çalışanının ise 30 gün içinde 4’ ten fazla nöbet tutma olasılığı % 70’ tir. Her iki çalışanında 30 gün içinde
4’ ten fazla nöbet tutma olasılığı nedir?
Çözüm 5.10: A ve B olayları öncelikle tanımlanmalıdır.
A olayı: A çalışanının 30 gün içinde 4’ ten fazla nöbet tutması, P( A)  0,60
B olayı: B çalışanının 30 gün içinde 4’ ten fazla nöbet tutması, P( B)  0,70
A ve B olayları bağımsız olaylarıdır. Bu durumda olasılık,
P  A  B   P( A) P( B)  0,60  0,70  0, 42 dir.
Eğer bir olayın ortaya çıkması öteki olayın ortaya çıkma olasılığını
etkilemiyorsa, bu iki olaya bağımsız olaylar denir. A ve B olaylarının bağımsız
olabilmeleri için durumda P  A B   P  A veya P  B A  P  B  koşulu sağlanmalıdır.
Bir sözleşmeli personelin daimi kadroya 2 yıl içinde geçme olasılığı
0,80 ve başka bir sözleşmeli personelin ise daimi kadroya 2 yıl içinde geçme olasılığı
0,60’ tır. Her iki sözleşmeli personelinde 2 yıl içinde daimi kadroya geçme olasılıkları
nedir?
OLASILIK FONKSİYONU
Olasılığa giriş ve olasılık hesaplama konularından sonra, tesadüfi değişken, olasılık fonksiyonları,
birikimli olasılık fonksiyonu ve ortak olasılık fonksiyonu kavramı olasılık ile ilgili diğer önemli
konulardır.
Tesadüfi Değişkenler
Tesadüfi değişken, S örnek uzayındaki her bir tesadüfi olaya sayısal değerler atayan bir fonksiyondur. Bu
fonksiyon aracılığıyla örnek uzayındaki her bir sonuç reel eksende bir değere taşınır. Kısaca tesadüfi
değişken, S örneklem uzayının her bir olayını yalnız bir gerçek değere dönüştürür. Tesadüfi bir
denemenin yapılarak olası sonuçlara sayısal değerler verileceğini düşünelim. Bir zar atma ya da bir
ailenin gelirini ölçme gibi denemelerde sonuçlar doğal olarak sayısal biçimdedir. Böyle olmadığı
durumlarda bile sonuçlara sayılar vermek, özellikle yalnızca iki sonuçlu denemelerde, anlamlı ve yararlı
olabilir. Sözgelimi, bir işletmede üretilen bir parça “kusurlu” ya da “kusursuz” diye sınıflandırılabilir. Bu
olanaklardan ilkine 1, ikincisine 0 değerini verebiliriz. O zaman tesadüfi değişken: tesadüfi bir
denemenin sonuçlarına göre belirlenen sayısal değerleri alan bir değişkendir. Tesadüfi bir değişken ile
onun alabileceği değerleri birbirinden ayırmak önemlidir. Simgesel olarak bunu X gibi büyük harflerle,
122
onun alabileceği değerleri ise x gibi küçük harflerle göstererek yapabiliriz. Tesadüfi değişkenin aldığı tüm
değerler X’ in değer kümesini oluşturur ve X tesadüfi değişkeninin değer kümesi bir olasılık uzayıdır.
Bir X değişkeni, alabileceği her bir değeri belli bir olasılıkla alıyorsa
bu değişkene tesadüfi değişken adı verilir.
Bir tesadüfi değişken yalnızca sayılabilir sayıda değerler alabiliyorsa kesiklidir. Kesikli tesadüfi
değişkenlere örnekler, büyük bir parti mal içinden alınan yirmilik bir örneklemdeki kusurlu parça sayısı,
bir polikliniğe bir saat içinde gelen hasta sayısı vb.
Bunların tersine, günlük hava sıcaklığıyla ilgilendiğimizi düşünelim. Sıcaklık, sürekli bir ölçekle
ölçülür ve sürekli bir tesadüfi değişkendir. Bir tesadüfi değişken tanımlı bir aralıktaki tüm değerleri
alabiliyorsa süreklidir. Bir ailenin yıllık geliri, ithal edilen ilaç hammadde miktarı, bir hisse senedi
fiyatının aylık değişimi, bir hastaya konulan tanı ile iyileşmesi arasında geçen süre, bir kimyasal
maddenin kirlilik oranı sürekli tesadüfi değişkenlere verilebilecek örneklerdir.
Olasılık Fonksiyonu Tanımları
Olasılık fonksiyonu, bir değişkenin alabileceği değerler ile bu değerleri alabilmesi olasılıkları
arasındaki ilişkiyi gösteren bir fonksiyondur. Bu fonksiyon bir tesadüfi değişkenin alabileceği tüm
değerlere ilişkin olasılıkların tek tek gösterilmesi yerine, olasılıkların hesaplanmasında kullanılacak bir
eşitliktir. Olasılık fonksiyonları tesadüfi değişken tanımına göre; kesikli olasılık fonksiyonu (olasılık
fonksiyonu) ve sürekli olasılık fonksiyonu (olasılık yoğunluk fonksiyonu) olarak iki şekilde tanımlanır.
Kesikli Olasılık Fonksiyonu
X , kesikli bir tesadüfi değişken bunun alabileceği değerlerden biride x olsun. X tesadüfi değişkeninin
belli bir x değerini alma olasılığı P (X = x) ile gösterilir. Tesadüfi bir değişkenin, olanak içindeki bütün
sonuçları olasılık fonksiyonları kullanılarak gösterilir. Bu gösterim cebirsel, çizimsel yada çizelge
biçiminde olabilir. Kesikli tesadüfi değişkenler için uygun bir gösterim, olanak içindeki bütün sonuçların
olasılıklarının x’in değerlerine göre dizmektir.
X’ in tüm olası x değerleri için tanımlanan
P( x)  P( X  x) fonksiyonu, X değişkeninin olasılık fonksiyonu olarak tanımlanır.
X, olasılık fonksiyonu P(x) olan kesikli bir tesadüfi değişken olsun. Bu durumda,
1.
Her x değeri için P( x)  0
2.
Tekil olasılıkların toplamı 1’dir; yani
 P( x)  1
x
Buradaki gösterim x’in bütün değerleri için toplama yapıldığı anlamına gelir.
Özellik (1), yalnızca, olasılıkların negatif olamayacağını gösterir. Özellik (2), x’in bütün olanaklı
değerleri için “X=x” olaylarının bağdaşmaz ve bütünü kapsayıcı olduğu olgusundan türemiştir.
Dolayısıyla bu olayların olasılıkları toplamı 1 eder.
Örnek 5.11:
Bir hilesiz zar atıldığında tek sayı gelme olasılığı bulunuz.
Çözüm 5.11:
Hilesiz bir zar atma deneyinde S örneklem uzayı, S  1, 2,3, 4,5, 6 dır.
A olayı zarın tek gelmesi ise, A  1,3,5 dir.
P( A)   P( x) 
x A
1 1 1 3
    0,5 bulunur
6 6 6 6
123
Örnek 5.11:
Bir çift hilesiz zar deneyinde, zarların yüzeyindeki sayıların toplamının 8 olması olasılığını bulunuz.
Çözüm 5.11:
İki zar atıldığında 36 nihai sonuçtan oluşan bir örneklem uzayı elde edilir. Bu örneklem uzayında A olayı
ise zarların üst yüzeyindeki sayıların toplamının 8 olasıdır.
A   2,6  ,  3,5 ,  4, 4  , 5,3 ,  6, 2 
O zaman,
P( A)   P( x) 
xA
1 1
1
1
1
5
   

 0,14 olur.
36 36 36 36 36 36
Örnek 5.12:
Bir hastanede çalışan 100 sağlık personelinin, 30’ u sağlık meslek lisesi acil tıp mezunu, 50’ si sağlık
meslek lisesi hemşirelik mezunu ve 20’ si de sağlık meslek lisesi laboratuar mezunudur. Ayrıca
çalışanların 60’ ı kadındır. Bu hastaneden tesadüfi olarak seçilen bir personelin;
a.
Sağlık meslek lisesi acil tıp mezunu olma olasılığını,
b.
Erkek çalışan olma olasılığını,
c.
Sağlık meslek lisesi laboratuar mezunu olmama olasılığını bulunuz.
Çözüm 5.12:
30
 0,30
100
a.
P  x : Acil Tıp Mezunu  
b.
P  x : Erkek Çalışan  
c.
P  x : Laboratuar Mezunu Olmama  
40
 0, 40
100
80
 0,80
100
Sürekli Olasılık Fonksiyonu - Olasılık Yoğunluk Fonksiyonu
X, sürekli bir tesadüfi değişken ve x te bu tesadüfi değişkenin alabileceği değerler aralığındaki herhangi
bir sayı olsun. Bu tesadüfi değişkenin olasılık yoğunluk fonksiyonu, f ( x) , aşağıdaki özellikleri taşıyan
bir fonksiyondur:
i.
x’in bütün değerleri için f ( x)  0
ii.
 f ( x)dx  1 dir.
x

Sürekli bir tesadüfi değişkenin olasılık yoğunluk fonksiyonu,

f ( x)dx şeklinde ifade edilir. Bu

fonksiyon aracılığıyla X değişkeninin a ile b arasında bir değeri alma olasılığı ise,
b
P{ a  X  b }=
 f ( x)dx
ile bulunur. f(x)’in sürekli olasılık fonksiyonu olabilmesi için aşağıdaki
a
şartları sağlaması gerekir:
124
f(x)’in integrali alınabilir ve f(x)=0 her x  R için,
I.
II.
f(x)  0 her x R için ya da
   x   için,
 f ( x)dx  1
III.
R
Birikimli Olasılık Fonksiyonu
Bir değişkenin X gibi bir değere eşit ya da daha küçük bir değeri alabilmesi olasılığını gösteren fonksiyon
birikimli dağılım fonksiyonudur. X’ in birikimli olasılık fonksiyonu gerçel sayılar kümesinde x’e eşit
veya ondan küçük değerleri alan ve S örneklem uzayında X tesadüfi değişkeni ile ilişkili olan olasılıktır.
Birikimli olasılık fonksiyonu F(x) ile gösterilir.
F ( x)  P  X  x 
Kesikli ve sürekli tesadüfi değişkenler için birikimli olasılık fonksiyonu aşağıdaki gibidir;
Kesikli birikimli olasılık fonksiyonu: F ( x)   P( x)
x
Sürekli birikimli olasılık fonksiyonu: F ( x) 

f (t )dt .

Bir değişkenin a…b aralığında bir değer alabilmesi olasılığı, birikimli olasılık fonksiyonu ile aşağıdaki
gibi gösterilir;
P  a  x  b   F b   F  a 
Olasılık Dağılımları
Yapılan her tesadüfi deneyde ortaya çıkan sonuçlar için yeni bir fonksiyon aramak hem emek hem de
zaman kaybına yol açacağından çeşitli tesadüfi deneylerin aynı koşullar altında aynı özellikler
göstermelerinden yararlanılarak kuramsal olasılık dağılımları geliştirilmiştir. Bu kuramsal olasılık
dağılımları benzer özellikteki diğer deneylerde de kullanmak amacıyla genelleştirilmiştir. Çok sayıda
kuramsal olasılık dağılımdan söz etmek olanaklı ise de bu ünitede kesikli olasılık dağılımlarından Binom
dağılımı ve Poisson dağılımı, sürekli olasılık dağılımlarından ise Normal dağılım ele alınacaktır.
Binom Dağılımı
Yapılan deneylerin sonuçları, olumlu-olumsuz, başarılı-başarısız, iyi-kötü, ölü-sağ, pozitif-negatif gibi
ortaya çıkıyorsa, bu tür deneyler sonucunda elde edilen dağılımlar Binom dağılımıdır. Tesadüfi bir
deneyin başarılı ve başarısız olarak iki ayrık ve bütüne tamamlayıcı bir şekilde sonuçlanabileceği ve tek
bir deneydeki başarı olasılığının p olduğunu düşünelim. Eğer birbirinden bağımsız n tane deney yapılırsa,
ortaya çıkan başarı sayısı X’ in dağılımına Binom dağılımı denir. Binom dağılımı kesikli olasılık
dağılımıdır. Binom dağılımı, tüm denemelerin aynı koşullarda tekrarlandığı ve her tekrarda birbirinden
bağımsız iki olaydan birinin meydana geldiği deneylerde ortaya çıkmaktadır. Örneğin Binom deneyine,
bir kadının klasik tüp bebek işlemi sonrasında gebe kalması (başarı) veya kalmaması (başarısılık) örnek
olarak verilebilir. 20 adet gebe kalma olasılığı aynı olan kadına klasik tüp bebek işlemi yapıldığını
varsayalım burada tesadüfi değişkenimiz başarılı gebeliklerin sayısıdır ve Binom dağılımına sahiptir.
Bir deneyin olumlu sonuçlanma olasılığı p, olumsuz sonuçlanma olasılığı da q (1-p) ile gösterilir.
Örneğin hilesiz bir para atma deneyinde ilgilenilen olay paranın tura gelmesi olsun. Bu durumda p = 0,5,
q = 1-p = 0,5 ve p+q =1 olacaktır.
Binom dağılımı aşağıdaki özelliklere sahiptir:
1.
Her bir deneme için yalnız iki sonuç vardır. Başarı (p) , Başarısızlık (q)
2.
Başarma olasılığı p her bir deneme için aynıdır. Başarısızlık olasılığı q=1-p dir.
125
3.
Denemeler birbirinden bağımsızdır.
4.
Denemelerin sayısı n sabittir.
Aşağıdaki deneyler Binom tesadüfi değişkenleriyle ilgilidir.
1.
Bir para 10 kez atılsın. X tesadüfi değişkeni gözlenen turaların sayısıdır,
2.
İçinde 4 kusurlu ve 8 kusursuz parça bulunan bir kutudan iadeli 5 parça seçelim. X tesadüfi
değişkeni seçilen kusurlu parçaların sayısıdır,
3.
İçinde 7 kırmızı ve 5 sarı top bulunan bir kavanozdan iadeli 4 top çekilsin. X tesadüfi
değişkeni çekilen kırmızı topların sayısıdır.
4.
Bir aşını yan tesir gösterme olasılığı 0,10 dur. 20 kişiye bu aşının denendiği varsayılsın. X
tesadüfi değişkeni yan tesir gösteren hasta sayısı olarak tanımlansın. Bu tanıma göre X
Binom dağılır.
X, bir tek denemede başarma olasılığı p, başaramamanın olasılığı q olan n bağımsız deneme için
Binom tesadüfi değişkeni ise,
X’in olasılık fonksiyonu;
 n  x n  x
  p q
p  x    x 
0

,x  0,1,2,...,n
,diğer durumlarda
dir.
X kesikli tesadüfi değişkeni Binom dağılımına sahip ise ortalaması,
standart sapması
  npq
ve değişim katsayısı
  np , varyansı  2  npq
,
1 p
dir.
np
Örnek 5.13:
Bir sigortacı hayat poliçesi satmak için 5 görüşme yapmaktadır. Bunların her biri için satış yapma
olasılığı 0,4 olduğunu düşünelim. O zaman satış sayısı X, n=5, p=0,4 olan bir Binom dağılımına uyar.
P( x) 
5!
0, 4 x (0,6)5 x x=0,1,2,3,4,5 için başarı (yapılan satış) sayılarının olasılıkları
x !(n  x)!
aşağıdaki gibi hesaplanır:
P(0) 
5!
0, 40 (0, 6)5  0, 078
0!5!
P(2)  0,346
P(3)  0, 230
P(1) 
5!
0, 41 (0, 6) 4  0, 259
1!4!
P(4)  0,077
P(5)  0,010
Bir sigortacının 2 ile 4 arasında satış yapma olasılığı,
P(2  X  4)  P( X  2)  P( X  3)  P( X  4)
P(2  X  4)  0,346  0, 230  0, 077  0, 653
Sigortacının en az bir satış yapması olasılığı ise,
P( X  1)  1  P( X  0)  1  0,078  0,922 şeklinde hesaplanır.
126
Örnek 5.13 deki verilen problemin excel programında çözümü için önce fonksiyon ekle (fx) tuşuna
basılarak buradan istatistiksel fonksiyonlar seçilir. Daha sonra istatistiksel fonksiyonlar arasından Binom
dağılımı seçilerek aşağıda verilmiş olan resimdeki gibi ilgili alanlar belirlenerek olasılıklar hesaplanır.
Örnek 5,13 de verilen problemin Binom dağılımı yardımıyla excel çözümü yapılarak kümülatif
başlığı altında olasılıklar hesaplanır. Bu hesaplanan olasılıkların daha görsel sunumu ve yorumlanması
için grafik çizilmek istendiğinde ise başarı sütünü ile kümülatif sütünü seçilerek ekle grafik menüsüne
basılır ve istenilen grafik türü belirlenir. Böylece hesaplanan olasılıklar ve başarıya (yapılan satışlar)
ilişkin grafik aşağıda ki resimde verildiği gibi elde edilir.
127
Örnek 5.14:
Fizyoterapist eşliğindeki Plates gruplarına katılan kadınların % 40’ ı zayıflama programını
tamamlayabilmektedir. Tesadüfi olarak 6 kadın seçildiğinde, bunların yarısından fazlasının zayıflama
programını tamamlaması olasılığı nedir?
Çözüm 5.14:
Bu olayda tamamlama ve tamamlamama olmak üzere iki sonuç vardır. X, zayıflama programını
tamamlayan kadınların sayısını göstersin, p  1  0, 40  0,60 ’ tır. 6 kadının yarsından fazlasının
tamamlamasının olasılığı P  X  3 tür. O halde;
128
P  X  3  P  X  4  P  X  4  P  X  5  P  X  6
6
6
6
4
2
5
1
6
0
    0, 6   0, 4      0, 6   0, 4      0, 6   0, 4 
4
5
6
 
 
 
 0,311  0,187  0, 047  0,545
Binom dağılımı, tüm denemelerin aynı koşullarda tekrarlandığı ve her
tekrarda birbirinden bağımsız iki olaydan birinin meydana geldiği deneylerde karşımıza
çıkar.
F. Er, K.Ö, Peker, Editör: H. Sönmez (2009). Biyoistatistik, Ünite 4,
Eskişehir Anadolu Üniversitesi.
Bir hastanede çalışanların % 25’ i hizmet içi eğitime katılmıştır.
Tesadüfi olarak seçilen 5 kişiden 1 tanesinin hizmet içi eğitime katılmış olma olasılığını
bulunuz.
Poisson Dağılımı
Binom dağılımında p olasılığının oldukça küçük olması (genellikle p<0,05) durumunda Binom dağılımı
uygun bir kuramsal olasılık modeli olmamaktadır. Tesadüfi değişken belli bir zaman aralığında veya belli
bir mekânda çok az yinelenen olayları göstermesi durumunda ortaya çıkan olasılık dağılımı Poisson
dağılımı olarak adlandırılır. Pek çok deney uzayın sürekli bir bölgesinde ya da sürekli bir zaman
aralığında sonsuz sayıdaki olanaklı 0,1,2,3,... değerlerinin verilmesiyle oluşur. Birim zaman, dakika, saat,
gün, hafta; birim uzay, uzunluk, alan, hacim olabilir. Poisson dağılımı sürekli uzayda kesikli veriler veren
deneylere uygulanır.
Verilmiş bir zaman aralığında ya da uzayın verilmiş bir bölgesinde başarıların sayısı, X rassal
değişkeni olsun. Aşağıdaki koşulları sağlayan X’e Poisson dağılmış tesadüfi değişkeni denir.
1.
Farklı bir zaman veya mekân diliminde ilgilenilen türden sonuçların gerçekleşmesi birbirinden
bağımsızdır.
2.
Küçük bir zaman aralığı veya uzayın küçük bir bölgesi için başarı olasılığı, uzaydaki bölge ya da
zaman aralığının uzunluğu ile orantılıdır.
3.
Küçük bir zaman aralığı veya uzayın küçük bir bölgesinde iki ya da daha çok başarının olasılığı
önemsizdir.
4.
Küçük bir zaman ya da mekan diliminde ilgilenilen türde sonuçların bir defa gerçekleşme
olasılığı olan p sabittir ve yaklaşık olarak p<0,05 eşitsizliğine uymaktadır.
Aşağıdaki örnekler Poisson tesadüfi değişkenleriyle ilgilidir;
1.
Büyük bir şehirde ender rastlanan bir hastalıktan her yıl meydana gelen ölümlerin sayısı,
2.
Bir üretimdeki kusurlu ürün sayısı,
3.
Bir kitabın her bir sayfasındaki eksik basımların (yanlış basımların) sayısı.
4.
Bir kentte bir hatta meydana gelen ölümcül kazaların sayısı.
5.
Dahiliye polikliniğine gelen hastalarda aylık göğüs kanseri görülme sayısı.
129
X, 0,1,2,... olanaklı değerleri alabilen Poisson teadüfi değişkeni olsun, X’ in olasılık fonksiyonu,
 e   x

P( x)   x !
0

,x  0,1,2,...;   0
,diğer durumlarda
 , Poisson dağılımının tek parametresidir ve Poisson dağılımına sahip X değişkeninin ortalamasıdır.
X kesikli tesadüfi değişkeni Poisson dağılımına sahip ise ortalaması  , varyansı  ve değişim katsayısı
1
dır.

Toplumda az sayıda ya da seyrek olarak gözlenen olayların belli bir
zaman aralığındaki gözlenme sayılarının uyduğu kuramsal dağılıma Poisson dağılımı
denir.
Örnek 5.15:
Bir hastanede yeni doğan servisinde akciğer enfeksiyonundan bir hafta içinde ölenlerin sayısı   4 olan
Poisson dağılımına uymaktadır. Belli bir hafta içinde akciğer enfeksiyonundan hiçbir yeni doğanın
ölmemiş olma olasılığı nedir?
Çözüm 5.15:
X: Bir haftada akciğer enfeksiyonundan ölenlerin sayısı
P( x) 
e   x
, x  0,1,2,...
x!
  4 ve X  0 olasılık fonksiyonunda yerine konursa;
P( X  0) 
e4 40
 0, 0183 olasılığını elde ederiz. Burada e sabit bir sayı olup değeri 2,71828’ dir.
0!
Örnek 5.16:
Bir hastanenin acil servisine Pazar günleri saat: 16.00 - 17.00 arasında 20 dakikada bir ortalama 3 acil
vaka gelmektedir. Saat 16.00-17.00 arasında herhangi bir 20 dakika içinde acil servise 0,1,2,3,4 ve 5
vakanın gelmesi olasılıklarını hesaplayınız.
Çözüm 5.16:
X: Acil servise Pazar günleri saat: 16.00 - 17.00 arasında 20 dakikada bir gelen hasta sayısı
P( x) 
e   x
, x  0,1,2,...
x!
  3 ve X  0,1, 2,3, 4,5 olasılık fonksiyonunda yerine konursa;
P( X  0) 
e3 30
 0, 0498
0!
P( X  1) 
e3 31
 0,1494
1!
P( X  2) 
e3 32
 0, 2241
2!
P( X  3) 
e3 33
 0, 2241
3!
P( X  4) 
e3 34
 0,1681
4!
P( X  5) 
e3 35
 0,1008
5!
olasılıkları elde edilir.
130
Örnek 5.16 deki verilen problemin excel programında çözümü için önce fonksiyon ekle (fx) tuşuna
basılarak buradan istatistiksel fonksiyonlar seçilir. Daha sonra istatistiksel fonksiyonlar arasından
Poisson dağılımı seçilerek aşağıda verilmiş olan resimdeki gibi ilgili alanlar belirlenerek olasılıklar
hesaplanır.
Örnek 5,16 de verilen problemin Poisson dağılımı yardımıyla excel çözümü yapılarak kümülatif
başlığı altında olasılıklar hesaplanır. Bu hesaplanan olasılıkların daha görsel sunumu ve yorumlanması
için grafik çizilmek istendiğinde ise X sütünü ile kümülatif sütünü seçilerek ekle grafik menüsüne basılır
ve istenilen grafik türü belirlenir. Böylece hesaplanan olasılıklar ve başarıya (yapılan satışlar) ilişkin
grafik aşağıda ki resimde verildiği gibi elde edilir.
131
Örnek 5.17:
Bir polikliniğe 5 dakikada ortalama 2 hasta gelmektedir.
a.
5 dakikalık sürede gelen hasta sayısının olasılıklarını gösteriniz.
b.
5 dakika içinde ikiden çok hasta gelmesi olasılığını bulunuz.
Çözüm 5.17 :
Bekleme yada kuyruk oluşturma sorularının çözümünde Poisson dağılımı kullanılır. 5 dakikalık sürede
gelen hasta sayısını X ile gösterelim, ortalaması   2 olan bir Poisson dağılımına uyar. Olasılık
fonksiyonu:
132
a. P( x) 
e2 (2) x
x!
P( X  0) 
x= 0, 1, 2,...........
e2 (2)0
 0,1353
0!
P( X  1) 
e2 (2)1
 0, 2706
1!
P( X  2) 
e2 (2)2
 0, 2706
2!
b. P( X  2)  1   P(0)  P(1)  P(2)  0,3233 dir.
X, Binom dağılımına sahip tesadüfi değişken olsun. Deney sayısı n’nin çok arttırıldığını ve ilgilenilen
sonuçların ana kütledeki oranının çok küçük olduğunu varsayalım. Kısaca n   ve p  0 iken
n. p   sabit bir sayı olmak üzere Binom dağılımı Poisson dağılımına yaklaşır. Bu nedenle Binom
dağılımı yerine ortalaması n. p   olan Poisson dağılımı kullanılır. Örneğin, Bir serumun hastaya
verilmesi sonucu yan etkiye neden olma olasılığı 0,02 olduğu varsayılsın. 100 hastadan tesadüfi olarak
seçilen 4 tanesinde ilacın yan etki göstermesi olasılığını hesaplayalım;
n. p   olduğunu biliyoruz, o zaman 0,02  100=2=  bulunur. X, yan etki gösteren hasta sayısı
olarak tanımlandığında,
P( X  4) 
 =2 olan Poisson dağılımına uyar. İstenen olasılık,
e2 24 0,135 16

 0, 09
4!
24
olarak bulunur.
Bir bölgede 1 yıllık periyotta tifodan (typhoid fever) ölen kişi sayısı
ortalama 4 olarak belirlenmiştir. Bu bölgede önümüzdeki 1 yıl içinde tifodan 8 kişinin
ölme olasılığı nedir?
Sağlık kuruluşlarında mesleki kazalar sonucunda her yıl ortalama
olarak meydana gelen 1000 kazadan 1’i ölümcül kazadır. Bir yıl içinde 2000 sağlık
personelini hiçbirinin ölümcül kaza ile karşılaşmama olasılığı nedir?
Normal Dağılım
İstatistikte en çok kullanılan ve çok geniş bir uygulama alanına sahip olan normal dağılım ya da LaplaceGauss dağılımı ilk olarak 1733 yılında De Moivre tarafından ortaya atılmış, sonra 1809 da Gauss
tarafından geliştirmiştir. Uygulamada ele alınan birçok değişken normale benzer bir dağılım gösterir.
Örneğin, ölçme hataları, bebeklerin canlı doğum ağrılıkları, diastolik kan basıncı, hemoglobin düzeyi,
kadınların yaşam süresi vb... gibi. Aslında, bu tür tesadüfî değişkenlerin dağılımları tam olarak bir normal
dağılıma uymasa da yaklaştıkları görülür. Fakat uygulamada, çok sayıda birbirinden bağımsız olarak
ortaya çıkan tesadüfî değişkenlerin bir normal dağılım gösterdikleri kabul edilir.
İstatistik teorisinde önemli bir yere sahip olan normal dağılım, tek değişkenli, iki değişkenli ve çok
değişkenli olmak üzere üç kısım altında incelenir. Bu kitapta sadece tek değişkenli normal dağılım ele
alınmaktadır. Aritmetik ortalaması ve standart sapması farklı değerler olan çok sayıda normal dağılım
düşünülebilir; herhangi bir normal dağılımın özel denklemini yazabilmek için dağılımın parametreleri
olan
değerlerini bilmek yeterlidir.
133
X sürekli tesadüfî değişkeni, gerçel sayılar uzayında tanımlanmak üzere,
1  x 
 1
 


e 2  
f  x    2

0
2
, 2  0,     ,   x  
,diğer durumlarda
ise X normal dağılıma sahiptir denir. Burada;  , normal dağılımın ortalaması,
 , normal dağılımın
standart sapması, e=2,71828 ve   3,14159 dır.
Uygulamada insanlara, hayvanlara ve bitkilere ait ölçümlerin normal dağıldıkları görülür. Ayrıca normal
dağılımı olmayan bir anakütleden tesadüfi olarak seçilen yeterince büyük örneklemlerin ortalamalarının
dağılımı da yaklaşık olarak normaldir.
Normal dağılımı özellikleri:
a.
Normal dağılım olasılık yoğunluk fonksiyonunun, yani f(x)’ eğrisi altında kalan ve X ekseni ile
sınırlanan alan 1’ e eşittir.
b.
Normal dağılım ortalamaya göre simetriktir.
c.
Normal dağılıma sahip bir değişkenin ortalaması, medyanı ve modu bir birbirine eşittir.
Şekil 5.1: Normal dağılım- çan eğrisi
Şekil 5.2: Normal eğri altına kalan alan
134
Şekil 5.3: Normal eğri altında kalan simetrik alan
Eğrinin altında kalan alan,  ve 
değerleri ile orantılı olarak, belirli % değerlerine göre
yoğunlaşmalar gösterir. Bu değerleri  ve  değerlerine göre aşağıdaki gibi verebiliriz.
   : toplam alanının % 34,13’ünü
   : toplam alanının % 34,13’ünü
   : toplam alanının % 68,26’sını
  2 : toplam alanının % 95,44’ünü
  1.96 : toplam alanının % 95,00’ini
  2.58 : toplam alanının % 99,00’unu belirtir.
Şekil 5.4: Normal eğri altında kalan alanlar
135
Standart Normal Dağılım
Farklı ortalama ve standart sapmalara sahip normal dağılımlar için X tesadüfi değişkenin verilen iki değer
arasında olması olasılığını hesaplamak için integral almaya gerek vardır. Her olasılık değerini hesaplamak
için integral almak zor olduğundan, normal dağılım özelliğine sahip bütün tesadüfi değişkenlerin yerine
standart normal değişkenler geçirilerek bir tablo hazırlanmıştır. Bahsedilen standart dağılım tablosu
kitabın sonunda verilmiştir.
Normal dağılım ortalama ve varyans olmak üzere iki parametresi bulunmaktadır. Farklı ortalama ve
varyanslara göre çok sayıda normal dağılım eğrisi çizilebilir. Değişen ortalama ve varyanslara göre yeni
olasılıkların hesabını yapmak oldukça zordur. Bundan dolayı ortalaması ve varyansı değişmeyen standart
normal dağılım için olasılıklar önceden hesaplanıp, ortalama ve varyans değerlerine göre farklılaşan
normal dağılımların olasılıkları bu standart dağılım aracılığıyla hesaplanabilir. Bunun için Z harfi ile
belirtilen standart bir değişken tanımlanır;
z
X 

Bu Z değişkeninin dağılımı, ortalaması 0 ve varyansı 1 olan normal dağılımdır ve standart normal
dağılım olarak tanımlanır. Normal dağılım olasılık yoğunluk fonksiyonunda   0 ve   1 yazılırsa
standart normal dağılım elde edilir. Standart normal dağılım Z
N  0,1 olarak gösterilir.
Standart normal dağılımın olasılık değerleri tablolar halinde hazırlanmıştır. Tablonun ilk sütun ve ilk
satır rakamlarının bileşimi ile Z değişkeninin değeri bulunur. Tablonun gövde kısmındaki değerler
olasılık değerleridir. Bu olasılık değerlerine karşılık gelen Z değerini bulmak için; söz konusu olasılık
değerinin bulunduğu satırdaki ilk rakam Z değerinin ilk iki basamağını oluşturur ve olasılık değerinin
bulunduğu sütunda en tepedeki rakam da Z değerinin üçüncü basamağını oluşturur. Örneğin tablodan
0,3413 olasılık değerine karşılık gelen Z değeri ilk sütunda 1,0 ve dikey olarak ilk satırdan ,00 rakamının
birleştirilmesi ile 1,00 olarak bulunur.
Örnek 5.18:
Standart Z değişkeninin;
a.
1,25’ ten küçük değer alma olasılığını hesaplayınız.
b.
1,25’ ten büyük değer alma olasılığını hesaplayınız.
Çözüm 5.18:
Standart Z değişkeninin 1,25’ ten küçük ve büyük değer alma olasılıkları sırasıyla P  Z  1, 25 ve
P  Z  1, 25 olarak gösterilir.
a.
1,25’ ten küçük değer alma olasılığı;
Z = 1,25 için olasılım değeri 0,3944’ dur. Bu olasılık değeri Z = 0 ile Z = 1,25 arasındaki alan değeridir.
Sonuç itibariyle standart normal dağılım eğrisi altında kalan alanlara göre P  Z  1, 25 olasılığı;
P  Z  1, 25 
0,5  0,3944 
0,8944 olarak bulunur.
136
Şekil 5.5: Normal eğri altında kalan alan:
b.
P  Z  1, 25
1,25’ ten büyük değer alma olasılığını hesaplayınız.
P  Z  1, 25 
0,5  0,3944 
0,1056 olarak bulunur.
Şekil 5.6: Normal eğri altında kalan alan:
P  Z  1, 25
Örnek 5.19:
Standart normal dağılımı kullanarak aşağıdaki olasılıkları hesaplayınız.
a.
P(0,18  Z  1,15)
b.
P(2,00  Z  1,85)
Çözüm 5.19:
Standart normal dağılımı kullanarak aşağıdaki olasılıkları hesaplayınız.
a.
P(0,18  Z  1,15) olasılığını hesaplanırken sırasıyla Z = 0 ile Z = 0,18 değerleri ve Z = 0 ile Z =
1,15 değerleri arasında kalan alan değerleri standart normal dağılım tablosu kullanılarak elde
edilir.
Z = 0 ile Z = 0,18 arasında olasılık değeri 0,0714
Z = 0 ile Z = 1,15 arasında olasılık değeri 0,3749 dur.
O halde;
P(0,18  Z  1,15) P(0  Z  1,15)  P(0  Z  0,18) 0,3035
0,3749
0,0714
137
P(0,18  Z  1,15)
Şekil 5.7: Normal eğri altında kalan alan:
b.
P(2,00  Z  1,85) için a şıkkında olduğu gibi ilgili olasılık değerleri öncelikle standart normal
dağılım tablosu kullanılarak elde edilir. Standart normal dağılım tablosunda Z’ nin negatif
değerleri yer almamaktadır. Böyle durumda standart normal dağılımın simetrik olma özelliğinden
yararlanılır. Yani Z = 0 ile Z = 2 arasında kalan alan Z = -2 ile Z = 0 arasında kalan alana eşittir.
Z = -2 ile Z = 0 arasında olasılık değeri 0,4772
Z = 0 ile Z = 1.85 arasında olasılık değeri 0,4678 dur.
O halde;
P(2,00  Z  1,85)  P(2,00  Z  0)  P(0  Z  0,185)  0,9450 bulunur.
0,4772
0,4678
Şekil 5.8: Normal eğri altında kalan alan:
P(2,00  Z  1,85)
Normal dağılımlarda olasılık hesabı yapılacağı zaman öncelikle
standartlaştırılmış değişken elde edilir. Standartlaştırma işleminden sonra standart
normal dağılım tablosu kullanılarak istenilen olasılıklar bulunur.
Örnek 5.20:
İlaçla tedavi edilen hastaların iyileşme süresi ortalaması 30 gün ve varyansı 36 olan bir normal dağılım
göstermektedir. Buna göre bir hastanın;
a.
25 günden daha fazla sürede iyileşme olasılığı nedir?
b.
36 günden daha az sürede iyileşme olasılığı nedir?
Çözüm 5.20:
İlgili olasılıkları hesaplamak için iyileşme süresi olarak tanımlanan X tesadüfi değişkeninin aldığı
değerlere karşılık gelen z değerlerinin hesaplanması gerekmektedir.
138
z
X 
a.

burada   30 ,  2  36 ve   6 dır.
25 günden daha fazla sürede iyileşme olasılığı P  X  25 için öncelikle x = 25 güne karşılık
gelen z değeri hesaplanır;
z
X 


25  30 5

 0.83 tur.
6
6
Z = -0,83 ile Z = 0 arasında olasılık değeri 0,2967
P  Z  0,83  0,5  0, 2967  0, 7967
Bir hastanın 25 günden daha fazla sürede iyileşme olasılığı % 79,67’ dir.
Şekil 5.9: Standart normal eğri altında kalan alan:
b.
P  Z  0,83
36 günden daha az sürede iyileşme olasılığı P  X  36  için öncelikle x = 36 güne karşılık gelen
z değeri hesaplanır;
z
X 


36  30 6
  1, 00
6
6
Z = 0 ile Z =1,00 arasında olasılık değeri 0,3413
P  Z  1,00  0,5  0,3413  0,8413
Bir hastanın 36 günden daha az sürede iyileşme olasılığı % 84,13’ tür.
Şekil 5.10: Standart normal eğri altında kalan alan:
139
P  Z  1.00 
Örnek 5.21:
Şeker hastalarında küçük tansiyon ortalaması 90 mm HG varyansıda 45 mm HG olmak üzere normal
dağılım göstermektedir. Buna göre seçilen bir şeker hastanın 85 mm HG ile 95 mm HG arasında olma
olasılığını bulunuz.
Çözüm 5.21:
İlgili olasılığı hesaplamak için X tesadüfi değişkeninin aldığı değerlere karşılık gelen z değerlerinin
hesaplayalım;
z1 
x1  


x   95  90
85  90
 0,56 ve z2  2

 0,56
9

9
P 85  X  90  P  0,56  Z  0,56  olasılığını elde edilir.
Z = -0,56 ile Z = 0 arasında olasılık değeri 0,2123
Z = 0 ile Z = 0,56 arasında olasılık değeri 0,2123 tur.
P  0,56  Z  0,56  P  0,56  Z  0   P  0  Z  0,56 
P  0,56  Z  0,56  0, 2123  0, 2123  0, 4246
Buna göre seçilen bir şeker hastanın 85 mm HG ile 95 mm HG arasında olma olasılığı % 42,46’ tır.
Z=0,56
0,4246
Şekil 5.11: Standart normal eğri altında kalan alan:
P  0,56  Z  0,56 
Standart normal Z değişkeni için aşağıdaki olasılıkları bulunuz.
a.
P  Z  2, 2  b. P  Z  2, 6  c. P  Z  1, 75 d. P  1, 45  Z  1, 76  e. P  0,97  Z  2, 21
Bir bölgedeki bebeklerin canlı doğum ağırlıkları 2,85 kg ve satandart
sapması da 0,25 kg dır. Ayrıca canlı doğum ağrılıklarının normal dağılım gösterdiği
bilinmektedir. Yeni doğmuş bir bebeğin ağırlığının 2,80 kg ile 3,15 kg arasında olma
olasılığını bulunuz.
140
Özet
tam olarak bir normal dağılıma uymasa da
yaklaştıkları görülür. Fakat uygulamada, çok
sayıda birbirinden bağımsız olarak ortaya çıkan
tesadüfî değişkenlerin bir normal dağılım
gösterdikleri kabul edilir. İstatistik teorisinde
önemli bir yere sahip olan normal dağılım, tek
değişkenli, iki değişkenli ve çok değişkenli
olmak üzere üç kısım altında incelenir. Bu kitapta
sadece tek değişkenli normal dağılım ele
alınmaktadır. Aritmetik ortalaması ve standart
sapması farklı değerler olan çok sayıda normal
dağılım düşünülebilir; herhangi bir normal
dağılımın özel denklemini yazabilmek için
dağılımın
değerlerini bilmek yeterlidir.
İstatistik biliminin temelini oluşturan olasılık,
belirsizlik durumunda karar almayı sağlar.
Tesadüfiliği (rassallık) içeren olasılık, herhangi
bir olayın meydana gelme şansıyla ilgilenir.
Genel olarak olasılık, meydana gelmesi arzu
edilen olay sayısının, olayın nihai tüm
sonuçlarının sayısına olan oranı olarak
tanımlanır.
Belirsizliğin bir ölçüsü olarak
tanımlanan olasılık, aslında bize tesadüfi deneyin
çok defa tekrarlanması durumunda bu sonuçlarla
hangi şansla karşılaşabileceğimizi tümdengelim
yöntemiyle
anlatır.
Olasılık
kavramını
açıklayabilmek için üç temel kavramın
tanımlanmasına ihtiyaç vardır. Bunlar tesadüfi
deney, örneklem uzayı ve olaydır.
Farklı ortalama ve standart sapmalara sahip
normal dağılımlar için X tesadüfi değişkenin
verilen iki değer arasında olması olasılığını
hesaplamak için integral almaya gerek vardır.
Her olasılık değerini hesaplamak için integral
almak zor olduğundan, normal dağılım özelliğine
sahip bütün tesadüfi değişkenlerin yerine standart
normal değişkenler geçirilerek bir tablo
hazırlanmıştır. Bahsedilen standart normal
dağılım tablosu kitabın sonunda verilmiştir.
İki bağımlı olaydan birincisinin gerçekleştiği
bilindiğinde ikincisinin ona bağlı olarak
gerçekleşme olasılığına koşullu olasılık denir.
Bir olayın gerçekleşme şansı başka bir olayın
gerçekleşmesine bağlı olduğunda koşullu olasılık
kullanılmaktadır. A ve B olayları herhangi iki
olay olsun. A olayının gerçekleştiği bilindiğinde,
B olayının ortaya çıkma olasılığı koşullu olasılık
olarak tanımlanır ve P  B A ile gösterilir.
Tesadüfi değişken, S örnek uzayındaki her bir
tesadüfi olaya sayısal değerler atayan bir
fonksiyondur. Bu fonksiyon aracılığıyla örnek
uzayındaki her bir sonuç reel eksende bir değere
taşınır. Kısaca tesadüfi değişken, S örneklem
uzayının her bir olayını yalnız bir gerçek değere
dönüştürür.
Normal dağılım ortalama ve varyans olmak üzere
iki parametresi bulunmaktadır. Farklı ortalama
ve varyanslara göre çok sayıda normal dağılım
eğrisi çizilebilir. Değişen ortalama ve varyanslara
göre yeni olasılıkların hesabını yapmak oldukça
zordur. Bundan dolayı ortalaması ve varyansı
değişmeyen standart normal dağılım için
olasılıklar önceden hesaplanıp, ortalama ve
varyans değerlerine göre farklılaşan normal
dağılımların olasılıkları bu standart dağılım
aracılığıyla hesaplanabilir. Bunun için Z harfi ile
belirtilen standart bir değişken tanımlanır;
Yapılan her tesadüfi deneyde ortaya çıkan
sonuçlar için yeni bir fonksiyon aramak hem
emek hem de zaman kaybına yol açacağından
çeşitli tesadüfi deneylerin aynı koşullar altında
aynı özellikler göstermelerinden yararlanılarak
kuramsal olasılık dağılımları geliştirilmiştir. Bu
kuramsal olasılık dağılımları benzer özellikteki
diğer deneylerde de kullanmak amacıyla
genelleştirilmiştir. Çok sayıda kuramsal olasılık
dağılımdan söz etmek olanaklı ise de bu ünitede
kesikli olasılık dağılımlarından Binom dağılımı
ve
Poisson
dağılımı,
sürekli
olasılık
dağılımlarından ise Normal dağılım ele
alınacaktır. Uygulamada ele alınan birçok
değişken normale benzer bir dağılım gösterir.
Örneğin, ölçme hataları, bebeklerin canlı doğum
ağrılıkları, diastolik kan basıncı, hemoglobin
düzeyi, kadınların yaşam süresi vb... gibi.
Aslında, bu tür tesadüfî değişkenlerin dağılımları
z
x

Bu Z değişkeninin dağılımı, ortalaması 0 ve
varyansı 1 olan normal dağılımdır ve standart
normal dağılım olarak tanımlanır.
141
Kendimizi Sınayalım
b. Olay
5. İki tavla zarının birlikte atıldığını varsayalım.
A olayı üst yüze gelen sayıların toplamının 8
olması ve B olayı üst yüze gelen sayıların aynı
olması olayları olarak tanımlansın. Bu iki olayın
birleşiminin olasılığını bulunuz.
c. Deney
a. 0,28
d. Değişken
b. 0,14
e. Ortalama
c. 0,17
2. Bir çocuk hastalıkları polikliniğine tedavi için
gelen 4 hasta kaç farklı şekilde sıralanabilir?
d. 0,46
1. Örneklem uzayındaki temel sonuçların bir alt
kümesine ……………. denir.
a. Örneklem
e. 0,24
a. 24
6. A ve B olayları için olasılıklar
b. 36
P  A 
2
,
3
d. 64
3
3
ve P  A  B  
olarak veriliyor.
5
4
P  A  B  olasılığını bulunuz.
e. 112
a. 0,67
3.
S  a, b, c, d , e, f , g , A  a, c, e, g , B  c, d , e
b. 0,75
P  B 
c. 48
c.0,82
olsun. A  B alt kümesini oluşturunuz.
d. 0,18
a. A  B  a, b, c, d , e, f , g
e. 0,94
b. A  B  a
c. A  B  g
7. Bir toplumun 0,20’si X hastalığı taşıyıcısıdır.
Bu toplumdan tesadüfi olarak seçilen 10 kişiden
yarısının bu hastalığın taşıyıcısı olma olasılığını
bulunuz.
d. A  B  a, g
a. 0,015
e. A  B  b, c, d , e, f 
b. 0,026
c. 0,032
4. İki olayın kümelerinin ortak elemanı yok ve
kesişimleri boş küme ise bu tür olaylara nedir?
d. 0,044
a. Tesadüfi olay
e.0,075
b. Bağımsız olay
d. Örneklem uzayı
8. Bir kırsal yerleşim alanında yılda kuduz vakası
oranı 0,00003’ tür. Belli bir zaman diliminde
200000 vakadan hiçbirinde kuduz vakası ile
karşılaşmama olasılığı nedir?
e. Bağımlı olay
a. 0,0025
c. Ayrık olay
b. 0,02
c. 0,44
d. 0,001
e. 0,00003
142
9. Z, standart normal dağılıma sahip bir değişken
olduğuna göre, P  0,50  Z  2 olasılığı kaçtır?
Kendimizi Sınayalım Yanıt
Anahtarı
a. 0,4772
1. b Yanıtınız yanlış ise “Olasılığa Giriş” başlıklı
konuyu yeniden gözden geçiriniz.
b. 0,6687
2. a Yanıtınız yanlış ise “Permütasyon” başlıklı
konuyu yeniden gözden geçiriniz.
c. 0,2857
d. 0,1915
3. d Yanıtınız yanlış ise “Olasılık Hesaplama”
başlıklı konuyu yeniden gözden geçiriniz.
e. 0,500
10. Z, standart normal dağılıma sahip bir
değişken olduğuna göre, P  0,50  Z  1,65
4. c Yanıtınız yanlış ise “Olasılık Hesaplama”
başlıklı konuyu yeniden gözden geçiriniz.
olasılığı kaçtır?
5. a Yanıtınız yanlış ise “Olasılık Hesaplama”
başlıklı konuyu yeniden gözden geçiriniz.
a. 0,4505
6. c Yanıtınız yanlış ise “Olasılık Hesaplama”
başlıklı konuyu yeniden gözden geçiriniz.
b. 0,1915
c. 0,700
7. b Yanıtınız yanlış ise “Binom Dağılımı”
başlıklı konuyu yeniden gözden geçiriniz.
d. 0,8200
8. a Yanıtınız yanlış ise “Poisson Dağlımı”
başlıklı konuyu yeniden gözden geçiriniz.
e. 0,6412
9. c Yanıtınız yanlış ise “Normal Dağılım”
başlıklı konuyu yeniden gözden geçiriniz.
10. e Yanıtınız yanlış ise “Normal Dağılım”
başlıklı konuyu yeniden gözden geçiriniz.
143
Sıra Sizde Yanıt Anahtarı
Sıra Sizde 7
Sıra Sizde 1
n
P n  n!  6!  6.5.4.3.2.1  720
a.
P  Z  2, 2   0,9861
b.
P  Z  2,6  0,0047
n
 6
n!
6!
6.5.4.3!
C  
 C  

 20
3!3!
 r  r ! n  r !
 3  3! 6  3!
c.
P  Z  1, 75  0, 0401
Sıra Sizde 2
d.
P  1, 45  Z  1,76   0,8873
e.
P  0,97  Z  2, 21  0,8204
1.45 personel içinden seçilen bir kişinin erkek
30
 0, 667
olma olasılığı; P  E  
45
Sıra Sizde 8
2. P  A  B   P  A  P  B   P  A  B 
z1 
eşitliğiyle hesaplanır;
P  A  B 
2 2 1
   0, 73
5 3 3
z2 
P  A  B   P  A P  B   0,80  0,60  0, 48
Sıra Sizde 4
olasılığın hesaplanması için Binom
dağılımı kullanılır;
n
 5
P( x)    p x q n  x =   0, 251 (0, 75) 4  0,396
 x
1 
Sıra Sizde 5
P( x) 
e   x
e4 48
 P( x  8) 
 0, 0298
x!
8!
Sıra Sizde 6
İlgili
olasılığın hesaplanması için Poisson
dağılımı kullanılır;
n  2000 ,
olayın
1
p
 0, 001 dir.
1000
görülme
olasılığı
O zaman Poisson dağılımının
  np  2000  0,001  2 dir.
parametresi
P( x) 

2,80  2,85
 0, 20 ve
0, 25
x2  

3,15  2,85
 1, 20
0, 25


P  0, 20  Z  1, 20   0, 4642
Sıra Sizde 3
İlgili
x1  
e   x
e2 20
 P( x  0) 
 0,135
x!
0!
144
Yararlanılan Kaynaklar
Anadolu Üniversitesi Açık Öğretim Fakültesi,
İstatistik, Editör: Prof. Dr. Ali Fuat Yüzer, AÖF
Yayın No: 771, Anadolu Üniversitesi, Eskişehir.
Çömlekçi, N. (1997). Temel İstatistik İlke ve
Teknikleri, Bilim Teknik Yayınevi, Eskişehir.
F. Er, K.Ö, Peker, Editör: H. Sönmez (2009).
Biyoistatistik, Ünite 4, Eskişehir Anadolu
Üniversitesi.
Esin, A.A., Ekni, M., ve Gamgam, H. (2006).
İstatistik, Gazi Kitapevi, Ankara.
Gürsakal, N. (2007). Çıkarımsal İstatistik,
Bursa: Dora Basım Yayın Dağıtım.
Lwanga, S.K. and Tye, C.Y. (1986) Teaching
Health Statistics. Geneva: World Health
Organization.
Serper, Ö (2004). Uygulamalı İstatistik 1 ve 2
Bursa: Ezgi Kitabevi.
145
6
Amaçlarımız
Bu üniteyi tamamladıktan sonra;
Tam sayım ve örnekleme kavramlarını ayırt edebilecek,
Örneklemeye başvurmanın yararlarını açıklayabilecek,
Örnekleme planı hazırlayabilecek,
Bir örnek araştırma için örnekleme uygulaması yapabilecek ve istenen bilgileri üretebilecek
bilgi ve becerilere sahip olabilirsiniz.
Anahtar Kavramlar
Tam sayım
Örnekleme
Çerçeve
Örneklem
Parametre
İstatistik
Değişken
İçindekiler
 Giriş
 Tam Sayım ve Örnekleme
 Örnekleme Yapmayı Gerekli Kılan Nedenler
 Örnekleme Sürecinin Aşamaları
 Örnekleme Yöntemleri
 Bazı Örnekleme Dağılımları
146
Örnekleme ve Bazı
Örnekleme Dağılımları
GİRİŞ
İstatistiğin önemli bir konusu olan örnekleme, bilimsel araştırma sürecinin en önemli aşamasıdır ve bu
konu sürecin diğer aşamalarıyla önemli bir ilişkiye sahiptir. Örnekleme, ana kütlenin birim sayısı
bakımından daha az fakat araştırmaya konu olan özellikleri bakımından ana kütlenin temsili bir modeli
olan örneklemin oluşturulması ve örneklemden yararlanarak ana kütle parametrelerine ait tahminde
bulunma faaliyetidir. Bütün bilim dallarında olduğu gibi sağlık bilimlerinde de yapılacak bilimsel
araştırmalarda genellikle tam sayım değil örneklemeye başvurulmaktadır.
TAM SAYIM VE ÖRNEKLEME
Anahtar kelimeler başlığı altında verilen kavramlar örnekleme konusunu açıklayabilmek için de bilinmesi
gereken kavramlardır. Bu kavramlar birinci ünitede açıklandığı için bu üniteye sadece tam sayım ve
örnekleme kavramlarıyla ilgili hatırlatıcı bilgiler verilerek başlanmıştır.
Bu ünitedeki konuları kolayca anlayabilmeniz için birinci ünitede
açıklanan temel kavramları tekrar okuyunuz.
Bilindiği gibi istatistiksel araştırmaların amacı tanımlanan ve hakkında araştırma yapılacak birimler
topluluğu olan ana kütlenin özellikleriyle ilgili bilgiler üretmektir. Bu bilgiler ya tam sayım sonucu elde
edilen veri kümesinin (ana kütle veri kümesinin) çözümlenmesiyle ya da örneklemden elde edilen veri
kümesinin (örneklem veri kümesinin) çözümlenmesiyle üretilebilir.
Tam Sayım
Planlanan bir istatistiksel araştırma için tanımlanan sonlu ana kütlenin bütün birimleri üzerinden
araştırmaya konu olan değişkenler itibariyle veri derleniyorsa yapılan işleme tam sayım denir. Tam sayım
sonucu elde edilen veri kümesinin çözümlenmesiyle elde edilen bilgiler (parametre değerleri) veri
derleme ve çözümleme hatası işlenmemiş ise kesin ve doğru bilgilerdir.
Tam sayım sonucu elde edilen veriler kullanılarak hesaplanan sayısal
değerlere parametre denir.
Tam sayım genellikle sonlu ve küçük hacimli ana kütlelere uygulanır. Bununla birlikte büyük hacimli
sonlu ana kütlelerin bütün birimlerine ulaşabilmek olanaklıysa, karşılaşılan özel problemin çözümü için
mümkün bütün verilerin elde edilmesine gereksinim varsa tam sayım yapılmalıdır.
147
Örnek 6.1:
Bir tıp fakültesi hastanesinde çalışan 100 uzman hekimin uygulamaya geçen tam gün çalışma yasasına
ilişkin görüşlerinin belirlenmesini konu alan bir araştırma planlanıyor. Tamsayım yapılabilir mi?
Çözüm 6.1:
Tam gün yasası ile ilgili görüşlerin alınacak hekim sayısı N=100 dür, küçük hacimli sonlu bir ana
kütledir. 100 hekimden tam gün yasası ile ilgili görüşlerinin alınması mümkün ve üretilmesi istenen bilgi
için zaman yeterli ise tam sayım yapılabilir.
Ancak tanımlanan ana kütlenin bütün birimleri üzerinden veri derlemek veya tam sayım yapmak her
zaman izleyen kısımda açıklanacak çeşitli nedenlerle mümkün olamaz, parametre değerleri
hesaplanamaz. Böyle bir durumda ana kütlenin özellikleriyle ilgili bilgiler ve genellemeler örnekleme
uygulamasıyla elde edilebilir.
Örnekleme
Tanımlanan ana kütleden onu ilgilenilen değişkenler bakımından temsil eden sınırlı sayıda birimin belirli
yöntemler kullanılarak seçilmesi ile ana kütle için tahmine dahalı bilgi edinme işlemine örnekleme,
seçilen birimlerin oluşturduğu topluluğa örneklem denir.
Örnek 6.2:
Bir anaokulu işletmecisinin 5 ayrı bölgedeki okullarında 1000 öğrencisi bulunmaktadır. Bu işletmeci
öğrencilerine uyguladığı beslenme programıyla ilgili öğrenci ailelerinin görüşlerini almak amacıyla bir
araştırma planlıyor.
Araştırmanın Amacı: Uygulanan beslenme programıyla ilgili ailelerin görüşlerinin alınması.
Araştırmanın Ana kütlesi: 5 bölgedeki okullarda okuyan öğrencilerin ailelerinin oluşturduğu
topluluktur.
Örnekleme: Her bölgedeki okuldan 20şer olmak üzere toplam n=100 aile seçiliyor. Ailelerin seçim
işlemine örnekleme; seçilen 100 ailenin oluşturduğu topluluğa örneklem adı verilir.
Değişken: Öğrencilerin annelerinin beslenme programıyla ilgili görüşleri ise değişkendir.
Örnekleme Birimi, Gözlem Birimi: Seçilen ailelerin oluşturduğu topluluk örneklem, aileler örnekleme
birimi ve öğrencilerin anneleri ise gözlem birimidir.
Ana kütleyi temsil eden, onun bir modeli olan örneklemden elde edilen veri kümesi kullanılarak
yapılacak çözümlemenin sonucu olan bilgi (örneklem istatistiği) ana kütle bilgisi anlamında kullanılabilir.
Başka bir deyişle örneklem istatistiği değeri bilinmeyen ana kütle parametre değeri hakkında genelleme
yapmak amacıyla kullanılabilir. Örneklemede önemli olan, ana kütle doğru tanımlanmış ise örneklemin
araştırmaya konu olan değişkenler itibariyle ana kütleyi temsil edip etmemesi konusudur. Temsili bir
örneklem, ana kütlenin sadece birim sayısı bakımından küçük, özellikleri bakımından benzeri ve modeli
olan örneklemdir. Eğer ilgilenilen değişkenler bakımından ana kütledeki ve örneklemdeki birimler benzer
dağılım gösteriyorsa oluşturulan örneklem temsili bir örneklemdir.
Örnek 6.3:
Bir ilde yaşayan ve 2010-2011 yıllarında prostat kanseri teşhisi sonucu ameliyat olan yaşları 45-70
grubundaki 500 kişinin yaşam kalitesi araştırılmak isteniyor. Bu kişilerin %40’ının 45-55 yaş grubunda
olduğu biliniyor. Diyelim ki n=50 hastadan oluşan bir örneklem seçilmiş ve bu hastaların %40’ının (20
Kişinin) 45-55 yaş grubunda yer aldığı belirlenmiş ise bu örneklem yaş grubu değişkeni bakımından
temsili örneklemdir.
148
Bir hastaneye başvuran kişilerin rahatsızlık türlerinin günlük
dağılımını belirlemek amacıyla bir araştırma yapılması isteniyor.

Tam sayım yapılabilir mi, tartışınız.

Örneklem istatistiğinin değeri her zaman parametre değeri için bilgi niteliği taşır mı,
tartışınız.

Örneklemenin temel amacı nedir, açıklayınız.
Bu ünitenin izleyen kısımlarındaki konular için A. F. Yüzer, E. Şıklar,
E. Ağaoğlu, H. Tatlıdil, A. Özmen, Editör: A. F. Yüzer (2011). İstatistik, Ünite 7 ve 8,
Eskişehir Anadolu Üniversitesi Yayını İsimli kitaptan, editör ve ünite yazarlarının izni
alınarak yararlanılmıştır.
ÖRNEKLEME YAPMAYI GEREKLİ KILAN NEDENLER

Ana kütlenin sonsuz olması durumu
Tanımlanan ana kütlenin sonsuz ana kütle olması durumunda tam sayım mümkün olmaz. Çünkü
incelenecek birimler X tesadüfi değişkeninin teorik olasılık dağılımının türettiği sonuçlardır. Dolayısıyla
incelencek birim sayısında ve gözlem değeri sayısında bir sınır yoktur. Bu nedenle örnekleme
uygulamasına başvurmak kaçınılmazdır.
Örnek 6.4:
Bir sağlık ocağından poliklinik hizmeti alan kişilerin memnuniyeti araştırılmak isteniyor. Tamsayım
yapılıp yapılamayacağını açıklayınız.
Çözüm 6.4:
Sağlık ocağında verilen poliklinik hizmeti bir süreçtir. Bu hizmet geçmişte verilmiştir, bugün
verilmektedir ve verilmeye de devam edecektir. Bu nedenle geçmişte poliklinik hizmeti alan, bugün
almakta olanlar ve gelecekte alacak olan hastalar ana kütleyi oluşturur. Poliklinik hizmeti devam ettikçe
bu hizmetten yararlananlar ana kütlesine yenileri ilave olacağı için ana kütle sonsuz ana kütledir. Söz
konusu araştırma için tamsayım yapılamaz, örnekleme uygulaması zorunludur.
Neter J., Wasserman W., Whitmore G. A. (1993). Applied Statistics 4.
Edition, Allyn and Bacon
Ana kütlenin sonlu olması durumu
Daha önce de açıklanmış olduğu gibi tanımlanan ana kütle sonlu ana kütle olduğunda ana kütle ile
ilgili bilgiler hem tam sayım uygulayarak hem de örneklemeye başvurularak elde edilebilir. Bu durumda
tam sayım mı?, örnekleme mi? uygulanacağına karar verebilmek için aşağıdaki kriterler değerlendirilir.
Maliyet: Örnekleme bütçesi, örneklemeyi tam sayıma tercih etmede en önemli belirleyicidir.
Örnekleme tam sayıma göre daha az maliyetle bilgi üretme imkanı sağlar. Öte yandan eğer ana kütle
hacmi küçükse veya tam sayım yapmak bütçe olanaklarıyla da mümkünse tam sayım tercih edilmelidir.
Burada dikkat edilmesi gereken nokta tam sayım yapma maliyetinin, elde edilecek bilginin değerinden
küçük olması gerekir. Aksi durumda örneklemeye başvurmak uygun olacaktır.
Zaman: Bir araştırma sonunda ulaşılacak bilgiye duyulan ihtiyacın zaman sınırları, araştırmanın tam
sayımla mı yoksa örneklemeyle mi yapılacağına karar verirken değerlendirilecek diğer önemli bir
etkendir. Örnekleme, tam sayıma göre daha kısa zamanda ve yeterli ayrıntıda bilgi elde etme olanağı
verir. Örneklemenin bu özelliği ve üstünlüğü bilgiye çok hızlı gereksinim olduğu durumlarda bilhassa
önemlidir.
149
Hem bir tam sayımdan hem de bir örneklemden elde edilecek bilgi için gerekli olan zaman bir alternatif
maliyet üstlenmeyi de gerektirir. Çünkü bilgi elde etme süresine bağlı olarak verilecek kararın erken ya
da geç oluşu kazanç kadar kayıplara da neden olabilir.
Doğru veri elde etme: Her ne kadar tam sayım yapılınca kesin, doğru bilgiye ulaşılır denilse de tam
sayımın yapılabilmesi için gerekli olan sayıda ve istenen özelliklere sahip, veri derleme hatası
yapmayacak gözlemci ya da görüşmeci bulmak ya da yetiştirmek oldukça zor hatta olanaksızdır
İncelenecek birimlerin fiziksel zarara uğraması: Tanımlanan ana kütlede yer alan birimlerin, gözlemi
ya da ölçümü yapılırken fiziksel zarara uğratılıyorsa örneklemeye başvurmak zorunludur. Örneğin bir
enjektör iğnesi üreten bir sanayi kuruluşunda belirlenen bir gün içinde üretilen enjektör iğnelerinin
içerisindeki hatalı iğne oranının belirlenmesi için yapılacak bir araştırmada tam sayım benimsenirse
gerekli verilerin derlenmesi amacıyla üretilen tüm iğnelerin hatasız olup olmadığının teste tabi tutulması
gerekir ki bu da anlamsızdır. Bu gibi durumlarda örneklemeden yararlanmak kaçınılmaz olur.
Ana kütleyi oluşturan birimlerin değişkenliği: Ana kütleyi oluşturan birimler araştırmaya konu olan
değişkenler bakımından heterojen olduğunda mümkün ise tam sayım yapmak, değil ise büyük hacimli
örneklem seçmek gerekir.

Ana kütle hacmi küçük, parasal imkanların yeterli olduğu bir araştırma için tam sayım
mı yoksa örnekleme mi tercih edersiniz, açıklayınız.

1,5 milyon öğrencinin olduğu Açıköğretim Sisteminin değerlendirileceği bir araştırma
için gerekli olan zaman ve parasal imkanlar yeterli ise tam sayım mı yoksa örnekleme
mi uygularsınız, tartışınız.
ÖRNEKLEM İÇİN BİRİM SEÇME YÖNTEMLERİ
Örnekleme girecek birimlerin seçiminde kullanılan yöntemler keyfi seçim yöntemi ve tesadüfi seçim
yöntemi şeklinde sınıflandırılmaktadır.
Keyfi Seçim
Örneklem oluşturulurken tanımlanan tanımlanan ana kütleyi oluşturan birimler arasında fark gözetilir,
yani bütün birimlere bilinen bir olasılıkla seçilme şansı verilmez ise bu türden birim seçimine keyfi seçim
adı verilir. Bu seçim yönteminde araştırmacı, hangi birimlerin örnekeleme seçileceğini bilerek ve
isteyerek belirler.
Tesadüfi Seçim
Sonlu Ana kütlelerde Tesadüfi Örneklem Seçimi
Sonlu ana kütlelerde tesadüfi birim seçim imkânı veren iki seçim uygulaması bulunmaktadır. Bunlar kura
seçimi ve sistematik seçimdir.
Serper Ö. (2004). Uygulamalı İstatistik 2, Genişletilmiş 5. Baskı,
Bursa: Ezgi Kitabevi
Kura Seçimi
Tesadüfi birim seçimi için kura usulü uygulanacak ise aşağıdaki adımlar izlenir:
 Tanımlanan anakütle ile ilgili oluşturulacak güncel çerçevedeki bütün birimlere birden N e kadar
numara verilir. Bu numaralar fişlere yazılır ve bir torbaya veya bir kaba atılır.
150
 Fişler iyice karıştırıldıktan sonra n tane fişin çekilmesi işlemine başlanır. Çekilen fiş her çekilişten
sonra torbaya iade edilir veya edilmez. Çekilen fiş torbaya iade ediliyorsa birim seçimine iadeli seçim,
iade edilmiyorsa iadesiz seçim adı verilir.
 Seçilen n sayıdaki birim örneklemi oluşturur.
Bu birim seçim uygulamasıyla ana kütleyi oluşturan çerçevede yer alan birimler arasında örneklemde
yer almaları bakımından ayrıcalık yapılmamış ve eşit seçilme olasılığı tanınmış olur.
Birim seçimi iadeli yapıldığında aynı birim tekrar tekrar örnekleme seçilmiş olabilir. Bu durumda
örnekleme kuramının önemli koşullarından biri olan bağımsızlık koşulu sağlanmış olur ve herhangi bir
birimin seçilmesi bir başka birimin seçilmesi olasılığını etkilememiş olur.
Gerçekte uygulanan örnekleme planlarında iadeli seçim genellikle uygulanmaz. Birim seçimi iadesiz
yapıldığında, seçilen bir birimin tekrar seçilmesi engellenmiş olur. Ancak, ana kütle hacmi N çok büyük,
örneklem hacmi n küçük olduğunda her birimin seçiminin diğerinden bağımsız olduğu ve iadeli
seçimdeki bağımsızlık koşulunun sağlanabilecek olduğu varsayılır.
Belirlenen sonlu ana kütlede yer alması gereken birim oluşturulacak çerçevede yer almıyorsa veya
birden fazla yer alıyorsa kura seçiminin tesadüfîliği etkilenir. N hacimli sonlu bir ana kütlede tesadüfi
iadeli seçimle Nn tane farklı örneklem seçmek mümkün iken, aynı ana kütlede iadesiz seçim
uygulandığında aynı hacimli
C
N
n

N!
tane farklı örneklem seçmek mümkün olur.
n !( N  n)!
Sistematik Seçim
Eğer tesadüfi seçim için sistematik seçim uygun görülürse aşağıdaki aşamalar izlenir:
 Güncel çerçevedeki birimler birden N ye kadar numaralandırılır.
 Örneklem hacmi belirlenir.
 k = N / n oranı hesaplanır. Bu oran “büyütme faktörü” olarak isimlendirilir.
 1, 2, ….. , k adet sayı arasından tesadüfi olarak bir sayı çekilir. Çekilen sayı a ile gösterilsin. a,
örnekleme girecek birinci birimin sıra numarasını gösterir.
 a’ıncı, a + k’ıncı, ….. , a + (n – 1)k’ıncı sıra nolu birimlerin seçilmesiyle n hacimli örneklem
oluşturulur.
Hem kura usulü seçimde hem de sistematik seçimde seçilecek bir birimin belirlenen n hacimli
örneklemde yer alması olasılıkları aynı (n / N) olmasına rağmen olası örneklemlerden birinin incelenen
N
örneklem olma olasılıkları farklıdır. Bu olasılıklar kura usulü (iadesiz) seçimde 1/ Cn olduğu halde,
sistematik seçimde örneklemi oluşturabilme şansına sahip kombinasyonların her biri için eşit 1 / k ,
diğerlerininkinde ise 0 (sıfır) dır.
Olasılıklı örneklemenin üç önemli üstünlüğü vardır:
 Örneklemden elde edilen verilerden hesaplanan istatistikler ana kütle parametreleri hakkında
genelleme yapmak üzere kullanılabilir.
 Örneklem hatasının büyüklüğü hakkında bilgi elde edilebilir.
 Keyfi seçimde söz konusu olabilecek yanlılık (sistematik hata) giderilmiş olur.
Olasılıklı örneklem oluşturma prensibi esas olmak üzere, uygulamada ya birim seçim işlemini
kolaylaştırmak ya da ana kütleyi temsil edecek daha iyi bir örneklemin oluşturulmasını sağlamak üzere
çeşitli tesadüfi örnekleme yöntemleri geliştirilmiştir. Bu yöntemler izleyen başlıklar altında açıklanmıştır.
151
Bu örnekleme yöntemlerinden herhangi birini bir örnekleme uygulaması için seçerken yöntemlerin
etkinlik ve doğruluk kriterlerine göre değerlendirilmesi gerekir. Örnekleme yöntemlerinin etkinlikleri
farklılık gösterir. Etkinlik, örnekleme maliyeti ve doğruluğu arasındaki dengeyi yansıtan bir kavramdır.
Doğruluk ise ölçülecek özelliğin belirsizliği ile ilgili düzeyi gösterir. Doğruluk ile örnekleme hataları
arasında ters ilişki varken maliyetle aynı yönde ilişki vardır. Yani daha çok maliyet daha doğru bilgi, daha
doğru bilgi daha az hatalı karar, tahmin demektir.
ÖRNEKLEME SÜRECİNİN AŞAMALARI
Genel olarak örnekleme süreci 5 aşamadan oluşmaktadır. Birbirleriyle ve bir araştırma sürecinin diğer
aşamalarıyla sıkı sıkıya ilişki içinde olan bu aşamalar Şekil 6.1 de gösterilmiştir.
Şekil 6.1: Örnekleme sürecinin aşamaları.
Kaynak: N. K. Malhotra, Marketing Research An Applied Orientation, Prentice Hall International Inc. , 1996
Ana kütlenin Tanımlanması
Bir araştırma sürecinde araştırmacının ilk yapacağı işlerden biri olan örnekleme süreci ana kütlenin
tanımlanmasıyla başlar. Ana kütle, araştırmacı tarafından belirlenen bir tanıma uyan ve hakkında
bilgilerin üretileceği, çıkarımların yapılacağı birimlerden oluşan topluluktur. Ana kütlenin ayrıntılı bir
biçimde tanımlanmasıyla, hangi birimlerin araştırma kapsamına alınacağı, hangilerinin alınmayacağı
belirlenmiş olur. Bu, başka bir ifadeyle örneklemde yer alabilecek ve yer alamayacak birimlerin
belirlenmesi anlamına gelir.
Ana kütlenin tanımlanması genel olarak örnekleme birimi, gözlem birimi, yer ve zaman kavramlarıyla
yapılmaktadır. Araştırmanın konusunu tanımlayan değişkenlerle ilgili verilerin derlendiği birimlere
gözlem birimi adı verilir. Örnekleme birimi ise örnekleme seçilecek birimlerdir.
Örnek 6.5:
Araştırmanın konusu: Bir il merkezindeki kamuya ait ilköğretim okullarında öğrenim gören öğrencilere
uygulanan sağlık taraması sonucu ağız ve diş sağlığı sorunu tespit edilmiş 1200 öğrencinin ailelerinin
ağız ve diş sağlığı konusundaki bilgilerinin araştırılması.
Ana kütle: Yapılan tarama sonucu ağız ve diş sağlığı sorunu olan 1200 öğrencinin ailelerinin
oluşturduğu topluluktur. Sonlu bir ana kütledir. Ana kütle hacmi N=1200 ailedir.
Örnekleme Birimi: Ağız ve diş sağlığı sorunu tespit edilen her bir öğrencinin ailesi.
Gözlem Birimi: Ailede çocuğun ağız ve diş sağlığı konularında eğitimini verecek olan anne ve/veya
baba.
Yer: Belirlenen il ve kamu ilköğretim okulları.
Zaman: Araştırmanın yapıldığı tarih.
152
Örnekten anlaşılabileceği gibi önce örnekleme aile seçilecek sonra ailedeki ağız ve diş sağlığı
konusunda bilgisi ölçülecek anne ve/veya babadan veri derlenecektir.
Bu örnekte olduğu gibi her araştırmada gözlem birimi ve örnekleme birimi ayrımı olmayabilir.
Örnekleme seçilen ve veri derlenen birim aynı olabilir. Bu durumda sadece birim kavramı kullanılır.
Örnek 6.6:
Araştırmanın Konusu: 2010-2011 öğretim yılında Anadolu Üniversitesi Sağlık Programında öğrenim
gören öğrencilerin kitap okuma alışkanlığını araştırmak.
Ana kütle: 2010-2011 öğretim yılında Sağlık Programına kayıtlı olan öğrenciler topluluğudur.
Birim: Sağlık Programında kayıtlı olan her bir öğrenci hem gözlem birimi hem de örnekleme
birimidir. Çünkü örnekleme seçilecek birim de, veri derlenecek birim de öğrencilerdir.
Örnekleme ve gözlem birimi aynı olduğu zaman araştırmalarda
sadece birim kavramı kullanılmaktadır.
Gözlem birimi ve örnekleme birimi ayrımına gidilmesinin nedeni, gözlem birimleri ile ilgili bir
çerçevenin temin edilmesinin veya hazırlanmasının zor, maliyetli ve çok zaman alacak olmasıdır.
Örnekleme birimi birden çok gözlem birimini kapsayacak şekilde de tanımlanabilir. Örnek 2 üzerinden
açıklamak gerekirse, beslenme programıyla ilgili öğrencinin hem annesinin hem de babasının görüşlerine
başvurulabilir. Bu durumda gözlem birimi öğrencinin hem annesi hem de babası olur.
Ana kütlenin tanımlanması yukarıda yapılan açıklamalarda olduğu gibi her zaman kolay olmayabilir.
Örnek 5 üzerinden açıklama yapılacak olursa ana kütle tanımı yapılırken örneğin, yabancı uyruklu olup
araştırmanın yapılacağı ile merkezinde ikamet eden ve söz konusu okullarda çocuğunu okutan aileler,
araştırmada ifade edilen aile tanımı içine alınacak mı yoksa alınmayacak mı karar verilmelidir. Gözlem
birimi olarak ailedeki anne mi? Baba mı? olacak, yoksa çocuğunu eğitimi için görevli annenin yardımcısı
olarak çalışan kişi mi seçilecektir?
Bir araştırmanın ana kütlesini tanımlarken açıklık, kesinlik, amaca uygunluk ve örnekleme
uygulaması için güçlük yaratmaması gibi ilkelerin de göz önünde bulundurulması gerekir.
Çerçevenin Belirlenmesi
Çerçeve sonlu bir ana kütlenin bütün birimlerinin kayıtlı olduğu bir listedir. Nüfus kayıtları, seçmen
kütükleri, hasta kayıt listeleri, hastane personel listeleri, telefon rehberi, öğrenci kayıt listeleri, su, elektrik
abonelik listeleri vb. çerçeve olarak kullanılabilecek araçlardır.
Sonsuz ana kütleler için yapılacak örnekleme uygulamalarında
çerçeve söz konusu olmaz.
Örneklemeye başlamadan önce öncelikle amaca uygun bir çerçevenin var olup olmadığı, yoksa
sağlanıp sağalanamayacağı araştırılmalıdır. Araştırmaya uygun bir çerçevenin var olması durumunda bu
çerçevenin güncel olup olmadığının araştırılması da önemli bir konudur. Çerçeve olmadan ne tam sayım
ne de örneklemenin yapılabileceği unutulmamalıdır.
Bir çerçeve yoksa yeni bir çerçevenin hazırlanması problemiyle karşılaşılır. Yeni bir çerçevenin
hazırlanmasında çerçeve maliyeti ve kapsam hatası özellikle göz önünde tutulmalıdır. Bazen tanımlanan
ana kütlenin bazı birimleri çerçevede yer almadığı gibi tanımlanan ana kütlenin dışında kalması gereken
birimler de çerçevede yer alabilir ya da bazı birimler tekrar tekrar çerçevede yer alabilir. Bu özellikteki
çerçevelerde kapsam hatası işlenmiş olur. Güncel çerçeve bulmak zordur. Kapsam hatası işlenen mevcut
çerçevelerin de güncelleştirilmesi uzun zaman alır ve maliyetli olur. Bu nedenlerle uygulamada güncel
olmayan bir çerçevenin kabul edilebilirliği onun güncelleştirilmesinin maliyeti ve sağladığı zaman
153
tasarrufu ile ilişkilendirilerek belirlenir. Çerçeve, kabul edilebilir bir çerçeve hatası düzeyinde ana kütle
birimlerinin çok büyük kısmını kapsamalıdır. Şüphesiz amaç ana kütle tanımında yer alan bütün birimleri
kapsayan bir çerçeve elde etmek veya oluşturmaktır.
Örnekleme Yönteminin Seçimi
Örneklemeye girecek birimlerin belirlenmesine imkân veren yöntemlere örnekleme yöntemleri denir. Bu
yöntemler örneklem için birim seçiminde uygulanan usulün keyfi ya da teadüfi oluşuna göre iki sınıfa
ayrılır. Birinci durumda olasılıklı olmayan örnekleme, ikinci durumdaysa olasılıklı örnekleme söz konusu
olur. Örnekleme yönteminin seçimiyle ilgili en önemli karar bir örnekleme planında ne tür bir örnekleme
yöntemi uygulanacağıdır. Bu konu örnekleme yöntemleri başlığı altında ayrıntılı bir biçimde ele
alınacaktır.
Örneklem Hacminin Belirlenmesi
Örneklem hacmi, örnekleme girecek birimlerin sayısını gösterir ve “n” simgesiyle gösterilir. Bu sayının
ne olacağına ilişkin kesin yanıt vermek mümkün değildir. Ancak, bu sorunun yanıtlanabilmesi için
aşağıda açıklanan faktörlere ilişkin yapılacak nitel değerlendirmelere ve örnekleme dağılımı başlığı
altında açıklanacak olan nicel yöntemlere başvurulur.
Malhotra N. K. (1996). Marketing Research An Applied Orientation,
Prentice Hall International Inc.
Örneklem Hacminin Belirlenmesine Etki Eden Faktörler

Ana kütlenin homojenliği: Ele alınan ana kütlenin ilgilenilen değişken bakımından homojen ya da
heterojen olması örneklem hacminin belirlenmesine etki eder. Birimlerin özellikler bakımından
farklılığı arttıkça ana kütleyi temsil edebilecek bir örneklem oluşturabilmek için örneklem hacminin
de giderek büyümesi gerekir.

Araştırmada verilecek kararın önemi: Önemli kararlar için olabildiğince çok veriye ve ayrıntılı
bilgiye gereksinim vardır. Bu gibi durumlar büyük hacimli bir örneklem üzerinde araştırma yapmayı
gerekli kılar. Ancak örneklem hacmi arttıkça maliyet ve gereksinim duyulan zaman ve nitelikli
personel sayısı da artar. Burada dikkat edilmesi gereken husus, bir yandan küçük hacimli örneklem
oluşturmak suretiyle, bu örneklemin ana kütleyi temsil etmesi bakımından yetersiz kalmasını
engellemek, diğer taraftan da gereksiz yere çok büyük hacimli örneklem seçerek zaman ve maliyet
yönünden kayba uğramamak için uygun büyüklükte bir örneklem hacmini belirlemektir.

Araştırmanın yapısı: Araştırmanın doğası da örneklem hacmi üzerinde etkilidir. Uygulamada
genellikle nitel araştırmalarda küçük hacimli örneklemlerde; nicel araştırmalarda ise örneğin betimsel
araştırmalarda daha büyük hacimli örneklemlerle çalışılır. Ayrıca araştırmalarda değişken sayısı
arttıkça örneklem hacminin artırılması bilginin niteliği açısından ihtiyaç olur. Örneğin çok değişkenli
analiz teknikleri ve yöntemlerinin kullanıldığı araştırmalarda örneklem hacmi büyük olmalıdır.
Örneklemin Seçimi
Örnekleme sürecinin bu son aşamasında örnekleme girecek birimler keyfi veya tesadüfi seçim
uygulamalarıyla seçilirler. Gerekli veriler seçilen birimlerden gözlem veya ölçüm yoluyla derlenir. Bu
aşamada yapılacak işlemleri; uygun özellikte büro ve çalışma ortamı ile nitelikli işgörenlerin temini gibi
sayabiliriz. Önceki aşamalarda yapılan yanlış uygulamalar ve dikkatsizlikler bu aşamada büyük
sorunların yaşanmasına neden olur.
154
ÖRNEKLEME YÖNTEMLERİ
Örnekleme yöntemleri ana kütleden örnekleme birim seçiminde uygulanan usule göre Şekil 6.2 de
gösterildiği gibi olasılıklı olmayan örnekleme yöntemleri ve olasılıklı örnekleme yöntemleri gibi iki sınıfa
ayrılır.
Şekil 6.2: Örnekleme Yöntemleri.
Malhotra N. K. (1996). Marketing Research An Applied Orientation,
Prentice Hall International Inc.
Olasılıklı Olmayan Örnekleme Yöntemleri
Araştırmayı planlayan ya da örnekleme uygulamasını yapan kişi ya da grubun istekleri ve değer yargıları
örnekleme seçilecek birimlerin ve örneklem hacminin belirlenmesinde etkili oluyorsa yapılan örnekleme
olasılıklı olmayan örneklemedir.
Bu örnekleme yöntemleri, örneklem için birim seçiminde keyfi seçim usulünün uygulandığı
örnekleme yöntemleridir. Örneklem oluşturulurken, tanımlanan ana kütleyi oluşturan birimler arasında
fark gözetilir ve bütün birimlere, bilinen bir olasılıkla seçilme şansı verilmezse yapılan seçim keyfi
seçimdir. Keyfi seçimle oluşturulan olasılıklı olmayan örneklemenin ana kütleyi temsil etmeyeceği
anlamına gelmez. Ancak olasılık kuramının uygulanamayacağı anlamına gelir. Olasılıklı olmayan
örnekleme uygulandığında örneklemin ana kütleyi temsil etme olasılığı bilinemez. Oysa bu bilgi
araştırmacılar için çok önemlidir.
Temsili örneklem oluşturma ve uygulama kolaylığı sağlaması amacıyla çeşitli olasılıklı olmayan
örnekleme yöntemleri geliştirilmiştir. Uygulamada sıkça kullanılan ve aşağıda incelenen bu yöntemlerin
ortak özellikleri:

Örneklem için birim seçimi keyfidir.

Örneklem hacmi keyfi olarak belirlenir.
 Örneklemden hesaplanan istatistikler ana kütle parametreleri hakkında genelleme amacıyla
kullanılamaz.
Kolayda Örnekleme
Burada amaç, araştırma konusu ile ilgili ve kolayca ulaşılabilir olan birimlerden bir örneklemin
oluşturulmasıdır. Araştırma konusu ile ilgili olan ve doğru yerde, doğru zamanda bulunan birimler
arasından keyfi olarak birimler seçiliyorsa yapılan örneklemeye kolayda örnekleme denir. Kolayda
örnekleme gönüllülük esasına göre katılan birimlerden oluşur.
155
Örnek 6.7:
Daha önce ele alınan 4 numaralı örnek üzerinden kolayda örnekleme uygulamasını açıklayalım. 4 nolu
örnekte sözü edilen sağlık ocağından poliklinik hizmeti almak için herhangi bir günde gelenler arasından
keyfi olarak belirlenen ve araştırmanın amacıyla ilgili mülakata katılmayı kabul eden kişilere verilen
hizmetten memnuniyetleri ile ilgili görüşleri soruluyor ve görüşleri alınıyorsa mülakata katılanların
oluşturduğu topluluk kolayda örnekleme uygulamasıyla oluşturulmuş bir örneklemdir. Bu örnekte doğru
yer ilgili sağlık ocağıdır. Doğru zaman ise, poliklinik hizmetlerinin verildiği bir günün ilgili zaman
dilimidir.
Uygun görülen sokaktan, uygun görülen zamanda gelip geçen bireylerle görüşme yapılması ya da bir
konferansa katılan belirli sayıdaki katılımcıdan araştırma konusuyla ilgili görüşlerinin alınması, birer
kolayda örnekleme uygulamasıdır. Bu örnekleme uygulamasında örnekleme birimlerine kolayca
ulaşılabilir, ilgilenilen değişkenlerle ilgili veriler kolayca derlenebilir ve birimlerle işbirliği sağlanabilir.
En kısa zamanda ve en az maliyetle bilgi üretilmesine ihtiyaç duyulduğu durumlarda kolayda
örnekleme yöntemi bir seçenektir.
Bu örnekleme yönteminde en önemli sorun, seçilen örneklemin seçildiği ana kütleyi ne kadar temsil
edebildiğidir. Kolayda örnekleme uygulaması ile oluşturulan örneklem, birim seçimindeki yanlılık
nedeniyle tanımlanan bir ana kütleyi temsil etmeyebilir. Betimleyici ve ilişki araştırıcı araştırmalarda
kolayda örnekleme uygun bir yöntem değildir. Kolayda örnekleme odak (focus) gruplar, soru kâğıtlarının
(anket formlarının) ön testi veya pilot çalışmalar için kullanılabilir.
Yargısal Örnekleme
Bu örnekleme de bir tür kolayda örneklemedir. Yargısal örnekleme, örneklemin araştırmacının ya da
örneklemecinin kişisel arzu, düşünce ve deneyimlerine göre seçilmiş olduğu örneklemedir.
Bu yöntemin kolayda örneklemeden farkı örnekleme birim seçimi için araştırmacının uzman
fikirleriyle belirlediği ölçütler kullanması ve bu ölçütlerin temsili bir örneklem oluşturacak ölçütler
olduğuna inanıyor olmasıdır.
Örnek 6.8:
A Üniversitesinin sorunlarını araştırmak amacıyla bu üniversitenin üst düzey yöneticilerinden seçim
yapılması yargısal örnekleme için bir örnektir. Çünkü üniversitenin üst düzey yöneticileri üniversite
sorunlarını en iyi bilen kişilerdir. Bu düşünceyle seçimin bu kişiler arasından yapılması temsili bir
örneklem oluşturabilir.
Kolayda örneklemede olduğu gibi yargısal örneklemede de örnekleme birimlerine kolayca ulaşılabilir
ve verilerin çok hızlı biçimde derlenmesi mümkün olur. Yargısal örnekleme pazarlama araştırmasında,
kamuoyu araştırmalarında ve biyolojik araştırmalarda yaygın olarak kullanılmaktadır.
Eğer ana kütleyi oluşturan birimler araştırmaya konu olan değişkenler bakımından homojen ise
kolayda ve yargısal örnekleme uygulamaları temsili örneklem oluşturma imkanı verir. Bu örnekleme
uygulamalarının maliyeti, uzman çalıştırılacağı için kolayda örneklemeye göre daha yüksektir.
Kota Örneklemesi
Örneklem için birim seçiminin keyfi olarak yapıldığı yöntemlerden biri de kota örneklemesidir.
Tanımlanan sonlu ana kütle heterojen özelliklere sahip birimlerden oluşuyorsa olasılıklı olmayan
örnekleme yöntemleri grubundan kota örneklemesi temsili örneklem oluşturma amacıyla tercih
edilmelidir. Bu yöntemin başarıyla uygulanabilmesi için;
1.
Tanımlanan sonlu ana kütleyle ilgili bir çerçevenin var olması,
2.
İlgili ana kütlenin homojen veya heterojen özelliğe sahip olup olmadığının sorgulanabilmesi için
ana kütle hakkında öncül bilgilere sahip olunması,
156
3.
Ana kütlenin heterojen olduğuna karar verilmiş ise hangi kritere göre heterojen birimlerden
oluşan bu ana kütlenin homojen birimlerden oluşacak tabakalara ayırmada kullanılacak kriterin
belirlenmesi,
4.
tabaka hacimlerinin bilinmesi gerekir.
Kota örneklemesi sürecindeki adımlar aşağıdaki gibidir:
 Ana kütle hacmi N ve tabaka hacimleri Nh , (Tabaka sayısı h = 1, 2, …) belirlenir.
 Örneklem hacmi n keyfi olarak belirlenir.
 Her tabakanın, ana kütle hacmi içindeki oranı Nh / N belirlenir.
 Her tabakada keyfi seçimle nh = (Nh / N) . n sayıda birim seçilir ve bu seçilen birimler örneklemi
oluşturur.
Örnek 6.9:
Bir hastane yönetimi 2012 yılının ilk iki ayında kardiyoloji ve dahiliye poliklinik hizmetlerinden memnun
olan kişilerin oranını belirlemek amacıyla bir araştırma planlıyor. Araştırmayı gerçekleştirecek grup kota
örneklemesi uygulamayı düşünmektedir.
Çözüm 6.9:
Poliklinik türü tabakalama türü kriterine göre hastalara ilişkin bilgiler:
N = 600
Ana kütle hacmi.
NK = 400
Kardiyoloji polikiliniğine iki ayda başvuran hasta sayısı.
ND = 200
Dahiliye polikiliniğine iki ayda başvuran hasta sayısı.
n = 100
Örneklem hacmi.
Kardiyoloji polikliniğinden son iki ay içinde hizmet alan hastalar tabakasından (NK) seçilecek hasta
sayısı:
nK = (NK / N) . n = (400 /600) . 100 = 66.67
67 kişi
Benzer hesaplama dahiliye polikliniğinden son iki ay içinde hizmet alan hastalar için de yapılırsa:
nK = 33 kişi bulunur.
Kardiyoloji ve dahiliye polikiliniklerinden hizmet alan hasta tabakalarından sırasıyla 67 ve 33 hasta
keyfi seçimle seçilmek suretiyle n = 67 + 33 = 100 hacimli örneklem seçilmiş olur. Bu örneklemdeki
birimler üzerinden gerekli veriler derlenir ve istenilen bilgi üretilir.
Kota örneklemesi kolayda ve yargısal örneklemeye göre daha temsili örneklem oluşturma
çalışmasıdır. Ancak bu örnekleme yönteminin uygulanması sonucu oluşturulan örneklemin ana kütleyi
temsil etmesinin garantisi yoktur. Çünkü kota örneklemesi uygulamasında belirlenen tabakalardaki
birimlerin homojen özellikli birimlerden oluştuğunun, tabaka oranlarının doğruluğunun garantisi yoktur.
Ayrıca tabakalardan birimler keyfi olarak seçildiği için yanlılık söz konusu olabilir. Bu örnekleme
uygulaması sonucu oluşturulan örneklemden elde edilen bilgiler ana kütle bilgisi için genelleme amacıyla
kullanılamaz.
157
Kartopu Örneklemesi
Kartopu örneklemesi, özellikle bir çerçevenin mevcut olmaması ya da oluşturulmasının imkansız olduğu
durumlarda faydalı bir örneklemedir. Bu yöntemde örnekleme süreci tanımlanan ana kütlede yer alan bir
bireyin genellikle tesadüfi olarak seçilmesiyle başlar. Belirlenen bu birey örnekleme giren birinci
birimdir. Bu bireyden aynı ana kütle tanımında yer alan tanıdığı bir bireyin olup olmadığı öğrenilir. Varsa
bu bireye ulaşılır. Böylece örneklemde yer alacak ikinci birime ulaşılmış olur. Benzer şekilde bu süreç,
referanslarla keyfi olarak belirlenen hacimde örnekleme ulaşılıncaya kadar sürdürülür.
Örnek 6.10:
Bir bölgedeki uyuşturucu madde kullananlar üzerinde bir araştırma yapılacak olsun. Bu bölgede
uyuşturucu kullananlarla ilgili bir liste bulmak mümkün değildir. Bölgede bir ya da iki uyuşturucu
kullanan tanımlanabilirse kartopu örnekleme süreci başlar. Örnekleme seçilmiş olan bu kişi ya da kişilere
uyuşturucu kullanan arkadaşları ya da tanıdıklarının olup olmadığı sorulur. Varsa adresleri öğrenilir, bu
kişilere ulaşılır ve bunlar da bu örnekleme seçilirler. Bu süreç keyfi olarak belirlenen n hacimli örneklem
oluşturulncaya kadar sürdürülür.
Çete üyeleri ve bir ülkeye yasal olamayan yollarla girmiş kişilerle ilgili araştırmalarda, bir kentte
internet üzerinden alışveriş yapanlarla ilgili araştırmalarda kartopu örneklemesi uygulanır. Bu örnekleme,
endüstriyel ürün alan ve satanlar hakkında yapılacak araştırmalarda da kullanılabilir. Bu yöntem
uygulandığında temsili örneklem oluşturmak olanaklıdır. Kartopu örneklemesinin maliyeti ve örneklem
değişkenliği düşüktür.
Tüm olasılıklı olmayan örnekleme yöntemlerinde örnekleme girecek birimlerin seçiminin keyfi
olması tek yönlü hatalara neden olur. Bu tür hatalardan kaçınmak için izleyen kısımlarda ele alınacak olan
olasılıklı örnekleme yöntemleri tercih edilmelidir.

Kolayda örnekleme mi yargısal örnekleme mi daha temsili örneklem oluşturur?

Ana kütlenin birimleri ilgilenilen özellik bakımından heterojen ise hangi olasılıklı
olmayan örnekleme yöntemi kullanılır? Açıklayınız.
Olasılıklı Örnekleme Yöntemleri
Olasılıklı örnekleme, ilgilenilen ana kütledeki her örnekleme birimine hesaplanabilir ve sıfırdan farklı bir
olasılıkla seçilme imkânı veren örneklemedir.
Tesadüfi örnekleme yöntemleri olarak da alınan bu örnekleme yöntemleri örnekleme planlarında
yaygın olarak uygulanır. Bu tür örneklemede örnekleme girecek birimlerin seçimi tesadüfi olarak yapılır.
Tesadüfi seçim ana kütleden örnekleme girecek birimleri seçerken herhangi bir ayrıcalığın uygulanmadığı
seçimdir.
Basit Tesadüfi Örnekleme
Sonlu Ana kütlelerde Basit Tesadüfi Örnekleme
Serper Ö. (2004). Uygulamalı İstatistik 2, 5. Baskı, Bursa; Trochim W.
M. (2001). Research Methods Knowledge Base, Cornell University
Örnekleme planlarında uygulanan en temel olasılıklı örnekleme basit tesadüfi örneklemedir. Basit
tesadüfi örnekleme hacmi N olan sonlu bir ana kütleden birbirinden farklı ve n hacimli oluşturulabilecek
CnN sayıdaki olası örneklemlerin her birine incelenecek örneklem olması bakımından eşit şans tanıyan
158
N
örnekleme yöntemidir. Bu tanımda belirtilen özellikleri taşıyan Cn sayıdaki mümkün örneklemlerin her
birine basit tesadüfi örneklem denir. Bu örnekleme yöntemi ana kütledeki bütün birimlere hacmi n olarak
belirlenen örnekleme girmeleri bakımından bilinen ve birbirine eşit
seçilme olasılığı sağlar.
Örnek 6.11:
Kan tahlili yapılan 4 hastanın ölçülen LDL kolesterol düzeyi incelenecektir. Ölçülen sonuçlar 60, 40, 50
ve 70 mg/dl dir. Sonlu ana kütleyi oluşturan bu 4 hastayı, A, B, C ve D olarak simgelendirelim ve 2
hastadan oluşan
C
N
n

N!
4!
4
;

 6 tane mümkün farklı örneklem aşağıdaki gibi oluşturulabilir.
n !( N  n)! C 2 2!(4  2)!
Tablo 6.1: 4 birimlik ana kütleden iadesiz seçimle oluşturulabilecek 2 hacimli mümkün örneklemler.
BİRİMLER
MÜMKÜN
ÖRNEKLEMLER
A
A, B
B
A, C
C
A, D
D
B, C
B, D
C, D
Bu
mümkün
farklı
6
tesadüfi
örneklemden
birinin
incelenen
örneklem
olması
olasılığı
olur. Burada herhangi bir birimin yapılacak bir tesadüfi seçimde seçilmesi olasılığı
; herhangi bir birimin n = 2 hacimlik örneklemde yer alması olasılığı da
olacaktır.
Örnekleme uygulamalarında mümkün örneklemler oluşturulmaz;
oluşturulabileceği varsayılır. Sadece bu mümkün örneklemlerin birisi oluşturulur ve
araştırma bu örneklem üzerinden yapılır. Sonlu bir ana kütleden iadesiz seçimle n hacimli
bir tesadüfi örneklem oluşturmak için aşağıdaki adımlar izlenir:

Güncel çerçeve temin edilir ya da hazırlanır.

Örneklem hacmi belirlenir.

Çerçevede yer alan n sayıdaki birime tanımlayıcı numara ya da işaret verilir.

Ana kütledeki her birime eşit
seçilme şansı vermek suretiyle örnekleme girecek birinci birim
tesadüfi seçim araçları kullanılarak belirlenir.

Geriye kalan (N – 1) birimin her birine yine eşit şans vermek suretiyle ikinci birim seçilir.

Bu birim seçim süreci n hacimli örneklem seçilinceye kadar tekrarlanır.
159
Açıklanan seçim sürecinde her çekilişte seçilen birim incelendikten sonra ana kütleye iade edilmediği
için bu seçim sürecine iadesiz tesadüfi seçim süreci adı verilir. Eğer basit tesadüfi örnekleme planlarında
önceki çekilişte seçilen birim incelendikten sonra ana kütleye iade ediliyorsa, başka bir ifadeyle birimler
tekrar tekrar seçilme şansına sahipse bu seçim sürecine iadeli tesadüfi seçim süreci adı verilir. Bu seçim
sürecinde ana kütle hacmi çekilişten çekilişe değişmez. Sonlu bir ana kütleden iadeli seçimle bir tesadüfi
örneklem seçilirse sonsuz ana kütleden basit tesadüfi örnekleme yapılıyormuş gibi bir anlam ifade eder.
Bu çekiliş sürecinde ana kütledeki her birimin yapılacak çekilişlerin her birinde birbirine eşittir.
olan
seçilme olasılığına sahiptir ve birbirini izleyen çekilişler bağımsızdır. Sonlu ana kütlelerde ana kütle
hacminin büyük ya da küçük oluşu iadeli ya da iadesiz seçimler için önemli farklılıklar gösterir. Ana
kütle hacmi büyük, örnekleme oranı
küçük olduğu zaman iadeli ve iadesiz örneklemler benzer
özellikler gösterirler. Çünkü iadeli çekiliş uygulandığında önceki çekilişlerde seçilmiş olan bir birimin
yeniden örnekleme seçilmiş olma olasılığı çok küçüktür. Ancak ana kütle hacmi küçükse iadeli ve iadesiz
tesadüfi seçimlerle oluşturulan aynı hacimli örneklemler için hesaplanan örneklem istatistikleri ile ana
kütle parametreleri karşılaştırılırsa iadesiz basit tesadüfi seçimle oluşturulan örneklem iadeli olana göre
daha az hatayla tahminleme imkanı sağlar. Bu özellik nedeniyle de iadesiz tesadüfi seçim uygulamada
genellikle başvurulan yöntem olmaktadır.
İlgilenilen özellik bakımından ana kütlenin homojen olması durumunda basit tesadüfi örnekleme
tercih edilmesi gereken bir yöntemdir. Örnekleme planlarında basit tesadüfi örnekleme yöntemlerinin
tercihlerini etkileyen önemli sınırlayıcılar vardır. Bunlardan birincisi güncel bir çerçeve oluşturma ya da
hazırlama güçlüğüdür. İkincisi ana kütlenin birimleri geniş bir coğrafi alana yayılmışsa basit tesadüfi
örnekleme uygulaması çok zaman alır ve veri derleme maliyeti giderek artar. Üçüncüsü ana kütle
homojen değilse basit tesadüfi örneklem sonuçlarının başarısı diğer olasılıklı örnekleme yöntemleri
sonuçlarının başarısından düşüktür.
Sonsuz Ana kütlelerde Basit Tesadüfi Örnekleme
Daha önce açıklandığı gibi sonsuz ana kütle “aynı koşullar altında işleyen bir sürecin sonuçlarının
oluşturduğu topluluktur” şeklinde tanımlanmıştı ve bir sağlık ocağında verilen poliklinik hizmeti süreci
örnek verilmişti. Bu sağlık ocağında verilen poliklinik hizmeti sonucu olan her bir hizmet (hizmet verilen
her bir hasta) bir birim, poliklinik hizmeti süreci devam ettikçe hizmet alan yeni hastalar ana kütleye dahil
olduğu için bu sürecin sonuçları olan poliklinik hizmeti alan hastalar sonsuz ana kütleyi oluşturur.
Örnekten de anlaşılabileceği gibi sonsuz ana kütledeki bir başka ifadeyle aynı koşullar altında işleyen bir
sürecin bütün sonuçları listelenemez. Bütün birimlerle ilgili bir çerçeve hazırlanamaz, bunun yerine bu
birimlerin ilgilenilen bir değişken X için bir teorik olasılık dağılımı tarif edilebilir. Tarif edilen bu teorik
olasılık dağılımına sonsuz ana kütle adı verilir.
Sonsuz ana kütlelerde basit tesadüfi örnekleme ile ilgili bilgiler için
Neter J., Wasserman W., Whitmore G. A. (1993). Applied Statistics, (Boston: Fourth
Edition, Allyn and Bacon) adlı kitaptan yararlanmıştır.
Sonsuz ana kütlenin birimlerinin X değişkeni için ölçümlenen değerleri (gözlem değerleri) bu birimler
için X değişkeninin gerçekleşen değerleridir. Eğer sonsuz ana kütlenin birimleri kararlı (aynı koşullar
altında meydana gelen) bir sürecin sonuçları, birimleri ise n sayıdaki birimin ilgilenilen X değişkeni
bakımından aldığı x1 x2, … , xn değerleri (gözlem değerleri), X1, X2, … Xn tesadüfi değişkenlerinin birer
gerçekleşmesi olduğu düşünülür. Buna göre, bir süreç tarafından türetilen birbirinden bağımsız ve benzer
olasılık dağılımına sahip n sayıdaki X1, X2, … Xn tesadüfi değişkenlerinin oluşturduğu topluluğa sonsuz
ana kütleden seçilmiş basit tesadüfi örneklem denir. Bu tesadüfi değişkenlerin teorik olasılık dağılımına
sonsuz ana kütle adı verilir.
160
Örnek 6.12:
Bir hastanede yataklı tedavi gören hastaların hastanede yatma sürelerinin ortalamasını hesaplamak
amaçlanıyor. Yataklı tedavi gören hastaların hastanede kalış süresi kararlı bir süreçtir. Aynı koşullar
altında işleyen bir süreçtir. Yataklı tedavi gören, görmekte olan ve görecek olan her bir hasta sonsuz ana
kütlenin birimleridir. İncelenen değişken yataklı tedavi gören ve görecek olan hastaların yatma
süreleridir. Bu hastalardan tesadüfi olarak seçilecek n tanesinin hastanedeki yatma süreleri x1 x2, … , xn
sırasıyla X1, X2, … Xn tesadüfi değişkenlerinin gerçekleşmeleridir. Buna göre hastaların hastanede kalış
sürecinden tesadüfi olarak seçilen n tane hastanın ölçülen kalış sürelerini kullanılarak hesaplanan olasılık
dağılımı X1, X2, … Xn teorik olasılık dağılımını ifade eden sonsuz ana kütleden seçilmiş basit tesadüfi
örneklemi oluşturduğu söylenebilir.
Tabakalı Örnekleme
Tanımlanan ana kütlenin birimleri araştırmaya konu olan değişkenler bakımından heterojen ise, önemli
farklılıklar gösteriyorsa tabakalı örnekleme temsili örneklem oluşturabilmek için tercih edilmelidir.
Tabakalı örnekleme ana kütle birimlerinin tabakalara ayrıldığı ve her tabakadan tesadüfi seçimle
örneklemin oluşturulduğu örneklemedir.
Tabakalı örnekleme, üzerinde araştırma yapılacak ana kütle ilgilenilen değişkenler yönünden
heterojen olduğunda örnekleme dağılımının varyansın olabildiğince küçük olmasını sağlayan bir
örnekleme yöntemidir.
Tabakalı örnekleme 4 aşamalı bir süreçtir.

Tabakalama kriterinin belirlenmesi.
Tabakalı örnekleme uygulaması yapacak araştırmacı önce incelenecek değişkenler açısından önemli
farklılıklar gösteren N hacimli ana kütlenin birimlerini homojen birimlerden oluşacak tabakalara
ayırmada kullanılacak kriter belirler. Burada önemli olan belirlenecek kriterin tabakalar içindeki birimleri
olabildiğince homojen, tabakalar arasında ise birimlerin heterojen olmasını sağlayacak kriter olmasıdır.
Aynı zamanda bu kriterin uygulama ve ölçme kolaylığı da sağlamak suretiyle maliyet artırmadan
tahminleme hatasını azaltması gerekir. Tabakalama kriteri ilgilenilen parametre ile sıkı sıkıya ilişki
içindedir. Belirlenen tabakalama kriterinin uygunluğu örneklem değişkenliğinin etkinliği üzerinde olumlu
yönde etkilidir. Bu nedenle asimetrik bölünmeye sahip ana kütlelerde tabakalı örnekleme uygulamasını
tercih etmek bir zorunluluktur. Tabakalama amacıyla kullanılabilecek kriterlere demografik özellik (yaş,
cinsiyet…vb), tüketici türü, sosyoekonomik sınıf, meslek grubu, firma büyüklüğü, coğrafi yerleşim yeri,
fakülte türü vb. örnek olarak gösterilebilir.

Tabakaların oluşturulması.
Belirlenen tabakalama kriteri itibariyle N hacimli bir ana kütle daha homojen, L sayıda ve hacimleri
N1 , N2 , …. , NL olan tabakalara ayrılır. Bu aşamada önemli olan tanımlanan ana kütledeki her bir birimin
yalnız bir tabakaya ait olması ve hiçbir birimin açıkta kalmamasının sağlanmasıdır. Başka bir ifadeyle
N1  N 2  N L 
L
N
h
N
h 1
olmalıdır. Tabaka sayısı L arttıkça tabakaların homojenliği de artacağından tabaka varyansları giderek
küçülecek ve buna bağlı olarak da tahminlerin güvenilirliği giderek artacaktır. Tabaka sayısının artması
maliyetleri yükseltir ve uygulama zorluğu yaratır. Bu nedenlerle tabaka sayısı L belirlenirken tabaka
sayısının yaratacağı maliyet, uygulama zorluğu ve elde edilecek tahminlerin güvenilirliği birlikte
değerlendirilmelidir. Deneyimler ve uygulamalar tabaka sayısının 6 ’dan fazla olmamasını önermektedir.

Tabakalardan birimlerin seçilmesi.
161
Her tabakadan basit tesadüfi seçimle sırasıyla n1 , n2 , … , nL hacimli alt örneklemler oluşturulur. Alt
örneklem hacimleri toplamı örneklem hacmine eşittir. Başka bir ifadeyle n örneklem hacmini göstermek
üzere
L
n1  n2  nL  nh  n
h 1
olmalıdır.

Verilerin derlenmesi.
Oluşturulan alt örneklem birimleri üzerinden veriler derlenir, bu veriler kullanılarak araştırma
amaçları için gerekli olan istatistikler hesaplanır ve bu istatstiklere dayanarak istatistiksel çıkarımlar
yapılır.
Daha önce de vurgulandığı gibi tabakalar içi homojenlik arttıkça tabakalar içi varyanslar küçülür. Bu
da ilgili ana kütle parametre tahminleyicisinin varyansını küçültür. Bu sonuca göre heterojen ana
kütlelerde aynı örneklem hacmi için basit tesadüfi örnekleme uygulamasının örnekleme hatası, tabakalı
örneklemenin örnekleme hatasından büyük olur. Heterojen ana kütleler için tabakalı örnekleme yöntemi
daha etkindir.
Tabakalı örneklemenin diğer bir üstünlüğü ilgilenilen ana kütlenin yanısıra her tabaka içinde ayrı bilgi
elde etme olanağı sağlamasıdır. Uygulamada ana kütleye göre tabakalar için çerçeve oluşturmak daha
kolay olabilir. Ancak sağladığı kolaylıklara rağmen tabakalı örneklemenin bazı güçlükleri de vardır.
Örneğin tabaka hacimleri ve bunların toplamı olan ana kütle hacminin bilinmesi gerekir. Bu her zaman
mümkün olamamaktadır. Ayrıca ilgilenilen ana kütlenin homojenliğinin sorgulanması için de bu ana
kütle hakkında pek çok öncül bilgiye gereksinim vardır. Bu öncül bilgilerin yetersizliği ve geçersizliği
oluşturulacak örneklemin temsil niteliğini olumsuz yönde etkiler. Tabakalı örnekleme sürecinin
adımlarıyla ilgili yukarıdaki kuramsal bilgileri örnek araştırma üzerinde uygulayalım.
Örnek 6.13:
Araştırmanın Amacı: Türkiye’de guatr hastalığının genel ve coğrafi bölgeler itibariyle dağılımını
araştırmak.
Ana kütle: Bu araştırma için Türkiye’nin N1, N2, N3 ve N4 olmak üzere dört coğrafi bölgeye
ayrıldığını düşünelim. Araştırma için bu coğrafi bölgelerdeki sağlık kuruluşlarına son bir hafta içerisinde
başvuran hastalardan oluşan topluluğun ana kütle olarak tanımlandığını düşünelim. Tanımlanan bu ana
kütle sonlu bir ana kütledir, varsayalım ki hacmi N= 10000 hastadır.
Örnekleme Yöntemi: Ana kütle, sonlu ana kütle olduğu için araştırmacı tam sayım da uygulayabilir,
örneklemeye de başvurabilir. Araştırmacı örnekleme yapmayı gerekli kılan nedenleri değerlendirmiş ve
örnekleme yapmaya karar vermiştir. Araştırmacının gözlemlerine ve öncül bilgilerine göre bölgeler
itibariyle guatr hasta dağılımı farklılık göstermektedir. Çünkü araştırmacının öncül bilgilere göre bazı
coğrafi bölgelerde guatr hasta sayısı düşükken bazı bölgelerde yüksek olduğu kanaati bulunmaktadır.
Başka bir ifadeyle guatr hasta sayısı değişkeni bakımından coğrafi bölgeler heterojen özelliğe sahiptir. Bu
değerlendirmeye göre araştırmacı tabakalı örnekleme yöntemini örnekleme amacıyla tercih etmiş ve
uygulama adımlarını aşağıdaki gibi izlemiştir:

Heterojen birimlerden oluşan ana kütlenin coğrafi bölge kriterine göre guatr hasta sayısı
bakımından homojen tabakalara ayrılabileceği düşünülmüştür.

Tabakalar (coğrafi bölgeler) N1, N2, N3 ve N4 şeklinde isimlendirilmiş olsun. Elde edilen
bilgilere göre tabaka hacimleri N1 = 4000, N2 = 3000 , N3 = 2000 ve N4 = 1000 birimden
oluştuğu düşünülsün.
162

n = 1000 olarak belirlenen örneklem hacmi tabaka hacimlerinin (Nh) ana kütle hacmi N=10000
içindeki paylarıyla orantılı olarak aşağıdaki şekilde dağıtılır:
nh = (
).n
n1 = (
) . n = (4000 / 10000) . 1000 = 400
Burada h tabaka numarasıdır. Örneğimizde h = 1, 2, 3, 4 değerlerini alır.
Benzer şekilde h = 2, 3, 4 için hesaplama yapılırsa n2 = 300, n3 = 200, n4 = 100 bulunur.

Her tabakadan (coğrafi bölgeden) yukarıda hesaplanan sayıda tesadüfi seçimle birim (hasta)
seçilir,
(n1 = 400 )+ (n2 = 300) +( n3 = 200) + (n4 = 100) = n = 1000 hasta örneklemi oluşturur.
Seçilen birimler (hastalar) üzerinden guatr hastası olup olmadığı değişkeni itibariyle birinci elden veri
derleme yöntemiyle veriler derlenip çözümleme yapılır ve gerekli bilgiler üretilebilir.
Sistematik Örnekleme
Örneklem için birim seçimi aşağıda ele alınan bir sistematiğe uygun olarak yapıldığı örnekleme sürecine
sistematik örnekleme adı verilir. Bu yöntemin sınırlayıcıları ilgili ana kütleye ilişkin bir çerçevenin var
olup olmaması veya birimlerin doğal bir sıraya sahip olup olmamasıdır.
Bir sistematik örneklem oluşturmak için aşağıdaki adımlar izlenir:

Ana kütledeki birimler 1’den N’ye kadar numaralandırılır.

Araştırma için yeterli olacak örneklem hacmi n belirlenir.

k=

1 ile k arasında bir tamsayı tesadüfi olarak seçilir. Bu sayı a ile gösterilirse, a örnekleme girecek
birinci birimin sıra numarası olur.

a‘ıncı birimi k aralıklarıyla izleyen a + k’ıncı , a + 2k’ıncı , … , a + (n - 1)k’ıncı sıra nolu
birimler örnekleme seçilir ve n hacimli sistematik örneklem oluşturulur.

Oluşturulan örneklemden elde edilen veriler kullanılarak gerekli istatistikler hesaplanır.

Bütün bu adımları daha açık bir şekilde bir örnek üzerinden gösterelim:

Örneğin,

Ana kütledeki birim sayısı N = 1000 sağlık personeli çalışanı olsun. Bu personelin ünvan türü,
soyadı sırası itibariyle listelenip 1’den N’ye kadar numaralandırılır.

Diyelim ki n = 100 birimlik bir örneklem seçileceği tasarlandı. k = 1000 / 100 = 10, hesaplandı.
Bunun anlamı, her 10’uncu birim örnekleme alınacak demektir.

1, 2, … , 10 arasından tesadüfi olarak bir sayı seçildi. Seçilen sayı 4 olsun. A = 4. Sıradaki sağlık
personeli çalışanı örnekleme girecek birinci birimdir.

Sıra nolu sağlık personeli çalışanından başlayarak her 10. ( 4, 14, 24, 34,…) sıra nolu sağlık
personeli çalışanı örnekleme alınarak n = 100 birimlik tesadüfi örneklem oluşturulmuş olur.
büyütme faktörü hesaplanır. Bu oran örnekleme aralığını gösterir.
163
Tablo 6.2: Örnek problem için sistematik örnekleme uygulama tablosu.
1
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16 17 18 19 20
21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1000
Sistematik örneklemede uygulanacak sistematiğin belirlenmesi her zaman yukarıdaki hesaplamalarda
olduğu gibi yapılmayabilir. Ana kütleyi oluşturan birimlere sıra numarası verilemiyorsa veya
numaralandırma çok zaman alıyor ve masraflı oluyorsa ve fakat sonlu veya sonsuz ana kütle birimleri
rastgele dizilişlere veya gelişlere sahip ise sistematik örnekleme uygulanabilir. Örneğin bir üniversitenin
20.000 öğrencisi üzerinde yapılacak bir araştırma için haftanın seçilen bir öğretim günü saat 8:30 da
başlayıp her yarım saat aralıklarla üniversite kampüs kapısından giren öğrencinin örnekleme alınması
uygulaması da bir sistematik seçimdir. Bir süpermarketten ayrılan her k’ıncı müşteriyle görüşme
yapılarak yürütülen araştırmalar da bu örneklemin uygulandığı araştırmalardır. Sistematik örnekleme ana
kütledeki her birimin örneklemde yer alma olasılığı bakımından basit tesadüfi örneklemeye benzer ve bu
olasılık n / N dir. Ancak mümkün örneklemlerden herhangi birinin incelenen örneklem olması olasılığı
N
basit tesadüfi örneklemede 1/ Cn olduğu halde sistematik örneklemede belirlenen sistematiğe göre
örneklem olma şansına sahip kombinasyonların her biri için eşit 1 / k diğerlerininki için 0’dır.
Sistematik örnekleme uygulaması sonucu oluşturulacak örneklemin temsil niteliği ana kütle
birimlerinin sıralandırılması ve k aralığı ile ilişkilidir. Bu sıralandırma araştırmaya konu olan
değişkenlerle ilişkilendirilerek yapılırsa sistematik örnekleme basit tesadüfi örneklemeye göre daha
temsili örneklem oluşturma imkanı verir. Örneğin firmaların düşük ciroya sahip olandan büyük ciroya
sahip olana doğru sıralanması, otellerin yıldız sayıları bakımından büyükten küçüğe doğru sıralanması,
öğrencilerin küçük boyludan büyük boyluya doğru sıralandırılması durumunda sistematik örnekleme her
gruptan birimin örnekleme girmesini temin edebilir. Ancak örnekleme aralığının uygun şekilde
belirlenememesi halinde sistematik örneklemenin basit tesadüfi örneklemeye olan yukarıda açıklanan
üstünlüğü ortadan kalkar. Çünkü belirli özelliğe sahip birimlerin gereksiz oranda örnekleme girmesi söz
konusu olabilir. Bu durum örneklemin temsil niteliğini olumsuz yönde etkiler.
Sistematik örnekleme önceki tesadüfi örnekleme yöntemlerine göre daha az maliyetli ve uygulaması
kolaydır.
Çerçevenin doğal yapısında tekrarlamalar varsa sistematik örnekleme kullanılmamalıdır. Örneğin,
veriler aylık olarak düzenlenmiş ve k = 12 alınmışsa her yılın aynı ayı örnekleme gireceğinden bu tür bir
uygulama tek yönlü hatalara neden olabilir.
Tek Aşamalı ve Çok Aşamalı Küme Örneklemesi
Tabakalı örneklemede olduğu gibi ana kütlenin birimleri küme adı verilen gruplara ayrılır. Bu gruplar
genellikle doğal olarak vardır. Her küme bir örnekleme birimi olarak tanımlanır. Kümeler arasından
tesadüfi olarak belirli sayıda küme seçilir ve seçilen kümelerdeki gözlem birimlerinin tamamı örneklemi
oluşturur. Örneğin bir organize sanayi bölgesinde faaliyette bulunan işyerlerinde çalışan işgörenler
hakkında bir araştırma planlandığında bu organize sanayi bölgesinde her bir işyerinde çalışan işgörenler
bir küme olarak tanımlanabilir. Hanehalkı geliriyle ilgili bir araştırmada her mahalledeki hanehalkı
topluluğu bir küme olarak tanımlanır. Örneklerden de anlaşılabileceği gibi kümeler genellikle bir coğrafi
kritere göre tanımlanmaktadır.
Küme örneklemesi bir ve daha fazla kümeleme aşamaları ile de uygulanabilir. Bir kümeleme aşaması
ile gözlem birimlerine ulaşılıyorsa tek aşamalı kümeleme; iki veya daha fazla kümeleme aşaması ile
gözlem birimlerine ulaşılıyorsa çok aşamalı kümeleme adı verilir.
164
Bu örnekleme yöntemleri ana kütledeki birimlerin homojen, hacimlerinin çok büyük ve geniş bir
coğrafi alana yayılmış olmaları ya da örnekleme girecek birimlere ilişkin bir çerçeve oluşturmanın
mümkün olmadığı durumlarda tercih edilmesi gereken yöntemlerdir.
Tek aşamalı (küme) örneklemesi sürecinde aşağıdaki adımlar izlenir.

İlgilenilen ana kütledeki birimler genellikle coğrafi kritere göre kümelere ayrılır. Bu, birinci
düzey kümelemedir. Kümeler doğal olarak bir mekânda var olan birimlerden oluşur. Küme
sayısı “M” simgesiyle gösterilir. Üniversiteler, sağlık ocakları, araştırma ve uygulama
hastaneleri, kamu kurumları, ortaöğretim okulları birer kümedir. Çünkü örneğin sağlık ocakları
ele alalım. Bu kuruluşlarda çalışan işgörenler kümeleri oluşturur.

Kümeler arasından tesadüfi seçimle “m” sayıda küme seçilir.

Seçilen kümelerdeki birimlerin toplamı tek aşamalı küme hacmini gösterir.
Tanımlanan birinci aşama kümelerine, benzer kritere göre ikinci, üçüncü ve n’inci aşama kümelere
ayrılır ve son kümeleme aşamasındaki kümeler arasından tesadüfi seçimle m sayılı küme seçilir ve seçilen
kümelerdeki birimlerden örneklem oluşturulursa yapılan örneklemeye çok aşamalı küme örneklemesi
denir.
Tek ve çok aşamalı küme örneklemesi ile ilgili kuramsal açıklamaları bir araştırma örneği üzerinden
açıklayalım.
Örnek 6.14:
Araştırmanın Amacı: Türkiye’deki tıp fakülteleri hastanelerinde görev yapan uzman hekimlerin tam gün
yasası uygulaması ile ilgili görüşlerini araştırmak.
Ana kütle: Bu araştırmanın ana kütlesi Türkiye’de tıp fakülteleri hastanelerinde uzman hekimlerin
oluşturduğu topluluktur. Sonlu ve büyük hacimli bir ana kütledir. Ana kütle hacminin büyük olması,
bütün uzman hekimlere ulaşmanın güçlükleri gibi nedenlerle araştırma için örneklemeye başvurulması
düşünülmüştür.
Örnekleme Yöntemi: Uzman hekimler Türkiye’de pek çok ilde kurulmuş üniversitelerin bünyesinde
açılmış olan tıp fakültelerinde görev yapmaktadırlar. Yani coğrafi olarak ülkenin büyük bir kısmına
yayılmış durumdadırlar. Araştırmacı, tıp fakültelerinde görev yapan bu uzman hekimlerin tam gün
yasasını değerlendirmeleri bakımından homojen olduğu öncül bilgisine sahiptir. Bu değerlendirmelere
göre araştırma için uygun örnekleme yöntemi olarak önce tek aşamalı, sonra iki aşamalı örnekleme
yöntemi seçilmiştir.
Tek aşamalı örnekleme uygulamasının adımları:

Uzman hekimler görev yaptıkları üniversite türü kriterine göre kümelere ayrılmıştır. Kümeler
örneğin Eskişehir Osmangazi Üniversitesi Tıp Fakültesi, Hacettepe Üniversitesi Tıp Fakültesi,
Ege Üniversitesi Tıp Fakültesi, İnönü Üniversitesi Tıp Fakültesi, Gazi Üniversitesi Tıp
Fakültesi, İstanbul Üniversitesi Çapa Tıp Fakültesi vb. uzman hekimleri topluluğu şeklinde
tanımlanabilir. Bu tanıma göre küme sayısı M=6 ‘dır.

M=6 tıp fakülteleri arasından m=2 fakülte tesadüfi olarak seçilir. Varsayalım ki seçilen 2 fakülte
Hacettepe Üniversitesi Tıp Fakültesi, Ege Üniversitesi Tıp Fakültesi olsun. Seçilen birinci
fakültedeki uzman hekimlerin tamamı N1=250 ve ikinci fakültedeki uzman hekimlerin tamamı
N4=300 ise örneklem hacmi n=N1+N4=250+300=550 uzman hekim olur.
İki aşamalı örnekleme uygulaması benimsendiğinde birinci aşamada seçilen Hacettepe Üniversitesi
Tıp Fakültesi, Ege Üniversitesi Tıp Fakültesi uzman hekimleri anabilimdalı türü kriterine göre tekrar
kümelere ayrılırsa ikinci aşama kümeleme yapılmış olur. İkinci aşamada her iki üniversitenin oluşturulan
kümeleri (anabilimdalları) arasından tesadüfi seçimle m2 sayıda anabilimdalı seçilir ve bu anabilim
dallarındaki bütün uzman hekimler örneklemi oluşturur. Bu uzman hekimlerin tam gün yasası ile ilgili
görüşlerine ilişkin veriler derlenir.
Tek ve çok aşamalı örnekleme uygulamasında tanımlanan kümeler örnekleme birimi olarak
benimsendiğinden basit tesadüfi örneklemede olduğu gibi ana kütle ile ilgili bir çerçeveye gerek yoktur.
165
Sadece seçilen kümelerle ilgili çerçeveye gereksinim vardır. Bu durum örnekleme uygulamasında zaman,
maliyet tasarrufu yanında uygulama kolaylığı sağlamaktadır.
Eğer birimler kümeler arasında homojen değilse seçilen kümelerdeki birimlerden oluşacak örneklemin
ana kütleyii temsil niteliği tartışılır, çünkü ana kütleyi oluşturan her türden birim örnekleme girmemiş
olur.
Tek aşamalı ve çok aşamalı örnekleme yöntemleri örnekleme maliyetini azaltarak onun etkinliğini
artırırken tabakalı örnekleme doğruluğu artırmaktadır. Küme örneklemesinde kümelerdeki birimlerin
mümkün oldukça heterojen olması, tabakalı örneklemede tanımlanan tabakaların ise mümkün oldukça
homojen olması istenir.
Olasılıklı örnekleme ile olasılıklı olmayan örneklem yöntemleri
arasındaki temel fark nedir, açıklayınız.
ÖRNEKLEME DAĞILIMI
Daha önce de değinildiği gibi tanımlanan ana kütleye ilişkin sayısal karakteristiklere parametre adı verilir
ve parametre genel olarak θ (theta) simgesiyle gösterilir. Tam sayım yapılamadığı durumlarda
araştırmacılar istatistiksel tahminleme ve karar verme (istatistiksel çıkarım) problemleri ile karşılaşırlar.
Bu çıkarımlar örneklem istatistiklerine dayanır. Örneklem istatistiklerinin genel gösterimi daha önce ifade
edildiği gibi ˆ simgesiyle yapılır. Örneklem istatistiği bilindiği gibi tesadüfi olarak seçilen n hacimli
örneklemden elde edilen x1, x2, … ,xn gözlem değerlerinin kullanılmasıyla hesaplanan karakteristiklerin
genel adıdır.
Örnekleme sürecinde tesadüfi olarak seçilen n hacimli bir örneklem için hesaplanan istatistikler
sadece ait oldukları örneklem için bilgi niteliğindedirler. Çünkü incelenen n hacimli bir örneklem aynı
hacimli ve fakat farklı birimlerden oluşabilecek mümkün örneklemlerden sadece birisidir ve mümkün
örneklemlerin her biri için hesaplanacak istatistikler birbirinden farklı ve ana kütle parametre değerlerine
eşit ( ˆ) , büyük ( ˆ) veya küçük ( ˆ) olabilir. Bu nedenle örneklem istatistiklerinden
yararlanarak ana kütle parametreleri hakkında tahminleme ve karar verme sürecinde tesadüfi olarak
seçilen n hacimli bir örneklemin hesaplanan test istatistiğinden değil; o istatistiğin mümkün
örneklemlerde alacağı değerlerin dağılımından ve bu dağılımın özelliklerinden yararlanılır.
N hacimli sonlu bir ana kütleden iadesiz seçimle tesadüfi olarak seçilebilecek n hacimli
sayıdaki mümkün bütün örneklemlerin seçildiğini ve her örneklem için
ˆ1 ,ˆ2 , ,ˆC
N
n
C
N
n
istatistiklerin
hesaplandığını varsayalım. Hesaplandığını varsaydığımız bu istatistiklerin dağılımına örnekleme dağılımı
denir.
Tesadüfi örneklemden hesaplanan ̂ istatistiğinin olasılık dağılımına
bu istatistiğin örnekleme dağılımı denir.
Eğer N hacimli ana kütleden n hacimli örneklemler iadeli seçimle oluşturulursa mümkün örneklem
sayısı ve hesaplanacak istatistik sayısı Nn olacaktır.
Uygulamada, n hacimli bir tek örneklem seçilir ve bu örneklem için tahminlenecek veya karar
verilecek parametre hakkında bilgi üreten istatistik hesaplanır. n hacimli mümkün örneklemler seçilmez,
örneklem istatistikleri hesaplanmaz ve bu istatistiğin dağılımı oluşturulmaz. Mümkün örneklemler
seçilmiş gibi düşünülerek bu istatistiğin varsayımsal dağılımından yararlanmak suretiyle ana kütle
parametreleri hakkında çıkarımlar yapılabilir. Bu durum, örneklem istatistiğinin aynı hacimli
örneklemden örnekleme farklı değerler alan tesadüfi değişken olduğu esasına dayanır. Bir ana kütleden
örneklem seçilmeden önce örneklem gözlem değerleri x1 , x2 , … , xn tesadüfi değişkenlerdir ve bu
gözlem değerlerinden hesaplanan istatistikleri de bir tesadüfi değişkendir. Yapılan açıklama bağlamında
166
örnekleme dağılımı bir tesadüfi değişken olan örneklem istatistiğinin olasılık dağılımı şeklinde
yapılabilir.
Çeşitli amaçlar için örnekleme karar verildiği zaman dikkatlerin en çok odaklandığı parametreler ana
kütle aritmetik ortalaması (µ) ve ana kütle oranı (π) olmaktadır. Bu nedenle bu ünitenin izleyen
kısımlarında bu parametreler hakkında bilgi üreten örneklem istatistiklerinin sırasıyla örneklem aritmetik
ortalaması ̅ ve örneklem oranı p ‘nin örnekleme dağılımları ve özellikleri incelenecektir.
Ortalamanın ( X
Örnekleme Dağılımı
Bir örneklem istatistiği olan örneklem aritmetik ortalaması ( X ) tesadüfi bir değişkendir. X tesadüfi
değişkeninin olasılık dağılımına ortalamanın örnekleme dağılımı adı verilir. Bir başka anlatımla
tanımlanan ana kütleden n hacimli bir tesadüfi örneklem değil de aynı hacimli
C
N
n
(veya Nn) sayıdaki
mümkün tesadüfi örneklemlerin seçildiğini ve her mümkün örneklem için X hesaplandığını
varsaydığımızda
dan oluşan bir frekans dağılımı elde edilebilir. Bu dağılıma ortalamanın
X 
i
örnekleme dağılımı adı verilir. Bir örnek üzerinde
X nın örnekleme dağılımını oluşturalım.
Örnek 6.14:
Kan tahlili yapılan 4 hastanın ölçülen LDL kolesterol düzeyi incelenecektir. Bu hastaların simgesel
isimleri ve kolesterol ölçüm değerleri aşağıda verilmiştir. Ana kütle ortalamasını hesaplayınız ve
örnekleme dağılımını oluşturunuz.
Hastalar (Birimler)
LDL Kolesterol Değerleri
A
90
B
80
C
60
D
70
X nın
Toplam=300
Çözüm 6.15:
Ana kütle ortalaması µ, tam sayım yapıldığında, gözlem değerleri x1 , x2 , … , xN olarak gösterildiğinde
ve yukarıdaki veriler kullanıldığında;
N

x
i
i 1
N

300
 75 mg/dl
4
şeklinde hesaplanır. Hesaplama hatası yapılmamış ise, 75 mg/dl kesin, doğru olan ortalama kolesterol
düzeyini gösterir.
Tam sayım yapılamadığı durumlarda açıktır ki, yukarıdaki kolesterol düzeyleri (xi değerleri)
derlenememiş ve µ=75 mg/dl bilgisi hesaplanamamış olur. Bu durumda µ hakkında tahminleme ve karar
verme (istatistiksel çıkarım) problemleriyle karşılaşılır. Bu türden problemlerin çözümlenebilmesi için µ
hakkında bilgi üreten örneklem istatistiği
gereksinim vardır.
X nın örnekleme dağılımının özellikleriyle ilgili bilgilere
167
̅ ların örnekleme dağılımının oluşturulması için aşağıdaki adımlar izlenir.
N=4 birimlik ana kütleden iadeli veya iadesiz seçimle belirlenen n hacimli mümkün örneklemler
seçilir. Örneğin n=2 için iadesiz seçimle oluşturulabilecek mümkün örneklem sayısı;
C
N
n

N!
n !( N  n)!
C
4
2

4!
 6 adet
2!(4  2)!
olup aşağıdaki tabloda verilmiştir.
Tablo 6.3: N=4 hacimli ana kütleden n=2 hacimli mümkün örneklemlerin ̅ larının örnekleme dağılımı.
Örneklem No
Mümkün
Örneklemler
Örneklem Gözlem
Değerleri
̅
1
A, B
90, 80
85
2
A, C
90, 60
75
3
A, D
90, 70
80
4
B, C
80, 60
70
5
B, D
80, 70
75
6
C, D
60, 70
65
450
̅ lar serisinin dağılımına, ̅ nın örnekleme dağılımı adı verilir. Bu dağılımın ortalaması
̅ simgesiyle gösterilir ve aşağıdaki gibi hesaplanır:
N
Cn

x

X
i
i 1
C
N

n
450
 75 mg/dl
6
Görüldüğü gibi ana kütle ortalaması µ, ̅ nın örnekleme dağılımının ortalaması
 
x
̅ ya eşittir ve
 75 mg/dl
şeklinde yazılır. Tablo 6.3 teki ̅ lar frekans dağılımı olarak düzenlendiğinde n=2 hacimli
farklı örneklem ortalamalarının olasılığı Tablo 6.4 teki gibi gösterilmiş olur.
168
Tablo 6.4: N=4 hacimli ana kütleden n=2 hacimli mümkün örneklemlerin ̅ larının frekans dağılımı.
̅
ni
Örneklem Ortalamalarının Elde Edilmesi Olasılıkları
65
1
1/6 = 0,167
70
1
1/6 = 0,167
75
2
2/6 = 0,333
80
1
1/6 = 0,167
85
1
1/6 = 0,166*
Toplam
6
1,000
*: Olasılıklar toplamını 1’e eşitlemek için düzeltme yapılmıştır.
Tablodaki bilgilere göre, örneğin ̅=75 puan değerini elde etme olasılığı %33,3’tür bilgisi üretilebilir.
Örnekleme girecek birimlerin seçimi iadeli yapılmış olsaydı, N=4 birimden, n=2 birimlik Tablo 6.5
teki Nn = 42 = 16 farklı örneklem oluşurdu. 16 farklı örneklem için yukarıdaki işlemler yapılırsa ̅ ların
örnekleme dağılımı oluşturulabilir. Bu durumda da
 
x
 75 puan
olduğu görülebilir.
Tablo 6.5: N=4 birimlik ana kütleden iadeli seçimle oluşturulabilecek mümkün örneklemler.
A
B
C
D
A
A, A
A, B
A, C
A, D
B
B, A
B, B
B, C
B, D
C
C, A
C, B
C, C
C, D
D
D, A
D, B
D, C
D, D
Özetle;

Her örneklem hacmi için bir istatistiğe ilişkin örnekleme dağılımı olduğu düşünülür.

Örnekleme birim seçimi iadeli de yapılsa, iadesiz de yapılsa hesaplanan örneklem
ortalamalarının dağılımı ana kütle ortalamasına eşit olur.
Ancak, hiçbir araştırmada istatistiksel çıkarsama amacıyla yukarıda açıkladığımız işlemler yapılmaz.
Bunun yerine, n hacimli tek bir örneklem seçilir, bunun
X ortalaması hesaplanır ve örnekleme dağılımı
ile ilgili yukarıda açıklanan bilgilerden yararlanılarak µ hakkında çıkarım yapılır.
169
X ‘nın Dağılımının Özellikleri
X tesadüfi değişkeninin örnekleme dağılımının özellikleri, bu dağılımın ortalaması µ (ana kütle
ortalaması, X nın örnekleme dağılımının ortalaması  x ya eşit olduğu için  x yerine µ kullanılmıştır)
ve standart sapması  x (standart hata) ile açıklanır. Standart hatanın karesi ise ortalamalar örnekleme
dağılımının varyansı olarak isimlendirilir ve
 x2 simgesi ile gösterilir.
X ‘nın Dağılımının Ortalaması
X nın örnekleme dağılımının ortalaması veya aynı anlama gelen, X nın beklenen değeri E ( X )
şeklinde gösterilirse;
E( X )  
yazılabilir. Bu sonuca göre
yapılabilir;
X nın örnekleme dağılımının ortalaması ile ilgili aşağıdaki değerlendirmeler
X nın örnekleme dağılımının ortalaması ana kütle ortalamasına

Örneklem hacmi n arttıkça
yaklaşır.

Ana kütlenin dağılım şekli çarpık bir dağılım gösterse bile, örneklem hacmi arttıkça
dağılımı normal dağılıma yaklaşır.
X nın
Örneğin, kolesterol ölçümü yapılan hastalarlarla ilgili örnek ele alındığında ve tesadüfi olarak seçilen
n=2 hacimli örneklemdeki birimler A ve D birimleri olduğunda örneklem ortalaması;
n
2
x x
i
X=
olarak hesaplanır ve µ nün tahmini
i 1
n

i 1
2
i

90  70
 80 mg/dl
2
E ( X )  µ  80 mg / dl şeklinde yazılabilir.
X ‘nın Dağılımının Standart Hatası
X nın standart sapması veya aynı anlama gelecek şekilde, X nın örnekleme dağılımının standart hatası
 x simgesiyle gösterilir ve standart hata olarak da isimlendirilir.
Standart hata
 x ortalamanın örnekleme dağılımının değişkenliğini gösterir. Yani, mümkün örneklem
ortalamalarının ( X i 'ların) ana kütle ortalamasından farklarının ( X i  µ  hata) ortalama ölçüsüdür.
Standart hatanın karesi ( x ) ise
2
X nın dağılımının varyansını ifade eder.
Ana kütle, sonsuz bir ana kütle ise basit tesadüfi örneklemede birim seçimi iadeli seçimle yapılıyorsa
örneklem hacmi n
30 birim veya örnekleme oranı n/N
0,05 ise
x
aşağıdaki eşitlik yardımıyla
hesaplanır.

x

Bu eşitliklerden


n
x
nın özellikleri ile ilgili aşağıdaki değerlendirmeler yapılabilir.
Standart hata ana kütle standart sapması σ ya ve örneklem hacmi n’e bağlıdır. Bir başka ifadeyle
ana kütle değişkenliği σ büyük ise herhangi bir örneklem hacmi için  x da büyük olur.
170

Örneklem hacmi arttıkça, örneklem istatistiğinden yararlanarak µ hakkında daha az hatalı, daha
güvenilir bilgi üretmek mümkün olur.

Örneklem hacminin karekökü ile
artırdıkça
x
x
arasında ters yönde ilişki vardır. Yani örneklem hacmini
küçülür. Ancak örneklem hacmini artırarak
x
yı düşürmeye çalışmak
örnekleme başvurmayı gerekli kılan nedenlerden dolayı bazı güçlüklere yol açar. Örneğin n=100
birim iken
X standart sapmasını yarıya indirebilmek için örneklem hacmi 4 kat artırılmalıdır.
Ana kütle standart sapması genellikle bilinmediğinden
x
hesaplanırken
yerine onun yansız bir
taminleyicisi olan örneklem standart sapması s kullanılır. Bu durumda standart hata
s
x
simgesiyle
s
eşitliğiyle hesaplanır. Burada “s” hesaplanan örneklem standart sapma değeri
n
serinin değişkenlik ölçüsüdür. Ancak ana kütlenin standart sapması ( ) tahmini amacıyla kullanılacağı
gösterilir ve
s
x

zaman örneklem standart sapması hesaplanırken formülde payda da n yerine n-1 yazılarak hesaplanır.
Örneklem standart sapması,
n
 (x  X )
s
i 1
2
i
n
Ana kütle standart sapması tahmini için hesaplanan örneklem standart sapması ise,
n
s
 (x  X )
2
i
i 1
n 1
şeklinde hesaplanır.
Eğer ilgilenilen ana kütle sonlu bir ana kütle ve örnekleme oranı n/N
hesaplanırken
0,05 ise standart hata
N n
şeklindeki bir çarpan, düzeltme faktörü olarak kullanılır ve standart hata
N 1
hesaplanması

x


n
.
N n
N 1
veya
s
x

s
n
N n
N 1
eşitlikleriyle yapılır.
Basit tesadüfi örneklemede örneklem hacmi arttıkça X nın örnekleme dağılımı normal dağılıma
yaklaşır. Bu sonuca, istatistikte önemli bir yeri olan aşağıdaki teorem yardımıyla ulaşılır:
Merkezi Limit Teoremi
Ana kütlenin dağılım şekli ne olursa olsun, örneklem hacmi büyüdükçe, X nın örneklem dağılımı normal
dağılıma yaklaşır. Bu dağılımın ortalaması µ, varyansı
/ n dir. Örneklem hacmi n için yeterli
büyüklük,kesin olmamakla birlikte uygulamada n 30 birim olarak kabul edilmektedir.
171
Eğer
X ortalaması µ ve varyansı
olan normal dağılımlı bir ana kütleden seçilmiş n hacimlik basit
bir tesadüfi örneklemin ortalaması ise, ortalamalar örnekleme dağılımı, ortalaması µ ve varyansı
olan bir normal dağılımdır.
/n
X tesadüfi değişkeninin dağılımı normal olduğunda,
z
i

 Xi
/ n
Eşitliğiyle standart değişkene dönüştürülür. Böylece, normal dağılımın özellikleri kullanılarak
örneklem aritmetik ortalamasından ana kütle aritmetik ortalaması hakkında bilgi üretmek kolaylaşır.
Normal dağılan bir ana kütleden, tesadüfi olarak seçilebilecek birbirinden farklı
mümkün bütün örneklemlerin seçildiğini, her örneklem için
 X i
değerlerini hesaplandığını düşünelim. Değerler aralığı  
X 
s
birimlik
X


i
ları ve onların
standart
s

x
olan istatistiğin dağılımı
x
(n  1) serbestlik derecesi (sd = n-1) ile t dağılımı adı verilen sürekli bir dağılım gösterir ve bu istatistik
t
X 
s
x
şeklinde hesaplanır.
t dağılımı ortalaması sıfır olan tek modlu ve simetrik bir dağılımdır. Dağılımın şekli standart normal
dağılıma benzer fakat değişkenliği daha büyüktür. Bu değişkenlik serbestlik derecesi ile ters orantılıdır.
Örneklem hacmi artarken, (sd = n-1) büyür, t değerinin hesaplanmasında
s
x
nın kullanılması nedeniyle
ortaya çıkan değişkenlik küçülür ve t dağılımı standart normal dağılım (z dağılımına) yaklaşır.
t örnekleme dağılımının özelliklerinden yararlanarak ana kütle ortalaması µ ile ilgili bilgilerin nasıl
üretileceği de izleyen ünitede örneklerle açıklanacaktır.
Örnek 6.16:
Bir hastanede belirli bir hastalıktan şikayetçi olarak hastaneye yatan hastaların ortalama olarak kaç gün
kaldıkları tahminlenmek isteniyor. Bu amaçla tesadüfi olarak n=100 hasta seçiliyor. Seçilen bu hastaların
ortalama kalış süresi 5,4 gün ve standart sapması 2 gün olarak hesaplanmıştır. Bu hastanede daha önce
yapılan araştırmalara göre hastaların ortalama kalış süresinin 6,4 gün olduğu bilinmektedir.
Bu bilgileri kullanarak;

X nın örnekleme dağılımının ortalaması nedir? Hesaplayınız.

İstenen tahminleme yapılırken işlenebilecek hata nedir? Hesaplayınız.

X nın standart z değerini hesaplayınız.
Çözüm 16:


E ( X )    5, 4 gün
hasta
bilinmediği için)
olduğu için standart hata (ana kütle standart sapması
s
x

s
2
2

  0, 2 gün
10
n
100
172
hesaplanır. Hastaların ortalama kalış süresini yukarıdaki verilere göre tahminlerken işlenebilecek hata
düzeyi 0,2 gündür bilgisi elde edilebilir.
Z
X 
s
x

5, 4  6, 4
 5
0, 2
Örneklem Oranı p’nin Örnekleme Dağılımı
Örnekleme planlarında ele alınan ana kütlenin araştırılmak istenen değişkenin düzeyleri (şıkları) iki, üç
dört,…… sayıda olabilir. Uygulamalarda çoğunlukla ilgilenilen değişken iki düzeye sahip olmaktadır.
Örneğin bir fabrikada üretilen ürünler, hatalı ya da hatasız ürün, bir fakültedeki öğrenciler, başarılı ya da
başarısız öğrenci olmak üzere iki grupta toplanabilir. Bu iki sonuçtan birinde örneğin A sonucunda yer
alan birimlerin oranıyla ilgilenilebilir. Bu durumda ana kütle oranı ana kütlenin birimleri içindeki
ilgilenilen türden özelliğe sahip olanların oranı biçiminde tanımlanır.
Örnek 6.17:
Y sınıfındaki öğrencilerin genel başarı durumu aşağıda verilmiştir. Bu sınıfın başarılı öğrenci oranı nedir?
ÖĞRENCİ ADI
BAŞARI DURUMU
A
Başarılı
B
Başarısız
C
Başarılı
D
Başarılı
Örnekte sınıftaki başarılı öğrenci oranı, ana kütle oranıdır ve П ile gösterilir. Bu ana kütledeki ilgilenilen
türden özelliğe sahip (başarılı) birim (öğrenci) sayısı R ile gösterilirse, ana kütle oranı П,
Eşitliği ile hesaplanır. Burada R = 0, 1, 2, … , N değerlerini alabileceği için
nin değer aralığı
olur. Sınıftaki başarısız öğrenci saısı (ilgilenilmeyen türden özelliğe sahip birim sayısı) NR olduğu için, başarısız öğrenci oranı Q,
Olur.
Yukarıdaki örnekte başarılıöğrenci sayısı, R=3 olduğu için
=
Olarak bulunur. Bu sonuca göre sınıftaki öğrencilerin %75 i başarılıdır. Bu kesin bir sonuçtur.
Tam sayım yapılamadığı zaman R bilinemez ve
hesaplanamaz. Örnekleme planlarında
parametresi hakkında bilgi, bu parametre hakkında bilgi reten örneklem istatistiklerinden yararlanılarak
üretilebilir.
Hacmi n olan bir basit tesadüfi örneklemden, bu örneklemin seçildiği ana kütlenin
parametresi
hakkında bilgi üretebilmek için iki örneklem istatistiği söz konusudur. Birincisi, hacmi n olan bir basit
tesadüfi örneklemdeki ilgilenilen türden özelliğe sahip olan birimlerin sayısıdır ve r ile gösterilir. İkincisi,
173
ilgilenilen türden özelliğe sahip olan örneklemdeki birimlerin oranıdır. Örneklem oranı p simgesiyle
gösterilir ve
p=
eşitliği ile hesaplanır. Burada r =0, 1, 2, … , n değerlerini alabilir. r’nin değerlerine bağlı olarak p de
aralığında bir değer alır. Örneklemi oluşturan birimler arasında ilgilenilen türden sonuca
sahip olmayan birimlerin oranıysa q ile gösterilir. Bu sonuca sahip birimlerin sayısı n- r olduğu için,
olur.
Yukarıda verilen örnekte ele alınan N=4 birimlik bir ana kütleden basit tesadüfi örneklemeyle hacmi n=2
olan bir örneklem seçildiğinde ve örneklemdeki birimler öğrenci B ve C olduğunda başarılı öğrenci oranı,
olarak hesaplanmış olur.
Öte yandan, ana kütle oranına ilişkin varyans,
şeklinde ifade edilir. Varyansın karekökü de standart sapmayı verdiğinden,
  π (1  π)
şeklinde yazılır.
örneklem varyansı ve standart sapması da benzer şekilde sırasıyla
s 2  p (1  p)
ve
s  p (1  p)
olarak gösterilir.
İki sonuçlu bir ana kütleden, mümkün bütün n hacimli basit tesadüfi örneklemlerin seçildiğini ve her
örneklem için p oranının hesaplandığı varsayıldığında pi oranlarından oluşan bir dağılım elde edilir. Bir
ana kütleden seçilebilecek aynı hacimli mümkün bütün örneklemler için hesaplanan örneklem oranlarının
oluşturduğu dağılıma oranların örnekleme dağılımı adı verilir.
Örnekleme planlarında tanımlanan ana kütleden tesadüfi olarak n hacimli sadece tek bir örneklem
oluşturulur ve bu örneklem için p oranı hesaplanır. Bu p oranı bir rasal değişkenin gerçekleşen bir
değeridir. Buna göre P tesadüfi değişkeninin çekilmesi mümkün bütün n hacimli örneklemlerde aldığı
değerlerin dağılımına “oranların örnekleme dağılımı” adı verilir.
Ortalama ve Varyans
Ana kütle oranı
hakkında araştırılmak istenin bilgi n hacimli tek bir örneklem için hesaplanan p
istatistiğine değil, bir tesadüfi değişken olan p istatistiğinin örnekleme dağılımının özelliklerinden
yararlanılarak üretilir. Bu dağılımın özellikleri dağılımın aritmetik ortalaması ve varyansıyla
belirlenebilir.
174
Sonsuz bir ana kütleden seçilen n hacimli basit tesadüfi örneklem için hesaplanan p oranının
örnekleme dağılımının aritmetik ortalaması µp ana kütle oranı
ye eşittir. Bu durum örneklem oranı
p’nin ana kütle oranı
nin yansız (sistematik hata içermeyen) tahminleyicisi olduğunu göserir. Bu
sonuca göre, p’nin beklenen değeri
E(p) =
yazılır.
Sonsuz ana kütlelere ya da örnekleme oranı n/N
0,05 olan bütün sonlu ana kütlelere uygulanan basit
tesadüfi örnekleme planlarında örneklem oranı p nin dağılımının varyansı
gösterilir.
ve standart hatası da
ile
Oranlar örnekleme dağılımının statndart sapması;
Eğer ana kütle varyansı
biliniyorsa,
p 
eşitlikleriyle, ana kütle varyansı
π (1  π)
n
bilinmiyorsa,
sp 
p (1  p)
n
eşitlikleriyle hesaplanır.
Dağılım Şekli ve Merkezi Limit Teoremi
Oranların örnekleme dağılımının şekli eğer E(p) = < 0,5 ise sağa çarpık, E(p) = > 0,5 ise sola çarpık
ve E(p) = = 0.5 ise simetrik bir dağılım gösterir. Kolaylıkla görülebileceği gibi, E(p) = nin değeri 0
ve 1 e yaklaşırken dağılımın çarpıklığı artar.
Merkezi limit teoremine göre bir örnekleme planında seçilen basit tesadüfi örneklemin hacmi n
büyürken örneklem oranı p’nin örnekleme dağılımı normal dağılıma yaklaşır. Uygulamada (n
5
ve [n (1- )]
5 koşullarını birlikte sağlayan örneklem büyüklüğü, yeterli örneklem büyüklüğü olarak
birim olması ve ana kütle oranı nin
kabul edilir. Aynı teoreme göre tesadüfi örneklem hacmi
0 ya da 1 e yakın değerler almaması koşuluyla oranların örnekleme dağılımı normal dağılıma yaklaşır. Bu
koşulları sağlayan oranların örnekleme dağılımıyla ilgili problemlerin çözümlerinde normal dağılımın
özelliklerinden yararlanılır. Bu amaçla örneklem oranı p standartlaştırılmış Z değişkenine
Z=
şeklinde dönüştürülerek çeşitli olasılıklar hesaplanabilir ve istatistiksel çıkarımlar kolayca yapılır.

Örnekleme dağılımı kavramını açıklayınız.

Merkezi limit teoremi istatistiğe ne tür kolaylıklar getirmiştir, açıklayınız.
175
Örnek 6.18:
Bir hastaneye çeşitli hastalık şikâyetleri nedeniyle yılda 8000 kişi başvurmuştur. Hastane yönetimi ilgili
yılda hastaneye başvuranlardan yataklı tedavi görenlerin oranları tahminlemek amacıyla 100 başvuru
tesadüfi olarak seçiyor. Seçilen başvuruların 15 tanesinin yataklı tedavi gören hasta olduğu belirlenmiştir.
Bu verileri kullanarak istenen tahminleme yapılırken işlenecek hata düzeyi nedir?
Çözüm 6.18:
Bilindiği gibi, tahminleme yaparken işlenebilecek hata düzeyini belirleme imkânı veren istatistik standart
hatadır. Bu;
sP 
P (1  P)
n
eşitliği ile hesaplanır. Burada;
ve
sP 
0,15 . 0,85
0,127

 0, 032
100
100
Bu bilgilere göre, söz konusu hastaneye başvuran hastaların içerisinde yataklı tedavi gören hasta
oranını tahminlerken işlenebilecek hata düzeyi ortalama olarak SP = 0,032 gün olacaktır.
Örneklem Hacminin Belirlenmesinde Nicel Yöntemler
Karşılanabilecek Maliyeti Esas Alan Yöntem: Örneklem hacmi n, araştırma bütçesine bağlı olarak,
n
eşitliği ile hesaplanır. Burada,
C = Araştırma bütçesini,
= Araştırmanın sabit maliyetini,
= Örnekleme birimi için değişken maliyeti gösterir.
Örnek 6.19:
Araştırma bütçesinin 2200 TL. ile sınırlı olduğu bir araştırmada, sabit maliyet 800 TL. ve örnekleme
seçilecek her örnekleme birimi için maliyet ise 5 TL. dır. Bu bütçeyle oluşturulabilecek örneklem hacmi
en fazla ne olabilir?
Çözüm 6.19:
n
280 birim
Örneklem hacmi en az 280 birim olmalıdır.
Kabul Edilebilir Hata Düzeyini Esas Alan Yöntem: Örneklem istatistiğinin dağılımının normal olduğu
varsayımı altında bu yöntemle örneklem hacminin belirlenmesi için aşağıdaki eşitlikten yararlanılır.
176
Kabul Edilebilir Hata Düzeyi ( X  µ)  d Olduğunda;
Kabul Edilebilir Hata Düzeyi (
n
Olduğunda;
z 2 [ (1   )]
d2
Bu eşitliklerde
= Örneklem hacmini
d  ( X  µ) veya (
= Belirlenen 1
araştırmacının belirlediği kabul edilebilir değeri
güven düzeyinde standart normal dağılım tablo değerini
σ = Standart sapmayı
= Ana kütle oranını
gösterir.
Örneğin, kabul edilebilir hata düzeyi
d  ( X  µ) esas alındığında örneklem hacminin
eşitliği ile hesaplanabilmesi için araştırmacının α anlamlılık düzeyini ve
değerini belirlemesi ve ana
kütle varyansı
hakkında bilgiye sahip olması gerekir. Ana kütle varyansı
genellikle bilinmez. Bu
durumda,
ile ilgili bilgi geçmiş yıllarda yapılmış olan aynı ya da benzer konudaki çalışmalardan elde
edilebileceği gibi, bir pilot çalışmadan ya da en büyük değerli gözlem değeri xenb ve en küçük değerli
gözlem değeri xenk biliniyorsa ve xi tesadüfi değişkeni normal dağılıyorsa, α=0,01 için
tahmincisi kullanılarak da hesaplanabilir.
Örnek 6.20:
Bir araştırmacı X ilinin merkeç ilçesinde ikamet eden ailelerin ortalama aylık mutfak harcama tutarını
tahminlemek istiyor. Ayrıca bu tahminlemede 0,05 anlamlılık düzeyinde 10 TL’lik bir yanılgı payı
amaçlıyor. Örneklem hacmi ne olmalıdır? Benzer amaçla bu il merkezinde yapılan araştırmalardan
ailelerin aylık mutfak giderleriyle ilgili standart sapmanın 150 TL olduğu öğrenilmiştir.
Çözüm 20:
d = 10 TL.
z = 1,96, α= 0,05
σ= 150 TL.
n
864.36
865 birim
en az 865 aile tesadüfi olarak seçilmelidir.
177
Özet
Örneklemden derlenen veriler için araştırmada
istenen bilgileri üreten istatistikler; örneklem
aritmetik ortalaması, örneklem oranı vb. gibi
istatistikler hesaplanır. Bu istatistikler ve bu
istatistiklerle
ilgili
dağılımın
özellikleri
kullanılarak bu istatistiklerin bilgi ürettiği
parametreler; ana kütle aritmetik ortalaması µ,
ana kütle oranı π için gerekli çıkarım bilgileri
üretilebilir.
Ana kütle sonlu ana kütle ise gerekli bilgilerin
üretilebilmesi için tam sayım yapılabilir veya
örneklemeye başvurulur. Araştırma için gerekli
zamana, ekonomik imkanlara ve araçlara sahip
olunduğunda tam sayım yapılmalıdır. Çünkü tam
sayım sonucu elde edilen verileri kullanarak
hesaplanan bilgiler kesin bilgilerdir. Tanımlanan
ana kütle sonsuz ana kütle ise, örnekleme
zoruludur. Tam sayım uygulamasının imkansız,
örneklemeye başvurmanın gerekli olduğu
durumlarda
örneklemeye
başvurmak
kaçınılmazdır.
Örneklemeye
başvurulduğunda
araştırmacı
zaman ve ekonomik tasarruf sağlar. Ayrıca tam
sayım yapmayı engelleyen diğer nedenlerin
varlığında örnekleme araştırma yapmaya imkan
verir.
Örnekleme planı beş aşamalı bir süreçtir. Bu
aşamalarda araştırmacı araştırma yapacağı ana
kütleyi tanımlar. Bu ana kütle sonlu ana kütle
olduğunda ana kütle ile ilgili güncel bir çerçeve
hazırlar veya belirli bir kaynaktan nasıl temin
edilebileceğini belirler. Daha sonra olasılıklı ve
olasılıklı olmayan örnekleme yöntemlerinden
hangisini temsili bir örneklem oluşturma
amacıyla araştırmasında kullanacağına karar
verir. Seçilecek örneklem hacminin ne olacağını
belirler ve örnekleme uygulaması sonucu
oluşturduğu örneklemdeki birimler üzerinden
araştırmaya konu olan değişkenler itibariyle
veriler derlenir.
178
Kendimizi Sınayalım
1. Bir örneklemin özelliklerine ilişkin değerlere
ne ad verilir?
b. Ana kütle
5. X tesadüfi değişkeni, ortalaması (µ) 50 ve
standart sapması (σ) 10 olmak üzere normal
dağılmıştır. Buna göre, hacmi n=100 olan
örneklemin
ortalaması
X  55 değerinin
standart normal değeri (z) kaçtır?
c. Anlamlı fark
a. 0,5
d. Örnekleme
b. 1
e. Parametre
c. 1,5
2. Bir ana kütleden rastgele seçilen birden fazla
örneğin sonuçlarının birbirinden farklı olduğu
gözlenmiştir.
d. 2
Bu farklılığın nedeni aşağıdakilerden hangisidir?
6.
Örneklem
oranının
aşağıdakilerden hangisidir?
a. Örnek istatistiği
e. 5
a. Beklenen frekans
değer
aralığı
a.
b. Yöntem farklılığı
b.
c. Örnek değişkenliği
c.
d. Örnek istatistiği
d.
e. Parametre
e.
3. İki sonuçlu bir ana kütleden, mümkün n
hacimli basit tesadüfi örneklemlerin seildiğini ve
her iki örneklem için p oranı hesaplandığı
varsayımı altında,
lerin dağılımına (i=1, 2, … ,
n) ne ad verilir?
7. Bir örneklemin gözlem değerleri için
hesaplanan karakteristik değerlere ne ad verilir?
a. Ortalama
a. Oranların örnekleme dağılımı
b. İstatistik
b. Örneklem istatistiği
c. Frekans
c. Binom dağılımı
d. Anlamlı fark
d. Normal dağılım
e. Parametre
e. Ortalamaların örnekleme dağılımı
8. Aşağıdakilerden hangisi, tam sayım yapmayı
engelleyen nedenlerden biri değildir?
4. Aşağıdakilerden hangisi olasılıklı örnekleme
yöntemlerinden biri değildir?
a. Maliyet
a. Tabakalı örnekleme
b. Ölçüm için birimlerin tahrip edilmesi olasılığı
b. Basit tesadüfi örnekleme
c. Ana kütle hacminin küçük olması
c. Kartopu örneklemesi
d. Zaman
d. Küme örneklemesi
e. Ana kütle hacminin sonsuz sayıda olması
e. Sistematik örnekleme
179
9. Tabaka hacimleri sırasıyla 50, 250 ve 200
birimden oluşan bir ana kütleden kota
örneklemesiyle
50
birimlik
örneklem
oluşturulmak istenmektedir. Bu örneklem hacmi
tabaka hacimlerinin ana kütle içindeki paylarıyla
orantılı olarak dağıtılırsa üçüncü sıradaki
tabakadan seçilecek birim sayısı kaç olmalıdır?
Kendimizi Sınayalım Yanıt
Anahtarı
1. a Cevabınız yanlışsa “Tam Sayım ve
Örnekleme”
tanımlarını
yeniden
gözden
geçiriniz.
2. c Cevabınız yanlışsa “Olasılıklı Örnekleme ve
Örnekleme Dağılımı” konularını yeniden gözden
geçiriniz.
a. 4
b. 15
3. a Cevabınız yanlışsa “Oranların Örnekleme
Dağılımı” tanımını yeniden gözden geçiriniz.
c. 20
d. 35
4. c Cevabınız yanlışsa, “Olasılıklı ve Olasılıklı
Olmayan Örnekleme” tanımlarını yeniden gözden
geçiriniz.
e. 40
10. Ana kütle hacmi küçük olduğunda,
örnekleme seçilen bir birimin diğerlerinin
seçilme şansını etkilememesi için aşağıdaki
seçim yöntemlerinden hangisi kullanılır?
5. e Cevabınız yanlışsa, “Ortalamanın Örnekleme
Dağılımının özelliklerini” yeniden gözden
geçiriniz.
6. a Cevabınız yanlışsa, “Oranların Örnekleme
Dağılımının Özellikleri” ile ilgili bilgileri
yeniden gözden geçiriniz.
a. Tesadüfi
b. Kolayda
c. Kartopu ve sistematik birlikte
7. b Cevabınız yanlışsa, “Örneklem ve
Örneklemenin Amaçları” ile ilgili bilgileri
yeniden gözden geçriniz.
d .Keyfi ve sistematik birlikte
e. Keyfi
8. c Cevabınız yanlışsa, “Örnekleme Başvurma
Nedenlerini” yeniden gözden geçiriniz.
9. c Cevabınız yanlışsa, “Kota Örneklemesi
uygulaması” ile ilgili açıklamaları yeniden
gözden geçiriniz.
10. a Cevabınız yanlışsa, “Keyfi ve Tesadüfi
Seçim” uygulamalarıyla ilgili açıklamaları
yeniden gözden geçiriniz.
180
Sıra Sizde Yanıt Anahtarı
Sıra Sizde 5
Sıra Sizde 1

Tam sayım yapılamaz. Çünkü hastaneye
gelen hastalar ana kütleyi sonsuz ana
kütledir.

Örnekleme giren birimlerin tesadüfi olarak
seçilmesi ve örneklemin temsil örneklem
olması durumunda örneklem istatistikleri
ana kütle parametreleri için bilgi
niteliğindedir.



Örneklemin temel amacı temsili örneklem
oluşturmaktır.

Sıra Sizde 2


Tam sayım yapmayı imkansız kılan nedenler
söz konusu olmadıkça ve kesin bilgi istediği
sürece tam sayım yapılır.
Yararlanılan Kaynaklar
Fink, A. (1995). How To Sampling in Surveys,
London: Sage Publication.
Her ne kadar tam sayım için gerekli koşullar
mümkün ise de örneklemeye başvurulur.
Çünkü, öğrencilerin bazılarına ulaşmak
imkansız olabilir, ulaşılsa bile bazıları bilgi
vermeyebilir.
Gürsakal, N. (1997). Bilgisayar Uygulamalı
İstatistik 1, Bursa: Marmara Kitabevi.
Malhotra, N. K. (1996). Marketing Research
An Applied Orientation, New Jersey: Prentice
Hall International.
Sıra Sizde 3


Neter, J., Wasserman, W., Whitmore, G. A.
(1993). Applied Statistics, Boston: Simon and
Schuster.
Yargısal örnekleme daha temsili örneklem
oluşturur.
Çünkü,
bu
örnekleme
uygulamasında örnekleme birim seçimini
yapacak kişi incelenecek ana kütle ile ilgili
temsili örneklem oluşturma bakımından
öncül bilgilere sahiptir.
Serper, Ö., Aytaç, M. (2000). Örnekleme, Bursa:
Ezgi Kitabevi
Serper, Ö. (1986). Uygulamalı İstatistik 2,
İstanbul: Filiz Kitabevi
Kota örneklemesi seçilir.
Sıra Sizde 4

N sonlu bir ana kütleden tesadüfi olarak n
hacimli bir örneklem değil de mümkün aynı
hacimli bütün örneklemleri seçtiğimiz ve
her
örneklem
için
bir
istatistik
hesapladığımızda meydana gelen dağılıma
örnekleme dağılımı denir.
Bu teorem herhangi bir örnekleme
uygulamasında hesaplanan n hacimli bir
örneklem için hesaplanan istatistiğin
dağılım şekli ve özellikleri ile ilgili
ispatlanmış bilgileri verdiği için istatistiksel
çıkarımlar bu teoreme dayandırılmaktadır.
Tryfos, P. (1996). Sampling Methods for
Applied Research, New York: John Wiley and
Sons Inc.
Temel fark, olasılıklı olmayan örnekleme
yöntemlerinde birim seçimi keyfi yapılırken
bu örneklem uygulamaları ile oluşturulan
örneklem için hesaplanan istatistiklerin ana
kütle parametreleri hakkında genelleme
yapmak
amacıyla
kullanılmamasıdır.
Olasılıklı örnekleme uygulandığında birim
seçimi tesadüfi yapılır ve örneklem
istatistikleri
parametreler
hakkında
genelleme amacıyla kullanılır.
Trochim, W. M. (2001). Research Methods
Knowledge Base, Cornell University.
Hirsch, W. Z. (1963). Introduction to Modern
Statistics, New York: The Macmillan Company
181
7
Amaçlarımız
Bu üniteyi tamamladıktan sonra;
İstatistiksel tahmin ve hipotez testi kavramlarını açıklayabilecek,
Bir hipotez testi problemini aşamalarıyla gerçekleştirebilecek,
Varyans analizi problemlerini çözümleyebilecek,
Ki-Kare analizini gerçekleştirebilecek
bilgi ve becerilere sahip olabilirsiniz.
Anahtar Kavramlar
İstatistiksel tahmin
Ki-kare testi
Güven aralığı
I. ve II. Tip hata
Hipotez testi
Anlamlılık düzeyi
Varyans analizi
Serbestlik derecesi
İçindekiler

Giriş

İstatistiksel Tahmin

Hipotez Testleri

Tek-Yönlü Varyans Analizi

Ki-Kare   2  Testi
182
İstatistiksel Tahmin ve
Hipotez Testleri
GİRİŞ
İstatistiksel tahmin ve örnekleme iç içe kavramlardır. Ana kütleyi oluşturan birimlerin sayısının çok fazla
olması durumunda çeşitli nedenlerden dolayı birimlerin tamamına ulaşılamadığında örneklemeye
başvurmanın gerekliliği önceki bölümde belirtilmişti. Örneklem istatistiklerine dayanarak ana kütle
parametrelerine ilişkin çıkarsama yapma, örnekleme yaklaşımı olmakla birlikte bir tahmin işlemidir.
İstatistiksel tahmin belirli bir ana kütleden tesadüfi olarak alınan örneklemden yararlanarak, ana kütlenin
belirli bir parametresi ya da parametrelerinin değerinin araştırılması işlemidir. Dolayısıyla ana kütle
parametreleri, örneklem istatistikleri yardımıyla tahmin edilmektedir. Tahmin işlemi istatistiğin
çıkarsama işlevi ile ilgilidir.
İstatistiksel tahmin gibi örneklem istatistiklerinden yararlanarak ana kütle parametrelerine ilişkin
hipotezlerin test edilmesi çıkarsama işlevinin bir başka konusudur. Hipotez testlerinde araştırmanın
amacına göre kullanılacak uygun testin seçimi oldukça önemli bir konudur. Kullanılacak testin
koşullarının sağlanıp sağlanmamasına göre testin seçimi önem kazanır. Buna göre testler parametrik ve
parametrik olmayan biçiminde iki gruba ayrılır. Parametrik testler, bazı varsayımları gerektiren testlerdir
ve incelenen değişkenin en az aralıklı ölçme düzeyinde ölçülmüş olmasını gerektirirler. Parametrik
olmayan testler, iddialı varsayım ileri sürmezler ve genellikle sınıflayıcı ve sıralayıcı ölçme düzeyindeki
verilere uygulanırlar. Bu ünitede açıklanan t-testi, z-testi ve varyans analizi parametrik testlerdir. Ki-Kare
testi ise parametrik olmayan testlerdendir.
t-testi ve z-testi tek ve iki ana kütle aritmetik ortalamasına ilişkin testlerdir. İkiden çok ana kütle
ortalamasına ilişkin test ise varyans analizi olarak adlandırılmaktadır. Ki-Kare testi iki ya da daha fazla
grubun sınıflayıcı veya sıralayıcı ölçme düzeyinde ölçülmüş değişken bakımından farklılığını araştıran bir
testtir.
Bir araştırma probleminin çözümlenmesinde kullanılacak tekniğin seçiminde değişkenlerin hangi
ölçekle ölçülebileceğinin belirlenmesinin önemli olduğu ilk ünitede belirtilmişti. Sınıflayıcı ve sıralayıcı
ölçekle ölçülebilen değişkenlerden elde edilen verilerle parametrik olmayan tekniklerden, aralıklı ve
oranlı ölçekteki verilerle hem parametrik olmayan hem de parametrik tekniklerden yararlanılabilir.
Bu ünitede istatistiksel tahmin ve parametrik hipotez testleri konuları ele alınacaktır. Parametrik
olmayan testlerden sadece Ki-Kare testine yer verilecektir.
İSTATİSTİKSEL TAHMİN
Bir ana kütle parametresinin değerinin örneklem istatistiğinden yararlanarak belirlenmeye çalışılması
istatistiksel tahmindir. İstatistiksel tahminde “nokta tahmin” ve “aralık tahmini” olmak üzere iki tür
tahmin söz konusudur.
Nokta (Tek Değer) Tahmin
Ana kütle parametresini çekilen örneklemden elde edilecek örneklem istatistiğinden hareketle tek bir
değerle tahmin etmek nokta tahmin(tek değer tahmin) olarak adlandırılır. Genel gösterim olarak ana kütle
parametresi “  ”, örneklem istatistiği ise “T” simgeleri ile gösterilecektir. Örneğin; bir ana kütle aritmetik
183
ortalaması

tahmin edilmek istendiğinde örneklem ortalaması x , ana kütle oranı
istendiğinde p , ya da ana kütle varyansı
2

tahmin edilmek
tahmin edilmek istendiğinde örneklemden hesaplanan
s2
yardımıyla nokta tahmin işlemi gerçekleştirilir. Nokta tahmininde genel olarak ana kütle ortalaması, ana
kütle oranı ya da bunlar arasındaki farklar için tahmin yapılır. Sözü edilen tahminlerde kullanılacak
eşitlikler aşağıdaki gibi gösterilebilir.
n
ˆ X

x
i 1
i
n
n
r
ˆ p
n
2
2

s
 (x  X )
i 1
2
i
n 1
Nokta tahmin işleminin başarılı sayılabilmesi için nokta tahmininin belirli bazı özelliklere sahip
olması gerekir. Bu özellikler tahminleri değerlendirmede kullanılan ölçütler olarak da
nitelendirilmektedir. Nokta tahmininin “sapmasızlık”, “tutarlılık”, “etkinlik” ve “yeterlilik” olmak üzere
dört özelliğinden söz edilir. Sapmasızlık bir ana kütle parametresinin tahmincisi olan örneklem
ortalamasının bu parametreye eşit olması özelliğidir. Sapmasızlık şu şekilde de açıklanabilir: eğer
örneklem istatistikliğinin beklenen değerinin tahmin edilmek istenen ana kütle parametresine eşit ise, söz
konusu istatistik ana kütle parametresinin sapmasız bir tahminidir. Sözü edilen eşitlik gerçekleşmiyorsa
tahmin yanlı olacaktır. Örneğin E  x    ifadesi örneklem ortalamasının ana kütle ortalamasının
sapmasız bir tahmin olduğunu göstermektedir. Örneklem hacmi n, ana kütle hacmine yaklaşacak biçimde
arttırıldığında örneklem istatistiğiyle ana kütle parametresi arasındaki farkın azalarak sıfıra yaklaştığı
görülür. Bu durumda tahmin tutarlı bir tahmin olarak değerlendirilir. Tutarlılık özelliği “  ” çok küçük
pozitif bir sayı olmak üzere,
lim Pr  T      
1 biçiminde gösterilebilir. Etkinlik tahminlerin örnekleme dağılımının
n N
varyansı ile ilgilidir. Bir ana kütle parametresinin alternatif tahminleri arasında varyansı küçük olanın
etkin olduğu ifade edilmektedir. Örneğin ana kütle aritmetik ortalamasının iki tahmincisi örneklem
ortalaması ve medyanıdır. Bu tahminciler hem sapmasız hem de tutarlılık özelliklerine sahiptir. Örneklem
hacmi n yeterince büyük olduğunda aritmetik ortalamaların örnekleme dağılımının varyansı   2  ,


 n 
2
medyanlarınki ise     dir. “  =3,14” olduğundan örneklem aritmetik ortalaması, varyansı daha
 
 n 
küçük olduğundan örneklem meydanına göre daha etkin bir tahmincidir. Yeterlilik özelliği, tahmin
değerinin hesaplanmasında örneklem verilerinin tamamının kullanılıp kullanılmadığı ile ilgilidir.
Örneklem verilerinin tamamının kullanılması ilgili tahminin yeterli olduğunu göstermektedir. Bilindiği
gibi örneklem ortalamasının hesaplanmasında tüm örneklem verileri, mod ve medyanın hesaplanmasında
ise bazı örneklem verileri kullanılmaktadır. Bu durumda örneklem ortalamasının yeterli bir tahminci
olduğu görülmektedir.
Aralık Tahmini
Nokta tahmin, ana kütle parametresinin tahmininde kullanılan genel bir yaklaşımdır. Ancak kesin
değildir. Dolayısıyla, gerçekleştirilen bir nokta tahmini sonucunda tahminin gerçek parametre değerine ne
kadar yakın olduğu bilinemez. Bundan dolayı güvenilir bir tahmin yapma gerekliliği doğar.
Güvenilirliğin somut olarak ortaya konulması için “güven aralığı” kavramı geliştirilmiştir. Bu nedenle
güvenilir bir tahmin yapılabilmesi için aralık tahmini yaklaşımı geliştirilmiştir.
Ana kütle parametresinin değerinin örneklem istatistiğinden hareketle bir aralık biçiminde tahmin
edilmesi “aralık tahmin” olarak tanımlanır. Aralık tahmininde, ana kütle parametresinin belirli bir olasılık
düzeyinde içerisinde yer alabileceği simetrik bir aralık belirlenir. Belirtilen olasılık düzeyi, tahminin
doğruluğundan ne kadar emin olunacağını belirtir ve aralığı oluşturan güven sınırlarının belirlenmesinde
kullanılır. Aralık tahmininde oluşacak aralığa “güven aralığı”, aralığın alt ve üst sınır değerlerine ise
“güven sınırları” adı verilir. Bilindiği gibi bir ana kütleden çekilen “n” birimlik mümkün örneklemlerin
184
içerisinde bir tanesi tesadüfi olarak çekilir ve elde edilen verilerden hareketle ana kütle hakkında
çıkarsama yapılmaktadır. Herhangi bir ana kütleden çekilen farklı örneklemler için hesaplanan güven
aralıklarının bir kısmı değeri araştırılan ana kütle parametresini kapsamaz. Dolayısıyla ana kütle
parametresinin tahmininde güven aralığı yaklaşımı kullanıldığında, yapılan tahminin doğruluk derecesi,
yani hesaplanan güven aralığının ana kütle parametresini içermesi olasılığı (1-α) belirlenebilmektedir. Bu
olasılık “güven düzeyi” olarak adlandırılır. Burada α tahminin hata payını ifade etmektedir. Böylece
yukarıda belirtildiği gibi, aralık tahminini oluşturan güven sınırları güven düzeyine göre belirlenmektedir.
Örneğin, aralık tahminin %95 olasılıkla (güven düzeyinde) yapılması, belirlenen güven aralığının ana
kütle parametresini içermesi olasılığı 0,95 olacaktır.
Aralık tahmininde güven aralığının genişliğini güven düzeyi belirler: güven düzeyi yükseldikçe güven
aralığı genişler. Buna bağlı olarak doğru tahmin yapma şansı artar, ancak tahminin duyarlılığı azalır.
Bundan dolayı, güven aralığının mümkün olduğunca dar tutulması arzulanır. Bunun için ya güven düzeyi
düşürülür ya da tahminin standart hatası küçültülmeye çalışılır. Örneklem hacminin mümkün olduğu
kadar büyütülmesiyle standart hata küçültülebilir. Uygulamada genellikle alışkanlığa bağlı olarak 0,95 ve
0,99 güven düzeyleri kullanılmaktadır. İzleyen kesimlerde ana kütle aritmetik ortalaması, ana kütle oranı,
ortalamalar arasındaki fark ve oranlar arasındaki fark için güven aralıkları incelenecektir.
“Güven aralığı” kavramını açıklayınız
ANA KÜTLE PARAMETRESİNİN ARALIK TAHMİNİ
Aralık tahmininde ana kütle parametresinin güven sınırlarının belirlenmesinde ilgili örneklem
istatistiğinin örnekleme dağılımının şeklinin bilinmesine gereksinim vardır. İlgili ana kütle
parametrelerine ilişkin güven sınırları güven düzeyi de belirtilerek aşağıdaki genel biçimiyle ifade
edilebilir:
Pr (Alt sınır<
 < Üst sınır) = 1- 
(Eşitlikte “Pr”, “olasılık” için kullanılmıştır)
Alt ve üst sınırlar, örnekleme dağılımına bağlı olarak güven düzeyi ve standart hata değeriyle
belirlenir.
Ana Kütle Ortalaması µ’nün Aralık Tahmini
Ana kütle aritmetik ortalamasının aralık tahmininde örneklem hacminin yeterince büyük olup
olmamasına göre iki farklı dağılımın olasılık kurallarından yararlanılır. İzleyen kesimlerde μ nün aralık
tahmini “büyük örneklemler (n  30)” ve “küçük örneklemler (n<30)” için ayrı ayrı ele alınacaktır.
Büyük Örneklemler İçin µ’nün Aralık Tahmini
Ortalamalar örnekleme dağılımının normal olabilmesi için, ana kütlenin normal dağılması ya da örneklem
hacminin yeterince büyük olması (n  30) gerektiği önceki ünitede belirtilmişti. Bu dağılımın olasılık
kurallarından yararlanarak, ana kütleden tesadüfi olarak çekilecek tek bir örneklem yardımıyla örneklem
aritmetik ortalaması kullanılarak ana kütle aritmetik ortalaması µ için aralık tahmini aşağıdaki güven
sınırlarıyla yapılabilir.
Pr( X  z x    X  z x )  1  
veya
X  z x
Yukarıdaki formülde z değeri, başlangıçta belirlenen güven düzeyine karşılık gelen standart normal
eğri alanları tablosundan bulunacak değerdir. Aralık tahmininde genellikle %95 ve %99 güven
düzeylerinin kullanıldığı daha önce ifade edilmişti. Bu güven düzeyleri için güven sınırları aşağıdaki
gibidir:
185
Ana kütle ortalamasının güven
sınırları
(n  30)
%95 Güven Düzeyinde
X  1,96 x
%99 Güven Düzeyinde
X  2,58 x
Ana kütle aritmetik ortalamasının tahmincisi olan örneklem aritmetik ortalamasının standart hatası
 x , ana kütle standart sapması bilindiğinde,

x 
n
eşitliğinden elde edilir.
Ana kütle aritmetik ortalamasının tahmini ile ilgili açıklamalar Ana kütle standart sapması “σ” nın
bilinmesi durumunda geçerli olmaktadır. Günlük yaşamda bazı ender durumlar dışında karşılaşılan
problemlerin çözümünde genel olarak “σ” bilinmemektedir. Bu durumda Ana kütle standart sapması
yerine onun sapmasız tahmincisi olan örneklem standart sapması “ s ” kullanılır. Bu tahminci aşağıdaki
eşitlikle hesaplanır:
n
s
 (x  X )
2
i
i 1
n 1
Ortalamaların örnekleme dağılımı “merkezi limit teoremi” uyarınca n  30 olduğunda normale
uyduğu daha önce belirtilmişti. Buna göre, Ana kütle aritmetik ortalaması μ’nün aralık tahmini aşağıdaki
eşitlikle bulunur:
Pr( X  zsx    X  zsx )  1  
Ortalamanın standart hatasının tahmini, örneklem standart hatası kullanılarak
sx 
s
n
eşitliğinden yararlanarak gerçekleştirilir.
Örnek 7.1:
Belirli bir bölgede canlı doğum ağırlık ortalamasını tahmin etmek amacıyla tesadüfi olarak 100 doğum
ağırlığı belirlenmiştir. Ortalama doğum ağırlığı 3250 gr, standart sapma ise 450 gr olarak
hesaplanmıştır. Buna göre söz konusu bölgedeki canlı doğum ağırlık ortalamasını %99 güvenle tahmin
ediniz.
İlgili araştırmada,
n =100 doğum
X = 3250 gr ve s = 450 gr olarak belirlenmiştir.
Tahmin %99 güvenle yapılacağından, ana kütle ortalamasının tahmininin güven düzeyi (1-  ) 0,99
olacaktır. Örneklem hacmi yeterince büyüktür (n>30). Buna göre, yukarıda da belirtildiği gibi standart
normal dağılım tablosundan
z /2 = z 0,01 = 2,58 değeri belirlenir. Ana kütle standart sapması
2
bilinmediğinden örneklem standart sapmasından yararlanarak %99 güven sınırları aşağıdaki gibi
belirlenir:
186
sx 
s
= 450 = 45 gr
n
100
Pr( X  zsx    X  zsx )  1    Pr(3250-(2,58)(45)<  <3250+(2,58)(45))=0,99
Pr(3133,9<  <3366,1)=0,99
Söz konusu bölgede ortalama canlı doğum ağırlığı, %99 güvenle 3133,9 gr ile 3366,1 gr arasında
herhangi bir değer alır.
Küçük Örneklemler İçin µ’nün Aralık Tahmini
Örneklem hacminin küçük (n<30) olması durumunda büyük örneklemler için söz konusu olan
açıklamalar geçerli olmaz. Normal dağılan bir ana kütleden çekilmesi mümkün tüm “n” birimlik küçük
örneklemlerin çekildiği ve her biri için,
t
X 
sx
biçimindeki t istatistiği hesaplandığı düşünülsün. Tanım aralığı “-  ve +  ” arasında olan bu
istatistikler önceki ünitede anlatıldığı gibi Student-t Dağılımı adı verilen sürekli bir dağılım oluşturur.
Küçük örneklemler durumunda t dağılımından yararlanarak µ’nün Aralık Tahmininde z değerleri yerine,
ilgili güven düzeyi ve n-1 serbestlik derecesi için “kritik t değerleri tablosu”ndan bulunacak t değerleri
kullanılır. Bu değerler, t
biçiminde gösterilir. Ana kütle aritmetik ortalaması µ için aralık tahmini
2
;( n 1)
aşağıdaki güven sınırlarıyla yapılabilir.


Pr  X  t
sx    X  t
sx   1  
;( n 1)
;( n 1)

2
2

veya
X  t
2
;( n 1)
sx
Örnek 7.2
Örnek 7.1’deki çalışmanın n= 25 birimlik bir örneklemle yapıldığı düşünülsün. Ortalama doğum ağırlığı
3200 gr, standart sapma ise 550 gr olarak hesaplanmıştır. Buna göre söz konusu bölgedeki canlı doğum
ağırlık ortalamasını %95 güvenle tahmin ediniz.
İlgili araştırmada,
n = 25 doğum
x = 3200 gr ve s = 550 gr olarak belirlenmiştir.
Tahmin %95 güvenle yapılacağından, ana kütle ortalamasının tahmininin güven düzeyi (1-  ) 0,95
olacaktır. Örneklem hacmi yeterince küçüktür (n<30). Buna göre, yukarıda da belirtildiği gibi Student-t
dağılım tablosundan (çift yönlü  =0,05) t
= t0.025;(251) = 2,064 değeri belirlenir. Ana kütle
2
;( n 1)
standart sapması bilinmediğinden örneklem standart sapmasından yararlanarak %95 güven sınırları
aşağıdaki gibi belirlenir:
sx 
s 550
=
= 110 gr
n
25


Pr  X  t
sx    X  t
sx   1    Pr(3200-(2,064)(110)<  <3200+(2,064)(110))=0,99
;( n 1)
;( n 1)

2
2

Pr(2972,96<  <3427,04)=0,95
Söz konusu bölgede ortalama canlı doğum ağırlığı, %95 güvenle 2972,96gr ile 3427,04gr arasında
herhangi bir değer alır.
187
ANA KÜTLE PARAMETRELERİ ARASINDAKİ FARKIN ARALIK
TAHMİNİ
N1 ve N2 hacimlik iki farklı ana kütleden tesadüfi olarak ve birbirinden bağımsız olarak çekilen n1 ve n2
birimlik örneklemler için hesaplanan istatistikler T1 ve T2 biçiminde gösterilsin. Ana kütle parametreleri
arasındaki farkın 1   2  aralık tahmininin yapılabilmesi için, T1- T2 istatistiğinin örnekleme
dağılımının bilinmesi gerekir. İlgili dağılımın olasılık kurallarından hareketle seçilen güven düzeyinde,
ana kütle parametreleri arasındaki farkın aralık tahmini aşağıdaki biçimde genel olarak yapılabilir.
Pr (Alt sınır<
1   2
< Üst sınır) = 1-α
Ana kütle Ortalamaları Arasındaki Farkın  1  2  Aralık Tahmini
Ana kütle ortalamaları arasındaki farkın aralık tahmininde de örneklemlerin büyük ya da küçük örneklem
olmaları durumları dikkate alınacaktır. İzleyen kısımlarda büyük örneklemler için ve küçük örneklemler
için
1  2
‘in aralık tahmini aktarılacaktır.
Büyük Örneklemler İçin 1  2 ’nin Aralık Tahmini
Ortalama farklarının örnekleme dağılımının normal olabilmesi için, ana kütlelerinin normal dağılması ya
da örneklemlerin hacminin yeterince büyük olması (n1,n2  30) gerekmektedir. Bu dağılımın olasılık
kurallarından yararlanarak, ilgili ana kütlelerden tesadüfi olarak çekilecek birer örneklem yardımıyla
örneklem aritmetik ortalamaları arasındaki fark
arasındaki fark
 1  2 
X
1
 X 2  kullanılarak, ana kütle aritmetik ortalamaları
için aralık tahmini aşağıdaki güven sınırlarıyla yapılabilir.
Pr[( X1  X 2 )  z x1  x2  1  2  ( X1  X 2 )  z x1  x2 ]  1  
veya
( X1  X 2 )  z x1  x2
Yukarıdaki formülde z değerinin, başlangıçta belirlenen güven düzeyine karşılık gelen standart
normal eğri alanları tablosundan bulunacak değer olduğu önceki kesimde açıklanmıştı. %95 ve %99
düzeyleri için µ1-µ2’nin güven sınırları aşağıdaki gibidir:
Ana kütle ortalamaları arasındaki
farkın güven sınırları
(n1,n2  30)
%95 Güven Düzeyinde
( X1  X 2 )  1,96 x1  x2
%99 Güven Düzeyinde
( X1  X 2 )  2,58 x1  x2
Güven sınırlarındaki ortalama farklarının standart hatası
 x x
1
2
, ana kütle standart sapmaları
bilindiğinde,
 x x 
1
2
 12
n1

 22
n2
eşitlğine göre hesaplanır.
Yukarıda yapılan açıklamalar ana kütle standart sapmaları “σ1 ve σ2” nin bilinmesi durumunda geçerli
olmaktadır. Günlük yaşamda bazı ender durumlar dışında karşılaşılan problemlerin çözümünde genel
olarak “σ1 ve σ2” bilinmemektedir. Bu durumda ana kütle standart sapmaları yerine onun sapmasız
188
tahmincileri olan örneklem standart sapmaları “s1 ve s2” kullanılır. Buna göre, ana kütle aritmetik
ortalamaları arasındaki fark
 1  2 
için aralık tahmini aşağıdaki güven sınırlarıyla yapılabilir:
Pr[( X1  X 2 )  zsx1  x2  1  2  ( X1  X 2 )  zsx1  x2 ]  1  
Ana kütle standart sapmaları bilinmediği durumda ortalamalar arasındaki farkın standart hatasının
tahmini sx1  x2 aşağıdaki gibi belirlenir:
sx1  x2 
s12 s22

n1 n2
Örnek 7.3
A ve B gibi iki ilacın ortalama etki süreleri arasındaki farkı tahmin etmek isteyen bir araştırmacı, A
ilacını uyguladığı 35, B ilacını uyguladığı 50 hasta için elde ettiği etki sürelerinden hareketle aşağıdaki
bulgulara ulaşmıştır. Buna göre iki ilacın ortalama etki süresi arasındaki farkı %95 güvenle tahmin
ediniz.
A İlacı (1)
B İlacı (2)
X 1 =15 dk.
X 2 =11 dk.
s12 =12,25 dk.
s22 =5,29 dk.
n1 =35
n2 =50
Tahmin %95 güvenle yapılacağından, ana kütle ortalamaları arasındaki farkın tahmininin güven
düzeyi (1-  ) 0,95 olacaktır. Örneklem hacimleri yeterince büyüktür (n1 ve n2>30). Buna göre, yukarıda
da belirtildiği gibi standart normal dağılım tablosundan
z = z 0,05 = 1,96 değeri belirlenir. Ana kütle
2
2
standart sapmaları bilinmediğinden örneklem standart sapmalarından yararlanarak %95 güven sınırları
aşağıdaki gibi belirlenir:
sx1  x2 
s12 s22
12, 25 5, 29
= 0, 46 = 0,68



n1 n2
35
50
Pr[( X1  X 2 )  zsx1  x2  1  2  ( X1  X 2 )  zsx1  x2 ]  1   
Pr((15-11)-(1,96)(0,68)<
1  2 <(15-11)-(1,96)(0,68))=0,95
Pr(2,67<  <5,33)=0,95
A ve B gibi iki ilacın ortalama etki sürelerinin arasındaki fark, %95 güvenle 2,67 dk ile 5,33 dk
arasında herhangi bir değer alır.
Küçük Örneklemler İçin 1  2 ’nin Aralık Tahmini
Örneklem hacmlerinin küçük (n1,n2<30) olması durumunda büyük örneklemlerdekine benzer biçimde
ana kütle ortalamaları arasındaki farkın aralık tahmini gerçekleştirilebilir. Bu durumda, t dağılımından
yararlanarak, ilgili güven düzeyi ve
n1  n2  2 serbestlik derecesi için “kritik t değerleri tablosu”ndan
189
bulunacak t değerleri kullanılır. Bu değerler,
ortalamaları arasındaki fark
 1  2 
t
2
;( n1  n2  2)
biçiminde gösterilir. Ana kütle aritmetik
için aralık tahmini aşağıdaki güven sınırlarıyla yapılabilir:


Pr  ( X 1  X 2 )  t
sx1  x2  1  2  ( X 1  X 2 )  t
sx1  x2   1  
;( n1  n2  2)
;( n1  n2  2)

2
2

veya
( X 1  X 2 )  t
2
;( n1  n2  2)
sx1  x2
Yukarıda verilen güven aralığındaki ortalamalar arasındaki farkın standart hatasının tahmini sx1  x2
aşağıdaki gibi belirlenir:
sx1  x2 
(n1  1) s12  (n2  1) s22
n1  n2  2
1 1

n1 n2
Örnek 7.3’te n1=16 n2=12 kabul ederek %99 güven sınırlarını bulunuz
Ana kütle Oranı  ’nin Aralık Tahmini
Sayısal olmayan değişkenler için ölçme düzeyi sınıflayıcı (kategorik) olduğunda söz konusu olan ana
kütle oranı, önceki ünitede “ana kütlenin birimleri içindeki ilgilenilen türden özelliğe sahip olanların
oranı” biçiminde tanımlanmıştı. Ana kütle oranı için güven aralıkları, ana kütle ortalamasının aralık
tahminine paralel olarak gerçekleştirilebilir. Böyle bir tahminin yapılabilmesi için, örneklem hacminin
yeterince büyük (n≥30) olması gerekmektedir. Bu durumda oranların örnekleme dağılımı merkezi limit
teoremi uyarınca normale yaklaşım gösterir. Örneklem oranı p kullanılarak ana kütle oranı  için
aralık tahmini aşağıdaki güven sınırlarıyla yapılabilir.
Pr( P  z.s p    P  z.s p )  1  
p  z.s p
veya
Yukarıdaki formülde z değerleri, %95 ve %99 güven düzeyleri için kullanıldığında güven sınırları
aşağıdaki gibidir:
Ana kütle oranının güven sınırları
(n  30)
%95 Güven Düzeyinde
p  1,96.s p
%99 Güven Düzeyinde
p  2,58.s p
Oranın standart hatasının tahmini s p ,
sp 
p(1  p)
n
eşitliğinden hesaplanır.
Örnek 7.4
Gelişmiş ülkelerde sigara içme oranı hızla düşerken, Türkiye'de sigaraya başlayanların sayısı sürekli
artmaktadır ve bu önemli bir sağlık sorunu olarak kabul edilmektedir. Sağlık Bakanlığı'nın ilk ve orta
dereceli okullarda yaptığı araştırmaya 61 ilden 202 okul ve bu okullarda öğrenim gören 15957 öğrenci
katılmıştır. Bu öğrencilerden 4628 i sigara içtiğini belirtmiştir. Buna göre sigara içenlerin oranını %95
güven düzeyinde tahmin ediniz.
190
Araştırmada, n=15957 öğrenci ve sigara içen sayısı r = 4628 buradan,
p
r 4628
=
= 0,29
n 15957
Tahmin %95 güvenle yapılacağından, ana kütle oranının tahmininin güven düzeyi (1-  ) 0,95
olacaktır. Örneklem hacmi yeterince büyüktür (n>30). Buna göre, yukarıda da belirtildiği gibi standart
normal dağılım tablosundan
z = z 0,05 = 1,96 değeri belirlenir. Burada örneklem oranından yararlanarak
2
2
ana kütle oranı için %95 güven sınırları aşağıdaki gibi belirlenir:
sp 
p(1  p)
0, 29(1  0, 29)
= sp 
=0,004
n
15957
Pr( p  z.s p    p  z.s p )  1    Pr(0,29-(1,96)(0,004)<  <0,29+(1,96)(0,004))=0,95
Pr(0,282<  <0,298)=0,95
Bu sonuca göre sigara içen öğrencilerin ana kütle düzeyindeki oranı %95 güvenle 0,282 ile 0,298
arasında bir değer alır.
Ana Kütle Oranları Arasındaki Farkın 1   2  Aralık Tahmini
Ana kütle oranları arasındaki farkı için güven aralıkları, ana kütle ortalamaları arasındaki farkın aralık
tahminine paralel olarak gerçekleştirilebilir. Böyle bir tahminin yapılabilmesi için, örneklem hacmlerinin
yeterince büyük (n1,n2>30) olması gerekmektedir. Ana kütle oranları arasındaki fark
 1   2 
için
aralık tahmini aşağıdaki güven sınırlarıyla yapılabilir.
Pr ( p1  p2 )  zs p1  p2  1   2  ( p1  p2 )  zs p1  p2   1   veya ( p1  p2 )  zs p1  p2
Oranlar arasındaki farkın standart hatasının tahmini sP1  P2 ,
s p1  p2 
p1 (1  p1 ) p2 (1  p2 )

n1
n2
eşitlğine göre hesaplanır.
Örnek 7.5
Özel bir sağlık kuruluşu, büyük bir ildeki iki hastanesi arasındaki memnuniyet farkını araştırmak
amacıyla bir araştırma yaptırmıştır. A hastanesinden tesadüfi olarak belirlenen 500 hastadan 350’si, B
hastanesinden tesadüfi olarak belirlenen 450 hastadan ise 270’i memnun olduklarını belirtmişlerdir. Bu
duruma göre iki hastane arasındaki memnuniyet oranları arasındaki farkın güven sınırlarını %95
olasılıkla belirleyiniz.
Araştırmada memnuniyet oranları arasındaki farkın güven sınırları istenmektedir. Bu durumda aralık
tahmini söz konusudur.
n1 =500 hasta ve memnun olan sayısı r1=350, n2 =450 ve memnun olan sayısı
r2=270 buradan,
p1 
r1 350
=
= 0,70
n1 500
p2 
r2 270
=
= 0,60
n2 450
191
Tahmin %95 güvenle yapılacağından, ana kütle oranının tahmininin güven düzeyi (1-  ) 0,95
olacaktır. Örneklem hacimleri yeterince büyüktür (n1 ve nn>30). Buna göre, yukarıda da belirtildiği gibi
standart normal dağılım tablosundan
z /2 = z0,05/2 = 1,96 değeri belirlenir. Burada örneklem oranından
yararlanarak ana kütle oranları arasındaki fark için %95 güven sınırları aşağıdaki gibi belirlenir:
s p1  p2 
p1 (1  p1 ) p2 (1  p2 )
0, 70(1  0, 70) 0, 60(1  0, 60)
=0,03



500
450
n1
n2
Pr ( p1  p2 )  zs p1  p2  1   2  ( p1  p2 )  zs p1  p2   1   
Pr((0,70-0,60)-(1,96)(0,03)<
1   2 <(0,70-0,60)-(1,96)(0,03))=0,95
Pr(0,04< 1   2 <0,16)=0,95
Bu sonuca göre iki hastane arasındaki memnuniyet oranları arasındaki farkın güven sınırları %95
olasılıkla 0,04 ile 0,16 olarak belirlenir.
HİPOTEZ TESTLERİ
Hipotez testleri, istatistiğin çeşitli bilim dallarındaki uygulamalı çalışmalarda yoğun bir biçimde
kullanılan önemli bir dalıdır. Hipotez testleri de istatistiksel tahminde olduğu gibi örnekleme konusu ile iç
içe kavramlardır. Örnekleme yapan bir araştırmacının genel olarak ana kütle parametrelerine ilişkin çeşitli
kararları örneklem istatistiklerinden elde edilen bilgilere dayanarak vermesi gerekmektedir. Bağlı olarak
tahmin sürecinde olduğu gibi hipotez testlerinde de ana kütle parametreleri hakkında çıkarsamalarda
bulunulur.
Tasarlanan araştırmanın amacına göre, cevaplanması gereken çok sayıda soru akla gelebilir. Örneğin
bir ilaç firması uygulayacağı bir yeniliğin üretim miktarını artırıp artırmadığını araştırmak isteyebilir.
Hastane yönetimi müşteri memnuniyet oranın önceden bilinen orandan daha yükseğe çıkarılıp
çıkarılmadığını araştırmak isteyebilir. Bir araştırmacı uyguladığı bir tedavi yönteminin ilgili hastalığa
ilişkin ölçümleri değiştirip değiştirmediğini araştırmak isteyebilir. Bu tür soruların cevaplarını İstatistiksel
Hipotez Testleri yardımıyla verebiliriz.
Hipotez, genel olarak belirli bir konuda ileri sürülen iddia (önerme) dır. İstatistiksel Hipotez ise, bir
araştırmada araştırma amacına uygun olarak ilgilenilen bir veya daha fazla ana kütle parametresi
hakkında ileri sürülen, doğruluğu konusunda kuşku duyulan ve bundan dolayı doğruluğu (veya
geçerliliği) olasılık kurallarına göre test edilme gerekliliği olan özel önermelerdir.
Sıfır Hipotezi ve Karşıt Hipotez
Hipotez testlerinde, araştırmacının doğruluğundan kuşku duyduğu hipotez sıfır hipotezi (yokluk hipotezi),
doğru olduğuna inandığı hipotez ise karşıt hipotez (alternatif hipotez) adı verilir. Ana kütle
parametresinin belirli bir değere eşitliği, iki ya da daha fazla ana kütle parametresi arasında fark olmadığı
biçimindeki hipotez; sıfır hipotezidir ve
H 0 ile gösterilir. Buna karşın, ana kütlenin ilgilenilen
parametresinin belirli bir değerden farklılığını, iki ya da daha fazla ana kütle parametresi arasında fark
olduğunu ifade eden hipotez ise karşıt hipotezdir ve H1 ile gösterilir.
Sözü edilen hipotezler,

ana kütle parametresi,
0
ana kütle parametresi için iddia edilen değeri
olmak üzere tek bir ana kütle parametresi için genel biçimde aşağıdaki gibi ifade edilirler:
192
H 0 :   0
   0 


H1 :    0 
   
0

Yukarıda görüldüğü gibi, test için eşitlik biçiminde kurulabilecek bir tane sıfır hipotezi kurulmasına
karşın, alternatif hipotez araştırmanın amacına uygun olarak üç durumdan biriyle ifade edilir. Farklı bir
ifadeyle, sıfır hipotezi ana kütle parametresinin değişmezliğini ifade eder ve bütün karar alma problemleri
için geçerli olan standart bir eşitliğe sahiptir. Buna karşılık olarak, karşıt hipotez verilecek kararın
niteliğine göre çeşitli problemlerde üç farklı durumdan biri ile ifade edilir.
BİRİNCİ VE İKİNCİ TİP HATALAR
Hipotez testlerinde de aralık tahmininde olduğu gibi belirli bir güven düzeyinde karar verilir. Dolayısıyla
varılan kararın bir hata içermesi söz konusudur. Araştırmacı araştırmanın amacına uygun olarak
H 0 ’ı
reddetmeye çalışır. Sıfır hipotezinin gerçekte doğru olup olmadığı bilinememektedir. Hipotez testi
sonucunda ise sıfır hipotezi ya reddedilecek ya da reddedilemeyecektir (Başka bir ifade ile, sıfır
hipotezini reddetmek için yeterli kanıt olmadığına karar verilecektir). O halde hipotez testinde örneklem
istatistiği kanıt olarak kullanıldığında şu dört karar durumuyla karşı karşıya kalınacaktır:
I.
Sıfır hipotezi gerçekte doğrudur, reddedilememiştir.
II.
Sıfır hipotezi gerçekte doğrudur, reddedilmiştir.
III.
Sıfır hipotezi gerçekte yanlıştır, reddedilememiştir.
IV.
Sıfır hipotezi gerçekte yanlıştır, reddedilmiştir.
Bu karar durumlarının ikisinde doğru karar, diğer ikisinde ise yanlış karar söz konusu olur. Bunu
aşağıdaki tabloda açıklamak mümkündür.
Tablo 7.1: Hipotez testinde hata tipleri
Hipotez Testi
Sonucu Karar
H 0 Reddedilir
Sıfır Hipotezinin Gerçek Durumu
H 0 Doğru
H 0 Yanlış
YANLIŞ KARAR
I. TİP HATA
VERİLEN KARAR DOĞRU
(1-∝)
(∝)
H0
Reddedilemez
VERİLEN KARAR DOĞRU
(1- β)
YANLIŞ KARAR
II. TİP HATA
(β)
Tablo 7.1’de görüldüğü gibi dört karar durumundan ikisinde yanlış karar verilmesi söz konusudur,
yani iki tip hata yapılmaktadır. Bu hatalar şu biçimde tanımlanabilir:
I. TİP HATA: Gerçekte doğru olan sıfır hipotezini test sonucunda yanlıştır diye reddetmeye I. Tip
Hata adı verilir. α-Hatası olarak da adlandırılan bu hatayı işleme olasılığı tabloda belirtildiği gibi α
kadardır.
II. TİP HATA: Gerçekte yanlış olan sıfır hipotezini test sonucunda doğrudur diye “reddedilemez”
kararı vermeye II. Tip Hata adı verilir. β-Hatası olarak da adlandırılan bu hatayı işleme olasılığı da β
kadardır. Dolayısıyla tablodaki;
193
α: Birinci tip hatayı işleme olasılığı,
β: İkinci tip hatayı işleme olasılığı,
1-α:
H 0 gerçekte doğru olduğunda onu reddetmeme olasılığıdır ve aralık tahmininde olduğu gibi
“Güven Düzeyi” olarak adlandırılır.
1-β:
H 0 gerçekte yanlış olduğunda onu reddetme olasılığıdır ve “Testin Gücü” olarak adlandırılır.
Hipotez testlerinde, α hatası üzerinde daha çok durulur ve bu hatayı işlemekten kaçınılır. Uygulamada
bu hatayı işleme olasılığı araştırmacı tarafından belirlenebilmektedir.
I. ve II. Tip hatayı ve bunlara ilişkin olasılıkları açıklayınız
Hipotez Testinin Aşamaları
Araştırmanın amacına uygun olarak yürütülecek bir hipotez testinde genel olarak izlenecek aşamalar şu
biçimde sıralanabilir:
1.
Sıfır hipotezi ve alternatif hipotezin ifade edilmesi
2.
Anlamlılık düzeyi
3.
Örnekleme dağılımının belirlenmesi
4.
Red bölgesinin (kritik değerin) belirlenmesi
5.
Uygun test istatistiğinin hesaplanması
6.
İstatistiksel kararın verilmesi

nın seçilmesi
Hipotez testinin belirtilen aşamaları izleyen kesimde “Tek Ana kütle Ortalamasına İlişkin Hipotez
Testleri” başlığı altında ayrıntılı olarak anlatılacaktır.
Ana Kütle Ortalamasına İlişkin Hipotez Testleri
Bu bölümde ana kütle ortalamasına ilişkin uygulamada çoğunlukla kullanılan tek ana kütle ortalamasına
ve iki ana kütle ortalaması arasındaki farka ilişkin olarak gerçekleştirilen testlere değinilecektir. Bu testler
anlatılırken, büyük örneklem-küçük örneklem ve ana kütle varyanslarının bilirip bilinmemesi ayrımları
dikkate alınacaktır. İzleyen kesimde tek ana kütle ortalamasına ilişkin hipotez testi ayrıntılı olarak ele
alınacak, diğer testler mümkün olduğunca kısaltılarak verilecektir.
Tek Ana Kütle Ortalamasına İlişkin Hipotez Testi
Tek bir ana kütle aritmetik ortalamasına ilişkin hipotez testinde, ilgili ana kütle aritmetik ortalamasının
 
belirli bir değere
 0 
eşitliği biçiminde ifade edilen sıfır hipotezinin test edilmesi işlemleri
gerçekleştirilir. Sözü edilen test, hipotez testi aşamaları izlenerek aşağıdaki gibi uygulanır:
1. Sıfır Hipotezi ve Alternatif Hipotezin İfade Edilmesi
Sıfır hipotezi her zaman eşitlik şeklinde ifade edilir. Alternatif hipotez ise bizim araştırmak istediğimiz
hipotezdir. Daha sonra testin tek taraflı mı yoksa çift taraflı mı olacağına, dolayısıyla alternatif hipotezin
yönüne karar verilir. Ana kütle ortalamasının iddia edilen değerden büyük olduğu ya da küçük olduğu
biçimindeki iddialar için test tek taraflı olarak adlandırılır. Yön belirtilmeden ana kütle ortalamasının
iddia edilen değerden farklı olduğu ileri sürülecekse alternatif hipotez eşitsizlik biçiminde kurulur ve
testin çift taraflı olduğu ifade edilir. Tek taraflı testlerde eşitsizliğin yönü belirlenirken dikkat edilmelidir.
Hipotezler aşağıdaki gibi kurulur:
194
H 0 :   0
H 0 :   0
H 0 :   0
H1 :   0
H1 :   0
H1 :   0
Çift Taraflı Test
Tek Taraflı Test
Tek Taraflı Test
Yukarıda da belirtildiği gibi belirli bir araştırmada, araştırmanın amacına uygun olarak bu üç hipotez
çiftinden biri kurulur.
2. Anlamlılık Düzeyi  nın Seçilmesi
Anlamlılık düzeyi, bir hipotez testinde I. Tip hatayı işleme olasılığı idi. Bu hata miktarı çoğunlukla 0,05
ve 0,01 olarak belirlenir. Ancak, araştırmanın önemi dikkate alınarak daha büyük ya da küçük bir değer
de belirlenebilir. Anlamlılık düzeyine bağlı olarak testin güven düzeyi de belirlenmiş olur. Buna göre
  0.05  Güven düzeyi 1     0.95 ve   0.01  Güven düzeyi 1     0.99
olarak belirlenmiş olur.
3. Örnekleme Dağılımının Belirlenmesi
Önceki ünitede anlatıldığı gibi, örneklemeye başvurulduğunda, istatistiksel tahminde olduğu gibi hipotez
testlerinde de, örneklem istatistiğinin örnekleme dağılımından ve onun olasılık kurallarından
yararlanılmaktadır. Dolayısıyla araştırmanın amacına uygun olarak hangi örnekleme dağılımından
yararlanılacağı bu aşamada belirlenir ve örneklem istatistikleri ( x ve s gibi) kullanılarak standart hata
hesaplanır.
4. Red Bölgesinin (Kritik Değerin) Belirlenmesi
Test istatistiğinin hesaplanan değerlerinin bizi sıfır hipotezinin reddi kararına götüreceği değerler kümesi
red bölgesidir. Red bölgesinin sınırında bulunan değere kritik değer adı verilir. Red bölgesinin büyüklüğü
Tip I hata olasılığı olan α’ya bağlıdır. Buna göre anlamlılık düzeyinin belirlenmesiyle red bölgesinin
büyüklüğü de ortaya çıkmış olur. Karşıt hipotez ise, red bölgesinin yerini belirlemede yardımcı olur.
Karşıt hipotez, ana kütle ortalamasının iddia edilen değerinden büyük ya da küçük bir değer olduğu
biçiminde ise, yani tek taraflı bir test gerçekleştirilecekse, red bölgesi birinci durumda dağılımın pozitif
(sağ) ucunda yer alır. İkinci durumda ise dağılımın sol ucunda gösterilir. Eğer karşıt hipotez ana kütle
ortalamasının iddia edilen değerinden farklı olduğu biçiminde ise, red bölgesi dağılımın iki ucunda olmak
üzere iki eşit bölgede yer alır. Tek taraflı, sağ veya sol uçtaki testler için red bölgesinin alanı α’ya; `çift
taraflı testler için ise  ‘ye eşittir. Bu açıklamalar, normal dağılım eğrisinden yararlanılarak aşağıdaki
2
gibi gösterilebilir.
Şekil 7.1: Çift taraflı test için red bölgesi
195
 H1 :   0 
Şekil 7.2: Tek (sol uç) taraflı test için red bölgesi
 H1 :   0 
Şekil 7.3: Tek (sağ uç) taraflı test için red bölgesi
 H1 :   0 
Red bölgesinin sınırında bulunan kritik değer/değerler, anlamlılık düzeyine ve testin tek ya da çift
taraflı oluşuna göre değişik değerler alır. Büyük örneklemler için z tablo değerleri, küçük örneklemler
için de t tablo değerleri kullanılır. Örneğin, tek taraflı bir test kullanıldığında ve 0,05 anlamlılık düzeyi
belirlendiğinde, büyük örneklemler için kritik z değeri 1,64 olarak belirlenir. Bazı kritik z değerleri
aşağıdaki gibi tablolaştırılabilir:
z
Bazı kritik
değerleri
Anlamlılık Düzeyi 
Testin Yönü
Tek Taraflı Test
Çift Taraflı Test
0,05
0,01
z =1,64
z =1,96
z =2,33
z =2,58
5. Uygun Test İstatistiğinin Hesaplanması
İstatistiksel karar, örneklemden elde edilen ortalama ile ana kütle ortalamasının iddia edilen değeri
arasındaki farkın istatistiksel olarak anlamlı olup olmadığı biçiminde verilecektir. Bunun için, sözü edilen
farkın standart hataya göre standartlaştırılarak elde edilen değer olan test istatistiğine gereksinim vardır.
Test istatistiği tek ana kütle ortalamasına ilişkin test için büyük örneklem durumunda, ana kütle varyansı
bilindiğinde:
z
eşitliği yardımıyla hesaplanır. Burada
x
X  0
x
bilindiği gibi aşağıdaki eşitlik yardımıyla hesaplanır.
x 

n
Uygulamada ana kütle varyansının genellikle bilinmediği daha önce belirtilmişti. Bu durumda aralık
tahmininde olduğu gibi ana kütle varyansının tahmincisi olan örneklem varyansından yararlanılır.
Dolayısıyla, test istatistiği aşağıdaki gibi olacaktır.
196
z
Burada
X  0
sx
sx da aşağıdaki gibi hesaplanır:
sx 
s
n
6. İstatistiksel Kararın Verilmesi
Hesaplanan test istatistiğinin daha önce belirlenen red bölgesinin içinde yer alıp almamasına göre birinci
aşamada ileri sürülen sıfır hipotezinin reddedilip reddedilemeyeceği, hipotez testinin son aşaması olan
istatistiksel kararı ifade eder. Sıfır hipotezinin reddedilmesi durumunda ana kütle ortalamasının iddia
edilen değerden farklı olduğuna, hipotezin reddedilememesi durumunda ise sıfır hipotezini reddetmek
için yeterli kanıt bulunamadığına, yani ana kütle aritmetik ortalamasının iddia edilen değerden farklı
olmadığına belirlenen güven düzeyinde karar verilir.
İstatistiksel kararın verilmesinde hesaplanan test istatistiğinin red bölgesine düşüp düşmediğinin
belirlenmesinde pratik bir yol; test istatistiğinin mutlak değerinin kritik değerden büyük olup olmadığının
belirlenmesidir. Bu durumda karar kuralı aşağıdaki gibi tanımlanabilir.
Tek taraflı test için:
zhesap  z  H 0 Reddedilir
zhesap  z  H 0 Reddedilemez
İki taraflı test için:
zhesap  z  H 0 Reddedilir
zhesap  z  H 0 Reddedilemez
2
2
Örnek 7.6
En az 20 kez milli olmuş, 18 yaşın üzerindeki erkek orta mesafe yüzücülerinin oksijen tüketim
kapasitelerinin 68 ml/kg/dk olup olmadığı araştırılmak istenmiştir. Bu amaçla, belirtilen özelliklere sahip
yüzücüler içerisinden 36’sı tesadüfi olarak seçilmiştir. Örnekleme seçilen 36 yüzücünün oksijen tüketim
kapasiteleri ölçülmüş ve ortalama 62, varyans tahmini 29,38 ml/kg/dk olarak belirlenmiştir. %99 güven
düzeyinde sözü edilen yüzücülerin oksijen tüketim kapasitelerinin 68 ml/kg/dk olup olmadığını araştırınız.
Hipotez testleri için verilen ilk örnek olduğundan çözümleme hipotez testi adımları belirtilerek
verilecektir.
  68
X =62
s 2 =29,38  s =5,42
n =36
Araştırmada tek örneklem ile çalışılmıştır ve örneklem hacmi büyüktür. Bundan dolayı büyük
örneklemler için ana kütle ortalamasına ilişkin hipotez testi gerçekleştirilecektir. Ayrıca ana kütle standart
sapmasına ilişkin bir bilgi bulunmamaktadır.
197
1) Sıfır hipotezi ve alternatif hipotezin ifade edilmesi;
H 0 :   0  68
H1 :   0  68 biçiminde olacaktır.
Araştırmada sözü edilen yüzücülerin oksijen tüketim kapasitelerinin 68 ml/kg/dk olup olmadığı
araştırıldığı için çift taraflı test uygulanacaktır.
2) Anlamlılık düzeyinin belirlenmesi;
Karar %99 güvenle verileceğinden anlamlılık düzeyi
 =0,01 olarak belirlenir.
3) Örnekleme dağılımı
Ana kütle ortalamasına ilişkin hipotez testi gerçekleştirileceğinden, ortalamaların örnekleme dağılımı
kullanılacaktır. Ayrıca büyük örneklemlerden yararlanıldığından standart normal dağılım olan z
dağılımından ve olasılık kurallarından yararlanılacaktır.
4) Red Bölgesi;
 anlamlılık düzeyi ve H1 ’in yönü dikkate alınıyordu. Çift taraflı
bölgesi dağılımın her iki ucunda  kadar olmak üzere toplam 
Red bölgesinin belirlenmesinde
bir test uygulanacağından red
kadardır. Buna göre kritik
2
z değerleri tablosundan z = z0,025 =1,96 belirlenir.
2
5) Test İstatistiğinin hesaplanması;
sx 
z
s
5, 42 0,9 olmak üzere,


n
36
X  0 62  68
= -6,67 ,

sx
0,9
zhesap  6,67
Olarak hesaplanır.
6) İstatistiksel kararın verilmesi;
zhesap =6,67> z =1,96  H 0 Reddedilir. Dolayısıyla, %99 güven düzeyinde sözü edilen
2
yüzücülerin oksijen tüketim kapasitelerinin 68 ml/kg/dk olmadığı söylenebilir.
Hipotez testlerinde red bölgesi neye göre belirlenir?
Küçük Örneklemler Durumu
Küçük örneklem durumunda (n<30), yukarıda izlenen aşamalar benzer biçimde gerçekleştirilir.
Kullanılacak test istatistiği, örnekleme dağılımı (n-1) serbestlik dereceli Student-t dağılımına uygun
olarak,
t
X  0
sx
biçiminde olacaktır.
Hesaplanan test istatistiği tek taraflı test için
t ;n 1 , iki taraflı test için t
2
; n 1
kritik değeri ile yukarıdaki
gibi karşılaştırılarak karar verilir. Yukarıda verilen pratik yol t-testi için de geçerlidir.
198
Ana Kütle Ortalamaları Arasındaki Farka  1  2  İlişkin hipotez Testi
Uygulamada genellikle birbirinden bağımsız iki grubun, iki türün, iki işletmenin, iki ilacın v.b. incelenen
sayısal değişken bakımından karşılaştırıldığı problemler ve bunların çözümlenmesi ile sıklıkla karşılaşılır.
Bu tür problemlerde iki ana kütle ortalaması arasındaki farkın karşılaştırılması genellikle uygulanan
hipotez testidir. Hipotezler aşağıdaki gibi kurulur.
H 0 : 1  2
H 0 : 1  2
H 0 : 1  2
H1 : 1  2
H1 : 1  2
H1 : 1  2
Çift Taraflı Test
Tek Taraflı Test
Tek Taraflı Test
İki ana kütle ortalaması arasındaki farkın test edilmesinde ilişkin test için büyük örneklemler
durumunda, ana kütle varyansları bilindiğinde kullanılacak test istatistiği aşağıdaki gibidir:
z
X1  X 2
 12
n1

 22
n2
2
2
Ana kütle varyansları bilinmediğinde ise test istatistiği, bunların tahmincileri olan s1 ve s2
yardımıyla hesaplanır.
z
X1  X 2
s12 s22

n1 n2
Küçük Örneklemler Durumu
İki ana kütle ortalaması arasındaki farkın aralık tahmininde olduğu gibi hipotez testinde de örneklemler
yeterince büyük değilse (n1,n2<30), Student t dağılımından yararlanılır. Bu durumda test istatistiği
aşağıdaki gibi olacaktır:
t
X1  X 2
(n1  1) s  (n2  1) s22
n1  n2  2
2
1
1 1

n1 n2
Testin diğer aşamaları benzer biçimdedir. Burada istatistiksel kararın verilmesi aşamasında, hesaplanan
test istatistiğinin karşılaştırılacağı kritik değer tek taraflı test için t ;n1  n2 2 , iki taraflı test için
t
2
;( n1  n2  2)
olacaktır.
Örnek 7.7
Bir araştırmacı akü fabrikasında çalışan işçiler ile tekstil fabrikasında çalışan işçiler arasında kandaki
kurşun konsantrasyonu bakımından farklılık olup olmadığını araştırmak istemiştir. Bu amaçla akü
fabrikasından 17, tekstil fabrikasından 10 işçiyi tesadüfi olarak seçmiş ve kandaki kurşun konsantrasyonu
değerlerini( mg/100gr)*100 olarak kaydetmiştir. Verilerden hareketle her işçi grubu için aşağıdaki
bulguları elde etmiştir. Buna göre iki işçi grubu arasında sözü edilen değerler bakımından farklılık olup
olmadığını %95 güven düzeyinde belirleyiniz.
199
Akü Fabrikası (1)
Tekstil Fabrikası(2)
X 1 =8,157
X 2 =3,943
s12 =0,45
s22 =0,13
n1 =17
n2 =10
Araştırmada iki örneklem ile çalışılmıştır ve örneklem hacimleri küçüktür. Bundan dolayı küçük
örneklemler için ana kütle ortalamaları arasındaki farka ilişkin hipotez testi gerçekleştirilecektir. Ayrıca
ana kütle standart sapmalarına ilişkin bir bilgi bulunmamaktadır.
1) Hipotezler;
H 0 : 1  2
H1 : 1  2 biçiminde olacaktır. Buna göre çift taraflı test uygulanacaktır.
2) Anlamlılık Düzeyi;
Karar %95 güvenle verileceğinden anlamlılık düzeyi
 =0,05 olarak belirlenir.
3) Örnekleme dağılımı
Ana kütle ortalamaları arasındaki farka ilişkin hipotez testi gerçekleştirileceğinden, ortalama
farklarının örnekleme dağılımı kullanılacaktır. Ayrıca küçük örneklemlerden yararlanıldığından
n1  n2  2 serbestlik dereceli Student-t dağılımından ve olasılık kurallarından yararlanılacaktır.
4) Red Bölgesi;
 anlamlılık düzeyi ve H1 ’in yönü dikkate alınıyordu. Buna göre
red bölgesi dağılımın her iki ucunda  / 2 kadar olmak üzere toplam  kadardır. Küçük örneklemler
ile çalışıldığından Student-t dağılımından yararlanılacaktır. Buna göre kritik değer t
=
Red bölgesinin belirlenmesinde
2
;( n1  n2  2)
t0,025;17 102 =2,06
5) Test İstatistiği;
t

X1  X 2
(n1  1) s12  (n2  1) s22
n1  n2  2
1 1

n1 n2

8,157  3,943
(17  1)(0, 45)  (10  1)(0,13) 1 1

17  10  2
17 10
4, 214
 18,32
0, 23
6) İstatistiksel karar;
thesap =18,32> t0,025;17 102 =2,06  H 0 Reddedilir. Dolayısıyla, akü fabrikasında çalışan işçiler ile
tekstil fabrikasında çalışan işçiler arasında kandaki kurşun konsantrasyonu bakımından istatistiksel
olarak anlamlı bir farklılık olduğu söylenebilir.
200
Tek Ana Kütle Oranına İlişkin Hipotez Testi
Tek bir ana kütle oranına ilişkin hipotez testinde, ilgili ana kütle oranının
 
belirli bir değere
 0 
eşitliği biçiminde ifade edilen sıfır hipotezinin test edilmesi işlemleri gerçekleştirilir. Sözü edilen test için
hipotezler aşağıdaki gibi kurulur:
H0 :    0
H0 :    0
H0 :    0
H1 :    0
H1 :    0
H1 :    0
Çift Taraflı Test
Tek Taraflı Test
Tek Taraflı Test
Burada da anlamlılık düzeyinin belirlenmesi, örneklem hacminin belirlenmesi ve red bölgesinin
belirlenmesi aşamaları “ana kütle ortalamasına ilişkin test” başlığındaki gibidir. Büyük örneklem durumu
için test istatistiği aşağıdaki gibi hesaplanır:
z
P 0
P
Oranın standart hatası ise, ana kütle oranı için iddia edilen değeri kullanılarak aşağıdaki gibi
hesaplanır:
P 
 0 (1   0 )
n
Örnek 7.8
Belirli bir bölgede faaliyet gösteren devlet hastanelerinde görevli hemşirelerin işi bırakma niyeti oranı
0,15’ten büyük olduğu iddia edilmektedir. Bu iddianın doğruluğunu araştırmak amacıyla yapılan bir
araştırmada tesadüfi olarak seçilen 350 hemşireye bir anket uygulanmıştır. “işten ayrılmayı düşünüyor
musunuz?” sorusuna “evet” diyen hemşirelerin sayısı 73 olarak belirlenmiştir. İddianın doğruluğunu
0,01 anlamlılık düzeyinde araştırınız.
n =350 hemşire ve r = 73 olarak belirlenmiştir. Buradan, p  r  73  0,21 olarak hesaplanır.
n
350
Araştırmada tek örneklem ile çalışılmıştır ve örneklem hacmi büyüktür. Bundan dolayı büyük
örneklemler için ana kütle oranına ilişkin hipotez testi gerçekleştirilecektir
1) Sıfır hipotezi ve alternatif hipotezin ifade edilmesi;
H 0 :    0  H 0 :   0,15
H1 :    0
 H1 :   0,15
biçiminde olacaktır. Araştırmada sözü edilen hemşirelerin işi
bırakma niyeti oranının 0,15’ten büyük olduğu iddia edildiğinden tek taraflı test uygulanacaktır.
2) Anlamlılık düzeyinin belirlenmesi;
Anlamlılık düzeyi
 =0,01 olarak verilmiştir.
3) Örnekleme dağılımı
Ana kütle oranına ilişkin hipotez testi gerçekleştirileceğinden, oranların örnekleme dağılımı
kullanılacaktır. Ayrıca büyük örneklemlerden yararlanıldığından standart normal dağılım olan z
dağılımından ve olasılık kurallarından yararlanılacaktır.
201
4) Red Bölgesi;
Red bölgesinin belirlenmesinde
bir test uygulanacağından ve
dağılımın sağ ucunda
tablosundan

 anlamlılık düzeyi ve H1 ’in yönü dikkate alınıyordu. Tek taraflı
H1 :    0
 H1 :   0,15
kadar olmak üzere toplam

biçiminde olduğundan red bölgesi
kadardır. Buna göre kritik
z değerleri
z = z0,01 =2,33 belirlenir.
5) Test İstatistiğinin hesaplanması;
P 
 0 (1   0 )
n
z

P 0
P
0.15(1  0,15)
 0,019 olmak üzere,
350
 0, 21  0,15 = 3,16
0, 019
olarak hesaplanır.
6) İstatistiksel kararın verilmesi;
zhesap =3,16> z =2,33  H 0 Reddedilir. Dolayısıyla, %99 güven düzeyinde belirtilen bölgede
faaliyet gösteren devlet hastanelerinde görevli hemşirelerin işi bırakma niyeti oranı 0,15’ten büyük
olduğuna karar verilir.
Ana Kütle Oranları Arasındaki Farka 1   2  İlişkin Hipotez Testi
Ana kütle oranları arasındaki farka ilişkin hipotez testlerinde aralık tahmininde belirtildiği gibi, ana
kütlelerden tesadüfi olarak çekilen birbirinden bağımsız n1 ve n2 hacimli örneklemler yeterince büyük
olduğunda oran farklarının örnekleme dağılımı normal dağılıma uymaktadır. Buna göre hipotezler ve test
istatistiği aşağıdaki gibi olacaktır.
H 0 : 1   2
H 0 : 1   2
H 0 : 1   2
H1 : 1   2
H1 : 1   2
H1 : 1   2
Çift Taraflı Test
Tek Taraflı Test
Tek Taraflı Test
z
p1  p2
p1 (1  p1 ) p2 (1  p2 )

n1
n2
Tek-Yönlü Varyans Analizi
Önceki kesimlerde, tek ana kütle ve iki ana kütle aritmetik ortalamalası arasındaki farka ilişkin hipotez
testlerine değinilmişti. Uygulamada ikiden çok ana kütle ortalamasının karşılaştırılması problemleriyle
yoğun bir biçimde karşılaşılmaktadır. Başka bir ifadeyle, ikiden çok grubun incelenen değişken
bakımından karşılaştırılması söz konusu olabilir. Özellikle deneysel araştırmalarda grup değişkeni olarak
tanımlanan bağımsız değişkenin incelenen bağımlı değişken üzerindeki etkisi, grup ortalamaları
arasındaki farklılığın belirlenmesiyle ortaya konabilir. Bu amaçla kullanılan çözümleme yaklaşımı
Varyans Analizi olarak adlandırılmaktadır. Çözümleme bağımlı değişkendeki toplam değişimi unsurlarına
ayrıştırmayı amaçlamaktadır. Böylece bağımsız değişkenin bağımlı değişken üzerindeki salt etkileri
ortaya çıkarılabilmektedir. Araştırmanın amacına uygun olarak çeşitli varyans analizi yaklaşımları söz
konusudur. Burada, tek bir bağımsız değişkenin varlığı durumundaki Tek-Yönlü Varyans Analizi (TekYönlü ANOVA) açıklanacaktır.
202
Tek-Yönlü Varyans Analizi, bağımlı değişken üzerinde sadece bir bağımsız değişkenin etkisinin
araştırıldığı, dolayısıyla bağımsız değişkenin düzeyleri olarak ortaya çıkan gruplar arasındaki farkların
istatistiksel olarak anlamlılığının araştırıldığı bir yaklaşımdır. Çözümlemede F-Testinden yararlanılır. Bu
amaçla test istatistiği olarak F istatistiği kullanılır. F istatistiği, aynı varyansın bağımsız iki tahmincisinin
birbirine oranıdır. Bu oran, pyın serbestlik derecesi
 1 =(k-1) ve paydanın serbestlik derecesi  2 =(N-k)
serbestlik dereceleriyle dağılan F örnekleme dağılımının bir terimidir.
Tek-Yönlü Varyans Analizinde, her hangi bir gözlem değerinin bileşenlerini gösteren doğrusal
toplamsal model aşağıdaki gibidir:
yij     j   ij
i=1,2,...,k
j=1,2,...,n j
Burada;
yij : Ana kütlenin herhangi bir terimi (j’inci gruptaki i’nci birimin aldığı değer)
 : Genel ortalama
 j : Grup etkisi
 ij : Deneysel hatadır.
Tek-Yönlü Varyans Analizinde, “kareler toplamı” ve “kareler ortalaması” kavramları özel önem
taşımaktadır. Söz konusu kareler toplamı verideki toplam değişkenliği açıklar. Özellikle deneysel
araştırmalarda belirlenen gözlemlerin genel ortalamadan olan sapmalarının kareleri toplamını, bu
sapmalara neden olan öğelere göre kısımlara ayırmak ve çözümlemek, varyans analizinin temelini
oluşturmaktadır. Buna göre toplam değişim aşağıdaki gibi iki öğeye ayrılır:
Toplam Değişim = Gruplararası Değişim  Gruplariçi Değişim( Hata)
Toplam değişim ve unsurlarını hesaplamada kullanılan formülleri oluşturmada kullanılmak üzere
aşağıdaki üç temel nicelik tanımlanabilir.
ni
k
Yi 2
i 1 ni
k
A   yij2
T 
i 1 j 1
Burada; yij gözlem değerlerini,
toplamını ve
C
Y2
N
Yi i’nci gruptaki gözlem değerleri toplamını, Y tüm gözlemlerin
ni ise i’nci gruptaki gözlem değeri (terim) sayısını ifade etmektedir. Buna göre kareler
toplamları;
Gruplararası kareler toplamı
:
T  C (k-1 serbestlik dereceli)
Gruplariçi (Hata) kareler toplamı: A  T (N-k serbestlik dereceli)
Genel kareler toplamı
: A  C (N-1 serbestlik dereceli)
biçiminde yazılabilir. Burada toplam değişimin ifadesi olan genel kareler toplamının diğer iki kareler
toplamının toplamı olduğuna dikkat edilmelidir.
Kareler toplamlarının serbestlik derecesine oranlanmasıyla kareler ortalamalarına ulaşılır.
2
2
Gruplararası kareler ortalaması sB ve gruplariçi kareler ortalaması sW aşağıdaki gibi yazılabilir:
sB2 
T C
k 1
sW2 
A T
N k
203
Buradan Tek-Yönlü Varyans Analizi için hipotezler aşağıdaki gibi yazılabilir.
H 0 :  i  0 ya da H 0 : 1  2 ...  k
H1 : En az bir  i  0 ya da H1 : 1 , 2 ..., k ' ların en az biri farklıdır
Çözümlemede kullanılacak test istatistiği yukarıda açıklanan iki varyans tahmincisinin birbirine oranı
biçiminde şu biçimde yazılabilir.
F
sB2
sW2
Varyans analizinde yukarıda açıklanan çeşitli hesaplamalar genel olarak aşağıdaki tabloda topluca
gösterilebilir.
Tablo 7.2: Tek-Yönlü varyans analizi tablosu
Değişim Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Gruplar Arası
 1 =k-1
T C
Gruplar İçi (Hata)
 2 =N-k
A T
Genel
N-1
AC
Kareler
Ortalaması
sB2 
T C
k 1
sW2 
A T
N k
F Değeri
sB2
F 2
sW
Hesaplanan F istatistiğinin anlamlılığının belirlenmesinde F-Dağılımının  anlamlılık düzeyi, (k-1)
ve (N-k) serbestlik dereceli kritik değerinden yararlanılır. Red bölgesi dağılımın sağ ucunda yer
alır. Buna göre,
Fhesap  F ; k 1, N k   H 0 Reddedilir.
Şekil 7.4: F dağılımı için red bölgesi
Varyans analizi bütünleşik bir çözümlemedir. Yani,
H 0 reddedildiğinde gruplar arasındaki farkın
anlamlı olduğunu belirtir, buna karşın hangi gruplar arasında farklılığın bulunduğu konusunda bilgi
içermez. Bunun için farklı grupların belirlenmesi amacıyla çeşitli yaklaşımlar geliştirilmiştir. Burada bu
konuya değinilmeyecektir.
Çömlekçi, N. (2003). Deney Tasarımı İlke ve Teknikleri, Alfa Yayınları
204
Örnek 7. 9
Bir araştırmacı, üç farklı hastalık grubunun (Kronik hepatit (1), Siroz (2) ve Malignite (3) ) hastaların
albüminleri (gr/dl) bakımından farklı olup olmadığını araştırmak istemiştir. Her bir grup hastalardan
tesadüfi olarak 15 hasta için sözü edilen ölçümleri almıştır. Veriler aşağıdaki tabloda sunulmuştur.
Hastalık grupları arasında albümin ölçümleri bakımından farklılık olup olmadığını 0,05 anlamlılık
düzeyinde belirleyiniz.
Tablo 7.3: Hastalık gruplarına ilişkin Örnek 7.9 verileri
Hastalık Grupları
Toplam Yi
Kronik Hepatit
Siroz
Malignite
5,0
3,0
0,8
5,1
4,3
1,3
4,5
3,4
2,2
4,7
1,8
2,7
5,3
2,2
1,9
4,7
2,7
1,4
4,5
2,5
2,5
3,6
3,1
1,0
2,8
2,8
1,5
3,8
2,2
0,7
Y1=44
Y2=28
Y3=16
Y=88
1) Hipotezler;
H 0 :  i  0 ya da H 0 : 1  2  3
H1 : En az bir  i  0 ya da H1 : 1 , 2 , 3 ' lerin en az biri farklıdır
2) Anlamlılık düzeyi;
Anlamlılık düzeyi soruda 0,05 olarak verilmiştir. Dolayısıyla %95 güven düzeyinde karar verilecektir.
3) Örnekleme dağılımı;
İkiden çok grup ortalamasının karşılaştırılması söz konusu olduğundan gruplararası değişimin
gruplariçi değişime oranlanmasından yararlanılacaktır. Bu nedenle F-testi uygulanacak, bağlı olarak F
dağılımından yararlanılacaktır.
4) Red bölgesi;
F dağılımı 0 ile ∞ arasında tanımlı bir dağılımdır. Dolayısıyla red bölgesi dağılımın sağ ucunda yer
alacaktır. Karar kuralı aşağıdaki biçimde ifade edilmişti:
Fhesap  F ; k 1, N k   H 0 Reddedilir. Bu durumda örneğimiz için F tablo değeri;
F0.05;31,303 =3,35 olarak belirlenir.
5) Test istatistiği;
Test istatistiği için önce toplam değişimin unsurlarının elde edilmesi gerekir. Önce yukarıda
tanımlanan temel nicelikler aşağıdaki gibi hesaplanır.
205
A temel niceliği tüm gözlem değerlerinin kareleri toplamından oluşur,
k
ni
2
2
2
2
2
2
2
2
A   yij2 =[(5,0) +(5,1) +…+(3,0) +(4,3) +…+(0,8) +(1,3) +…+(1,5) +(0,7) ]=312
i 1 j 1
T temel niceliği grup toplamlarına dayandırılmıştır,
Yi 2
i 1 ni
k
T 
2
2
2


=   44    28   16   =297,6
10
10 
 10

C niceliği ise terimler toplamına dayandırılmıştır,
Y 2 882
C

 258,13 olarak hesaplanır. Burada A>T>C sıralaması daima gerçekleşir.
N
30
Hesaplamalar varyans analizi tablosunda özetlenir:
Tablo 7.4: Örnek 7.9 verileri için varyans analizi tablosu
Değişim
Kaynağı
Serbestlik
Derecesi
Kareler Toplamı
Gruplar Arası
 1 =k-1
T  C =297,6-258,13
(Hastalık
Grupları)
3-1=2
= 39,47
Kareler
Ortalaması
F Değeri
T C
k 1
39, 47
2
sB 
 19, 74
2
sB2 
F
F
Gruplar İçi
 2 =N-k
A  T =312-297,6
(Hata)
30-3 =27
= 14,4
Genel
N-1
A  C =312-258,13
30-1 =29
= 53,87
AT
N k
14, 4
sW2 
 0,53
27
sB2
sW2
19, 74
 37, 25
0,53
sW2 
6) İstatistiksel karar;
Fhesap  37, 25  F ; k 1, N k   3,35  H 0 Reddedilir. Buna göre Üç hastalık grubundaki
hastaların albumin ölçümleri arasındaki farkın istatistiksel olarak anlamlı olduğuna karar verilir.
Ki-Kare (  2 ) Testi
Önceki kesimlerde anlatılan hipotez testleri, sayısal değişkenlere ilişkin testler idi. Uygulamada sayısal
olmayan, başka bir ifadeyle sınıflayıcı ve sıralayıcı ölçekle ölçülmüş veri setleri ile sıkça
karşılaşılmaktadır. Bu durumda sık başvurulan hipotez testi yaklaşımı
 2 Testidir.
Bu test, uygunluk,
bağımsızlık ve homojenlik testi olmak üzere üç biçimde uygulanmaktadır. Ki-Kare Uygunluk Testi, n
birimlik bir örneklemin belirli bir teorik dağılıma uyan bir ana kütleden gelip gelmediğinin
belirlenmesinde kullanılır. Ki-Kare Bağımsızlık Testi, sınıflayıcı ya da sıralayıcı ölçekle ölçülmüş iki
veya daha fazla düzeye sahip iki sayısal olmayan değişken arasında ilişki olup olmadığının
belirlenmesinde kullanılır. Ki- Kare Homojenlik testi ise, birbirinden bağımsız olarak seçilen iki veya
daha fazla örneklemin aynı ana kütleden gelip gelmediği konusunda karar verilmeye çalışılır. Burada
önceki testlere paralel olarak Homojenlik testi açıklanacaktır.
Ki-Kare Homojenlik testinde biri örneklemlerin ait olduğu değişken (grup değişkeni), diğeri incelenen
değişken olmak üzere, birinin düzeyleri satırlarda diğerinin düzeyleri de sütunlarda olacak biçimde çapraz
206
tablo (kontenjans tablosu) olarak adlandırılan tablo oluşturulur. Bu çapraz tabloda oluşan hücrelerde ilgili
birim sayısına (hücre frekansı) yer verilir.
Ki-Kare homojenlik testi aşağıda verilen örnekle açıklanacaktır.
Örnek 7.10
200 yetişkinden oluşan bir örneklem için sigara içme durumunun cinsiyete göre değişiklik gösterip
göstermediğinin araştırıldığı bir çalışmada aşağıdaki gibi bir çapraz tablo oluşturulabilir:
Tablo 7.5: 2x2 lik çapraz tablo
Sigara İçme Durumu
Cinsiyet
İçiyor
TOPLAM
İçmiyor
Erkek
55
34
25
46
80
Bayan
30
51
90
69
120
TOPLAM
85
115
200
Oluşturulan çapraz tabloda, gözlenen frekanslara karşılık beklenen (teorik) frekanslar hesaplanır ve
gözlenen frekanslar ile beklenen frekanslar arasındaki farklara dayanan bir test istatistiği hesaplanır.
Beklenen frekanslar şu şekilde hesaplanır: Örneğin erkek*içiyor hücresi için 55 gözlenen frekansa
karşılık beklenen frekans, ilgili hücrenin satır toplamı ile sütun toplamı çarpılır ve toplam birim sayısı
olan 200 değerine bölünür. Bu işlem yapıldığında beklenen frekans,
(80)(85)/200 = 34 olarak hesaplanır. Diğer hücrelerin beklenen frekansları da benzer biçimde
hesaplanır. Beklenen frekanslar da tabloda hücrelerin sağında italik olarak yazılmıştır.
Test için hipotezler şu biçimde kurulur:
H 0 = Erkek ve bayanlar sigara içme durumu bakımından homojendir.
H1 = Erkek ve bayanlar sigara içme durumu bakımından heterojendir.
 = 0,05 alalım. Serbestlik derecesi, R satır sayısı, C sütun sayısı olmak üzere (R-1)(C-1)= (2-1)(21)= 1 olarak belirlenir.
Test istatistiği aşağıdaki eşitlik yardımıyla hesaplanır:
R
C
 2  
(Gij  Bij )2
Bij
i 1 j 1
Formülde Gij : Gözlenen frekanslar, Bij : Beklenen frekanslardır. Buna göre örneğimiz için test
istatistiği,
2 
(55  34)2 (25  46)2 (30  51) 2 (90  69) 2
= 37,6 olarak bulunur.



34
46
51
69
Hesaplanan test istatistiği Ki-Kare tablo değeri,
karar verilir. Örneğimiz için
olduğundan
(2 ;( R 1)(C 1)) tablo kritik değeri ile karşılaştırılarak
2
2
=37,6>   0,05;1 = 3,84
20,05;1 = 3,84 olarak belirlenir. Bu durumda,  hesap
H 0 reddedilir. Sonuç olarak erkek ve bayanların sigara içme durumu bakımından heterojen
olduklarına (birbirine benzemediklerine) %95 güvenle karar verilir.
207
Özet
İstatistiksel tahmin ve hipotez testleri istatistiğin
çıkarsama işlevi ile ilgilidir. İstatistiksel tahmin,
ana kütle parametrelerinin değerinin örneklem
istatistikleri
yardımıyla
araştırılması
çalışmalarıdır. İstatistiksel tahmin, nokta tahmini
ve aralık tahmini olmak üzere iki grupta
incelenmektedir.
t-testi ve z-testi tek ve iki ana kütle aritmetik
ortalamasına ilişkin testlerdir. İkiden çok ana
kütle ortalamasına ilişkin test ise varyans analizi
olarak adlandırılmaktadır. Ki-Kare testi iki ya da
daha fazla grubun sınıflayıcı veya sıralayıcı
ölçme düzeyinde ölçülmüş değişken bakımından
farklılığını araştıran bir testtir.
İstatistiksel hipotez, ana kütle parametreleri
hakkında belirli bir amaca yönelik olarak ileri
sürülen iddialardır. Hipotez testi, ana kütle
parametreleri hakkındaki iddiaların doğruluğunun
örneklem istatistikleri ve onların örnekleme
dağılımının olasılık kurallarından yararlanarak
test edilmesi işlemlerini gerçekleştirir. Hipotez
testlerinde iki tür hata söz konusudur. Gerçekte
doğru olan sıfır hipotezinin test sonucunda
reddedilmesi I. Tip hata olarak adlandırılır. Bu
hatayı işleme olasılığı anlamlılık düzeyidir. II.
Tip hata gerçekte yanlış olan sıfır hipotezini
reddetmemektir. Hipotez testinde şu aşamalar
izlenir:
Bir araştırma probleminin çözümlenmesinde
kullanılacak tekniğin seçiminde değişkenlerin
hangi ölçekle ölçülebileceğinin belirlenmesinin
önemli olduğu ilk ünitede belirtilmişti. Sınıflayıcı
ve sıralayıcı ölçekle ölçülebilen değişkenlerden
elde edilen verilerle parametrik olmayan
tekniklerden, aralıklı ve oranlı ölçekteki verilerle
hem parametrik olmayan hem de parametrik
tekniklerden yararlanılabilir.
1. Hipotezlerin ifade edilmesi
2. Anlamlılık düzeyi

nın seçilmesi
3. Örnekleme dağılımının belirlenmesi
4. Red bölgesinin belirlenmesi
5. Test istatistiğinin Hesaplanması
6. İstatistiksel kararın verilmesi
Hipotez testleri parametrik ve parametrik
olmayan testler biçiminde iki temel gruba ayrılır.
Parametrik testler, bazı varsayımları gerektiren
testlerdir ve incelenen değişkenin en az aralıklı
ölçme düzeyinde ölçülmüş olmasını gerektirirler.
Parametrik olmayan testler, iddialı varsayım ileri
sürmezler ve genellikle sınıflayıcı ve sıralayıcı
ölçme düzeyindeki verilere uygulanırlar. Bu
ünitede açıklanan t-testi, z-testi ve varyans analizi
parametrik testlerdir. Ki-Kare testi ise parametrik
olmayan testlerdendir.
208
Kendimizi Sınayalım
5. Anlamlılık düzeyi hangi hatayı işleme
olasılığıdır?
1. Gerçekte doğru olan sıfır hipotezinin test
sonucu reddedilmesi durumunda hangi hata
işlenmiş olur?
a. Sistematik hata
b. Tesadüfi hata
c.
 hatası
d.
 hatası
e.
a.
 hatası
b.
 hatası
c. Standart hata
d. Tesadüfi hata
e. Sistematik hata
Standart hata
2-4. sorular aşağıdaki
cevaplandırılacaktır.
probleme
6-8. sorular aşağıdaki
cevaplandırılacaktır.
göre
probleme
göre
Zamanında doğum yapan, sigara içen kadınların
çocuklarına ilişkin baş çevresi ortalamasının
içmeyenlerin çocuklarına göre küçük olup
olmadığı araştırılmak istenmiştir. Her iki gruptan
tesadüfi olarak seçilen 10’ar kadının çocuklarının
baş çevresi ölçümleri sonuçları aşağıdaki gibidir:
Bir hastanede hasta memnuniyet oranı tahmin
edilmek istenmektedir. Bu amaçla tesadüfi olarak
500 hasta ile görüşülmüştür. 300 hasta memnun
olduğunu belirtmiştir.
2. Hastanenin memnuniyet oranının %95 güven
sınırlarından üst sınır değeri kaçtır?
Sigara içen (1)
a. 0,75
X 1 =34
X 2 =37
b. 0,95
s12 =2,25
s22 =4,0
n1 =10
n2 =10
c. 0,56
d. 0,64
Sigara içmeyen (2)
e. 0,05
6. Bu test için karşıt hipotez aşağıdakilerden
hangisidir?
3. Oranın standart hatasının tahmin değeri
aşağıdakilerden hangisidir?
a.
1  2
b.
1  2
c.
1  2
d.
1  2
e.
1  2
a. 0,05
b. 0,04
c. 0,02
d. 0,06
e. 0,5
4. Hastanenin
tahmini kaçtır?
memnuniyet
oranının
nokta
7. Bu test için hesaplanacak test istatistiğinin
değeri aşağıdakilerden hangisidir?
a. 0,75
a. 3,80
b. 0,70
b. -3,80
c. 0,90
c. -4,80
d. 0,60
d. 4,80
e. 0,80
e. -2,80
209
8. 0,05 anlamlılık düzeyindeki test sonucunda
aşağıdaki kararlardan hangisi doğrudur?
Kendimizi Sınayalım Yanıt
Anahtarı
a. Sigara içen kadınların çocuklarına ilişkin baş
çevresi ortalaması içmeyenlerin çocuklarına
göre daha küçüktür
1. c Yanıtınız yanlış ise “Hipotez Testleri”
başlıklı konuyu yeniden gözden geçiriniz.
2. d Yanıtınız yanlış ise “Ana kütle Oranına
İlişkin Aralık Tahmini ” başlıklı konuyu yeniden
gözden geçiriniz.
b. Sigara içen kadınların çocuklarına ilişkin baş
çevresi ortalaması içmeyenlerin çocuklarına
göre daha büyüktür
3. c Yanıtınız yanlış ise “Ana kütle Oranına
İlişkin Aralık Tahmini” başlıklı konuyu yeniden
gözden geçiriniz.
c. Sigara içen kadınların çocukları ile
içmeyenlerin çocuklarının baş çevresi
ortalaması aynıdır
4. d Yanıtınız yanlış ise “Nokta Tahmin” başlıklı
konuyu yeniden gözden geçiriniz.
d. Sigara içen kadınların çocukları ile
içmeyenlerin çocuklarının baş çevresi
ortalaması farklıdır
5. a Yanıtınız yanlış ise “Hipotez Testleri”
başlıklı konuyu yeniden gözden geçiriniz.
e. Sigara içen kadınların çocukları ile
içmeyenlerin çocuklarının baş çevresi
ortalaması benzerdir
6. d Yanıtınız yanlış ise “İki ana kütle ortalaması
arasındaki farkın hipotez testi” başlıklı konuyu
yeniden gözden geçiriniz.
9. Hipotez testlerinde işlenebilecek II.Tip Hata
aşağıdakilerden hangisidir?
7. b Yanıtınız yanlış ise “İki ana kütle ortalaması
arasındaki farkın hipotez testi” başlıklı konuyu
yeniden gözden geçiriniz.
a. Gerçekte doğru
reddedilmesi
olan
b. Gerçekte doğru
reddedilememesi
olan
c. Gerçekte doğru
reddedilmesi
olan
sıfır
hipotezinin
sıfır
hipotezinin
8. a Yanıtınız yanlış ise “İki ana kütle ortalaması
arasındaki farkın hipotez testi” başlıklı konuyu
yeniden gözden geçiriniz.
karşıt
hipotezinin
9. e Yanıtınız yanlış ise “Hipotez Testleri”
başlıklı konuyu yeniden gözden geçiriniz.
10. c
Yanıtınız yanlış ise “Varyans analizi”
başlıklı konuyu yeniden gözden geçiriniz.
d. Gerçekte yanlış
reddedilmesi
olan
sıfır
hipotezinin
e. Gerçekte yanlış
reddedilememesi
olan
sıfır
hipotezinin
10. İkiden çok ana kütle ortalamasına ilişkin test
aşağıdakilerden hangisidir?
Sıra Sizde Yanıt Anahtarı
Sıra Sizde 1
a. t-testi
Aralık tahmininde, ana kütle parametresinin
belirli bir olasılık düzeyinde içerisinde yer
alabileceği bir aralık belirlenir. Belirtilen olasılık
düzeyi, tahminin doğruluğundan ne kadar emin
olunacağını belirtir ve aralığı oluşturan güven
sınırlarının belirlenmesinde kullanılır. Aralık
tahmininde oluşacak aralığa “güven aralığı”,
aralığın alt ve üst sınır değerlerine ise “güven
sınırları” adı verilir.
b. z-testi
c. F-testi
d. Ki-Kare testi
e. Oran testi
210
α: Birinci tip hatayı işleme olasılığı,
Sıra Sizde 2
A İlacı (1)
β: İkinci tip hatayı işleme olasılığı,
B İlacı (2)
X 1 =15 dk.
X 2 =11dk.
s12 =12,25 dk.
s22 =5,29 dk.
n1 =16
n2 =12
1-α:
reddetmeme olasılığıdır ve aralık tahmininde
olduğu gibi “Güven Düzeyi” olarak adlandırılır.
1-β:
Sıra Sizde 4
Red bölgesinin büyüklüğü Tip I hata olasılığı
olan α’ya bağlıdır. Buna göre anlamlılık
düzeyinin belirlenmesiyle red bölgesinin
büyüklüğü de ortaya çıkmış olur. Karşıt hipotez
ise, red bölgesinin yerini belirlemede yardımcı
olur. Karşıt hipotez, ana kütle ortalamasının iddia
edilen değerinden büyük ya da küçük bir değer
olduğu biçiminde ise, yani tek taraflı bir test
gerçekleştirilecekse, red bölgesi birinci durumda
dağılımın pozitif (sağ) ucunda yer alır. İkinci
durumda ise dağılımın sağ ucunda gösterilir. Eğer
karşıt hipotez ana kütle ortalamasının iddia edilen
değerinden farklı olduğu biçiminde ise, red
bölgesi dağılımın iki ucunda olmak üzere iki eşit
bölgede yer alır.
n1  n2  2 serbestlik derecesi için “kritik t
değerleri tablosu”ndan bulunacak t değerleri
kullanılır.
Buna
göre,
2
;( n1  n2  2)
 t0.005;(16122) =
2,779
değeri
belirlenir. Ana kütle standart sapmaları
bilinmediğinden
örneklem
standart
sapmalarından yararlanarak %95 güven sınırları
aşağıdaki gibi belirlenir:
sx1  x2 
(n1  1) s12  (n2  1) s22
n1  n2  2
1 1 =

n1 n2
(16  1)12, 25  (12  1)5, 29 1 1 = 1,36

16  12  2
16 12
= 1,16
P[( X1  X 2 )  t
2
s
;( n1  n2  2) x1  x2
 1  2  ( X1  X 2 )  t
Pr((15-11)-(2,779)(1,16) <
2
s
;( n1  n2  2) x1  x2
H 0 gerçekte yanlış olduğunda onu
reddetme olasılığıdır ve “Testin Gücü” olarak
adlandırılır.
Tahmin %99 güvenle yapılacağından, ana kütle
ortalamaları arasındaki farkın tahmininin güven
düzeyi (1-  ) 0,99 olacaktır. Örneklem hacimleri
küçüktür (n1 ve n2<30). Bu durumda, t
dağılımından yararlanarak, ilgili güven düzeyi ve
t
H 0 gerçekte doğru olduğunda onu
Yararlanılan Kaynaklar
]  1
Alpar, R. (2011). Uygulamalı Çok Değişkenli
İstatistiksel
Yöntemler.
Ankara:
Detay
Yayıncılık.
1  2 <
(15-11)+(2,779)(1,16))=0,99
Çömlekçi, N. (1998). Temel İstatistik İlke ve
Teknikleri. İstanbul: Bilim Teknik Yayınevi.
Pr(0,78< 1  2 <7,22)=0,99
Çömlekçi, N. (2003). Deney Tasarımı İlke ve
Teknikleri.
İstanbul: Alfa Basım Yayın
Dağıtım.
A ve B gibi iki ilacın ortalama etki sürelerinin
arasındaki fark, %99 güvenle 0,78 dk ile 7,22 dk
arasında herhangi bir değer alır.
Gürsakal, N. (2007). Çıkarımsal İstatistik,
Bursa: Dora Basım Yayın Dağıtım.
Sıra Sizde 3
Lwanga, S.K. and Tye, C.Y. (1986) Teaching
Health Statistics. Geneva: World Health
Organization.
I. TİP HATA: Gerçekte doğru olan sıfır hipotezini
test sonucunda yanlıştır diye reddetmeye I. Tip
Hata adı verilir. α-Hatası olarak da adlandırılan
bu hatayı işleme olasılığı α kadardır.
Serper, Ö (2004). Uygulamalı İstatistik 2.
Bursa: Ezgi Kitabevi.
II. TİP HATA: Gerçekte yanlış olan sıfır
hipotezini test sonucunda doğrudur diye
“reddedilemez” kararı vermeye II. Tip Hata adı
verilir. β-Hatası olarak da adlandırılan bu hatayı
işleme olasılığı da β kadardır. Dolayısıyla;
211
8
Amaçlarımız
Bu üniteyi tamamladıktan sonra;
Korelasyon ve regresyon kavramlarını açıklayabilecek,
İki değişken arasındaki korelasyonu hesaplayabilecek,
Regresyon denkleminin nasıl kurulacağını ifade edebilecek
bilgi ve becerilere sahip olabilirsiniz.
Anahtar Kavramlar
Korelasyon
Sıra korelasyon
Regresyon
Belirlilik katsayısı
Bağımlı değişken
Bağımsız değişken
İçindekiler

Giriş

Korelasyon kuramı

Pozitif ve negatif korelasyon

Ana kütle ve örneklemden korelasyon katsayısı

Sıra korelasyon katsayısı

Basit doğrusal regresyon analizi

Belirlilik katsayısı

Eğim katsayısının anlamlılık testi

Excel uygulamaları
212
Korelasyon ve Regresyon
Analizi
GİRİŞ
Bölüm 7’de sözel değişkenler arasındaki ilişkinin Ki-Kare analiziyle belirlenebileceği ifade edilmişti.
Eğer değişkenler sayısal ise, bu değişkenler arasındaki ilişkinin belirlenmesi “korelasyon analizi” nin
konusudur. Korelasyon analizi x ve y gibi herhangi iki değişken arasındaki ilişkinin yönünü (aynı veya
ters yönlü) ve derecesini (kuvvetli veya zayıf) verir. Oysa çoğu analizde, değişkenler arasındaki ilişkinin
matematiksel bir fonksiyonla da ifade edilmesi istenir. Yani bağımlı ve bağımsız değişken(ler) arasındaki
ilişkinin sabit terimi ve eğim katsayısı belirlenmek istenir. İşte bunu sağlayan analize de “regresyon
analizi” adı verilir. Bu ünitede de önce korelasyon analizi anlatılacak, daha sonra da korelasyonun yeterli
olmadığı durumlardan bahsedilerek, daha ayrıntılı analizler yapılmasını sağlayan regresyon analizi
açıklanacaktır.
KORELASYON KURAMI
Aralarında ilişki araştırılan değişkenlerden birinde değerler azalırken, diğerinin değerleri de azalıyorsa ya
da değişkenlerden birinin değerleri artarken diğerinin değerleri de artıyorsa (veya zıt yönlü değişmeler
gösteriyorsa), bu değişkenler arasında bir ilişki olduğu söylenebilir. Çünkü bu durumda değişkenlerin
birinin değerlerindeki değişmeler diğerinin değerlerindeki değişmelerden etkileniyor demektir. Buna
karşılık birinin değerleri azalır veya çoğalırken diğerinin değerleri hiç değişmiyorsa, değişkenler arasında
bir ilişkinin varlığından söz edilemez. Örneğin öğrencilerin bir derse ilişkin çalışma süresi arttıkça, başarı
notları da yükselecektir. Buna karşın özel hastanelerin tedavi ücretleri arttıkça, bu hastaneye olan talep
azalacaktır.
Değişkenler arasında var olan ilişkileri ölçmek için çeşitli teknikler kullanılabilir. Bunlardan en
basiti ise “korelasyon analizi” dir. Korelasyon iki ya da daha çok değişken arasındaki ilişkinin derecesi
olarak tanımlanabilir. İki değişken arasındaki ilişkinin derecesine ise ”basit korelasyon” denir. Bir
serpilme çiziminde (diyagramında), bütün (xi,yi) noktaları bir doğruya yakın yerlerde toplanıyorlarsa
korelasyon “doğrusaldır”. Anlaşılacağı gibi eğer değişkenler arasında bir ilişki varsa, bu ilişki pozitif
(aynı yönlü) veya negatif (ters yönlü) olabilir.
Pozitif ve Negatif Korelasyon
İki değişken aynı yönde birlikte değişiyorlarsa, yani değerleri birlikte artıp birlikte azalıyorlarsa,
aralarında pozitif korelasyon var demektir. Örneğin, büyük bir yerleşim yerinde nüfus arttıkça, hastane
sayısı da artar. Dolayısıyla bir yerleşim yerinin nüfusuyla, hastane sayısı arasında aynı yönlü yani pozitif
bir ilişki var demektir. Örneğin, y ve x değişkenleri için veriler Tablo 8.1’deki gibi elde edilmiş olsun.
Tablo 8.1’deki veriler incelendiğinde değişkenlerin her ikisinin de birlikte arttığı görülmektedir. Bu
verilerin bir grafiği çizildiğinde de Şekil 1’deki gibi doğrusal artan bir grafik elde edilecektir.
213
Tablo 8.1: Pozitif Doğrusal Korelasyon İçin Veri Tablosu
yi
xi
5
120
8
123
12
125
15
128
17
132
20
134
22
138
25
140
28
145
30
152
Şekil 8.1: Pozitif Doğrusal Korelasyon Grafiği
İki değişken ters yönlerde değişme eğilimi gösteriyorlarsa, negatif korelasyonlu oldukları ifade edilir.
(xi) arttığında (yi) azalıyorsa ya da tersi söz konusu olduğunda x ve y değişkenleri arasında ters yönlü yani
negatif bir ilişki var demektir. Örneğin özel bir hastanenin hastalara sunduğu hizmet bedeli arttığında
hasta sayısında bir azalma oluyorsa, bu durumda bu değişkenler arasında negatif yönlü bir ilişkiden söz
edilir. Tablo 8.2’deki verilerin grafiği
Şekil 8.2’de verilmiştir. Şekil 8.2’den de görüleceği gibi
değişkenler arsında ters yönlü bir ilişki vardır.
Tablo 8.2: Negatif Doğrusal Korelasyon İçin Veri Tablosu
yi
xi
5
152
8
12
145
140
15
17
138
134
20
22
132
128
25
28
125
123
30
120
214
Şekil 8.2: Negatif Doğrusal Korelasyon Grafiği
Ana Kütle ve Örneklem Korelasyon Katsayısı
İki değişken arasındaki korelasyonun yönünü, doğrudan serpilme çizimine bakarak belirleyebiliriz. Ancak, bir
serpilme çiziminin incelenmesi, x ve y değişkenleri arasındaki ilişki hakkında yaklaşık bir fikir verebilir. x
ve y değişkenleri arasındaki korelasyonun derecesini tam ve sayısal olarak ölçmek için “korelasyon
katsayısı” adıyla anılan ve genellikle Yunanca harf "  " (ro) ile gösterilen bir parametre kullanılır.  , ana
kütle korelasyon katsayısını ifade eder. Bunun belli bir örneklemden kestiricisi (tahmincisi) ise “r” harfiyle
gösterilir.
Korelasyon katsayısı x ve y değişkenlerinin ne derece birlikte değiştiklerinin bir ölçüsüdür ve
alabileceği değerler –1 ve 1 arasında değişir. Korelasyon katsayısı pozitif ise, x ve y birlikte artar ya da
azalırlar. Korelasyon katsayısının negatif olması ise x ve y arasında ters yönlü bir ilişki olduğunu ifade
eder. Korelasyon katsayısının +1 ya da –1 değerlerine yakın olması değişkenler arasında çok kuvvetli bir
ilişki olduğunu, sıfıra yakın olması ise değişkenler arasında hiç bir ilişki olmadığını ifade eder.
Ana kütle korelasyon katsayısı,
N

 (x
  x )( yi   y )
i
i
N
 (x
  x )2
i
i
(y
i
veya
  y )2
i
( xi  xi   X ,
'
x y
'
i

N
yi'  yi  Y ) olmak üzere
'
i
x y
'2
i
'2
i
şeklinde belirlenir.
Ancak çoğu durumda ana kütle verileri elde edilemeyeceğinden, örneklem korelasyon katsayısı
benzer şekilde aşağıdaki gibi hesaplanır:
n
r
 (x
i
i
n
 (x
i
 x)2
i
( xi'  xi  x ,
x y
'
i
 x )( y i  y )
=
n
(y
'
i
i
 y )2
i
x y
'2
i
yi'  yi  y )
215
'2
i
Örnek 8.1:
Özel bir hastanenin yıllık reklam harcamaları ve hastaneye gelen hasta sayıları Tablo 8.1’deki gibi elde
edilmiş olsun. Buna göre bu iki değişken arasındaki örneklem korelasyon katsayısını hesaplayarak
yorumlayınız. (Bu unite içinde aksi belirtilmedikçe, tüm soru ve örnek verileri, örneklem için olacaktır.)
Tablo 8.3 Reklam Harcamaları ve Hasta Sayıları
Hasta Sayısı (Bin Kişi)
(yi)
10
12
13
15
17
19
22
Reklam Harcaması (Milyon TL)
(xi)
1,2
1,5
2,2
2,6
3,2
3,5
3,6
Çözüm 8.1
Korelasyon katsayısının hesaplanabilmesi için öncelikle değişkenlere ait ortalamalara ihtiyaç vardır. Bu
ortalamalar hesaplandığında x  2,56 , y  15, 43 olarak bulunacaktır. Ortalamalardan sapmalar ve
diğer gerekli hesaplamalar da Tablo 8.4’de verilmiştir.
Tablo 8.4: Örneklem Korelasyon Katsayısı İçin Gerekli İşlemler Tablosu
yi
xi
10
12
13
15
17
19
22
Toplam
1,2
1,5
2,2
2,7
3,2
3,5
3,6
yi'  yi  y
xi'  xi  x
yi'2
xi'2
xi' yi'
-5,43
-3,43
-2,43
-0,43
1,57
3,57
6,57
-1,36
-1,06
-0,36
0,14
0,64
0,94
1,04
29,48
11,76
5,90
0,18
2,46
12,74
43,16
105,68
1,85
1,12
0,13
0,02
0,41
0,88
1,08
5,49
7,38
3,64
0,87
-0,06
1
3,36
6,83
23,02
Gerekli toplamlar örneklem korelasyon formülünde yerine yazıldığında korelasyon katsayısı,
r
x y
'
i
'
i

x y
'2
i
r
'2
i
23, 02
23, 02

5, 49. 105, 68 2,34(10, 28)
23, 02
 0,96
24, 06
olarak hesaplanır. Görüldüğü gibi korelasyon katsayısının değeri pozitif ve oldukça yüksek bir değerdir
(1’e çok yakındır). O halde, reklam harcamalarıyla hastaneye gelen hasta sayıları arasında aynı yönlü
(pozitif) ve oldukça kuvvetli bir ilişki vardır.
216
Aşağıdaki
veriler
için
korelasyon
katsayısını
hesaplayarak
yorumlayınız.
yi:
81
85
88
92
95
102
105
110
xi:
28
25
20
18
19
16
12
10
Sıra Korelasyon Katsayısı
Birçok durumda değişkenler sayısal olarak ölçülemez. Örneğin meslek, hastanın sosyal güvence durumu,
çeşitli marka tercihleri v.b değişkenler sözel değişkenlerdir. Diğer taraftan, bazı durumlarda gözlem
değerlerine “sıra numarası“ verilmesi daha uygun olabilir veya gözlem değerleri herhangi bir ölçüte göre
zaten sıralanmış olabilir. Değişkenlerin değerleri yerine sıralarının önem kazandığı böyle durumlarda
doğrusal korelasyon katsayısı yerine, “sıra korelasyon katsayısı“ (Spearman korelasyon katsayısı)
kullanılır.
Sıra korelasyon katsayısının hesaplanmasında gözlemler, büyüklük, önem vb. özelliklerine göre
sıraya dizilir. Bir başka deyişle verilere sıra numarası verilir ve gerçek sayısal değerleri yerine bu sıra
numaraları arasındaki ilişki belirlenmeye çalışılır. Bazen de veriler zaten sıralanmış olarak elde edilir.
Örneğin hastalar A bölgesinde bulunan hastaneleri, çeşitli kriterlere göre 1 nci, 3 ncü, 4 ncü v.b
sıralayabilirler.
Sıra korelasyon katsayısı aşağıdaki formülle hesaplanır:
rs  1 
6 d i2
n(n 2  1)
Formüldeki,
di:sıralamalar arasındaki fark,
n:gözlem sayısı’dır.
Örnek 8.2:
Z hastanesinde yatarak tedavi gören hastalar için bir X ürünü kullanılmaktadır. Ancak bu X ürününün 6
faklı markası bulunmaktadır. Hastane yönetimi bu ürünleri iki hastaya uygulayarak, memnuniyet
derecelerine göre, tercihlerini sıralamalarını istemiştir. İki hasta bu 6 farklı ürün için tercihlerini Tablo
8,5’deki gibi sıralamışlardır. Tercih sıralamaları arasında bir ilişki olup olmadığını belirleyiniz.
Tablo 8.5: İki Hastanın Tercih Sıralamaları
Markalar
A
B
C
D
E
F
1.Hastanın Tercih Sıralaması
5
3
1
6
2
4
2.Hastanın Tercih Sıralaması
6
3
1
5
2
4
Çözüm 8.2:
Sıra korelasyon katsayısının hesaplanabilmesi için öncelikle tercih sıralamaları arasındaki farkın
2
( d i ) belirlenmesi gerekir. Daha sonra da d i değerleri hesaplanarak, bunların toplamı alınacaktır. Bu
işlemleri Tablo 8.6’ da verilmiştir.
217
Tablo 8.6: Sıra Korelasyon İçin Gerekli İşlemler Tablosu
Markalar
A
B
C
D
E
F
Toplam
n=6 ve
d
2.Hastanın
Tercih Sıralaması
4
3
1
5
2
6
di
d i2
-1
0
0
1
0
2
1
0
0
1
0
4
6
 6 olduğuna göre sıra korelasyon katsayısının değeri,
2
i
rs  1 
1.Hastanın Tercih
Sıralaması
5
3
1
6
2
4
6 d i2
n(n  1)
2
 1
6(6)
36
36
 1
 1
 1  0,17
2
6(6  1)
6(35)
210
rs  0,87
olarak hesaplanacaktır. Bu durumda, iki hastanın tercih sıralamaları arasında aynı yölü ve kuvvetli bir
ilişki vardır.
Korelasyon katsayısı, değişkenlerin birlikte değişiminin bir ölçüsü olmakla birlikte, ilgili değişkenler
arasında fonksiyonel bir ilişki kurmaz. Yani hangi değişkenin bağımlı, hangi değişkenin bağımsız
değişken olduğunu göstermez. Sadece değişkenler arasındaki ilişkinin yönünü ve derecesini vermektedir.
Ayrıca korelasyon analizi ilişkinin katsayıları hakkında sayısal değerler vermez. Yani fonksiyonun eğimi
ve sabit terimi için tahminler yapmaz. Bundan dolayı, sayısal iki değişken arasındaki ilişkinin
matematiksel bir fonksiyonla ifade edilmesini sağlayacak olan, regresyon analiziyle çözümleme yapılır.
BASİT DOĞRUSAL REGRESYON ANALİZİ
Korelasyon analizinde bir değişkenin bağımlı veya bağımsız değişken konumunda olması hiç önemli
olmamasına rağmen, regresyon analizinde bağımlı ve bağımsız değişken kavramları çok önemlidir. O
halde bağımlı ve bağımsız değişken kavramlarını kısaca tanımlayalım. Sonuç niteliğindeki değişkene
“bağımlı (açıklanan) değişken”, “neden” niteliğindeki değişkene ise “bağımsız (açıklayan) değişken” adı
verilir. Örneğin, özel bir hastaneye gelen hasta sayısı arttıkça, hastanenin geliri de artacaktır. O halde
hasta sayısı “neden” durumunda olduğu için “bağımsız değişken”, hastane geliri de “sonuç” niteliğinde
olduğu için “bağımlı değişken” konumunda olacaktır.
Bağımlı değişken “y”, bağımsız değişken de “x” olmak üzere, N birimli bir ana kütle için regresyon denklemi
yˆi  b0  b1 xi
i=1, 2, 3,..........., N
şeklinde yazılır. Bu denkleme “y’nin x’e göre regresyon doğrusu” adı verilir. Denklemdeki;
b0 :Sabit terim (y eksenini kestiği nokta),
b1 : Eğim katsayısı’dır. Bu katsayı bağımsız değişkendeki bir birimlik değişimin, bağımlı değişken
üzerindeki artış veya azalış olarak yaptığı etkiyi gösterir.
218
Ancak tüm istatistik çalışmalarında olduğu gibi, genellikle ana kütlenin tamamı gözlemlenemediğinden, n
birimlik örneklem seçilerek analiz yapılır. n birimlik örneklem için regresyon doğrusu denklemi ise “en küçük
kareler tekniği” ne göre aşağıdaki gibi tahmin edilir:
yˆi  bˆ0  bˆ1 xi
i=1, 2, 3, ............., n
Denklemdeki;
ŷi :x’in belli bir değeri için y’nin kestiricisi,
b̂0 :b0’ın kestiricisi,
b̂1 :b1’ın kestiricisi’dir.
Regresyon doğrusu denklemi için önce eğim katsayısı ( b̂1 ) değeri
 xi' yi'
bˆ1 
 xi'2
formülüyle belirlenir. Eğim katsayısı, “regresyon katsayısı” olarak da isimlendirilir. Daha sonra da sabit
terim aşağıdaki gibi hesaplanır:
bˆ0  y  bˆ1 x
Örnek 8.3:
Örnek 8.1’deki veriler için örneklem regresyon denklemini belirleyiniz.
Çözüm 8.3:
Regresyon denkleminin belirlenebilmesi için eğim (regresyon) katsayısı ve sabit terim için formüllerdeki
gerekli toplamlar Tablo 8.4’te verilmişti. O halde bu toplamlar yardımıyla önce eğim katsayısı
hesaplanacaktır.
 xi yi  23, 02  4,19
bˆ1 
 xi'2 5, 49
'
'
Değişkenlere ait ortalamalar da daha önce,
x  2,56 , y  15, 43
olarak elde edilmişti. O halde bu değerler sabit terim formülünde yerine yazıldığında, sabit terimin
kestirim değeri aşağıdaki gibi bulunacaktır:
bˆ0  y  bˆ1 x  15, 43  (4,19).2,56  15, 43  10,73  4,70
Dolayısıyla regresyon denklemi,
yˆi  4,70  4,19.xi
olacaktır. Bu denklemin anlamı şudur: Bağımsız değişken (x) bir birim arttığında (azaldığında bağımlı
değişken 4,19 birim artacaktır (azalacaktır). Başka bir ifadeyle reklam harcamalarındaki 1 milyon TL’lik
bir artış hastaneye gelen hasta sayısını 4,19 birim (4,19*1000=4190 kişi) artıracaktır. Herhangi bir reklam
harcaması yapılmadığında ise (x=0 olduğunda) hastaneye gelen hasta sayısının 4,70 birim
(4,70*1000=4700 kişi) olması beklenir.
219
Sıra sizde 1”deki veriler için örneklem regresyon doğrusu
denklemini belirleyiniz.
Belirlilik Katsayısı (r2)
Regresyon doğrusu belirlendikten sonra bağımsız değişkenin, bağımlı değişkeni hangi oranda
açıkladığının da bilinmesi gerekir. Eğer bağımsız değişkenin, bağımlı değişkeni açıklama oranı yüksek
ise, bağımsız değişken önemli bir değişken demektir ve denklemde yer almalıdır. Bağımsız değişkenin,
bağımlı değişkeni açıklama oranı ise, korelasyon katsayısının karesi olan ve “Belirlilik Katsayısı” olarak
isimlendirilen r2 değeridir. Belirlilik katsayısının sınırları da
0  r 2  1 dir.
Örnek 8.4:
Örnek 8.1’deki veriler için belirlilik katsayısını hesaplayarak yorumlayınız.
Çözüm 8.4:
Örnek 8.1’deki veriler için korelasyon katsayısı 0,96 olarak hesaplanmıştı. Belirlilik katsayısı da
korelasyon katsayısının karesi olduğuna göre,
r 2  0,962  0,92
olarak hesaplanacaktır. O halde bağımsız değişken (reklam harcaması), bağımlı değişkeni (hastaneye
gelen hasta sayısı) % 92 oranında açıklamaktadır. Bu oldukça yüksek bir orandır. Dolayısıyla hastane için
yapılan reklam harcamaları, hastaneye gelen hasta sayılarındaki artış için oldukça etkilidir.
Belirlilik katsayısı, bağımsız değişkenin bağımlı değişken üzerindeki etkisi konusunda bir fikir
vermekle beraber, bağımsız değişkenin anlamlı (önemli) olduğunu kesin olarak belirtmez. Bunun için de
eğim katsayısının anlamlılık testi yapılmalıdır.
Eğim (Regresyon) Katsayısının Anlamlılık Testi
Regresyon denklemindeki tüm katsayıların anlamlılık testleri yapılabilir. Ancak sabit terimin anlamlılığı
çok önemli olmadığından bu ünitede sadece eğim katsayısının anlamlılık testi anlatılacaktır. Eğer eğim
katsayısı anlamlıysa, bağlı olduğu bağımsız değişken anlamlı demektir. Dolayısıyla bu bağımsız
değişken, bağımlı değişkeni açıklamada önemli bir değişkendir.
Eğim katsayısının anlamlılık sınamaları da iki şekilde yapılır. Bunlar z ve t sınamalarıdır. Ancak ana
kütle varyansı genellikle bilinmediğinden ve n<30 olduğundan, t testi uygulanır.
Hipotezler,
H0:b1=0 (katsayı anlamsız)
H1:b1  0 (katsayı anlamlı)
olmak üzere, test istatistiği ise,
th 
bˆ1
ˆ bˆ
1
olarak belirlenecektir. Test istatistiğinin paydasında yer alan değere ise standart hata kestiricisi denir ve
aşağıdaki gibi belirlenir:
ˆ bˆ  se
1
1
 xi'2
220
Artıkların standart sapması olan se değeri de,
se 
 ( y  yˆ )
i
2
i
n2

e
2
i
n2
formülüyle belirlenir. Buna “tahminin standart hatası” da denir. ei = yi
 yˆi olarak hesaplanır ve “artık
terimi” olarak ifade edilir. Formülden de görüldüğü gibi artık terimleri bağımlı değişkenin gözlem
değerlerinden, regresyon denklemi yardımıyla tahmin edilen değerlerin çıkartılmasıyla elde edilirler.
Şunu unutmamak gerekir ki artık değerlerinin toplamı daima sıfırdır. Bunların kareleri toplamına ise
“artık kareler toplamı” denir (  ei2 ) .
Test istatistiğinin değeri de belirli bir anlam düzeyi ve (n-2) serbestlik derecesi ile tablo değeriyle
karşılaştırılır. Eğer sıfır hipotezi reddedilirse eğim katsayısının anlamlı, yani bağımsız değişkenin bağımlı
değişkeni açıklamakta önemli olduğu sonucuna varılır.
Örnek 8.5:
Örnek 8.1’deki veriler için
yˆ i , artık ( ei )değerlerini ve artık kareler toplamını hesaplayınız.
Çözüm 8.5:
Bundan önce de ifade edildiği gibi
yˆ i değerleri regresyon denklemi yardımıyla hesaplanacak
değerlerdir. Daha önce regresyon denklemi
yˆi  4,70  4,19.xi
şeklinde elde edilmişti. Bağımsız değişkenin değerleri denklemde yerine yazılarak, y’nin kestirim
değerleri hesaplanır. O halde 1. kestirim değeri
yˆ1  4, 70  4,19.x1
yˆ1  4, 70  4,19.(1, 2)
yˆ1  4, 70  5, 03
yˆ1  9, 73
olarak hesaplanacaktır. x2’nin değeri olan 1,5 denklemde yerine yazıldığında da
yˆ 2  4, 70  4,19.(1,5)
yˆ 2  4, 70  6, 29
yˆ 2  10,99
değeri bulunur. Daha sonra sırasıyla bağımsız değişkenin değerleri denklemde yerine yazıldığında, Tablo
8.7’deki değerler elde edilecektir.
Artık değerlerinin ise
ei  yi  yˆi formülüyle belirleneceği ifade edilmişti. O halde 1. artık değeri
e1  y1  yˆ1
e1  10  9, 73
e1  0, 27
olacaktır. 2. Artık değeri ise benzer şekilde aşağıdaki gibi hesaplanır:
221
e2  12  10,99
e2  1, 01
Diğer artık değerleri ve bunların kareleri yine Tablo 8.7’de verilmiştir. Artıkların kareleri alınarak
toplandığında da artık kareler toplamı,
e
2
i
 9, 26
olarak bulunur.
Tablo 8.7:
yˆ i ,
artık ( ei ) ve artık karelerinin değerleri.
yi
xi
yˆ i
ei
ei2
10
12
13
15
17
19
22
Toplam
1,2
1,5
2,2
2,7
3,2
3,5
3,6
9,73
10,99
13,92
16,01
18,11
19,37
19,78
0,27
1,01
-0,92
-1,01
-1,11
-0,37
2,22
0,07
1,02
0,85
1,02
1,23
0,14
4,93
9,26
Örnek 8.6
Örnek 8.1’deki veriler için eğim katsayısının anlamlılığını %5 anlam düzeyinde test ediniz.
Çözüm 8.6
Bu bir hipotez testi olduğuna göre önce hipotezler yazılmalıdır. Hipotezler ise konunun başında
belirtildiği gibi,
H0:b1=0 (eğim katsayı anlamsız)
H1:b1  0 (eğim katsayı anlamlı)
şeklinde ifade edilir. Ana kütle varyansı bilinmediği için ve n<30 olduğundan dolayı
th 
bˆ1
ˆ bˆ
1
test istatistiği kullanılacaktır. Eğim katsayısı 4,19 olarak bulunmuştu. O halde paydada yer alan ˆ bˆ
1
değerinin hesaplanması gerekir. Bunun için de öncelikle se değeri belirlenmelidir. Artık kareler toplamı
9,26 olduğuna göre,
se 
e
2
i
n2

9, 26
9, 26

72
5
se  1,85  1,36
değeri elde edilecektir. Dolayısıyla eğim katsayısı için standart hatanın kestirim değeri de
222
ˆ bˆ  se
1
1
1
 1,36
'2
5, 49
 xi
ˆ bˆ  0,58
1
olarak hesaplanır. Buradan da test istatistiğinin değeri aşağıdaki gibi bulunur:
th 
bˆ1 4,19
=
ˆ bˆ 0,58
1
th  7, 22
Hesaplanan test istatistiğinin 7,22 değeri, %5 anlam düzeyi ve n-2=7-2=5 serbestlik dereceli
Student t tablo değeri 2,571’den büyük olduğundan, sıfır hipotezi reddedilecektir. Dolayısıyla eğim
katsayısının anlamlı olduğuna karar verilecektir. Buradan da bağımsız değişken olan reklam
harcamalarının, hastaneye gelen hasta sayısında etkili olduğu sonucuna ulaşılacaktır.
Ayrıca bu denklem x’in çeşitli değerleri için, y’nin alabileceği değerlerin tahmininde de
kullanılabilir demektir. Örneğin reklam harcaması 4 milyon TL olduğunda, hastaneye gelecek hasta sayısı
yˆ  4, 70  4,19.(5)
yˆ  4, 70  20, 95
yˆ  25, 65
(25,65*1000)=21460 kişi olarak tahmin edilir.
“Sıra sizde 1”deki verileri kullanarak, eğim katsayısının anlamlılığı
için test istatistiğinin (t) değerini hesaplayınız.
223
EXCEL UYGULAMALARI
Excel’de regresyon analizinin yapılabilmesi için “veri çözümleme” nin kurulu olması gerekir. Her zaman
olduğu gibi yeni bir çalışma sayfası açılarak önce veriler girilir. Örnek uygulama için Tablo 8.3’deki
verileri girelim. Önce “veri” menüsü, daha sonra da “veri çözümleme” menüsü tıklanır. Karşımıza çıkan
pencereden yapmak istediğimiz analiz olan “korelasyon” tıklanır. Daha sonra korelasyonu hesaplanacak
değişkenler seçilir ve “Tamam” tıklanarak sonuca ulaşılır. Bu işlemler ayrıca aşağıda da gösterilmiştir.
224
Tablo 8.8: Korelasyon İçin Excel Çıktısı
Bu değer yuvarlatıldığında 0,96 olacaktır. Örnek çözümde de 0,96 olarak bulunduğu görülecektir.
225
Şimdi de Tablo 8.3.’deki veriler için regresyon analizi uygulaması yapalım. Regresyon analizi için
de, “veri” ve “veri çözümleme” menüsü tıklanır. Karşımıza çıkan pencereden yapmak istediğimiz analiz
olan “regresyon” tıklanır. Daha sonra bağımlı değişken “Y Giriş Aralığı”na, bağımsız değişken de “X
Veri Aralığı”na girilir. “Tamam” tıklanarak “ÖZET ÇIKIŞI” olarak belirtilen sonuç tablosuna ulaşılır. Bu
işlemler de yine aşağıda ayrıntılı olarak gösterilmiştir
226
Tablo 8.9: Basit Regresyon İçin Excel Çıktısı
227
Tablo 8.9’daki “Özet Çıkışı” olarak ifade edilen sonuçların ne anlama geldiğini kısaca açıklayalım:
Çoklu R : r değeridir. Bu değer örnek çözümde de 0,96 olarak hesaplanmıştı. (Çoklu R, çoklu
korelasyon katsayısı olmasına rağmen, basit korelasyon için de aynı şekilde ifade edilmektedir. Bu
ayırımı analizi yapan kişi yapacaktır).
R Kare: r2 değeridir.
Ayarlı R Kare: Düzeltilmiş çoklu belirlilik katsayısıdır ve çoklu regresyon analizinde kullanılır.
Standart Hata: se değeridir.
“Katsayılar sütunu”, denklemin sabit terimini ve değişkenlere ait tahmin edilen katsayıları verir .
Sabit terim 4,72 ve eğim katsayısı ise 4,19’dur. Örnek çözümde sabit terim 4,70 olarak bulunmuştu.
Meydana gelen bu çok az fark, ortalamalar ve eğim katsayısının yuvarlatılmış değerler alınmasındandır.
Bu değerler tam olarak alınırsa yine 4,72 olarak bulunacaktır.
“Standart hata” sütunu ise katsayılara ilişkin standart hata kestirimlerini verir ( ˆ ˆ  0,58 ). Katsayılar
b
1
sütunu standart hata sütunundaki değerler bölündüğünde ise test istatistiği olan t değerleri elde edilir. “F”
denklemdeki tüm katsayıların aynı anda anlamlılığı için hesaplanan test istatistiğidir. “P değeri” sütunu
ise katsayıların anlamlı olup olmadığını belirtir. 1-P değeri katsayıların % kaç anlamlı olduğunu ifade
eder.
Gerçek uygulamalarda ise, bağımlı değişkeni etkileyen çok sayıda bağımsız değişken alınarak analiz
yapılır. Bağımsız değişken sayısının iki ve daha fazla olduğu regresyon analizine ise “çoklu regresyon”
adı verilir. Bağımsız değişken sayısının üç veya daha fazla olması durumunda ise elle çözüm yapmak
neredeyse imkansız hale gelir. Böyle durumlarda istatistik paket programlarının veya Excel’in
kullanılması zorunludur. Burada da iki bağımsız değişken için bir analiz yapılacaktır. Çoklu regresyon
konusunda ayrıntılı bilgi sahibi olmak isteyen öğrenciler, aşağıda belirtilen kaynaktan yararlanabilirler.
Basit regresyon ve çoklu regresyon hakkında daha ayrıntılı bilgi
sahibi olabilmek için Ümit Şenesen ve Gülay Günlük Şenesen’nin çevirisini yaptığı, A.
Koutsoyiannis’in Verso yayınevi tarafından basılmış olan “Ekonometri Kuramı (1999)
adlı kitabını okuyabilirsiniz.
Tablo 8.10: Çoklu Regresyon Analiz Verileri.
yi
125
139
135
142
178
196
198
200
219
225
x1i
700
715
723
732
740
751
756
762
768
775
x2i
23
24
25
26
26
27
29
29
30
32
Çoklu regresyon analizi için işlemler aynı basit regresyondaki gibidir. Farklı olarak sadece bağımsız
değişkelerin her ikisi (ya da daha fazla) de “X Veri Aralığı”na girilir. “Tamam” tıklanarak “ÖZET
ÇIKIŞI” olarak belirtilen sonuç tablosu elde edilir.
228
Tablo 8.11: Çoklu Regresyon İçin Excel Çıktısı
Çıktı sonuçlarından da görüldüğü gibi, tek bağımsız değişkenli analizden farklı olarak “X değişkeni
2” satırı görülmektedir. Sonuçlara ilişkin açıklamalar basit regresyon içinde verildiğinden, burada tekrar
edilmeyecektir.
229
Özet
Çoğu zaman değişkenler arasındaki ilişkinin
yönü ve derecesi dışında, daha ayrıntılı analizlere
ihtiyaç duyulur. Böyle durumlarda da “regresyon
analizi” ne başvurulur. Regresyon analizinde
amaç, önceden belirlenen bağımlı değişken ve
bağımsız değişken (değişkenler) arasındaki
ilişkiyi, matematiksel bir fonksiyonla yazmaktır.
Değişkenler arasındaki regresyon denklemi
belirlendikten sonra, bu denklemin anlamlı olup
olmadığının belirlenmesi gerekir. Bu ölçütlerden
bir tanesi, bağımsız değişkenin bağımlı değişkeni
açıklama oranı olan “belirlilik katsayısıdır”.
Ancak belirlilik katsayısı denklemin anlamlılığı
konusunda kesin bir ölçüt değildir. Bununla
beraber eğim (regresyon) katsayısının anlamlılık
testi yapılır. Eğer eğim katsayısı anlamlı ise
bağımsız değişkenin, bağımlı değişken üzerinde
etkili olduğu ve denklemde yer alması gerektiği
sonucuna varılır. Denklem anlamlı ise artık bu
denklem tahminler için kullanılabilir demektir.
Sayısal değişkenler arasındaki ilişkinin analizi iki
şekilde yapılabilir. Bunlar korelasyon ve
regresyon analizidir. Korelasyon analizinde
bağımlı ve bağımsız değişken ayırımı olmaksızın,
sadece değişkenler arasındaki ilişkinin yönü ve
derecesi belirlenir. Korelasyon katsayısının
değeri sıfıra yakınsa, değişkenler arasında bir
ilişki yok demektir. 1 değerlerine yakınsa,
değişkenler arasında aynı veya zıt yönlü kuvvetli
bir ilişki olduğu ifade edilir.
Bazen de değişkenler sözel değişken olabilir ya
da değişkenlerin gözlem değerleri yerine,
sıralamaları arasındaki ilişki önemli olabilir.
Böyle durumlarda da “sıra korelasyon katsayısı”
hesaplanır.
230
Kendimizi Sınayalım
1. İki değişken arasındaki korelasyon -0,85
olduğuna göre aşağıdaki ifadelerden hangisi
doğrudur?
edilmiştir. Bu denklem için ˆ ˆ  0, 42 olarak
b
a. İki değişken arasında aynı yönlü kuvvetli bir
ilişki vardır.
hesaplandığına göre test istatistiğinin değeri
aşağıdakilerden hangisidir?
b. İki değişken arasında ters yönlü kuvvetli bir
ilişki vardır.
a. -13,33
4. n=12 için yˆi  3,8  5, 6.xi
1
b. 13,33
c. İki değişken arasında aynı yönlü zayıf bir
ilişki vardır.
c. 9,05
d. 10
d. İki değişken arasında ters yönlü zayıf bir ilişki
vardır.
e. 25
e. İki değişken arasında hiç ilişki yoktur.
2.
5. n= 14 ve
r  0, 76 değerinin yorumu için aşağıdaki
2
c. 0,42
d. 0,29
İki değişken arasında ters yönlü kuvvetli bir
ilişki vardır.
e. 0,65
6 ve 7. soruları aşağıdaki verilere göre
cevaplandırınız:
e. İki değişken arasında aynı yönlü zayıf bir
ilişki vardır.
yˆi  8  4.xi
 325 olduğuna göre sıra
b. 0,51
d. İki değişken arasında ters yönlü zayıf bir
ilişki vardır.
3.
2
i
a. 0,98
değişkeni
b. Bağımlı değişkenin bağımsız değişkenin
açıklama oranı %76’dir.
c.
d
korelasyon değeri aşağıdakilerden hangisidir?
ifadelerden hangisi doğrudur?
a. Bağımsız değişkenin bağımlı
açıklama oranı%76’dir.
denklemi elde
denklemi için x bir birim
arttığında, y’nin değeri ne olur?
a. 8 birim azalır
b. 4 birim azalır
yi
xi
22
24
28
32
35
38
3
5
7
8
11
14
6.
Eğim katsayısının
aşağıdakilerden hangisidir?
c. 4 birim artar
d. 5 birim artar
a. -2,43
e. 8 birim artar
b. 5,87
c. 1,54
d. 17,51
e. 4,67
231
kestirim
değeri
7. Sabit
terimin
kestirim
aşağıdakilerden hangisidir?
değeri
10.
se değeri aşağıdakilerden hangisidir?
a. 2,12
a. -2,43
b. 0,66
b. 5,87
c. 4,6
c. 1,54
d. 1,46
d. 17,51
e. 0,47
e. 4,67
8.-10. soruları
cevaplandırınız:
aşağıdaki
yi
xi
10
13
16
18
20
24
28
34
36
40
46
49
52
55
Yukarıdaki
veriler
için
verilere
göre
yˆi  15  0, 75.xi
denklemi elde edimiştir. Bu denklem için
 ei2  10,62 olarak hesaplandığına göre;
8.
ŷ3 değeri aşağıdakilerden hangisidir?
a. 10,5
b. 12
c. 15
d. 19,5
e. 24
9.
e3 değeri aşağıdakilerden hangisidir?
a. -0,5
b. 1
c. -1,5
d. 1,75
e. 0
232
Kendimizi Sınayalım Yanıt
Anahtarı
Sıra Sizde Yanıt Anahtarı
Sıra Sizde 1
1. b Yanıtınız yanlış ise “korelasyon kuramı”
başlıklı konuyu yeniden gözden geçiriniz.
2. a Yanıtınız yanlış ise “belirlilik katsayısı”
başlıklı konuyu yeniden gözden geçiriniz.
3. c Yanıtınız yanlış ise “basit doğrusal regresyon
analizi” başlıklı konuyu yeniden gözden
geçiriniz.
4. a Yanıtınız yanlış ise “eğim katsayısının
analamlılık testi” başlıklı konuyu yeniden gözden
geçiriniz.
yi
xi
yi'
xi'
81
85
88
92
95
102
105
110
28
25
20
18
19
16
12
10
-13,75
-9,75
-6,75
-2,75
0,25
7,25
10,25
15,25
9,5
6,5
1,5
-0,5
0,5
-2,5
-6,5
-8,5
y  94,75
5. d Yanıtınız yanlış ise “sıra korelasyon
katsayısı” başlıklı konuyu yeniden gözden
geçiriniz.
x
x y
'
i
7. d Yanıtınız yanlış ise “basit doğrusal regresyon
analizi” başlıklı konuyu yeniden gözden
geçiriniz.
r
y
 256
'2
i
6. c Yanıtınız yanlış ise “basit doğrusal regresyon
analizi” başlıklı konuyu yeniden gözden
geçiriniz.
x  18,5
'
i
'2
i
 417, 02
x y
'
i
'
i

x y
'2
i
8. c Yanıtınız yanlış ise “eğim katsayısının
analamlılık testi” başlıklı konuyu yeniden gözden
geçiriniz.
r
9. b Yanıtınız yanlış ise “eğim katsayısının
analamlılık testi” başlıklı konuyu yeniden gözden
geçiriniz.
 727, 48
'2
i
417, 02
417, 02

256. 727, 48 16.(26,97)
417, 02
 0,97
431,52
x ve y değişkenleri arasında arasında ters yönlü
ve oldukça kuvvetli bir ilişki vardır.
Sıra Sizde 2
10. d
Yanıtınız yanlış ise “eğim katsayısının
analamlılık testi” başlıklı konuyu yeniden gözden
geçiriniz.
 xi yi  417, 02  1, 63
bˆ1 
256
 xi'2
'
'
bˆ0  y  bˆ1 x  94, 75  (1, 63).18,5
bˆ0  94, 75  30,16  124,91
yˆi  124, 91  1,63.xi
233
Yararlanılan Kaynaklar
Sıra Sizde 3
yˆ i
ei
79,27
84,16
92,31
95,57
93,94
98,83
105,35
108,61
Toplam
se 
1,73
0,84
-4,31
-3,57
1,06
3,17
-0,35
1,39
e
2
i
n2

Koutsoyiannis, A. (1999). Ekonometri Kuramı,
Verso Yayıncılık, Ankara.
ei2
2,99
0,71
18,58
12,74
1,12
10,05
0,12
1,93
48,24
Montgomery, D.C. and Peck, E.A. (1991).
Introduction to Linear Regression Analysis,
John Wiley & Sons, New York.
Serper, Ö. (2004). Uygulamalı İstatistik 2, Ezgi
Kitabevi, Bursa.
48, 24
48, 24

82
6
se  8, 04  2,84
ˆ bˆ  se
1
1
1
 2,84
'2
256
 xi
ˆ bˆ  0,18
1
th 
bˆ1 1, 63
=
ˆ bˆ 0,18
1
th  9, 06
234
TIBBİ İSTATİSTİK SORULARININ CEVAPLANMASINDA GEREKLİ OLABİLECEK
TABLOLAR
Tablo 1. Normal Eğri Alanları
z
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
0,00
0,0000
0,0398
0,0793
0,1179
0,1554
0,1915
0,2257
0,2580
0,2881
0,3159
0,3413
0,3643
0,3849
0,4032
0,4192
0,4332
0,4452
0,4554
0,4641
0,4713
0,4772
0,4821
0,4861
0,4893
0,4918
0,4938
0,4953
0,4965
0,4974
0,4981
0,4987
0,01
0,0040
0,0438
0,0832
0,1217
0,1591
0,1950
0,2291
0,2611
0,2910
0,3186
0,3438
0,3665
0,3869
0,4049
0,4207
0,4345
0,4463
0,4564
0,4649
0,4719
0,4778
0,4826
0,4864
0,4896
0,4920
0,4940
0,4955
0,4966
0,4975
0,4982
0,4987
0,02
0,0080
0,0478
0,0871
0,1255
0,1628
0,1985
0,2324
0,2642
0,2939
0,3212
0,3461
0,3686
0,3888
0,4066
0,4222
0,4357
0,4474
0,4573
0,4656
0,4726
0,4783
0,4830
0,4868
0,4898
0,4922
0,4941
0,4956
0,4967
0,4976
0,4982
0,4987
0,03
0,0120
0,0517
0,0910
0,1293
0,1664
0,2019
0,2357
0,2673
0,2967
0,3238
0,3485
0,3708
0,3907
0,4082
0,4236
0,4370
0,4484
0,4582
0,4664
0,4732
0,4788
0,4834
0,4871
0,4901
0,4925
0,4943
0,4957
0,4968
0,4977
0,4983
0,4988
0,04
0,0160
0,0557
0,0948
0,1331
0,1700
0,2054
0,2389
0,2704
0,2995
0,3264
0,3508
0,3729
0,3925
0,4099
0,4251
0,4382
0,4495
0,4591
0,4671
0,4738
0,4793
0,4838
0,4875
0,4904
0,4927
0,4945
0,4959
0,4969
0,4977
0,4984
0,4988
235
0,05
0,0199
0,0596
0,0987
0,1368
0,1736
0,2088
0,2422
0,2734
0,3023
0,3289
0,3531
0,3749
0,3944
0,4115
0,4265
0,4394
0,4505
0,4599
0,4678
0,4744
0,4798
0,4842
0,4878
0,4906
0,4929
0,4946
0,4960
0,4970
0,4978
0,4984
0,4989
0,06
0,0239
0,0636
0,1026
0,1406
0,1772
0,2123
0,2454
0,2764
0,3051
0,3315
0,3554
0,3770
0,3962
0,4131
0,4279
0,4406
0,4515
0,4608
0,4686
0,4750
0,4803
0,4846
0,4881
0,4909
0,4931
0,4948
0,4961
0,4971
0,4979
0,4985
0,4989
0,07
0,0279
0,0675
0,1064
0,1443
0,1808
0,2157
0,2486
0,2794
0,3078
0,3340
0,3577
0,3790
0,3980
0,4147
0,4292
0,4418
0,4525
0,4616
0,4693
0,4756
0,4808
0,4850
0,4884
0,4911
0,4932
0,4949
0,4962
0,4972
0,4979
0,4985
0,4989
0,08
0,0319
0,0714
0,1103
0,1480
0,1844
0,2190
0,2517
0,2823
0,3106
0,3365
0,3599
0,3810
0,3997
0,4162
0,4306
0,4429
0,4535
0,4625
0,4699
0,4761
0,4812
0,4854
0,4887
0,4913
0,4934
0,4951
0,4963
0,4973
0,4980
0,4986
0,4990
0,09
0,0359
0,0753
0,1141
0,1517
0,1879
0,2224
0,2549
0,2852
0,3133
0,3389
0,3621
0,3830
0,4015
0,4177
0,4319
0,4441
0,4545
0,4633
0,4706
0,4767
0,4817
0,4857
0,4890
0,4916
0,4936
0,4952
0,4964
0,4974
0,4981
0,4986
0,4990
Tablo 2. Kritik t Değerleri Tablosu
α (Anlam düzeyi)
Tek Yönlü
Test
Çift Yönlü
Test
V
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

0,45
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,025
0,01
0,005
0,90
0,80
0,70
0,60
0,50
0,40
0,30
0,20
0,10
0,05
0,02
0,01
0,158
0,142
0,137
0,134
0,132
0,131
0,130
0,130
0,129
0,129
0,129
0,128
0,128
0,128
0,128
0,128
0,128
0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,1257
0,325
0,289
0,277
0,271
0,267
0,265
0,263
0,262
0,261
0,260
0,260
0,259
0,259
0,258
0,258
0,258
0,257
0,257
0,257
0,257
0,257
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,2533
0,510
0,445
0,424
0,414
0,408
0,404
0,402
0,399
0,398
0,397
0,396
0,395
0,394
0,393
0,393
0,392
0,392
0,392
0,391
0,391
0,391
0,390
0,390
0,390
0,390
0,390
0,389
0,389
0,389
0,389
0,3853
0,727
0,617
0,584
0,569
0,559
0,553
0,549
0,546
0,543
0,542
0,540
0,539
0,538
0,537
0,536
0,535
0,534
0,534
0,533
0,533
0,532
0,532
0,532
0,531
0,531
0,531
0,531
0,530
0,530
0,530
0,5244
1,000
0,816
0,765
0,741
0,727
0,718
0,711
0,706
0,703
0,700
0,697
0,695
0,694
0,692
0,691
0,690
0,689
0,688
0,688
0,687
0,686
0,686
0,685
0,685
0,684
0,684
0,684
0,683
0,683
0,683
0,6745
1,376
1,061
0,978
0,941
0,920
0,906
0,896
0,889
0,883
0,879
0,876
0,873
0,870
0,868
0,866
0,865
0,863
0,862
0,861
0,860
0,859
0,858
0,858
0,857
0,856
0,856
0,855
0,855
0,854
0,854
0,8416
1,963
1,386
1,250
1,190
1,156
1,134
1,119
1,108
1,100
1,093
1,088
1,083
1,079
1,076
1,074
1,071
1,069
1,067
1,066
1,064
1,063
1,061
1,060
1,059
1,058
1,058
1,057
1,056
1,055
1,055
1,0364
3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,310
1,2816
6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,812
1,796
1,782
1,771
1,761
1,753
1,746
1,740
1,734
1,729
1,725
1,721
1,717
1,714
1,711
1,708
1,706
1,703
1,701
1,699
1,697
1,6449
12,706
4,303
3,182
2,776
2,571
2,447
2,365
2,306
2,262
2,228
2,201
2,179
2,160
2,145
2,131
2,120
2,110
2,101
2,093
2,086
2,080
2,074
2,069
2,064
2,060
2,056
2,052
2,048
2,045
2,042
1,9600
31,821
6,965
4,541
3,747
3,365
3,143
2,998
2,896
2,821
2,764
2,718
2,681
2,650
2,624
2,602
2,583
2,567
2,552
2,539
2,528
2,518
2,508
2,500
2,492
2,485
2,479
2,473
2,467
2,462
2,457
2,3264
63,657
9,925
5,841
4,604
4,032
3,707
3,499
3,355
3,250
3,169
3,106
3,055
3,012
2,977
2,947
2,921
2,898
2,878
2,861
2,845
2,831
2,819
2,807
2,797
2,787
2,779
2,771
2,763
2,756
2,750
2,5759
V; Serbestlik Derecesi
236
Tablo 3. Ki-kare Tablosu
α
0,995
0,990
0,975
0,950
0,050
0,025
0,010
0,005
0,001
0,0002
0,0201
0,1148
0,2971
0,5543
0,8721
1,2390
1,6465
2,0879
2,5582
3,0535
3,5706
4,1069
4,6604
5,2293
5,8122
6,4078
7,0149
7,6327
8,2604
8,8972
9,5425
10,1957
10,8564
11,5240
12,1981
12,8785
13,5647
14,2565
14,9535
22,1643
29,7067
70,0649
0,0010
0,0506
0,2158
0,4844
0,8312
1,2373
1,6899
2,1797
2,7004
3,2470
3,8157
4,4038
5,0088
5,6287
6,2621
6,9077
7,5642
8,2307
8,9065
9,5908
10,2829
10,9823
11,6886
12,4012
13,1197
13,8439
14,5734
15,3079
16,0471
16,7908
24,4330
32,3574
74,2219
0,0039
0,1026
0,3518
0,7107
1,1455
1,6354
2,1673
2,7326
3,3251
3,9403
4,5748
5,2260
5,8919
6,5706
7,2609
7,9616
8,6718
9,3905
10,1170
10,8508
11,5913
12,3380
13,0905
13,8484
14,6114
15,3792
16,1514
16,9279
17,7084
18,4927
26,5093
34,7643
77,9295
3,8415
5,9915
7,8147
9,4877
11,0705
12,5916
14,0671
15,5073
16,9190
18,3070
19,6751
21,0261
22,3620
23,6848
24,9958
26,2962
27,5871
28,8693
30,1435
31,4104
32,6706
33,9244
35,1725
36,4150
37,6525
38,8851
40,1133
41,3371
42,5570
43,7730
55,7585
67,5048
124,3421
5,0239
7,3778
9,3484
11,1433
12,8325
14,4494
16,0128
17,5345
19,0228
20,4832
21,9200
23,3367
24,7356
26,1189
27,4884
28,8454
30,1910
31,5264
32,8523
34,1696
35,4789
36,7807
38,0756
39,3641
40,6465
41,9232
43,1945
44,4608
45,7223
46,9792
59,3417
71,4202
129,5612
6,6349
9,2103
11,3449
13,2767
15,0863
16,8119
18,4753
20,0902
21,6660
23,2093
24,7250
26,2170
27,6882
29,1412
30,5779
31,9999
33,4087
34,8053
36,1909
37,5662
38,9322
40,2894
41,6384
42,9798
44,3141
45,6417
46,9629
48,2782
49,5879
50,8922
63,6907
76,1539
135,8067
7,8794
10,5966
12,8382
14,8603
16,7496
18,5476
20,2777
21,9550
23,5894
25,1882
26,7568
28,2995
29,8195
31,3193
32,8013
34,2672
35,7185
37,1565
38,5823
39,9968
41,4011
42,7957
44,1813
45,5585
46,9279
48,2899
49,6449
50,9934
52,3356
53,6720
66,7660
79,4900
140,1695
10,8276
13,8155
16,2662
18,4668
20,5150
22,4577
24,3219
26,1245
27,8772
29,5883
31,2641
32,9095
34,5282
36,1233
37,6973
39,2524
40,7902
42,3124
43,8202
45,3147
46,7970
48,2679
49,7282
51,1786
52,6197
54,0520
55,4760
56,8923
58,3012
59,7031
73,4020
86,6608
149,4493
V
1 0,000039
0,0100
2
0,0717
3
0,2070
4
0,4117
5
0,6757
6
0,9893
7
1,3444
8
1,7349
9
2,1559
10
2,6032
11
3,0738
12
3,5650
13
4,0747
14
4,6009
15
5,1422
16
5,6972
17
6,2648
18
6,8440
19
7,4338
20
8,0337
21
8,6427
22
9,2604
23
9,8862
24
25 10,5197
26 11,1602
27 11,8076
28 12,4613
29 13,1211
30 13,7867
40 20,7065
50 27,9907
100 67,3276
V; Serbestlik Derecesi
α; Anlam düzeyi
237
Tablo 4. F Tablo Değerleri
Anlam düzeyi = α = 0,05)
Ho Red Bölgesi
α
Serbestlik derecesi
v
v
1
1
2
3
4
5
6
7
8
12
24
∞
5
661
579
541
519
5,05
4,95
4,88
4,82
4,68
4,53
4,37
6
5,99
5,14
4,76
4,53
4,39
4,28
4,21
4,15
4,00
3,84
3,67
7
5,59
4,74
4,35
4,12
3,97
3,87
3,79
3,73
3,57
3,41
3,23
8
5,32
4,46
4,07
3,84
3,69
3,58
3,50
3,44
3,28
3,12
2,93
9
5,12
4,26
3,86
3,63
3,48
3,37
3,29
3,23
3,07
2,90
2,71
10
4,96
4,10
3,71
3,48
3,33
3,22
3,14
3,07
2,91
2,74
2,54
11
4,84
3,98
3,59
3,36
3,20
3,09
3,01
2,95
2,79
2,61
2,41
12
4,75
3,89
3,49
3,26
3,11
3,00
2,91
2,85
2,69
2,51
2,30
13
4,67
3,81
3,41
3,18
3,03
2,92
2,83
2,77
2,60
2,42
2,21
14
4,60
3,74
3,34
3,11
2,96
2,85
2,76
2,70
2,53
2,35
2,13
15
4,54
3,68
3,29
3,06
2,90
2,79
2,71
2,64
2,48
2,29
2,07
16
4,49
3,63
3,24
3,01
2,85
2,74
2,66
2,59
2,42
2,24
2,01
17
4,45
3,59
3,20
2,96
2,81
2,70
2,61
2,55
2,38
2,19
1,96
18
4,41
3,55
3,16
2,93
2,77
2,66
2,58
2,51
2,34
2,15
1,92
19
4,38
3,52
3,13
2,90
2,74
2,63
2,54
2,48
2,31
2,11
1,88
20
4,35
3,49
3,10
2,87
2,71
2,60
2,51
2,45
2,28
2,08
1,84
21
4,32
3,47
3,07
2,84
2,68
2,57
2,49
2,42
2,25
2,05
1,81
22
4,30
3,44
3,05
2,82
2,66
2,55
2,46
2,40
2,23
2,03
1,78
23
4,28
3,42
3,03
2,80
2,64
2,53
2,44
2,37
2,20
2,01
1,76
24
4,26
3,40
3,01
2,78
2,62
2,51
2,42
2,36
2,18
1,98
1,73
25
4,24
3,39
2,99
2,76
2,60
2,49
2,40
2,34
2,16
1,96
1,71
26
4,23
3,37
2,98
2,74
2,59
2,47
2,39
2,32
2,15
1,95
1,69
27
4,21
3,35
2,96
2,73
2,57
2,46
2,37
2,31
2,13
1,93
1,67
28
4,20
3,34
2,95
2,71
2,56
2,45
2,36
2,29
2,12
1,91
1,66
29
4,18
3,33
2,93
2,70
2,55
2,43
2,35
2,28
2,10
1,90
1,64
30
4,17
3,32
2,92
2,69
2,53
2,42
2,33
2,27
2,09
1,89
1,62
40
4,08
3,23
2,84
2,61
2,45
2,34
2,25
2,18
2,00
1,79
1,51
60
4,00
3,15
2,76
2,53
2,37
2,25
2,17
2,10
1,92
1,70
1,39
2
80
3,96
3,11
2,72
2,49
2,33
2,21
2,13
2,06
1,88
1,65
1,33
100
3,94
3,09
2,70
2,46
2,31
2,19
2,10
2,03
1,85
1,63
1,28
120
3,92
3,07
2,68
2,45
2,29
2,18
2,09
2,02
1,83
1,61
1,26
∞
3,84
3,00
2,61
2,37
2,22
2,10
2,01
1,94
1,75
1,52
1,00
v : Pay için serbestlik derecesi
v : Payda için serbestlik derecesi
1
2
238
Tablo 5. F Tablo Değerleri
(Anlam düzeyi= α = 0,01)
Ho Red Bölgesi
α
Serbestlik derecesi
v
v
1
1
2
3
4
5
6
7
8
12
24
∞
5
16,26
13,27
12,06
11,39
10,97
10,67
10,46
10,29
9,89
9,47
9,02
6
13,75
10,92
9,78
9,15
8,75
8,47
8,26
8,10
7,72
7,31
6,88
7
12,25
9,55
8,45
7,85
7,46
7,19
6,99
6,84
6,47
6,07
5,65
8
11,26
8,65
7,59
7,01
6,63
6,37
6,18
6,03
5,67
5,28
4,86
9
10,56
8,02
6,99
6,42
6,06
5,80
5,61
5,47
5,11
4,73
4,31
10
10,04
7,56
6,55
5,99
5,64
5,39
5,20
5,06
4,71
4,33
3,91
11
9,65
7,21
6,22
5,67
5,32
5,07
4,89
4,74
4,40
4,02
3,60
12
9,33
6,93
5,95
5,41
5,06
4,82
4,64
4,50
4,16
3,78
3,36
13
9,07
6,70
5,74
5,21
4,86
4,62
4,44
4,30
3,96
3,59
3,17
14
8,86
6,51
5,56
5,04
4,69
4,46
4,28
4,14
3,80
3,43
3,01
15
8,68
6,36
5,42
4,89
4,56
4,32
4,14
4,00
3,67
3,29
2,87
16
8,53
6,23
5,29
4,77
4,44
4,20
4,03
3,89
3,55
3,18
2,75
17
8,40
6,11
5,18
4,67
4,34
4,10
3,93
3,79
3,46
3,08
2,65
18
8,29
6,01
5,09
4,58
4,25
4,01
3,84
3,71
3,37
3,00
2,57
19
8,18
5,93
5,01
4,50
4,17
3,94
3,77
3,63
3,30
2,92
2,49
20
8,10
5,85
4,94
4,43
4,10
3,87
3,70
3,56
3,23
2,86
2,42
21
8,02
5,78
4,87
4,37
4,04
3,81
3,64
3,51
3,17
2,80
2,36
22
7,95
5,72
4,82
4,31
3,99
3,76
3,59
3,45
3,12
2,75
2,31
23
7,88
5,66
4,76
4,26
3,94
3,71
3,54
3,41
3,07
2,70
2,26
24
7,82
5,61
4,72
4,22
3,90
3,67
3,50
3,36
3,03
2,66
2,21
25
7,77
5,57
4,68
4,18
3,85
3,63
3,46
3,32
2,99
2,62
2,17
26
7,72
5,53
4,64
4,14
3,82
3,59
3,42
3,29
2,96
2,58
2,13
27
7,68
5,49
4,60
4,11
3,78
3,56
3,39
3,26
2,93
2,55
2,10
28
7,64
5,45
4,57
4,07
3,75
3,53
3,36
3,23
2,90
2,52
2,07
29
7,60
5,42
4,54
4,04
3,73
3,50
3,33
3,20
2,87
2,49
2,04
30
7,56
5,39
4,51
4,02
3,70
3,47
3,30
3,17
2,84
2,47
2,01
40
7,31
5,18
4,31
3,83
3,51
3,29
3,12
2,99
2,66
2,29
1,81
60
7,08
4,98
4,13
3,65
3,34
3,12
2,95
2,82
2,50
2,12
1,60
80
6,96
4,88
4,04
3,56
3,26
3,04
2,87
2,74
2,42
2,03
1,50
100
6,90
4,82
3,98
3,51
3,21
2,99
2,82
2,69
2,37
1,98
1,43
120
6,85
4,79
3,95
3,48
3,17
2,96
2,79
2,66
2,34
1,95
1,38
∞
6,64
4,61
3,78
3,32
3,02
2,80
2,64
2,51
2,19
1,79
1,00
2
v : Pay için serbestlik derecesi
v : Payda için serbestlik derecesi
1
2
239
Download