İSTATİSTİK

advertisement
İSTATİSTİK
SAĞLIK KURUMLARI İŞLETMECİLİĞİ
Doç. Dr. Suphi VEHİD
İSTANBUL ÜNİVERSİTESİ AÇIK VE UZAKTAN EĞİTİM FAKÜLTESİ
Önsöz
Günümüzde bilimsel çalışmaların tamamında istatistik metotlardan yararlanılmaktadır.
Sağlık alanında kullanılan istatistiksel terimler ve yöntemler biostatistik başlığı altında yer
almaktadır. Sağlıkla ilgili bilim dalları gerek tanımlama gerekse nedenselliği açıklama amacı
ile Biyoistatistik metotlardan en fazla yararlanan bilim alanlarındandır.
Sağlık Hizmetlerini bir bütün olarak ele aldığımızda bu hizmette yer alan her bir
meslek grubunun görev
ve sorumlulukları belirlenmiştir. Her bir meslek grubu diğerini
tamamlamakta ve desteklemektedir. Sağlıkla ilgili bir olayı tanımlama veya nedenselliğini
açıklamak için doğru bilgiye ve doğru bilginin doğru yorumlanmasına gereksinim
bulunmaktadır.
Mesleğin gerektiği şekilde uygulanmasına yardım edeceği ümidiyle
Doç. Dr. Suphi VEHİD
İSTANBUL ÜNİVERSİTESİ AÇIK VE UZAKTAN EĞİTİM FAKÜLTESİ
TIBBİ DÖKÜMANTASYON ve SEKRETERLİK LİSANS PROGRAMI
İSTATİSTİK
SAĞLIK KURUMLARI İŞLETMECİLİĞİ
Doç. Dr. Suphi VEHİD
BÖLÜM I
GİRİŞ
Sağlık kurumlarında görev yapanların görev ve sorumlulukları arasında;
Tıbbi istatistikler ile ilgili verileri derler ve bilimsel metotlarla analiz ederek
sonuçları periyodik olarak ilgililere rapor etmek yer almaktadır.
Yukarda sözü edilen görev, yetki ve sorumlulukların doğru olarak yerine
getirilmesinde istatistik ve onun sağlık alanında kullanım şekli olan biyoistatistik
uygulamalarının bilinmesinin sonsuz yararı bulunmaktadır.
İstatistiksel ilke ve yöntemlerin uygulanmasında bilgi ve beceri yalnız biyoloji
ve tıp bilimleri için değil sağlık mesleklerinin herhangi birinde etkili kullanılması için de
gereklidir.
Sağlık alanında çalışan kişilerin istatistik bilgisine sahip olma nedenleri
aşağıdaki gibi sıralanabilir;
1. Tanıya ve kanıta dayalı düşüncenin anlaşılması, tıbbın hayli bağımlı olduğu
olasılık kavramlarının anlaşılması için istatistik bilgisine gereksinim duyulmaktadır.
2. Sağlık çalışanları kendi bilgi becerilerinin ışığında ölçümlerle yorum yapmak
gereksinimi duyarlar,
3. Hastalıktan korunma veya hastalık etkilerini sınırlayabilmek yönünde
hastaların en iyi tedavilerini sağlamak için sağlık çalışanları hastalıkların neden –
sonuç ilişkisinde istatistiksel ve epidemiyolojik gerçekleri bilmeleri ve anlamaları
gerekmektedir,
4.
Sağlık
çalışanları
sağlık
istatistiklerinin
birincil
veri
kaynağını
oluşturmaktadır. Bu nedenle sağlık verilerinin sağlıklı tutulması ve yorumlanması
gerekmektedir,
5. Sağlık yöneticileri toplumsal sağlık sorunlarının tanımlandığı istatistikleri
yorumlayabilecek bilgiye sahip olmalıdır.
İstatistiksel Tanımlar:
İstatistik terimi genellikle iki şekilde kullanılmaktadır.
1
a. Veriler,
b. Sayısal Gözlemler
c. Nicel bilgi
Örnek:Bebeklerin doğum ağırlığı,
Belli bir günde polikliniklere başvuran hasta sayısı,
Belli nüfusta var olan olgu sayısı gibi
2.
a. İstatistiksel yöntemler
b. Verilerin toplanması, sunulması, analizi yorumlanması,
İstatistiksel yöntemlerin üç ana kullanımı bulunmaktadır.
1. Mümkün olan en iyi yöntemle verileri toplamak
a. veri toplama için formların oluşturulması,
b. veri toplama işleminin örgütlenmesi,
c. araştırmayı planlama ve yönetme,
d. bir toplumda taramayı yönetme
Örnek: Ölüm ve doğumla ilgili verilerin toplanması, Tüberkulozlu kişilere ait
verilerin toplanması
2. Bir grup veya bir durumun niteliklerini tanımlamak
a. veri çıkarma
b. veri özetleme,
c. veri sunumu
3. Verileri analiz ederek sonuçlarını çıkarmak
Bunun için farklı analiz tekniklerini kullanarak sonuçlar çıkarmada olasılık
kavramlarının bilinmesi ve kullanılması gerekmektedir.
İstatistik Nedir?
İstatistik “’Last’’ tarafından rastgele varyasyonların konusu olan verilerin
toplanması, özetlenmesi ve analiz etmesini sağlayan bir bilim ve sanat olarak
tanımlanmaktadır.
Bu durum “Bilimsel Çalışma” olarak adlandırılabilir ve genel amacı güncel,
geçerli ve dinamik bilgi üretmek olup kısaca belirsizliği ortadan kaldırmaktır. Bilimsel
bilgi doğru, geçerli, güvenilir ve yeterli verilerden elde edilir.
İstatistik
ne
anlama
gelmektedir?
İstatistik
kelimesinin
çeşitli
anlamı
bulunmaktadır.
1. Sıklıkla kaydedilmiş herhangi bir bilgiye atıfta bulunmak için kullanılır,
2. Hesaplanmış bir seri bilgiyi belirtmek için kullanılır, örneğin ortalama vb.
3. İstatistik bir çalışmanın veri setinde yer alan bilgilerin toplanması ve analizi
ve bundan çıkarımlar elde edilmesi ile ilgili izlek ve teknikleri ifade eder.
İstatistikle ilgilenen kişinin görevi nedir?
1. Bilgi toplamadan önce bir deney veya araştırmanın tasarımına danışmanlık,
2. Elde edilen verileri uygun istatistiksel teknik ve izleklerle analizi,
3. Hükümet görevlileri ve endüstride yer alan kişiler de dahil karar vericiler ve
araştırıcılara sonuçları sunmak ve yorumlamak
Neden istatistik uygulanır?
1. İstatistik bilgisi araştırma yapacak ve yönetecek kişiler için önemlidir,
2. İstatistiğin temelini anlama bir araştırma ve bunun etkili sunumu için
yararlıdır,
3.İstatistiği öğrenme günlük hayatta gerçek ile hayali birbirinden ayırmaya
yardımcı olur.
Konu ile İlgili bazı kavramlar
İstatistiksel Olay: Canlı ve cansız varlıklar ile kuramsal olarak varsayılan
birimlerde ortaya çıkan ve sayılarla ifade edilebilen oluşumlara “istatistiksel olay” adı
verilmektedir.
Toplum: Belirli bir özelliği gösteren, bilinen canlı ve cansız birimlerin
oluşturduğu topluluğa verilen addır.
Hedef Toplum: Üzerinde araştırma yapılacak topluma hedef toplum
denmektedir.
Birim: Toplumun en küçük parçasına birim denir.
Değişken: Birimin sayılarak, ölçülerek veya tartılarak değerleri saptanan
özelliklerine değişken denmektedir.
Veri: Birimlere ait değişkenlerin; ölçerek, tartarak, sayarak ya da ölçekler
aracılığı ile elde edilen sayısal değerlerine veri denmektedir. Bilimsel bir çalışmada
en önemli eleman veridir. Bu nedenle veri doğru, güvenilir, örneklem hatası düşük
(ileriki bölümlerde açıklanmaktadır) sistematik hata taşımayan değerlerden
oluşmalıdır.
Veri kaynakları
1. Birincil veri kaynağı: Doğrudan araştırmacı tarafından toplanan verilerdir.
2. İkincil veri kaynağı: Başka araştırmalarda benzer veya farklı amaçlar için
toplanan verilerdir.
Ölçme: Bir değişkenin büyüklüğünü uygun ölçeklerle sayısallaştırma işlevine
ölçme denmektedir
Ölçek: Matematiksel özellikleri belirli ölçümler kümesine ölçek denir.
Ölçü Birimi: Bir ölçme aracının karşılaştırmaya esas alınan standart büyüklük
ölçüsüne ölçü birimi denmektedir. Örneğin uzunluk için metre, ağırlık için kilogram
denmesi gibi.
Ölçülebilirlik: Bir değişkenin büyüklüğünün uygun olan bir ölçme aracı ile
sayısallaştırılmasıdır.
Hipotez: Gözlemlere veya sezgilere dayalı olarak oluşturulan veya araştırılan
konu ile ilgili gerçekleşmesi beklenen durumdur. Hipotez ya kabul edilir veya
reddedilir.
Önkabul: Bir araştırmada önceden belirlenen önerme ve koşullardır.
Açıklamaya çalışılan kavramlardan yola çıkarsak “istatistik” saymak veya
ölçmekle elde ettiğimiz sayılardan oluşturulan verilerin değerlendirilmesini sağlayan
bir dizi uygulamalardır.
Gerçekte canlı ve cansız, sabit veya farklılaşan, nicel veya nitel özelliği
sayılarla belirtebilecek herhangi bir oluşum istatistiksel bir değerlendirmeye
girebileceği
için
istatistik
olay
olarak
adlandırılabilir.
Herhangi
bir
birimde
yargılanacak, değerlendirilecek "olay" da daha önce de değinildiği gibi kendi içinde 2
biçimde oluşabilir.
1- Tipik olaylar:Bilinmeyen rastlantısal etkenlerin etkilerinin yok kabul
edilebileceği, dolayısı ile hepsi denetlenir etkenlere bağlı nedenlerden kaynaklanan,
kesin belirgin sonuçların alındığı olaylardır. Bunlarda tek bir örnek, tüm evreni
simgelemektedir.
(Ör.: Işık hızının sabitliği, belli dış koşullarda suyun kaynama derecesinin
denkleminin saptanması gibi).
2- Atipik olaylar (yığın olaylar):Temelde aynı nedenlere sahip ancak
rastlantısal nedenlerle, belli sınırlar içinde farklılaşımlar gösteren olaylardır. Her birim
ölçümsel değer olarak farklı olabileceğinden genel bir simge kullanılmaz.
(Ör.: boy ölçümü, eritrosit sayısı, gerek tekil gerek toplumsal olarak
farklılaşabilir).
Topluma ait ölçütler, toplum içinden belli yöntemlerle çekilen ve toplumu
simgelediği varsayılan, toplumdan çok daha az sayıda (n) bir birim kümesi üzerinde
incelenir. Bu özel kümeyi toplum içinden alma eylemine "örnekleme", kümeye ise
"örneklem", "örnek grubu, kümesi", denir.
Örneklemlerden
elde
edilen
ve
tüm
toplumun
kullanılabilecek olan sayısal büyüklüklere de "istatistik" denir.
özelliğiymişçesine
İstatistik, tanımlayıcı ve açıklayıcı istatistik olarak sınıflanmaktadır.
Tanımlayıcı İstatistiğe örnek olarak;Bir çalışma sonucu elde edilen kan
kolesteroldeğerlerini ortalama ± standart sapma ile gösterebiliriz298 ± 56 gibi
(burada değerler 242 ile 346 arasında değişmektedir)
•
150 kişilik bir grupta yer alan olguların cinsiyet dağılımını bir tabloda
özetlemek istersek aşağıdaki tablo örneğindeki gibi özetleyebiliriz.
Sayı
Yüzde
Erkek
90
60
Kadın
60
40
Toplam
150
100
Veya grafik şeklinde aşağıdaki gibi özetlenerek sunulabilir
Cinsiyete göre dağılım, sayı (n)=150
Kadın
40,0%
Erkek
60,0%
ARAŞTIRMADA - İSTATİSTİKSEL YARGILAMADA "HATA"
Bilimsel araştırmada, tüm toplumun (popülasyon) denetlenmesi ilgilenilen
özelliğin tüm toplum bireylerinde ölçülmesi, sayılması pek çok nedenle olanaksızdır.
Bundan dolayı toplumu simgeleyecek, çok daha kısıtlı topluluklarla çalışılır. Örnek
veya örneklem olarak adlandırılan bu özel grupların gerek sayısal gerek özellik
dağılımı açısından toplumu simgeleyecek nitelikte ve nicelikte olmaları gerekir.
-
Örneklem ne kadar sağlıklı belirlenmiş olursa olsun, yerine geçtiği toplumu tam
anlamı ile (nicel veya nitel olarak) yansıtması neredeyse tamamen olanaksızdır.
Başka bir deyişle örneklemden elde edilen sayısal değerler toplumu ancak belli
farklarla ortaya koyarlar. Olasılık kuramları yardımı ile, bir örneklemden elde edilmiş
değerlere dayanarak, belli güvenirlikle, bir toplumun değerlerini kestirmek olanaklıdır.
Ancak bu kestirimin sağlıklı olabilmesi için herşeyden önce örneklemin değerlerinin
güvenilir, doğru, yani kabaca "hatasız" olması gerekir.
Her tür bilimsel ölçüm de kaçınılmaz olarak yanlışlara, hatalara açıktır,
yöntembilimsel olarak yapılması gereken, hatanın en aza indirilmesi başka bir deyişle
olanaklı olan en yüksek doğruluğun sağlanmasıdır.
Bir ölçümün doğruluğu iki tip "hata"dan etkilenir;
1) Rassal hatalar
2) Dizgesel (sistematik) hatalar.
1) Rassal hatalar: Bilinçsiz rastlantılara bağlı olarak ortaya çıkan dolayısı ile de
"gerçek" değerin etrafında oldukça dengeli saçılım gösterebilen, sonuçta belki gerçek
değere temelde oldukça yakın özet değerlere (ortalama) erişilmesini getiren ancak
tekil değerlerin değişkenliği nedeniyle "kesinliği" (presizyon) oldukça az ,güvensiz
sonuçlara götüren hatalardır. Toplumun ortalama boyunun araştırılacağı bir
örneklemde rassal olarak cücelerin ve basketbol oyuncularının gerçek toplum
sıklıklarından -dengeli de olsa -çok fazla sayıda
bulunması ve boy değerinin
gerçekten çok daha fazla değişkenlik aralığına sahip olması gibi.
2)
Dizgesel
hatalar:
Genelde
araştırmada
özelde
örneklemde
yapılmış
yöntembilimsel bir aksama nedeniyle (sistem) olguların özellikle belli bir yönde
birikmesi hatasıdır. Rassal hatalar çok az olsa bile, örneklem temelde toplumu
simgelemekten uzaktır ve "geçersiz" bir değeri yansıtmaktadır. Toplum yetişkin erkek
vücut ağırlığı düzeyi saptanırken hep ayni yönde hata yapan - ör.: 1.5 kg fazla tartan
- bir ölçüm cihazının kullanılması gibi .
Dizgesel hatalara genel olarak "bias" adı
verilir.
Rassal hatalar ölçümlerde – aşağıda anlamlarının açıklanacağı üzere "kesinlik" azalmasına, Dizgesel hatalar ise "geçerlilik" azalmasına neden olurlar.
Buna göre bias, gerçek toplum değeri ile, örnek grubundan saptanan kestirimsel
değer arasında oluşan ve araştırmanın çeşitli aşamalarındaki hataların birikiminden
kaynaklanan farklılıkdır. Bu farklılığın bilimsel etik çerçevesinde “özel” olarak
kurgulanmadığını - bilimsel ahlaksızlık tanımına girer - raslantılar ve “hatalar” sonucu
ortaya çıktığını unutmayalım.
Yöntembilimsel özellikler, çalışma tasarımı ve çözümlemeye bağlı olarak
belirebilen biasla ilgili olarak yüzü aşkın ayrıntılı çeşitten söz edilebilir; sonuçları
etkileme, değiştirme açısından en ağır sonuçlar üretebilecek iki tip biasdan kısaca
söz edelim :
1) Seçim Biası
Örneklem olgularının seçimi düzeyinde yapılan hatalara bağlı olarak beliren
kestirimsel
değer
bozukluğudur.
Kıyaslanacak
grupların
seçimi,
örneklem
çerçevesinin belirlenmesi (özellikle vaka/kontrol ve kesitsel çalışmalarda) izleme
çalışmalarında "tamamlanmamış" olguların değerlendirilmesi bu biasdan kaçınılması
için özenilmesi gereken noktalardır. Olgu/denetim çalışmalarında vaka tanısı,
etkilenim süresine bağlı özelliklere göre değişiyorsa hata oluşur.
Kişilerin bilimsel araştırmaya
katılmada gönüllü olmaları bile sağlık
durumlarına bağlı olabilir. Yanıt alınamayan veya kaybolanlar, en genç, en sağlıklı
veya sağlıkları en bozuk olanlar olabilir. Olumsuz bir etkenin etkilenim süresi yaşam
süresini değiştiriyorsa, zaman içinde etkilenmemiş (veya etkilenmiş) olanların daha
fazla bulunduğu, insidans hızı oranlarının hatalı belireceği "seçkin sağkalım" biası
oluşur. Eğer etken, hastalıkla olan ilişkisinin dışında, hastalığın saptanmasını da
doğrudan etkiliyorsa (kolaylaştırıyorsa), saptanma şansının yüksek olmasına bağlı
"saptanma" biası oluşur. Berkson yanılgısı olarak adlandırılan bias tipi de, olgu veya
denetim ögelerinin eldesinin (örnek: hastahaneye alınma) daha kolay olmasına bağlı
olarak ortaya çıkabilir.
Araştırıcı bu tür bir bias'ın oluşabileceğini düşünüyorsa örneğin birden çok
denetim topluluğu oluşturma yoluna gidilebilir. Hepsinde yaklaşık değerlerin elde
edilmesi biasın etkisizliğini belirtecektir.
Dığer taraftan örnekleme aşamasında
kayıpların en aza indirilmesi , tanı yönteminin etkenin düzeyinden bağımsız seçilmesi
gibi yöntemler bu biası azaltmak için kullanılır. Örneklem sayısının ve seçim
yönteminin önemi unutulmamalıdır.Bu bias tipi özellikle olgu/denetim çalışmalarında
sonuçları tamamen yanıltıcı biçimde değiştirebilir.
Seçim biası kavramına giren bazı özel bias tipleri şunlardır:
•
Yetersiz örneklem sayısı biası :
•
Çekim biası (Centripetal Bias) :
•
Referansa erisim biası (Referral Filter Bias) :
•
Tanılamaya erişim biası (Diagnostic Access Bias) :
•
Yatış oranı biası (Admission Rate / Berkson Bias) :
•
Prevalans-insidans biası (Neyman Bias) :
•
Özel küme biası ( Membership - Healty Worker [Seçkin Sağkalım] Bias ) :
2) Bilgilenme biası
Çalışmanın konusu olan neden sonuç ilişkisinde, etkilenim veya hastalık tanısı
yargısındaki dizgesel hatalar yüzünden, sonuç kestirimin bozulmasıdır. Anketlemede,
sorgulamada yetersizlik veya yanlışlık, tanı koyma düzeninin yetersizliği, hatalı bilgi
kaynakları vs. gibi nedenlerle ortaya çıkan bilgilenme biası, olgunun yanlış
sınıflanmasını getirir. Bu nedenle "yanlış sınıflama biası" adını da almaktadır.
Bir neden-sonuç ilişkisi araştırmasında, her iki toplulukta da (olgu/de- netim) tanı
yöntemi aynı (hatalı) duyarlılık ve özgüllüğe sahipse "ayrımsız bilgilenme hatası"
vardır. Buna karşın topluluklarda (etken grubu/etki bulunmayan grup gibi) tanı
konmasında farklı testler (veya titizlik) uygulanıyor ise "ayrımcı bilgilenme hatası"
vardır.
Tanı için en geçerli (hem duyarlılık hem özgüllük açısından) yöntemler, yalın,
sorgulama ve gözlem gereğinde çift denetim, Bilgilenme biasının giderilmesi için
gereklidir.
Bilgilenme biası kavramına giren bazı özel bias tipleri şunlardır:
•
Kaba-kötü ölçüm biası :
•
Muayene gerginligi –Beyaz gömlek- biası :
•
Kabul edilmez yöntem (Unacceptability Bias) biası :
•
Beklenti (Expectation Bias) biası :
•
Anımsatma (Recall Bias) biası :
•
Aileden bilgilenme (Family information Bias) biası :
•
Gözlemde olma (in Attention Bias) biası :
Bu
belirtilenlerden
başka
yaklaşık
100’den
fazla
ayrı
tip
bias
ayrımlanabilmektedir ; bunlardan en sık en sık karşılaşılabilecek olan bazıları –
ayrıntılarına girilmeksizin -şöyledir:
•
Spektrum biası : Özel seçilmiş bir kümede uygulanan bir tanılama yönteminin
sonuçlarının gerçeğe göre daha abartılı – veya düşük – olarak saptanması,
•
Dışlanmış değişken biası: Belli bir sonucu oluşturmada belirgin rolü olması
bilinmesine karşın değerlendirmeye alınmayan bir etkenin varlığı yüzünden
oluşabilecek kestirim yanlışları,
•
“Dil” biası : İngilizce gibi belli bir dilin dışında yapılmış yayınların
değerlendirmeye alınmaması,
•
Yayın (publication – pozitif sonuç) biası : Genellikle beklendiği yönde sonuç
alınmış araştırmaların yayınlanma şansının yüksekliğine bağlı bias ,
•
Cinsiyet , inanç , ırk ,etnik köken,vs
gibi özelliklerin seçilmesi veya
dışlanmasına bağlı biaslar.
•
Kayıp olgu (Withdrawall) biası :
•
Kayıp veri (Missing Data) biası :
•
Denetime aktarım (Bogus Control) biası
•
Degerlendirme sonrası anlamlılık düzeyi kabulü biası :
•
Sonuç seçme (Looking for the pony) biası :
•
Yeniden düzeltme (Tidying-Up) biası :
•
Küme tanım sınırlarının degistirilmesi biası
•
Şirket ürünü desteği biası
Anlaşılacağı üzere bazı tip biaslar seçim veya bilgilenme biası ayrıntısı altında
ele alınabilecekken bazıları çok daha özgün , ender ancak çok etkili olabilirler ,
araştırıcılar
tasarımları
davranmalıdırlar.
ve
çalışma
süreçleri
boyunca
bu
yönde
bilinçli
BÖLÜM II
KESİNLİK VE GEÇERLİLİK
Hataların varlığı ortadan -olabildiğince- kaldırılarak örneksel simge değerin
toplumu en güçlü ve doğru şekilde yansıtması yani "kesin" ve "geçerli" olması istenir.
Bu aynı zamanda istatistiksel bir yargının doğru olmasının da ilk adımıdır.
1) Kesinlik
Kesinlik bir anlamda "dağınıklığın , saçınımın tersidir" ; verilerin doğal, rassal
değişim sınırları ne denli darsa o veri kümesinden elde edilecek olan toplum kestirimi
o denli kesin olacaktır. Erişikin erkek toplumunun HDL düzeyi - çok büyük oranda 13-90 mg/dL arasında değişir demek , 34-48 arasında değişir demeye göre çok
daha az kesindir. Rassal hatanın, göreli olarak yok varsayılması demek olan kesinlik
temelde 3 etkene bağlıdır;
1) Örneklem büyüklüğü ,
2) Örnekleme yöntemi
,
3) İncelenen özelliğin ölçümsel değişkenliği (varyans)
Bu etkenler doğrudan biyoistatistiksel önkabul ve kestirimlerle , örnekleme düzeninni
iyi tasarlanıp gerçekleştirilmesi ile belirlenirler.
2) Geçerlilik
"Geçerlilik" birden fazla alanda değişik tanımlarla kullanılan bir terimdir.
Örneğin bir ölçme aracının geçerliliği ölçtüğü düşünülen durumun gerçek
büyüklüğüne yakın ölçüm yapması ile belirlenir. Bilimsel araştırma ve deneylemede
geçerlilik , yanıtı aranan soruya araştırmanın doğru yanıt verebilme yeteneğidir ,
klinik değerlendirmede geçerlilik özellikle tanılamada bir tanı yönteminin hasta veya
sağlam tanısını olabildiğince doğru koyabilmesidir. Veri özelliği olarak ise geçerlilik,
örneklemdeki-veri setindeki sonuç düzeyin tüm toplumdan elde edilebilecek olana
yakın olması ile belirlenir. Örneklemin "toplumu simgeleme" özelliğinin yetersizliği
geçerliliği de yok eder.
Sonuç olarak geçerlilik ; araştırmanın yapısının veya/ve ölçümsel düzeylerin veya/ve
örnek olguların simgeleme yeteneğinin bozulması gibi, araştırma sonuçlarının genel
doğruluğunu, güvenirliğini , gerçeğe yakınlığını t zedeleyecek hataların bulunmaması
durumudur.
Geçerlilik ancak "Dizgesel hata" nın ortadan kaldırılması ile
sağlanabilecektir. İki tip geçerlilikten söz edilebilir;
a) Dışsal geçerlilik: Bir araştırmanın sonuçlarının (örneklemden elde edilen)
belli bir toplum (popülasyon) için "genelleştirilebilmesi" olgusudur. -Toplum kavramı
için her zaman kısıtlamalardan söz edilebilir örneğin sonuçlar sadece "kadınlar" için
geçerli olabilir.
Genelleştirme istatistiksel ve bilimsel açılardan irdelenir. İstatistiksel açıdan
genelleştirilebilme,
toplumdan,
örneklemin
sayıca
yeterli
ve
uygun
olasılık
dağılımlarına göre çekilmiş olmasına (simgeleme) bağlıdır. Doğal olarak istatistiksel
genellemenin kısıtlılıkları bulunmaktadır.
Örneğin Vaka/Denetim çalışmalarında
olguların istatistiksel açıdan "genellenebilirliliği" tartışmalıdır veya ender hastalık
(veya etken) olgularında sayısal yeterliliğe erişilmeyebilir.
Bilimsel açıdan ise genelleme, incelenen olaya ilişkin bilgiler çerçevesinde
yapılır. Olgular arasında biyolojik, fizyolojik, psikolojik, vs. temel benzerlikler olması
ile örneklemden topluma (veya topluluğa) geçiş yapılabilir.
b) İçsel geçerlilik: Bir çalışmanın iç düzenlemesindeki yapısındaki hatalar,
ölçümlerin bozunumuna neden oluyorsa içsel geçerlilik yok demektir. Örneğin
araştırmada "tartı aletinin" ayarsız olması tüm ağırlık ölçümlerinin yanlış olmasına
(aynı düzenle) neden olacak, araştırmanın "iç" değerleri hatalı olarak belirlenecektir.
Gerek içsel gerek dışsal geçerlilikler araştırmada, dizgesel hata düzeyinin yani
bias ‘ın azaltılması ile sağlanabilecektir yani biasları engellemek için alınacak
önlemler geçerlilikleri de yükseltecektir. alınabilecek ilk önlemler kısaca şöyle
sıralanabilir;
Araştırma yöntembiliminde hem kesinliği hem geçerliliği uygun düzeyde
sağlamak açısından aşağıdaki noktalara mutlak uyulmalıdır:
Kesinlik için:
• Sayıca ve simgeleyicilik olarak uygun örneklem,
• Aşırı uçlardaki değişken değerlerinin denetimi
Geçerlilik için:
• Varsayım düzenine uygun sınama kurgusu ,
• Bilgilenmede nesnelliğin sağlanması ,
• Örnekleme kurgusunun uygun yapılandırılması.
Şekil 1.1.'de "x" ile simgelenen toplumsal parametreyi belirlemek için yapılan
örneklemelerde elde edilebilecek hatalı ve uygun sonuçlar görselleştirilmektedir.
Şekil 1.1- Kesinlik ve Geçerlilik açısından örnekleme sonuçları
DEĞİŞKEN KAVRAMI
Matematiksel fonksiyonlara bağlı olarak mutlak bir kesinlikle belirlenmeyen
özellikler "değişkendir" ve tıpsal-biyolojik alanlardaki hemen her konu değişkenler
üzerinedir. Nesnel tanım olarak "rastlantısal etkilere bağlı olarak ölçümsel
farklılaşmalar gösteren birim değişken adını alır". Aynı konulardaki değişkenler,
kuramsal bir "beklenti" değerin etrafında;
• Bilinen denetlenir etkiler,
• Bilinmeyen etkiler
• Çeşitli etkilerin ara etkileşimleri,
nedeniyle ölçümsel farklılaşımlar göstererek yer alırlar. Bazen bir değişken özellikle
diğer bir değişkenin gösterdiği farklılaşmalara uygunluk göstermesi açısından
tanımlanır. Böyle konumlarda iki değişken arasındaki ilişki bir çeşit "fonksiyon" olarak
da tanımlanabilir .
Değişkenlerin değerlendirilmesi ve sınıflanması farklı açılardan ele alınabilir –
bu konu 2. bölümde ayrıntıları ile incelenecektir – ancak en belirgin ve temel iki ana
özellikle ortaya çıkarlar:
1) Nicelik: Çeşitli ölçü teknik ve birimleri ile düzeyleri saptanıp, simgelenen,
(ölçülebilen) gerçek,nesnel özelliklerdir. Örneğin boy uzunluğu, vücut ısısı gibi.
Ölçümleri bir birime dayalı olarak yapılır ve genelde sürekli değerler (en küçük kesre
kadar gereğinde saptanabilen) alırlar, ondalıklı birmlerle ölçümleri uzatılabilir
2) Nitelik: Birimlere dayalı ölçümlerle değil sayımlarla değerleri belirtilebilen,
belli bir yapısal veya konumsal özelliği taşımak (veya taşımamakla) simgelenebilen
özelliklerdir. Örneğin, belli bir kan grubunu taşımak, x hastası olmak, evli olmak vs.
Nitel özellikler ancak tam-süreksiz (kesirli değerler almayan) sayılarla belirtilebilirler.
Değişken(ler) gerek kavram olarak gerekse de
ölçümleri ile istatistiksel
değerlendirmenin ana ögesini oluştururlar. Çeşitleri ve özelliklerinin bilinmesi
araştırmanın doğru süreci için zorunludur. (Biyo)istatistiksel değerlendirmelerin hepsi
"değişkenler" üzerinde gerçekleştirilir.
NEDENSELLİK
Bilim bir anlamda, çeşitli alanlarda ve konulardaki "neden?" sorusuna yanıt
bulma sanatıdır. Çevremizdeki - ve içimizdeki - "dünya" ile olan bağlarımızı oluşturan
ve etkileyen tüm oluşumlar böylesi soruların yanıtındadır ve genel bir adlandırma ile
"nedensellik"
olarak
tanımlanabilir.
Böylece
"nedensellik"
olaylar-oluşumlar
arasındaki, birinin - genel adlandırma ile "neden"- , belli koşullar altında bir diğerinin
ortaya çıkmasını veya büyüklük değiştirmesini - genel adlandırma ile "sonuç" sağlaması olarak düşünülebilir. Nedenselliğin özü bir oluşun bir diğerince üretilmesi,
belirlenmesi veya kestirilmesidir. Bu açıklamayı daha nesnelleştirirsek :
"İki ayrı olgu veya duruma ilişkin; birinin, diğerinin var olması nedeni ile ortaya
çıkması veya birbirlerine uyumlu olarak düzey değiştirmeleri biçiminde belirlenen,
mantıklı, olabilir, ölçülebilir uyuma “nedensellik bağıntısı denir" .
Biyoistatistik biliminin değerlendirmesi çerçevesinde - ve tanıma uygun olarak - 2 tip
bağıntı açık olarak ayırdedilebilir :
1- Nedensel (Causal) Bağ : Buna göre bir "B" oluşumunun ortaya çıkışı , varlığı ,
büyüklüğü başka tür bir "A" oluşumunun varlığına bağlı olarak gerçekleşir. Oluşum
terimi bir özelliğin büyüklüğü, bir durum veya bir olay olarak karşımıza çıkabilir. Bu
tür bir bağlantıda "A" neden , "B" sonuç olarak yer alır. Örneğin,: Kuduz virüsü ,
kuduz infeksiyonuna neden olur , Sigara içmek Anfizeme neden olur. Diabet hastalığı
nöropatik ağrı yapar. Güneş yanığı melanoma neden olabilir.
Bu bağ her zaman çok açık olmayabilir ve bir "olasılık" sorunu olarak çözülür. Yapısal
açıdan ise bir nedensel bağ şu iki özelliği taşımalıdır :
Öncüllük : Neden , sonuçtan zaman olarak önce gelmelidir.
Bitişiklik : Neden ve sonuç ya doğrudan temas durumunda olan oluşumlar olmalıdır
ya da doğrudan temasta olan başka aracı bağlar ile bağlanmış olmalılardır.
Temel olarak infeksiyon hastalıklarının değerlendirilesi , incelenmesi ile ortaya çıkan
nedensel bağ - bakteri varlığı --> bulaşma --> hastalık - ünlü İngiliz epidemiologSir
Bradford Hill'in ilkelerine göre de tıpsal konularda nesnel olarak şu özellikleri
taşıyorsa geçerli bulunmalıdır:
- Zamansal izleme - öncüllük.
- Bağın gücü: sayısal özel ölçütlerle belirlenebilir ve yüksek olmalıdır.
- Bağın tutarlılığı: Pek çok benzer ikili oluşumda gözlenebilmelidir.
- Doz-yanıt birlikteliği: neden düzeyi arttıkça sonuç oluşum örneği artar.
- Bağın özgüllüğü: nedenden etkilenme belli tip bir sonuca götürür.
- Güncel bilgilere göre olabilirlik: Bilimsel, mantıklı açıklanabilirlik.
- Deneysel kanıtlanabilirlik: gerekli varsayımsal deneylerle doğrulanabilirlik.
- Benzeşim: benzer, kanıtlanmış bağlarla uygunluk.
Nedensel bağları tanıma tanımlama açısından yararlı olsa da Hill'in ilkelerinin
geçerliliğinin çelişkili, gerçek oluşumlara uymayan örneklerle tartışıldığını da
belirtelim.
Nedensel bağ , bilimsel araştırma tasarımı çerçevesinde yöntembilimsel olarak iki
yönden yaklaşılarak çözümlenebilir:
Öngördüğümüz bir sonuç farklılaşmasını üreteceğini düşündüğümüz bir
-
“nedenin” geçerliliğini değerlendirmek : Ör.:grip aşısı uygulaması ile grip
prevalansını düşürmek...
-
Gözlemlediğimiz bir sonuç farklılaşmasını ürettiğini düşündüğümüz
bir
“nedenin” geçerliliğini değerlendirmek.ör.: KOAH olgularında yoğun olarak sigara
kullanımı saptamak..
Görüldüğü gibi çözümleme nedenden sonuca veya sonuçtan nedene doğru
yapılabilir. Konunun ve koşulların – etik dahil – biçimlendirmesi bu yönü belirler –
ileride görülecek olan ; retrospektiv (geri yönelik) , prospektiv (ileri yönelik) araştırma
tipleri-.
Nedensel bağ irdelemesine şu tipik soru ile geçilir :Belli sayıda, nedensel,
“nitel” farklılık düzeyi ( farklı tedavi tipleri/ sigara içim özelliği tipleri/ cinsiyetler / yaş
dekadları , vs)sonuçsal açıdan , (mortalite / rekurrans sıklığı / sağkalım oranı / SAB ,
cea düzeyi , vs) farklılık düzeyleri oluşturur mu ?!
Bağın varlığı genellikle “kıyas tabanlı” değerlendirmelerin sonuçlarına dayandırılır.
2 - Birlikte değişim (covariation) bağı : Bir olayın düzey değişimine nesnel uyum
gösteren bir diğer olayın düzey değişimini çözümler (uyumun matematiksel belirtisini
ve yapısallığını). Nedensel (causal) bağ genellikle Varlık/yokluk veya farklı düzey
nedenlerin – medeni durum tipleri , yaş dekadları , eğitim tipi , tedavi tipi vs kıyaslamasına bağlı bir çözümleme iken birlikte değişim bağı mutlak neden-sonuç
ilişkisi gerektirmez sadece bir değişkenin değerini bilip bir diğerininkini kestirmek
veya gücünü göreli olarak vurgulamak için gerekli modellemeyi – varsa - kurgular .
Birlikte değişim bağ irdelemesine şu tipik soru ile geçilir :Bir – veya daha fazla –
öncül niceliğin -bağımsız değişken- (veya özel nitel alttiplerin) düzeyine göre (yaş ,
CEA , ailede DM var-yok, vs ) ilgili bir diğer niceliğin – bağımlı değişken- (veya ikicil
nitelik olasılığını), (CRP düzeyi , Tümör çapı, KKH olma olasılığı,vs) kestirebilecek
matematiksel bir modelleme oluşturulabilir mi ?
Bağın varlığı genellikle “matematiksel bir fonksiyonun” varlığı – veya biçimi sonuçlarına dayandırılır. Bu fonksiyon sadece “güç” belirten bir ölçüm olabileceği gibi
tüm özellikleri ile x değerine bağlı y değerinin hesaplanabileceği bir yapıda da olabilir.
Şekil 1.2.- Nedensellik bağı temel tipleri
NEDENSELLİĞİN KARMAŞIKLIĞI
İdeal bir nedensellik bağıntısı gerekirci (determinist) yaklaşımda, daha önce de
örneğini gördüğümüz gibi şöyle bir tabloda yargılanabilir;
X: Olası neden (Etken)
Y:
Olası
Sonuç Var
Yok (Etken
(hastalık)
:(Etken+)
-)
Var ( Hasta)
a
b
Yok (Sağlam)
c
d
X: Olası neden (Etken)
Y:
Olası
(hastalık)
Sonuç Var
:(Etken+)
Yok (Etken
-)
c = 0 ise X, Y'nin "yeterli" nedenidir. b = 0 ise X, Y'nin "gerekli" nedenidir.
Bu tür c ve b nin 0 olduğu, bir tipik olay tablosuna, tıpsal ve diğer biyolojik
olaylarda hemen hiç rastlanmaz, sayısal oranları toplama göre çok düşük olsa bile a
ve d gözlerinde de değerler bulunur ve olay kesinlikten çıkarak "olasılığa dayalı" bir
biçim kazanır. Bu da "tek nedene bağlı sonuç" yaklaşımını yetersiz duruma getirir.
Gerçekten tek bir etken belli bir sonucu oluşturmada gerekli olsa bile yeterli
olmayabilir (İnfeksiyon hastalıkları için tipik). Özellikle karşıt etkenlerin varlığı
(koruyucu) sonucun oluşmasını engelleyebilir. Bu konum bile "başka nedenlerin"
(koruyucu neden) ortada bulunması ile olayın atipik özellik kazanmasına yol açar.
Bazı atipik olaylarda ise koruyucu etkenlere bile gerek kalmadan, sonuç zaten ancak
birden fazla nedenin bir araya gelmesi ile belirebilmektedir yani birden fazla gerekli
ama yeterli olmayan nedensel koşulun (ögenin) tekil veya çoklu ilişkilerle bir arada
bulunması, çoklu bir nedensellik oluşturarak sonucu ortaya çıkarabilir. Bir sonucun
ortaya çıkması için kesinlikle bulunması gereken etkenler "zorunlu" etken adı verilir.
Zorunlu etkenlerin yanı sıra sonucun oluşmasına katkıda bulunan diğer etkenler
bulunur (katkısal etken) bunlar belli bir tip olmayıp, biri olmaz ise diğeri onun yerine
geçebilir, böylece "yerine etken" kavramı ortaya çıkar. Bazen hiçbir etken tek başına
yeterli olmayabilir veya sonuç için tipik/gerekli olmayabilir , bu koşullarda çok sayıda
katkısal etkenin birikimi tipik bir sonucun sonunda ortaya çıkmasını getirebilirler. Pek
çok dejeneratif hastalık , kanserler , vs için bu yönde hem genetik , hem çevresel
etkenlerin birlikte ve farklı kombinasyonlarla sonucu ortaya çıkarttıkları bilinmektedir.
Bazı nedenlerin alt ögeleri birbirlerinin düzeyinden etkilenebilirler ve sonuç etki
tekil etkilerinin toplamından fazla veya eksik olabilir. Bazı ikincil etkenlerin varlığı
nedensellik ilişkilerinde farklı düzeylerde farklı güçte bağıntılar ortaya çıkmasına
olanak verebilir (araetkileşim) , bazen ise bir nedensellik bağıntısı , arada yer alan
ikincil bir etken nedeni ile yalancı olarak var gibi gözükebilir (karıştırıcı etken).Bu tür
özgün konumlar gerçekçi ve güvenilir nedenselliklerin saptanması ve tanımlanması
açısından sorun çıkartabilirler.Bazen de tüm etkenler var olarak görülmesine karşın,
belli bir düzeye erişilmediği için sonucun belirmediği görülebilir. Bu tür, eksik olan
düzeyin tamamlanmasına neden olan veya yeterli nedeni oluşturmak için gerekli çok
sayıda ögeden eksik olan sonucunun tamamlanmasına neden olan olaya "Tetik" olay
denir.
Anlaşılacağı üzere tek bir sonuç öge için nedensellik ilişkisinin varlığı aslında
hemen hemen hiç yoktur ve ortaya konması da çok zordur. Gerçekçi ve iyi
düzenlenmiş bir nedensellik araştırması sonucu etkileyen /etkileyebilecek diğer tüm
ikincil nedensel ögelerin yöntembilimsel açıdan ve/veya istatistiksel tekniklerle
denetimini gerektirecektir. Bu tip çözümleme “çok değişkenli değerlendirme” olarak
adlandırılacaktır. Hem bilinmeyen hem de denetlenemeyen nedensel ögelerin
kesinlikle bulunacağı yorumlamalar yapılırken unutulmamalıdır.
Sağlık politikası oluşturma, planlama, programlama, bütçeleme , uygulama ve
bütün sağlık sistemi içindeki farklı programların genel entegrasyonunun sistematik ve
sürekli işlemesi bilgi desteğine bağlıdır.
Veri toplama ve analizi için kullanılan yöntemler potansiyel kullanıcılara ve
bunların duyacakları bilginin çeşidine bağlıdır.
Tarih süreci içerisinde çözümlemeler için genel olarak aşağıdaki bilgi
kaynaklarından yararlanılmıştır.
1.Gelenekler – inançlar:Toplumda oluşmuş bilgi birikimleri(genelde dinlere,
toplumsal deneyimler ve örneklere dayalı olarak), çözüm yaklaşımlarıdır. İlgili konuya
bağlı olarak, son derece hızlı değişim ve kanıtlı gelişimlerin yaşandığı konumlarda
yetersiz, yararsız hatta zararlı olabilmektedirler
2. Otoritenin kararları: Bazı konularda karar verme yetkisi ve yeteneği olduğu
düşünülen birey ve kurumların bilgileri kullanılmıştır. Doğal olarak bunların "doğru"
olması, gerçekte yetersiz bilgilenmişlik, öznellik, vs. gibi nedenlerle çok tartışmalıdır
3. Bireysel deneyimler: Birey kendi bilgi ve yaşam deneyimleri çerçevesinde
kararlar alır. Birey yaşantısının sınırlı ve öznel olması, bilgisinin genel bir doğru
olarak kabul edilmesini tartışmalı duruma getirir.
4. Bilim: Neden – sonuç ilişkilerinin sorgulandığı, çözümlendiği, belirtildiği,
nesnel – dizgeli bilgiler birikimi olarak adlandırılabilecek “bilim” aslında doğru bilginin
kaynağıdır.
Temelde bilim; anlama, açıklama ve denetim (kontrol) işlevlerini içerir.
"Anlama" kavramı, var olan şeylerin tanınması, özelliklerinin ve
bağıntılarının temel kavramlarını içerir.
"Açıklama" ise bunların bağıntısal nedenlerinin ortaya konma çabasıdır.
"Denetim" işlevi de ilk iki işlevle üretilen bilgilerin uygulamaya yönelik
sonuçlarını ortaya koyar. Özet olarak bilim nedensellik bağıntılarını "doğru" olarak
bilmeyi ve bunlardan yararlı "bilgi ürünleri" oluşturmayı amaçlamaktadır.
Diğer taraftan kesinliğin karşıtı olarak düşünebilecek "Belirsizlik" , tanım olarak
"açık ve net bilgi yoksunluğu" ,"içinde bulunulan durumu veya gelecekteki bir
beklentiyi veya birden fazla olası seçeneği tanımlama açısından kısıtlı bilgi
bulunması" olarak tanımlanabilir.
Anlaşılacağı üzere belirsizliğin ölçümü ortaya çıkabilecek tüm seçenekleri
belirlemek, bunların her birine düşen olasılıkları saptamakla başlar. Bu da olasılığın
"uygulanması" ve istatistik bilimi kullanılması ile gerçekleşir.
Belirsizlik , "risk" kavramı ile birlikte gelir; bazı olası sonuç seçenekler zararlı
hatta ölüme kadar gidebilen olumsuz çıktılardır, böylece bu tip seçeneklerin
saptanması ve olasılık çerçevesinde "büyüklüklerinin" belirlenmesi riski de ortaya
koyar. Buna karşılık riskin tersi "yarar" olarak düşünülürse, riski olasılığının dışında
kalan kısım çözümlenmelidir.
Belirsizlik tüm insan etkinlik ve bilimlerinde ortaya çıkar, bir anlamda tıp bilimi
de bu alanda doğru kararlar alınması için yine bu alanda ortaya çıkan belirsizliklerle
baş edebilme sanatıdır. Bu, ilgilenilen konudaki tüm verileri , nesnel ipuçlarını
derlemek , çözümlemek ve bir sonuç üretmeyi içerir. Söz konusu veriler çoğu zaman
sayısallaştırılabilir - hasta/sağlam sayıları , MI olguları ve kolesterol düzeyleri , farklı
semptomları taşıyanların sayıları , semptomları ağırlıklarına göre dağıtılması , vs .Bu sayılardan yola çıkarak altta yatan belirsizlikler için en uygun çıktı, karar, yorum
olasılıklarına gidilir.
BELİRSİZLİĞİN NESNELLEŞTİRİLMESİ: OLASILIĞIN BELİRLENMESİNE
DOĞRU
Nedensellik Bağıntısı Nedir?
İki ayrı olgu veya duruma ilişkin var olma -veya ölçüm büyüklüğü değişmesiözellikleri arasındaki birlikteliğe “Nedensellik bağıntısı“ denir.
Bilim genel olarak böylesi bağıntılara objektif açıklamalar getirmeyi amaçlar.
Nedensellik bağıntısı
Kabaca önceden var olan bir olayın varlığının daha sonra ortaya çıkan bir
olaya neden olması veya düzeyinde değişiklik oluşturması biçiminde düşünülebilir.
Konunun olasılıklı değerlendirme çerçevesinde basit bir örnek üzerinde kısaca
irdeleyelim:
"E" etkeninin, "S" sonucunu doğuran bir neden olduğunu düşünürsek, "E’’
etkeninin var ve yok olduğu örneklerde "S" nin var ve yok oluşuna göre aşağıdakilere
benzer örnek tablolar elde edebiliriz.
Etken Var
Etken Yok
Sonuç Var
A
B
Sonuç Yok
C
D
Ebola virüs infeksiyonu üzerinden aşağıdaki gibi bir tablo oluşturacak olursak
Ebola infeksiyonu
Etken Var
Etken Yok
Ölüm var
69
0
Ölüm yok
7
44
Ebola infeksiyonuvarlığının , bu enfeksiyondan ölüm için gerekli olduğunu
etkenin olmadığı durumda ölümün gözlenmemesinden (B gözünün sıfır olmasından)
söyleyebiliriz, buna karşılık etkenin varlığının ölüm için yeterli olmadığı yorumunu
etkeni taşıyan herkesin ölmemiş olmasından dolayı (C gözü 7) yapabiliriz.
Kuduz
infeksiyonu
Etken Var
Etken Yok
Ölüm var
69
0
Ölüm yok
0
44
Yukarıdaki tabloya bakarak Kuduz infeksiyonuvarlığının, bu enfeksiyondan
ölüm için gerekli olduğu - B gözü boş - ayrıca yeterli olduğu - infekte olup sağ kalan
yok- anlaşılmaktadır.
Bu tabloda etken var ise sonuç "kesinlikle" bulunmaktadır.
Eğer bir neden "gerekli" ise, sonucun görüldüğü her olguda bulunmaktadır
ama sonucun görülmediği olgularda da bulunabilir - bunlar etkenin varlığına rağmen
sonucu göstermeyebilmişlerdir -. Eğer bir neden "yeterli" ise bulunduğu her olguda
sonuç görülür ama aynı sonuç başka nedenlerle de ortaya çıkabilir dolayısı ile
sonucu gösteren her olguda bu nedenin bulunması zorunlu değildir.
Bu ifadeden de anlaşılacağı gibi, olasılığa bağlı olaylar arasında özgün
değerlendirmeler yapılarak
karar noktalarına doğru gidilmesi söz konusudur ve
istatistik bilimi bu tür değerlendirmeleri yapmak üzere ortaya çıkmıştır.
Bu tür, olasılığa dayalı olayların incelenmesi, kuramlaştırılması, bağıntıların
kurulması yöntemleri bütünü "İstatistik" bilimini oluşturur.
BİYOİSTATİSTİKSEL DEĞERLENDİRME
Biyoistatistiksel değerlendirme, bilimsel bir araştırmanın amaca uygun elde
edilmiş verilerinin, karar üretebilmek amacı ile , istatistik kuramları temel alan sayısal
tekniklerle değerlendirilmesi olarak tanımlanabilir. Bu tip bir değerlendirme zaten
bilimsel araştırmanın zorunlu bir aşamasıdır .Bu değerlendirme , araştırma sürecinin
tüm boyutlarından etkilenebilir , hazırlığı da , yöntembilimsel süreçleri belli düzeylerde
ve biçimlerde etkiler. Başka bir deyişle araştırmanın koşullarına uygun bir
değerlendirme yapılması zorunlu olduğu gibi , bir araştırmanın koşulları da eldeki ,
kullanılabilecek değerlendirme yöntemlerine göre seçilmeli akla gelen her koşula ,
araştırma tasarımına uygun bir değerlendirme yöntemi bulunabileceği önyargısı ile
yola çıkılmamalıdır. Hem araştırma aşamalarının hem de bu etkileşimlerin doğru
tanımlanması ve gerçekleştirilmesi sonuçların da doğru ve güvenilir olması açısından
zorunludur. Aşağıdaki şekilde , biyoistatistiksel değerlendirmenin de yer aldığı bir
bilimsel araştırma düzeninde çeşitli süreçsel özelliklerin etkileşimi en basit durumu ile
görülmektedir.
Bilimsel araştırmanın o aşamaya kadarki süreçlerine uygun olarak elde edilmiş olan
nesnel-sayısal veriler üzerinde önce gerekli özetsel istatistik uygulamaları yapılır.
Devamında ise varsayımın geçerliliğini yargılayacak olan , araştırma sorusuna yanıt
verecek olan , belirlenen "sıradışılığı" bilimsel olarak yargılayacak olan değerlendirme
gerçekleştirilir. Bir araştırma aslında tek bir varsayım - araştırma sorusu içermeli ise
de bir çeşitli açılardan , çok sayıda değişkeni ilgilendiren pek çok değerlendirme
yapılabilir. Bunların tümü araştırma protokolünde bulunan , planlanmış , varsayımın
yargılanmasına doğrudan veya dolaylı katkısı olan değerlendirmeler olmalıdır.
Araştırmanın varsayımı - sorusu, genelde tek bir özgün olayın (primary endpoint)
yargılanmasını esas alır , ilgilenilen diğer özellikler ikincil konular , değişkenler olarak
(secondary end points , events, variables) ele alınır.
Gereken her istatistiksel değerlendirme , o değerlendirmeye konu olan durumun
koşulları çerçevesinde belirir ve bu özgün koşullar kullanılması gereken doğru
biyoistatistiksel tekniği belirler.
Bazen , aynı soruna kabaca birden fazla tekniğin uygulanabileceği sanılsa bile
aslında bir yargılamanın koşullarına uyan sadece tek bir doğru teknik vardır ve ancak
onun sonucu geçerli-doğru olacaktır.
“p”
Nedensellik bağıntısının tipi ne olursa olsun, hangi tip değerlendirme tekniği ile
gerçekleştirilirse gerçekleştirilsin bir biyoistatistiksel yargılamanın sonucu “p” harfi ile
simgelenen bir olasılık düzeyi yansıtılarak verilir. “p” , olasılık kelimesinin (probability,
probabilite) karşılığı olarak kullanılmakta olup gerçekleştirilen değerlendirmedeki
sorunsala ilişkin özgün olasılık düzeyini yansıtır. Genel anlamı ile “olasılık”; “bir olayın
ortaya çıkış beklentisinin ölçütü” olarak tanımlansa da ele alınışı ve yorumu doğal
olarak söz konusu olayın tanımsal özelliklerine bağlı olacaktır ve bir bilimsel
yargılamadaki istatistiksel değerlendirmenin sonucu olan “p” değeri de bu çerçevede
yorumlanacaktır.
Şekil 1.2.- Biyoistatistiksel değerlendirmenin diğer yöntembilimsel araştırma
ögeleri ile etkileşimi.
Olasılık düzeyi “0” – gerçekleşmesi olanaksız – ile “1” – mutlaka gerçekleşecek –
değerleri arasında değişir ve genellikle “0” ve “1” düzeylerine – bilimsel araştırmalar
çerçevesinde rastlanmaz. Olasılık düzeyi ne denli yüksek olursa ilgilenilen,
"araştırmanın soru özelliğinin" ortaya çıkma “şansı” da o düzeyde yüksek olur ama
hiç bir zaman “mutlaka olacak” düzeyine erişemez dolayısı ile çok yüksek bir olasılık
düzeyi bile, yine de beklentinin aksinin çıkmasına açık olacaktır.
Olasılık tabanlı değerlendirme, karmaşık sistemlerin – medikal konuların da içinde
bulunduğu – mekanizmaları, bunların düzen ve düzensizliklerini tanımlamak ve
anlamak için kullanılacaklardır. "p" simgesi, sayısal biçimde sorgulanabilen
kavramsal veya uygulamalı bir medikal sorunun olasılık sonucunu yansıtır ve anlamı
sorunun yapısına göre değişir.
Yeni tedavi "A" , "B" tedavisinden daha etkin
midir ?
p = 0.6818
iki
tedavinin başarı oranları arasında "Anlamlı fark" bulunamamıştır.
Yeni tedavi "A" , "B" tedavisinden daha etkin
midir ?
p = 0.1565
iki tedavinin başarı oranları arasında "Anlamlı
fark" bulunamamıştır.
Yeni tedavi "A" , "B" tedavisinden daha etkin
midir ?
p = 0.0451
tedavinin başarı oranları arasında "Anlamlı fark" bulunmuştur.
iki
Bu 3 çapraz tabloda da tedavi tipleri arasında başarı oranı farkı olup olmadığı
sorgulanmıştır. İlk tabloda, kıyas tedavileri arasındaki oran farkı ( % 78.8 - %76.1)
bilimsel açıdan nedensel sayılabilecek düzeyde bir fark olarak belirlenmemiştir. Bu
yetersiz fark - ya da "farksızlık" - ikinci tabloda da sürmektedir (%78.8 - %69.1) . Bu
örnekte tedavilerin oranları arasındaki farkın artmasına koşut olarak sonuç yargı
olasılığı olan "p" değeri de değişmiş ve daha düşmüştür (0.6818-->0.1565).
Anlaşılacağı üzere "fark" arttıkça , bunu "gerçek" bir fark olarak yorumlamamızın
ipucu olan "p" değeri küçülmektedir.
3. örnekte "p" nin belli, özel bir sınırın altına inmesi ile yorumun da diğer yöne - fark
bulunduğu - döndüğü anlaşılabilecektir. Bu tablolar ve yorumlarından çıkartılacak
ana kavramsal sonuçlar şunlardır:
1. Bilimsel araştırmalar öngörülen, varsayılan "farkların" gerçekten var olup
olmadıklarını veya gözlenen-belirlenmiş farkların altında gerçek nedensellikler
bulunup bulunmadığını sorgulamak üzere yapılır, dolayısı ile "fark bulunması /
bulunamaması" kalıbı her zaman kullanılmaktadır. Bilimsel açıdan geçerli-kanıtlı
bir nedenselliğe bağlı fark ,"anlamlı fark" olarak adlandırılır.
2. Genel anlamı ile "p" değeri, gözlenmiş ve/veya öngörülmüş bir farkın
altında
gerçek
bir
nedensellik
yatabileceği
iddiamızın
ne
kadar
yanılabileceğini yansıtmaktadır. Bu iddia'nın, varsayımın, yapısına, biçimine,
yönüne göre "p" düzeyi sonucunu değerlendirmek de farklılaşabilecektir. 3.
örnekte "p" için belli bir sınırın altına düşülmesi ile yorumlama değişmiştir. "p"
sonuçlu
bir
sorunsalın
3
farklı
biçimde
ortaya
çıkabileceği
ve
değerlendirilebileceğini aşağıda ayrıntısı ile göreceğiz ancak belli "p" olasılık
düzeyinin altında bulunulması, yani yanılma payının çok düşük olduğu
koşullar, önerinin, varsayımın, gözlenen farkın gerçekliğini, geçerliliğini
vurgulayacaktır. Medikal alanlar için bu kritik sınır p=0.05 olarak kabul
edilmektedir, bu sınıra "anlamlılık sınırı" denir. -bununla birlikte özel koşullarda
p=0.10 a kadar yükseltilebilmesi veya çok kritik-tehlikeli sonuçların ortaya
çıkabileceği alanlarda p=0.001 e kadar düşürülebilmesi olanaklıdır.
3. Dikkat edilirse 2. ve 3. tabloda A ve B tedavilerinin başarı oranları aynı
olmasına karşın (%78.8 - %69.0) - 3. tablodaki olgu sayıları 2. tablodakinin tam 2
katıdır-
2.
tabloda
anlamlılık
bulunamamışken,
3.
tablo
anlamlı
fark
göstermektedir, örneklem sayısının, sonuç yargı değeri üzerinde kesin ve
büyük etkisi bulunmaktadır. Bu konunun önemi "örnekleme" bölümünde
ayrıntısı ile ele alınacaktır.
Çapraz tablolarla değerlendirilmiş araştırmalardan bazı başka örnek araştırma
konularını da ele alalım:
Kadınların HDL düzeyi erkeklerinkinden yüksek midir?
Kadın kümesi HDL (nk= 34)
47.3 ± 11.7 mg/dL Erkek kümesi HDL
(ne= 26) 39.8 ± 12.6 mg/dL
→p = 0.0206
Kadınların HDL düzeyi erkeklerinkinden anlamlı olarak yüksektir.
Hastaların total kolestrol düzeyi tedaviden sonra düşmüş müdür ? (n= 27)
Tedavi öncesi :
254.8 ± 26.5 mg/dL
Tedavi sonrası :
219.7 ± 19.3 mg/dL
→p = 0.017
Tedavi kolestrol düzeyini anlamlı olarak düşürmüştür.
Total kolestrol ve HbA1c düzeylerinin değişimi birbirleri ile bağıntılı mıdır " ?
n=56 , Ch.: 214.6 ± 23.5 mg/dLHbA1c : 4.7 ± 0.76 %
r = 0.57
→p = 0.00043 : (p<0.001)
Total kolestrol ve HbA1c düzeyleri matematiksel bir model çerçevesinde
birbirlerine uygun olarak değişmektedirler
4. Biyoistatistiksel değerlendirme ve dolayısı ile "p" sonucu her tür değişken için
ve her tür bilimsel araştırma tasarımında ve nedensellik yargısında
bulunmaktadır.
Genel olarak sınıflandırılırsa "p" , 3 ayrı tip sorunun dolayısı ile de
sonuçsal yorumun olasılık yargısı olarak ortaya çıkar:
-Öngördüğümüz bir düşüncenin doğruluğunu kanıtlamak için gerçekleştirilen
bir bilimsel araştırmada , “p” bu düşüncenin-varsayımın yanlış olması
(yanılgımızın) düzeyini gösterecektir. Başka bir deyişle böylesi bir düşüncenin
sadece şansa bağlı olarak ortaya çıkması olasılığını gösterir.
•
Yeni bir "A" tedavisinin, standart tedaviye kıyasla, x-kanseri hastalarının
sağkalım süresini en az 20 ay uzatacağını öngörüyoruz.
p =0.003
p<0.05  Bu yöndeki öngörümüzün yanılma payı çok düşüktür,
varsayımımız kabul edilebilir ve yeni tedavinin sağkalımı uzattığı kanıtlı sayılabilir.
•
"A" hastalığının kadınlara kıyasla erkeklerde daha çok gözlenebileceğini ileri
sürüyoruz. (araştırma sürecinde 18/1363 erkek , 9/1307 kadın --> % 1.32 - %
0.68)
p =0.103 p>0.05  Bilimsel açıdan emin olamayacağımız düzeyde bir yanılma
payı, hastalığın erkeklerde daha yüksek olduğunu kesin ileri süremeyiz. Oranların
farklı olduğu düşüncesi reddedildi.
- İkincil özellikte değişkenlerde gözlemlenen - araştırmanın ana sorusu
olmayan - bir fark düzeyinin yorumlanması. Sonuç "p", eğer bu farkın özel bir
nedensel bağ çerçevesinde ortaya çıktığını öne sürersek ne denli yanılabileceğimizin
göstergesidir.
•
Bir klinik araştırmada ( iki tedavinin etkinliği kıyaslanıyor) , "A" tedavisi
hastalarının yaşı 59.8 (± 5.4, n1=18) ve "B" tedavisindekiler; 62.6 (± 6.3,
n2=19) bulundu. Bu fark "anlamlı mı?" , etkinlik sonuçlarını da etkileyebilmesi
açısından yanıt önem taşıyor.
p =0.157
p>0.05  Tedavi kümelerinin yaş düzeyleri arasında "anlamlı" fark
bulunmuyor, birbirlerine denk sayılırlar - dolayısı ile de yaş , tedavi etkisini bozacak
bir ikincil etken gibi gözükmüyor-.
- Kuramsal veya gerçek hayattaki beklentiye uymadığı gözlenen bir durumun
yargılanması.
Bu durumda "p", gözlenen "farklılığın" yeni bir kurama, duruma
uyduğunu ileri sürersek ne kadar yanılabileceğimizin göstergesidir. Başka bir deyişle
eski kuramın şansa bağlı olarak böylesi bir "uç durumu" gösterebilme olasılığını
yansıtır.
•
Yeni bir fertilizasyon yönteminde 79 gebelikten 45 i kız bebektir (%56.96) , kuramsal
beklentiden (%50) gerçekten yüksek sayılır mı - özellikle kız mı oluyor ?
p =0.042 p<0.05  Kuramsal beklentiye göre anlamlı olarak daha yüksek kız
bebek bulunmaktadır. Ancak "p" değerinin anlamlılık sınırına çok yakın olması nedeni
ile kesin bir yargıya varmak için yeni olguların birikmesinin uygun olacağı ve/veya
ikincil koşulların da gözden geçirilmesi düşünülmelidir.
Bu örnekten anlaşılacağı üzere özellikle anlamlılık sınırına yakın sonuçlarda,
örneklem sayısı, klinisyenin görüşleri ve sonucu etkileyebilecek ikincil etkenler
mutlaka sonuç yargıda göz önünde bulundurulmalıdır.
Verilen örneklerden ve yorumlardan anlaşılacağı üzere biyoistatistiksel
değerlendirme daha önce de vurgulanmış olan başka kavramlar ve özelliklere göre
yöntem ve yorum değiştirebilmektedir dolayısı ile sonuç olarak bilinmelidir ki bu
süreç, sadece- rastgele bir teknikle - bir “p” değeri hesaplaması değildir .
Bir bilimsel öngörünün geçerliliğinin denetimi için gerekli olan:
•
Bir sezgiyi-öngörüyü denetlenebilir “biçime”, varsayıma dönüştürmek;
•
Olayın ölçütlerini ve bunların yapısını belirlemek,değişken seçmek,
•
Denetim için uygun düzeni tasarlamak,
•
Güvenilir sonuç için gerekli örneklem sayısını hesaplamak,
•
Verilerin toplanacağı “olguları” belirlemek,
•
Verileri olgulardan sağlıklı-doğru elde etmek ve işlemek,
•
Koşullara uygun “yargılama yöntemini” kullanmak,
•
Sonuçları doğru yorumlamak ve karar üretmek,
aşamalarının tümü doğrudan veya
dolaylı olarak
sonuç "p" değerinin ortaya
çıkmasını oluşturacağından , bir anlamda "Biyoistatistiksel değerlendirme" tüm bu
basamakların bütünü olarak düşünülmelidir.
Araştırıcı o ana dek varlığı bilinmeyen veya yanlış ya da geçersiz olarak kabul
edilen bir bilgiden farklı bir bilgiyi sezerek onu varsayım veya özgün bir düşünce
biçimine dönüştürmüş, istatistiksel
yargılama ile
öngörüsünün geçerliliğini
denetlemektedir.
İstatistik hesaplamalar konunun özelliğine göre çeşitli testler kullanılarak
yapılırlar ve hesap sonuçları genellikle özel simgelerin karşılığı olarak belirtilir (t, z, F,
χ2, vs.)
Her test için, araştırmanın deney düzeyine bağlı olan (denek sayısı,
kontenjans tablosunda göz sayısı vs.) ve adına “serbestlik derecesi” denen bir
kavram çerçevesinde, elde edilen sonuç değere karşılık gelen bir olasılık düzeyi
belirlenir. Gerek okuyucunun konuyu daha bilinçli irdelemesi gerekse de gereğinde
çözümleme denetimlerinin yapılabilmesi için istatistiksel değerlendirme sonuçlarının
yargılamada kullanılmış olan testin simgesi (“χ2” gibi) ve serbestlik derecesi (sd) de
vurgulanarak verilmesi önerilir (ör.:χ2 = 6.38 , sd=2 , p= 0.041).
Uygun tasarımla , yeterli sayıda ve doğru yapılandırılmış örneklemle ,
araştırmanın tasarım ve
değişken koşullarına göre seçilmiş bir (biyo)istatistiksel
değerlendirme tekniği ile sürdürülen bir araştırmada , öngörülen varsayım
kanıtlanmamış olsa bile bu bilgi de yayınlanmalıdır. Böylesi bulgular daha sonra
yapılacak araştırmalar için çok önemli temel taşları oluşturacaklardır Ancak
unutulmaması gereken ilke de şu olmalıdır :”Kanıtlanamamış fark , farksızlığın
kanıtı değildir”…..
Açıklayıcı İstatistik:
Toplumun tümünde çalışmak çok zor olduğundan toplumu temsil eden örnek
üzerinde çalışılır,
Hipotez testleri ve hesaplama metodları açıklamalar için son derece önemlidir,
Örnekten elde edilen veriden toplumdaki olasılığa ulaşılmaya çalışılır.
Sigara içmenin sağlık üzerine olumsuz etkisinin araştırılmak istendiği ulusal
düzeyde bir çalışmada tüm toplum yerine toplumdan elde edilen örnek grupla
görüşülür,
Toplumda barsak solucanı sıklığını araştırmak için tüm toplum yerine rastgele
seçilen örneklerdeki sıklıktan toplumdaki sıklığı hesap edilmeye çalışılır.
Genelde pek çok farklı bilim dalında da kullanılabilen temel istatistiksel
yöntemlerden yararlanarak, tıp ve diğer biyolojik bilimlerdeki konulara, sorunlara yanıt
arama yaklaşımına "Temel biyoistatistik" adı verebiliriz. Bu çerçevede tanımlayıcı
istatistikler, kıyassal tabanlı basit varsayım çözümlemeleri, bazı basit - veya
karmaşık- bağıntı modellemeleri gibi konular temel biyoistatistik çerçevesinde ele
alınır.
Biyoistatistik; "Genelde tüm canlıların özelde insanların biyoloji ve sağlık
tabanlı konularda, diğer canlı ve cansız değişkenlerle etkileşimlerinin sonuçlarını
sayısal olarak değerlendirerek tanılama, yargılama ve yorumlama yapmak bilimidir".
Biyoistatistik günümüzde 3 alt özellikli olarak düşünülebilir: bunlardan ilki
verilerin
toplanması ve
değerlendirilmesi
dökümü,
biçimindedir.
Bu
ikincisi ise
uğraşların
çeşitli matematik
ise
yöntembilimsel
yöntemlerle
çerçevede
gerçekleştirilmesi gereği 3. özellik olarak varsayılabilir.
Biyoistatistik, tıpta genelde iki alanda kullanılır, bunların en genel anlamları ile
alt başlıkları da çok kısaca şöyle düşünülebilir.
1- Koruyucu tıp’ta,
•
Genel ve bölgesel sağlık durumu saptama ve planlanmasında,
•
Toplum özelliklerinin değerlendirilmesinde,
•
Farklı toplumların özelliklerinin kıyaslanmasında,
•
Taramaların, tedavi hizmetlerinin, önlemlerin değerlendirilmesinde kullanılır.
Bu başlıklardan da anlaşılacağı üzere biyoistatistik halk sağlığı ve
epidemiyolojinin vazgeçilmez-zorunlu bir parçasıdır.
2- Klinik tıpta, klinik araştırmalardan elde edilen sonuçlar ile,
•
Klinik tanı yöntemlerinin yargılanması, kıyaslanmasında,
•
Yeni tedavi yöntemlerinin yargılanması, kıyaslanmasında,
•
Etiyolojik etkenlerin saptanmasında,
•
Belli biyolojik, klinik özelliklere ilişkin kestirimlerin üretilmesinde,
Tıpsal
sonuçları
etkilediği
düşünülen
belirlenmesinde sayısal özellikleri ile kullanılır.
farklı
değişkenlerin
etkilerinin
BÖLÜM III
VERİLERİN TOPLANMASI ve DÜZENLENMESİ ile ÖLÇÜM
ÖLÇEKLERİ
Sağlık politikası oluşturma, planlama, programlama, bütçeleme , uygulama ve
bütün sağlık sistemi içindeki farklı programların genel entegrasyonunun sistematik ve
sürekli işlemesi bilgi desteğine bağlıdır.
Veri toplama ve analizi için kullanılan yöntemler potansiyel kullanıcılara ve
bunların duyacakları bilginin çeşidine bağlıdır.
Veri toplama için düzenli ve özel amaçlı sistemler
Düzenli veya rutin bir sistemle veri toplamadır. Sıklıkla veri oluştukça veri
toplama için bir kayıt işleminden oluşur.
Örnek:
1. Doğum, ölüm, evlenme gibi hayati olaylar hakkında veri toplama için bir
yaşamsal kayıt sistemi,
2. Salgın hastalıklar hakkında bilgi toplamak için bildirim sistemi,
3. Kanser olgularını takip edebilmek için kanser kayıt formu gibi,
Özel amaçlı veri toplama genellikle düzenli bir temelde bulunmayan, bilgiyi
toplama için taramanın yapıldığı veri toplama şeklidir.
Örnek: Obesite taraması, Oral kontraseptif kullananların saptanması gibi,
Özel amaçlı sistemi düzenli veri toplama sisteminden ayıran temel özellikler;
1. Hangi tip bilginin toplanmasına gereksinim duyulduğu ve bu gereksinimin
topluma tanıtılması ve katılımının sağlanması,
2. Hangi tip bilginin toplumun hangi kesiminden toplanacağına karar verilmesi,
3. Kaç kişiden bilgi toplanacağı,
4.Bilgi toplanacak kişilerin nasıl seçileceği konularına gereksinim duymaktadır.
Veri Ölçme İçin Araçlar:
Veri ölçme için üç temel araç vardır.
1. Alet: Ölçüm tamamen mekanik bir araçla yapılır.Ağırlık tartısı, termometre
2. İnsan : Ölçüm aletinin az veya yok denecek kadar katkısı ile insan
tarafından yapılır. Kalbin dinlenmesi, dalak büyüklüğünün derecelendirilmesi,
3. İnsan ve alet kombinasyonu: Röntgen filmlerinin okunması, kan yayma
preparatlarının okunması.
VERİ ELDESİ YÖNTEMLERİ
Araştırmaların nesnelliğini sağlayacak olan veriler, araştırma tasarımının
özelliği çerçevesinde – örneklerden- elde edilen sayısal veya sayısallaştırılabilen
bilgilerdir. Bunların elde edilmesi temel olarak 2 kaynaktan sağlanır : Gözlemler ve
Deneyler.
GÖZLEM:
Araştırmacının, oluşumuna hiç bir katkısal / değiştirici etki
göstermeden , - gereğinde tanımı nesnel bir varsayım oluşturmadan- çeşitli olayları
dışarıdan, doğal çevresi ve kurgusu içinde, duyumsal olarak izlemesidir.
Bu tür olaylar sıklıkla nitel özellikte ve büyük boyutlu
(toplumsal veya doğal)
oluşumlarda ve uzun süreçlerde veya tamamen rastlantısal ortaya çıkan tiptedir
ancak belli hastalık veya tıpsal özelliklerin tanılanması çerçevesinde nicelikler de
olabilir.
Araştırıcı olgulardan bilgi toplamak amacı ile belli koşullarda özgün teknikler
kullanabilir ( kan tahlili, MR , vs ).
Gözlemler, olguların, örneklemin yapısallığında hiçbir değişiklik oluşmasına neden
olmaksızın:
-
Özel tedavi yok,
-
İlgilenilen
konu
özelliği
bozacak
(tansiyonunu
yükseltecekse,
stresini
arttıracaksa, bazı kan değerlerini değiştirecekse, vs) girişim yok,
Çeşitli
Tamamen doğal koşulları koruyarak, gerçekleştirilmelidir.
konulardaki
anketler,
özgün
konu
dizgeleri,
hasta
öyküleri,
arşiv
değerlendirmeleri, kayıtlardan çalışmalar, vs “gözlem” kavramı altında gerçekleştirilir.
DENEY: Araştırmacının, kendi varsayımsal amaçları doğrultusunda, gereğinde
yapay özellikler içeren düzenler üretilerek ve konumdaki değişkenlerin tanındığı,
bilindiği ve/veya özel olarak katıldığı, ortam ve koşullarda, sonuçların belirmesini
tetikleyerek veri oluşturmasıdır.
Sonuçlara daha kısa sürede erişilebilir ama tüm etkenlerin denetimi olanaksızdır
dolayısı ile sonuçlarda belirsizlikler kalabilir veya gerçek yaşam koşullarına
uygulandığında beklenmeyen durumlar ortaya çıkabilir. Deneylerde olabildiğince
nesnel koşullarda çalışılmalıdır.
Araştırıcı olgulara “değişimleyici” girişimde bulunur yani kendi kurguladığı belli bir
nedensel fark yaratarak – Farklı tedaviler, girişimler, vs – bunun farklı sonuçlar
üretme özelliğini belirler. Dolayısı ile önce nedensel girişim vardır bulunur, sonuç
sonradan ortaya çıkar  İleri yönelik. Tüm “klinik deneyler” bu tanıma girer.
Bu çerçeve de 3 alttip ayrımlayabiliriz:
Kontrollü deney: Kontrollü deney, etkisi yargılanan özellik dışında tüm diğer
özellikleri açısından – olabildiğince- benzeş bir kıyas kümesindeki sonuçlar ile bir
deneysel etkenin bulunduğu kümenin sonuçlarını kıyaslar – ileri yönelik - . Özel
koşullarında – laboratuar veya klinik, hastane, vs – gerçekleştirilen deneyler bu
başlığa uyar.
Doğal deney
(Quasi Experiment):Doğal deneyler kontrollü deneylerdekinden farklı
olarak düzenli denetlenebilen belli sayıda değişken yerine ilgilenilen bir sistemin
değişkenlerinin tümünün – olabildiğince – gözlemlenmesi ve böylece belli değişkenin
farklılaştırıcı etkilerinin başka değişkenlerinkinden ayırt edilebilmesini temel alır.
Genelde belli bir varsayım çerçevesinde ortam ve özellikler gözlemlenmektedir. – her
yöne !- Kendiliğinden ortaya çıkmış, toplumsal – alansal boyutta bir olayı öncelikle
gözlemleyip, devamında nedenini – veya sonucunu – belirleyebilmek için belli
girişimlerde bulunulması ile gerçekleştirilir.1854 Londra kolera salgınında Broadstreet
‘teki kuyunun infeksiyonun kaynağı olduğunun saptanması bu yöndeki ilk örnektir ve
süreci gerçekleştiren Dr. Snow’da ilk “çözümleyici” epidemiyolog sayılabilir.
Anlaşılacağı üzere epidemiyoloji’de son derece önemli bir yaklaşımdır.
Alan deneyleri: Kontrollü deney yaklaşımının toplumsal boyutta, belli tip etken
sorgulamaları için gerçekleştirilmesidir. En sorunlu yönü pek çok ikincil etkenin
kontrol dışı kalması hatta bilinmeyen etkenlerin varlığıdır. – ileri yönelik - . İki farklı
ancak temel özellikleri benzeyen kasabada, biri kontrol diğeri sağlık düzeyinin
yükselteceği öngörülen bir girişimin alanı olarak kullanılarak ve sadece bu girişim
farklılığı dışında diğer yaşam koşullarını doğal akışına bırakarak sürdürülen bir
araştırma örneği bu başlığa girer. Halk sağlığı açısından önemli bir araştırma
yaklaşımıdır.
BAŞLICA ARAŞTIRMA TASARIM ŞEMALARI
Belli bir varsayımın kanıtlanması amacı ile başlatılan araştırmalar, bu beklenti
çerçevesinde karar vermeyi sağlayacak uygun bir çözümleme tasarımına göre
yürütülürler. Özgün tasarım şeması her şeyden önce araştırma konusu nedenselliğin
bir "nedensel" veya "birlikte değişim" bağı olmasına göre farklılaşır. Daha önce
vurgulandığı gibi bazı araştırmalar - çözümle tanımlayıcı- gereğinde her iki bağı da
barındırırlar. Aynı şekilde araştırmada yer alan "kıyassal ortam" veya "bağımsız"
değişken sayısı tek - dolayısı ile çift değişkenli değerlendirme - veya çok sayıda
olabilir - çokdeğişkenli değerlendirme - . Daha önce vurgulandığı gibi bilimsel
araştırmalar salt tanımsal amaçlı da yapılabilir. Aşağıdaki basit şema hangi araştırma
tiplerinde
ne
tür
nedensellik
karşılaşabildiğimizi özetlemektedir.
bağları
ve
değerlendirme
yaklaşımları
ile
İlgilenilen nedensellik bağının tipine göre ve varsayımın yönlendirmesine de
bağlı olarak "kanıtlama"
kurgusu aşağıdaki yaklaşımlardan birine bağlı olarak
gerçekleştirilir.
Bu yaklaşımlara ilişkin çok kısa bilgi verirsek:
AYRIM YAKLAŞIMI: En basit açıklaması ile bağımlı değişken, yani sonuç
olarak düşünülebilecek bir y özelliğinin, bunun nedeni - ya da bağımsız değişken olarak düşünülen bir x olgusu ortadan kaldırıldığında, yok olup olmadığının – veya
düzeyinin anlamlı olarak değiştiğinin –denetlenmesidir. Yaklaşım, x değişkeni ortaya
konduğunda, etki ettirildiğinde, bunun sonucu olarak beklenen y’ nin de ortaya çıkıp
çıkmadığını denetlemek şeklinde de düşünülebilir. Dolayısı ile nedenden sonuca
süreci sorgulayan bir yaklaşımdır, “ileri yönelik” araştırma tasarımları bu süreci
uygular.
Sigara içimi etkisi ile ( çiçek hst. Virüsü ile) akc. Ca. (çiçek hst.) varlığı ortaya çıkıyor
mu?
UYGUNLUK YAKLAŞIMI: En basit açıklaması ile; -bağımlı değişken ya dasonuç olarak düşünülebilecek bir y özelliğinin var olması durumunda, bunun nedeni ya da bağımsız değişken - olarak düşünülen bir x olgusunun da var olup olmadığının
denetlenmesidir, anlaşılacağı gibi ayrım yaklaşımının tersi yönde bir süreçtir. Dolayısı
ile sonuçtan nedene süreci sorgulayan bir yaklaşımdır, “geriye yönelik” araştırma
tasarımları bu süreci uygular
Akc. Ca. ( çiçek hst. ) olan durumlarda (!!!) , sigara içimi (çiçek hst. Virüsü ) var mı ?
TORTU YAKLAŞIMI: Bir sonucu açıklamak için kurgulanmış ve ileri yönelik
olarak sorgulanmış - nedenden sonuca - bir düzen olmaksızın, elde bir seri "olası"
neden bulunduğunda uygulanabilir. Söz konusu listeden , sonucu etkileyemeyeceği
belirlenen olası nedenler elendiğinde - Sherlock Holmes : Zanlılar listesinden
bazılarının olay yerinde olamayacağı belirlendiğinde - kalan olası neden(ler) , kanıtlı
neden (!?) olarak düşünülebilir. Sonuçların güvenirliği açısından, bilimsel kabuller
çerçevesinde oldukça yetersiz olacağı ortadadır. Listede olmayan bir çok gerçek
neden bulunabilir, sonuçta "neden" olarak gösterilen değişkenin gerçek gücü çok
tartışmalı veya yetersiz olabilir. Belli düzeye kadar, çözümle-tanımlayıcı araştırma
süreci bu çerçevede düşünülebilr.
ANDIRIŞMA YAKLAŞIMI: Bir sonucu açıklamak için kurgulanmış konu
çerçevesinde herhangi bir olası neden öngörülmemiş ise, benzer bir sonuca neden
olduğu düşünülen nedenlerin benzerleri de yeni araştırmanın konu alanı içinde
sorgulanır. Bilimsel koşullar çerçevesinde çok yetersiz kalan ancak bir varsayımın
kurulması için sezgi üretmekte ipucu verebilecek bir yaklaşım olarak düşünülebilir.
BAĞINTI VARLIĞI SORGULAMASI: Bir değişkenin ölçümsel büyüklüğünün
başka bir değişkeninkindeki değişimlere uygun olarak farklılaştığını ortaya koymak
anlamınadır: kabaca Y= f(x) sonucunun
geçerliliğini ortaya koymak amaçlanır.
X' , Y'nin nedeni olmak zorunda değildir,
yaklaşım sadece bunların birbirlerine göre - daha sonraki aşamada, koşullar uygunsa
matematik modeli de açıklanabilecektir - büyüklük değişimi varlığını ortaya koyar.
UYUM VARLIĞI SORGULAMASI: Bir değişkenin ölçümsel büyüklüğünün
başka bir değişkeninkine eşdeğer olarak ortaya çıktığını ortaya koymak anlamınadır:
kabaca Y= x sonucunun geçerliliğini ortaya koymak amaçlanır. x'in gerçeği yansıtan
bir değer olup olmadığı sorgulanmaz yeter ki y buna eşdeğer büyüklük gösteriyor mu
sorgulanır. - Dr. Ahmet ve Dr. Mehmet 'in aynı hasta kümesi ile ilgili tanılarının
uyumu, her iki hekimin tanıları da birbirleri ile uyumlu ancak yanlış olabilir.
DOĞRUYA
UYGUNLUK
SORGULAMASI:
Bir
değişkenin
ölçümsel
büyüklüğünün gerçeği doğru yansıttığı kabul edilen başka bir değişkeninkine eşdeğer
olarak ortaya çıktığını
ortaya koymak anlamınadır. kabaca Y= x sonucunun,
x
"gerçek" büyüklük olmak üzere geçerliliğini ortaya koymak amaçlanır.
MATEMATİKSEL
BAĞINTI
MODELLEMESİ:
Bir
değişkenin
ölçümsel
büyüklüğünün başka bir değişkeninkindeki değişimlere uygun olarak farklılaştığının
ortaya konmasından sonra, araştırmanın ve değişkenlerin koşulları uygunsa bu
bağıntı için matematik modeli üretilmesi anlamınadır.
Son 4 değerlendirme, "Bağıntı" bölümünde ayrıntısı ile ele alınacak konulardır,
bu bölümde "nedensel" bağ kanıtlanması için kullanılabilecek olan temel tasarım
kalıpları ele alınacaktır.
Değerlendirilecek olan kalıplar "çift değişkenli" değerlendirme için geçerli olan
kalıplardır.
Yöntemlerin Güvenirlik ve Geçerliliği
Güvenirlik: Araçların kendi doğal performansını ele alır. Güvenilir bir araç
benzer koşullar altında aynı birimde birden çok uygulandığında tutarlı sonuçlar veren
araçtır. Güvenirliği etkileyen faktörler;
•
Aracın kendi doğal değişkenliği, Bir tartı aletinin değişen kalibrasyonu
•
Ölçülen maddedeki değişimler. Hastanın benzer soruya farklı cevap
vermesi
•
Gözlemci hatası.Tek bir gözlemci tekrarlanan ölçümlerde farklı sonuçlar
elde etmesi
•
Gözlemciler arası hata. Aynı kişide yapılan Kan basıncı ölçüm sonuçlarının
farklılığı
Geçerlilik: Bir ölçüm eğer ölçmek için önerildiği durumu gösterici nitelikte ise
geçerlidir.
1. Ateş, düşük sıtma taşıma düzeyli bölgelerde sıtma için geçerli bir gösterge
olmayabilir.
2. Çocuk sahibi olmama infertilitenin geçerli bir göstergesi olmayabilir.
Duyarlılık ve seçicilik geçerliliğin iki önemli bileşenidir.
Bir testin, bir yöntemin, bir ölçüm aracının duyarlılığı genelde gözlenen bir
ölçümde değişmenin ve ölçülen miktar veya etkenin değerine karşılık gelen
değişmenin bölünmesi sonucu elde edilen değerdir. Bölme sonucu elde edilen değer
büyüdükçe duyarlılık da artmaktadır. Epidemiyolojide duyarlılık bir test tarafından
doğru olarak saptanmış gerçek doğruların oranıdır. a/(a+c) ilişkisiyle elde
edilir.(Örnek aşağıdaki tablo)
Gerçek Görünüm
+
-
Toplam
Test
+
a
b
a+b
Sonuçları
-
c
d
c+d
a+c
b+d
Toplam
Seçicilik
epidemiyolojide
doğru
olarak
saptanan
gerçek
negatiflerin
(sağlamların) oranıdır. d(b+d) ilişkisi ile elde edilir (Bak yukarıdaki tablo)
Tarama testlerinde geçerliliğin diğer iki bileşeni pozitif ve negatif prediktif değerlerdir.
Burada pozitif prediktif değer yeni testin pozitif saptadıkları arasında gerçek pozitif
olma durumudur. a/(a+b) işlemi ile hesaplanmaktadır. Negatif prediktif değer ise
testin negatif olarak saptadıkları arasında gerçek negatiflerin oranıdır. d/(c+d) işlemi
ile hesaplanmaktadır.
Ölçüm ölçekleri:
Verileri ölçmek için kullanılan dört ana ölçek isim ölçeği, sıra ölçeği, aralık ölçeği ve
oran ölçeğidir.
Bir isim ölçeği veya sınıflandırıcı ölçek bir ölçümü diğerlerinden ayırmak için isimlerin,
markaların veya etiketlerin içinde verildiği ölçektir. Bu ölçekte ölçüm bireysel
ölçümlerin büyüklüğü konusunda herhangi bir kavram içermez.
1. Bir hastada hastalığın sonucu yaşamı sürdürme veya ölüm olarak ölçülebilir.
2. Birinci basamak sağlık bakımı için yükümlülüğün var olduğuna veya
olmadığına karar verilebilir,
3. Psikiyatrik hastalar psikotik, nevrotik, manik depresif veya şizofrenik olarak
sınıflandırılır.
Bir sıra veya sıralama ölçeği ölçümler arasında kesin bir sıra ilişkisiyle isim ölçeğinin
özelliklerine sahiptir.
BÖLÜM IV
VERİ ŞEKİLLERİ, ÖZETLEME ve SUNUM TEKNİKLERİ
Bir
araştırma
bireylerinden
yürütülürken
veri
bireylerden
toplamak
çok
veri
toplamanın
bireylerin
oluşturduğu
örnek
özellikteki
bireylerin
tümünün
(örnekleme
verilir.
üzerinde
ayrı
bir
durulan
hatta
zor
kısıtlılığı
bütün
olanaksızdır.
Tüm
karşısında
grubundan
veri
oluşturduğu
konu
topluluğun
başlığı
kısıtlı
toplanır.
topluluğa
altında
sayıda
Örneğe
giren
populasyon
ileriki
adı
bölümlerde
yer
alacaktır)
Örnek oluştuğu ana yığını temsil etmelidir.
Örnekleme Yaklaşımları
1.
Kolay
bireylerden
bir
örnek
örnekleme
Hedef
örnekleme;
oluşturulur.
yöntemi
Bu
olmakla
nüfusta
yöntem
birlikte
en
ucuz
uygun
ve
hedef
ve
az
nüfusu
erişilebilir
zaman
bire
tüketen
bir
temsil
etme özelliği yoktur.
2.
rasgele
Rasgele
örnekleme;
seçimle
olmaktadır.
tamamının
tanınmasını
Hedef
popülasyondan
Öncelikle
gerektirir.
örnekleme
hedef
Sıklıkla
hedef
popülasyonun
popülasyonu
temsil
eden bir örnekleme sağlar.
3.
Sistematik
örnekleme;
Hedef
popülasyon
tanınır
ve
hedef
popülasyonun her bir x inci kişisi örneğe seçilir.
4.
Tabakalı
bilinmesi
bu
arasından
örnek
örnekleme;
tip
kolay
grubu
örnekleme
örnekleme
oluşturulur.
Bu
Hedef
popülasyondakialt
için
önemlidir.
veya
rastgele
yöntemde
de
Alt
grupların
gruplardaki
örnekleme
her
alt
bireyler
metodu
grubu
ile
örnekte
temsil edildiğinden emin olunmalıdır.
değerlere
Popülasyondanhesaplanan
parametrelere
istatistik
adı
karşılık
verilir.
gelen
ve
Parametreler
istatistikler
ise
öğrencilerin
tamamının
oluşturduğu
μ
ile
sembolü
gösterilirken,
Latin
bu
örnekten
Grek
hesaplanan
parametre,
(Yunan)
harflerle
hesaplanan
harfi
gösterilir.
popülasyonun
öğrencilerden
oluşan
ile
değere
gösterilirken,
Bir
ağırlık
örnek
okuldaki
ortalaması
grubunda
(tahmin
hesaplanan
edilen)
ağırlık
ortalaması
mezun
araştırıcı
oldukları
Araştırıcı
mezun
ana
konu
öğrencileri
zamanda
sayıda
ve
lise
ile
oldukları
evreni
lise
soru
türünü
bir
formu
(anket)
saptaması
temsil
ucuza
elde
tümü
ilgili
araştırma
olan
örnek
istenen
genelleme
tasarlamaktadır.
öğrencilerin
Bu
çalışmada
üniversitesinin
grubundan
tüm
daha
kısa
ulaşılabilinecektir.
bilgiye
verilerle
öğrencilerin
oluşturarak
İstanbul
eden
edilecek
için
çizgi
okuyan
gerekmektedir.
(popülasyon)
onu
daha
Üniversitesinde
ile
bir
oluşturan
öğrenciden
öğrencilerin
türü
ilgili
yerine
ve
İstanbul
bir
şeklindedir)
bir Latin alfabesinden bir harfle gösterilir (
Bir
üzerinde
analizi
yapar.
Ana
yaparak
Belirli
yorumlar
populasyondan
elde
edilen örnekteki eleman sayısı bize örnek genişliğini vermektedir.
İstatistikte
“gözlem
“Kesikli
değeri”
Gözlem
örneğin
denir.
Değeri”
herhangi
Gözlem
bir
özelliğini
değeri
saymakla
ölçmekle
elde
edilmiş
ise
belirten
elde
rakama
edilmiş
“Sürekli
ise
Gözlem
Değeri” adını almaktadır.
Veri Tipleri;
Ölçüm ölçeğine göre;
1. Kalitatif : Binary (dikotom), ordinal ve nominal
2. Kantitatif : Sürekli ve Kesikli olabilir
Veri tipleri örneklendirilecek olursa
Kalitatif
Dikotom:, kadın veya erkek, çalışıyor veya çalışmıyor
Ordinal: sosyoekonomik düzey: Yüksek, orta ve düşük
Nominal:
resmi
ilişkisi
Medeni
olmadan
durum
(Evli,
birliktelik)
güney, doğu veya batı)
Kantitatif
Kesikli: Çocuk sayısı 1,2,3,4
bekar,
Yaşanan
dul,
boşanmış
bölge(merkez,
veya
kuzey,
Sürekli: Kan glikoz seviyesi 110 mg/dl veya 130 mg/dl
Verilerin Özetlenmesi:
Elde
sunulmak
edilen
Kategorik
istendiğinde;
verilerin
sıklık
21
öğrenciden
örneğin
sayıları
izole
özet
tablo
edilen
ile
parazitler
aşağıdaki gibi dağılmıştır.
Giardia lamblia
Entamoeba histolytica
Ascaris lumbricoides
Enterobius vermicularis
Ascaris lumbricoides
Enterobius vermicularis
Giardia lamblia
İzole
yorum
edilen
yapmak
Giardia lamblia
Entamoeba histolytica
Ascaris lumbricoides
Enterobius vermicularis
Ascaris lumbricoides
Enterobius vermicularis
Giardia lamblia
parazitler
oldukça
belirtilmiş
zordur.
Daha
Giardia lamblia
Entamoeba histolytica
Ascaris lumbricoides
Enterobius vermicularis
Ascaris lumbricoides
Enterobius vermicularis
Giardia lamblia
olmakla
kolay
beraber
bir
sunum
sıklıkları
şekli
sırayla bir tablo yapmaktır.
Giardia lamblia
Giardia lamblia
Giardia lamblia
Giardia lamblia
Giardia lamblia
Giardia lamblia
Ascaris lumbricoides
Ascaris lumbricoides
Ascaris lumbricoides
Ascaris lumbricoides
Ascaris lumbricoides
Ascaris lumbricoides
Enterobius vermicularis
Enterobius vermicularis
Sıklık dağılımını bir tablo halinde sunabiliriz.
Parazit
n
Giardia lamblia
6
Ascaris lumbricoides
6
Enterobius vermicularis
6
Entamoeba histolytica
3
Toplam
21
Enterobius vermicularis
Enterobius vermicularis
Enterobius vermicularis
Enterobius vermicularis
Entamoeba histolytica
Entamoeba histolytica
Entamoeba histolytica
ile
olan
Frekans
dağılımının
yüzde
değerlerini
de
aynı
tabloda
bu
durumda
sunmak daha anlaşılır ve yorumlanabilir sunum sağlar
Parazit
n
%
Giardia lamblia
6
28.57
Ascaris lumbricoides
6
28.57
Enterobius vermicularis
6
28.57
Entamoeba histolytica
3
14.29
Toplam
21
100.00
Bazı
durumlarda
kategori
sayısında
birleştirilebilir.
Bu
kategori
sayısı
azaltma
fazla
yapmak
yöntemde
en
olabilir,
amacı
sık
ile
kullanılan
kategoriler
başlık
“diğer”
başlığıdır.
Ölüm Nedeni
n
%
Kardiyovasküler hastalık
12,525
21.96
Kanser
10,321
18.10
Alt Solunum Yolları Enfeksiyonu
8,745
15.34
Diğer
25,435
44.60
Toplam
57,026
100.00
Kantitatif
1.
gösterilmek
Kantitatif
sayısı
verinin
istendiğinde
veriler
için
çalışmadaki
sınıf
sıklık
dağılımı
öncelikle
sayısı
eleman
hesaplanmaktadır. Bu formül
1 + 3.3log (n) şeklindedir.
5
ve
relatif
sınıflandırılması
–
sayısına
15
arasında
göre
frekansı
gerekmektedir.
değişmektedir.
Sturges
formülü
Sınıf
ile
2.
Frekans
belirlendikten
dağılım
sonra
tablosunda
yapılacak
kaç
ikinci
sınıfın
işlem
yer
sınıf
alacağı
genişliğinin
belirlenmesidir.
Yaklaşık
küçük
sınıf
gözlem
genişliği;
değerinin
en
büyük
çıkarılması
gözlem
ile
değerinden
elde
edilen
en
Değişim
Genişliğinin Sınıf sayısına bölünmesi ile elde edilir.
Örnek:
sayısının
En
10
büyük
değerin
olduğu
150,
durumda
en
küçük
sınıf
aralığı
değerin
50
ve
100/10
=10
sınıf
olarak
hesaplanacaktır.
3.
Üçüncü
aşamada
sınır
sınıfın
alt
ve
sınıfın
alt
değeri
değere
sınır
Sınıf
sınır
üst
değerleri
her
en
En
kolaylığı
küçüğü
olarak
üst
sınır
sınır
son
gerekir.
İşlem
sınıfın
belirlenirken
edilir.
belirlenmesi
belirtilir.
değerlerinin
eklenerek
dikkat
sınırların
değerleri
gözlem
aralığı
çakışmamasına
sınır
sınıfın
üst
olarak
seçilir.
değeri
değerlerin
Her
Bu
saptanır.
birbiri
sınır
ilk
değeri
ile
olarak
gözlem değerinin en büyüğü seçilir.
4.Her sınıf
üst
sınırlarının
için bir “Sınıf
tam
ortasında
Değeri” seçilir, bu değer sınıfın alt
olan
ve
sınıfın
tablosundaki
sınıflar
tamamını
temsil
ve
eden
değeridir.
5.
Frekans
örnekteki
gözlem
işaretleme
bittikten
dağılım
değerleri
sonra
her
uygun
sınıfta
belli
sınıflara
yer
alan
olduktan
işaretle
eleman
sonra
yerleştirilir,
sayısı
frekans
için
frekans
sayısı olarak belirtilir.
6.
Frekans
sayıları
belirlendikten
sonra
her
sınıf
atım
sayısı
yüzdesi hesaplanır.
100
arasında
sınıf
öğrencilik
bir
grubun
değişmektedir.
genişliği
yaklaşık
Sınıf
7
dakikada
sayısı
olmalıdır.
kalp
8
olarak
Buna
göre
olursak aşağıdaki frekans tablosunu elde ederiz.
48
hesaplandığına
tablomuzu
–
110
göre
oluşturacak
Sınıflar
Sınıf Değeri
İşaretle
Frekans
Frekans
(Rakamla)
48-54
51
IIIIIII
6
6,0
55-61
58
IIIIIIIII
9
9,0
62-68
65
IIIIIIIIIIIIII
14
14,0
69-75
72
IIIIIIIIIIIIIIIII
17
17,0
76-82
79
IIIIIIIIIIIIIIIII
17
17,0
83-89
86
IIIIIIIIIIIIIIIIIII
19
19,0
90-96
93
IIIIIIIIII
9
9,0
97-103
100
IIIII
5
5,0
104-110
107
IIII
4
4,0
100
100,0
Toplam
Kantitatif
yararlı
bir
%
verilerde
uygulama
yığışımlı
olup
(eklemeli)
herhangi
bir
frekansı
verinin
hesaplamak
sunumunun
aşamasıdır.
Sınıflar
Sınıf Değeri
Frekans
%
(Rakamla)
Yığışımlı
Frekans
48-54
51
6
6,0
6,0
55-61
58
9
9,0
15,0
62-68
65
14
14,0
29,0
69-75
72
17
17,0
46,0
76-82
79
17
17,0
63,0
83-89
86
19
19,0
82,0
90-96
93
9
9,0
91,0
97-103
100
5
5,0
96,0
104-110
107
4
4,0
100,0
100
100,0
Toplam
son
Açık Uçlu Frekans Dağılım Tablosu
Bazı
değerlerde
Bu
araştırmalarda
veya
durumda
her
verilerin
belli
ikisinde
tablo
bir
çok
ile
değerden
az
sayıda
sunumunda
tek
küçük
gözlem
taraflı
veya
büyük
değeri
olabilir.
veya
çift
taraflı
ucu açık sınıflar oluşturulabilir.
Yaş
Frekans
%
<5
52
13,20
5-9
132
33,50
10-14
131
33,25
>15
79
20,05
Toplam
394
100,00
Sürekli Gözlem Değerleri İçin Frekans Dağılım Tablosu
bir
Örneğin
kan
şeker
düzeyi
değeri
çalışmada
kan
şeker
düzeyi
80
ile
mg/dl
ilgili
1000
altında
30
kişiyi
kişi,
kapsayan
181
altında ise 15 kişi olduğu bir frekans tablosu sunacak olursak;
Kan Şekeri
Frekans
%
Yığışımlı Frekans
< 80
30
3,0
3,0
81-90
75
7,5
10,5
91-100
95
9,5
20,0
101-110
135
13,5
33,5
111-120
205
20,5
54,0
121-130
130
13,0
67,0
131-140
90
9,0
76,0
141-150
65
6,5
82,5
151-160
55
5,5
88,0
161-170
45
4,5
92,5
170-180
60
6,0
98,5
>181
15
1,5
100,0
Toplam
1000
100,0
mg/dl
Verilerin Grafiklerle Sunumu
Frekans
çizilebilir.
bu
dağılım
Frekans
verilerle
tablosu
kesik
tablosu
tablosu
düzenlendikten
sürekli
gözlem
“poligon”
veya
“histogram”
(tam)
gözlem
değerleri
değeri
sonra
için
çizilebilir.
için
grafikler
düzenlenmişse
Frekans
dağılım
düzenlenmişse
“Çubuk
diyagram” çizilir.
Poligon:
Frekans
eksen)
“sınıf
değerler”
mutlak
veya
oransal
poligonu
ve
(%)
“y”
çizilirken
eksenine
frekans
“x”
(dikey
konularak
eksenine
eksen)
grafik
her
çizilir.
ve B)
Kadınların sahip olduğu erkek çocuk sayısı
Kadın Sayısı
700
600
500
400
300
200
100
0
1
2
3
4
5
6
Erkek Çocuk Sayısı
7
8+
(yatay
sınıfa
ait
(Grafik
1A
Doğum ağırlığının birikimli sıklığı
Yeni Doğan
120
Birikimli Sıklık (%)
100
80
60
40
20
0
501- 1001- 1501- 2001- 2501- 3001- 3501- 4001- 4501- 5000+
Ağırlık
Frekans
tablosundaki
değerinden
çizilirken
poligonu
birinci
başlar
sınıftan
ve
en
önce
son
var
sınıftan
poligon
olduğu
sonra
frekans
varsayılan
var
dağılım
sınıfın
olduğu
kabul
sınıf
edilen
sınıfın sınıf değerinde biter.
Histogram
çizilirken
x
eksenine
gerçek
sınırlar
ve
y
her sınıfa ait frekanslar yerleştirilir. (Grafik 2)
Kadınların sahip olduğu erkek çocuk
sayısı
Kadın Sayısı
700
600
500
400
300
200
100
0
1
2
3
4
5
6
Erkek Çocuk Sayısı
7
8+
eksenine
Çubuk
eksenine
Çubuk
diyagram
sınıflar
diyagram
birleştirilmez.
y
tamsayılı
eksenine
çizildikten
Bunun
gözlem
ise
sonra
nedeni
değerleri
sınıflara
çubukların
tamsayılı
iki
ait
için
çizilir.
frekanslar
tepe
noktası
değer
bir
arasında
X
yerleştirilir.
çizgi
yer
ile
alan
başka bir değer bulunmamasıdır. (Grafik 3)
Gastrointestinal enfeksiyon
Sıklık
8
6
4
2
0
Cryptos.
Çember
(pasta
E.histolyt.
dilimi)
E.coli
grafik:
Giardia
Etken
Bu
grafikte
Rotavirus
bir
Shigella
bütünün
parçaları
pastanın dilimleri şeklinde gösterilir. (Grafik 4)
Bir toplumda kadının medeni durumuna göre dağılımı
Birlikte
Yaşayan
Dul
8%
8%
Boşanmış
11%
Bekar
28%
Evli
45%
Tablo ve grafik olarak veri sunumunda uygun kullanım
Tablolama Yöntemi
Veri durumu
Küçük
Tablolama Yöntemi
veri
kümesi,
örneğin Düzenli sıra
sayısı 20 den az
Sayısı
çok,
değişkeni
yalnız
içeren
bir Sıklık tablosu
bireysel
gözlemler
İki
veya
daha
çok
değişkeni Çapraz tablolama
içeren bireysel gözlemler
Tablo verilerine uygun grafik yöntemler
Tablo verileri
Sıklık
Grafik Yöntemi
tablosu,
değişken, tek veri kümesi
Sıklık
tablosu,
nicel Histogram
veya
poligonu
nicel Sıklık poligonu
değişken, iki veri kümesi
Sıklık tablosu, sınıflı veriler
Çubuk veya daire grafiği
sıklık
BÖLÜM V
TANITICI İSTATİSTİKLER I
GİRİŞ
İlgilenilen
konu
değişken
olsun
(kalitatif)
ölçümlenmiş
değerlendirilebilmesi
hesaplanması
ister
için
nicel
verilerin
bunların
ister
nitel
istatistiksel
olarak
düzenler
içinde
değerlere
tanıtıcı
belli
Bu
gerekmektedir.
(kantitatif)
hesaplanan
istatistikler adı verilmektedir.
Nicelve
ortaya
nitel
özellikler
konduklarından
oluşacaktır,
dolayısı
kavramsal
bunlara
ile
de
ilişkin
iki
ayrı
açıdan
farklı
ölçütlerde
tip
de
özellikte
ölçümlerle
farklılaşmalar
karşılaşılan
ölçütler
ayrı ayrı değerlendirilecektir.
NİCEL VERİLERİN DEĞERLENDİRİLMESİ
Ölçümlenmiş
durumlarda,
Her
bu
değerlerin
verilerin
ölçümsel
değer
gerçek
büyüklükleri
oluşturduğu
özel
yalın
diziye
ölçütlerin
ile
ele
(basit)
oluşturulmasına
alındığı
dizi
kendi
denir.
gerçek
büyüklüğü ile katılacaktır.
Bir
çalışmadaki
her
değerini
(Örneğin
105
Basıncı
değerlerini)
liste
olguya
ilişkin,
hastanızın
olarak
ilgilenilen
tümünün
vermek
değişkenin
bireysel
nicel
Sistolik
genellikle
Arter
olanaksız
ve
gereksizdir.
Veri
dizisini
bazı
sadeleştirilmiş
aktarımlarla
sunulabilecek
belli istatistiksel özetleyiciler her zaman bulunacaktır.
Belli
ile
aralıklarda
belirlenmiş,
başka
bulunan
bir
değerlere
deyişle
"aralıklı
sahip
ölçek"
öge
sayıları
(sıklık)
ile
ölçülmüş
veriler
"sınıflandırılmış" dizileri oluşturacaktır.
Bilgiişlem
yüksek
olanaklarının
yalın
verileri
dizi
yeterince
olarak
gelişmediği
değerlendirmek
yerine
dönemlerde
daha
rahat
ve
sınıf
hesaplama sağlayan bu yaklaşım öne çıkabilmiştir.
Günümüz
aralıklarının
koşullarında
özel
kullanılabilmektedir.
klinik
epidemiyolojik
anlamlar
araştırmalarda
taşıdığı
koşullarda
yine
Dizinin gerçek anlamda değerlendirilmesi için iki özgün kavrama ilişkin bilgileri
yansıtması gerekir. Bunlar dizinin özek (merkez) durumuna ilişkin ve dizinin
dağılımına ilişkin bilgilerdir.
İstatistiksel yargılama açısından temel önemde iki konuyu ortaya koymaktadır:
Özeksel (merkezi)değerler veri dizisinin özelliklerine göre en doğru “ortayı”
yansıtabilecek şekilde yapılandırılmalıdır aksi takdirde tamamen ilgisiz bir bilgi
yansıtması ve kullanımı yapılabilir.
Veri dizisinin dağılımının özel bir yapıda olması – veya olmaması – o dizi
üzerinde gerçekleştirilecek değerlendirmelerin doğru seçilmesi açısından çok
önemlidir; belli tip düzendeki dağılımlara göre kurgulanmış testler ancak buna uygun
dizileri yargılamada doğru sonuç verebilirler.
İstatistiksel kararlara varılabilmesi için zorunlu olarak (önkabulsel tarafları
bulunsa bile) belli özgün dağılım sınırlarına dayanılması gereklidir ancak
unutulmamalıdır ki bu özellikler belli dağılım tiplerine (örneğin “Normal” dağılım) uyan
veri dizileri için geçerli, güvenilir ve uygun testlerde kullanılabilecek sonuçlar üretirler
ve dağılımı belirsiz-düzensiz diziler için yanıltıcı olabilirler.
Özellikle bu açıdan, değerlendirilecek dizinin dağılım özellikleri başlangıçta
mutlaka incelenmeli değerlendirme ve yargılama işlemlerine bundan sonra, uygun
teknikler kullanılarak geçilmelidir.
Dağılım kavramından özetle anlaşılması gereken; belli bir kıstas–referans
ölçüte göre (örneğin ortalama) veya belli bir ölçek düzeniüzerinde, diziyi oluşturan
verilerin yer alma özellikleridir.
Merkezi Eğilim Ölçüleri (Ortalamalar)
Ortalamalar, merkezi eğilim ölçüleri olarak da adlandırılırlar. Gözlem
değerleri bir ortalama etrafında toplanma eğilimi gösterirler. Merkezi eğilim ölçüleri,
bir örnekteki bireyleri temsil eden tipik değerlerdir. Beş gruba ayrılırlar. Bunlar;
Aritmetik ortalama,
Ortanca değer (Medyan)
Tepe değer (Mod)
Geometrik ortalama,
Harmonik ortalamadır.
Tek başına “ortalama” denirse bu aritmetik ortalama anlamına gelmektedir.
Aritmetik ortalama
Toplum için µ ile simgelenen aritmetik ortalama istatistiksel değerlendirmede
kullanılan en önemli ölçütlerdendir. Aritmetik ortalama xidizisinde yer alan n sayıdaki
verinin toplamının n sayısına bölünmesi ile elde edilen değerdir. Formülü aşağıda yer
almaktadır.
Örnek : xidizisini ağırlıkları(40, 48.5, 60, 54.6, 79.4, 92.5, 80, 65 kg) şeklinde
olan 8 (n) kişi oluşturmaktadır. Bunların aritmetik ortalaması
(40+48.5+60+54.6+79.4+92.5+80+65 kg) =520
Dizide 8 eleman olduğuna göre 520/8 = 65 kg olarak hesaplanır.
Frekans Dağılım Tablosundan Aritmetik Ortalamanın Hesaplanması
Eğer herhangi bir frekans dağılım tablosunda verilerin frekansları (sıklıkları)
farklı ise aritmetik ortalamanın hesaplanmasında sıklıkları dikkate alınmalıdır. Örnek;
xi
6
8
10
12
14
16
fi
2
1
4
4
1
3
Şeklinde olan dağılımda aritmetik ortalama
((2x6)+(1x8)+(4x10)+(4x12)+(1x14)+(3x16))/(2+1+4+4+1+3)
= 12+8+40+48+14+48/14
= 125.42 şeklinde hesaplanacaktır.
Aritmetik Ortalamanın Özellikleri
Bir örnekteki gözlem değerlerinin örnek ortalamasından farkları alınır
ve toplanırsa bu sapmaların toplamı sıfır olarak bulunur. Örnek
10
(10-23)
-13
12
(12-23)
-11
24
(24-23)
1
36
(36-23)
13
40
(40-23)
17
16
(16-23)
-7
138/6= 23
0
Bir örnekteki gözlem değerlerinin hepsine bir A sabiti eklenecek olursa elde
edilen değerin ortalaması A sabiti eklenmeden önceki ortalamadan A sabiti kadar
fazla olacaktır.
10
+8
18
12
+8
20
24
+8
32
36
+8
44
40
+8
48
16
+8
24
138/6= 23
186/6=31
186/6=31
31-23 = 8
Bir
çıkarılacak
örnekteki
olursa
gözlem
elde
değerinin
edilen
hepsinden
değerin
çıkarılmadan öncekinden A sabiti kadar eksik olacaktır.
10
-8
2
12
-8
4
24
-8
16
36
-8
28
40
-8
32
16
-8
8
138/6= 23
90/6=15
23-15=8
bir
ortalaması
A
sabiti
A
sabiti
Bir
çarpılırsa
örnekteki
elde
değerlerinin
gözlem
edilen
değerin
ortalaması
hepsi
A
bir
sabiti
A
ile
sabiti
ile
çarpılmadan
öncekinden A sabiti katı kadardır.
10
X8
80
12
X8
96
24
X8
192
36
X8
288
40
X8
320
16
X8
128
138/6= 23
1104/6=184
23x8=184
Bir
bölünecek
örnekteki
olursa
gözlem
elde
değerlerinin
edilen
değerlerin
hepsi
ortalaması
bölünmeden önceki ortalamanın A sabitine bölümüne eşittir.
10
/8
1.25
12
/8
1.5
24
/8
3
36
/8
4.5
40
/8
5
16
/8
2
138/6= 23
17.25/6=2.875
23/8=2.875
bir
A
sabiti
ile
A
sabiti
ile
BÖLÜM VI
TANITICI İSTATİSTİKLER II
Ortanca (Medyan) Değer
Örnekten elde edilen gözlem değerleri büyüklüklerine göre sıralandığında
ortada yer alan gözlem değeri ortanca (medyan) değeridir. Tüm gözlem değerlerinin
yarısı bu değerden küçük ve diğer yarısı ise büyüktür. Eğer üzerinde çalışılan
örnekteki eleman (n) sayısı tek sayıda ise ortanca değer (n+1)/2 ci gözlem değeridir.
Gözlemdeki eleman (n) sayısı çift ise ortanca değer n/2 ci değer ile (n/2+1)ci değerin
ortalamasıdır.
Örnek: 17 kişilik bir grupta ölçüm değerleri aşağıdaki gibidir.
7-21-18-8-4-12-20-8-5-10-4-8-15-20-12-4-27 Bu ölçüm değerlerini sıraya
koyacak olursak
4-4-4-5-7-8-8-8-10-12-12-15-18-20-20-21-27 şeklinde sıralama elde ederiz.
Seride tek sayıda eleman olduğundan ortanca 17+1/2 yani 9.cu eleman olan 10
sayısıdır. 10’dan küçük ve 10’dan büyük 8’er eleman yer almaktadır.
Örnek 16 kişilik bir grupta ölçüm değerleri aşağıdaki gibidir.
7-21-18-8-4-12-20-5-10-4-8-15-20-6-4-27 Bu ölçüm değerlerini sıraya dizecek
olursak;
4-4-4-5-6-7-8-8-10-12-15-18-20-20-21-27
16/2 + (16/2+1) değerleri bulunur. Yani 8 ve 9.cu değerlerin toplamı alınır.
8 değer 8 ve 9 cu değer 10 dur. Bu durumda ortanca (8+10)/2 = 9 olarak
hesaplanır.
Ortanca Değerlerin Kullanıldığı Durumlar
Üzerinde çalışılan örnekte gözlem değerlerinde büyük çarpıklık varsa aritmetik
ortalama yerine ortanca değer kullanılır. Aritmetik ortalama uç değerlerden
etkilenmektedir.
Örnek bir bölgede bulunan 6 marketin günlük satış miktarları 450,475,5900,
320,520,610 olduğunu varsayarsak aritmetik ortalama 1.379,16 olarak hesaplanır. Bu
değer aritmetik ortalamanın 5900 den etkilenmesinden ortaya çıkmıştır. Buna karşılık
ortanca hesaplanacak olursa; 320-450-475-520-910-5900 dizisinden 497.5 olarak
hesaplanır ve oldukça gerçekçi bir değerdir.
Bazı araştırmalarda tek veya çift taraflı ucu açık frekans dağılımları olabilir. Bu
durumda aritmetik ortalama hesaplanamaz ve ortanca değer kullanılır.
Tepe (Mod) değeri :
Bir örnekte frekansı en yüksek yani en çok tekrarlanan gözlem değer tepe
(mod) değeridir. Bazı serilerde en fazla tekrarlayan değer iki farklı değer olabilir, bu
durumda örnek bimodal yani iki tepelidir.
Örnek; 4,5,6,7,8,8,8,8,4,4,6,7,8,4,4,2,7,6 şeklinde bir örnekte 4 ve 8 5 er kez
tekrar edilmişlerdir. Mod 4 ve 8’dir.
Aritmetik Ortalama, Ortanca ve Tepe Değeri arasındaki ilişki:
Örnekten elde edilen gözlem değerlerinin dağılımı ile yakın ilişkilidir. Dağılım
simetrik ise her üç ortalama ayni değere sahiptir. Dağılım sola yatık bir dağılım ise en
küçük aritmetik ortalama en büyük tepe değeri olacaktır. Dağılım sağ tarafa yatık bir
dağılım ise en büyük aritmetik ortalama, en küçük tepe değeri olacaktır. Dağılımdan
en fazla etkilenen aritmetik ortalama olduğundan dağılımın simetriden uzaklaşması
durumunda aritmetik ortalama yerine ortanca değerin kullanılması daha güvenilir bir
tanıtıcı istatistik olacaktır.
Geometrik Ortalama;
Bu dizideki veriler, doğal özellikleri nedeni ile aritmetik veya geometrik dizi
biçiminde farklılaşan değerler gösteriyorlarsa (bakteri sayısı gibi) veya dağılımının
belirsiz olduğuna ilişkin saptamalar varsa, bu diziye ilişkin ortalamayı geometrik
ortalama ile yansıtmak daha bilgilendirici olacaktır. Logaritmik dönüşüm kullanılan
değerlendirmelerde geometrik ortalama özellikle bilgilendiricidir.
Harmonik Ortalama:
Harmonik ortalama verilerin terslerinin ortalamasının tersidir. 3 araba aynı
mesafeyi farklı hızlarda kat etmektedirler. Bu durumda ortalama hız
3/((1/h1)+(1/h2)+(1/h3)) şeklinde hesaplanacaktır.
DEĞİŞİM ÖLÇÜLERİ
Bir araştırıcı verilerini topladığı zaman bunlar arasında bir farklılık olduğunu
görecektir. Bu farklılık varyasyondur. Bir örnekte elde edilen gözlem değerlerinin
arasındaki farklılığın sayısal olarak ifadesi için kullanılan istatistikler değişim (dağılım)
ölçüleri adını almaktadır.
Bunlar;
•
R : Dağılım aralığı,
•
SD , SD2: (Standart sapma , varyans) ,
•
SE :Standart hata ,
•
CV : (DK ; Değişim katsayısı),
•
Yüzdelikler (Persentiller),
•
Güven Aralıkları (ConfidenceIntervals : CI ,%xx Güven aralığı)
Dağılım alanı (R, Range, Dağılım aralığı)
Kabaca, verilerin arasında değiştiği alt ve üst sınırların belirtilmesi yani en
küçük
(minimum)
ve
en
büyük
(maksimum)
ölçümsel
değerlerin
gösterilmesidir.
Örnek: 8 kişiye ilişkin sistolik kan basıncı değerleri :
110, 125, 160, 210, 105, 135, 140, 125 mmHg
R: 105 - 210 mmHgdir.
Varyans (Değişim) ve standart sapma (Standart deviation)
Ölçümsel veri dizilerinde kullanılan en önemli dağılım ölçütüdür ve hem
tanımlayıcı
hem
çözümleyici
amaçlarla
kullanılır.
Standart
sapma
varyansınkare köküdür ve örnek gruplarında standart sapma SD, varyans
SD2ile, toplum değerlerinde σ ve σ2 ile simgelenirler. Formülü ;
biçimindedir
Örnek: 8 kişinin ağırlıkları şöyledir; 50, 55, 58, 60, 64, 70, 71, 76 kg Aritmetik
ortalama 504/8=63
Toplam
xi
xi-
(xi- )2
xi2
50
-13
169
2500
55
-8
64
3025
58
-5
25
3364
60
-3
6
3600
64
1
1
4096
70
7
49
4900
71
8
64
5041
76
13
169
5776
550
32302
504
SD =
550
= 8.86
7
Standart Sapma
Yaygın olarak kullanılan bir diğer değişim ölçüsü “standart sapma”dır. Varyansınkare
köküne eşittir. Standart sapma popülasyondan hesaplanıyorsa parametredir ve σ ile
gösterilir. Örnekten hesaplanıyorsa istatistiktir ve SD harfi ile gösterilir.
Standart Hata (SE :StandartError)
Belli bir konuda, o konunun gözlenebileceği tüm olguları elde etmek nerede
ise olanaksızdır. Ancak kısıtlı sayıda olgudan oluşan bir örneklem kümesinden elde
edilen bilgilerden, o konunun toplumsal değerine ilişkin kestirimler yapmak - eğer
koşullar uygunsa- olasıdır. SE ‘ de bir örnekleme ortalamasına dayanarak gerçek
toplum ortalamasının hangi düzeyde, hangi sınırlar arasında (ve hangi güvenilirlik
düzeyi ile) bulunabileceğinin ipucunu üretir.
biçiminde hesaplanır. Paydadaki “n” değeri veri sayısından
etkilenmez.
Standart sapması hesaplanmış örneğin
SE = 8.86 = 3.1324 kg’dır.
√8
Varyans (Değişim) Katsayısı
Yüzde olarak standart sapmanın ortalamaya oranıdır ve veri dizisinin
dağılımına ilişkin ipucu oluşturabilir.Varyans katsayısı hesaplanarak standart
sapma üzerinde ortalamanın etkisi ortadan kaldırılmış olur.
Değişim Katsayısının % 5’den küçük olması dar dağılım alanlı,düzenli bir
dizinin belirtisidir. % 30’dan küçük olması durumunda ise büyük olasılıkla “normal
dağılan” bir dizi düzeni bulunmaktadır.
Yüzdelikler (Persentiller)
Yüzdelikler rastgele bir değerin, dizi içindeki veriler toplamının hangi yüzde payı için
ayrım noktası olduğunu belirlerler. (Verilerin %35 i “x” değerinin altındadır, %43 ü “y”
değerinin üzerindedir... gibi).
Bazı yüzdelik değerler özel isim alırlar;
Desil, onluk payları belirler 3. desil, 30. persentildir
Kartil,yirmibeşlik payları belirler 1. kartil, 25. persentildir ve "Q1" olarak, 75. persentil
yani 3. kartil "Q3" olarak simgelenir.
Medyan, 50. persentil, 5. desil, 2. kartil değeridir (Q2).
Persentillerin hesaplanması için farklı yaklaşımlar kullanılabilmektedir.
En basiti küçükten büyüğe sıralanmış veri düzeninde, toplam veri sayısına göre
istenen yüzdelik sıradaki
- veya en yakın tam sayıdaki – gerçek değerin
kullanılmasıdır: 1,2,3,5,9,10,11,12,20,40 dizisinde (N=10) ,
40. yüzdelik 0.4 * 10 = 4. sıradaki değer olarak (5) belirlenebilir
Özelikle büyüme gelişme ile ilgili değişimlerin değerlendirildiği ve toplumun hangi
düzeylerinin hangi değerin altında – üstünde – bulunduğunun sorgulandığı konularda
– pediatri gibi – yüzdelikler önemli kullanıma sahiptir.
GüvenAralıkları "%xx GA" - (Confidence Intervals : CI ,%xx)
İstatistik, bir özelliğin ölçümünü genellikle tüm toplumu ölçerek veremez.
Ancak belli denek sayısı ile ölçümleri yapmak ve bunlara dayanılarak genelde toplum
değerlerini kestirebilmek söz konusudur. Bir örnek grubundan elde edilmiş
değerlerden yola çıkarak topluma ait değerlerin içinde bulunacağı sınırları kestirmeye
"aralık kestirimi" denir. Bu kestirimsel değerlerin doğru-güvenilir olması çerçevesinde
de belli beklentiler önerilebilir ve kestirimler bu “güven derecesine” göre yapılır
“Normal dağılımlı" bir özellikte, örneklemden elde edilmiş bir ortalamaya ve
standart sapmaya dayanarak, toplumun gerçek ortalamasının % 95 güvenleolasılıkla, ± 2 SE sınırları arasında bulunacağı söylenebilir.
Ör.: 172 ± 8 cm , n= 49  %95 Güven alt sınır ≈ 172 –2 (8 / √49)= 169.7 cm ,
üst sınır : 174.3 . Bu örneklem verilerine göre toplumun boy ortalaması %95 güvenle
- doğrulukla - 169.7 - 174.3 arasında bulunacaktır.
BÖLÜM VII
İSTATİSTİK DAĞILIMLAR I
Olasılık
kuramsal
değerlendirmeleri,
veya
gerçek-sayım
kestirimsel
(tahmin)
tabanlı
olabilir.
(sıklık)
Olasılıklara
,
dayalı
kestirimler de gerçek verilere ve/veya kuramlara dayanılarak yapılır.
Bir
“A”
biçiminde
aralıkta
olayının
gösterilir.
bulunan
–
çıkma
-
0
1
sınır
;
“p”
bir
ortaya
reel
ile
sayıdır.
olasılığı

P(A)
değerlerini
de
Olanaksız-imkansız
,
p(A)
içine
alan
olayın
olasılığı
tanım
yapmayı
0 ve mutlak bir olayın olasılığı 1 olur
Kısa
ve
öngörürsek,
uygun
nesnel,
olasılık
tüm
:
medikal
alanlara
(sorgulanan)
seçenekler
içinde,
uygun
özel
bu
bir
bir
özel
duruma
durumun,
(altseçeneğe)
gerçek
olarak
ortaya çıkma sıklığının matematiksel düzeyidir.
Bu
olgunun
çerçevede
bulunması;
“N”
olguluk
Sıklık,
bir
Hız,
toplumda,
Toplamdaki
“n”
pay,
özel
durumlu
Olgular
toplamı
payı, prevalans , insidans , olasılık , adlarını da alabilir.
•
Eğer
seçeneklerin
dizi
içinde
tekrarlanabilirliği
söz
konusu
ise:
“n”
ayrı
tekrarlayan
öge
tipinden
ögeler
her
bulundurabilen
biri
nr
“r”
tane
dizi
öge
içeren
yapılabilir.
ve
Örneğin
kendini
5
tip
harfin kullanılabileceği 3 er harflik 5³=125 dizi olanaklıdır.
n”
farklı
ögeden
“r”
tanesi
kullanılarak
önem taşıdığı dizi sayısı Permütasyonile hesaplanır
yapılacak
ve
dizilişin
“n”
farklı
önem
ögeden
“r”
tanesi
dizi
taşımadığı
kullanılarak
sayısı
yapılacak
ve
dizilişin
Kombinasyonilehesaplanır:
nCr
biçiminde de gösterebiliriz
Farklı
vs
tip
değişkenler
farklı
-
olasılıkları
düzenlerde
konunun
çerçevesinde
–
içerik
engelleyen,
bileşik
basit,
ve
–
özelliğine
–
göre
engellemeyen,
olayların
2
ortaya
biçimde
çıkma
değerlendirilir
:
•
Basit olasılık
•
Olasılık dağılımları
Basit
kuramı
Olasılık:
olmayan,
belli
salt
bir
anlık
dağılım
duruma
oranlarına
özgü,
dayalı
özel
bir
iç
dağılım
değerlendirmedir.
Genellikle yargılama yapmaz.
Herhangi
bir
A
olayının
belirmesi
olasılığı:
p(A)
biçiminde
gösterilir.
A
her
olayının
ögenin,
belirmesi
bireyin
A
ya
olasılığının
uygun
araştırıldığı
olması
gerekmez.
toplumda
Buna
mutlaka
bağlı
olarak
sayısı
oranı
klasik olasılık tanımında:
p(A)
kullanılır.
=
A
‘
ya
uygun
ögeler
sayısı
/
Tüm
ögeler
•
OLASILIK DAĞILIMLARI
Bir
olasılık
göre
dağılımı,
olasılık
ilişkin
bir
düzeyini
belirleyen
değerlerin-durumların
çerçevesinde,
belli
“istatistiksel”
rassal
olayın
nesnel
dağılımı,
önkabulsel
ölçütlere”
ortaya
dizgeli
belli
değerlere
çıkabildiği
modeldir.
Bir
matematiksel
veya
bu
değerlere
özelliğe
fonksiyonlar
özelliğe
ilişkin
değerlendirilip
–parametre-göre
olasılık
düzeyleri kestirilebiliyorsa “Olasılık dağılımları” söz konusudur.
•
Olasılık dağılımları, ilgili değişkenin yapısına göre:
•
- Kesikli olasılık dağılımları
•
- Sürekli – kesiksiz olasılık dağılımları
olarak temelde ikiye ayrılır.
•
Olasılık
yoğunluk
fonksiyonu
(probabilitydensityfunction
:
PDF)
değerli
Gerçek
arasında
olasılık
bir
olmak
değeri
fonksiyonunun
X
rastgele
açısından
f(x)
X=a
gösterebileceği
integralinin
ve
değişkeninin
X=b
P(a
iki
olasılıklar
<
değerleri
belli
X
arasında
<=
sayısal
değer
toplamıdır.
Yani
b),
f(x)
entegrasyonu
olasılık
ile
elde
edilir
Öneri
iki
durumun
sayı
çok
olasılığı
<x<188,000001).Bu
yakın
olduğunda
soruluyormuş
özel
durum
sanki
konumu
sadece
belli
bir
oluşur.
sürekli
tek
sayının-
P(187,999999
değişkenler
için
(
ör.:
AKŞ = 104 olması) değil , nitelikler için de geçerlidir (ör.: 5 çocuktan
1 inin erkek olması).
•
Birikimli
dağılım
fonksiyonu
(cumulativedistributionfunction:
CDF)
Gerçek
değerinin
değerli
altında
bir
–
X
veya
rastgele
üzerinde
değişkeninin,
-
bir
düzeyde
alabileceği
olma
bir
x
olasılığıdır.
Atılan bir zarda 4 den küçük bir sayı gelmesi zarın 1 veya 2 veya 3
gelme olasılıklarının toplamına eşit olacaktır
Aynı
şekilde
mg/dL
‘nin
toplumda
AKŞ
üzerindeki
toplamıdır.
Anlaşılacağı
>
100
her
AKŞ
üzere
x
mg/dL
olma
değerinin
olasılığı,
taşınma
seçenekler
100
olasılıklarının
ekseninde,
x’in
son
seçeneği için birikimli olasılık “1” e erişir
KESİKLİ (NİTEL) DEĞİŞKEN OLASILIK DAĞILIMLARI
Belli
belli
görülme
özel
sıklığı
olan
topluluklarda,
bir
–
veya
daha
öngörülen
fazla
sayıda
olayın,
–
olguda
sayısı
rastlanması
olasılığını hesaplayan istatistiksel kuramlardır.
Bu
ve
çerçevede,
görülme
konu
olayın
sıklığının
bulunmaktadır.
En
çift
seçenekli
düzeyine
önemli
kesikli
–
göre
dikotom
farklı
dağılımlar
olan
olmasına
–
dağılım
Binom
tipleri
ve
Poisson
dağılımlarıdır.
•
BİNOM DAĞILIMI ve ÖZELLİKLERİ
Binom
en
olasılık
önemli
dağılımına
dağılımı,
olanıdır.
“Binom
kesikli
olasılık
Binomialrastsal
olasılık
dağılımı”
dağılımı
değişkene
denir
ve
konuları
(X)
sıklığı
%5
arasında
ait
olasılık
den
büyük
(P>0.05) olaylar, özellikler için kullanılması uygundur.
Binom Dağılım:
Binom
konusudur.
çıkan
Gerçek
olası
durumdur.
ele
dağılmış
alınan
dağılımdan
iki
ise
özelliğin
söz
durulan
halin
olasılığı
n<1
bilinmediği
yaşamda
sonuç
Diğeri
popülasyonda
tanedir.
edilir.
dir.
zaman
birçok
fazla
Binom
π
Üzerinde
örnekten
ile
biri
beklenmeyen
hali
söz
dağılımda
durulmayan
tahmin
edilir.
ve
konusu
ise
popülasyonda
durulan
olasılığı
Bu
ise
durumda
söz
ortaya
beklenen
durumdur.
Üzerinde
halin
hali
denemede
istenilen
ve
gösterilir.
iki
konumda,
Bunlardan
istenmeyen
ikiden
özelliği
da
değişkenlerin
Eğer
multinomial
üzerinde
özelliğin
1-πdir.
Π
üzerinde
durulan
olayın
olasılığı
p,
diğer
durumun
olasılığı
ise
(1-p)
veya
yerine kullanılan q harfidir.
Örnek:
Doğan
bebeklerin
olasılığı
vardır.
Yani
olasılığı
π-0.5
olduğuna
çocuğun
kız
veya
π
0.5’
eşittir.
göre
erkek
cinsiyeti
Bu
durumda
2
çocuklu
0.5’dir.
olması
kız
olasılığı
0.25
veya
erkek
olma
diğer
cinsiyetin
olma
ailelerde
dir.
ise
Birinci
her
iki
çocuğun
kız
veya erkek olma olasılığı yine 0.25 dir. Toplam her zaman 1’e eşittir.
Her
edilme
bir
binom
şansı
denemede
sabittir
başarı
ve
her
olasılığı
bir
P
binom
(veya
π)
deneme
’nin
elde
birbirinden
bağımsızdır.
Bu çerçevede çözülecek bir soru şu şekilde karşımıza çıkmaktadır :
•
Görülme
içinden
sıklığı
“r”
“P”
olan
tanesinde
bir
(r
<=
olaya,
n)
rastgele
rastlanması
“n”
olgu
olasılığı
p(r)
nedir ?
•
Bu sorunun çözümü şu formülle gerçekleştirilir:
Binom
(r)
dir.
dağılımda
Burada
üzerinde
faktöryel
işareti
durulan
(!)
bir
halin
r
kez
sayının
olma
kendinden
olasılığı
küçük
P
(“0”
hariç) çarpılacağını göstermektedir.
Örnek 4! = 4*3*2*1= 24
İstenen Olayın Oluş Olasılığının Hesaplanması
Yapılan
bir
araştırmada
öğrencilerin
%
25
kullandığı saptanmıştır. Rasgele seçilecek dört öğrenciden
a- 4 ününde sigara kullanmama olasılığı
b- 4 öğrenciden 3 ünün sigara kullanmama olasılığı
inin
sigara
c- 4 öğrenciden ikisinin sigara kullanmama olasılığı
d- 4 öğrenciden birinin sigara kullanmama olasılığı
e- 4 öğrenciden dördününde sigara kullanma olasılığı
Örneğimizde
sigara
içmeme
olasılığı
(istenen
durum)
¾,
sigara içme olasılığı (istenmeyen durum) ¼ (1 – ¾) şeklindedir.
Seçilen 4 öğrencinin dördününde sigara kullanmama olasılığı
P(4)= C(4,4)(3/4)4 (1/4)4-4 = 4!/(4 – 4)! 4!(3/4)4 (1/4)4-4 =
(3/4)4 = 81/256 = 0.316
Seçilen 4 öğrenciden üçünün sigara içmeme olasılığı
0.422
Seçilen 4 öğrenciden ikisinin sigara içmeme olasılığı
0.211
Seçilen 4 öğrenciden birinin sigara içmeme olasılığı
0.047
Seçilen 4 öğrencinin dördününde sigara içme olasılığı
0.004
(81/256)+(108/256)+(54/256)+(12/256)+(1/256)= 1.0
0316+0.422+0.211+0.047+0.004 = 1.0
Örnek
•
Örnek:
Tedavide
başarı
şansı
P=
0.8
(
hastalığa tutulan 7 kişiden;
•
Hiçbirinde Başarılı olunmaması ( Başarılı = 0) olasılığı :
%
80)
olan
bir
Bu
sonuçlara
göre
değerlendirmeler”
“yargısal
çerçevesinde gözlemlememiz gereken durumlar şunlardır :
Bu
denemede,
başarılı
başarı
4
beklentisi
olgudan
olunması
gözükmektedir
açısından
tüm
ile
daha
(Tedavide
başarı
azında
0
bilimsel
(
olabilirlik
,
şansı
1,
2,
ve
sınırları
uygulayıcının
beklenen
“normal”
bulunmadığını
yansıtmaktadır.

%
80
beklenirken
0.8)
3
gösterme
Diğer
başarı
7
(p<0.05)
başarıyı
%100
,
seçenekleri)
dışında
ve
olgularda:7/7
P=
–
taraftan
bulunması
özel / sıra dışı / normalin ötesinde gözükmeyecektir p=0.2097
Anlaşılacağı
belli
sıklıklar
sonuçların
da
gibi
Binom
beklentisi
başlangıç
yansıtmaktadırlar.
değerlendirmesinin
çerçevesine,
beklentisi
“Normal”
,
özel
“p”
koşullarda
sonuçları,
elde
edilen
düzeyinde
sayılıp
sayılamayacağını
“beklentiye
uymaz”
sonuçlar
iki uçta bulunan seçeneklerde de gözlenebilir.
bazen
Bazen
de
çıkabilecektir.
sadece
Aşağıdaki
bir
örnekte
yöndeki
de
sadece
seçeneklerde
fazla
ortaya
görülme
açısından
“beklenti dışı“ seçenekler ortaya çıkmaktadır.
Binom Dağılımının Şekli
Binom
dağılımının
şekli
“n”
ve
“π”
ye
bağlıdır.
Deneme
sayısı
ne olursa olsun π = ½ şeklinde dağılımın şekli simetriktir. İstenen tip
ve
istenmeyen
dağılımın
şekli
(çarpıktır).
Eğer
tarafa
çarpıktır.
tip
olaylarının
değerlerden
π>
½
ise
Çarpıklık
oluş
büyük
dağılım
olasılığı
olanın
sol tarafa,
durumunda
“n”
farklı
olduğu
zaman
tarafına
doğru
yatıktır
π<
sayısının
½
ise
dağılım
artması
sağ
dağılımın
simetriye yaklaşmasını sağlamaktadır.
Binom
fazlasına
eşittir.
dağılımında
Bunun
sınıf
nedeni
olma olasılığının bulunmasıdır.
sayısı
istenen
deneme
olayın
hiç
sayısından
olmama
yani
bir
sıfır
Poisson Dağılımı
Poisson
dağılımdır.
dağılım
Bu
Binom
dağılım
az
dağılıma
rastlanan
benzer
ancak
belirli
olarak
(sabit)
kesikli
bir
olasılıkla
meydana gelen olayların dağılımıdır.
•
Belirli
bir
nüfus
içinde
110
yaşına
kadar
yaşayan
insanların
sayısı,
•
Belirli bir günde yanlış düşen telefon numaralarının sayısı,
•
Bir günde başlayan savaş sayısı,
•
Bir
sigortası
hayat
tarafından
sigortalanan
belirli
sayıda
bir
günde
insandan belirli zaman aralığında ölenlerin sayısı,
•
Çok
az
satılan
bir
maldan
bir
dükkanda
satılanların sayısı,
•
Bir kitaptaki yazım hatalarının sayısı,
•
Çok
sayıda
birimden
oluşan
ambalajlanmış
mallardaki
bozuk olanların sayısı gibi.
Binom
istenen
Poisson
olayın
dağılımda
olayın
oluş
dağılım
belirli
“n”
deneme
olasılığının
fonksiyonu
bir
çok
sayısının
çok
küçük
olması
kullanılır.
Çünkü
oluş
olasılığının
sayıda
büyümesi
bu
ve
“π”
durumlarında
da
durumda
Binom
istenen
fonksiyonu
kullanılarak hesaplanması zorlaşır.
Olayların Oluş Olasılıklarının Hesaplanması
Poisson
dağılımının
fonksiyonu
Fransız
matematikçisi
Poisson tarafından bulunan eşitliğe göre belirlenmektedir.
P( r ) = (µr /r!) e- μ
Formülde
olayın
“μ”
meydana
dağılımın
geliş
ortalaması,
sayısı,
“e“
yaklaşık
2.718’dir.
Araştırıcı
görülme
olasılığını
hesapladıktan
“r”
doğal
istenen
sonra
olayın
nadir
olarak
logaritma
herhangi
aşağıda
tabanı
görülen
olup
bir
sayıda
gösterildiği
şekilde
olayın birbirini izleyen sayıda görülme olasılıklarını hesaplayabilir.
P( 0 ) = (µ0 /0!) e- μ= e- μ
P ( 1 ) = (µ1 /1!) e- μ= μ P (0)
P( n ) = (µn /n!) e- μ= (μ/n) P (n-1)
Örnek:
Bir
hayat
sigortalamış
kazadan
sigortası
olsun.
ölme
bir
Bir
yılda
olasılığı
0.001
yılda
5000
sigortalanmış
olarak
kişiyi
kazalara
karşı
kişilerden
herhangi
birinin
bilindiğine
göre
bir
yıl
boyunca
4 kişinin kazadan ölme olasılığı nedir.
Bu
durumda
5000
ortalama
*
0.001
=
5
4
kişinin
kazada
ölme olasılığı
P (4) = (54 /4!) e- 5= 54 (2.718)-5/24 = 0.1745
Örnek:
Poisson
doğma
100
dağılım
olasılığı
kişilik
bir
sınıfta
göstermektedir.
1/365
tir.
Bu
1Ocak
tarihinde
Herhangi
dağılımın
bir
doğanların
kişinin
ortalaması
1
100/365
sayısı
Ocakta
=
0.2740
olduğuna göre 3 kişinin 1 Ocakta doğmuş olma olasılığı nedir.
P(3)=
(0.27403/3!)
e
-0.2740=
0.02057(0.76035)/6
=
0.002606
olarak bulunur.
Poisson Dağılımının Parametresi ve Dağılım Şekli
Poissondağılımında
ortalama
ve
varyans
birbirine
eşittir.
Aşağıdaki şekilde hesaplanır
μ = σ2 = n.π
Eşitlikte n birey sayısı π ise olayın oluş olasılığıdır.
Poisson
yaklaşmaktadır.
dağılımın
şekli
ortalaması
büyüdükçe
simetriye
Normal Dağılım :
Normal
sürekli
bir
değişkenin
dağılım
Binom
ve
dağılımdır.
Normal
dağılım,
düzeni
kullanılmaktadır.
Gauss
olarak
tipi
için
geçerlidir
Normal
dağılım
dağılım,
veya
isimlendirilen,
ve
dahil
dağılımlarının
doğada,
uygulanmalı
aynı
şeklinden
–
tıp
Poisson
pek
dolayı
pek
–
çok
çok
istatistikte
Gauss
zamanda
aksine
kabaca
sürekli
de
çok
dağılımı,
Çan
alanda/bilimde
eğrisi
pratik
uygulaması olan, sürekli bir olasılık dağılım(lar) tipidir.
Bu
Konum
dağılım
gösteren
tipleri
ortalama
iki
(μ,
parametreyle
aritmetik
varyans (σ2,SD2, "değişim/saçınım") dır.
tam
ortalama)
olarak
ve
tanımlanabilir:
ölçek
gösteren
Bu
formülde
yer
alan
“e”
sabiti
2.718’e,
π
sabiti
kg
(μ
ise
3.1416’ya
eşittir.
Örneğin
standart
sapması
popülasyonda
olasılığı
öğrencilerin
5
(
ağırlık
σ
öğrencilerin
hesaplanmak
=
ortalaması
5)
olan
ağırlıklarının
istendiğinde
65
60
normal
–
yukarıdaki
=
dağılım
69
kg
formül
60
kg)
ve
gösteren
bir
arasında
olma
kullanılarak
%
(yüzde) sonuç elde edilecektir.
Normal
tip
göre
olarak
dağılım
ortaya
fonksiyonunun
çıkmaz,
Basıklık-Yaygınlık
özellikle
(kurtosis)
görüntüsü
standart
ve
veriler
sadece
sapmanın
belli
bir
büyüklüğüne
saçınımının
bozukluğuna göre Çarpıklık (skewness) özellikleri de ortaya çıkar.
tek
simetri
BÖLÜM VIII
İSTATİSTİK DAĞILIMLAR II
Normal Dağılımın Özellikleri
1. Normal dağılım çan eğrisi şeklindedir.
2.
Normal
dağılım
ortalama
etrafında
simetriktir.
Ortalama,
tepe değeri ve ortanca değer aynıdır.
3.
Yoğunluk
standartsapma
ve
μ+σ
eğrisinin
önce
ve
üzerinde,
sonraki
noktalarında)
noktalar
bir
ortalamadan
arasında
''enfleksyon/
birer
(yani
μ
-
σ
bükülme''
noktası
olasılıkları
toplamı
bulunur,
4.
Yoğunluk
olarak
eğrisinin
%
100’e
ortalamadan
küçük
altı,
yani
“1”
olma
tüm
e
ve
seçenek
eşittir,
büyük
dolayısı
olma
ile
kuramsal
olasılıkları
%
olarak
50
şer
yani 0.5’dir.
5.
Kuramsal
olarak
yoğunluk
eğrisinin
-ω
ile
arasında
+ω
uzandığı düşünülebilirse de uygulamada söz konusu değildir.
6.
Normal
standart
sapma
formülden
değerin
de
dağılım,
ile
bir
ortalamayı
anlaşılacağı
ortalamaya
matematiksel
fonksiyon
parametre
üzere
uzaklığının
bir
olarak
rastgele
standart
olduğu
için
kullandığı
değerin
için,
olasılığı
sapmanın
ve
bu
kaç
katı
sapma
katları
olduğuna göre belirlenmektedir.
7.
Ortalamanın
biçiminde
etrafında,
belirlenebilen
bakışımlı
alanlar
ve
standart
her
normal
dağılım
için
eşdeğerdir.
Standardize Normal Dağılım
Parametreleri
değerlerinden
farklı
normal
dağılımları
ortalamaları
çıkarılıp
standart
standardize edilebilir.
oluşturan
sapmalara
gözlem
bölünerek
Bu
normal
durumda
dağılımlar
değerlere
ortalaması
ve
ortalamamaları
dönüştürülmüş
olur.
standart
ve
Z
standart
normal
dağılımın
ortalaması
“1”dir.
dağılım
ortalama
etrafında
farklı
olan
aynı
olan
sapmaları
dağılımı
standardize
Bu
sapmaları
da
“0”
olarak
tanımlanan
ve
standart
sapması
simetriktir.
Ortalama
ile
+Z
arasında olma olasılığı ortalama –Z arasında olma olasılığına eşittir.
Normal Dağılımda Standart Sınırlar
Normal
bulunma
dağılım
olasılığı
olan
bu
%
çerçevede
95
i
µ±
“Normal
1.96
x
sınırlar”
σ
değerleri
olarak
kabul
arasında
eder
ve
bunu dışındaki % 5 lik kısım iki uca , %2.5 ar lık paylarla “anormal”
düşükler ve “anormal yüksekler” olarak pay edilir.
Bu
mantıkla
toplumda,150.4
87
12
±
172
cm’den
mg/dL
AKŞ
±
11
kısa
cm
boy
olanlar
belirlenmiş
uzunluğu
“istatistiksel
bir
sağlıklı
ile
belirlenmiş
anormal
toplumda
bir
kısa”
veya
110.5’in
üzeri
“istatistiksel anormal yüksek” olarak değerlendirilecektir.
Örnek 1
Bu
olanların
değerinden
dağılım
oranı
1
çerçevesinde
nedir
standart
diye
Z
değeri
hesaplanmak
sapma
sağa
0
ile
1.0
istendiğinde
ve
sola
değerleri
arasında
ortalamadan
(çift
yönlü)
(0)
olan
mesafede
toplamın
%
mesafede
popülasyonda
%
68.26’sı
34.13
olarak
herhangi
bir
yer
almakta
olduğundan
hesaplanacaktır.
Z
değerinin
0
tek
Standart
ile
1
yönlü
normal
arasında
olma
arasında
olma
olasılığı % 34.13 tür.
Örnek 2
Normal
olasılığı
2
bir
nedir
standart
aldığından
diye
sağa
tek
popülasyonda
Z
hesaplanmak
ve
taraflı
sola
olan
hesaplamada
değerinin
0
ile
istendiğinde
0
mesafede
2
ortalama
toplamın
bunun
yarısı
tüm
Z
önce
0
olan
değerinden
%
%
95.44
yer
47.72’si
yer
yüzde
ne
almaktadır.
Örnek 3
Standart
normal
dağılımda
değerlerinin
kadarı 0.5 ile 2 arasındadır.
Bu
yüzdeyi
hesaplamak
için
–
2
mesafesi
arasındaki
% değer alınır. Bu değer % 47.72 dir. Daha sonra 0 – 0.5 arasındaki
mesafe
bulunur.
Tablo
%
A
47.72
değerinden
den
%
bakıldığında
19.15
(0.2857) 0.5 – 2 arasında kalan değerdir.
bunun
çıkarıldığında
da
geri
%
19.15
kalan
%
olduğu
28.57
STUDENT “t” DAĞILIMI
Standardize Normal dağılımın katsayıları, sonsuz veya çok yüksek sayıda
(örneğin N>300) olgu içeren durumlar İçin geçerli sayılabilir ayrıca gözlemlendiği
üzere tekil bir rassal durum için: x (başka bir örneklem veya toplumun kendi özgün
özet istatistiksel özelliklerine göre değil) sorgulanır.
Olgu sayısı kısıtlandığı zaman aynı olasılık sınırlarını belirleyen katsayı değerleri
değişir. Bu şekilde farklı örneklemlerin düzeylerinin yargılanması da olanaklı olur.
Çeşitli seçenek “olgu sayıları” için
belli olasılık, düzeylerini belirleyen katsayılar,
Gosset (takma adı “Student”) tarafından belirlenmiş ve tablolaştırılmıştır. Olasılık
kuramı ve istatistik bilim dallarında t-dağılımı veya Student's t dağılımı olarak geçen
bu dağılım, genel olarak örneklem sayısı veya sayıları küçük ise ama konu
değişkenin
normal dağılım gösterdiği varsayılırsa kestirimsel-çıkartımsal istatistik
uygulamaları için kullanılan bir sürekli olasılık dağılımıdır.
t-dağılımının
ortaya
çıkarılması ilk
defa
1908’de
Dublin’de
Guinness
Bira
Fabrikasında çalışan Kimyacı ve matematikçi William SealyGosset’ in kısıtlı
örneklemlerle doğru kararlar verebilme çabasının bir sonucudur. Bulgularını
yayınlarken zorunlu olarak kullandığı takma ada (Student) dayanarak dağılım bu adı
taşımaktadır.
Normal dağılım gösterdiğine emin olunan bir sürekli örneklem verisi için ortalama
değer ve standart sapması bulunuyorsa, t-dağılımını kullanarak bulunan ortalama için
güvenlik sınırları yahut daha önce kuramsal olarak önerilmiş bir değerin, bu sınırların
arasında bulunup bulunmadığı araştırılabilir. Bu yaklaşım Student's t-testlerinin de
temelidir. İki normal dağılımdan alınan örneklemlerin ortalamalarının farkı da normal
dağılım gösterdiği için, bu farkın sıfıra eşit olduğuna ilişkin bir sonuç çıkarmak da bu
çerçevede kullanılabilir.
Varsayım değerlendirmesi bölümünde göreceğimiz gibi Student’s t testlerinin sonucu
( z ye benzer kavramda) “t” olarak adlandırılan bir değerle sonuçlanmaktadır. Bu tip
testlerin kullanımına uygun araştırmaların -sonsuz olmayan- olgu sayılarına doğrudan
bağlı bir “serbestlik derecesi” kavramı bulunmaktadır (sd)
ve her “sd” için belli
olasılık düzeylerine karşılık gelen kuramsal “t” değerleri bulunur. Bu tip “kritik
değerlerin” simgesel gösterimi, ilgili serbestlik derecesi ve karşılık geldiği Tip-1 hata
olasılık düzeyi (α) yansıtılarak – çift yönlü/kuyruklu değerlendirme ile - verilir:
t(sd, α) = … örneğin t (11 , 0.05) = 2,201
, t ( 30 , 0.02) =2,457
gibi.
Aşağıdaki örnek tablo parçasında görüleceği gibi sonsuz serbestlik derecesi için olan
katsayılar z değerlerince belirlenen alanlara da bir yönden karşılık gelmektedir. t
tablosu için üstteki olasılık değeri açıklamaları farklı olan çeşitlemeler de bulunur
ancak aslında hepsi aynı anlamsal düzeyi kastederler.
Görüldüğü gibi olabilecek her sonuçsal t değeri için doğrudan bir p değeri
bulunmamakta, yorumlamanın belli kritik p sınırlarından küçük –veya büyük –
olmasına olanak veren bir kullanım ortaya çıkmaktadır. Bir araştırma sonucu olarak
bulunan “t” değerini yorumlamak için, o araştırmanın serbestlik derecesine karşılık
gelen satırda, bulunmuş olan bu “t” değerinin, kritik değerler olarak verilmiş “t”
değerlerine göre nerede bulunduğu saptanır. Örneğin en sağ kolondakinden bile
büyükse (p=0.001 düzeyi),araştırmanın sonuçsal p değeri ;”p<0.001’”dir. Buna
karşılık çift kuyruk olasılıklarına göre 0.05 kolonundaki değerlerden daha küçükse
(p=0.05 düzeyi) , p>0.05 kararı ortaya çıkar. Ara kritik değerlerden ise en son hangisi
aşılabildi ise onun p düzey karşılığının altında kalındığı yorumu ile bitirilir.
Örnekler:
sd= 12,
t = 4.89
 p<0.001
sd= 38,
t = 2.95
 p<0.01
sd= 50,
t = 1.36
 p>0.05
Güncel yazılımlar sonuç “p” değerlerini gerçek düzeyleri ile verir dolayısı ile tablo
kullanımına artık pek gerek kalmamıştır. – Sonuçlar tablolara bakarak olduğu gibi “<“
, “>” düzeyleri ile de verilmez. Son yaklaşımlar ,“p” değerlerinin gereğinde yayınlarda
da gerçek düzeyleri ile verilerek uzman okuyucuya da özellikle anlamlılık sınırına
yakın sonuçlarda klinik yorum olanağı tanınması yönündedir..
BÖLÜM IX
HİPOTEZ KONTROLLERİ
Bütün
edilen
bilim
dallarında
örneklerden
bilinmeyen
yapılan
yararlanarak
parametreleri
araştırmaların
üzerinde
hakkında
amacı
çalışılan
sonuç
elde
popülasyonun
çıkarmaktır.
Sonuç
çıkarma iki şekilde yapılabilir;
1. Popülasyonu temsil edecek parametrelerin tahmini,
2. Popülasyon parametreleri ile ilgili hipotezlerin test edilmesi
Nedensellik
yöntemlerden
“farklı”
bağıntısının
biri
"neden
bulunduğunu
etkenin
etken"in
gösterebilmek
bulunmadığı
bulunduklarından,
ortaya
var
temel
durumlarda
"sonuç'un
olduğu
düzenidir.
olguların
ilgilenilen
konmasındaki
konu
Başka
bir
deyişle,
genel
düzeyi,
etkenin
değişkenin
düzeyi
açısından
"farklı" ise, etken farkının sonucu oluşturabileceği düşünülür.
Bu
veya
bağı
reddedilir.
ortaya
Bu
koymak
karara
üzere
kurulan
varabilmek
için
hipotez
bir
dizi
ya
kabul
edilir
istatistik
işlem
kontrol
olup
uygulanır. Bunlar;
1. Hipotezin kurulması
2.
Yapılacak
kontrolün
çift
veya
tek
taraflı
olmadığının kararı,
3. Test istatistiğinin seçilmesi
4. I. tip hata olasılığının belirlenmesi
5.
Gerekirse
belirlenmesi
testin
gücünün
hesaplanması
ve
güç
eğrilerinin
1. HİPOTEZ:
Hipotez
kontrolünün
birinci
aşaması
araştırıcının
hipotezi
kurmasıdır. Hipotez kontrolünde iki tip hipotez bulunmaktadır.
1. Kontrol Hipotezi: H0
2. Karşıt Hipotez: H1
Kurulan
hipotezler
varsayılan
dağılımın
bir
veya
daha
fazla
parametresini kapsayabilir.
Kurulan
hipotez”
hipotez
birden
fazla
sadece
bir
parametreyi
parametreyi
kapsarsa
kapsarsa
“bileşik
“basit
hipotez”
adını
alır.
Test
ve
karşıt
hipotezin
basit
ve
bileşik
olmasına
göre
hipotez
aşağıdaki sıralanabilir.
1. Basit bir hipotez basit bir karşıt hipoteze karşı test edilir.
H0 : μ = a
H1 : μ = b
2. Basit bir hipotezin bileşik bir hipoteze karşı test edilir.
H0 : μ = a
H1 : μ ≠ a
3. Bileşik bir hipotezin bileşik bir hipotezle test edilmesi
H0 : μ ≥ a
H1 : μ < a
Üç ayrı örnekle basit ve bileşik hipotez açıklanacak olursa;
1.
Bir
mühendis
bir
araba
lastiğinin
ömrünün
en
az
60000km
olup olmadığı,
2.
Bir
ziraatçı
yeni
geliştirilen
diğer bir gübreye göre artırıp artırmadığı,
bir
gübrenin
buğday
rekoltesini
3.
Bir
doktor
bir
yeni
ilacın
herhangi
bir
hastalığı
iyileştirme
oranının % 90 olup olmadığını araştırmak istemektedir.
Burada kontrol hipotezlerinde oluşturulması gerekmektedir.
1.
Hipotez
bileşik
hipotezdir.
hipotezde
Karşıt
bileşik
hipotezdir
H0 : ᶿ ≥ 60000
H1:ᶿ < 60000
2.
Hipotez
basit
hipotezdir
ancak
karşıt
hipotez
bileşik
hipotezdir
H0 : μ = a
H1 : μ ≠ a
3. Hipotez basit hipotezdir. Karşıt hipotezde basit hipotezdir
H0 : π = 90
H1 : π = 60
2. Test İstatistiği
Hipotezler
belirlemesi
söz
sonra
Hipotez
kontrolü
gerekir.
konusu
edilecek
bu
kurulduktan
populasyondan
örnekleme
sonuca
göre
örnekten
ayni
dağılımına
karar
araştırıcının
dahil
vermektir.
test
hesaplanan
genişlikteki
olma
Test
istatistiğini
örneklerden
olasılığını
istatistiği
istatistiğin
elde
hesaplamak
örnekten
elde
ve
edilen
verilerin bir fonksiyonudur.
Örnek:
Bir
araştırıcı
tedavisinde
diğer
sürmektedir.
Bu
hastalığı
hasta
ayırarak
taşıyan
seçer.
yeni
bir
ilaçtan
bir
daha
hipotezin
sınanması
hastalardan
tamamen
Daha
gruplardan
üretilen
sonra
birini
bu
yeni
ilacın
etkili
ilacı
konusu
olarak
tesadüfi
hastalığın
hipotezini
söz
tesadüfi
(A)
bir
olduğu
için
hastaları
üretilen
spesifik
ile
spesifik
belirli
olarak
öne
iki
tedavi
sayıda
gruba
ederken
diğer grubu
eskiden
beri kullanılan
hastalığın
süre
sonunda
kan
özelliğine
ait
(B) ilacı
iyileşme
analizleri
ile
göstergesi
yaparak
tedavi
olarak
eder.
kabul
verilerini
Belirli
edilen
toplar.
bir
bir
Gözlediği
verilere dayanarak;
Hastalığın
H0:
ilaç
arasında
iyileşmesine
fark
yoktur.
etki
bakımından
gözlenen
fark
yeni
tesadüften
ilaç
ileri
ile
eski
gelmektedir
hipotezini,
H1:
hastalığın
tedavisine
etkisi
bakımından
yeni
ilaç
eski
ortalamalar
arası
farka
ilaçtan daha etkilidir, hipotezine karşı kontrol edilecektir.
Burada
ait
kontrol
örnekleme”
farkının
elde
hipotezi
dağılımıdır.
hipotezle
edilecek
ile
belirlenen
Ve
örnekten
belirlenen
“ortalamalar
“
elde
populasyondan
arası
farka
edilen
ortalamalar
çekilen
ait
örneklerden
örnekleme”
dağılımına
dahil olma olasılığını hesaplamak gerekir.
Test
örnekleme
hipotezi
geçerli
dağılımının
populasyonvaryansı
hesaplanan
olduğunda
ortalaması
biliniyorsa)
farkın
µD =
0
Z-
örnekleme
ortalamalar
ve
arası
standart
değeri
farka
sapması
kullanılarak
dağılımına
dahil
ait
(eğer
örnekten
olma
olasılığı
hesaplanarak hangi hipotezin kabul edileceğine karar verilir.
3. I. Ve II. Tip Hatalar:
Hipotez
kontrollerinde
kontrol
hipotezi
karşıt
hipoteze
karşı
test edilerek karar verildiği zaman iki tip hata söz konusudur.
Yapılan
kontrol
sonucunda
doğru
olan
kontrol
hipotezi
H0 ret
edildiği zaman yapılan hata I. Tip hatadır. Yani doğru olan bir kontrol
hipotezi
için
ret
kararı
verildiği
zaman
I.tip
hata
yapılmış
olur.
I.
Tip
hata yapma olasılığı α simgesi ile gösterilir.
II.
durumlarda
tip
hata
kontrol
ise
karşıt
hipotezinin
olasılığı β simgesi ile gösterilir.
hipotezin
kabulü
ile
H1 gerçekte
yapılan
hatadır.
doğru
II.
olduğu
Tip
hata
Hipotez
kontrollerinde
verilecek
kararların
isabetli
veya
hatalı
olması α ve β olasılıklarına bağlıdır.
VARSAYIM KABUL/ RED” BÖLGELERİ
Bir
varsayımı
yöntemine/
sıfır
testine
varsayımı
yargılama
“test
ile
için
istatistiği”
seçenek
kullanılan
adı
varsayım
verilir.
değerlendirme
Bu
çerçevesinde
değerlendirme
verilerin
nesnel,
sayısal tabanlı olarak uygun değerlendirilmesidir.
Sıfır
varsayımının,
alternatif
varsayım
lehine
“reddedileceği”
olasılıksal koşula “red bölgesi” adı verilir.
Eğer
söz
konusu
istatistiğin
değeri
“kabul
bölgesi”
nedahilise
bu durumda “ Kontrol Hipotezi reddedilememiştir” denir.
Gerçek Durum
Verilen Karar
H0 Hipotezi kabul
H0 Hipotezi ret
H0 doğru
İsabetli Karar (1 – α )
Hatalı karar (α)
H1 doğru
Hatalı Karar β
İsabetli karar (1-β)
Geçerli
karar
kontrol
verilmiş
sonucunda
olasılığı
kabul
(1
–
hipotezinin
demektir.
edilmesi
β)
kabulü
Geçerli
ile
dır.
de
Bu
ile
(1
H1
isabetli
ihtimalle
–α
)
olasılık
hipotezin
karar
verilmiş
“testin
Gücü
ile
isabetli
yapılan
olur
(veya
kontrol
ki
bunun
Hipotez
Kontrolunun gücü)” denir.
α ve β
hata
yol
olasılığının
açmaktadır.
arasında ters ilişki vardır. α değerinin küçülmesi I. Tip
azalmasına
Araştırıcı
olasılığını
belirlemelidir.
anlamlılık
sınırı
zarar
verecek
karşın
hipotez
Biyolojide
“p<0.05”
maddelerde
dir.
II
ve
insan
H0: İlaç öldürücü bir etkiye sahip değildir
olasılığının
başlarken
medikal
küçülmelidir.
hipotezini
H1: İlaç öldürücü etkiye sahiptir,
hata
kontrolüne
Ancak,
α
tip
I.
alanlarda
sağlığına
Örneğin
artmasına
Tip
hata
önkabulsel
ve
hayatına
bir
araştırıcı
Şeklinde kurmuş ise α = 0.00001 gibi çok küçük olmalıdır.
4. Çift ve Tek Taraflı Kontroller
Hipotez
kontrolleri
çift
veya
tek
taraflı
olarak
yapılabilir.
istatistiğinin
sadece
Yapılacak kontrolü araştırıcının kuracağı karşıt hipotez belirler.
Araştırıcı,
örnekleme
örnekten
dağılımına
sadece
dahil
örnekleme
önemli
ise
için,
küçük
tarafa
olması
ile
dağılımının
durumda
bu
Bunun
hesapladığı
başka
ortalamasından
yapılması
örnekleme
örnekten
ilgileniyorsa,
gereken
dağılımının
hesaplanan
sapıp
çift
veya
değişle
sapmadığı
taraflı
ortalamasından
değer
bir
kontroldür.
büyük
daha
fazla
veya
sapanların
ihtimali bulunur.
H0:
kabul
Söz
konusu
edilebilir.
ilacın
hastalığı
Gözlenen0.69
oranı
iyileştirme
ile
oranı
0.75
0.75
olarak
arasındaki
fark
tesadüfen ileri gelmektedir.
Kontrol Hipotezi;
H1: Aynı ilacın iyileştirme oranı 0.75 değildir yanı π≠ 0.75 dir.
Burada
araştırıcının
ilgilendiği
söz
konusu
ilacın
etki
oranının
0.75 olarak kabul edilip edilmeyeceğidir.
Eğer
belirlemiş
araştırıcı
ise
ortalamadan
küçük
ortalamadan
büyük
olasılığına
karşı
1.
bu
Tip
hata
olasılığın
değerlerin
değerlerin
ret
kontrolünde belirlemiş olur.
ve
olasılığını
yarısını
bulunduğu
bulunduğu
kabul
da
α=
0.05
örnekleme
tarafa,
tarafa
bölgelerini
diğer
alır
çift
ve
olarak
dağılımında
yarısını
I.
taraflı
Tip
ise
hata
hipotez
Bazı durumlarda araştırıcı sadece örnekten hesaplanan istatistiğin örnekleme
dağılımının ortalamasından küçük (veya büyük) tarafa sapması ile ilgilenebilir. Bu
durumda tek taraflı hipotez kontrolü yapılır. Tek taraflı hipotez kontrolünde örnekleme
dağılımın ortalamasından küçük (veya büyük) tarafa örnekten hesaplanan istatistik
kadar ve daha fazla sapanların olasılığı hesaplanır. Bu durumda I. Tip hata olasılığı
için dağılımın hangi tarafı ile ilgileniliyorsa o tara alınır. Örneğin doktor söz konusu
ilacın tedavi oranının 0.75 den daha az olduğunu kontrol etmek istiyorsa;
H0: İlacın hastalığı iyileştirme oranı 0.75 olarak kabul edilerek, gözlenen 0.69
ile 0.75 arasındaki fark tesadüften ileri gelmektedir hipotezine karşı kontrol hipotezi;
H1: İlacın hastalığı iyileştirme olasılığı 0.75 ten düşüktür hipotezine karşı test
eder. Bu durumda ortalamadan sol tarafta 0.69 ve daha küçük oranların bu dağılıma
dahil olma ihtimalini hesaplar.
Hipotezler
kurulduktan
ve
test
istatistiği
hesaplandıktan
sonra
eğer
hesaplanan test istatistiğine göre örnekten hesaplanan istatistiğin söz konusu
dağılma olasılığı kararlaştırılan I. Tip hata olasılığından büyük ise yani H0 kabul
bölgesine H0 hipotezi reddedilemedi denir. Aksi durumda kontrol hipotezi reddedilerek
karşıt hipotez kabul edilir.
5. Testin Gücü
Yapılan hipotez kontrolünün gücü daha önce de belirtildiği üzere (1 – β) dır. Β
olasılığının küçülmesi ile yapılan hipotez kontrolünün gücü artar.
Bir vitamin karmasında 25 mg B1 bulunması gerektiği belirtilmiştir. Üretim
aşamasında değişik aralıklarla yapılan kontrollerden beher drajede bulunan B1
vitamini miktarına ait standart sapmanın 1.2 mg olduğu bilinmektedir Bu verilere göre
µ= 25 mg
δ = 1.2 mg
Drajelerdeki B1 vitamini miktarının normal dağıldığı bilinmektedir.
Söz konusu fabrikanın ürettiği vitamin karmalarından rastgele 16 ambalaj
alınsa ve bunların her birinden rastgele alınan drajeler test edilse
bu 16 adet
drajelerde B1 ortalaması 25 mg ve standart sapması 1.2/√16 = 0.3 olacak şekilde bir
normal dağılım gösterir. Yapılacak bir hipotez testinde test ve karşıt hipotez
aşağıdaki gibi olsun:
H0 = 25 mg
H1 = µx< 25 mg
Eğer birinci tip hata olasılığı α = 0.05 olarak belirlenmişse herhangi bir örnek
ortalamasına ait test değeri Z = - 1.645 den daha küçük ise test hipotezi
reddedilecektir.
-1.645 =
𝑥𝑥−25
0.3
bağıntısından X =24.5065 olarak bulunur Hesaplanan değer 25
mg daha küçük olduğu için her drajede ortalama 25 mg B1 vitamini olduğu hipotezi
reddedilmiş olacaktır.
Gerçekte ortalama 25 mg B1 vitamini bulunduğu halde bu
partinin yanlış
olarak reddedilme olasılığı (1. Tip hata olasılığı) α = 0 0.05 tir. Geçekte ortalama B1
vitamini 25 mg dan düşük olduğu halde µ= 25 mg hipotezinin kabul edilme olasılığı
(II.tip hata olasılığı) nedir. Karşıt hipotez 25 mg dan düşük olduğu yönündedir. Karşıt
hipotez için 24.1 değeri alınırsa II. Tip hata olasılığı β hesaplanabilir. Bu durumda
Z = 24.5065 – 24.1/0.3 = 1.355 yaklaşık 1.36
Z tablosundaki 0 ile 1.36 arasındaki Z’lerin oranının 0.4131 olduğu bulunur. Bu
değerden büyük Z’lerin oranı 0.5 – 0.4131 = 0.0869’dur. Geçekte B1 vitamini
ortalaması 24.1 iken 25 mg olarak saptama olasılığı % 8.69’dur. Testin gücünün
hesaplanması ise 1 – 0.0869= 0.9131 dir. Yani α = 0.05 ve karşıt hipotezde µ= 24.1
ise karşıt hipotezin doğru verme olasılığı %91.31 ‘dir.
BÖLÜM X
REGRESYON ve KORELASYON
Birçok durumda araştırıcı üzerinde çalıştığı örnekte birdenfazla özelliğe ait veri
toplayabilir. Bu gibi durumlarda sadece örneği tanıtıcı istatistiklerini hesaplamak ve
bilmek araştırıcı tarafından yeterli bulunmayabilir. Eldeki veriler kullanılarak iki özellik
arasında bir ilişki olup olmadığı değişkenlerden birinin bir birim artmasına karşılık
diğer değişkenlerde nasıl bir değişiklik oluştuğunu araştırabilir.
Nedensellik bağıntı tiplerinden biri olarak “birlikte değişim bağı”, pek çok tıp
araştırmasında, klinik uygulamada ve biyolojik özellikte karşımıza çıkar:
Fizyolojik bir ölçütün, biyokimyasal bir özellikle bağıntısı, bir ilaca verilen
yanıtın o ilacın dozuna olan bağının modeli, bir halk sağlığı ölçütünün özgün bir
sağlık hizmeti sonucu ile ilgisi, vs gibi sorgulamaların hepsinin yanıtında birlikte
değişimin varlığı ve gereğinde modellenmesi yatmaktadır.
Biyoistatistiksel açıdan iki değişkenin – veya veri setinin – böylesi özgün
değişim birliktelikleri, değişim uyumu içinde olması “bağıntı” , “bağımlılık” adını alır.
İstatistiksel açıdan böylesi bağıntıların varlığına Korelasyon denir ve bunu
belirlemek için farklı değişken ve düzen tipleri için farklı yöntemler bulunmaktadır.
Bağıntı varlığının kanıtı için bu ilk aşama saptandı ise ve değişkenlerin özellikleri de
uygunsa, bağıntının matematiksel modeli yapılandırılarak fonksiyonun katsayıları
belirlenir ve bir Regresyon denklemi kurgulanır.
Bir örnekten birden fazla özelliğe ait veri toplandığı zaman hesaplanması
gereken istatistikler korelasyon ve regresyon katsayılarıdır.
Değişkenlerden biri diğerini etkileyen etkenlerden biri olabilir, bu duruma
neden – sonuç ilişkisi denir.
Korelasyon Katsayısı
Bir örnekten iki özelliğe ait toplanan verilerin koordinat sisteminde noktalar
halinde gösterilmesi araştırıcıya iki özellik hakkında bir ön bilgi verecektir.
Eğer veriler koordinat ekseninde yukarıdaki şeklin üst tarafında yer alan iki
grafiğe benzer bir dağılım gösteriyorsa iki özellik arasındaki ilişkinin derecesini
belirten korelasyon katsayısı ( r ) 0 veya 0’a çok yakın bir değerdedir. Bu durumda iki
özellik arasında doğrusal bir ilişkiden söz edilemez.
İki özelliğe ait veriler koordinat ekseninde yukarıda verilen şeklin alt tarafında
kalan iki grafiğe benzer bir dağılım gösteriyorsa bir doğru üzerinde sıralanabilir olarak
kabul edilmektedir. Bu iki özellik arasında tam bir ilişki olduğu anlamına gelmektedir.
Yani her bir X değerine karşılık gelen bir Y değeri vardır.
İki özelliğe ait veriler arasında tam bir ilişki bulunmayabilir. İki özellik arasında
tam olmayan pozitif ilişkide korelasyon katsayısı 0 ile + 1 arasındadır. Bunun tersi de
olasıdır. İki özellik arasında tam olmayan negatif bir ilişki söz konusu olabilir bu
durumda korelasyon katsayısı -1 ile 0 arasındadır.
2
değişken
arasındaki
doğrusal
korelasyonun
en
önemli
ölçütü
Pearsonkorelasyon– çarpım moment- katsayısıdır ve “r” ile simgelenir Yukarıdaki
paragraftan da anlaşılacağı üzere koralsyon katsayısı -1 ile +1 arasında
değişmektedir. Korelasyon katsayısının işareti ile ilişkinin yönü saptanır.
Pearson korelasyon katsayısı normal dağılımlı veri setleri için uygundur,
normallik varsayımları yerine gelmiyorsa, parametrik olmayan seçenek, korelasyonu
kestirmek için kullanılabilir. Bu X ve Y değişkenlerinin gerçek değerlerini değil kendi
değişkenleri içinde sıra sayılarını temel alan Spearmansırasayılar korelasyon (ρ:rho)
katsayısıdır.
Mutlak değerlere göre, r’nin çeşitli aralıkları için kabaca şu yorumlarda
bulunmak olasıdır :
0- 0.30 :
Doğrusal bağıntı yok
0.31- 0.45 : Çok zayıf doğrusal korelasyon
0.46- 0.65 : Zayıf doğrusal korelasyon
0.66- 0.80:
Orta güçte doğrusal korelasyon
0.81-0.95 :
Güçlü doğrusal korelasyon
> 0.95 :
Mutlak doğrusal korelasyon
Yeterince güçlü bulunsa da hesaplanan bir "r" her zaman geçerli bir
korelasyonun göstergesi değildir. Gerçek bir bağıntının varlığı ancak r’nin “0”
değerinden istatistiksel açıdan anlamlı farklı olduğu kanıtlandığında kabul edilebilir.
Dolayısı ile korelasyonun geçerliliği bir anlamlılık testi ile ve r’nin 0’dan farklı olduğu
varsayımı ile test edilir.
Değerlendirme aşağıdaki formül ile gerçekleştirilir. Sonuç “t”
değeri, t
dağılımının n-2 serbestlik derecesine göre değerlendirilir. Anlamlılık bulunuyorsa
(p<0.05) r’nin 0’dan farklı olduğu ve korelasyonun geçerli olduğu anlaşılır. Bağıntının
gücü ve yönüne ilişkin yorum ancak bu değerlendirmeden sonra yapılmalıdır.
Gerçekten de çok güçlü bir "r" değeri istatistiksel anlamsızlığı nedeniyle geçersiz
olabilir. Bazen de çok “anlamlı” gözüken bir sonuç - özellikle büyük örneklemler için geçerli bir korelasyon göstergesi değildir.
t=
r
1− r 2
n−2
Korelasyon çözümlemesi sonunda geçerli ve yeterince güçlü bir “r” değeri elde
edilmiş ise regresyon çözümlemesine geçilir. Bu sonuç doğrusal bir bağıntı
sorgulamanın da uygun olacağının kanıtıdır.
Bu çözümlemede temel yaklaşım y bağımlı değişkeninin rassal değişimlere
açık olduğu halbuki x bağımsız değişkenindeki saçılımın araştırıcının daha fazla
denetiminde dolayısı ile daha düşük saçınıklıkta olabileceği düşüncesidir. Dolayısı ile
y değişkeninin sorgulanacak ideal bir doğrudan uzaklıklarının karelerini minimuma
indirecek bir çözüm aranır. Örnek verilerin belirlenen doğrudan uzaklıkları – artıklar –
toplamı 0 edecektir. Bu yaklaşıma “en küçük kareler yöntemi” denir ve doğrusal
regresyon çözümlemelerinde en çok kullanılan yöntemdir.
BELİRTME KATSAYISI (R2 , r2)
Belirtme katsayısı korelasyon katsayısının karesidir - örneğin, r = 0,849 r2 =
0.7208. Bu istatistik, bağımlı değişkendeki, bağımsız değişkene bağlı olarak ortaya
çıkan – istatistiksel anlamdaki - varyans / değişim düzeyini belirtir. Örneğin 0.72 gibi
bir belirtme katsayısı bağımlı değişkendeki değişkenlik düzeyinin % 72 oranında
bağımsız
değişken
tarafından
açıklanabildiği
anlamındadır,
kalan
%
28
,
“açıklanmamış” durumdadır.
r2 değeri de 0 ile 1 arasında yer alır.
Belirtme katsayısının en önemli yararı bağımlı değişkendeki değişikliğin düzeyini
öngörebilme olanağı sağlamasıdır. Bir başka yönden bakıldığında ise belirtme
katsayısı, regresyon çözümlemesinde saptanmış ideal uygunluk doğrusuna en yakın
verilerin oranını göstermektedir bu da regresyon doğrusunun veri setini ne düzeyde
doğru yansıttığının göstergesi olmaktadır. Doğru, serpilme diagramındaki noktalardan
ne denli uzaksa açıklayıcılığı da o kadar zayıftır.
Regresyon katsayısı
Ele alınan iki değişkenden biri diğerinin fonksiyonu olarak ele alınabilir. Bir
ülkenin nüfusu yıllar ilerledikçe artar. Yani pozitif bir ilişki vardır. Burada, ülke nüfusu
yılların (zamanın) bir fonksiyonudur. Burada nüfus Y, zaman X ile tanımlanacak
olursa ikisi arasındaki ilişki y=f(x) olarak gösterilir.
Değişkenlerden biri diğerinin fonksiyonu olarak tanımlandığında eşitliğin sol
tarafındaki değişken bağımlı değişken sağ tarafındaki ise bağımsız değişken denir.
Bağımlı değişken birden fazla değişkenin fonksiyonu olarak da ele alınabilir.
X ve Y çiftleri koordinat ekseninde noktalandığında, ilişkinin doğrusal
olduğunun varsayılabileceği kararına varılmış ise fonksiyon örnekte;
Y = a + bX+e şeklinde ifade edilir.
Bağımsız değişkenin kendi ölçü birimi cinsinden bir birim değişmesine karşılık
bağımlı değişkenin kendi ölçü birimi cinsinden ortalama olarak ne kadar değişeceğini
gösteren katsayıya regresyon katsayısı denir. Korelasyon katsayısı iki özellik
arasındaki ilişkinin derecesini verir ve birimi bulunmamaktadır. Buna karşılık
regresyon katsayısının birimi vardır ve bağımsız değişkende bir birim değişmeye
karşılık bağımlı değişkenin kendi birimi cinsinden ortalama olarak değişeceği
miktardır.
Bağımsız değişken X ve bağımlı değişken Y ile gösterilirse; X değişkeninin bir
birim artmasına karşılı Y değişkeninin kendi birimi cinsinden ortalama olarak
değişeceği miktara Y’nin X’e göre regresyon katsayısı denir ve byxolarak gösterilir.
Eğer Y değişkeni bağımsız X değişkeni bağımlı ise bu durumda bxyşeklinde gösterilir.
byx : Y’ninX’e göre regresyon katsayısı
bxyX’in Y’ye göre regresyon katsayısı
Regresyon katsayısının hesaplanması için kullanılan eşitlik genellikle ;
Regresyon Katsayısı(b) = çarpımlar toplamı / Bağımsız değişkene ait kareler
toplamı
Regresyon katsayısının işareti ile korelasyon katsayısının işareti her zaman
aynıolarak bulunur.
Regresyon Denklemi
İşaretlenmiş olan noktalar bir doğru üzerinde olsa idi doğrunun denklemi
kolayca oluşturulabilirdi. Eğer noktalar bir doğru üzerinde değil de, doğru etrafında
saçılıyorsa X ve Y değerlerine karşılık gelen noktaların hepsine birden en yakın
geçecek bir doğru oluşturulabilir. Oluşturulacak bu doğruya Regresyon Doğrusu ve
doğruyu oluşturan denkleme de Regresyon Denklemi adı verilir. Bu denkleme
önceden tahmin denklemi de denmektedir.
BÖLÜM XI
SAĞLIK İSTATİSTİKLERİ
Epidemiyoloji, sağlık veya sağlığa ilişkin olayların kişi, yer, zaman özelliklerine
göredağılımını, nedenlerini, tanı, tedavi ve önlenmesi için uygun çözüm yollarını
belirlemeye yarayançalışmaların araştırma tekniklerinin bilimi, yöntem bilimidir.
Epidemiyolojik açıdan bu incelemeler, niceliksel (sayısal) olarak ifade edilince
bir anlamkazanırlar. Bu durumda, bir toplumun tümünün ya da belirli özellikleri olan
alt gruplarınınsağlığını etkileyen olayların, çeşitli faktörlerin etkilerinin sayısal olarak
ölçülüp belirtilmesigerekmektedir.
En basit ve temel ölçü belirli bir hastalığı veya özelliği olan kişilerin
sayılmasıdır.Ancak, sadece vaka sayısını belirtmek konu hakkında bilgi sahibi olmak,
karşılaştırmalaryapmak için yetersizdir. Ölçülerin bir ortak payda üzerinden ifade
edilmesi gerekir. Bunedenle, belirli bir birime dayanan ölçütler geliştirilmiştir
Ölçütün anlamlı olabilmesi için ait olduğu toplum (tüm nüfus, belirli gruplar
veya olay)üzerinden belirtilmesi gerekir (“Risk altındaki toplum”).
Ölçüt, NE, NEREDE, NE ZAMAN sorularını yanıtlamalıdır.
ÖLÇÜT =
(Pay /Payda) x Katsayı şeklindedir.
PAY :
İlgilenilen olay sayısı
PAYDA :
1. Risk altındaki toplum / gruptaki kişi sayısı
2. Sağlık olayının görüldüğü grup
3. Başka bir olay / ölçüt
KATSAYI :
Olayın sıklığına göre seçilen değer
(10, 100, 1.000, 10.000, 100.000, gibi)
SAĞLIK ÖLÇÜTLERİNİN GENEL SINIFLANDIRILMASI
Sağlık alanında kullanılan ölçütler genellikle HIZ (rate), ORAN (ratio) ve
ORANTI/YÜZDE
(proportion/percentage) olarak ifade edilirler.
HIZ (Rate):
Risk altındaki bir toplum veya grubun, belirli bir birimi (k= 100, 1.000, 10.000
gibi)içinde, belirli bir zaman diliminde gözlenen hastalık veya olay sıklığını belirtir.
Matematikselolarak, bir olgunun “bütün” içindeki yerini belirten ölçülerdendir.
Örnek: Ankara İli’nde 1999 yılı hipertansiyon hızının saptanması.
Burada pay, 1999 yılında Ankara İli’nde hipertansiyon saptanan kişi sayısı,
payda ise1999 yılı Ankara İli toplam nüfusu olmalıdır. Bulunan sayının bir katsayı ile
çarpılması ile de“HIZ” elde edilmektedir.
Toplumda az görülen olguların hızları için 10.000, 100.000 gibi büyük
katsayılar, sıkgörülen olguların hızları için ise 100, 1.000 gibi katsayılar seçilmelidir.
ORANTI (Proportion, Percentage):
Hesaplama tekniği olarak hız ile aynı olmakla beraber, orantıda her zaman
belirli birzaman dilimine atıf söz konusu değildir ve paydada “risk altındaki toplum”
veya toplumutemsil eden örnek yoktur. “Sağlık olayı” sayısının, toplam olay sayısı
veya başvuran kişi sayısınabölünmesi ile elde edilir. Tanımlayıcı çalışmalardan elde
edilen ölçütler bu şekilde ifadeedilirler.Kullanılan katsayı genellikle 100 olup, yüzde
olarak ifade edilir.
Örnek: “A” hastanesi “B” polikliniğinde yapılan muayenelerin tanılarına
göre dağılımı.
Pay : Akut solunum yolu enfeksiyonu tanısı alan kişi sayısı
Payda : “A” hastanesi “B” polikliniğinde muayene olan toplam kişi sayısı.
Katsayı : 100
ORAN (Ratio) :
Kesrin pay ve paydasında farklı olaylar veya ölçütler yer alır. Hız ve orantıdan
farklıolarak, payda payı içermemektedir.
Oran, farklı sağlık olaylarının ya da durumların boyutunu birbirine göreceli
olarak ifade eder.Katsayı olarak genellikle 100 kullanılır, ancak bazı durumlarda da
katsayı kullanılmaz.
Örnek: 100 canlı doğuma karşılık isteyerek düşük sayısı
Pay : İsteyerek düşük sayısı
Canlı doğum sayısı
Payda :
Katsayı : 100
Risk altındaki toplum = a+b
Sağlam = a
Hasta =
b
a
b
Sağlık Göstergesi olarak Kullanılan Çeşitli Ölüm Hızları
Ana Ölüm Hızı:
Dünya Sağlık Örgütü ve Uluslararası Jinekoloji ve Obstetrik federasyonu gibi
uluslararası sağlık örgütlerinin ana ölümünü bir kadının gebeliğinin birinci gününden
doğum sonrası lohusalık döneminin 42 gününe kadar olan sürede gebelik ve dolaylı
olan nedenlerle oluşan ölümler olarak tanımlanmaktadır.
Ana Ölüm Hızı = Bir toplumda bir yıl içerisindeki ana ölümleri
x 100.000
Aynı toplumda aynı sürede canlı doğum sayısı
AÖH bir toplumda gebe kalmadaki risk derecesi hakkındaki fikir vermesinin
yanısıra ana sağlığı hizmetlerinin yeterli olup olmadığı ve o toplumun genel sosyo –
ekonomik düzeyi hakkında da fikir verir.
Perinatal Ölüm Hızı :Bu hız toplumda ana sağlığı düzeyini, doğum öncesi
bakımın yeterli ve doğumların sağlıklı koşullarda olup olmadığını gösteren önemli bir
ölçüttür. Ana ölümüne göre daha sık meydana geldiği için küçük populasyonlarda
ana sağlığı düzeyini değerlendirmek için kullanılmaktadır
Perinatal Ölüm Hızı =
Bir toplumda bir yılda 28. Haftadan sonra olan ölü
doğumlar ve canlı doğup 0-7 gün içerisinde ölen bebeklerin sayısı
x 1000
Toplam (canlı ve ölü) doğum sayısı
Perinatal Ölüm Nedenleri; Konjenital Anomaliler, Rh uyuşmazlığı, Mekanik
nedenler (travma, uterusrüptürü, kordon sarkması), toksemi, Antepartum kanama,
Plasental yetmezlik, Düşük Doğum Ağırlığı, Maternal Hastalıklardır
Bebek Ölüm Hızları:
Yaşamın ilk dönemlerinde, gerek doğumdan önce, gerek doğumdan sonraki
ölümlerin boyutunu belirlemek, halk sağlığının öncelikli konularından birirni
oluşturmaktadır. Anne ve çocuk sağlığının ne durumda olduğunu, en çok öldüren
nedenlerin neler olduğunu ve hangi dönemde olduğunu saptamak için çeşitli ölçütler
geliştirilmiştir.
Bir toplumun genel sağlık, özellikle çocuk sağlığı düzeyini belirlemek,
bu konuda verilen sağlık hizmetlerinin etkinliğini değerlendirmek için kullanılan
en anlamlı ve en önemli ölçütlerden birisi bebek ölüm hızıdır.
Toplam Bebek Ölüm Hızı : (Bir yılda canlı doğup, 365 gün içerisinde ölen
bebek sayısı/ Canlı doğum sayısı) * 1000
Bebek ölümleri ile ilgili diğer hızlar;
Yeni doğan (neonatal) dönem bebek ölüm hızı :
Erken yeni doğan, canlı doğup 0 – 7 gün içerisinde ölen bebekler ile ilgili
hızdır. 0 – 7 günde ölen bebeklerin sayısı payda yer alır.
Geç yeni doğan dönemi , canlı doğup, hayatın 8 – 28 günleri arasında ölen
bebeklerle ilgili hızdır. 8 – 28 günde ölenler payda yer alırlar.
Bu iki hızın toplamı yenidoğan dönemi bebek ölüm hızını verir. 1000 de 36
civarındadır.
Yeni doğan dönemi sonrası ölüm hızı:
Pay bir takvim yılında canlı doğan ve 29 – 365 günler arasında ölen bebek
sayısını içerir, payda da ise aynı yılın canlı doğan bebek sayılarını içerir.
Postnatal ve neonatal ölüm hızları toplam bebek ölüm hızını verir.
DOĞURGANLIK ÖLÇÜTLERİ :
Kaba Doğum Hızı :
Bir toplumda doğurganlık düzeyin, genel olarak gösteren, ayrıntılı bilgi
vermeyen, elde edilmesi kolay bir ölçüttür.
KDH : Bir toplumda bir yıldaki canlı doğum sayıs / aynı toplumun yıl ortası
nüfusu * 1000
Özel Doğurganlık Hızı :
Yaşa özel doğurganlık hızı : Kadınlarda 15 – 44 veya 15 – 49 yaş dönemi
doğurganlık çağı olarak adlandırılmaktadır. Herhangi bir toplumda
doğurganlığın zaman içerisinde nasıl bir seyir izlediğini, sunulan aile
planlaması hizmetlerinin etkinliğinin değerlendirilmesinde veya farklı
toplumların doğurganlık düzeylerini karşılaştırmak amacı ile kullanılan duyarlı
bir ölçüttür.
Pariteye Özel Doğurganlık Hızı : Doğurganlık düzeyinin belirlenmesinde
kullanılan duyarlı bir ölçüttür. Gerek aile planlaması hizmetlerinin
planlanmasında, gerek sunulan hizmetlerin en çok hangi gruplarca
kullanıldığının değerlendirilmesinde yararlıdır.
Toplam Doğurganlık Hızı : Yaşa özel doğurganlık hızının toplanması ile elde
edilir.
Genel Doğurganlık Hızı : Doğurganlık çağında her 1000 kadının bir yılda
yaptığı canlı doğum sayısıdır.
GDH : Bir yıldaki canlı doğum sayısı/15 – 49 yaştaki kadınlar * 1000
Tamamlanmış Doğurganlık Hızı : 45 – 49 yaş grubu kadınların doğurdukları
ortalama çocuk sayısıdır.
Toplam Düşük Hızı : Bir toplumda düşük sorununu ne düzeyde olduğunu ve
aile büyüklüğünü sınırlandırma ya da doğumlar arası aralığın uzatılması
konusunda talebin düzeyini gösterir.
Belli sürede isteyerek veya kendiliğinden düşük sayısı/ toplam gebelik sayısı x
100
HASTALIK (MORBİTİDE) DÜZEYİ BELİRLEYEN ÖLÇÜTLER:
Epidemiyolojide en sık kullanılan hastalık ölçütleri insidans ve prevalanstır.
İnsidans : Risk altındaki sağlam kişilerin belirli bir sürede hastalığa yakalanma
olasılıklarını verir. Bir toplumda belli bir sürede ortaya çıkan yeni vaka
sayısıdır. Payda da yıl ortası nüfus yer almaktadır.
İnsidans hızı ileriye dönük tıptaki araştırmalarda veya toplumun sürekli
izlenmesi, sağlıkla ilgili kayıtların tam, doğru ve sürekli tutulması ile elde edilir.
Hastalıkların etiyolojilerinin açıklanmasında, sağlık sorunlarına çözümünde
yapılan uygulamanın etkinliğinin değerlendirilmesinde çok yararlıdır
Atak Hızı :
Primer Atak Hızı : İnsidans hızının özel bir şeklidir. Bazı durumlarda toplumun
tümü veya bir kesimi, hastalık riski ile bir süre için karşılaşır. Böyle durumlarda
olayın boyutunu ölçmek için primer atak hızı kullanılır. İlk vaka görüldükten
sonra, o hastalık için en uzun kuluçka dönemi içerisinde görülen tüm vakalar
primer veya aynı kaynaktan bulaşmış olarak kabul edilir.
Sekonder Atak Hızı : Genellikle bulaşıcı hastalıklar alanında kullanılır. İlk vaka
görüldükten sonra ikinci en uzun kuluçka döneminde ortaya çıkan vakaların
primerlerden bulaştığı, yani sekonder vakalar olduğu kabul edilir.
EpizodHızı : Bağışıklık bırakmayan ve tekrarlayıcı hastalıkların sıklığını
ölçmede kullanılır.
Gıdaya özel Atak Hızı: Gıda zehirlenmelerinde zehirlenmeye hangi yiyeceğin
neden olduğunu gösterebilmek için kullanılır.
Prevalans : Belirli bir süre veya anda toplumda bulunan toplam vaka sayısının
risk altındaki topluma oranıdır. Belirli bir zamanda bir hastalığın bir toplumda
hangi sıklıkla olduğunu gösterir.
Nokta Prevalansı : Toplumda belirli bir andaki bir zaman kesitindeki toplam
vaka sayısıdır.
Süre Prevalans : Toplumda belirli bir süre içinde toplam vaka sayısıdır. Ruhsal
hastalıklar için önemlidir
STANDARDİZASYON
STANDARDİZASYON TEKNİKLERİ
Standardizasyon teknikleri ile nüfusun yapısı ile ilgili sakıncalar ortadan
kaldırılır. Bu amaçla kullanılan üç yöntem bulunmaktadır. Bunlar;
Ortalama Ölüm Hızı Eşitinin Hesaplanması:
Direkt Standardizasyonla Standardize Ölüm Hızının Hesap Edilmesi
İndirekt Standardizasyon Yöntemidir.
Ortalama Ölüm Hızı Eşitinin Hesaplanması
Nüfus 5’er yıllık aralıklarla 13 yaş grubunabölünerek, 13 yaş dilimine ait ölüm
hızları ayrı ayrı hesap edilir ve toplanır ve 13’e bölünerekaritmetik ortalama ölüm hızı
elde edilerekkarşılaştırmalar bu ortalama ölüm hızı ile yapılır.
Direkt Standardizasyonla Standardize Ölüm Hızının Hesap Edilmesi
Karşılaştırma yapılacak her iki bölge için ayrı bir nüfus yani standart nüfus
atanır ve yaşa özel ölüm hızları bustandart nüfus ile çarpılarak beklenen
ölümlerbulunur. Standart nüfusun belirlenmesinde en çok kabul edilen sistem
karşılaştırılacak her iki nüfusun yaş gruplarınaÖzel nüfuslarının toplanıp o yaş grubu
için standart Nüfusu oluşturmalarıdır.
Yaş
Grupları
Nüfus
(X)
Ölüm
Sayısı
KÖH
Nüfus
(Y)
Ölüm
Sayısı
KÖH
Standart
Nüfus
SKÖH
(X)
SKÖH
(Y)
0–4
9222
180
19.5
7965
70
8.8
17187
308
151
5–9
10 – 14
15 – 19
20 – 24
25 – 29
30 – 34
35 – 39
40 – 44
45 – 49
50 – 54
55 – 59
60 – 64
65 üzeri
Toplam
19576
39056
46071
55621
26780
26600
22400
18600
17920
14300
12731
11121
9080
329078
120
98
71
76
34
30
21
78
60
18
24
10
15
835
6.1
2.5
1.5
1.3
1.2
1.1
0.9
4.2
3.3
1.3
1.9
0.9
1.7
2.5
14314
29974
42715
50638
24641
28914
26517
18704
21418
16705
11312
12120
10125
316058
80
54
66
71
32
36
25
76
72
30
25
16
24
677
5.6
1.8
1.5
1.4
1.3
1.2
0.9
4.1
3.4
1.8
2.2
1.3
2.4
2,14
33890
69030
88782
106259
51421
55514
48917
37304
39338
31005
24043
23241
19205
645136
208
173
133
138
62
61
44
157
130
40
46
21
33
1554
190
124
133
149
67
67
44
153
134
56
53
30
46
1397
X Toplumun Standardize Ölüm Hızı : 1554/645136 :2,41
Y Toplumun Standardize Ölüm Hızı : 1397/645136 : 2,17
İndirekt Standardizasyon Yöntemi
Yaş gruplarına göre ölüm hızları bilinmiyorsa kullanılan beş basamaklı bir
yöntemdir.
1.Basamakta : Standart kabul edilen nüfusun yaşa özel ölüm hızı (Dünya Nüfusu
olabilir) standart hız olarak kabul edilir. Karşılaştırılacak olan ülkeler için beklenen
ölüm hızları bulunur.
2.Basamakta : İndeks ölüm hızı bulunur. Bunun için (beklenen ölüm sayıs/ nüfus)*
1000
3.Basamakta : KÖH/İÖH : Standartlaşma faktörü bulunur
4.Basamakta : Standartlaşma faktörü * KÖH
5.Basamakta: Standardize Ölüm Hızı hesap edilir.
(Gözlenen Ölüm Hızı (KÖH)/Beklenen Ölüm Hızı) *100
Sağlık Kurumlarında tutulan bazı istatistikler ve hesaplama yöntemleri
A-NÜFUS BAŞINA DÜŞEN HASTA YATAK SAYISI
Bir yıl içinde incelenen yerleşim birimi (İlçe, il, bölge, ülke) sınırları içerisinde
bulunan sağlık kurumlarının toplam hasta yatağı sayısının birimin nüfusuna
bölünmesi ile elde edilir. Belli sayıda (genellikle 10,000) kişiye düşen hasta yatak
sayısını ifade eder. Planlama yapmak gibi diğer amaçlar yanında yerleşim birimleri
arasında kıyaslama yapmak amacıyla da kullanılır.
İncelenen yerleşim birimi sınırları içindeki toplam hasta yatağı sayısı nasıl
hesaplanır.
10,000 Kişiye Düşen Hasta Yatak Sayısı = İncelenen yerleşim birimi toplam
nüfusu x10,000
Örnek:
674,387 nüfuslu bir ildeki toplam hasta yatağı sayısı 1,625 dir.
Bu ilde 10,000 kişiye düşen hasta yatağı sayısı; Yatak sayısının nüfusa
bölümüyle elde edilen sonucun on binle çarpımıdır.
10,000 Kişiye Düşen Hasta (1,625 Yatak Sayısı/ 674,387) x10,000 = 24.1
yatak şeklinde bulunur.
B - YATAN HASTA SAYISI Belirli bir zaman dilimi içerisinde hastaneye
yatırılan hasta sayısıdır.
C - HASTA YATIRILMA ORANI Belirli bir zaman dilimi içerisinde hastaneye
yatırılan hastaların bulunduğu yerleşim alanı nüfusuna oranıdır.
D - ÇIKAN HASTA SAYISI Bir yıl içerisinde hastaneye yatırılan, hastaların,
şifa, salah hali, ile evlerine veya başka kurumlara çıkarılmalarıdır. Ölüm vakaları da
buna dahildir.
E – MAKSİMUM YATILAN GÜN SAYISI İncelenen süre içinde hastanede
verilebilecek bakım gün sayısının en büyük değeridir. Hesaplamada hasta yatak
sayısı ile incelenen süre içindeki gün sayısı çarpılır.
Örnek: 50 yataklı bir hastanenin Ocak(31 gün), Şubat(28/29 gün), Mart ayı (31
gün) için maksimum hasta bakım gün sayısı = 50 yatak * (90/91 gün) = 4500 hasta
bakım günü (Şubat 28 gün ise) = 4550 hasta bakım günü (Şubat 29 gün ise)
F - YATILAN GÜN SAYISI Hastanın hastanede kaldığı günlerin toplamıdır.
Hesaplanmasında hastanın giriş çıkış günlerinden yalnız girdiği gün sayılır çıkış günü
sayılmaz hastanın çıkış tarihinden giriş tarihi çıkarılarak elde edilir. Aynı gün yatıp
çıkan hastanın hasta günü 1 gün olarak kabul edilir.
G) ORTALAMA KALIŞ GÜN SAYISI Yatılan Gün Sayısı /Taburcu + Ölen
sayısı
H) YATAN HASTA ORANI (%) Bir yılda hastane polikliniğine başvuran
hastaların ne kadarının yatırılarak tedavi edildiğini gösterir. Yatan Hasta X 100
/Poliklinik
I) YATAK DEVİR HIZI Bir yatağın yılda kaç hasta tarafından kullanıldığını
gösterir. Yatan Hasta /Hasta Yatağı
J) DEVİR ARALIĞI (GÜN) Bir hasta yatağının kaç gün boş kaldığını gösterir.
Hasta Yatağı X Süre- Yatılan Gün Sayısı /(Taburcu + Ölen)
K) YATAK DOLULUK ORANI: Belirli bir zaman dilimi içerisinde hasta
yataklarının ne oranda hasta tarafından kullanıldığını gösterir hesaplama formülü
Yatılan Gün Sayısı X 100 Yatak Doluluk Oranı /3ay ( 90 - 92 gün) veya 1 yıl
(365 gün) X hasta yatak sayısı
Hasta yataklarının yeterli kullanılıp kullanılmadığını gösterir
BÖLÜM XII
ÖRNEKLEME
GİRİŞ
Bir istatistiksel karara varmak için gerekli olan sayısal değerler, bireyler veya
toplumlar üzerinde ölçüm veya sayımlar yapılarak elde edilir.
Belli bir konuda, o alandaki değerlendirmelerin, ölçümlerin, sayımların yapılacağı tüm
olguları içeren topluluğa “Toplum: Popülasyon: Evren” denir. İlgilenilen özelliğe göre
tüm Diabetliler, diabet hastaları popülasyonunu oluşturabilecekleri gibi tüm sahil
çamları
veya
kömür
madeni
çalışanları
veya
balarıları
da
kendi
özgün
popülasyonlarını oluştururlar. Bir popülasyon kısıtlı özelliklerle tanımlanarak çok daha
az sayıda birey-olgu da içerebilir – çok ender hastalıklarda olgular topluluğu gibi- .
Evren,
araştırma
sonuçlarının
genellenmek
istendiği
olgular-elemanlar
bütünüdür. İki tür evren ayrımlanabilir: Birisi, genel evren, öteki ise çalışma evrenidir.
Genel evren, soyut, tanımlanması kolay fakat ulaşılması güç ve hatta çoğu zaman
olanaksız bir bütündür. Çalışma evreni, ise ulaşılabilen evrendir. Araştırmacının, ya
doğrudan gözleyerek ya da ondan seçilmiş bir örnek küme üzerinde yapılan
gözlemlerden yararlanarak, hakkında görüş bildirebileceği evren çalışma evrenidir
Üzerinde araştırma yapılan birey (veya olgular) toplumu sınırlı sayıda ögeden
oluşuyorsa böylece ölçüm veya sayım yapmak da kolaysa, araştırma toplumun tüm
ögeleri üzerinde yürütülebilir (Belli bir yöredeki seyrek ve endemik bir hastalığın tüm
olgularında belli bir enzimin ölçülmesi gibi). Bu tür, toplumdaki olguların tüm
birimlerinin düzeylerinin saptanması ile oluşan derlemeye “Tam sayım” (tüm sayım)
denilir. Ancak bir araştırma sınırlı bir birey topluluğunu değil de, sonsuz denebilecek
kadar çok sayıda bireyi içeriyor ise, bu tür bir sayım, yüksek maliyet, süreç,
uygulayıcı yetersizliği, tüm birimlere erişememe gibi sorunlar nedeniyle olanaksız
denebilecek
kadar
zorlaşır.
Bundan
dolayıdır
ki,
çok
özgün
ayrıntılı
değerlendirmelerin gerekli olduğu veya çok ender rastlanan olaylar dışında tam
sayım
yapılmaz.
Bunun
yerine,
tüm
toplumun
yerine
geçebilmek,
onu
simgeleyebilmek, değerlerini belli doğrulukla yansıtabilmek koşulu ile kısıtlı bir toplum
parçacığı kullanılır. Çok yüksek sayıda – hatta sonsuz - N olgu içerikli bir toplumdan,
n sayıda, toplumu simgeleyebilecek olgu, örnek alınması ve onun değerlendirilmesi
yöntemine “örnekleme” adı verilmektedir. (Bölümsel sayım).
Bu kısıtlı sayıda örneği elde etme yöntemine örnekleme dendiği gibi, eldeki kümeye
de örnekleme veya, örneklem, örnek kümesi adları verilir.
Bir örnekleme sonunda elde edilen örnek grubu, aşağıdaki iki temel özelliği
taşımak zorundadır, aksi halde yerine geçtiği toplumu yansıtmaktan uzak kalır.
1) Yapısal Simgeleme yeteneği: Bir örnek ana toplum içinde araştırılan
özellikleri gerçekten taşıyorsa o toplumu simgeleyebilir. Bunun içindir ki gerek
evrende-toplumda araştırılan özelliğin tanımı, gerekse de örnek birimlerinin bu
tanıma uyan bireyler olarak seçilmesi gerekir. Örneğin; doğurganlık çağındaki
kadınlarla ilgili bir araştırmada örnek birimlerin “belli yaştaki (19-45) kadınlardan
oluşması” simgeleme açısında zorunludur.
2) Sayısal yeterlilik: Bir örnek grubu toplum içinde aranan özelliği
yansıtabileceğine güvenilen büyüklükte ise değerlendirmeye “uygun büyüklüktedir”.
Bu büyüklüğü saptamada ana etken ögeler, toplumun özelliği, göz yumulacak hata
ve güvenirlik sınırlarının ön kabulüdür. İkincil olarak araştırma olanakları, örnekleme
işleminin tipi, varsayımın özelliği rol oynar. Yetersiz örneklemler geçerli olabilecek
varsayımların kanıtlanamamasına, çok gereksizce büyük tutulmuş örneklemler ise
klinik değeri olmayan farkların istatistiksel olarak anlamlı bulunmasına yol açarlar.
Bu iki temel özellik çerçevesinde, yapılacak bir araştırmanın örnekleminin
olabildiğince doğru sonuçlar üretebilmesi için şu aşamaların gerekliliği ortaya
çıkmaktadır:
•
Amaçlanan varsayıma göre gerekli en az sayının saptanması
•
Örneklemde, Toplumsal yapıya uyumun planlanması
•
Uygun sayı ve yapıda örneklemin toplum içinden seçimi ve “biassız” eldesi ,
Koşullar ne olursa olsun, bir örneklemin, toplumun “tam” bir yansıması olması
olası değildir. Bu çerçevede belli düzeyde farklılıklar göze alınır ve baştan kabul
edilir. Bunların düzeyinin “toplumsal gerçeği” zedelemeyecek sınırlarda tutulması
gerekir.
Ancak daha önce de vurgulandığı gibi bazı “hatalar”, bu farklılaşmanın çok
artmasına ve aslında örneklemin toplumu simgelememesine neden olabilir.
Örneklemden elde edilen ve gereğinde toplum bilgisi olarak kullanılacak olan
sonuçlarda iki temel özellik aranır:
Kesinlik: Sonuç bilgisinin çok geniş bir dağılım alanı olmamasıdır. Bu, özgün
bir özelliğin belirtisi olacaktır. Standart sapması çok büyük olan bir sonuç,
ölçümlenen özelliğin yaklaşık büyüklüğü hakkında belirgin bir bilgi oluşmasını –
kıyassal çözümlemelerde istatistik anlamlılığın bulunabilmesini – büyük oranda
engeller.
Geçerlilik: Elde edilen sonuç değerin gerçek toplum değeri yerine oturacak
yakınlıkta olmasıdır. Kesinlik sağlanmasına rağmen – özellikle ölçüm yaklaşımları
ağırlıklı -çeşitli hata kaynakları nedeni ile veriler gerçekte olduklarından farklı
ölçülebilirler – tartının hep 2 kg. fazla göstermesi örneği gibi – bu da sonucun
gerçekle örtüşmemesini getirir.
“Gerçeklik” sağlamayan örneklemeler “sistematik hata → bias” üretirler: Bu,
bilindiği gibi örneklem verisi eldesinde belli tip örneklerin alınması veya ölçümlerin
yanlış saptanması tipindeki hatadır. “Kesinlik” sağlamayan örneklemelerdeki -“rassal
hata” ise fazlası ile geniş, “belirleyiciliği olmayan” dağılım aralığı, uç örneklerin
fazlalığı- anlamındadır ve toplumun belirgin tanımlanamamasına neden olur.
Sonuç olarak bir “örnekleme” sadece sayısı ile değil, örneklerin toplumsal
yapıyı gerçekçi, abartısız ve tarafsız yansıtacak biçimde sağlanması ve üzerinden
elde edilen değerlerin doğru saptanmış olması ile de önem taşır.
10.2.- ÖRNEKLEME BÜYÜKLÜĞÜNÜN ÖNEMİ
Örnek grubu toplumu simgelemek üzere seçilmektedir, dolayısıyla toplumun
ölçüm değerlerini de taşımalıdır. Toplumun gerçek değerlerini önceden göze alınabilir
– klinik açıdan fark üretmeyecek- belli hata payları ile taşıyabilecek en uygun örnek
sayısının saptanması araştırma sonuçlarının güvenilirliği açısından büyük önem taşır.
Zira yetersiz örnek toplumun gerçek değerlerini yansıtmaz, çok fazla örnek gerek
uygulama gerekse de nesnel açılardan zorluklar getirir, yargılama “tuhaflıkları”
üretebilir.
Bu kavramın anlaşılması için bir nedensellik yargılamasında, “neden” olarak
düşünülen bir “X” özelliğinin, iki kümedeki (Ör: hasta/sağlam) dağılımının ( % 30 ve
% 50 ) farklı sayılardaki küme büyüklükleri ile (10 ar, 50 şer ve 100 er olguluk
kümeler) yargılandığını varsayalım.
“X” ÖZELLİĞİ
VAR
YOK
A GRUBU
3
7
B GRUBU
5
5
“X” oranı
0.30 ve 0.50
p= 0.659 (AD)
Bu koşullarda ve bu sonuca dayanarak “X” özelliği için herhangi bir anlamlı
nedensel yorum yapamıyoruz.
“X” ÖZELLİĞİ
YOK
“X” oranı
VAR
A GRUBU
15
35
0.30 ve 0.50
B GRUBU
25
25
p= 0.066 (AD)
Bu koşullarda ve bu sonuca dayanarak
“X” özelliği için herhangi bir anlamlı nedensel yorumda kuşkulu kalıyoruz!!
Eğer %30 a göre %50’lik bir oranın daha yüksek olduğunu kanıtlama amacı ile
araştırma yapıldıysa, bu “anlamsızlıklar” , aslında kaçırılmış anlamsızlıklardır ve
“Geçerli bir varsayıma”, hatalı olarak “geçersiz demek” yanılgısını yansıtmaktadırlar.
Bir varsayım geçerliliğini kanıtlamak için gerekli örneklem hesabına uyarak
değerlendirildiğinde en güvenilir karara varılabilecektir. Söz konusu çalışma için 100
er olguluk örneklemle;
“X” ÖZELLİĞİ
YOK
VAR
A GRUBU
30
70
B GRUBU
50
50
“X” oranı
0.30 ve 0.50
p= 0.039 √
Bu koşullarda ve bu sonuca dayanarak “X” özelliğinin “A” grubunda, “B” ye göre daha
az bulunduğunu “anlamlı” olarak söyleyebiliyoruz!
Gerçekten de bu çerçevedeki bir varsayım için gerekli örneklem hesabı yapıldığında
örnek kümelerinin yaklaşık 56 şar olgu içermesi gerektiği ortaya çıkmaktadır.
Kavramın “fazla örneklem” yönü de söz konusudur; Aşağıdaki örnek tabloda oranları
ele alalım:
“X” ÖZELLİĞİ
YOK
“X” oranı
VAR
A GRUBU
30550
69450
B GRUBU
30965
69035
0.3055
0.3097
p= 0.044 √ !
Bu koşullarda ve bu sonuca dayanarak “X” özelliğinin, “A grubunda, “B” ye göre daha
az bulunduğu “anlamlı” olarak söylenebilecektir. %30 düzeyinde bir olay için, binde
4.2 düzeyinde farklılık gerçek bir “anlam” taşır mı? Böylesi bir fark, “klinik” açıdan
önemli olabilir mi? "Etki büyüklüğü" klinik açıdan yeterli midir?
Bu anlamlılık aslında belki de klinik önem taşımayan bir farkı abartmak hatta belki de
“Geçersiz bir varsayıma hatalı olarak geçerli demek” olacaktır. Anlaşıldığı üzere
küme büyüklükleri sonuç yargıyı tamamen etkilemektedir.
Daha önce açıklanan kavramlar çerçevesinde, istatistikte tüm değerlendirme
süreçlerinde, “güvenirlik” kavramı kullanılır. Bu kavram kabaca belirli sayıların
önceden kabul edilen doğruluk yüzde paylarını belirler. Bu güvenirlik alanın dışında
kalan kesim “risk” veya güvensizlik alanıdır ve bu alana düşen bir ölçümsel değer,
“güvenirlik alanı” tarafından belirlenmiş sınırların dışında kaldığı için, “farklı” kabul
edilir.
Örnek büyüklüğü saptanırken de, belli bir güvenirlik alanı içinde toplum değerini
yansıtabilecek örnek sayısı saptanır. Ayrıca herhangi bir örnek grubunda elde edilen
konu değerin rassal olarak tam toplum değeri kadar olması çok düşük bir olasılık
olduğundan, belli bir ön kabul çerçevesinde, gerçek – ve bilinemeyecek olan- toplum
değeri ile örneklemde elde edilecek olan değer arasında “göze alınabilecek bir fark”
da belirtilir. Ancak bu farkın en kötü durumda bile toplumu gerçek olduğundan aşırı
farklı göstermeyecek düzeyde kısıtlı olarak seçilmesi gerekir.
Güven alanının belirlenmesinde bazı katsayılar kullanılmaktadır (z ve t gibi), bu
katsayılar yapılması önkabul olarak varsayılmış olan hata oranlarını belirlemektedir
ve her doğruluk oranı için belli bir katsayı bulunmaktadır. Gerçek toplum ortalaması
ile yapılması kaçınılmaz olan ortalama hatası da “d” simgesi altında kullanılacak ve
araştırıcı
konusunun
özellikleri
çerçevesinde
bu
hatanın
düzeyini
önceden
belirleyerek kabullenecektir. Çok kaba çizgilerle bu hatanın oransal ölçüm yapılmış
çalışmalarda – sürekli değişkenler - , değişkenin olası standart sapmasının % 10-50
arasında olması, nitel oranlarla-sıklıklarla yapılan çalışmalarda da kuramsal oran
değerlerinin %10- 20’si aralığında olması önerilir. Yine de çalışmanın özelliğine göre
bilimsel mantığın dışına çıkmamak kaydı ile bu sınırlarda esneklik söz konusudur,
eşdüzeylilik araştırmaları ile üstünlük kıyaslamaları farklı yaklaşımlar gösterebilirler.
Bu yönde elde hiçbir bilgi yoksa pilot çalışmalarla kaba bilgilere erişilmelidir. Bunlar
için; nicel, sürekli değişkenli çalışmalarda en az 15-20 örnek- aykırı değerlerden
arındırılmış - , nitel değişkenli çalışmalarda- sıklık-
ise, ilgilenilen olayın olası
sıklığına göre en az 50 örnek alınması önerilir. Başka kaynaklardaki bilgilere
dayanılarak kestirimle yola çıkılacaksa oranlarla ilgili araştırmalarda kaynakta
belirtilen düzeyden daha düşük bir oranı saptamayı hedeflemek gerekir. Varsayımda
öngörülecek değerlerin, saptanılması beklenen değerlerden biraz daha “küçük”
tutulması, araştırma sonucunda beklenen düzeyden düşük gerçek sonuçlarla
karşılaşılırsa bundan “emin olunmasını” sağlar. Varsayımda öngörülecek değerlerden
daha büyük gerçek değerlere erişilirse bu sonuçlar, öngörülenden daha da yüksek
güvenirlikte olur. Önçalışmanın olguları sonradan toplam örneklem içinde sayılabilir.
Çözümleyici araştırmalarda ise “d” simgesi altında öngörülecek olan değer kıyassal
kümelerin arasında bulunabilmesi beklenen “farkın” karşılığıdır. Bunun klinik açıdan
önem taşıyabilecek bir fark olması varsayımsal kurgular açısından gereklidir.
Örneklem sayısı hesaplanması öncelikle 2 temel araştırma özelliğine göre
belirlenir: Tanımlayıcı araştırmalar (taramalar)
Çalışmada konu edilen özelliğin
ve Çözümleyici araştırmalar.
(konu değişken / bağımlı değişken) nitelik veya
nicelik olması çerçevesinde formüller farklılaşır. Çalışma sonuçlarının güvenirliği (Tip
I. Hata) ve çözümleyici araştırmalarda ayrıca değerlendirmenin “gücü” (power)
hesaplamalara yansıtılır.Ayrıca hesaplanmış bir örneklem sayısı bazı koşullara göre
arttırıp , azaltılabilir. Genel çizgileri ile örneklem büyüklüğü hesaplamasının aşağıdaki
özelliklerden
duruma
uygun
olanlar
göz
önünde
bulundurularak
yapılması
gerekmektedir:
•
Araştırmanın tanımlayıcı veya çözümleyici olması,
•
Konu değişkenin sürekli (nicelik) veya süreksiz (genelde oranlar) olması,
•
Çözümleyici
özel
yaklaşımların
sorgulanması
(korelasyon,
göreli
değerlendirme, sağkalım , vs),
•
Saptanması amaçlanan özelliğin, beklenen yaklaşık düzeyi (nitelik/nicelik) öncü veya önceki çalışmalardan- (Tanımlayıcı),
•
Bu beklentide ortaya çıkabilecek “kabullenilebilir” hata payı -klinik yorumu
değiştirmeyecek sınırlara göre- (Tanımlayıcı),
•
Varsayımda
saptanması
amaçlanan
“farklılığın”
yaklaşık
düzeyi
(nitelik/nicelik) (Çözümleyici),
•
Sonuçların “güvenilirlik” düzeyi (α hata düzeyi: %5, %1, vs),- tek yönlü veya
çift yönlü sorgulama yapılabilir -
•
Sonuç yargıların
“güç” düzeyi:1-β hata düzeyi - %80, %90, vs-
(Çözümleyici), -tek yönlü değerlendirilir , % 80 kabul edilebilen ve en sık
kullanılan düzeydir -,
•
Çok “konudeğişkenli” araştırmalarda özel (max.) değerlendirme: Birden fazla
konu değişkenle çalışılacağı zaman en fazla örnekleme gereksinim gösteren
değişken için saptanmış büyüklüğün seçimi,
•
Varsayımsal çözümlemelere göre düzenleme, çokdeğişkenli çözümlemeler
için örneklem artırımı,
•
Olgu yitimine/yanıtsızlığa/katılım reddine önlem olarak artırım,
•
Kıyassal kümelerin eşit sayıda olgu içerememesi koşullarında özel
hesaplamalar,
•
Kısıtlı, belirli sayıda “evrenlerde” , örneklem sayısında azaltma.
Bu özellikleri göz önünde bulundurarak daha nesnel ayrıntılara girildiğinde;
ister tanımlayıcı ister çözümleyici olsun araştırmanın amacının – veya varsayımının –
da nesnel olarak belirlenmesi örneklem büyüklüğünün saptanmasında ilk temel
aşamadır. Buna ek olarak kabullenilebilir hatanın (tanımlayıcı) veya öngörülen
farklılaşmanın (çözümleyici) belirlenmesi gerekir:
•
En az %4 olabileceği düşünülen anginapektoris sıklığını , % 0.8 hata ile
saptamak,
•
“A” yöntemindeki % 20 lik yan etkiye göre ,”B” yönteminde daha düşük %
10’luk oranı kanıtlamak,
•
2 yıllık izlemde beklenen 15 ay medyan sağkalıma göre yeni yöntemle %50
artışı saptayabilme,
•
Tedaviye bağlı olarak beklenen, en az 30 mmHglik SAB düşüşünü ± 5
mmHg hata ile kanıtlama,
Bu açıklamalara yapılması kabullenilebilen α
ve gereğinde β hata paylarını da
katarak örneklem büyüklüğü hesaplamasının tüm verileri oluşturulur:
•
Yetişkin erkeklerde ortalama 48 mg/dL olabileceği düşünülen HDL düzeyini
± 5 mg/dL hata payı ile ve % 95 güvenle saptamak,
•
“A” yönteminde beklenecek % 78 başarıya göre ,yeni ”B” yönteminde en az
% 90’a çıkılacağını , % 95 güvenle (α =0.05) ve % 80 güçle (β =0.20)
saptamak…
Uygun formülle hesaplanan sayı gereğinde düzeltmelerle son durumuna
getirilir. Bu temel özellikler çerçevesinde kullanılacak hesaplama yaklaşımları
aşağıda irdelenmektedir.
ÖRNEKLEME BÜYÜKLÜĞÜ HESAPLANMASI
Yukarıda vurgulanan kalıplarda düzenlenen sorgular için örneklem büyüklüğü
hesaplamalarını, araştırmanın tanımlayıcı veya çözümleyici olmasına, bu ayrım
içinde de konu değişkenin (veya bağımlı değişkenin) nicel veya nitel olmasına göre
ayrımlayarak ele alacağız. Farklı çözümleme teknikleri için kullanılabilecek durumlara
göre de ayrı yaklaşımlar sunulacaktır. Unutulmamalıdır ki burada verilecek olan
yaklaşımlar en temel, en sık karşılaşılan araştırma tipleri için olanlardır. Ayrıntılar
girilirse onlarca örneklem büyüklüğü hesaplama yaklaşımı bulunmaktadır. Bazı
durumlar için birden fazla – az çok benzer – formülün bulunduğu da bilinmektedir.
ÖRNEKLEME YÖNTEMLERİ
Sadece örneklem örneklem sayısının yeterli olması elde edilecek sonuçların
geçerli ve güvenilir olmasına yetmez , en bunun kadar önemli bir diğer konu da
örneklemin yapısının ilgilenilen konu çerçevesinde toplumun yapısına uygun
olmasıdır. Uterus kanseri taramasına erkeklerin de veya 3 yaş altında kızların
alınması veya Türkiye'de erişkin erkeklerde total kolestrol düzeyi belirlenmesi için
sadece Ege bölgesinde 2-3 kasabanın taranması toplumsal gerçekleri hiç bir şekilde
yansıtmayacaktır. Bu nedenle örneklem yapısının belirlenmesi, planlanması ve doğru
eldesi yaşamsal önem taşır.
Genel anlamı ile örnekleme süreci, yöntem açısından iki ana gruba ayrılabilir;
1) Bilinçli (yargısal) örnekleme: Olasılık ilkelerine dayanmayan, doğası gereği
yanlılık içerebilecek derlemeler.
2) Rastgele (olasılıklı temelli) örnekleme: Olasılık ilkelerine dayanarak
örneklerin belirlenmesi.
BİLİNÇLİ ÖRNEKLEME
Amaçlı veya “olasılık dışı” da denebilen bu yaklaşımda, rastlantı ilkesine
uymak yerine, seçilecek örneklerde, belli ön yargılara, kabullere dayanılarak belli
özelliklerin aranmasıdır. Bundan dolayı bu tür örnekleme genelde simgeleme
yeteneği açısından güvenilir değildir. Bilinçli örneklemede temel 3 tipten söz edilebilir:
a- Monografik örnekleme
b- Yoğunluk yöntemi
c- Güdümlü örnekleme
a- Monografik örnekleme: Sadece eldeki bilgilere ve sezgilere dayanılarak,
simgelenebileceği kanı ve yargısı ile bir toplumun içinden bir alt grubun veya birkaç
bireyin seçilmesidir. (Eşdüzenli) Homojen toplumlarda belli ölçüde yararlıdır, ancak
genel olasılık ilkelerine uyumsuzluğu sonuçların doğruluğunu etkiler. Buna karşılık bu
yaklaşım çerçevesinde, kolaylık sağlamak amacı ile ve hiçbir önyargı güdülmeksizin
seçilmiş
kısıtlı
örneklerden
gerçekleştirildiklerinde
oldukça
bilgi
edinme
değerli
yaklaşımları
sonuçlara
uygun
koşullarda
erişebilmektedir.
Burada
araştırmacı kimlerin seçileceği konusunda kendi yargısını kullanır ve araştırmanın
amacına en uygun olanları örnekleme katar. Örnek grup toplumun tipik simgesi
sayılacağından içinde ortalama ve uç örneklerin bulunmasına çalışabilir. Özellik
farkları çerçevesinde alt tipler ayrımlanabilmektedir:
1. Aşırı veya aykırı durum örneklemesi,
2. Maksimum çeşitlilik örneklemesi,
3. Benzeşik örnekleme,
4. Tipik durum örneklemesi,
5. Kritik durum örneklemesi,
6. Kartopu veya zincir örnekleme,
7. Kolay ulaşılabilir durum örneklemesi.
Bunlarla ilgili ayrıntılar uygun kaynaklardan elde edilebilir.
b- Yoğunluk yöntemi: Dağınık düzenli toplumlarda, bir özelliğe ait ölçümün, sadece
o özelliği gösteren bireylerin yoğun olarak bulunduğu bir toplumun bölümünden
yapılan örneklemede saptanmasıdır. Toplumda payı önemsiz küçük gruplar örnek
içinde temsil edilmemektedir. Örneğin: Yetişkinlerde kalp hastalığı sıklığının
saptanmasında sadece 40-65 yaş arası erkeklerin alınması gibi. Sonuçlar, eğer diğer
koşullar yerine getirildi ise belli düzeyde güvenilir bilgiler üretebilir.
c- Güdümlü örnekleme: Toplumu simgelemek üzere güdümlü olarak bir özel
kümenin alınmasıdır. Sonuçlar istatistik olarak değer taşımayabilir hatta ne yazık ki
bu tür yaklaşımlar amaca uygun sonuçların özellikle eldesi için kullanılabilmektedir.
RASTGELE ÖRNEKLEME
Bir evrenden, uygun büyüklükle, istatistik hesaplarla evreni simgeleme özelliği
taşıyan ve tamamen rastgele yöntemle bir örneklem seçmek olasıdır. Buna “seçkisiz
örnekleme” veya “basit rastgele örnekleme” de denebilmektedir. Uygun sonuç,
toplumun tüm bireylerine örnek grubuna katılma olanağının tanınması ile sağlanır.
Tam bir rastlantısallığın, doğal süreçler çerçevesinde, toplumdaki özel yapısallığı,
örnekleme de oldukça yansıtacağı düşünülmüştür. Ancak dağınık düzenli toplum
özelliklerinin araştırılmasında belli kolaylıklar ve daha fazla doğruluk/güvenirlik
sağlanması amacı ile özel tipler oluşturulmuştur. Rastgele olasılıklı örneklemenin
belli başlı türleri:
a- Basit rastlantısal örnekleme
b-Dizgeli (sistematik) örnekleme
c-Katmanlı –kotalı rastgele örnekleme
d-Küme örneklemesi
e-Çok basamaklı örnekleme
a-
Basit rastlantısal örnekleme (Randomsampling ):
Rastgele örnekleme kavramına uygun olarak toplumdaki her bireye eşit
seçilme şansı tanıyan bir yöntemdir. Eş düzenli toplum özelliklerinde uygulanması
daha sağlıklı olur, dağınık düzenli toplumlarda alt toplumlar içine uygulanır. Amaç
rastlantısal seçim (kura, piyango) yapmak olduğundan ilk ana ilke olarak gereğinde
tüm toplum birimlerinin listelenebilmesi seçilme olasılıklarının numaralanması ve
mekanik (yansız) olarak seçim yapılması gerekmektedir. Belli bir sıra akışı ile gelen
olguların bulunduğu tıp araştırmalarında rastgele belirlenmiş sıra numaraları
kullanılır. Rastgele terimi körlemesine bir rassallığın belirtisi değildir. Bilinçli ama
yansız bir denetim, toplum içindeki dağılımların örneklem içine de yansıması şansını
arttıracak ve gerçek rastgelelik toplumun karmaşık yapısının benzeri olmak
çerçevesinde ortaya çıkacaktır.
Tüm evrenin numaralanması, olabildiğince eşdüzenlilik olmaz ise iyi simgeleme
yapılamaması, çok yaygın bazen çok büyük sayıda örnek gereksinimi olması bu
yöntemin yansızlık ve iyi simgeleme niteliklerini zedeler dolayısıyla gereğinde, diğer
örnekleme türlerinin aşamalarında geçiş olarak kullanılır.
Basit
rastlantısal
örneklemede örnekler özgün yöntemlerle belirlenir ve bu işleme “Randomizasyon”
(rassalama) adı verilir. Özelikle klinik deneylerde büyük önem taşıyan bu yaklaşımla
ilgili daha fazla ayrıntı ilerde verilmektedir.
En basit durumu ile basit rastİantısal örnekleme ilgilenilen konu değişken dışında
ikincil etkenler göz önünde bulundurmamaktadır. Basit rastgelelik, yüksek sayıdaki (
> 500) örneklemlerde, çok ender olmayan ikincil etkenlerin dengesini sağlayabilir.
b- Dizgeli (sistematik) örnekleme:
Rastgele örnekleme yönteminde, toplum listesi ve örneklerin saptanmasının
zorunluluğunun yanı sıra rastgele olarak bazı toplum kesimlerinden hiç örnek
alınmayabilir, bu da özellikle değişik düzenli toplumlarda simgelemeyi bozar. Bunları
gidermek için bireyleri sıralı durumda bir toplumdan önce rastgele bir birey ile
başlayarak yine yansız nesnel ön kabulü yapılan rastgele bir dizge ile örnekler
alınmaya
devam
edilir.
Bu
dizge
çeşitli
koşullara
göre
örnek
özelliğini
değiştirmeyecek bir dizge olmalıdır. Ayrıca örneklemeyi oluşturacak bireyler topluma
rastgele dağılmış bulunmalıdır. Bu yöntem tüm topluma ait numaralama ve kura
koşulunu büyük ölçüde ortadan kaldırmaktadır. Dizgeli örneklemede olanaklı olgular
listesi-sırasından öngörülmüş bir “k” sayısı – örnekleme aralığı denecektir – katlarına
göre olgu seçilir. İlk başlangıç olgusunun sırası rastgele belirlenebilir. Örneğin 480
olgudan 20 kişilik örneklem çekilecekse 480/20 = 24 olgu aralıklık bir dizge
oluşturulabilir. İlk olgu 1-24 sayıları arasından rastgele belirlenip sırası ile buna her
24 ek sayıda gelen olgu alınır – devamında başa dönüşle uygun sayıdan seçim
sürdürülür.
Daha biassız ve homojen seçim sağlar ancak yine ikincil etkenler göz önünde
bulundurulmamıştır.
c- Katmanlı rastgele örnekleme ( Stratifiedsampling) :
“Katmansal etken”,sonucu oluşturduğu, değiştirdiği düşünülen ve özelliği
betimlenmeye, kanıtlanmaya çalışılan “neden” dışında, sonucu etkileyebilecek diğer
özellikler yani etkisi giderilmeye çalışılan “karıştırıcı etkenlerdir” . Gereğinde ikincilkarıştırıcı
etkenlerin
de
dengelenmesi
için
örneklemin
çeşitli
ikincil
etken
katmanlarına/ alttoplumlarına da dağıtılması gerekir. Örneğin bir araştırmada
kadınlarla
erkeklerin
sorgulanan
etken-sonuç
düzeninde
zaten
farklı
yanıt
verebilecekleri düşünülüyorsa, örneklemde cinsiyetin katman olarak düzenlenmesi
gerekecektir. Toplum dağınık düzenli ise ve alt gruplar genelde araştırılan özelliği
etkileyebiliyorlarsa önce bu alt gruplar ayrılır ve toplum içindeki paylarına-kotalarına
göre katmanlardan rastgele örnekleme ile örnek olgu alınmasına geçilir. . “Katman”
ların bazen toplum içindeki payları bellidir, buna o katmanın “kotası” denir Örneğin
toplumda kadın / erkek  1 / 1  % 50 - % 50 oranındadırlar. Eğer katmanların
toplum içindeki payı saptanamıyor ise her katmandan eşit örnek alınır. Sonucu
etkileyebilecek ikincil etkenlerin toplum payları, örnekleme denetimli yansıtılarak,
rastgele seçim; katman’lara göre yapılır. Örneklemin katmanlara göre belirlenmesi
denetimsizlik nedeni ile çok değişkenli değerlendirme yapmak zorunluluğunu
kuramsal olarak azaltır hatta araştırmanın varsayım özelliğine göre ortadan
kaldırabilir.
Şekil 10.1.- Katmanlı-kotalı örneklemenin şematizasyonu
Toplumsal sonucu belirlenecek bir özellik, eğer belli bir cinsiyet açısından belirgin
yokluk göstermiyorsa (ör.: prostat ca.) her iki cinsiyeti eşit içererek toplumsal düzeyi
yansıtabilir. Katmanların konu açısından özellikleri aynı olmak zorunda değildir ( Ör.:
Kadın / erkeklerde tip 2 diabet ) ve her katman için ayrı değerlendirme de
gerçekleştirilebilir ve " toplumsal sonuç"
üretmek kotalarına uygun olarak
örneklemde yer alan katmanlar toplamında gerçekleşebilir. Örneğin Türkiye
genelinde metaboliksendrom sıklığı saptanacaksa örneklem, hem coğrafi bölge, hem
özgün yaş aralıkları hem cinsiyet katmanları, hem kır/kent ayrımı, vs gibi bu
sendromun sıklığının farklı olabileceği etkenler açısından ülkedeki gerçek kotalarına
göre oluşturulmalıdır. Kotaları bilinmesine karşın örneklemde yansıtılmadan yer alan
katmanlar için çeşitli düzeltmelerle – güvenilirliği azaltan – kestirimlere gidilmeye
çalışılır.
Kotalı ve katmanlı bir örnekleme geniş evren havuzlarından – örneğin büyük hasta
kümelerinden –uygun paylarla belirlenebilir. Her katmanlararası kesişimin bilinmesi
ve örneklem atanmasında her birine rastgelelik uygulanarak olguların belirlenmesi
gerekir. Katmanlı rastgele örnekleme yapılıyorsa hesaplanmış toplam örneklem
sayısı, katmanlara, kotalarına uygun olarak dağıtılır ancak katman olgu sayılarının,
bunlar
bağımsız
gruplarmışcasına
kıyaslamalar
yapmaya
yetmeyeceği
unutulmamalıdır. Katmanlı örnekleme için başlangıçta hesaplanan örneklem
hacminin de katman sayısına göre arttırılması gereğini hatırlatalım.
Örneğin cinsiyetten ve 40 yaş altı/üstü olmaktan etkilendiği bilinen bir tedavi etkinliği
ile ilgili araştırma yapılacağını varsayalım: kesişim altkatmanlar oranlarının konu
evren çerçevesinde E_<40 : % 36 E_40+ : % 15 , K_<40 : % 32 , K_40+ : % %
17 olarak saptanmış olduğu biliniyorsa , ve 2 farklı tedavi kümesinin belli sonuçsal
özellikler açısından kıyaslanmasında kıyas kümelerinin en az 75 er kişi olması
gerektiği hesaplanmışsa her tedavi kümesi: E_<40  27 (=75*0.36) , E_40+  12 ,
K_<40: 24 , K_40+: 13 olgu içermelidir. Bunların kıyassal 2 kümeye dağıtımı ise
olguların gelişlerine göre randomize olarak oluşturulabilir
d-Küme örneklemesi (Cluster sampling) :
Çok büyük toplumların kavranması -ve katmanlara ayrılmasında -sonuçta tekil
bireylere erişilmesinde büyük zorluklar çıkabilir. Araştırılacak toplumda doğal olarak
oluşmuş veya farklı amaçlarla yapay olarak oluşturulmuş, kendi içinde belirli özellikler
açısından benzerlik gösteren olgu kümelerinin (ev, okul, sokak, vs) olması
durumunda küme örneklemesi kullanılır ve kolaylık sağlar. Böylece ilk aşamada tekil
olgular değil özel-benzeş olgu kümeleri seçilir ve bunların içindeki tüm olgular
örnekleme katılır. Böylece birimlerin rastgele kendiliklerinden oluşturdukları gruplar
(küme) ana rastlantı birimi olarak alınır ve bunlardaki tekil bireylere göre saptama
yapılır. Bu saptamada da gereğinde rastgele örnekleme kullanılabilir. Örneğin; kente
tümüyle rastgele dağılmış konutlardaki rastgele bireyler yerine, rastgele sokaklardaki
(küme) tüm konutların bireyleri seçilebilir.
e-Çok basamaklı örnekleme (Multi stagesampling):
Küme örneklemesinin, diğer örnekleme türleri ile beraber, aşamalı olarak çok
büyük ve karmaşık toplumlar üzerinde uygulanmasıdır. Toplum birkaç basamak
halinde giderek küçülen alt gruplara katmanlı ve küme örneklemeler ile bölünür
bunlardan rastgele örnekler alınarak toplum temsil edilir. Kümeler iyi tanımlanmış ve
konu değişkene uygun özellikte ayrımlanmış olmalı , küme içi olgu sayısı ve yapısına
ilişkin bilgi yeterli olmalıdır.
Toplam küme sayısının en az 1/5 kadar küme seçilmesi - örneğin 81 ilden en az 17 il
-
ve bunlardan elde edilecek olgu sayısı da toplam kümeler nüfusunun en az
1/10000 i olması tercih edilmelidir.
Farklı özelliklerle tanımlanmış basamaklı “kümelemeler” oluşturulabilir ve küme içinde
olgu seçimi düzeyinde rastgele seçim yapılabilir.
Bu tip örneklemelerde adına " Desen etkisi : Designeffect " denen ve örneklem
varyansının toplumunkinden çok farklı olabilmesine neden olabilen bir bias tipine
dikkat edilmeli ve bu çerçevede de örneklem sayısı artırımına gidilmelidir.
BÖLÜM XIII
VARSAYIM DEĞERLENDİRMESİ I
PARAMETRİK KIYASLAMA YÖNTEMLERİ
Farklı araştırma tasarımı düzenlerine göre kullanılabilecek yöntemler aşağıda
değerlendirilecektir
TOPLUM- ÖRNEK KÜMESİ ORTALAMALARININ KIYASLAMASI
Bir örnek kümesinin ortalamasının, topluma ilişkin ortalama ile kıyaslanması
sürecinde toplum varyansının (σ2) bilinip bilinmemesine göre, farklı işlemler yapılır:
1) Topluma ait varyans biliniyorsa,
Çok geniş örneklemli ve yapısal açıdan da toplumu simgeleyebileceği kabul
edilen çalışmaların sonunda toplum değeri olarak kabul edilebilecek bir ortalama ve
varyansın elde bulunduğu ve bir örnek kümesi ortalamasının , bu toplum
ortalamasından farklılığının yargılanacağı zaman kullanılır.
Veriler;
:µ ±σ
Toplum
Örnek kümesi
Kıyaslama; t=
µ−x
σ
: x ± SD, n
özelliklerindedir.
formülüne göre yapılır.
n
Görüldüğü gibi topluma ait varyans bilindiğinde, örnek kümesinin standart
sapması kullanılmamaktadır. Yorumlama "t" tablosunda sonsuz serbestlik derecesi
için olan kritik değere göre yapılacak, - “t” nin 1.96'dan büyük olmasından itibaren
anlamlı farktan söz edilecektir -.
Örnek: 60 yaş kümesi erkeklerde, yaşa bağlı işitme kaybının 19 ± 6 dB olduğu
bildirilmektedir. Aynı yaş kümesindan, 45 işçide bu kayıp 26 ± 8 dB bulunmuştur bu
kümenin ortalamasının toplum düzeyinden farklı (yüksek) olduğu söylenebilir mi?
Veriler:
Varsayım:
µ ± σ 19 ± 6 dB,
H0: x = µ
H1: x ≠µ
x ± SD, n  26 ± 8 dB, 45
t=
19 − 26
= 7.86
6
45
t(∞,0.001) = 3.29  p < 0.001 dir.
Bu durumda H0 reddedilir, H1 kabul edilir.
Sonuç: Örnek kümesinin işitme kaybı topluma göre çok ileri düzeyde anlamlı
olarak daha yüksektir.
2) Topluma ilişkin varyans bilinmiyorsa
Bilgi olarak toplumun sadece ortalaması elde bulunmaktadır ve bu değer bir
örnek kümesi ortalaması ile karşılaştırılmaktadır. Bu tür kıyaslamalar özellikle toplum
değeri olarak medikal bir kritik sınırın öngörülmesi durumunda gerçekleştirilir.
Veriler;
Toplum
:µ
Örnek kümesi
Kıyaslama;
t=
: x ± SD, n
biçimindedir.
µ−x
SD
n
formülüne göre yapılır.
Örnek kümesinin standart sapması kullanılmakta ve yorumlamada da
serbestlik derecesi olarak "n-1" in kritik değerlerine bakılmaktadır.
Örnek: Belli operasyonel karar açısından bir arterin çapının 8 mm olması
gereği bildirilmiştir. 16 kişilik bir hasta kümesinde bu ölçü 8.20 ± 0.68 mm
bulunmuştur. Hastaların ortalamasının kritik sınırdan farklılığını yargılayınız.
Veriler:
µ 8 mm,
x ± SD, n  8.2 ± 0.68 mm, 16
Varsayım:
H0: x = µ
t=
H1: x ≠µ
,
8.2 − 8
= 1.17
0.68
16
t(15,0.05) = 2.131  p > 0.05 dir.
H1 reddedilecek; H0 kabul edilecektir.
Sonuç: Örnek kümesi ortalaması toplumdakinden farksız bulunmuştur.
İKİ ÖRNEK KÜMESİNİN ORTALAMALARININ KIYASLANMASI
İki örneklem kümesinin ortalamalarının kıyaslamasında parametrik seçenek
ancak iki kümenin de normal dağıldığının saptanması ile başlatılacaktır. Eğer bu
beklenti doğrulandı ise ikinci aşama küme varyanslarının eşdüzeyliliğinin (F
değerlendirmesi, Levene veya Bartlett testi) saptanmasıdır . Varyansların farklı veya
eşdüzeyli bulunmasına göre çözümleme yaklaşımları değişecektir.
A) Küme Varyansları eşdüzenli
Küme verileri ve ön değerlendirme şu şekildedir;
I. küme:
n1 , x 1 ± SD1
II. küme:
n2 , x 2 ± SD2
Daha önce açıklandığı gibi ,
F=
SDB2 BüyükVaryans
=
SDK2 KüçükVaryans
F < Ftablo ise ile varyanslar eşdüzenlidir.
Kıyaslamada kullanılmak üzere önce "ortak varyans" olarak adlandırılan değer
hesaplanır (SD2):
((n1 − 1) * SD12 ) + ((n2 − 1) * SD22 )
SD =
n1 + n2 − 2
2
ve
t=
kıyaslama ;
x1 − x2
SD 2 SD 2
+
n1
n2
formülü ile gerçekleştirilir.
Ortak varyansın değeri doğal olarak gerçek varyansların arasında ve denek
sayısı büyük olanınkine yakın bir değerdir.
Bulunan t değeri (n1 + n2 - 2) serbestlik derecesine uyan kritik t değerleri ile
kıyaslanarak yorumda bulunulur. Anlamlılık söz konusu ise gerçek ortalamalara
bakılarak karar ayrıntılandırılır.
Örnek: Fibrinojen düzeyi 41 sağlıklı yetişkinde 306 ± 48 mg/dl, 17 kronik
böbrek yetmezliği vakasında ise 348 ± 64 mg/dl bulunmuştur. Kümelerin ortalamasını
kıyaslayınız, yorumlayınız.
Öncelikle F testi ile küme varyansları kıyaslanır;
64 2
F = 2 = 177
. ; (16, 40) serbestlik derecesi için Ftablo = 2.10’dur.
48
F < F tablo olduğundan varyanslar eşdüzeyli kabul edilir.
(48 2 * 40) + (64 2 * 16)
= 1646 ;
SD =
41 + 17 − 2
2
t=
348 − 306
1646 1646
+
41
17
.
= 358
değerlendirme sd= 56 nın kritik t değerlerine göre (30 dan büyük serbestlik dereceleri
için yakın tamsayı serbestlik derecelerine bakılabilir ancak istatistiksel yazılımların
doğrudan “p” değerlerini verdiklerini anımsatalım) p < 0.001 bulunacaktır.
Sonuç: Kronik böbrek yetmezlikli vakaların fibrinojen düzeyi, sağlıklı vakalara
göre çok ileri düzeyde anlamlı olarak yüksek bulunmuştur.
B) Küme Varyansları farklı sayılıyor
Daha önce belirtilmiş olan yöntemle varyanslar kıyaslanır ve farklı bulunur ise
ortalamaların kıyaslanması için ortak varyans oluşturulmadan gerçek küme
varyansları kullanılır, serbestlik derecesi ise özel olarak oluşturulur. “sd” için bu
kestirimle değerlendirme yapmak Aspin-Welch testi veya Smith-Satterthwaite işlemi
olarak adlandırılır.
t=
x1 − x 2
SD12 SD22
+
n1
n2
formülü kullanılır.
(ortak değil gerçek varyanslar
kullanılmıştır.)
Kıyaslama için (n1 + n2 - 2) serbestlik derecesine değil, hesaplanacak özel bir
serbestlik derecesinin kritik karşılıklarına bakılır. Bu serbestlik derecesi;
(( SD12 / n1 ) + ( SD22 / n2 ) 2
sd =
(( SD12 / n1 ) 2 /(n1 − 1)) + (( SD22 / n2 ) 2 /(n2 − 1))
*
e eşittir.
sd*, sd’den (n1 + n2 - 2) küçüktür, dolayısı ile (n1 + n2 - 2) serbestlik derecesinin
karşılığı olan t değerlerinde "anlamlılık" bulunmamış ise sd*, hesaplanmadan bile
"ortalamalar arasında fark bulunamadığı" sonucuna varılmalıdır. t değeri ( n1 + n2 - 2)
serbestlik değerine göre "anlamlı düzeyde" görünüyor ise, gerçek sonuç için sd*
hesaplanmalı ve yorum buna göre yapılmalıdır. sd* değeri genellikle tam sayı olarak
bulunmaz, bu nedenle "Küçük olan tam sayı" değerine göre yorumlama yapılır.
Örnek:
Açlık kan şekeri ortalaması 25 sağlıklı yetişkinde 96 ± 10 mg/dl, 16 Tip-2
diyabet olgusunda ise 148 ± 20 mg/dl bulunmuştur. Kümelerin ortalamasını
kıyaslayınız, yorumlayınız
n1 = 25 x 1 ± SD1 = 96 ± 10
n2 = 16 x 2 ± SD2 = 148 ± 20
F=
t=
400
= 4; Ftablo(15, 24) = 2.11 < 4 olup varyanslar farklıdır.
100
148 − 96
100 400
+
25
16
= 9.65
n1 + n2 - 2 = 39 serbestlik derecesine göre p < 0.001 olup ileri düzeyde anlamlı
fark görülmektedir ,geçerli yargı için sd* hesaplanıp yorum yapıldığında;
((100 / 25) + (400 / 16)) 2
= 19.86
Sd =
((100 / 25) 2 / 24) + ((400 / 16) 2 / 15)
*
Küçük tam sayı olarak 19 serbestlik derecesi alınacaktır.
t(19,0.001) = 3.88 < 9.65 ile yine ileri düzeyde anlamlı fark bulunduğu ve hastaların
ortalamasının sağlıklılara göre yüksek olduğu sonucuna varılacaktır.
Aşağıdaki şekilde örnek verilerinin özet istatistiksel bilgiler ve sonuç yorumla
birlikte yansıtılması görülmektedir.
2
bağımsız
kıyaslamasında
kümeden
parametrik
elde
edilen
olmayan
(Wilcoxon rank sum) testi” kullanılır.
sürekli
seçenek
değişken
olarak
düzeylerinin
“Mann-Whitney
U
Şekil 7.2.
İki örneklem kümesi ortalama kıyası grafiği
EŞLENDİRİLMİŞ DİZİLER
Bu kavram içinde görünürde iki ölçümsel dizi (veya daha fazla) bulunmasına
karşın gerçekte tek bir küme, buna karşın her küme ögesinin birden fazla "durumda"
gösterdiği değerler bulunmaktadır. Örneğin aynı kişilerin yemek öncesi -yemekten 30
dakika sonraki - yemekten 2 saat sonraki - kan şeker düzeyleri gibi. Her konumdaki
değer, birbirinin "Eşi" kişiler (aynı kişi) üzerinde fakat "ayrı konumlarda" elde
edilmiştir. Araştırma, durumdan duruma fark eden "etken"in, gerçek bir farklılaşma
yaratıp yaratmadığını denetlemek için yapılmaktadır. İki durum arasındaki farkın
kuramsal olarak "0" olması, etken ögenin farklılaşım oluşturmadığını gösterecektir.
Şu halde her örnek olgu için "durumlar arası" değer farklarının belirlenmesi ve bu
"farklar dizisinin", farksızlık demek olan "0" ortalamalı kuramsal “toplum” değeri ile
kıyaslanması gerekir. Fark dizisinin "0" dan anlamlı olarak farklı bulunması, gerçek
bir fark oluştuğunu, başka bir deyişle etkenin gerçek bir işlevi olduğunu gösterecektir.
Fark dizisi oluşturulurken her olgu için aynı olmak koşulu ile çıkartmanın yönü
araştırıcıya kalmıştır; (1.2.- veya 2.-1) .Bir diğer önemli nokta da farkların cebirsel
işaretlerinin göz önünde bulundurulmasıdır. Buna bağlı olarak "0" olan, eksi ve artı
işaret taşıyan fark değerleri bulunabilir. Bilgiişlem ortamında yapılan hesaplamalarda
bu koşullar doğrudan sağlanmaktadır. Örnek bir düzen şöyle oluşmaktadır;
Olgu
1.
2. Durum
Durum
Durumlar arası
fark
1
x11
x12
d1 = x11 - x12
2
x21
x22
d2 = x21 - x22
...
...
...
...
n
xn1
xn2
dn = xn1 - xn2
Fark değerlerinin ortalama ( d ) ve standart sapması (SDd) hesaplanır. Bu işlem
esnasında da değerlerin cebirsel işaretleri önemsenir. Fark dizisinin ortalaması doğal
olarak, iki konum dizisinin gerçek ortalamalarının farkı kadar bulunacaktır. Son
aşama ise n kişinin farklı konumlardan elde edilmiş fark dizisi değerini, "0" farksızlık
toplumu ortalaması ile kıyaslanmaktadır.
Değerlendirme "eşlendirilmiş diziler için Student's t testi" ile gerçekleştirilir. Yöntemin
doğru sonuç vermesi için fark dizsinin normal dağılıma uygun olması gerekmektedir bu çerçevede DK<%30 değerlendirmesi karar için kullanılmamalıdır -.
Konumlar arası değişimi yargılamada kullanılacak olan formül :
t=
d −0 d * n
=
SDd
SDd
n
Elde edilen t değeri (n-1) serbestlik derecesine göre yorumlanır. Anlamlılık bulunması
durumunda etkinin yönü, 1. ve 2. durum dizilerinin gerçek ortalamalarına bakılarak
yorumlanır. Değerlendirmede 2 den fazla konum da bulunabilir (ameliyat öncesi,
ameliyat süresinde, ameliyattan 1 saat sonra, 24 saat sonra gibi) ve birbirini izleyen
her konum için eşlendirilmiş dizi uygulaması yapılabileceği gibi, konumlardan sadece
birine göre etki bulunup bulunmaması önem taşıyabilir ve değerlendirme sadece bu
konuma göre yapılabilir:(Ameliyat öncesi - 1 saat sonra , Ameliyat öncesi - 24 saat
sonra, vs) ancak esas olarak aşağıda kısaca değinilecek olan çözümleme yöntemi
kullanılarak genel anlamda bir farklılaşma olup olmadığı sorgulanır.
Örnek: Vücut ısısına etkisi sorgulanan – düşüreceği varsayılan -bir ilaç 9 kişi
üzerinde kullanılmıştır. Hastaların ilacı almadan önce ve sonraki vücut ısıları (°C)
aşağıdadır. İlacın etkinliğini denetleyiniz - fark dizisi normal dağılıma uygun
bulunmuştur-.
Hasta
Önce
Sonra
Fark (d) S - Ö
1
39.5
38.1
1.4
2
38.3
36.7
1.6
3
38.4
37
1.4
4
38.5
38.7
-0.2
5
39.5
38.6
0.9
6
38.2
38.7
-0.5
7
39.1
38.5
0.6
t (8,0.05) = 2.306
8
38
38
0
p < 0.05
9
38.3
37.2
1.1
X
38.64
37.94
SD
± 0.57
± 0.78
0.7
± 0.769
t = 0.7 * √9 / 0.769
t = 2.73
2.73 > 2.306 yani t > ttablo olduğuna göre ilacın önceden sonraya anlamlı bir
etki gösterdiği, önceki değerler ortalaması = 38.64 sonraki değerler ortalaması =
37.94 olduğuna göre de etkinin "azaltım" yönünde olduğu sonucuna varılmaktadır.
8. hastanın yerinde önceki ısısı = 42 ,sonraki ısısı = 36.6 , d = 5.4 olan başka
bir hasta düşünelim. Vücut ısısı fark göstermemiş bulunan ilk 8. hasta yerine, durumu
ilacın etkisi yönünde (hem de fazlası ile) olan bu yeni olgu yerleştirildiğinde önceki
değerler ortalaması yükselecek (39.08 e çıkmaktadır), sonraki değerler ortalaması
ise düşecektir (37.78 e düşmüştür). Buna bağlı olarak da t değerinin daha da anlamlı
bir düzeye erişeceği düşünülebilir, çünkü farklar ortalaması da 1.3 e erişmektedir.
Halbuki farkların standart sapması SDd = 1.699 a çıktığından değerlendirmede ,
t = 13
. * 9 / 1699
.
= 2.29 < t(8,
0.05)
bulunmakta, sonuç olarak bu yeni "ve gerçekten
ilaçtan etkilenmiş" olgu katıldığında ilaç etkisiz bulunmaktadır. Tüm vakalarda etki
aralığı (d) "-0.5 - 1.6" arasında değişirken "5.4" gibi bir fark değeri, etki yönünde
olmasına karşın SDd’ nin aşırı büyümesini, normal dağılım özelliğinin yitirilmesini ve
anlamsızlığı getirmiştir böylece - önceki sonuç da göz önünde bulundurulduğundahiç beklenmemesi gerek bir sonuçla karşılaşılmaktadır. Anlaşılacağı üzere aşırı
değerlerin varlığı ve yanlış değerlendirme yöntemi seçimi hatalı sonuçlar alınmasına
neden olmaktadır. Bu çerçevede fark dizisinin de normal dağılıma uygunluğu
durumunda parametrik yaklaşım uygulanması seçilmelidir - bu yeni düzenleme ile
yapılan
değerlendirme
parametrik
olmayan
yaklaşımla
anlamlı
farklılığı
gösterebilecektir ; Wilcoxon testi , p=0.021 -.
2 konumlu eşlendirilmiş dizilerde sürekli değişken düzeyleri farklarının
değerlendirilmesinde parametrik olmayan seçenek olarak “Wilcoxon işaretli
sıra sayıları testi” kullanılır.
Bir örneklem kümesi üzerinde birden çok konumdaki değişim yargılanabileceği
gibi, birden çok konumu bulunan birden çok kümenin bulunduğu araştırmalar da
kurgulanabilir. Böylece değerlendirilebilecek “farklılaşım” konumları da artacaktır; her
küme için konumlar arası değişim olup olmadığı, kümeler arasında her konumda
ortalama farkı olup olmadığı, kümelerin genel değişim özellikleri arasındaki farklar ve
kümeler arası konum farkları farkı gibi çok ayrıntılı irdelemeler yapılabilir.
Bu tür yaklaşımlar veya en basitinden 2 den çok konum arasındaki
farklılaşmalar genel olarak irdelenen tek kümeli araştırmalarda “Tekrarlı ölçümler
varyans çözümlemesi” (Repeated measures ANOVA) yöntemi ile değerlendirme
yapılır.
Şekil - 7.3.
3 kümenin 5 konumlu izlemi grafiği
BÖLÜM XIV
VARSAYIM TESTLERİ II
PARAMETRİK OLMAYAN VARSAYIM TESTLERİ
Nicel verilerde kullanılan parametrik testlerin formülleri bu verilerin belli dağılım
biçimlerine sahip oldukları düşünülerek oluşturulmuştur, (normal dağılım, t dağılımı
gibi) dolayısı ile dağılımların farklı olduğu veri gruplarını (varyanslar farklı) veya
dağılımın tipinin bilinmediği (veri sayısı azlığından veya ölçümlerin dengesiz
dağılımından kaynaklanabilir) grupları değerlendirirken bu testlerin kullanımı yanlış
sonuçlar
getirebilir.
Parametrik
testler
dağılımsal
önkabuller
çerçevesinde
yapılandırılmışken parametrik olmayan testlerin bu tür "parametrik" temelleri dolayısı
ile kısıtlılıkları yoktur bu nedenle de "dağılımdan bağımsız (distribution free) testler"
adını alırlar. Bu tip testler değerlendirmedeki verilerin büyüklük sıralamasındaki sıra
numaralarına göre işlem görürler dolayısı ile de "sıra sayı toplamı" testleri (rank sum)
olarak da adlandırılırlar.
3 sayısal değer varsayalım : 1 , 3 , 6 ; Bunların ortalaması 3.33'dür ve "6" değeri 3.
sıradadır , büyüklüklere göre sıra numarası verdiğimizde (1.,2.,3.) sıra numaraları
toplamı da 6'dır.
Dizideki 6 değerinin yerine 56 bulunsa idi ortalama 20'ye çıkacaktı dizinin SD değeri
çok büyüyecekti halbuki 56 yine büyüklük açısından 3. sırada olacak ve sıra sayıları
toplamı yine 6 olacaktı. Anlaşılacağı üzere sıra sayısı tabanlı testler gerçek
değerlerin büyüklüklerinden etkilenmemektedirler dolayısı ile normal dağılmayan, uç
değerler içeren veri setlerinde çok daha güvenilir sonuçlar verirler.
Bu temel mantıksal yaklaşımla kurgulanan parametrik olmayan testler, kullanımlarına
uygun veri setlerinde kullanıldıklarında parametrik testlerin kendi dağılımsal taban
kısıtlılıkları nedeni ile anlamlılık bulamadığı durumlarda anlamlı sonuçlar bulabilme
avantajına sahiptirler.
Parametrik olmayan testler kıyassal kümelerin "ortalamalarını" kıyaslamazlar, genel
anlamda büyüklük düzenlerini kıyaslarlar dolayısı ile normal dağılmayan verilerin
bulunduğu araştırmalarda - gereğinde ortalama ve SD de eklenerek - medyan ve
ÇAĞ (çeyreklikler arası aralık; IQR) değerlerinin sunulması gereklidir.
Sonuç
olarak, uç değerde yapay nicel değerler bulunan veya verilerin dağılım biçiminden
kuşku duyulduğu durumlarda nicel özelliklerin değerlendirmesinde kullanılan testlere
parametrik olmayan (non-parametrik) testler denir.
Parametrik olmayan istatistiklerin olumlu yönleri şunlardır;
• Öğrenimi ve uygulaması kolay ve hızlıdır.
• Sınıflama
sıralama
özelliğine
göre
değerlendirildiğinden
veri
ölçüm
ve
toplamasında kolaylıklar getirebilir.
• Parametrik testlerin gerektirdiği katı uygulanabilirlik koşullarını gerektirmezler.
Bu olumlu taraflarına karşın duyarlılıkları daha düşüktür yani gerçek farkların
ortaya çıkarılmasında (test tipine göre) parametrik testlere göre biraz daha zayıftırlar.
Bundan dolayı uygun koşullarda öncelikle parametrik testlerin kullanımına öncelik
verilmektedir.
Ölçümsel veriler için çeşitli uygulama tiplerinde kullanılabilecek belli başlı
parametrik olmayan testler şunlardır;
1) Toplum ortancasına göre, grup verilerinin kıyaslanması (işaret testi)
2) İki grup verilerinin kıyaslanması (Mann-Whitney U testi)
3) Varyans analizi (Kruskal-Wallis testi)
4) Eşlendirilmiş dizi yargılaması (Wilcoxon testi)
İŞARET TESTİ
Bir grubun verilerinin bir toplum ortalaması ile kıyaslanması için kullanılır.
Gerçekte amaç, grubu kuramsal bir ortanca değer ile kıyaslamaktır ama eğer toplum
normal dağılım gösteriyor ise zaten ortanca ve ortalama çakışık sayılabileceğinden
kıyaslama toplum ortalamasına göre yapılıyor sayılabilir.
Yöntem, veri dizisinde, kuramsal değerden büyük olanlara "+" işareti, küçük
olanlara "-" işareti verilerek gelişir.
Ortalama ile aynı değerdekiler çalışmadan
çıkarılır. Bundan sonra "+" işaretlilerin sayısı (n+) ve "-" işaretlilerin sayısı (n-)
saptanarak, süreklilik düzeltilmesi yapılmış bir χ2 - χ2 testi ile ilgili ayrıntılar izleyen
bölümde incelenecektir - formülünde yerine konur elde edilen χ2 değeri 1 serbestlik
derecesine göre yorumlanır.
χ =
2
( (n +) − (n −) − 1) 2
( n + ) + ( n −)
Örnek: Aşağıda 14 kişilik örnek grubunun kalp vurum sayıları, 80 v/d kuramsal
ortalamasına göre irdelenmektedir. 80 değerine göre veriler (+) veya (-) olarak (80 e
eşit olan iptal edilmiştir) değerlendirilerek;
76 80 84 90 92 104 82 78 84 90 96 104 100 87
-
* +
+ +
(n+) = 11;
χ =
2
+
-
+ +
+
+
+
+
(n-) = 2 bulunmuştur.
( 11 − 2 − 1) 2
13
+
= 4.92
( χ2
(1,0.05)=
3.841 )
Bu değer χ2(1,0.05) değerine göre anlamlı fark bulunduğunu başka bir deyişle
örnek grubu kalp vurum düzeyinin kuramsal ortalamadan yüksek olduğunu
göstermektedir.
χ2 formülüne başvurmadan başka bir formül ile, belli sayıda bir denek
grubunda anlamlılık elde edilebilmesi için uygun en fazla kaç ters işaretli deneğe izin
olduğu bulunabilir. Başka bir deyişle az sayıda olan işarete sahip en fazla denek
sınırı saptanır.
Toplam n kişilik bir grup için bu sınır sayısı;
S = ((n − 1) / 2 − (0.98 * (n + 1) )
ile hesaplanır ve S alt tam sayı olarak
alınabilir.
Yukarıdaki örnekte; S = ((13 − 1) / 2) − (0.98 * 14 ) = 2.33 ;
S = 2 olmaktadır ve bulunan 2 (-) sonuç, χ2 formülü ile de vurgulandığı gibi anlamlı
fark getirmektedir.
Formüldeki 0.98 değeri 0.05 anlamlılık sınırı için kullanılan bir kat sayı olup,
0.01 düzeyindeki bir anlamlılık için bu değer 1.28 alınacaktır. S sayısına dayanarak
yapılacak değerlendirmeler için n ‘ in 30 dan büyük olması daha sağlıklı olmaktadır.
MANN - WHITNEY U TESTİ
Ölçümsel verilerin, (iki ayrı gruptan elde edilen) karşılaştırılması amacı ile
kullanılır. Kıyaslama aslında medyanları ve büyüklük sıralamalarını kıyaslamaktadır.
Uygulanışı:
1) Birinde n1 diğerinde n2 değer bulunan, iki ayrı grup birleştirilerek n1 + n2
değer elde edilir ve bunlar küçükten büyüğe doğru dizilirler. Gerekli olacağı için her
değerin üzerine hangi gruba ait olduğu işlenir. Sonra bu değerlere yine küçükten
büyüğe olmak üzere (1’den n1 + n2 ye kadar) sıra numaraları verilir. Birbirine eş olan
(ortak) ölçümsel değerlerin sıra numaraları, gerçekte almak durumunda oldukları sıra
numaralarının ortalaması kadardır. Bunlardan sonraki ölçümsel değerlerde, gerçekte
olması gereken değeri alarak devam eder. Bu tür verilerin olabildiğince az olması
testin geçerliliği açısından önemlidir.
1. Basamağın örnek üzerinde uygulanması
A
Grubu
B
(n1=8)
= 7)
65
39
40
70
58
70
Grubu (n2
73
48
70
66
39
59
76
63
83
Düzenleme
Grup
B
B
A
A
A
A
B
B
B
A
B
A
B
58
59
63 65
66
70
70
5
6
7
9
11
11
A
Ölç.De 39
39 40
ğ.
70
73 76 83
Sıra
1.5 1.5
no
11 13 14
3
A
48
4
8
15
Eş veri düzenleme:
1 ve 2
10,11 ve 12
Ort:1.5
Ort:11
2) Grupların aldığı sıra numaraları, her grup için ayrı ayrı toplanır. 1. grup sıra
numaraları toplamı; T1 ve 2. grup sıra numaraları toplamı; T2 dir. Bundan sonra "U"
ve "U'" değerleri bulunur.
U=
U′ =
n1 * n2 +
n1 * (n1 + 1)
− T1
2
n1 * n2 +
n2 * (n2 + 1)
− T2
2
Sonuçlar;
T1 + T2 =
(n1 + n2 ) * (n1 + n2 + 1)
2
dir.
ve
U + U′ = n1 * n2
eşitlikleri ile kontrol edilebilir.
2. Basamağın örnek üzerinde uygulanması;
T1 = 1.5 + 3 + 5 + 8 + 11 + 13 + 14 + 15 = 70.5
T2 = 1.5 + 4 + 6 + 7 + 9 + 11 + 11 = 49.5
U = 7 * 8 + ( 8 * 9 / 2 ) - 70.5 = 21.5
U′ = 7 * 8 + ( 7 * 8 / 2 ) - 49.5 = 34.5
T1 + T2 = 70.5 + 49.5 =
(7 + 8) * (7 + 8 + 1)
= 120
2
U + U' = 21.5 + 34.5 = n1 * n2 = 56
Herhangi bir U değeri kullanılarak- z değeri işareti farklı olarak elde edilir,
sonuçta yorum değişmez- , "z " istatistiği ile çözümleme yapılır ve;
Z=
U − (n1 * n2 / 2)
n1 + n2 + 1) * n1 * n2
12
z değeri 1.96 dan büyük ise anlamlı fark vardır.
Sayısal
örneğimizin
biyoistatistiksel
değerlendirme
yazılımı ile çözümleme çıktısına göre sonuç p=0.450 'dir
ve
kümelerin
düzeyleri
arasında
anlamlı
fark
bulunmamaktadır.
Ayrı gruplardan olan ortak sıra numaralarının, toplam denek sayısının yirmide
birinden fazla olmamasına özen gösterilmesi önerilmektedir.
PARAMETRİK OLMAYAN VARYANS ANALİZİ
(Kruskal-Wallis testi)
Parametrik olmayan bir varyans analizi yöntemidir, herbiri n* denek içeren k
adet grubun karşılaştırılmasında kullanılır. Her gruptaki denek sayıları 5 veya fazla
ise k-1 serbestlik derecesine uygun bir X* dağılımı söz konusudur. Taest, dağılımı
bilinmeyen ölçüm toplumlarında, varyans analizine göre 0.95 güvenle kullanılır.
Bu testte de k grubun hepsindeki denekler birim ölçümlerine göre, sıraya
konarak, sıra numarası alırlar. Her bir gruptaki deneklerin sıra numaraları toplamı o
grubun toplam sıra değerini oluşturur. U testinde olduğu gibi eş değerler alacakları
sıra değerlerinin ortalamasına sahiptirler.
Tüm grupların sıra numaraları toplamı (T) yine T= N(N+1)/2 eşitliği ile
doğrulanır ve test ölçütü;
 12
H = 
 ( N + 1) N

TG 2 
N
−
+
3
1
(
)
∑ nG 


formülü ile hesaplanır.
Eş değere sahip, yani ortak sıra numarası almış ölçümler var ise formülde
düzeltme yapılır ve;

 12
TG 2 
3
−
+
3
1
N
(
)
H = 

∑
 / [1 − ( ΣOG / ( N − N ))]
+
1
N
N
nG
(
)



düzeltilmiş formülü kullanılır.
Burada;
N: Çalışma toplam denek sayısı
nG: Bir gruptaki denek sayısı
TG: Bir gruptaki sıra sayıları toplamı
OG: Her bir ortak durum için hesaplanan ve (S3 - S) ye eşit olan düzeltme
katsayısıdır. "S" ortaklığa giren eş ölçüm sayısıdır. Örneğin birinde 4 eş ölçüm,
diğerinde 3 eş ölçüm bulunan 2 ortaklık durumunun bulunduğu çalışmada;
∑OG= (43 - 4) + (23 - 2) = 66 dır.
Örnek: 3 ayrı gruptan elde edilen (grup denek sayıları farklı) kalp hızı (v/d)
düzeylerinin karşılaştırılması.
A gr.
Ölçüm
B gr.
Sıra S.
Ölçü
C gr.
Sıra S.
Ölçüm
Sıra S.
m
76
1
84
2
90
8.5
85
4
85
4
110
14
87
7
90
8.5
122
17
94
10
104
12
115
15
96
6
120
16
98
11
85
4
107
13
125
18
n3=7
T3
n1=6
T1
= n2=5
96.5
T2=
42.5
N = 18,
=
96.5
T = 18 * 19 / 2 = 171
Çalışmada iki ortaklık vardır, ilki 3 adet 85 değeri olması, diğeri, 2 adet 90
değeri olması biçimindedir, dolayısı ile;
∑OG = (33-3) + (23-2) = 30 ve
H=
 12  32 2 42.52 96.52 
+
+

 − (3 * 19)

5
7 
 18 * 19  6
[1 − (30 / (18 3 − 18))]
= 8.38
Grup sayısı 3 olduğuna göre 3-1=2 serbestlik derecesi için χ2 tablosundan yorum
yapılır ve χ2(2,0.02) = 7.82 olduğundan gruplar arasında kalp vurum düzeyi açısından
anlamlı fark bulunduğu sonucuna varılır.
Kruskal Wallis testi ile anlamlılık bulunması durumunda gerekli ikili
kıyaslamalar Mann-Whitney U testi ile gerçekleştirilir ancak değerlendirmenin
anlamlılık sınırı olarak Bonferroni düzeltmesi ile saptanacak olan anlamlılık sınırı
kullanılmalıdır.
WILCOXON TESTİ (Eşlendirilmiş diziler için)
Eşlendirilmiş dizilerde, durumlar arasındaki farklılaşmanın değerlendirilmesi,
parametrik olmayan Wilcoxon testi ile yapılabilir.Bazı kaynaklarda Mann Whitney U
testi , “ Wilcoxon “ testi olarak geçmekte , buna karşılık eşlendirilmiş diziler için olan
bu uygulama “ Wilcoxon işaretli sıra sayıları testi “ olarak geçmektedir.
Uygulanışı:
1- Eşlendirilmiş dizilerde "t" testi uygulamasında olduğu gibi n denek için iki
durumdaki ölçümsel değerler ve durumlar arasındaki farklar yazılır (cebirsel işaretler
belirtilerek). Sonra işaretler önemsenmeden, farklar küçükten büyüğe sıralanır.
(Örnek: -5.5 ile +5.6 değeri arada değer yok ise, birbirini izleyen sıra numaraları
alırlar). U testinde olduğu gibi aynı sıra numarasını alan değerlere ortalama sıra
numarası verilir. "0" olan farklara 1 den başlayarak sıra numarası verilir, ancak tek
sayıda "0" var ise herhangi biri değerlendirmeden çıkarılır. Sıra numaralarının önüne,
farkın gerçekte taşıdığı cebirsel işaret konur."0" değerlerinin yarısının önüne "+"
yarısının önüne "-" işaret konur.
2- Son aşamadaki + veya - işaretli sıra numaralarından, hangisi adet olarak
daha az ise, o sıra numaraları toplanır (T). Sonuçta bu T değeri kullanılarak test z
istatistiği ile değerlendirilebilir - denek sayısının 25 den fazla olduğu durumlarda daha
güvenilirdir-, z değeri aşağıdaki formülle bulunur;
z=
T − (n * (n + 1) / 4)
n * (n + 1) * (2n + 1)
24
Formülde;
T : Az sayıda görülen işaretin sıra numaraları toplamı
n = Denek sayısı
z, 1.96 dan büyükse durumlar arasında anlamlı fark vardır. Farklılaşma gerçek
ortamlara bakılarak saptanır.
Kilo verdirmeye yönelik bir diyet 12 hasta üzerinde uygulanmış
Örnek:
hastaların diyet öncesi ve sonrası ağırlıkları verilmiştir. Diyetin ağırlığa etkisi nedir?
Önce
Olgu
(Kg)
Sonr
Fark
a
(Ö-S) sıralam
(Kg)
Ham
Ortakları
düzenleme
a
İşaretler
i
düzenle
me
1
79
61
+18
11
11
+11
2
89
86
+3
4
4
+4
3
70
70
0(1)
1
1.5
+1.5
4
83
84
-1
3
3
-3
5
101
87
+14
10
10
+10
6
84
76
+8(1) 7
6.5
+6.5
7
93
83
+10
9
9
+9
8
83
83
0(2)
2
1.5
-1.5
9
81
72
+9
8
8
+8
10
91
91
0(3)
İptal
Tek sayıda var
0
11
96
90
+6
5
12
92
84
+8(2) 6
5
+5
6.5
+ 6.5
(-) işaretler (+) işaretlerden daha azdır (2 ve 9). (-) lerin mutlak sıra değerleri
toplanır. T= 3 + 1.5 = 4.5 ve sonuç z= 2.53 olduğundan, önce sonra arasında anlamlı
fark, "düşüş" vardır (önce-sonra değerleri genelde (+) olduğundan veya doğrudan
önce-sonra ortalamaları belirlenerek).
Farklı biyoistatistik çözümleme yazılımları özellikle "ortak" değerler ve sıfırlar için
değişik algoritmalar kullanabilmektedirler ve sonuçları birbirlerinden biraz fark
gösterebilir.
Eşlendirilmiş dizilerin çözümlemesinde ikinci bir non-parametrik yöntem olarak
işaret testi de kullanılabilmektedir.
Farksızlık denetimi yapan eşli dizilerde her
deneğin 2 ayrı durumunun ölçümleri farkı, farksızlığı simgeleyen "0" değerine göre
değerlendirilebilir, yani yine durum farklarının (aynı yöne doğru çıkartma işlemi
yapıldığında), "+" veya "-" işareti ile simgelenmesi sonucu elde edilen sayılar, işaret
testinde kullanılan formüllere yerleştirilerek karara varılabilir, "0" fark gösteren
denekler çalışmadan çıkartılır.
VARSAYIM DEĞERLENDİRMESİ-3
Kesikli değişkenler için, Çiftdeğişkenli Çözümlemeler
KESİKLİ SÜREKLİ DEĞİŞKENLER İÇİN “KONTENJANS TABLOLARI”
Bir nitelliğin alttip seçeneklerine (ortam değişkeni), ilgilenilen bir nitel konu değişkenin
olgusal alttip dağılımının yargılanması bu başlığın temel kalıbıdır. –Örneğin kadın ve
erkeklerdeki (ortam değişkeni: cinsiyet, sağlak ve solakların (konu değişken: el
kullanım yönü) dağılımının kıyaslanması-. Nitel dağılım yargılamalarında büyük sorun
yöntembilimsel yanlışlar yapılmasıdır. Bunlar “Bergson bias” olarak adlandırılan ve
yanlış ortamlardan nitel özellik örneği olgular seçilerek hatalı nedensellikler
üretilmesinden başlar, “payda belirsizliği”ne dek uzanır.
Nicel konu değişken yargılamalarında olduğu gibi ikinci etkenlerin denetiminden emin
olmaksızın nitel değişken yargılamalarına da hemen çiftdeğişkenli olarak girişilmesi
hatalıdır.
Pek çok etken bu kalıbın yapılandırılmasını farklılaştırır ve uygun çözümleme
tekniğinin seçimini belirler.
Nitel alt tip seçeneklerine araştırma olgularının sayısal dağılımı “kontenjans
tablolar“ aracılığı ile gerçekleştirilir. Bunlar ise sorgulanan varsayımın yapısına
doğrudan bağlıdır. “Çapraz tablo” adını da alan kontenjans tabloları iki nitel
değişkenin alttiplerine göre olan olgu sıklık dağılımını veren “matris” düzenleridir.
Sıralar bir değişken tipinin alt seçeneklerini, kolonlar diğer değişkenin alttiplerini
belirler ve sıra-kolon kesişimleri “hücre” adını alır. Aşağıda tipik bir kontenjans
tablosu sunulmaktadır:
Kızamık var
Kızamık
Toplam
yok
Aşılanan
30
670
700
Aşılanmaya
400
500
900
430
1170
1600
n
Toplam
Araştırmada yer alan her veri mutlaka bir ve sadece bir hücre içeriğinde bulunmalıdır.
Başlık özellikleri açısından çok fazla seçenek pek çok sorun içerecektir dolayısı ile
araştırmanın özellikleri açısından da sorun yoksa “Diğer” başlığı taşyan kolon veya
satırlar oluşturulabilir.
Daha önce de değinildiği gibi, tipik olarak 3 kontenjans tablosu bulunr :
•
Tek satırlı tablo: Tek bir değişkenin alttiplerine dağılımı yansıtır :Örnekte 5
alttipli bir değişken
-40
41-45
46-50
51-55
55+
Toplam
Menopoza giriş yaşı
görülmektedir :
• Çok alttipli 2
değişken (biri en az 3 altseçenekli olmak üzere s: satır X k:kolon). Örnekte
Tip-2 DM olgularının cinsiyet ve yaş aralıklarına dağılımı verilmiştir :
•
4 gözlü tablo: (her biri 2 şer alttipli 2 değişken  2 dikotom değişken . Bu
tablo aslında bir öncekinin
Cinsiyet \ Yaş aralığı
bir alt biçimi olarak ele
alınabilir
gözükmektedir
-30
30-39
40-49
50-59
60-69
Erkek
Kadın
,
ancak medikal alanda özel kullanımı ve kendine özgü teknikleri olması nedeni
ile ayrı ele alınmaktadır.. Örnekte Grip olgularının aşılanılmışlık durumuna
göre dağılımı verilmektedir :
Sağlık durumu \ Aşı
Var
Yok
Toplam
Grip Var
Grip Yok
Araştırmanın amacı , varsayımı doğrultusunda yapılandırılmış olan kontenjans
tablolarındaki veriler , bu varsayımın temel sorusu çerçevesinde belli tipik kalıplara
yanıt bulmak için çözümlenebilirler :
70+
Toplam
Bağımsızlık: 2 değişken bulunmaktadır ve bir değişkenin alttiplerine olan dağılımın
diğer değişkenin alttipleri açısından belli bir benzerlik / ilgisizlik gösterip göstermediği
 bağıntı sorgulanmaktadır. Örneğin hematokrit düzeyi –nitelemesinin : Düşük
/Normal/Yüksek , Parite seçeneklerine göre dağılımı : Nullipar/1-2/3-5/5+ gibi.
Homojenlik / Eşdüzenlilik: Ya tek bir değişken bulunmaktadır ve bu değişkenin
alttiplerine dağılım oranlarının eşdeğer olup olmadığı sorgulanır ( Ör.: Tifo olgularının
yılın 4 mevsimine eş oranda dağılımının sorgulanması ) ya da 2 değişken ile , birinin
alttiplerine dağılımının diğerinin tüm alttiplerinde de benzerliğinin sorgulanması ( Ör.:
Kadın ve Erkeklerde en önemli 6 ölüm nedenine dağılımların benzerliğinin
sorgulanması ) gerçekleştirilir.
“Uyum İyiliği” değerlendirmesi – Goodness-of-fit : Normal olarak tek bir değişken
bulunmaktadır ve bu değişkenin alttiplerine olan dağılımın bilinen belli tip bir dağılıma
(Ör.: Bir yöredeki kan gruplarına dağılımın o toplumun bilinen dağılım düzenine
uyumunun sorgulanması ) veya belli bir kuramsal dağılımın beklentilerine uygunluğu
sorgulanmaktadır( Ör.: 3’er çocuklu ailelerdeki çocuk cinsiyet tiplemeleirne dağılımın
Binom dağılımına uygunluğu).
Kontenjans tabloloları çeşitli biyoistatisitksel yöntemlerle çözümlenebilirler: Kikare , Fisher kesin olasılık , Olabilirlik oranı (Likelihood Ratio):G2 , KolmogorovSmirnov testi , vs. Uygun testin seçimi araştırma varsayımı , hücrelerdeki veri
büyüklükleri , tablo tipi, satır ve kolon sayıları gibi çeşitli etkenlerce belirlenir.
KONTENJANS TABLOLARINDA ÖZELLİKLER
Farklı içerik ve yapıdaki kontenjans tabloları çözüm seçenekleri ve yargılama
kritik değerleri açısından bazı özellikler kullanırlar ve değerlendirmeler bunları temel
alır .
GÖZLENEN VE BEKLENEN DEĞERLER
Kontenjans tabloların, sayısal içeriklerini, belli tip kuramsal veya oluşumsal dağılım
özelliklerine
uygunlukları
açısından
çeşitli
testlerle
yargılarız.
Bu
kavram
çerçevesinde tabloda yer alan gerçek , “gözlenmiş” olan verileri, kuramsal açıdan
orada olması “beklenen” bazı sanal değerlerle karşılaştırmamız söz konusudur.
Tablolardaki her “hücre” tek bir değişkenin bir alttipinden olan olguların veya iki farklı
değişkenin kesişen bazı alttiplerinin özelliğindeki olguların sayısını yansıtır; bunlar
araştırmada gözlemlenerek sayısallaştırılmış gerçek değerlerdir ve yer aldıkları
hücreye göre adreslenirler. Örneğin “sıralarda” yer alan değişkenin ikinci alttipi ile
"kolonlardaki" değişkenin üçüncü alttipi “G23” adresindeki sayıdır. Tek satırlı bir tablo
sadece cinsiyet tiplerinde yapılandırılarak 123 erkek ve 97 kadın yansıtıyorsa bunlar
cinsiyetlere ilişkin “gözlenen“ değerlerdir. Buna karşılık eğer kuramsal olarak
cinsiyetlere dağılımın eş oranda olduğu varsayılırsa bu tablodaki toplam 220 olgu için
110’ar erkek ve kadın olması “beklenir”. Farklı tablo – ve varsayım-
tipleri için
beklenen değerlerin hesaplanması basit “orantılandırmalara” dayanır.
Tek değişkenli tabloda beklenen değerler
Eğer değişkene ilişkin toplam olgu sayısında herhangi bir öngörülen oransal
dağılım yapısı yoksa, her gözün beklenen değeri, toplam olgu sayısı alttip sayısına
bölünerek elde edilir ve hepsi birbirine eşit olur.
Eğer belli bir dağılım düzeni öngörülüyorsa veya kuramsal olarak hesaplanıyorsa her
gözün beklenen değeri ;o gözün gözlenen değeri ile o göz için öngörülmüş/
hesaplanmış oranın çarpımına eşittir.
İki değişkenli tabloda beklenen değerler
S satır sayısına ve k kolon sayısına sahip bir kontenjans tablosunda ,her göz
yer aldığı satır değişkeninin “i.” Satırında , kolon değişkeninin “j.” Kolonunda
bulunarak Gij adresi taşımaktadır. Araştırma olgularının genel toplamından (N) başka
, her satırın kendi toplamı (örneğin Ts1 : ilk satır toplamı) ve her kolonun kendi
toplamını (örneğin Tk2 : 2. Kolon toplamı) belirlersek bir kontenjans tablosunun
“adresleri” şu şekilde biçimlenir :
Herhangi bir Gijgözünün beklenen değeri de bu simgeler çerçevesinde: Bij = Tsi * Tkj
/ N olarak hesaplanır. Aşağıdaki örnekte bu çerçevede hesaplanmış değerler
verilmektedir:
Farkedileceği gibi bir satırın toplam beklenen değeri o satırın toplam gözlenen
değerine eşittir, aynı özellik kolonlar için de geçerlidir.
Kontenjans tablolarına uygulanacak çözüm yöntemlerinin seçiminde 5’den
küçük beklenen değerler taşıyan gözlerin sayısı ve toplam tablo gözleri içindeki oranı
büyük önem taşır. Örneğin çok satır X çok kolonlu tablolarda – 4 gözlü tablolar
dışında – bu oranın %10 dan fazla olması , o tabloya ki-kare testi uygulaması
yapılmamasını öngörecektir. Bu çerçevede 3X2 lik bir tabloda, ki-kare uygulaması
için tüm gözlerin beklenenlerinin en az 5 olması , 4X4 lük bir tabloda ise (16 göz)
sadece bir gözün (%16.6) 5 den küçük beklen değer taşıması uygun olacaktır.
Zorunlu nedenlerle bu tür tablolarla karşılaşılması durumunda ileride sözü edilecek
başka yöntemler kullanılabilecektir. Bununla birlikte herhangi bir kontenjans
tablosunda boş: 0 olgu bulunan gözlerin bulunması da uygun olmamaktadır. Klinik
tanımsal kavramlar açıdan sakınca oluşturmuyorsa, fazla sayıda 5’den küçük değerin
ve/veya
boş
gözlerin
bulunduğu
tablolarda,
bazı
kolon
ve/veya
satırların
birleştirilmesi ile çözümlemelere uygun özellikte tablolar oluşturulabilir. Aşağıdaki
örnekte bu yönde bir yaklaşım
sergilenmektedir :
C ve D kolonları klinik tanımlar
açısından sorun oluşturmayacağı
için birleştirilmiş ve ilk tablodaki
boş gözün ortadan kalkmasınının
yanı sıra düşük beklenen değerler
de düzenlenmiştir.
TABLO SERBESTLİK DERECESİ
Diğer istatistiksel testlerin de çoğunda olduğu gibi, kontenjans tablolarında
kullanılan
testler de,
tablonun
özelliğine
bağlı olarak
derecelerinin kritik değerleri çerçevesinde yorumlanırlar:
belirlenen
serbestlik
Tek değişkenli - tek satırlı - tabloda serbestlik derecesi
"k" altnitelik taşıyan bir tek satırlı tablonun serbestlik derecesi,
sd= k-1'dir. Toplam gözü sayılmayacaktır.
sd = 4-1=3
2 değişkenli - (S x K )- tabloda serbestlik derecesi
Satır başlıkları - altnitelikleri olarak "s" sayıda ve kolon altnitelikleri olarak "k" sayıda
özellik taşıyan taşıyan bir tablonun serbestlik derecesi, sd= (s-1) X (k-1)'dir.
sd = (2-1) X (4-1) = 3
4 gözlü tabloların serbestlik derecesi her zaman (2-1)x(2-1) = 1 'dir.
KONTENJANS TABLOLARI DEĞERLENDİRME YÖNTEMLERİ
Yapısının, varsayımının
ve göz içeriklerinin farklılığına göre kontenjans
tablolarının çözümünde farklı yöntemler kullanılır : ki-kare ( χ2 ) , Fisher kesin olasılık
testi , Likelihood (olabilirlik) oranı , Kolmogorov-Smirnov testi, vs. Bu bölümde en
önemli ve yoğun kullanılan yöntem olan χ2 ayrıntılandırılacak , diğer yöntemler
biyoistatistik
incelenecektir.
yazılım
çıktıları
çerçevesinde
sadece
kullanım
özellikleri
ile
Kİ-KARE (χ2 ) YÖNTEMİ
Pearson χ2, testi bir kontenjans tablosunda gözlenen veri düzenini, sorgulanan
bir varsayım düzeni çerçevesinde yargılamak için kullanılır. Temeli özel bir dağılıma
,”ki-kare”
dağılımına
dayanmaktadır.
Test,
kontenjans
tablosu
gözlerindeki
“gözlenen” ve “beklenen” değerler üzerinde yapılandırılır ve her gözün ki-kare değeri
: (G-B)2 / B şeklinde hesaplanır. Sonuçta, k kolonu ve s satırı olan bir tablonun
toplam ki-kare değeri:
k
χ toplam = ∑
2
i =1
s
∑χ
j =1
2
ij
formülü ile hesaplanır.
Bir kontenjans tablosunda, koşullar ki-kare çözümlemesi için uygunsa aşağıdaki
basamakları izleyen bir süreç gerçekleştirilir:
1- Tablo çerçevesinde öngörülen varsayımın belirlenmesi :
Farklı tablo tipleri için farklı varsayımlar öngörülebilir. S X K tablolar için (4 gözlü
tablolar dahil) temel kalıp : “Satır başlıkları arasında , kolon başlıkları açısından fark
bulunup bulunmadığını“ sorgulamaktır.
Örnek :Sigara içenlerle içmeyenler arasında
KOAH sıklığı açısından fark bulunmaktadır !
2-
Gözlerin “beklenen” değerleri bulunur,
3-
Gözlerin ve devamında da toplam tablonun sonuç ki-kare değeri
hesaplanır,
4-
Bulunan sonuç ki-kare değeri, tablo serbestlik derecesine uygun
serbestlik derecesi kritik değerlerine göre yorumlanır. P<0.05 sonucu
varsayımın geçerliliğini vurgular.
Güncel yazılımlar p değerlerini doğrudan sunmaktadırlar.
Anlamlı farklılık bulunması durumunda, 4 gözlü tablolardaki gerçek değerlereoranlara bakılarak ayrıntılı yorumlar üretilebilir ancak diğer tip tablolarda sadece
“fark”
varlığı
vurgulanmış
olur
ve
ayrıntılandırmak
için
gereğinde
başka
değerlendirmeler gerekebilir.
Örnek
:Cinsiyetler
arasında
BKI
aralık
sınıflarına
dağılım
farklılığının
değerlendirilmesi.
Bazı
beklenenlerin
hesaplanmasına örnek
olarak :
Kadın; 21-28 : 88 * 90
/ 159 = 49.81
Erkek , >28 : 71 * 48 /
159 = 21.43
Toplam ki-kare hesabı
:
[(12-9,38)2 / 9.38] +
[(43-40,19)2 / 40.19] +
...+ [(32-26,57)2/26,57] = 4,17
sd = (2-1) * (3-1) = 2 , χ2 (2,0.05) = 5,99,
4,17<5,99  p>0.05
Cinsiyetler arasında BKI sınıflarına dağılım açısından anlamlı fark bulunmamıştır.
Örnek: 116 kişilik bir özel kümede belirlenen kan grupları dağılımının toplumun kan
grupları dağılımından farklılığının değerlendirilmesi.
Toplam
hesabı :
ki-kare
[(59-67,28)2 / 67,28] + [(18-20,88)2 / 20,88] + [(23-19,72)2 / 19,72] +
[(16-8,12)2 /
8,12)] = 1,019 + 0,397 + 0,545 + 7,647 = 9,608
sd = (4-1) = 3 , χ2 (3,0.05) = 9,348,
9,608 >9,348 
p<0.05
Özel kümenin kan gruplarına dağılımı ile toplumunki
arasında fark bulunmaktadır, küme topluma bu açıdan
uymamaktadır.
Yazılım kullanılarak yapılan çapraz tablo değerlendirmelerinde
Sonuçlar sadece ki-kare değerlendirmesi olarak değil başka yöntem sonuçları ile de
verilebilmektedir.
Örneğin
aşağıdaki
SPSS
çıktısında,
gerçekleştirilmiş
bir
Etken gücü X Hastalık
düzeyi
değerlendirilmesinde (
3 x 3 tablo) 3 ayrı
sonuçsal değerlendirme bulunmaktadır
Sadece Pearson ki-kare değerlendirmesi değil bir ikinci değerlendirme olarak
Lİkelihood Ratio sonucu bulunmaktadır üstelik bunlar anlamlılık açısından çelişkili
gözükmektedirler Ayrıca bunlardan çok daha “anlamlı” gözüken bir 3. değerlendirme
– Linear-by-linear association- bulunmaktadır. Çıktıda uygun yöntem sonucunun
seçimi için son derece önemli bir ipucu yansıtılmaktadır : 9 gözden 3 ünde (%33)
beklenen göz değeri 5’den küçüktür. Daha önce vurgulandığı üzere 4 gözlü olmayan
( 2 X 2 ) tablolarda ki-karenin güvenirliği açısından gözlerin % 10’undan fazlasında
5’den küçük beklenen değer olması durumunda seçenek yöntem sonuçları
önemsenmelidir.
Likelihood Ratio– olabilirlik oranı
4 gözlü tablolar dışındaki s X k gözlü tablolarda %10 dan fazla gözde 5’den
küçük beklenen değer olması durumunda likelihood Ratio sonucu – olabilirlik oranı
– kullanılması daha uygundur. G2 olarak da adlandırılabilen yöntem formül olarak :
2∑ Gij ln(Gij / B ij )
değerine eşittir.
Yukarıdaki örnekten de anlaşılacağı gibi normal ki-kareye göre daha “tutucu” –
anlamlılık bulmamaya yatkın – sonuç verir gibi gözükse de aslında yetersiz
örneklemelerle yanıltıcı anlamlılıklar üretmediği biçiminde de yorumlanabilir.
Gerçekten de yüksek örneklemli, sorunsuz tablolarda nerede ise tam ki-kare
sonucuna denk sonuç bulunur. “0” değeri – o altnitelikte olgu bulunmayan – gözlerin
bulunmaması tercih edilmelidir.
Yukarıdaki örnekte olabilirlik oranı ile saptanmış bulunan ve “anlamlı” olmayan
sonucun yorum için kullanılması ancak örneklem sayısını arttırma yönüne
gidilmesinin uygun olacağı düşünülmelidir.
DÖRT GÖZLÜ TABLOLAR İÇİN ÖZEL
DEĞERLENDİRMELER
Dört gözlü tablolar değerlendirme açısından tıp alanında en çok rastlanan ve
özellikli çapraz tablolardır çünkü farklı araştırma varsayımlarına uyan kullanıma
sahiptirler buna bağlı olarak da çeşitli özgün değerlendirme yöntemleri kullanabilirler.
Bu çerçevede en çok karşımıza çıkan varsayım soru tiplerine göre çözüm
yaklaşımlarını irdeleyeceğiz.
1)Eş yapısallık sorgulaması: Bir dikotom değişkenin iki altniteliği arasında, farklı
ikinci değişkenin 2 altniteliğine dağılım açısından fark olup olmadığını sorgular.
Anlaşılacağı üzere bu kalıp farklı varsayımlarda farklı sorgu özellikleri ile karşımıza
gelebilir. Kıyassal altnitelik kümeleri birbirlerinden bağımsızdır. Tipik bir sorunun
yazılım
çıktısı
aşağıdaki
gibi
gözükür :
Bu
tablonun
SPSS değerlendirme çıktısı ise şöyledir:
Görüldüğü gibi 6 farklı “p” sonucu bulunmaktadır: Bunlardan linear-by-linear
değerlendirmenin veriyi ele alış yaklaşımının farklı olduğunu görmüştük ve bizim
eşyapısallık yanıtımız bununla ilgili değildir. Geriye kalan 5 sonuçtan uygun olanın
seçim koşulları söyle açıklanabilir :
a) Tüm beklenen değerler 5’den büyük ve tüm gözlenen değerler en az 15 ise:
Değerlendirilmesi, incelenmiş olan standart ki-kare çözümlemesi ile yapılarak,
1 serbestlik derecesine göre yorumlanır. Anlamlı fark bulundu ise satırların /
kolonların gerçek iç oran dağılımlarına bakılarak ayrıntılar belirtilir.
Dört gözlü tabloların gözlerine, satır ve kolon toplamlarına simgesel adlar
verirsek, aşağıdaki kolaylaştırılmış formülle de aynı sonuç elde edilir.
Bu simgeleri diğer yöntemleri açıklarken
de kullanacağız
Kolaylaştırılmış χ2 formülü :
χ2 = [(a * d) - ( b * c )]2 *N / (Ts1 * Ts2 * Tk1 *Tk2)
Örneğimizde hiçbir gözde 5’den küçük beklenen değer olmadığı çıktıdan da
anlaşılmaktadır ancak “b” ve “d” gözlerinde 15’den küçük gözlenen değerler vardır.
b) Tüm beklenen değerler 5’den büyük ama gözlenen değerler içinde 15’den
küçük değer var ise:
Değerlendirilme için 2 seçenek bulunmaktadır: daha önce görmüş olduğumuz
“Olabilirlik oranı” – likelihood ratio veya “Süreklilik düzeltmeli χ2“ değeri. Bu
yaklaşım Yates
χ2 adı ile de anılmaktadır. Hesaplaması yukarıda gördüğümüz
kolaylaştırılmış formüle (N/2) düzeyinde bir azaltma uygulanarak gerçekleştirilir.
χ2 = [((a * d) – ( b * c )) – (N/2)]2 *N / (Ts1 * Ts2 * Tk1 *Tk2)
Son zamanlarda bu düzeltmenin fazlası ile “tutucu” sonuçlar verdiği ve Tip-2 hata
oluşturduğu düşünülmektedir. Bu nedenle Olabilirlik oranını bu tip tablolarda
kullanmak daha uygun bir seçenek olabilir.
Örneğimizde hiçbir gözde 5’den küçük beklenen değer olmadığı ama 15’den küçük
gözlenen değerler olduğu için “olabilirlik oranının” sonuç “p” değerinin kullanımı
uygun olacaktır. Buna göre etkeni bulunduranlarla bulundurmayanlar arasında sonuç
oranı açısından anlamlı fark vardır ve etkeni taşıyanlardaki sonuç oranı (%32.4)
taşımayanlara göre (%15.3) daha yüksektir.
Görüldüğü gibi düzeltmeli ki-kare sonucu anlamlılık yansımazken , olabilirlik oranı ,
standart ki-kare sonucundan daha yüksek olsa da anlamlı bir p düzeyi sunmaktadır.
c)
değerler
Beklenen
içinde
var
5’den
küçük
-
olan
gözlenen
değerler
önemsenmiy
or-:
Çözümleme hipergeometrik dağılım tabanlı “Fisher kesin olasılık testi” ile
gerçekleştirilecektir – sonuç bir ki-kare , vs değil doğrudan olasılık hesaplamasıdır-.
Bir araştırma örnek çıktısı aşağıdadır:
Çapraz tabloda 5’den küçük beklenen değer bulunmaktadır – bu örnekte 1 tane;
gözleneni 7 olan gözün beklenen değeri 3.73 dür - . Fisher (exact) kesin olasılık testi
için bulunan 2 sonuçtan araştırma varsayımının kurgusuna uyan seçilmelidir : Eğer
sadece “farklılık” sorgulanmayıp , “yönü belirtilerek beklenen bir fark : ör.: Etkeni
taşıyanlarda sonuç daha yüksektir varsayımı ! – değerlendiriliyorsa tek yönlü – 1sided- sonuç yorumlanmalıdır. Yukarıdaki örnekte varsayım bu beklenti ile kuruldu
ise:”Etkeni taşıyanlarda sonuç anlamlı olarak daha yüksektir (p=0.035)”.
2)Eşlendirilmiş (Bağımlı) konumlarda değişim sorgulaması:
Bir dikotom
değişken iki altniteliğine dağılımlar açısından iki farklı konumda değerlendirilmektedir
– eşlendirilmiş dikotom nitelik değerlendirmesi Yandaki ve üstteki alttip başlıkları aynı olup 2 farklı durumda değerlendirilmişlerdir.
Bu tip bir araştırmada durumlar arası farklılaşım McNemar χ2 testi ile değerlendirilir
ve :
Mc Nemar χ2
=( |(b – c )| -1)
2
/ (b + c)
şeklinde hesaplanıp “1” serbestlik
derecesine göre yorumlanır. Anlaşılacağı gibi değerlendirme sadece durumdan
duruma değişmiş olan olgu sayılarını hesaba katmaktadır – bu testin gücü açısından
son derece tartışmalı bir özellik olduğunu düşünüyorum -.
Örnek : Belli bir konuda deneysel eğitim verecek bir kursa katılan 47 olguda kurs
öncesi başarılı/başarısız değerlendirmesi yapılmış , aynı işlem kurstan sonra da
gerçekleştirilmiştir. Bu verilere göre kursun etkisini yorumlayınız.
Mc Nemar χ2
= ( |(18 – 7 )| -1) 2 / (18 + 7)
= 100 / 25 = 4
4>3.841 : (χ2(1,0.05)
Kurs öncesi başarılı iken başarısıza
dönenlerin oranı % 38.3 , başarısızdan
başarılıya değişenler ancak % 14.9’dur. Kurs
anlamlı olarak ters etki yapmıştır.
3)
Göreli Risk Değerlendirmesi : Epidemiyoloji ve klinik Biyoistatistikte Göreli
Risk değerlendirmesi kısaca: belli bir etkeni taşıyanlardaki patoloji/hastalık/sonuç
oranının
, bu etkeni taşımayanlardaki oranın kaç katı olduğunun belirlenmesidir.
Değerlendirme “bağımsız” kümeler kalıbı çerçevesinde gerçekleştirilecektir.
Araştırma retrospektiv ise (vaka/kontrol) ; OR ( odds oranı) , prospektiv ise ( kohort ,
klinik deney) RR (Göreli Risk) kullanılacaktır. Kesitsel araştırmalar için de OR
kullanılması uygundur.
E(+)= a+c
E(-) = b+d
S(+) = a+b
S(-) = c+d
OR = (a * d) / (b * c)
RR = [a / (a+c)] / ( b / (b+d)]  [a * (b+d)] / [b * (a+c)]
OR veya RR ‘nin yorumlanabilmesi için her şeyden önce değerlendirmenin yapıldığı
4 gözlü tabloda anlamlı sonuca erişilmiş olması gerekir.
Örnek : Belli düzeyde Sigara içiminin , KOAH – Kronik Obstruktiv Akciğer Hastalığı –
varlığı üzerindeki etkisi belli özellikte yetişkin erkeklerde vaka/kontrol araştırması
olarak sorgulanmıştır.
Öncelikle 4 gözlü tablo için değerlendirme gerçekleştirilmiştir:
5’den küçük beklenen değer bulunmamaktadır. Düşük gözlenen değerli göz varlığı
nedeni ile Olabilirlikler
oranı
sonucu
tercih
edilecektir – standart kikare sonucu ile nerede
ise tamamen aynıdırSigara
içmeyenlerdeki
KOAH
oranı
(%6.3)
içenlere göre (%21.4) anlamlı olarak çok daha düşüktür .
OR = (105 * 18 ) / (66 * 7 ) = 4.09 :Sigara içenler , içmeyenlere göre 4.09 kat daha
fazla KOAH olma riski taşımaktadırlar.
(Prospektiv bir kohort araştırmasında RR = (18/84) / (7/112) = 3.42 dirTablodaki özelliklerin bilincinde değerlendirme yapılarak - )
Bu çok özgün ve önemli konu çok daha ayrıntılı olarak “klinik biyoistatistik”
kitaplarında incelenebilir.
Download