İSTATİSTİK SAĞLIK KURUMLARI İŞLETMECİLİĞİ Doç. Dr. Suphi VEHİD İSTANBUL ÜNİVERSİTESİ AÇIK VE UZAKTAN EĞİTİM FAKÜLTESİ Önsöz Günümüzde bilimsel çalışmaların tamamında istatistik metotlardan yararlanılmaktadır. Sağlık alanında kullanılan istatistiksel terimler ve yöntemler biostatistik başlığı altında yer almaktadır. Sağlıkla ilgili bilim dalları gerek tanımlama gerekse nedenselliği açıklama amacı ile Biyoistatistik metotlardan en fazla yararlanan bilim alanlarındandır. Sağlık Hizmetlerini bir bütün olarak ele aldığımızda bu hizmette yer alan her bir meslek grubunun görev ve sorumlulukları belirlenmiştir. Her bir meslek grubu diğerini tamamlamakta ve desteklemektedir. Sağlıkla ilgili bir olayı tanımlama veya nedenselliğini açıklamak için doğru bilgiye ve doğru bilginin doğru yorumlanmasına gereksinim bulunmaktadır. Mesleğin gerektiği şekilde uygulanmasına yardım edeceği ümidiyle Doç. Dr. Suphi VEHİD İSTANBUL ÜNİVERSİTESİ AÇIK VE UZAKTAN EĞİTİM FAKÜLTESİ TIBBİ DÖKÜMANTASYON ve SEKRETERLİK LİSANS PROGRAMI İSTATİSTİK SAĞLIK KURUMLARI İŞLETMECİLİĞİ Doç. Dr. Suphi VEHİD BÖLÜM I GİRİŞ Sağlık kurumlarında görev yapanların görev ve sorumlulukları arasında; Tıbbi istatistikler ile ilgili verileri derler ve bilimsel metotlarla analiz ederek sonuçları periyodik olarak ilgililere rapor etmek yer almaktadır. Yukarda sözü edilen görev, yetki ve sorumlulukların doğru olarak yerine getirilmesinde istatistik ve onun sağlık alanında kullanım şekli olan biyoistatistik uygulamalarının bilinmesinin sonsuz yararı bulunmaktadır. İstatistiksel ilke ve yöntemlerin uygulanmasında bilgi ve beceri yalnız biyoloji ve tıp bilimleri için değil sağlık mesleklerinin herhangi birinde etkili kullanılması için de gereklidir. Sağlık alanında çalışan kişilerin istatistik bilgisine sahip olma nedenleri aşağıdaki gibi sıralanabilir; 1. Tanıya ve kanıta dayalı düşüncenin anlaşılması, tıbbın hayli bağımlı olduğu olasılık kavramlarının anlaşılması için istatistik bilgisine gereksinim duyulmaktadır. 2. Sağlık çalışanları kendi bilgi becerilerinin ışığında ölçümlerle yorum yapmak gereksinimi duyarlar, 3. Hastalıktan korunma veya hastalık etkilerini sınırlayabilmek yönünde hastaların en iyi tedavilerini sağlamak için sağlık çalışanları hastalıkların neden – sonuç ilişkisinde istatistiksel ve epidemiyolojik gerçekleri bilmeleri ve anlamaları gerekmektedir, 4. Sağlık çalışanları sağlık istatistiklerinin birincil veri kaynağını oluşturmaktadır. Bu nedenle sağlık verilerinin sağlıklı tutulması ve yorumlanması gerekmektedir, 5. Sağlık yöneticileri toplumsal sağlık sorunlarının tanımlandığı istatistikleri yorumlayabilecek bilgiye sahip olmalıdır. İstatistiksel Tanımlar: İstatistik terimi genellikle iki şekilde kullanılmaktadır. 1 a. Veriler, b. Sayısal Gözlemler c. Nicel bilgi Örnek:Bebeklerin doğum ağırlığı, Belli bir günde polikliniklere başvuran hasta sayısı, Belli nüfusta var olan olgu sayısı gibi 2. a. İstatistiksel yöntemler b. Verilerin toplanması, sunulması, analizi yorumlanması, İstatistiksel yöntemlerin üç ana kullanımı bulunmaktadır. 1. Mümkün olan en iyi yöntemle verileri toplamak a. veri toplama için formların oluşturulması, b. veri toplama işleminin örgütlenmesi, c. araştırmayı planlama ve yönetme, d. bir toplumda taramayı yönetme Örnek: Ölüm ve doğumla ilgili verilerin toplanması, Tüberkulozlu kişilere ait verilerin toplanması 2. Bir grup veya bir durumun niteliklerini tanımlamak a. veri çıkarma b. veri özetleme, c. veri sunumu 3. Verileri analiz ederek sonuçlarını çıkarmak Bunun için farklı analiz tekniklerini kullanarak sonuçlar çıkarmada olasılık kavramlarının bilinmesi ve kullanılması gerekmektedir. İstatistik Nedir? İstatistik “’Last’’ tarafından rastgele varyasyonların konusu olan verilerin toplanması, özetlenmesi ve analiz etmesini sağlayan bir bilim ve sanat olarak tanımlanmaktadır. Bu durum “Bilimsel Çalışma” olarak adlandırılabilir ve genel amacı güncel, geçerli ve dinamik bilgi üretmek olup kısaca belirsizliği ortadan kaldırmaktır. Bilimsel bilgi doğru, geçerli, güvenilir ve yeterli verilerden elde edilir. İstatistik ne anlama gelmektedir? İstatistik kelimesinin çeşitli anlamı bulunmaktadır. 1. Sıklıkla kaydedilmiş herhangi bir bilgiye atıfta bulunmak için kullanılır, 2. Hesaplanmış bir seri bilgiyi belirtmek için kullanılır, örneğin ortalama vb. 3. İstatistik bir çalışmanın veri setinde yer alan bilgilerin toplanması ve analizi ve bundan çıkarımlar elde edilmesi ile ilgili izlek ve teknikleri ifade eder. İstatistikle ilgilenen kişinin görevi nedir? 1. Bilgi toplamadan önce bir deney veya araştırmanın tasarımına danışmanlık, 2. Elde edilen verileri uygun istatistiksel teknik ve izleklerle analizi, 3. Hükümet görevlileri ve endüstride yer alan kişiler de dahil karar vericiler ve araştırıcılara sonuçları sunmak ve yorumlamak Neden istatistik uygulanır? 1. İstatistik bilgisi araştırma yapacak ve yönetecek kişiler için önemlidir, 2. İstatistiğin temelini anlama bir araştırma ve bunun etkili sunumu için yararlıdır, 3.İstatistiği öğrenme günlük hayatta gerçek ile hayali birbirinden ayırmaya yardımcı olur. Konu ile İlgili bazı kavramlar İstatistiksel Olay: Canlı ve cansız varlıklar ile kuramsal olarak varsayılan birimlerde ortaya çıkan ve sayılarla ifade edilebilen oluşumlara “istatistiksel olay” adı verilmektedir. Toplum: Belirli bir özelliği gösteren, bilinen canlı ve cansız birimlerin oluşturduğu topluluğa verilen addır. Hedef Toplum: Üzerinde araştırma yapılacak topluma hedef toplum denmektedir. Birim: Toplumun en küçük parçasına birim denir. Değişken: Birimin sayılarak, ölçülerek veya tartılarak değerleri saptanan özelliklerine değişken denmektedir. Veri: Birimlere ait değişkenlerin; ölçerek, tartarak, sayarak ya da ölçekler aracılığı ile elde edilen sayısal değerlerine veri denmektedir. Bilimsel bir çalışmada en önemli eleman veridir. Bu nedenle veri doğru, güvenilir, örneklem hatası düşük (ileriki bölümlerde açıklanmaktadır) sistematik hata taşımayan değerlerden oluşmalıdır. Veri kaynakları 1. Birincil veri kaynağı: Doğrudan araştırmacı tarafından toplanan verilerdir. 2. İkincil veri kaynağı: Başka araştırmalarda benzer veya farklı amaçlar için toplanan verilerdir. Ölçme: Bir değişkenin büyüklüğünü uygun ölçeklerle sayısallaştırma işlevine ölçme denmektedir Ölçek: Matematiksel özellikleri belirli ölçümler kümesine ölçek denir. Ölçü Birimi: Bir ölçme aracının karşılaştırmaya esas alınan standart büyüklük ölçüsüne ölçü birimi denmektedir. Örneğin uzunluk için metre, ağırlık için kilogram denmesi gibi. Ölçülebilirlik: Bir değişkenin büyüklüğünün uygun olan bir ölçme aracı ile sayısallaştırılmasıdır. Hipotez: Gözlemlere veya sezgilere dayalı olarak oluşturulan veya araştırılan konu ile ilgili gerçekleşmesi beklenen durumdur. Hipotez ya kabul edilir veya reddedilir. Önkabul: Bir araştırmada önceden belirlenen önerme ve koşullardır. Açıklamaya çalışılan kavramlardan yola çıkarsak “istatistik” saymak veya ölçmekle elde ettiğimiz sayılardan oluşturulan verilerin değerlendirilmesini sağlayan bir dizi uygulamalardır. Gerçekte canlı ve cansız, sabit veya farklılaşan, nicel veya nitel özelliği sayılarla belirtebilecek herhangi bir oluşum istatistiksel bir değerlendirmeye girebileceği için istatistik olay olarak adlandırılabilir. Herhangi bir birimde yargılanacak, değerlendirilecek "olay" da daha önce de değinildiği gibi kendi içinde 2 biçimde oluşabilir. 1- Tipik olaylar:Bilinmeyen rastlantısal etkenlerin etkilerinin yok kabul edilebileceği, dolayısı ile hepsi denetlenir etkenlere bağlı nedenlerden kaynaklanan, kesin belirgin sonuçların alındığı olaylardır. Bunlarda tek bir örnek, tüm evreni simgelemektedir. (Ör.: Işık hızının sabitliği, belli dış koşullarda suyun kaynama derecesinin denkleminin saptanması gibi). 2- Atipik olaylar (yığın olaylar):Temelde aynı nedenlere sahip ancak rastlantısal nedenlerle, belli sınırlar içinde farklılaşımlar gösteren olaylardır. Her birim ölçümsel değer olarak farklı olabileceğinden genel bir simge kullanılmaz. (Ör.: boy ölçümü, eritrosit sayısı, gerek tekil gerek toplumsal olarak farklılaşabilir). Topluma ait ölçütler, toplum içinden belli yöntemlerle çekilen ve toplumu simgelediği varsayılan, toplumdan çok daha az sayıda (n) bir birim kümesi üzerinde incelenir. Bu özel kümeyi toplum içinden alma eylemine "örnekleme", kümeye ise "örneklem", "örnek grubu, kümesi", denir. Örneklemlerden elde edilen ve tüm toplumun kullanılabilecek olan sayısal büyüklüklere de "istatistik" denir. özelliğiymişçesine İstatistik, tanımlayıcı ve açıklayıcı istatistik olarak sınıflanmaktadır. Tanımlayıcı İstatistiğe örnek olarak;Bir çalışma sonucu elde edilen kan kolesteroldeğerlerini ortalama ± standart sapma ile gösterebiliriz298 ± 56 gibi (burada değerler 242 ile 346 arasında değişmektedir) • 150 kişilik bir grupta yer alan olguların cinsiyet dağılımını bir tabloda özetlemek istersek aşağıdaki tablo örneğindeki gibi özetleyebiliriz. Sayı Yüzde Erkek 90 60 Kadın 60 40 Toplam 150 100 Veya grafik şeklinde aşağıdaki gibi özetlenerek sunulabilir Cinsiyete göre dağılım, sayı (n)=150 Kadın 40,0% Erkek 60,0% ARAŞTIRMADA - İSTATİSTİKSEL YARGILAMADA "HATA" Bilimsel araştırmada, tüm toplumun (popülasyon) denetlenmesi ilgilenilen özelliğin tüm toplum bireylerinde ölçülmesi, sayılması pek çok nedenle olanaksızdır. Bundan dolayı toplumu simgeleyecek, çok daha kısıtlı topluluklarla çalışılır. Örnek veya örneklem olarak adlandırılan bu özel grupların gerek sayısal gerek özellik dağılımı açısından toplumu simgeleyecek nitelikte ve nicelikte olmaları gerekir. - Örneklem ne kadar sağlıklı belirlenmiş olursa olsun, yerine geçtiği toplumu tam anlamı ile (nicel veya nitel olarak) yansıtması neredeyse tamamen olanaksızdır. Başka bir deyişle örneklemden elde edilen sayısal değerler toplumu ancak belli farklarla ortaya koyarlar. Olasılık kuramları yardımı ile, bir örneklemden elde edilmiş değerlere dayanarak, belli güvenirlikle, bir toplumun değerlerini kestirmek olanaklıdır. Ancak bu kestirimin sağlıklı olabilmesi için herşeyden önce örneklemin değerlerinin güvenilir, doğru, yani kabaca "hatasız" olması gerekir. Her tür bilimsel ölçüm de kaçınılmaz olarak yanlışlara, hatalara açıktır, yöntembilimsel olarak yapılması gereken, hatanın en aza indirilmesi başka bir deyişle olanaklı olan en yüksek doğruluğun sağlanmasıdır. Bir ölçümün doğruluğu iki tip "hata"dan etkilenir; 1) Rassal hatalar 2) Dizgesel (sistematik) hatalar. 1) Rassal hatalar: Bilinçsiz rastlantılara bağlı olarak ortaya çıkan dolayısı ile de "gerçek" değerin etrafında oldukça dengeli saçılım gösterebilen, sonuçta belki gerçek değere temelde oldukça yakın özet değerlere (ortalama) erişilmesini getiren ancak tekil değerlerin değişkenliği nedeniyle "kesinliği" (presizyon) oldukça az ,güvensiz sonuçlara götüren hatalardır. Toplumun ortalama boyunun araştırılacağı bir örneklemde rassal olarak cücelerin ve basketbol oyuncularının gerçek toplum sıklıklarından -dengeli de olsa -çok fazla sayıda bulunması ve boy değerinin gerçekten çok daha fazla değişkenlik aralığına sahip olması gibi. 2) Dizgesel hatalar: Genelde araştırmada özelde örneklemde yapılmış yöntembilimsel bir aksama nedeniyle (sistem) olguların özellikle belli bir yönde birikmesi hatasıdır. Rassal hatalar çok az olsa bile, örneklem temelde toplumu simgelemekten uzaktır ve "geçersiz" bir değeri yansıtmaktadır. Toplum yetişkin erkek vücut ağırlığı düzeyi saptanırken hep ayni yönde hata yapan - ör.: 1.5 kg fazla tartan - bir ölçüm cihazının kullanılması gibi . Dizgesel hatalara genel olarak "bias" adı verilir. Rassal hatalar ölçümlerde – aşağıda anlamlarının açıklanacağı üzere "kesinlik" azalmasına, Dizgesel hatalar ise "geçerlilik" azalmasına neden olurlar. Buna göre bias, gerçek toplum değeri ile, örnek grubundan saptanan kestirimsel değer arasında oluşan ve araştırmanın çeşitli aşamalarındaki hataların birikiminden kaynaklanan farklılıkdır. Bu farklılığın bilimsel etik çerçevesinde “özel” olarak kurgulanmadığını - bilimsel ahlaksızlık tanımına girer - raslantılar ve “hatalar” sonucu ortaya çıktığını unutmayalım. Yöntembilimsel özellikler, çalışma tasarımı ve çözümlemeye bağlı olarak belirebilen biasla ilgili olarak yüzü aşkın ayrıntılı çeşitten söz edilebilir; sonuçları etkileme, değiştirme açısından en ağır sonuçlar üretebilecek iki tip biasdan kısaca söz edelim : 1) Seçim Biası Örneklem olgularının seçimi düzeyinde yapılan hatalara bağlı olarak beliren kestirimsel değer bozukluğudur. Kıyaslanacak grupların seçimi, örneklem çerçevesinin belirlenmesi (özellikle vaka/kontrol ve kesitsel çalışmalarda) izleme çalışmalarında "tamamlanmamış" olguların değerlendirilmesi bu biasdan kaçınılması için özenilmesi gereken noktalardır. Olgu/denetim çalışmalarında vaka tanısı, etkilenim süresine bağlı özelliklere göre değişiyorsa hata oluşur. Kişilerin bilimsel araştırmaya katılmada gönüllü olmaları bile sağlık durumlarına bağlı olabilir. Yanıt alınamayan veya kaybolanlar, en genç, en sağlıklı veya sağlıkları en bozuk olanlar olabilir. Olumsuz bir etkenin etkilenim süresi yaşam süresini değiştiriyorsa, zaman içinde etkilenmemiş (veya etkilenmiş) olanların daha fazla bulunduğu, insidans hızı oranlarının hatalı belireceği "seçkin sağkalım" biası oluşur. Eğer etken, hastalıkla olan ilişkisinin dışında, hastalığın saptanmasını da doğrudan etkiliyorsa (kolaylaştırıyorsa), saptanma şansının yüksek olmasına bağlı "saptanma" biası oluşur. Berkson yanılgısı olarak adlandırılan bias tipi de, olgu veya denetim ögelerinin eldesinin (örnek: hastahaneye alınma) daha kolay olmasına bağlı olarak ortaya çıkabilir. Araştırıcı bu tür bir bias'ın oluşabileceğini düşünüyorsa örneğin birden çok denetim topluluğu oluşturma yoluna gidilebilir. Hepsinde yaklaşık değerlerin elde edilmesi biasın etkisizliğini belirtecektir. Dığer taraftan örnekleme aşamasında kayıpların en aza indirilmesi , tanı yönteminin etkenin düzeyinden bağımsız seçilmesi gibi yöntemler bu biası azaltmak için kullanılır. Örneklem sayısının ve seçim yönteminin önemi unutulmamalıdır.Bu bias tipi özellikle olgu/denetim çalışmalarında sonuçları tamamen yanıltıcı biçimde değiştirebilir. Seçim biası kavramına giren bazı özel bias tipleri şunlardır: • Yetersiz örneklem sayısı biası : • Çekim biası (Centripetal Bias) : • Referansa erisim biası (Referral Filter Bias) : • Tanılamaya erişim biası (Diagnostic Access Bias) : • Yatış oranı biası (Admission Rate / Berkson Bias) : • Prevalans-insidans biası (Neyman Bias) : • Özel küme biası ( Membership - Healty Worker [Seçkin Sağkalım] Bias ) : 2) Bilgilenme biası Çalışmanın konusu olan neden sonuç ilişkisinde, etkilenim veya hastalık tanısı yargısındaki dizgesel hatalar yüzünden, sonuç kestirimin bozulmasıdır. Anketlemede, sorgulamada yetersizlik veya yanlışlık, tanı koyma düzeninin yetersizliği, hatalı bilgi kaynakları vs. gibi nedenlerle ortaya çıkan bilgilenme biası, olgunun yanlış sınıflanmasını getirir. Bu nedenle "yanlış sınıflama biası" adını da almaktadır. Bir neden-sonuç ilişkisi araştırmasında, her iki toplulukta da (olgu/de- netim) tanı yöntemi aynı (hatalı) duyarlılık ve özgüllüğe sahipse "ayrımsız bilgilenme hatası" vardır. Buna karşın topluluklarda (etken grubu/etki bulunmayan grup gibi) tanı konmasında farklı testler (veya titizlik) uygulanıyor ise "ayrımcı bilgilenme hatası" vardır. Tanı için en geçerli (hem duyarlılık hem özgüllük açısından) yöntemler, yalın, sorgulama ve gözlem gereğinde çift denetim, Bilgilenme biasının giderilmesi için gereklidir. Bilgilenme biası kavramına giren bazı özel bias tipleri şunlardır: • Kaba-kötü ölçüm biası : • Muayene gerginligi –Beyaz gömlek- biası : • Kabul edilmez yöntem (Unacceptability Bias) biası : • Beklenti (Expectation Bias) biası : • Anımsatma (Recall Bias) biası : • Aileden bilgilenme (Family information Bias) biası : • Gözlemde olma (in Attention Bias) biası : Bu belirtilenlerden başka yaklaşık 100’den fazla ayrı tip bias ayrımlanabilmektedir ; bunlardan en sık en sık karşılaşılabilecek olan bazıları – ayrıntılarına girilmeksizin -şöyledir: • Spektrum biası : Özel seçilmiş bir kümede uygulanan bir tanılama yönteminin sonuçlarının gerçeğe göre daha abartılı – veya düşük – olarak saptanması, • Dışlanmış değişken biası: Belli bir sonucu oluşturmada belirgin rolü olması bilinmesine karşın değerlendirmeye alınmayan bir etkenin varlığı yüzünden oluşabilecek kestirim yanlışları, • “Dil” biası : İngilizce gibi belli bir dilin dışında yapılmış yayınların değerlendirmeye alınmaması, • Yayın (publication – pozitif sonuç) biası : Genellikle beklendiği yönde sonuç alınmış araştırmaların yayınlanma şansının yüksekliğine bağlı bias , • Cinsiyet , inanç , ırk ,etnik köken,vs gibi özelliklerin seçilmesi veya dışlanmasına bağlı biaslar. • Kayıp olgu (Withdrawall) biası : • Kayıp veri (Missing Data) biası : • Denetime aktarım (Bogus Control) biası • Degerlendirme sonrası anlamlılık düzeyi kabulü biası : • Sonuç seçme (Looking for the pony) biası : • Yeniden düzeltme (Tidying-Up) biası : • Küme tanım sınırlarının degistirilmesi biası • Şirket ürünü desteği biası Anlaşılacağı üzere bazı tip biaslar seçim veya bilgilenme biası ayrıntısı altında ele alınabilecekken bazıları çok daha özgün , ender ancak çok etkili olabilirler , araştırıcılar tasarımları davranmalıdırlar. ve çalışma süreçleri boyunca bu yönde bilinçli BÖLÜM II KESİNLİK VE GEÇERLİLİK Hataların varlığı ortadan -olabildiğince- kaldırılarak örneksel simge değerin toplumu en güçlü ve doğru şekilde yansıtması yani "kesin" ve "geçerli" olması istenir. Bu aynı zamanda istatistiksel bir yargının doğru olmasının da ilk adımıdır. 1) Kesinlik Kesinlik bir anlamda "dağınıklığın , saçınımın tersidir" ; verilerin doğal, rassal değişim sınırları ne denli darsa o veri kümesinden elde edilecek olan toplum kestirimi o denli kesin olacaktır. Erişikin erkek toplumunun HDL düzeyi - çok büyük oranda 13-90 mg/dL arasında değişir demek , 34-48 arasında değişir demeye göre çok daha az kesindir. Rassal hatanın, göreli olarak yok varsayılması demek olan kesinlik temelde 3 etkene bağlıdır; 1) Örneklem büyüklüğü , 2) Örnekleme yöntemi , 3) İncelenen özelliğin ölçümsel değişkenliği (varyans) Bu etkenler doğrudan biyoistatistiksel önkabul ve kestirimlerle , örnekleme düzeninni iyi tasarlanıp gerçekleştirilmesi ile belirlenirler. 2) Geçerlilik "Geçerlilik" birden fazla alanda değişik tanımlarla kullanılan bir terimdir. Örneğin bir ölçme aracının geçerliliği ölçtüğü düşünülen durumun gerçek büyüklüğüne yakın ölçüm yapması ile belirlenir. Bilimsel araştırma ve deneylemede geçerlilik , yanıtı aranan soruya araştırmanın doğru yanıt verebilme yeteneğidir , klinik değerlendirmede geçerlilik özellikle tanılamada bir tanı yönteminin hasta veya sağlam tanısını olabildiğince doğru koyabilmesidir. Veri özelliği olarak ise geçerlilik, örneklemdeki-veri setindeki sonuç düzeyin tüm toplumdan elde edilebilecek olana yakın olması ile belirlenir. Örneklemin "toplumu simgeleme" özelliğinin yetersizliği geçerliliği de yok eder. Sonuç olarak geçerlilik ; araştırmanın yapısının veya/ve ölçümsel düzeylerin veya/ve örnek olguların simgeleme yeteneğinin bozulması gibi, araştırma sonuçlarının genel doğruluğunu, güvenirliğini , gerçeğe yakınlığını t zedeleyecek hataların bulunmaması durumudur. Geçerlilik ancak "Dizgesel hata" nın ortadan kaldırılması ile sağlanabilecektir. İki tip geçerlilikten söz edilebilir; a) Dışsal geçerlilik: Bir araştırmanın sonuçlarının (örneklemden elde edilen) belli bir toplum (popülasyon) için "genelleştirilebilmesi" olgusudur. -Toplum kavramı için her zaman kısıtlamalardan söz edilebilir örneğin sonuçlar sadece "kadınlar" için geçerli olabilir. Genelleştirme istatistiksel ve bilimsel açılardan irdelenir. İstatistiksel açıdan genelleştirilebilme, toplumdan, örneklemin sayıca yeterli ve uygun olasılık dağılımlarına göre çekilmiş olmasına (simgeleme) bağlıdır. Doğal olarak istatistiksel genellemenin kısıtlılıkları bulunmaktadır. Örneğin Vaka/Denetim çalışmalarında olguların istatistiksel açıdan "genellenebilirliliği" tartışmalıdır veya ender hastalık (veya etken) olgularında sayısal yeterliliğe erişilmeyebilir. Bilimsel açıdan ise genelleme, incelenen olaya ilişkin bilgiler çerçevesinde yapılır. Olgular arasında biyolojik, fizyolojik, psikolojik, vs. temel benzerlikler olması ile örneklemden topluma (veya topluluğa) geçiş yapılabilir. b) İçsel geçerlilik: Bir çalışmanın iç düzenlemesindeki yapısındaki hatalar, ölçümlerin bozunumuna neden oluyorsa içsel geçerlilik yok demektir. Örneğin araştırmada "tartı aletinin" ayarsız olması tüm ağırlık ölçümlerinin yanlış olmasına (aynı düzenle) neden olacak, araştırmanın "iç" değerleri hatalı olarak belirlenecektir. Gerek içsel gerek dışsal geçerlilikler araştırmada, dizgesel hata düzeyinin yani bias ‘ın azaltılması ile sağlanabilecektir yani biasları engellemek için alınacak önlemler geçerlilikleri de yükseltecektir. alınabilecek ilk önlemler kısaca şöyle sıralanabilir; Araştırma yöntembiliminde hem kesinliği hem geçerliliği uygun düzeyde sağlamak açısından aşağıdaki noktalara mutlak uyulmalıdır: Kesinlik için: • Sayıca ve simgeleyicilik olarak uygun örneklem, • Aşırı uçlardaki değişken değerlerinin denetimi Geçerlilik için: • Varsayım düzenine uygun sınama kurgusu , • Bilgilenmede nesnelliğin sağlanması , • Örnekleme kurgusunun uygun yapılandırılması. Şekil 1.1.'de "x" ile simgelenen toplumsal parametreyi belirlemek için yapılan örneklemelerde elde edilebilecek hatalı ve uygun sonuçlar görselleştirilmektedir. Şekil 1.1- Kesinlik ve Geçerlilik açısından örnekleme sonuçları DEĞİŞKEN KAVRAMI Matematiksel fonksiyonlara bağlı olarak mutlak bir kesinlikle belirlenmeyen özellikler "değişkendir" ve tıpsal-biyolojik alanlardaki hemen her konu değişkenler üzerinedir. Nesnel tanım olarak "rastlantısal etkilere bağlı olarak ölçümsel farklılaşmalar gösteren birim değişken adını alır". Aynı konulardaki değişkenler, kuramsal bir "beklenti" değerin etrafında; • Bilinen denetlenir etkiler, • Bilinmeyen etkiler • Çeşitli etkilerin ara etkileşimleri, nedeniyle ölçümsel farklılaşımlar göstererek yer alırlar. Bazen bir değişken özellikle diğer bir değişkenin gösterdiği farklılaşmalara uygunluk göstermesi açısından tanımlanır. Böyle konumlarda iki değişken arasındaki ilişki bir çeşit "fonksiyon" olarak da tanımlanabilir . Değişkenlerin değerlendirilmesi ve sınıflanması farklı açılardan ele alınabilir – bu konu 2. bölümde ayrıntıları ile incelenecektir – ancak en belirgin ve temel iki ana özellikle ortaya çıkarlar: 1) Nicelik: Çeşitli ölçü teknik ve birimleri ile düzeyleri saptanıp, simgelenen, (ölçülebilen) gerçek,nesnel özelliklerdir. Örneğin boy uzunluğu, vücut ısısı gibi. Ölçümleri bir birime dayalı olarak yapılır ve genelde sürekli değerler (en küçük kesre kadar gereğinde saptanabilen) alırlar, ondalıklı birmlerle ölçümleri uzatılabilir 2) Nitelik: Birimlere dayalı ölçümlerle değil sayımlarla değerleri belirtilebilen, belli bir yapısal veya konumsal özelliği taşımak (veya taşımamakla) simgelenebilen özelliklerdir. Örneğin, belli bir kan grubunu taşımak, x hastası olmak, evli olmak vs. Nitel özellikler ancak tam-süreksiz (kesirli değerler almayan) sayılarla belirtilebilirler. Değişken(ler) gerek kavram olarak gerekse de ölçümleri ile istatistiksel değerlendirmenin ana ögesini oluştururlar. Çeşitleri ve özelliklerinin bilinmesi araştırmanın doğru süreci için zorunludur. (Biyo)istatistiksel değerlendirmelerin hepsi "değişkenler" üzerinde gerçekleştirilir. NEDENSELLİK Bilim bir anlamda, çeşitli alanlarda ve konulardaki "neden?" sorusuna yanıt bulma sanatıdır. Çevremizdeki - ve içimizdeki - "dünya" ile olan bağlarımızı oluşturan ve etkileyen tüm oluşumlar böylesi soruların yanıtındadır ve genel bir adlandırma ile "nedensellik" olarak tanımlanabilir. Böylece "nedensellik" olaylar-oluşumlar arasındaki, birinin - genel adlandırma ile "neden"- , belli koşullar altında bir diğerinin ortaya çıkmasını veya büyüklük değiştirmesini - genel adlandırma ile "sonuç" sağlaması olarak düşünülebilir. Nedenselliğin özü bir oluşun bir diğerince üretilmesi, belirlenmesi veya kestirilmesidir. Bu açıklamayı daha nesnelleştirirsek : "İki ayrı olgu veya duruma ilişkin; birinin, diğerinin var olması nedeni ile ortaya çıkması veya birbirlerine uyumlu olarak düzey değiştirmeleri biçiminde belirlenen, mantıklı, olabilir, ölçülebilir uyuma “nedensellik bağıntısı denir" . Biyoistatistik biliminin değerlendirmesi çerçevesinde - ve tanıma uygun olarak - 2 tip bağıntı açık olarak ayırdedilebilir : 1- Nedensel (Causal) Bağ : Buna göre bir "B" oluşumunun ortaya çıkışı , varlığı , büyüklüğü başka tür bir "A" oluşumunun varlığına bağlı olarak gerçekleşir. Oluşum terimi bir özelliğin büyüklüğü, bir durum veya bir olay olarak karşımıza çıkabilir. Bu tür bir bağlantıda "A" neden , "B" sonuç olarak yer alır. Örneğin,: Kuduz virüsü , kuduz infeksiyonuna neden olur , Sigara içmek Anfizeme neden olur. Diabet hastalığı nöropatik ağrı yapar. Güneş yanığı melanoma neden olabilir. Bu bağ her zaman çok açık olmayabilir ve bir "olasılık" sorunu olarak çözülür. Yapısal açıdan ise bir nedensel bağ şu iki özelliği taşımalıdır : Öncüllük : Neden , sonuçtan zaman olarak önce gelmelidir. Bitişiklik : Neden ve sonuç ya doğrudan temas durumunda olan oluşumlar olmalıdır ya da doğrudan temasta olan başka aracı bağlar ile bağlanmış olmalılardır. Temel olarak infeksiyon hastalıklarının değerlendirilesi , incelenmesi ile ortaya çıkan nedensel bağ - bakteri varlığı --> bulaşma --> hastalık - ünlü İngiliz epidemiologSir Bradford Hill'in ilkelerine göre de tıpsal konularda nesnel olarak şu özellikleri taşıyorsa geçerli bulunmalıdır: - Zamansal izleme - öncüllük. - Bağın gücü: sayısal özel ölçütlerle belirlenebilir ve yüksek olmalıdır. - Bağın tutarlılığı: Pek çok benzer ikili oluşumda gözlenebilmelidir. - Doz-yanıt birlikteliği: neden düzeyi arttıkça sonuç oluşum örneği artar. - Bağın özgüllüğü: nedenden etkilenme belli tip bir sonuca götürür. - Güncel bilgilere göre olabilirlik: Bilimsel, mantıklı açıklanabilirlik. - Deneysel kanıtlanabilirlik: gerekli varsayımsal deneylerle doğrulanabilirlik. - Benzeşim: benzer, kanıtlanmış bağlarla uygunluk. Nedensel bağları tanıma tanımlama açısından yararlı olsa da Hill'in ilkelerinin geçerliliğinin çelişkili, gerçek oluşumlara uymayan örneklerle tartışıldığını da belirtelim. Nedensel bağ , bilimsel araştırma tasarımı çerçevesinde yöntembilimsel olarak iki yönden yaklaşılarak çözümlenebilir: Öngördüğümüz bir sonuç farklılaşmasını üreteceğini düşündüğümüz bir - “nedenin” geçerliliğini değerlendirmek : Ör.:grip aşısı uygulaması ile grip prevalansını düşürmek... - Gözlemlediğimiz bir sonuç farklılaşmasını ürettiğini düşündüğümüz bir “nedenin” geçerliliğini değerlendirmek.ör.: KOAH olgularında yoğun olarak sigara kullanımı saptamak.. Görüldüğü gibi çözümleme nedenden sonuca veya sonuçtan nedene doğru yapılabilir. Konunun ve koşulların – etik dahil – biçimlendirmesi bu yönü belirler – ileride görülecek olan ; retrospektiv (geri yönelik) , prospektiv (ileri yönelik) araştırma tipleri-. Nedensel bağ irdelemesine şu tipik soru ile geçilir :Belli sayıda, nedensel, “nitel” farklılık düzeyi ( farklı tedavi tipleri/ sigara içim özelliği tipleri/ cinsiyetler / yaş dekadları , vs)sonuçsal açıdan , (mortalite / rekurrans sıklığı / sağkalım oranı / SAB , cea düzeyi , vs) farklılık düzeyleri oluşturur mu ?! Bağın varlığı genellikle “kıyas tabanlı” değerlendirmelerin sonuçlarına dayandırılır. 2 - Birlikte değişim (covariation) bağı : Bir olayın düzey değişimine nesnel uyum gösteren bir diğer olayın düzey değişimini çözümler (uyumun matematiksel belirtisini ve yapısallığını). Nedensel (causal) bağ genellikle Varlık/yokluk veya farklı düzey nedenlerin – medeni durum tipleri , yaş dekadları , eğitim tipi , tedavi tipi vs kıyaslamasına bağlı bir çözümleme iken birlikte değişim bağı mutlak neden-sonuç ilişkisi gerektirmez sadece bir değişkenin değerini bilip bir diğerininkini kestirmek veya gücünü göreli olarak vurgulamak için gerekli modellemeyi – varsa - kurgular . Birlikte değişim bağ irdelemesine şu tipik soru ile geçilir :Bir – veya daha fazla – öncül niceliğin -bağımsız değişken- (veya özel nitel alttiplerin) düzeyine göre (yaş , CEA , ailede DM var-yok, vs ) ilgili bir diğer niceliğin – bağımlı değişken- (veya ikicil nitelik olasılığını), (CRP düzeyi , Tümör çapı, KKH olma olasılığı,vs) kestirebilecek matematiksel bir modelleme oluşturulabilir mi ? Bağın varlığı genellikle “matematiksel bir fonksiyonun” varlığı – veya biçimi sonuçlarına dayandırılır. Bu fonksiyon sadece “güç” belirten bir ölçüm olabileceği gibi tüm özellikleri ile x değerine bağlı y değerinin hesaplanabileceği bir yapıda da olabilir. Şekil 1.2.- Nedensellik bağı temel tipleri NEDENSELLİĞİN KARMAŞIKLIĞI İdeal bir nedensellik bağıntısı gerekirci (determinist) yaklaşımda, daha önce de örneğini gördüğümüz gibi şöyle bir tabloda yargılanabilir; X: Olası neden (Etken) Y: Olası Sonuç Var Yok (Etken (hastalık) :(Etken+) -) Var ( Hasta) a b Yok (Sağlam) c d X: Olası neden (Etken) Y: Olası (hastalık) Sonuç Var :(Etken+) Yok (Etken -) c = 0 ise X, Y'nin "yeterli" nedenidir. b = 0 ise X, Y'nin "gerekli" nedenidir. Bu tür c ve b nin 0 olduğu, bir tipik olay tablosuna, tıpsal ve diğer biyolojik olaylarda hemen hiç rastlanmaz, sayısal oranları toplama göre çok düşük olsa bile a ve d gözlerinde de değerler bulunur ve olay kesinlikten çıkarak "olasılığa dayalı" bir biçim kazanır. Bu da "tek nedene bağlı sonuç" yaklaşımını yetersiz duruma getirir. Gerçekten tek bir etken belli bir sonucu oluşturmada gerekli olsa bile yeterli olmayabilir (İnfeksiyon hastalıkları için tipik). Özellikle karşıt etkenlerin varlığı (koruyucu) sonucun oluşmasını engelleyebilir. Bu konum bile "başka nedenlerin" (koruyucu neden) ortada bulunması ile olayın atipik özellik kazanmasına yol açar. Bazı atipik olaylarda ise koruyucu etkenlere bile gerek kalmadan, sonuç zaten ancak birden fazla nedenin bir araya gelmesi ile belirebilmektedir yani birden fazla gerekli ama yeterli olmayan nedensel koşulun (ögenin) tekil veya çoklu ilişkilerle bir arada bulunması, çoklu bir nedensellik oluşturarak sonucu ortaya çıkarabilir. Bir sonucun ortaya çıkması için kesinlikle bulunması gereken etkenler "zorunlu" etken adı verilir. Zorunlu etkenlerin yanı sıra sonucun oluşmasına katkıda bulunan diğer etkenler bulunur (katkısal etken) bunlar belli bir tip olmayıp, biri olmaz ise diğeri onun yerine geçebilir, böylece "yerine etken" kavramı ortaya çıkar. Bazen hiçbir etken tek başına yeterli olmayabilir veya sonuç için tipik/gerekli olmayabilir , bu koşullarda çok sayıda katkısal etkenin birikimi tipik bir sonucun sonunda ortaya çıkmasını getirebilirler. Pek çok dejeneratif hastalık , kanserler , vs için bu yönde hem genetik , hem çevresel etkenlerin birlikte ve farklı kombinasyonlarla sonucu ortaya çıkarttıkları bilinmektedir. Bazı nedenlerin alt ögeleri birbirlerinin düzeyinden etkilenebilirler ve sonuç etki tekil etkilerinin toplamından fazla veya eksik olabilir. Bazı ikincil etkenlerin varlığı nedensellik ilişkilerinde farklı düzeylerde farklı güçte bağıntılar ortaya çıkmasına olanak verebilir (araetkileşim) , bazen ise bir nedensellik bağıntısı , arada yer alan ikincil bir etken nedeni ile yalancı olarak var gibi gözükebilir (karıştırıcı etken).Bu tür özgün konumlar gerçekçi ve güvenilir nedenselliklerin saptanması ve tanımlanması açısından sorun çıkartabilirler.Bazen de tüm etkenler var olarak görülmesine karşın, belli bir düzeye erişilmediği için sonucun belirmediği görülebilir. Bu tür, eksik olan düzeyin tamamlanmasına neden olan veya yeterli nedeni oluşturmak için gerekli çok sayıda ögeden eksik olan sonucunun tamamlanmasına neden olan olaya "Tetik" olay denir. Anlaşılacağı üzere tek bir sonuç öge için nedensellik ilişkisinin varlığı aslında hemen hemen hiç yoktur ve ortaya konması da çok zordur. Gerçekçi ve iyi düzenlenmiş bir nedensellik araştırması sonucu etkileyen /etkileyebilecek diğer tüm ikincil nedensel ögelerin yöntembilimsel açıdan ve/veya istatistiksel tekniklerle denetimini gerektirecektir. Bu tip çözümleme “çok değişkenli değerlendirme” olarak adlandırılacaktır. Hem bilinmeyen hem de denetlenemeyen nedensel ögelerin kesinlikle bulunacağı yorumlamalar yapılırken unutulmamalıdır. Sağlık politikası oluşturma, planlama, programlama, bütçeleme , uygulama ve bütün sağlık sistemi içindeki farklı programların genel entegrasyonunun sistematik ve sürekli işlemesi bilgi desteğine bağlıdır. Veri toplama ve analizi için kullanılan yöntemler potansiyel kullanıcılara ve bunların duyacakları bilginin çeşidine bağlıdır. Tarih süreci içerisinde çözümlemeler için genel olarak aşağıdaki bilgi kaynaklarından yararlanılmıştır. 1.Gelenekler – inançlar:Toplumda oluşmuş bilgi birikimleri(genelde dinlere, toplumsal deneyimler ve örneklere dayalı olarak), çözüm yaklaşımlarıdır. İlgili konuya bağlı olarak, son derece hızlı değişim ve kanıtlı gelişimlerin yaşandığı konumlarda yetersiz, yararsız hatta zararlı olabilmektedirler 2. Otoritenin kararları: Bazı konularda karar verme yetkisi ve yeteneği olduğu düşünülen birey ve kurumların bilgileri kullanılmıştır. Doğal olarak bunların "doğru" olması, gerçekte yetersiz bilgilenmişlik, öznellik, vs. gibi nedenlerle çok tartışmalıdır 3. Bireysel deneyimler: Birey kendi bilgi ve yaşam deneyimleri çerçevesinde kararlar alır. Birey yaşantısının sınırlı ve öznel olması, bilgisinin genel bir doğru olarak kabul edilmesini tartışmalı duruma getirir. 4. Bilim: Neden – sonuç ilişkilerinin sorgulandığı, çözümlendiği, belirtildiği, nesnel – dizgeli bilgiler birikimi olarak adlandırılabilecek “bilim” aslında doğru bilginin kaynağıdır. Temelde bilim; anlama, açıklama ve denetim (kontrol) işlevlerini içerir. "Anlama" kavramı, var olan şeylerin tanınması, özelliklerinin ve bağıntılarının temel kavramlarını içerir. "Açıklama" ise bunların bağıntısal nedenlerinin ortaya konma çabasıdır. "Denetim" işlevi de ilk iki işlevle üretilen bilgilerin uygulamaya yönelik sonuçlarını ortaya koyar. Özet olarak bilim nedensellik bağıntılarını "doğru" olarak bilmeyi ve bunlardan yararlı "bilgi ürünleri" oluşturmayı amaçlamaktadır. Diğer taraftan kesinliğin karşıtı olarak düşünebilecek "Belirsizlik" , tanım olarak "açık ve net bilgi yoksunluğu" ,"içinde bulunulan durumu veya gelecekteki bir beklentiyi veya birden fazla olası seçeneği tanımlama açısından kısıtlı bilgi bulunması" olarak tanımlanabilir. Anlaşılacağı üzere belirsizliğin ölçümü ortaya çıkabilecek tüm seçenekleri belirlemek, bunların her birine düşen olasılıkları saptamakla başlar. Bu da olasılığın "uygulanması" ve istatistik bilimi kullanılması ile gerçekleşir. Belirsizlik , "risk" kavramı ile birlikte gelir; bazı olası sonuç seçenekler zararlı hatta ölüme kadar gidebilen olumsuz çıktılardır, böylece bu tip seçeneklerin saptanması ve olasılık çerçevesinde "büyüklüklerinin" belirlenmesi riski de ortaya koyar. Buna karşılık riskin tersi "yarar" olarak düşünülürse, riski olasılığının dışında kalan kısım çözümlenmelidir. Belirsizlik tüm insan etkinlik ve bilimlerinde ortaya çıkar, bir anlamda tıp bilimi de bu alanda doğru kararlar alınması için yine bu alanda ortaya çıkan belirsizliklerle baş edebilme sanatıdır. Bu, ilgilenilen konudaki tüm verileri , nesnel ipuçlarını derlemek , çözümlemek ve bir sonuç üretmeyi içerir. Söz konusu veriler çoğu zaman sayısallaştırılabilir - hasta/sağlam sayıları , MI olguları ve kolesterol düzeyleri , farklı semptomları taşıyanların sayıları , semptomları ağırlıklarına göre dağıtılması , vs .Bu sayılardan yola çıkarak altta yatan belirsizlikler için en uygun çıktı, karar, yorum olasılıklarına gidilir. BELİRSİZLİĞİN NESNELLEŞTİRİLMESİ: OLASILIĞIN BELİRLENMESİNE DOĞRU Nedensellik Bağıntısı Nedir? İki ayrı olgu veya duruma ilişkin var olma -veya ölçüm büyüklüğü değişmesiözellikleri arasındaki birlikteliğe “Nedensellik bağıntısı“ denir. Bilim genel olarak böylesi bağıntılara objektif açıklamalar getirmeyi amaçlar. Nedensellik bağıntısı Kabaca önceden var olan bir olayın varlığının daha sonra ortaya çıkan bir olaya neden olması veya düzeyinde değişiklik oluşturması biçiminde düşünülebilir. Konunun olasılıklı değerlendirme çerçevesinde basit bir örnek üzerinde kısaca irdeleyelim: "E" etkeninin, "S" sonucunu doğuran bir neden olduğunu düşünürsek, "E’’ etkeninin var ve yok olduğu örneklerde "S" nin var ve yok oluşuna göre aşağıdakilere benzer örnek tablolar elde edebiliriz. Etken Var Etken Yok Sonuç Var A B Sonuç Yok C D Ebola virüs infeksiyonu üzerinden aşağıdaki gibi bir tablo oluşturacak olursak Ebola infeksiyonu Etken Var Etken Yok Ölüm var 69 0 Ölüm yok 7 44 Ebola infeksiyonuvarlığının , bu enfeksiyondan ölüm için gerekli olduğunu etkenin olmadığı durumda ölümün gözlenmemesinden (B gözünün sıfır olmasından) söyleyebiliriz, buna karşılık etkenin varlığının ölüm için yeterli olmadığı yorumunu etkeni taşıyan herkesin ölmemiş olmasından dolayı (C gözü 7) yapabiliriz. Kuduz infeksiyonu Etken Var Etken Yok Ölüm var 69 0 Ölüm yok 0 44 Yukarıdaki tabloya bakarak Kuduz infeksiyonuvarlığının, bu enfeksiyondan ölüm için gerekli olduğu - B gözü boş - ayrıca yeterli olduğu - infekte olup sağ kalan yok- anlaşılmaktadır. Bu tabloda etken var ise sonuç "kesinlikle" bulunmaktadır. Eğer bir neden "gerekli" ise, sonucun görüldüğü her olguda bulunmaktadır ama sonucun görülmediği olgularda da bulunabilir - bunlar etkenin varlığına rağmen sonucu göstermeyebilmişlerdir -. Eğer bir neden "yeterli" ise bulunduğu her olguda sonuç görülür ama aynı sonuç başka nedenlerle de ortaya çıkabilir dolayısı ile sonucu gösteren her olguda bu nedenin bulunması zorunlu değildir. Bu ifadeden de anlaşılacağı gibi, olasılığa bağlı olaylar arasında özgün değerlendirmeler yapılarak karar noktalarına doğru gidilmesi söz konusudur ve istatistik bilimi bu tür değerlendirmeleri yapmak üzere ortaya çıkmıştır. Bu tür, olasılığa dayalı olayların incelenmesi, kuramlaştırılması, bağıntıların kurulması yöntemleri bütünü "İstatistik" bilimini oluşturur. BİYOİSTATİSTİKSEL DEĞERLENDİRME Biyoistatistiksel değerlendirme, bilimsel bir araştırmanın amaca uygun elde edilmiş verilerinin, karar üretebilmek amacı ile , istatistik kuramları temel alan sayısal tekniklerle değerlendirilmesi olarak tanımlanabilir. Bu tip bir değerlendirme zaten bilimsel araştırmanın zorunlu bir aşamasıdır .Bu değerlendirme , araştırma sürecinin tüm boyutlarından etkilenebilir , hazırlığı da , yöntembilimsel süreçleri belli düzeylerde ve biçimlerde etkiler. Başka bir deyişle araştırmanın koşullarına uygun bir değerlendirme yapılması zorunlu olduğu gibi , bir araştırmanın koşulları da eldeki , kullanılabilecek değerlendirme yöntemlerine göre seçilmeli akla gelen her koşula , araştırma tasarımına uygun bir değerlendirme yöntemi bulunabileceği önyargısı ile yola çıkılmamalıdır. Hem araştırma aşamalarının hem de bu etkileşimlerin doğru tanımlanması ve gerçekleştirilmesi sonuçların da doğru ve güvenilir olması açısından zorunludur. Aşağıdaki şekilde , biyoistatistiksel değerlendirmenin de yer aldığı bir bilimsel araştırma düzeninde çeşitli süreçsel özelliklerin etkileşimi en basit durumu ile görülmektedir. Bilimsel araştırmanın o aşamaya kadarki süreçlerine uygun olarak elde edilmiş olan nesnel-sayısal veriler üzerinde önce gerekli özetsel istatistik uygulamaları yapılır. Devamında ise varsayımın geçerliliğini yargılayacak olan , araştırma sorusuna yanıt verecek olan , belirlenen "sıradışılığı" bilimsel olarak yargılayacak olan değerlendirme gerçekleştirilir. Bir araştırma aslında tek bir varsayım - araştırma sorusu içermeli ise de bir çeşitli açılardan , çok sayıda değişkeni ilgilendiren pek çok değerlendirme yapılabilir. Bunların tümü araştırma protokolünde bulunan , planlanmış , varsayımın yargılanmasına doğrudan veya dolaylı katkısı olan değerlendirmeler olmalıdır. Araştırmanın varsayımı - sorusu, genelde tek bir özgün olayın (primary endpoint) yargılanmasını esas alır , ilgilenilen diğer özellikler ikincil konular , değişkenler olarak (secondary end points , events, variables) ele alınır. Gereken her istatistiksel değerlendirme , o değerlendirmeye konu olan durumun koşulları çerçevesinde belirir ve bu özgün koşullar kullanılması gereken doğru biyoistatistiksel tekniği belirler. Bazen , aynı soruna kabaca birden fazla tekniğin uygulanabileceği sanılsa bile aslında bir yargılamanın koşullarına uyan sadece tek bir doğru teknik vardır ve ancak onun sonucu geçerli-doğru olacaktır. “p” Nedensellik bağıntısının tipi ne olursa olsun, hangi tip değerlendirme tekniği ile gerçekleştirilirse gerçekleştirilsin bir biyoistatistiksel yargılamanın sonucu “p” harfi ile simgelenen bir olasılık düzeyi yansıtılarak verilir. “p” , olasılık kelimesinin (probability, probabilite) karşılığı olarak kullanılmakta olup gerçekleştirilen değerlendirmedeki sorunsala ilişkin özgün olasılık düzeyini yansıtır. Genel anlamı ile “olasılık”; “bir olayın ortaya çıkış beklentisinin ölçütü” olarak tanımlansa da ele alınışı ve yorumu doğal olarak söz konusu olayın tanımsal özelliklerine bağlı olacaktır ve bir bilimsel yargılamadaki istatistiksel değerlendirmenin sonucu olan “p” değeri de bu çerçevede yorumlanacaktır. Şekil 1.2.- Biyoistatistiksel değerlendirmenin diğer yöntembilimsel araştırma ögeleri ile etkileşimi. Olasılık düzeyi “0” – gerçekleşmesi olanaksız – ile “1” – mutlaka gerçekleşecek – değerleri arasında değişir ve genellikle “0” ve “1” düzeylerine – bilimsel araştırmalar çerçevesinde rastlanmaz. Olasılık düzeyi ne denli yüksek olursa ilgilenilen, "araştırmanın soru özelliğinin" ortaya çıkma “şansı” da o düzeyde yüksek olur ama hiç bir zaman “mutlaka olacak” düzeyine erişemez dolayısı ile çok yüksek bir olasılık düzeyi bile, yine de beklentinin aksinin çıkmasına açık olacaktır. Olasılık tabanlı değerlendirme, karmaşık sistemlerin – medikal konuların da içinde bulunduğu – mekanizmaları, bunların düzen ve düzensizliklerini tanımlamak ve anlamak için kullanılacaklardır. "p" simgesi, sayısal biçimde sorgulanabilen kavramsal veya uygulamalı bir medikal sorunun olasılık sonucunu yansıtır ve anlamı sorunun yapısına göre değişir. Yeni tedavi "A" , "B" tedavisinden daha etkin midir ? p = 0.6818 iki tedavinin başarı oranları arasında "Anlamlı fark" bulunamamıştır. Yeni tedavi "A" , "B" tedavisinden daha etkin midir ? p = 0.1565 iki tedavinin başarı oranları arasında "Anlamlı fark" bulunamamıştır. Yeni tedavi "A" , "B" tedavisinden daha etkin midir ? p = 0.0451 tedavinin başarı oranları arasında "Anlamlı fark" bulunmuştur. iki Bu 3 çapraz tabloda da tedavi tipleri arasında başarı oranı farkı olup olmadığı sorgulanmıştır. İlk tabloda, kıyas tedavileri arasındaki oran farkı ( % 78.8 - %76.1) bilimsel açıdan nedensel sayılabilecek düzeyde bir fark olarak belirlenmemiştir. Bu yetersiz fark - ya da "farksızlık" - ikinci tabloda da sürmektedir (%78.8 - %69.1) . Bu örnekte tedavilerin oranları arasındaki farkın artmasına koşut olarak sonuç yargı olasılığı olan "p" değeri de değişmiş ve daha düşmüştür (0.6818-->0.1565). Anlaşılacağı üzere "fark" arttıkça , bunu "gerçek" bir fark olarak yorumlamamızın ipucu olan "p" değeri küçülmektedir. 3. örnekte "p" nin belli, özel bir sınırın altına inmesi ile yorumun da diğer yöne - fark bulunduğu - döndüğü anlaşılabilecektir. Bu tablolar ve yorumlarından çıkartılacak ana kavramsal sonuçlar şunlardır: 1. Bilimsel araştırmalar öngörülen, varsayılan "farkların" gerçekten var olup olmadıklarını veya gözlenen-belirlenmiş farkların altında gerçek nedensellikler bulunup bulunmadığını sorgulamak üzere yapılır, dolayısı ile "fark bulunması / bulunamaması" kalıbı her zaman kullanılmaktadır. Bilimsel açıdan geçerli-kanıtlı bir nedenselliğe bağlı fark ,"anlamlı fark" olarak adlandırılır. 2. Genel anlamı ile "p" değeri, gözlenmiş ve/veya öngörülmüş bir farkın altında gerçek bir nedensellik yatabileceği iddiamızın ne kadar yanılabileceğini yansıtmaktadır. Bu iddia'nın, varsayımın, yapısına, biçimine, yönüne göre "p" düzeyi sonucunu değerlendirmek de farklılaşabilecektir. 3. örnekte "p" için belli bir sınırın altına düşülmesi ile yorumlama değişmiştir. "p" sonuçlu bir sorunsalın 3 farklı biçimde ortaya çıkabileceği ve değerlendirilebileceğini aşağıda ayrıntısı ile göreceğiz ancak belli "p" olasılık düzeyinin altında bulunulması, yani yanılma payının çok düşük olduğu koşullar, önerinin, varsayımın, gözlenen farkın gerçekliğini, geçerliliğini vurgulayacaktır. Medikal alanlar için bu kritik sınır p=0.05 olarak kabul edilmektedir, bu sınıra "anlamlılık sınırı" denir. -bununla birlikte özel koşullarda p=0.10 a kadar yükseltilebilmesi veya çok kritik-tehlikeli sonuçların ortaya çıkabileceği alanlarda p=0.001 e kadar düşürülebilmesi olanaklıdır. 3. Dikkat edilirse 2. ve 3. tabloda A ve B tedavilerinin başarı oranları aynı olmasına karşın (%78.8 - %69.0) - 3. tablodaki olgu sayıları 2. tablodakinin tam 2 katıdır- 2. tabloda anlamlılık bulunamamışken, 3. tablo anlamlı fark göstermektedir, örneklem sayısının, sonuç yargı değeri üzerinde kesin ve büyük etkisi bulunmaktadır. Bu konunun önemi "örnekleme" bölümünde ayrıntısı ile ele alınacaktır. Çapraz tablolarla değerlendirilmiş araştırmalardan bazı başka örnek araştırma konularını da ele alalım: Kadınların HDL düzeyi erkeklerinkinden yüksek midir? Kadın kümesi HDL (nk= 34) 47.3 ± 11.7 mg/dL Erkek kümesi HDL (ne= 26) 39.8 ± 12.6 mg/dL →p = 0.0206 Kadınların HDL düzeyi erkeklerinkinden anlamlı olarak yüksektir. Hastaların total kolestrol düzeyi tedaviden sonra düşmüş müdür ? (n= 27) Tedavi öncesi : 254.8 ± 26.5 mg/dL Tedavi sonrası : 219.7 ± 19.3 mg/dL →p = 0.017 Tedavi kolestrol düzeyini anlamlı olarak düşürmüştür. Total kolestrol ve HbA1c düzeylerinin değişimi birbirleri ile bağıntılı mıdır " ? n=56 , Ch.: 214.6 ± 23.5 mg/dLHbA1c : 4.7 ± 0.76 % r = 0.57 →p = 0.00043 : (p<0.001) Total kolestrol ve HbA1c düzeyleri matematiksel bir model çerçevesinde birbirlerine uygun olarak değişmektedirler 4. Biyoistatistiksel değerlendirme ve dolayısı ile "p" sonucu her tür değişken için ve her tür bilimsel araştırma tasarımında ve nedensellik yargısında bulunmaktadır. Genel olarak sınıflandırılırsa "p" , 3 ayrı tip sorunun dolayısı ile de sonuçsal yorumun olasılık yargısı olarak ortaya çıkar: -Öngördüğümüz bir düşüncenin doğruluğunu kanıtlamak için gerçekleştirilen bir bilimsel araştırmada , “p” bu düşüncenin-varsayımın yanlış olması (yanılgımızın) düzeyini gösterecektir. Başka bir deyişle böylesi bir düşüncenin sadece şansa bağlı olarak ortaya çıkması olasılığını gösterir. • Yeni bir "A" tedavisinin, standart tedaviye kıyasla, x-kanseri hastalarının sağkalım süresini en az 20 ay uzatacağını öngörüyoruz. p =0.003 p<0.05 Bu yöndeki öngörümüzün yanılma payı çok düşüktür, varsayımımız kabul edilebilir ve yeni tedavinin sağkalımı uzattığı kanıtlı sayılabilir. • "A" hastalığının kadınlara kıyasla erkeklerde daha çok gözlenebileceğini ileri sürüyoruz. (araştırma sürecinde 18/1363 erkek , 9/1307 kadın --> % 1.32 - % 0.68) p =0.103 p>0.05 Bilimsel açıdan emin olamayacağımız düzeyde bir yanılma payı, hastalığın erkeklerde daha yüksek olduğunu kesin ileri süremeyiz. Oranların farklı olduğu düşüncesi reddedildi. - İkincil özellikte değişkenlerde gözlemlenen - araştırmanın ana sorusu olmayan - bir fark düzeyinin yorumlanması. Sonuç "p", eğer bu farkın özel bir nedensel bağ çerçevesinde ortaya çıktığını öne sürersek ne denli yanılabileceğimizin göstergesidir. • Bir klinik araştırmada ( iki tedavinin etkinliği kıyaslanıyor) , "A" tedavisi hastalarının yaşı 59.8 (± 5.4, n1=18) ve "B" tedavisindekiler; 62.6 (± 6.3, n2=19) bulundu. Bu fark "anlamlı mı?" , etkinlik sonuçlarını da etkileyebilmesi açısından yanıt önem taşıyor. p =0.157 p>0.05 Tedavi kümelerinin yaş düzeyleri arasında "anlamlı" fark bulunmuyor, birbirlerine denk sayılırlar - dolayısı ile de yaş , tedavi etkisini bozacak bir ikincil etken gibi gözükmüyor-. - Kuramsal veya gerçek hayattaki beklentiye uymadığı gözlenen bir durumun yargılanması. Bu durumda "p", gözlenen "farklılığın" yeni bir kurama, duruma uyduğunu ileri sürersek ne kadar yanılabileceğimizin göstergesidir. Başka bir deyişle eski kuramın şansa bağlı olarak böylesi bir "uç durumu" gösterebilme olasılığını yansıtır. • Yeni bir fertilizasyon yönteminde 79 gebelikten 45 i kız bebektir (%56.96) , kuramsal beklentiden (%50) gerçekten yüksek sayılır mı - özellikle kız mı oluyor ? p =0.042 p<0.05 Kuramsal beklentiye göre anlamlı olarak daha yüksek kız bebek bulunmaktadır. Ancak "p" değerinin anlamlılık sınırına çok yakın olması nedeni ile kesin bir yargıya varmak için yeni olguların birikmesinin uygun olacağı ve/veya ikincil koşulların da gözden geçirilmesi düşünülmelidir. Bu örnekten anlaşılacağı üzere özellikle anlamlılık sınırına yakın sonuçlarda, örneklem sayısı, klinisyenin görüşleri ve sonucu etkileyebilecek ikincil etkenler mutlaka sonuç yargıda göz önünde bulundurulmalıdır. Verilen örneklerden ve yorumlardan anlaşılacağı üzere biyoistatistiksel değerlendirme daha önce de vurgulanmış olan başka kavramlar ve özelliklere göre yöntem ve yorum değiştirebilmektedir dolayısı ile sonuç olarak bilinmelidir ki bu süreç, sadece- rastgele bir teknikle - bir “p” değeri hesaplaması değildir . Bir bilimsel öngörünün geçerliliğinin denetimi için gerekli olan: • Bir sezgiyi-öngörüyü denetlenebilir “biçime”, varsayıma dönüştürmek; • Olayın ölçütlerini ve bunların yapısını belirlemek,değişken seçmek, • Denetim için uygun düzeni tasarlamak, • Güvenilir sonuç için gerekli örneklem sayısını hesaplamak, • Verilerin toplanacağı “olguları” belirlemek, • Verileri olgulardan sağlıklı-doğru elde etmek ve işlemek, • Koşullara uygun “yargılama yöntemini” kullanmak, • Sonuçları doğru yorumlamak ve karar üretmek, aşamalarının tümü doğrudan veya dolaylı olarak sonuç "p" değerinin ortaya çıkmasını oluşturacağından , bir anlamda "Biyoistatistiksel değerlendirme" tüm bu basamakların bütünü olarak düşünülmelidir. Araştırıcı o ana dek varlığı bilinmeyen veya yanlış ya da geçersiz olarak kabul edilen bir bilgiden farklı bir bilgiyi sezerek onu varsayım veya özgün bir düşünce biçimine dönüştürmüş, istatistiksel yargılama ile öngörüsünün geçerliliğini denetlemektedir. İstatistik hesaplamalar konunun özelliğine göre çeşitli testler kullanılarak yapılırlar ve hesap sonuçları genellikle özel simgelerin karşılığı olarak belirtilir (t, z, F, χ2, vs.) Her test için, araştırmanın deney düzeyine bağlı olan (denek sayısı, kontenjans tablosunda göz sayısı vs.) ve adına “serbestlik derecesi” denen bir kavram çerçevesinde, elde edilen sonuç değere karşılık gelen bir olasılık düzeyi belirlenir. Gerek okuyucunun konuyu daha bilinçli irdelemesi gerekse de gereğinde çözümleme denetimlerinin yapılabilmesi için istatistiksel değerlendirme sonuçlarının yargılamada kullanılmış olan testin simgesi (“χ2” gibi) ve serbestlik derecesi (sd) de vurgulanarak verilmesi önerilir (ör.:χ2 = 6.38 , sd=2 , p= 0.041). Uygun tasarımla , yeterli sayıda ve doğru yapılandırılmış örneklemle , araştırmanın tasarım ve değişken koşullarına göre seçilmiş bir (biyo)istatistiksel değerlendirme tekniği ile sürdürülen bir araştırmada , öngörülen varsayım kanıtlanmamış olsa bile bu bilgi de yayınlanmalıdır. Böylesi bulgular daha sonra yapılacak araştırmalar için çok önemli temel taşları oluşturacaklardır Ancak unutulmaması gereken ilke de şu olmalıdır :”Kanıtlanamamış fark , farksızlığın kanıtı değildir”….. Açıklayıcı İstatistik: Toplumun tümünde çalışmak çok zor olduğundan toplumu temsil eden örnek üzerinde çalışılır, Hipotez testleri ve hesaplama metodları açıklamalar için son derece önemlidir, Örnekten elde edilen veriden toplumdaki olasılığa ulaşılmaya çalışılır. Sigara içmenin sağlık üzerine olumsuz etkisinin araştırılmak istendiği ulusal düzeyde bir çalışmada tüm toplum yerine toplumdan elde edilen örnek grupla görüşülür, Toplumda barsak solucanı sıklığını araştırmak için tüm toplum yerine rastgele seçilen örneklerdeki sıklıktan toplumdaki sıklığı hesap edilmeye çalışılır. Genelde pek çok farklı bilim dalında da kullanılabilen temel istatistiksel yöntemlerden yararlanarak, tıp ve diğer biyolojik bilimlerdeki konulara, sorunlara yanıt arama yaklaşımına "Temel biyoistatistik" adı verebiliriz. Bu çerçevede tanımlayıcı istatistikler, kıyassal tabanlı basit varsayım çözümlemeleri, bazı basit - veya karmaşık- bağıntı modellemeleri gibi konular temel biyoistatistik çerçevesinde ele alınır. Biyoistatistik; "Genelde tüm canlıların özelde insanların biyoloji ve sağlık tabanlı konularda, diğer canlı ve cansız değişkenlerle etkileşimlerinin sonuçlarını sayısal olarak değerlendirerek tanılama, yargılama ve yorumlama yapmak bilimidir". Biyoistatistik günümüzde 3 alt özellikli olarak düşünülebilir: bunlardan ilki verilerin toplanması ve değerlendirilmesi dökümü, biçimindedir. Bu ikincisi ise uğraşların çeşitli matematik ise yöntembilimsel yöntemlerle çerçevede gerçekleştirilmesi gereği 3. özellik olarak varsayılabilir. Biyoistatistik, tıpta genelde iki alanda kullanılır, bunların en genel anlamları ile alt başlıkları da çok kısaca şöyle düşünülebilir. 1- Koruyucu tıp’ta, • Genel ve bölgesel sağlık durumu saptama ve planlanmasında, • Toplum özelliklerinin değerlendirilmesinde, • Farklı toplumların özelliklerinin kıyaslanmasında, • Taramaların, tedavi hizmetlerinin, önlemlerin değerlendirilmesinde kullanılır. Bu başlıklardan da anlaşılacağı üzere biyoistatistik halk sağlığı ve epidemiyolojinin vazgeçilmez-zorunlu bir parçasıdır. 2- Klinik tıpta, klinik araştırmalardan elde edilen sonuçlar ile, • Klinik tanı yöntemlerinin yargılanması, kıyaslanmasında, • Yeni tedavi yöntemlerinin yargılanması, kıyaslanmasında, • Etiyolojik etkenlerin saptanmasında, • Belli biyolojik, klinik özelliklere ilişkin kestirimlerin üretilmesinde, Tıpsal sonuçları etkilediği düşünülen belirlenmesinde sayısal özellikleri ile kullanılır. farklı değişkenlerin etkilerinin BÖLÜM III VERİLERİN TOPLANMASI ve DÜZENLENMESİ ile ÖLÇÜM ÖLÇEKLERİ Sağlık politikası oluşturma, planlama, programlama, bütçeleme , uygulama ve bütün sağlık sistemi içindeki farklı programların genel entegrasyonunun sistematik ve sürekli işlemesi bilgi desteğine bağlıdır. Veri toplama ve analizi için kullanılan yöntemler potansiyel kullanıcılara ve bunların duyacakları bilginin çeşidine bağlıdır. Veri toplama için düzenli ve özel amaçlı sistemler Düzenli veya rutin bir sistemle veri toplamadır. Sıklıkla veri oluştukça veri toplama için bir kayıt işleminden oluşur. Örnek: 1. Doğum, ölüm, evlenme gibi hayati olaylar hakkında veri toplama için bir yaşamsal kayıt sistemi, 2. Salgın hastalıklar hakkında bilgi toplamak için bildirim sistemi, 3. Kanser olgularını takip edebilmek için kanser kayıt formu gibi, Özel amaçlı veri toplama genellikle düzenli bir temelde bulunmayan, bilgiyi toplama için taramanın yapıldığı veri toplama şeklidir. Örnek: Obesite taraması, Oral kontraseptif kullananların saptanması gibi, Özel amaçlı sistemi düzenli veri toplama sisteminden ayıran temel özellikler; 1. Hangi tip bilginin toplanmasına gereksinim duyulduğu ve bu gereksinimin topluma tanıtılması ve katılımının sağlanması, 2. Hangi tip bilginin toplumun hangi kesiminden toplanacağına karar verilmesi, 3. Kaç kişiden bilgi toplanacağı, 4.Bilgi toplanacak kişilerin nasıl seçileceği konularına gereksinim duymaktadır. Veri Ölçme İçin Araçlar: Veri ölçme için üç temel araç vardır. 1. Alet: Ölçüm tamamen mekanik bir araçla yapılır.Ağırlık tartısı, termometre 2. İnsan : Ölçüm aletinin az veya yok denecek kadar katkısı ile insan tarafından yapılır. Kalbin dinlenmesi, dalak büyüklüğünün derecelendirilmesi, 3. İnsan ve alet kombinasyonu: Röntgen filmlerinin okunması, kan yayma preparatlarının okunması. VERİ ELDESİ YÖNTEMLERİ Araştırmaların nesnelliğini sağlayacak olan veriler, araştırma tasarımının özelliği çerçevesinde – örneklerden- elde edilen sayısal veya sayısallaştırılabilen bilgilerdir. Bunların elde edilmesi temel olarak 2 kaynaktan sağlanır : Gözlemler ve Deneyler. GÖZLEM: Araştırmacının, oluşumuna hiç bir katkısal / değiştirici etki göstermeden , - gereğinde tanımı nesnel bir varsayım oluşturmadan- çeşitli olayları dışarıdan, doğal çevresi ve kurgusu içinde, duyumsal olarak izlemesidir. Bu tür olaylar sıklıkla nitel özellikte ve büyük boyutlu (toplumsal veya doğal) oluşumlarda ve uzun süreçlerde veya tamamen rastlantısal ortaya çıkan tiptedir ancak belli hastalık veya tıpsal özelliklerin tanılanması çerçevesinde nicelikler de olabilir. Araştırıcı olgulardan bilgi toplamak amacı ile belli koşullarda özgün teknikler kullanabilir ( kan tahlili, MR , vs ). Gözlemler, olguların, örneklemin yapısallığında hiçbir değişiklik oluşmasına neden olmaksızın: - Özel tedavi yok, - İlgilenilen konu özelliği bozacak (tansiyonunu yükseltecekse, stresini arttıracaksa, bazı kan değerlerini değiştirecekse, vs) girişim yok, Çeşitli Tamamen doğal koşulları koruyarak, gerçekleştirilmelidir. konulardaki anketler, özgün konu dizgeleri, hasta öyküleri, arşiv değerlendirmeleri, kayıtlardan çalışmalar, vs “gözlem” kavramı altında gerçekleştirilir. DENEY: Araştırmacının, kendi varsayımsal amaçları doğrultusunda, gereğinde yapay özellikler içeren düzenler üretilerek ve konumdaki değişkenlerin tanındığı, bilindiği ve/veya özel olarak katıldığı, ortam ve koşullarda, sonuçların belirmesini tetikleyerek veri oluşturmasıdır. Sonuçlara daha kısa sürede erişilebilir ama tüm etkenlerin denetimi olanaksızdır dolayısı ile sonuçlarda belirsizlikler kalabilir veya gerçek yaşam koşullarına uygulandığında beklenmeyen durumlar ortaya çıkabilir. Deneylerde olabildiğince nesnel koşullarda çalışılmalıdır. Araştırıcı olgulara “değişimleyici” girişimde bulunur yani kendi kurguladığı belli bir nedensel fark yaratarak – Farklı tedaviler, girişimler, vs – bunun farklı sonuçlar üretme özelliğini belirler. Dolayısı ile önce nedensel girişim vardır bulunur, sonuç sonradan ortaya çıkar İleri yönelik. Tüm “klinik deneyler” bu tanıma girer. Bu çerçeve de 3 alttip ayrımlayabiliriz: Kontrollü deney: Kontrollü deney, etkisi yargılanan özellik dışında tüm diğer özellikleri açısından – olabildiğince- benzeş bir kıyas kümesindeki sonuçlar ile bir deneysel etkenin bulunduğu kümenin sonuçlarını kıyaslar – ileri yönelik - . Özel koşullarında – laboratuar veya klinik, hastane, vs – gerçekleştirilen deneyler bu başlığa uyar. Doğal deney (Quasi Experiment):Doğal deneyler kontrollü deneylerdekinden farklı olarak düzenli denetlenebilen belli sayıda değişken yerine ilgilenilen bir sistemin değişkenlerinin tümünün – olabildiğince – gözlemlenmesi ve böylece belli değişkenin farklılaştırıcı etkilerinin başka değişkenlerinkinden ayırt edilebilmesini temel alır. Genelde belli bir varsayım çerçevesinde ortam ve özellikler gözlemlenmektedir. – her yöne !- Kendiliğinden ortaya çıkmış, toplumsal – alansal boyutta bir olayı öncelikle gözlemleyip, devamında nedenini – veya sonucunu – belirleyebilmek için belli girişimlerde bulunulması ile gerçekleştirilir.1854 Londra kolera salgınında Broadstreet ‘teki kuyunun infeksiyonun kaynağı olduğunun saptanması bu yöndeki ilk örnektir ve süreci gerçekleştiren Dr. Snow’da ilk “çözümleyici” epidemiyolog sayılabilir. Anlaşılacağı üzere epidemiyoloji’de son derece önemli bir yaklaşımdır. Alan deneyleri: Kontrollü deney yaklaşımının toplumsal boyutta, belli tip etken sorgulamaları için gerçekleştirilmesidir. En sorunlu yönü pek çok ikincil etkenin kontrol dışı kalması hatta bilinmeyen etkenlerin varlığıdır. – ileri yönelik - . İki farklı ancak temel özellikleri benzeyen kasabada, biri kontrol diğeri sağlık düzeyinin yükselteceği öngörülen bir girişimin alanı olarak kullanılarak ve sadece bu girişim farklılığı dışında diğer yaşam koşullarını doğal akışına bırakarak sürdürülen bir araştırma örneği bu başlığa girer. Halk sağlığı açısından önemli bir araştırma yaklaşımıdır. BAŞLICA ARAŞTIRMA TASARIM ŞEMALARI Belli bir varsayımın kanıtlanması amacı ile başlatılan araştırmalar, bu beklenti çerçevesinde karar vermeyi sağlayacak uygun bir çözümleme tasarımına göre yürütülürler. Özgün tasarım şeması her şeyden önce araştırma konusu nedenselliğin bir "nedensel" veya "birlikte değişim" bağı olmasına göre farklılaşır. Daha önce vurgulandığı gibi bazı araştırmalar - çözümle tanımlayıcı- gereğinde her iki bağı da barındırırlar. Aynı şekilde araştırmada yer alan "kıyassal ortam" veya "bağımsız" değişken sayısı tek - dolayısı ile çift değişkenli değerlendirme - veya çok sayıda olabilir - çokdeğişkenli değerlendirme - . Daha önce vurgulandığı gibi bilimsel araştırmalar salt tanımsal amaçlı da yapılabilir. Aşağıdaki basit şema hangi araştırma tiplerinde ne tür nedensellik karşılaşabildiğimizi özetlemektedir. bağları ve değerlendirme yaklaşımları ile İlgilenilen nedensellik bağının tipine göre ve varsayımın yönlendirmesine de bağlı olarak "kanıtlama" kurgusu aşağıdaki yaklaşımlardan birine bağlı olarak gerçekleştirilir. Bu yaklaşımlara ilişkin çok kısa bilgi verirsek: AYRIM YAKLAŞIMI: En basit açıklaması ile bağımlı değişken, yani sonuç olarak düşünülebilecek bir y özelliğinin, bunun nedeni - ya da bağımsız değişken olarak düşünülen bir x olgusu ortadan kaldırıldığında, yok olup olmadığının – veya düzeyinin anlamlı olarak değiştiğinin –denetlenmesidir. Yaklaşım, x değişkeni ortaya konduğunda, etki ettirildiğinde, bunun sonucu olarak beklenen y’ nin de ortaya çıkıp çıkmadığını denetlemek şeklinde de düşünülebilir. Dolayısı ile nedenden sonuca süreci sorgulayan bir yaklaşımdır, “ileri yönelik” araştırma tasarımları bu süreci uygular. Sigara içimi etkisi ile ( çiçek hst. Virüsü ile) akc. Ca. (çiçek hst.) varlığı ortaya çıkıyor mu? UYGUNLUK YAKLAŞIMI: En basit açıklaması ile; -bağımlı değişken ya dasonuç olarak düşünülebilecek bir y özelliğinin var olması durumunda, bunun nedeni ya da bağımsız değişken - olarak düşünülen bir x olgusunun da var olup olmadığının denetlenmesidir, anlaşılacağı gibi ayrım yaklaşımının tersi yönde bir süreçtir. Dolayısı ile sonuçtan nedene süreci sorgulayan bir yaklaşımdır, “geriye yönelik” araştırma tasarımları bu süreci uygular Akc. Ca. ( çiçek hst. ) olan durumlarda (!!!) , sigara içimi (çiçek hst. Virüsü ) var mı ? TORTU YAKLAŞIMI: Bir sonucu açıklamak için kurgulanmış ve ileri yönelik olarak sorgulanmış - nedenden sonuca - bir düzen olmaksızın, elde bir seri "olası" neden bulunduğunda uygulanabilir. Söz konusu listeden , sonucu etkileyemeyeceği belirlenen olası nedenler elendiğinde - Sherlock Holmes : Zanlılar listesinden bazılarının olay yerinde olamayacağı belirlendiğinde - kalan olası neden(ler) , kanıtlı neden (!?) olarak düşünülebilir. Sonuçların güvenirliği açısından, bilimsel kabuller çerçevesinde oldukça yetersiz olacağı ortadadır. Listede olmayan bir çok gerçek neden bulunabilir, sonuçta "neden" olarak gösterilen değişkenin gerçek gücü çok tartışmalı veya yetersiz olabilir. Belli düzeye kadar, çözümle-tanımlayıcı araştırma süreci bu çerçevede düşünülebilr. ANDIRIŞMA YAKLAŞIMI: Bir sonucu açıklamak için kurgulanmış konu çerçevesinde herhangi bir olası neden öngörülmemiş ise, benzer bir sonuca neden olduğu düşünülen nedenlerin benzerleri de yeni araştırmanın konu alanı içinde sorgulanır. Bilimsel koşullar çerçevesinde çok yetersiz kalan ancak bir varsayımın kurulması için sezgi üretmekte ipucu verebilecek bir yaklaşım olarak düşünülebilir. BAĞINTI VARLIĞI SORGULAMASI: Bir değişkenin ölçümsel büyüklüğünün başka bir değişkeninkindeki değişimlere uygun olarak farklılaştığını ortaya koymak anlamınadır: kabaca Y= f(x) sonucunun geçerliliğini ortaya koymak amaçlanır. X' , Y'nin nedeni olmak zorunda değildir, yaklaşım sadece bunların birbirlerine göre - daha sonraki aşamada, koşullar uygunsa matematik modeli de açıklanabilecektir - büyüklük değişimi varlığını ortaya koyar. UYUM VARLIĞI SORGULAMASI: Bir değişkenin ölçümsel büyüklüğünün başka bir değişkeninkine eşdeğer olarak ortaya çıktığını ortaya koymak anlamınadır: kabaca Y= x sonucunun geçerliliğini ortaya koymak amaçlanır. x'in gerçeği yansıtan bir değer olup olmadığı sorgulanmaz yeter ki y buna eşdeğer büyüklük gösteriyor mu sorgulanır. - Dr. Ahmet ve Dr. Mehmet 'in aynı hasta kümesi ile ilgili tanılarının uyumu, her iki hekimin tanıları da birbirleri ile uyumlu ancak yanlış olabilir. DOĞRUYA UYGUNLUK SORGULAMASI: Bir değişkenin ölçümsel büyüklüğünün gerçeği doğru yansıttığı kabul edilen başka bir değişkeninkine eşdeğer olarak ortaya çıktığını ortaya koymak anlamınadır. kabaca Y= x sonucunun, x "gerçek" büyüklük olmak üzere geçerliliğini ortaya koymak amaçlanır. MATEMATİKSEL BAĞINTI MODELLEMESİ: Bir değişkenin ölçümsel büyüklüğünün başka bir değişkeninkindeki değişimlere uygun olarak farklılaştığının ortaya konmasından sonra, araştırmanın ve değişkenlerin koşulları uygunsa bu bağıntı için matematik modeli üretilmesi anlamınadır. Son 4 değerlendirme, "Bağıntı" bölümünde ayrıntısı ile ele alınacak konulardır, bu bölümde "nedensel" bağ kanıtlanması için kullanılabilecek olan temel tasarım kalıpları ele alınacaktır. Değerlendirilecek olan kalıplar "çift değişkenli" değerlendirme için geçerli olan kalıplardır. Yöntemlerin Güvenirlik ve Geçerliliği Güvenirlik: Araçların kendi doğal performansını ele alır. Güvenilir bir araç benzer koşullar altında aynı birimde birden çok uygulandığında tutarlı sonuçlar veren araçtır. Güvenirliği etkileyen faktörler; • Aracın kendi doğal değişkenliği, Bir tartı aletinin değişen kalibrasyonu • Ölçülen maddedeki değişimler. Hastanın benzer soruya farklı cevap vermesi • Gözlemci hatası.Tek bir gözlemci tekrarlanan ölçümlerde farklı sonuçlar elde etmesi • Gözlemciler arası hata. Aynı kişide yapılan Kan basıncı ölçüm sonuçlarının farklılığı Geçerlilik: Bir ölçüm eğer ölçmek için önerildiği durumu gösterici nitelikte ise geçerlidir. 1. Ateş, düşük sıtma taşıma düzeyli bölgelerde sıtma için geçerli bir gösterge olmayabilir. 2. Çocuk sahibi olmama infertilitenin geçerli bir göstergesi olmayabilir. Duyarlılık ve seçicilik geçerliliğin iki önemli bileşenidir. Bir testin, bir yöntemin, bir ölçüm aracının duyarlılığı genelde gözlenen bir ölçümde değişmenin ve ölçülen miktar veya etkenin değerine karşılık gelen değişmenin bölünmesi sonucu elde edilen değerdir. Bölme sonucu elde edilen değer büyüdükçe duyarlılık da artmaktadır. Epidemiyolojide duyarlılık bir test tarafından doğru olarak saptanmış gerçek doğruların oranıdır. a/(a+c) ilişkisiyle elde edilir.(Örnek aşağıdaki tablo) Gerçek Görünüm + - Toplam Test + a b a+b Sonuçları - c d c+d a+c b+d Toplam Seçicilik epidemiyolojide doğru olarak saptanan gerçek negatiflerin (sağlamların) oranıdır. d(b+d) ilişkisi ile elde edilir (Bak yukarıdaki tablo) Tarama testlerinde geçerliliğin diğer iki bileşeni pozitif ve negatif prediktif değerlerdir. Burada pozitif prediktif değer yeni testin pozitif saptadıkları arasında gerçek pozitif olma durumudur. a/(a+b) işlemi ile hesaplanmaktadır. Negatif prediktif değer ise testin negatif olarak saptadıkları arasında gerçek negatiflerin oranıdır. d/(c+d) işlemi ile hesaplanmaktadır. Ölçüm ölçekleri: Verileri ölçmek için kullanılan dört ana ölçek isim ölçeği, sıra ölçeği, aralık ölçeği ve oran ölçeğidir. Bir isim ölçeği veya sınıflandırıcı ölçek bir ölçümü diğerlerinden ayırmak için isimlerin, markaların veya etiketlerin içinde verildiği ölçektir. Bu ölçekte ölçüm bireysel ölçümlerin büyüklüğü konusunda herhangi bir kavram içermez. 1. Bir hastada hastalığın sonucu yaşamı sürdürme veya ölüm olarak ölçülebilir. 2. Birinci basamak sağlık bakımı için yükümlülüğün var olduğuna veya olmadığına karar verilebilir, 3. Psikiyatrik hastalar psikotik, nevrotik, manik depresif veya şizofrenik olarak sınıflandırılır. Bir sıra veya sıralama ölçeği ölçümler arasında kesin bir sıra ilişkisiyle isim ölçeğinin özelliklerine sahiptir. BÖLÜM IV VERİ ŞEKİLLERİ, ÖZETLEME ve SUNUM TEKNİKLERİ Bir araştırma bireylerinden yürütülürken veri bireylerden toplamak çok veri toplamanın bireylerin oluşturduğu örnek özellikteki bireylerin tümünün (örnekleme verilir. üzerinde ayrı bir durulan hatta zor kısıtlılığı bütün olanaksızdır. Tüm karşısında grubundan veri oluşturduğu konu topluluğun başlığı kısıtlı toplanır. topluluğa altında sayıda Örneğe giren populasyon ileriki adı bölümlerde yer alacaktır) Örnek oluştuğu ana yığını temsil etmelidir. Örnekleme Yaklaşımları 1. Kolay bireylerden bir örnek örnekleme Hedef örnekleme; oluşturulur. yöntemi Bu olmakla nüfusta yöntem birlikte en ucuz uygun ve hedef ve az nüfusu erişilebilir zaman bire tüketen bir temsil etme özelliği yoktur. 2. rasgele Rasgele örnekleme; seçimle olmaktadır. tamamının tanınmasını Hedef popülasyondan Öncelikle gerektirir. örnekleme hedef Sıklıkla hedef popülasyonun popülasyonu temsil eden bir örnekleme sağlar. 3. Sistematik örnekleme; Hedef popülasyon tanınır ve hedef popülasyonun her bir x inci kişisi örneğe seçilir. 4. Tabakalı bilinmesi bu arasından örnek örnekleme; tip kolay grubu örnekleme örnekleme oluşturulur. Bu Hedef popülasyondakialt için önemlidir. veya rastgele yöntemde de Alt grupların gruplardaki örnekleme her alt bireyler metodu grubu ile örnekte temsil edildiğinden emin olunmalıdır. değerlere Popülasyondanhesaplanan parametrelere istatistik adı karşılık verilir. gelen ve Parametreler istatistikler ise öğrencilerin tamamının oluşturduğu μ ile sembolü gösterilirken, Latin bu örnekten Grek hesaplanan parametre, (Yunan) harflerle hesaplanan harfi gösterilir. popülasyonun öğrencilerden oluşan ile değere gösterilirken, Bir ağırlık örnek okuldaki ortalaması grubunda (tahmin hesaplanan edilen) ağırlık ortalaması mezun araştırıcı oldukları Araştırıcı mezun ana konu öğrencileri zamanda sayıda ve lise ile oldukları evreni lise soru türünü bir formu (anket) saptaması temsil ucuza elde tümü ilgili araştırma olan örnek istenen genelleme tasarlamaktadır. öğrencilerin Bu çalışmada üniversitesinin grubundan tüm daha kısa ulaşılabilinecektir. bilgiye verilerle öğrencilerin oluşturarak İstanbul eden edilecek için çizgi okuyan gerekmektedir. (popülasyon) onu daha Üniversitesinde ile bir oluşturan öğrenciden öğrencilerin türü ilgili yerine ve İstanbul bir şeklindedir) bir Latin alfabesinden bir harfle gösterilir ( Bir üzerinde analizi yapar. Ana yaparak Belirli yorumlar populasyondan elde edilen örnekteki eleman sayısı bize örnek genişliğini vermektedir. İstatistikte “gözlem “Kesikli değeri” Gözlem örneğin denir. Değeri” herhangi Gözlem bir özelliğini değeri saymakla ölçmekle elde edilmiş ise belirten elde rakama edilmiş “Sürekli ise Gözlem Değeri” adını almaktadır. Veri Tipleri; Ölçüm ölçeğine göre; 1. Kalitatif : Binary (dikotom), ordinal ve nominal 2. Kantitatif : Sürekli ve Kesikli olabilir Veri tipleri örneklendirilecek olursa Kalitatif Dikotom:, kadın veya erkek, çalışıyor veya çalışmıyor Ordinal: sosyoekonomik düzey: Yüksek, orta ve düşük Nominal: resmi ilişkisi Medeni olmadan durum (Evli, birliktelik) güney, doğu veya batı) Kantitatif Kesikli: Çocuk sayısı 1,2,3,4 bekar, Yaşanan dul, boşanmış bölge(merkez, veya kuzey, Sürekli: Kan glikoz seviyesi 110 mg/dl veya 130 mg/dl Verilerin Özetlenmesi: Elde sunulmak edilen Kategorik istendiğinde; verilerin sıklık 21 öğrenciden örneğin sayıları izole özet tablo edilen ile parazitler aşağıdaki gibi dağılmıştır. Giardia lamblia Entamoeba histolytica Ascaris lumbricoides Enterobius vermicularis Ascaris lumbricoides Enterobius vermicularis Giardia lamblia İzole yorum edilen yapmak Giardia lamblia Entamoeba histolytica Ascaris lumbricoides Enterobius vermicularis Ascaris lumbricoides Enterobius vermicularis Giardia lamblia parazitler oldukça belirtilmiş zordur. Daha Giardia lamblia Entamoeba histolytica Ascaris lumbricoides Enterobius vermicularis Ascaris lumbricoides Enterobius vermicularis Giardia lamblia olmakla kolay beraber bir sunum sıklıkları şekli sırayla bir tablo yapmaktır. Giardia lamblia Giardia lamblia Giardia lamblia Giardia lamblia Giardia lamblia Giardia lamblia Ascaris lumbricoides Ascaris lumbricoides Ascaris lumbricoides Ascaris lumbricoides Ascaris lumbricoides Ascaris lumbricoides Enterobius vermicularis Enterobius vermicularis Sıklık dağılımını bir tablo halinde sunabiliriz. Parazit n Giardia lamblia 6 Ascaris lumbricoides 6 Enterobius vermicularis 6 Entamoeba histolytica 3 Toplam 21 Enterobius vermicularis Enterobius vermicularis Enterobius vermicularis Enterobius vermicularis Entamoeba histolytica Entamoeba histolytica Entamoeba histolytica ile olan Frekans dağılımının yüzde değerlerini de aynı tabloda bu durumda sunmak daha anlaşılır ve yorumlanabilir sunum sağlar Parazit n % Giardia lamblia 6 28.57 Ascaris lumbricoides 6 28.57 Enterobius vermicularis 6 28.57 Entamoeba histolytica 3 14.29 Toplam 21 100.00 Bazı durumlarda kategori sayısında birleştirilebilir. Bu kategori sayısı azaltma fazla yapmak yöntemde en olabilir, amacı sık ile kullanılan kategoriler başlık “diğer” başlığıdır. Ölüm Nedeni n % Kardiyovasküler hastalık 12,525 21.96 Kanser 10,321 18.10 Alt Solunum Yolları Enfeksiyonu 8,745 15.34 Diğer 25,435 44.60 Toplam 57,026 100.00 Kantitatif 1. gösterilmek Kantitatif sayısı verinin istendiğinde veriler için çalışmadaki sınıf sıklık dağılımı öncelikle sayısı eleman hesaplanmaktadır. Bu formül 1 + 3.3log (n) şeklindedir. 5 ve relatif sınıflandırılması – sayısına 15 arasında göre frekansı gerekmektedir. değişmektedir. Sturges formülü Sınıf ile 2. Frekans belirlendikten dağılım sonra tablosunda yapılacak kaç ikinci sınıfın işlem yer sınıf alacağı genişliğinin belirlenmesidir. Yaklaşık küçük sınıf gözlem genişliği; değerinin en büyük çıkarılması gözlem ile değerinden elde edilen en Değişim Genişliğinin Sınıf sayısına bölünmesi ile elde edilir. Örnek: sayısının En 10 büyük değerin olduğu 150, durumda en küçük sınıf aralığı değerin 50 ve 100/10 =10 sınıf olarak hesaplanacaktır. 3. Üçüncü aşamada sınır sınıfın alt ve sınıfın alt değeri değere sınır Sınıf sınır üst değerleri her en En kolaylığı küçüğü olarak üst sınır sınır son gerekir. İşlem sınıfın belirlenirken edilir. belirlenmesi belirtilir. değerlerinin eklenerek dikkat sınırların değerleri gözlem aralığı çakışmamasına sınır sınıfın üst olarak seçilir. değeri değerlerin Her Bu saptanır. birbiri sınır ilk değeri ile olarak gözlem değerinin en büyüğü seçilir. 4.Her sınıf üst sınırlarının için bir “Sınıf tam ortasında Değeri” seçilir, bu değer sınıfın alt olan ve sınıfın tablosundaki sınıflar tamamını temsil ve eden değeridir. 5. Frekans örnekteki gözlem işaretleme bittikten dağılım değerleri sonra her uygun sınıfta belli sınıflara yer alan olduktan işaretle eleman sonra yerleştirilir, sayısı frekans için frekans sayısı olarak belirtilir. 6. Frekans sayıları belirlendikten sonra her sınıf atım sayısı yüzdesi hesaplanır. 100 arasında sınıf öğrencilik bir grubun değişmektedir. genişliği yaklaşık Sınıf 7 dakikada sayısı olmalıdır. kalp 8 olarak Buna göre olursak aşağıdaki frekans tablosunu elde ederiz. 48 hesaplandığına tablomuzu – 110 göre oluşturacak Sınıflar Sınıf Değeri İşaretle Frekans Frekans (Rakamla) 48-54 51 IIIIIII 6 6,0 55-61 58 IIIIIIIII 9 9,0 62-68 65 IIIIIIIIIIIIII 14 14,0 69-75 72 IIIIIIIIIIIIIIIII 17 17,0 76-82 79 IIIIIIIIIIIIIIIII 17 17,0 83-89 86 IIIIIIIIIIIIIIIIIII 19 19,0 90-96 93 IIIIIIIIII 9 9,0 97-103 100 IIIII 5 5,0 104-110 107 IIII 4 4,0 100 100,0 Toplam Kantitatif yararlı bir % verilerde uygulama yığışımlı olup (eklemeli) herhangi bir frekansı verinin hesaplamak sunumunun aşamasıdır. Sınıflar Sınıf Değeri Frekans % (Rakamla) Yığışımlı Frekans 48-54 51 6 6,0 6,0 55-61 58 9 9,0 15,0 62-68 65 14 14,0 29,0 69-75 72 17 17,0 46,0 76-82 79 17 17,0 63,0 83-89 86 19 19,0 82,0 90-96 93 9 9,0 91,0 97-103 100 5 5,0 96,0 104-110 107 4 4,0 100,0 100 100,0 Toplam son Açık Uçlu Frekans Dağılım Tablosu Bazı değerlerde Bu araştırmalarda veya durumda her verilerin belli ikisinde tablo bir çok ile değerden az sayıda sunumunda tek küçük gözlem taraflı veya büyük değeri olabilir. veya çift taraflı ucu açık sınıflar oluşturulabilir. Yaş Frekans % <5 52 13,20 5-9 132 33,50 10-14 131 33,25 >15 79 20,05 Toplam 394 100,00 Sürekli Gözlem Değerleri İçin Frekans Dağılım Tablosu bir Örneğin kan şeker düzeyi değeri çalışmada kan şeker düzeyi 80 ile mg/dl ilgili 1000 altında 30 kişiyi kişi, kapsayan 181 altında ise 15 kişi olduğu bir frekans tablosu sunacak olursak; Kan Şekeri Frekans % Yığışımlı Frekans < 80 30 3,0 3,0 81-90 75 7,5 10,5 91-100 95 9,5 20,0 101-110 135 13,5 33,5 111-120 205 20,5 54,0 121-130 130 13,0 67,0 131-140 90 9,0 76,0 141-150 65 6,5 82,5 151-160 55 5,5 88,0 161-170 45 4,5 92,5 170-180 60 6,0 98,5 >181 15 1,5 100,0 Toplam 1000 100,0 mg/dl Verilerin Grafiklerle Sunumu Frekans çizilebilir. bu dağılım Frekans verilerle tablosu kesik tablosu tablosu düzenlendikten sürekli gözlem “poligon” veya “histogram” (tam) gözlem değerleri değeri sonra için çizilebilir. için grafikler düzenlenmişse Frekans dağılım düzenlenmişse “Çubuk diyagram” çizilir. Poligon: Frekans eksen) “sınıf değerler” mutlak veya oransal poligonu ve (%) “y” çizilirken eksenine frekans “x” (dikey konularak eksenine eksen) grafik her çizilir. ve B) Kadınların sahip olduğu erkek çocuk sayısı Kadın Sayısı 700 600 500 400 300 200 100 0 1 2 3 4 5 6 Erkek Çocuk Sayısı 7 8+ (yatay sınıfa ait (Grafik 1A Doğum ağırlığının birikimli sıklığı Yeni Doğan 120 Birikimli Sıklık (%) 100 80 60 40 20 0 501- 1001- 1501- 2001- 2501- 3001- 3501- 4001- 4501- 5000+ Ağırlık Frekans tablosundaki değerinden çizilirken poligonu birinci başlar sınıftan ve en önce son var sınıftan poligon olduğu sonra frekans varsayılan var dağılım sınıfın olduğu kabul sınıf edilen sınıfın sınıf değerinde biter. Histogram çizilirken x eksenine gerçek sınırlar ve y her sınıfa ait frekanslar yerleştirilir. (Grafik 2) Kadınların sahip olduğu erkek çocuk sayısı Kadın Sayısı 700 600 500 400 300 200 100 0 1 2 3 4 5 6 Erkek Çocuk Sayısı 7 8+ eksenine Çubuk eksenine Çubuk diyagram sınıflar diyagram birleştirilmez. y tamsayılı eksenine çizildikten Bunun gözlem ise sonra nedeni değerleri sınıflara çubukların tamsayılı iki ait için çizilir. frekanslar tepe noktası değer bir arasında X yerleştirilir. çizgi yer ile alan başka bir değer bulunmamasıdır. (Grafik 3) Gastrointestinal enfeksiyon Sıklık 8 6 4 2 0 Cryptos. Çember (pasta E.histolyt. dilimi) E.coli grafik: Giardia Etken Bu grafikte Rotavirus bir Shigella bütünün parçaları pastanın dilimleri şeklinde gösterilir. (Grafik 4) Bir toplumda kadının medeni durumuna göre dağılımı Birlikte Yaşayan Dul 8% 8% Boşanmış 11% Bekar 28% Evli 45% Tablo ve grafik olarak veri sunumunda uygun kullanım Tablolama Yöntemi Veri durumu Küçük Tablolama Yöntemi veri kümesi, örneğin Düzenli sıra sayısı 20 den az Sayısı çok, değişkeni yalnız içeren bir Sıklık tablosu bireysel gözlemler İki veya daha çok değişkeni Çapraz tablolama içeren bireysel gözlemler Tablo verilerine uygun grafik yöntemler Tablo verileri Sıklık Grafik Yöntemi tablosu, değişken, tek veri kümesi Sıklık tablosu, nicel Histogram veya poligonu nicel Sıklık poligonu değişken, iki veri kümesi Sıklık tablosu, sınıflı veriler Çubuk veya daire grafiği sıklık BÖLÜM V TANITICI İSTATİSTİKLER I GİRİŞ İlgilenilen konu değişken olsun (kalitatif) ölçümlenmiş değerlendirilebilmesi hesaplanması ister için nicel verilerin bunların ister nitel istatistiksel olarak düzenler içinde değerlere tanıtıcı belli Bu gerekmektedir. (kantitatif) hesaplanan istatistikler adı verilmektedir. Nicelve ortaya nitel özellikler konduklarından oluşacaktır, dolayısı kavramsal bunlara ile de ilişkin iki ayrı açıdan farklı ölçütlerde tip de özellikte ölçümlerle farklılaşmalar karşılaşılan ölçütler ayrı ayrı değerlendirilecektir. NİCEL VERİLERİN DEĞERLENDİRİLMESİ Ölçümlenmiş durumlarda, Her bu değerlerin verilerin ölçümsel değer gerçek büyüklükleri oluşturduğu özel yalın diziye ölçütlerin ile ele (basit) oluşturulmasına alındığı dizi kendi denir. gerçek büyüklüğü ile katılacaktır. Bir çalışmadaki her değerini (Örneğin 105 Basıncı değerlerini) liste olguya ilişkin, hastanızın olarak ilgilenilen tümünün vermek değişkenin bireysel nicel Sistolik genellikle Arter olanaksız ve gereksizdir. Veri dizisini bazı sadeleştirilmiş aktarımlarla sunulabilecek belli istatistiksel özetleyiciler her zaman bulunacaktır. Belli ile aralıklarda belirlenmiş, başka bulunan bir değerlere deyişle "aralıklı sahip ölçek" öge sayıları (sıklık) ile ölçülmüş veriler "sınıflandırılmış" dizileri oluşturacaktır. Bilgiişlem yüksek olanaklarının yalın verileri dizi yeterince olarak gelişmediği değerlendirmek yerine dönemlerde daha rahat ve sınıf hesaplama sağlayan bu yaklaşım öne çıkabilmiştir. Günümüz aralıklarının koşullarında özel kullanılabilmektedir. klinik epidemiyolojik anlamlar araştırmalarda taşıdığı koşullarda yine Dizinin gerçek anlamda değerlendirilmesi için iki özgün kavrama ilişkin bilgileri yansıtması gerekir. Bunlar dizinin özek (merkez) durumuna ilişkin ve dizinin dağılımına ilişkin bilgilerdir. İstatistiksel yargılama açısından temel önemde iki konuyu ortaya koymaktadır: Özeksel (merkezi)değerler veri dizisinin özelliklerine göre en doğru “ortayı” yansıtabilecek şekilde yapılandırılmalıdır aksi takdirde tamamen ilgisiz bir bilgi yansıtması ve kullanımı yapılabilir. Veri dizisinin dağılımının özel bir yapıda olması – veya olmaması – o dizi üzerinde gerçekleştirilecek değerlendirmelerin doğru seçilmesi açısından çok önemlidir; belli tip düzendeki dağılımlara göre kurgulanmış testler ancak buna uygun dizileri yargılamada doğru sonuç verebilirler. İstatistiksel kararlara varılabilmesi için zorunlu olarak (önkabulsel tarafları bulunsa bile) belli özgün dağılım sınırlarına dayanılması gereklidir ancak unutulmamalıdır ki bu özellikler belli dağılım tiplerine (örneğin “Normal” dağılım) uyan veri dizileri için geçerli, güvenilir ve uygun testlerde kullanılabilecek sonuçlar üretirler ve dağılımı belirsiz-düzensiz diziler için yanıltıcı olabilirler. Özellikle bu açıdan, değerlendirilecek dizinin dağılım özellikleri başlangıçta mutlaka incelenmeli değerlendirme ve yargılama işlemlerine bundan sonra, uygun teknikler kullanılarak geçilmelidir. Dağılım kavramından özetle anlaşılması gereken; belli bir kıstas–referans ölçüte göre (örneğin ortalama) veya belli bir ölçek düzeniüzerinde, diziyi oluşturan verilerin yer alma özellikleridir. Merkezi Eğilim Ölçüleri (Ortalamalar) Ortalamalar, merkezi eğilim ölçüleri olarak da adlandırılırlar. Gözlem değerleri bir ortalama etrafında toplanma eğilimi gösterirler. Merkezi eğilim ölçüleri, bir örnekteki bireyleri temsil eden tipik değerlerdir. Beş gruba ayrılırlar. Bunlar; Aritmetik ortalama, Ortanca değer (Medyan) Tepe değer (Mod) Geometrik ortalama, Harmonik ortalamadır. Tek başına “ortalama” denirse bu aritmetik ortalama anlamına gelmektedir. Aritmetik ortalama Toplum için µ ile simgelenen aritmetik ortalama istatistiksel değerlendirmede kullanılan en önemli ölçütlerdendir. Aritmetik ortalama xidizisinde yer alan n sayıdaki verinin toplamının n sayısına bölünmesi ile elde edilen değerdir. Formülü aşağıda yer almaktadır. Örnek : xidizisini ağırlıkları(40, 48.5, 60, 54.6, 79.4, 92.5, 80, 65 kg) şeklinde olan 8 (n) kişi oluşturmaktadır. Bunların aritmetik ortalaması (40+48.5+60+54.6+79.4+92.5+80+65 kg) =520 Dizide 8 eleman olduğuna göre 520/8 = 65 kg olarak hesaplanır. Frekans Dağılım Tablosundan Aritmetik Ortalamanın Hesaplanması Eğer herhangi bir frekans dağılım tablosunda verilerin frekansları (sıklıkları) farklı ise aritmetik ortalamanın hesaplanmasında sıklıkları dikkate alınmalıdır. Örnek; xi 6 8 10 12 14 16 fi 2 1 4 4 1 3 Şeklinde olan dağılımda aritmetik ortalama ((2x6)+(1x8)+(4x10)+(4x12)+(1x14)+(3x16))/(2+1+4+4+1+3) = 12+8+40+48+14+48/14 = 125.42 şeklinde hesaplanacaktır. Aritmetik Ortalamanın Özellikleri Bir örnekteki gözlem değerlerinin örnek ortalamasından farkları alınır ve toplanırsa bu sapmaların toplamı sıfır olarak bulunur. Örnek 10 (10-23) -13 12 (12-23) -11 24 (24-23) 1 36 (36-23) 13 40 (40-23) 17 16 (16-23) -7 138/6= 23 0 Bir örnekteki gözlem değerlerinin hepsine bir A sabiti eklenecek olursa elde edilen değerin ortalaması A sabiti eklenmeden önceki ortalamadan A sabiti kadar fazla olacaktır. 10 +8 18 12 +8 20 24 +8 32 36 +8 44 40 +8 48 16 +8 24 138/6= 23 186/6=31 186/6=31 31-23 = 8 Bir çıkarılacak örnekteki olursa gözlem elde değerinin edilen hepsinden değerin çıkarılmadan öncekinden A sabiti kadar eksik olacaktır. 10 -8 2 12 -8 4 24 -8 16 36 -8 28 40 -8 32 16 -8 8 138/6= 23 90/6=15 23-15=8 bir ortalaması A sabiti A sabiti Bir çarpılırsa örnekteki elde değerlerinin gözlem edilen değerin ortalaması hepsi A bir sabiti A ile sabiti ile çarpılmadan öncekinden A sabiti katı kadardır. 10 X8 80 12 X8 96 24 X8 192 36 X8 288 40 X8 320 16 X8 128 138/6= 23 1104/6=184 23x8=184 Bir bölünecek örnekteki olursa gözlem elde değerlerinin edilen değerlerin hepsi ortalaması bölünmeden önceki ortalamanın A sabitine bölümüne eşittir. 10 /8 1.25 12 /8 1.5 24 /8 3 36 /8 4.5 40 /8 5 16 /8 2 138/6= 23 17.25/6=2.875 23/8=2.875 bir A sabiti ile A sabiti ile BÖLÜM VI TANITICI İSTATİSTİKLER II Ortanca (Medyan) Değer Örnekten elde edilen gözlem değerleri büyüklüklerine göre sıralandığında ortada yer alan gözlem değeri ortanca (medyan) değeridir. Tüm gözlem değerlerinin yarısı bu değerden küçük ve diğer yarısı ise büyüktür. Eğer üzerinde çalışılan örnekteki eleman (n) sayısı tek sayıda ise ortanca değer (n+1)/2 ci gözlem değeridir. Gözlemdeki eleman (n) sayısı çift ise ortanca değer n/2 ci değer ile (n/2+1)ci değerin ortalamasıdır. Örnek: 17 kişilik bir grupta ölçüm değerleri aşağıdaki gibidir. 7-21-18-8-4-12-20-8-5-10-4-8-15-20-12-4-27 Bu ölçüm değerlerini sıraya koyacak olursak 4-4-4-5-7-8-8-8-10-12-12-15-18-20-20-21-27 şeklinde sıralama elde ederiz. Seride tek sayıda eleman olduğundan ortanca 17+1/2 yani 9.cu eleman olan 10 sayısıdır. 10’dan küçük ve 10’dan büyük 8’er eleman yer almaktadır. Örnek 16 kişilik bir grupta ölçüm değerleri aşağıdaki gibidir. 7-21-18-8-4-12-20-5-10-4-8-15-20-6-4-27 Bu ölçüm değerlerini sıraya dizecek olursak; 4-4-4-5-6-7-8-8-10-12-15-18-20-20-21-27 16/2 + (16/2+1) değerleri bulunur. Yani 8 ve 9.cu değerlerin toplamı alınır. 8 değer 8 ve 9 cu değer 10 dur. Bu durumda ortanca (8+10)/2 = 9 olarak hesaplanır. Ortanca Değerlerin Kullanıldığı Durumlar Üzerinde çalışılan örnekte gözlem değerlerinde büyük çarpıklık varsa aritmetik ortalama yerine ortanca değer kullanılır. Aritmetik ortalama uç değerlerden etkilenmektedir. Örnek bir bölgede bulunan 6 marketin günlük satış miktarları 450,475,5900, 320,520,610 olduğunu varsayarsak aritmetik ortalama 1.379,16 olarak hesaplanır. Bu değer aritmetik ortalamanın 5900 den etkilenmesinden ortaya çıkmıştır. Buna karşılık ortanca hesaplanacak olursa; 320-450-475-520-910-5900 dizisinden 497.5 olarak hesaplanır ve oldukça gerçekçi bir değerdir. Bazı araştırmalarda tek veya çift taraflı ucu açık frekans dağılımları olabilir. Bu durumda aritmetik ortalama hesaplanamaz ve ortanca değer kullanılır. Tepe (Mod) değeri : Bir örnekte frekansı en yüksek yani en çok tekrarlanan gözlem değer tepe (mod) değeridir. Bazı serilerde en fazla tekrarlayan değer iki farklı değer olabilir, bu durumda örnek bimodal yani iki tepelidir. Örnek; 4,5,6,7,8,8,8,8,4,4,6,7,8,4,4,2,7,6 şeklinde bir örnekte 4 ve 8 5 er kez tekrar edilmişlerdir. Mod 4 ve 8’dir. Aritmetik Ortalama, Ortanca ve Tepe Değeri arasındaki ilişki: Örnekten elde edilen gözlem değerlerinin dağılımı ile yakın ilişkilidir. Dağılım simetrik ise her üç ortalama ayni değere sahiptir. Dağılım sola yatık bir dağılım ise en küçük aritmetik ortalama en büyük tepe değeri olacaktır. Dağılım sağ tarafa yatık bir dağılım ise en büyük aritmetik ortalama, en küçük tepe değeri olacaktır. Dağılımdan en fazla etkilenen aritmetik ortalama olduğundan dağılımın simetriden uzaklaşması durumunda aritmetik ortalama yerine ortanca değerin kullanılması daha güvenilir bir tanıtıcı istatistik olacaktır. Geometrik Ortalama; Bu dizideki veriler, doğal özellikleri nedeni ile aritmetik veya geometrik dizi biçiminde farklılaşan değerler gösteriyorlarsa (bakteri sayısı gibi) veya dağılımının belirsiz olduğuna ilişkin saptamalar varsa, bu diziye ilişkin ortalamayı geometrik ortalama ile yansıtmak daha bilgilendirici olacaktır. Logaritmik dönüşüm kullanılan değerlendirmelerde geometrik ortalama özellikle bilgilendiricidir. Harmonik Ortalama: Harmonik ortalama verilerin terslerinin ortalamasının tersidir. 3 araba aynı mesafeyi farklı hızlarda kat etmektedirler. Bu durumda ortalama hız 3/((1/h1)+(1/h2)+(1/h3)) şeklinde hesaplanacaktır. DEĞİŞİM ÖLÇÜLERİ Bir araştırıcı verilerini topladığı zaman bunlar arasında bir farklılık olduğunu görecektir. Bu farklılık varyasyondur. Bir örnekte elde edilen gözlem değerlerinin arasındaki farklılığın sayısal olarak ifadesi için kullanılan istatistikler değişim (dağılım) ölçüleri adını almaktadır. Bunlar; • R : Dağılım aralığı, • SD , SD2: (Standart sapma , varyans) , • SE :Standart hata , • CV : (DK ; Değişim katsayısı), • Yüzdelikler (Persentiller), • Güven Aralıkları (ConfidenceIntervals : CI ,%xx Güven aralığı) Dağılım alanı (R, Range, Dağılım aralığı) Kabaca, verilerin arasında değiştiği alt ve üst sınırların belirtilmesi yani en küçük (minimum) ve en büyük (maksimum) ölçümsel değerlerin gösterilmesidir. Örnek: 8 kişiye ilişkin sistolik kan basıncı değerleri : 110, 125, 160, 210, 105, 135, 140, 125 mmHg R: 105 - 210 mmHgdir. Varyans (Değişim) ve standart sapma (Standart deviation) Ölçümsel veri dizilerinde kullanılan en önemli dağılım ölçütüdür ve hem tanımlayıcı hem çözümleyici amaçlarla kullanılır. Standart sapma varyansınkare köküdür ve örnek gruplarında standart sapma SD, varyans SD2ile, toplum değerlerinde σ ve σ2 ile simgelenirler. Formülü ; biçimindedir Örnek: 8 kişinin ağırlıkları şöyledir; 50, 55, 58, 60, 64, 70, 71, 76 kg Aritmetik ortalama 504/8=63 Toplam xi xi- (xi- )2 xi2 50 -13 169 2500 55 -8 64 3025 58 -5 25 3364 60 -3 6 3600 64 1 1 4096 70 7 49 4900 71 8 64 5041 76 13 169 5776 550 32302 504 SD = 550 = 8.86 7 Standart Sapma Yaygın olarak kullanılan bir diğer değişim ölçüsü “standart sapma”dır. Varyansınkare köküne eşittir. Standart sapma popülasyondan hesaplanıyorsa parametredir ve σ ile gösterilir. Örnekten hesaplanıyorsa istatistiktir ve SD harfi ile gösterilir. Standart Hata (SE :StandartError) Belli bir konuda, o konunun gözlenebileceği tüm olguları elde etmek nerede ise olanaksızdır. Ancak kısıtlı sayıda olgudan oluşan bir örneklem kümesinden elde edilen bilgilerden, o konunun toplumsal değerine ilişkin kestirimler yapmak - eğer koşullar uygunsa- olasıdır. SE ‘ de bir örnekleme ortalamasına dayanarak gerçek toplum ortalamasının hangi düzeyde, hangi sınırlar arasında (ve hangi güvenilirlik düzeyi ile) bulunabileceğinin ipucunu üretir. biçiminde hesaplanır. Paydadaki “n” değeri veri sayısından etkilenmez. Standart sapması hesaplanmış örneğin SE = 8.86 = 3.1324 kg’dır. √8 Varyans (Değişim) Katsayısı Yüzde olarak standart sapmanın ortalamaya oranıdır ve veri dizisinin dağılımına ilişkin ipucu oluşturabilir.Varyans katsayısı hesaplanarak standart sapma üzerinde ortalamanın etkisi ortadan kaldırılmış olur. Değişim Katsayısının % 5’den küçük olması dar dağılım alanlı,düzenli bir dizinin belirtisidir. % 30’dan küçük olması durumunda ise büyük olasılıkla “normal dağılan” bir dizi düzeni bulunmaktadır. Yüzdelikler (Persentiller) Yüzdelikler rastgele bir değerin, dizi içindeki veriler toplamının hangi yüzde payı için ayrım noktası olduğunu belirlerler. (Verilerin %35 i “x” değerinin altındadır, %43 ü “y” değerinin üzerindedir... gibi). Bazı yüzdelik değerler özel isim alırlar; Desil, onluk payları belirler 3. desil, 30. persentildir Kartil,yirmibeşlik payları belirler 1. kartil, 25. persentildir ve "Q1" olarak, 75. persentil yani 3. kartil "Q3" olarak simgelenir. Medyan, 50. persentil, 5. desil, 2. kartil değeridir (Q2). Persentillerin hesaplanması için farklı yaklaşımlar kullanılabilmektedir. En basiti küçükten büyüğe sıralanmış veri düzeninde, toplam veri sayısına göre istenen yüzdelik sıradaki - veya en yakın tam sayıdaki – gerçek değerin kullanılmasıdır: 1,2,3,5,9,10,11,12,20,40 dizisinde (N=10) , 40. yüzdelik 0.4 * 10 = 4. sıradaki değer olarak (5) belirlenebilir Özelikle büyüme gelişme ile ilgili değişimlerin değerlendirildiği ve toplumun hangi düzeylerinin hangi değerin altında – üstünde – bulunduğunun sorgulandığı konularda – pediatri gibi – yüzdelikler önemli kullanıma sahiptir. GüvenAralıkları "%xx GA" - (Confidence Intervals : CI ,%xx) İstatistik, bir özelliğin ölçümünü genellikle tüm toplumu ölçerek veremez. Ancak belli denek sayısı ile ölçümleri yapmak ve bunlara dayanılarak genelde toplum değerlerini kestirebilmek söz konusudur. Bir örnek grubundan elde edilmiş değerlerden yola çıkarak topluma ait değerlerin içinde bulunacağı sınırları kestirmeye "aralık kestirimi" denir. Bu kestirimsel değerlerin doğru-güvenilir olması çerçevesinde de belli beklentiler önerilebilir ve kestirimler bu “güven derecesine” göre yapılır “Normal dağılımlı" bir özellikte, örneklemden elde edilmiş bir ortalamaya ve standart sapmaya dayanarak, toplumun gerçek ortalamasının % 95 güvenleolasılıkla, ± 2 SE sınırları arasında bulunacağı söylenebilir. Ör.: 172 ± 8 cm , n= 49 %95 Güven alt sınır ≈ 172 –2 (8 / √49)= 169.7 cm , üst sınır : 174.3 . Bu örneklem verilerine göre toplumun boy ortalaması %95 güvenle - doğrulukla - 169.7 - 174.3 arasında bulunacaktır. BÖLÜM VII İSTATİSTİK DAĞILIMLAR I Olasılık kuramsal değerlendirmeleri, veya gerçek-sayım kestirimsel (tahmin) tabanlı olabilir. (sıklık) Olasılıklara , dayalı kestirimler de gerçek verilere ve/veya kuramlara dayanılarak yapılır. Bir “A” biçiminde aralıkta olayının gösterilir. bulunan – çıkma - 0 1 sınır ; “p” bir ortaya reel ile sayıdır. olasılığı P(A) değerlerini de Olanaksız-imkansız , p(A) içine alan olayın olasılığı tanım yapmayı 0 ve mutlak bir olayın olasılığı 1 olur Kısa ve öngörürsek, uygun nesnel, olasılık tüm : medikal alanlara (sorgulanan) seçenekler içinde, uygun özel bu bir bir özel duruma durumun, (altseçeneğe) gerçek olarak ortaya çıkma sıklığının matematiksel düzeyidir. Bu olgunun çerçevede bulunması; “N” olguluk Sıklık, bir Hız, toplumda, Toplamdaki “n” pay, özel durumlu Olgular toplamı payı, prevalans , insidans , olasılık , adlarını da alabilir. • Eğer seçeneklerin dizi içinde tekrarlanabilirliği söz konusu ise: “n” ayrı tekrarlayan öge tipinden ögeler her bulundurabilen biri nr “r” tane dizi öge içeren yapılabilir. ve Örneğin kendini 5 tip harfin kullanılabileceği 3 er harflik 5³=125 dizi olanaklıdır. n” farklı ögeden “r” tanesi kullanılarak önem taşıdığı dizi sayısı Permütasyonile hesaplanır yapılacak ve dizilişin “n” farklı önem ögeden “r” tanesi dizi taşımadığı kullanılarak sayısı yapılacak ve dizilişin Kombinasyonilehesaplanır: nCr biçiminde de gösterebiliriz Farklı vs tip değişkenler farklı - olasılıkları düzenlerde konunun çerçevesinde – içerik engelleyen, bileşik basit, ve – özelliğine – göre engellemeyen, olayların 2 ortaya biçimde çıkma değerlendirilir : • Basit olasılık • Olasılık dağılımları Basit kuramı Olasılık: olmayan, belli salt bir anlık dağılım duruma oranlarına özgü, dayalı özel bir iç dağılım değerlendirmedir. Genellikle yargılama yapmaz. Herhangi bir A olayının belirmesi olasılığı: p(A) biçiminde gösterilir. A her olayının ögenin, belirmesi bireyin A ya olasılığının uygun araştırıldığı olması gerekmez. toplumda Buna mutlaka bağlı olarak sayısı oranı klasik olasılık tanımında: p(A) kullanılır. = A ‘ ya uygun ögeler sayısı / Tüm ögeler • OLASILIK DAĞILIMLARI Bir olasılık göre dağılımı, olasılık ilişkin bir düzeyini belirleyen değerlerin-durumların çerçevesinde, belli “istatistiksel” rassal olayın nesnel dağılımı, önkabulsel ölçütlere” ortaya dizgeli belli değerlere çıkabildiği modeldir. Bir matematiksel veya bu değerlere özelliğe fonksiyonlar özelliğe ilişkin değerlendirilip –parametre-göre olasılık düzeyleri kestirilebiliyorsa “Olasılık dağılımları” söz konusudur. • Olasılık dağılımları, ilgili değişkenin yapısına göre: • - Kesikli olasılık dağılımları • - Sürekli – kesiksiz olasılık dağılımları olarak temelde ikiye ayrılır. • Olasılık yoğunluk fonksiyonu (probabilitydensityfunction : PDF) değerli Gerçek arasında olasılık bir olmak değeri fonksiyonunun X rastgele açısından f(x) X=a gösterebileceği integralinin ve değişkeninin X=b P(a iki olasılıklar < değerleri belli X arasında <= sayısal değer toplamıdır. Yani b), f(x) entegrasyonu olasılık ile elde edilir Öneri iki durumun sayı çok olasılığı <x<188,000001).Bu yakın olduğunda soruluyormuş özel durum sanki konumu sadece belli bir oluşur. sürekli tek sayının- P(187,999999 değişkenler için ( ör.: AKŞ = 104 olması) değil , nitelikler için de geçerlidir (ör.: 5 çocuktan 1 inin erkek olması). • Birikimli dağılım fonksiyonu (cumulativedistributionfunction: CDF) Gerçek değerinin değerli altında bir – X veya rastgele üzerinde değişkeninin, - bir düzeyde alabileceği olma bir x olasılığıdır. Atılan bir zarda 4 den küçük bir sayı gelmesi zarın 1 veya 2 veya 3 gelme olasılıklarının toplamına eşit olacaktır Aynı şekilde mg/dL ‘nin toplumda AKŞ üzerindeki toplamıdır. Anlaşılacağı > 100 her AKŞ üzere x mg/dL olma değerinin olasılığı, taşınma seçenekler 100 olasılıklarının ekseninde, x’in son seçeneği için birikimli olasılık “1” e erişir KESİKLİ (NİTEL) DEĞİŞKEN OLASILIK DAĞILIMLARI Belli belli görülme özel sıklığı olan topluluklarda, bir – veya daha öngörülen fazla sayıda olayın, – olguda sayısı rastlanması olasılığını hesaplayan istatistiksel kuramlardır. Bu ve çerçevede, görülme konu olayın sıklığının bulunmaktadır. En çift seçenekli düzeyine önemli kesikli – göre dikotom farklı dağılımlar olan olmasına – dağılım Binom tipleri ve Poisson dağılımlarıdır. • BİNOM DAĞILIMI ve ÖZELLİKLERİ Binom en olasılık önemli dağılımına dağılımı, olanıdır. “Binom kesikli olasılık Binomialrastsal olasılık dağılımı” dağılımı değişkene denir ve konuları (X) sıklığı %5 arasında ait olasılık den büyük (P>0.05) olaylar, özellikler için kullanılması uygundur. Binom Dağılım: Binom konusudur. çıkan Gerçek olası durumdur. ele dağılmış alınan dağılımdan iki ise özelliğin söz durulan halin olasılığı n<1 bilinmediği yaşamda sonuç Diğeri popülasyonda tanedir. edilir. dir. zaman birçok fazla Binom π Üzerinde örnekten ile biri beklenmeyen hali söz dağılımda durulmayan tahmin edilir. ve konusu ise popülasyonda durulan olasılığı Bu ise durumda söz ortaya beklenen durumdur. Üzerinde halin hali denemede istenilen ve gösterilir. iki konumda, Bunlardan istenmeyen ikiden özelliği da değişkenlerin Eğer multinomial üzerinde özelliğin 1-πdir. Π üzerinde durulan olayın olasılığı p, diğer durumun olasılığı ise (1-p) veya yerine kullanılan q harfidir. Örnek: Doğan bebeklerin olasılığı vardır. Yani olasılığı π-0.5 olduğuna çocuğun kız veya π 0.5’ eşittir. göre erkek cinsiyeti Bu durumda 2 çocuklu 0.5’dir. olması kız olasılığı 0.25 veya erkek olma diğer cinsiyetin olma ailelerde dir. ise Birinci her iki çocuğun kız veya erkek olma olasılığı yine 0.25 dir. Toplam her zaman 1’e eşittir. Her edilme bir binom şansı denemede sabittir başarı ve her olasılığı bir P binom (veya π) deneme ’nin elde birbirinden bağımsızdır. Bu çerçevede çözülecek bir soru şu şekilde karşımıza çıkmaktadır : • Görülme içinden sıklığı “r” “P” olan tanesinde bir (r <= olaya, n) rastgele rastlanması “n” olgu olasılığı p(r) nedir ? • Bu sorunun çözümü şu formülle gerçekleştirilir: Binom (r) dir. dağılımda Burada üzerinde faktöryel işareti durulan (!) bir halin r kez sayının olma kendinden olasılığı küçük P (“0” hariç) çarpılacağını göstermektedir. Örnek 4! = 4*3*2*1= 24 İstenen Olayın Oluş Olasılığının Hesaplanması Yapılan bir araştırmada öğrencilerin % 25 kullandığı saptanmıştır. Rasgele seçilecek dört öğrenciden a- 4 ününde sigara kullanmama olasılığı b- 4 öğrenciden 3 ünün sigara kullanmama olasılığı inin sigara c- 4 öğrenciden ikisinin sigara kullanmama olasılığı d- 4 öğrenciden birinin sigara kullanmama olasılığı e- 4 öğrenciden dördününde sigara kullanma olasılığı Örneğimizde sigara içmeme olasılığı (istenen durum) ¾, sigara içme olasılığı (istenmeyen durum) ¼ (1 – ¾) şeklindedir. Seçilen 4 öğrencinin dördününde sigara kullanmama olasılığı P(4)= C(4,4)(3/4)4 (1/4)4-4 = 4!/(4 – 4)! 4!(3/4)4 (1/4)4-4 = (3/4)4 = 81/256 = 0.316 Seçilen 4 öğrenciden üçünün sigara içmeme olasılığı 0.422 Seçilen 4 öğrenciden ikisinin sigara içmeme olasılığı 0.211 Seçilen 4 öğrenciden birinin sigara içmeme olasılığı 0.047 Seçilen 4 öğrencinin dördününde sigara içme olasılığı 0.004 (81/256)+(108/256)+(54/256)+(12/256)+(1/256)= 1.0 0316+0.422+0.211+0.047+0.004 = 1.0 Örnek • Örnek: Tedavide başarı şansı P= 0.8 ( hastalığa tutulan 7 kişiden; • Hiçbirinde Başarılı olunmaması ( Başarılı = 0) olasılığı : % 80) olan bir Bu sonuçlara göre değerlendirmeler” “yargısal çerçevesinde gözlemlememiz gereken durumlar şunlardır : Bu denemede, başarılı başarı 4 beklentisi olgudan olunması gözükmektedir açısından tüm ile daha (Tedavide başarı azında 0 bilimsel ( olabilirlik , şansı 1, 2, ve sınırları uygulayıcının beklenen “normal” bulunmadığını yansıtmaktadır. % 80 beklenirken 0.8) 3 gösterme Diğer başarı 7 (p<0.05) başarıyı %100 , seçenekleri) dışında ve olgularda:7/7 P= – taraftan bulunması özel / sıra dışı / normalin ötesinde gözükmeyecektir p=0.2097 Anlaşılacağı belli sıklıklar sonuçların da gibi Binom beklentisi başlangıç yansıtmaktadırlar. değerlendirmesinin çerçevesine, beklentisi “Normal” , özel “p” koşullarda sonuçları, elde edilen düzeyinde sayılıp sayılamayacağını “beklentiye uymaz” sonuçlar iki uçta bulunan seçeneklerde de gözlenebilir. bazen Bazen de çıkabilecektir. sadece Aşağıdaki bir örnekte yöndeki de sadece seçeneklerde fazla ortaya görülme açısından “beklenti dışı“ seçenekler ortaya çıkmaktadır. Binom Dağılımının Şekli Binom dağılımının şekli “n” ve “π” ye bağlıdır. Deneme sayısı ne olursa olsun π = ½ şeklinde dağılımın şekli simetriktir. İstenen tip ve istenmeyen dağılımın şekli (çarpıktır). Eğer tarafa çarpıktır. tip olaylarının değerlerden π> ½ ise Çarpıklık oluş büyük dağılım olasılığı olanın sol tarafa, durumunda “n” farklı olduğu zaman tarafına doğru yatıktır π< sayısının ½ ise dağılım artması sağ dağılımın simetriye yaklaşmasını sağlamaktadır. Binom fazlasına eşittir. dağılımında Bunun sınıf nedeni olma olasılığının bulunmasıdır. sayısı istenen deneme olayın hiç sayısından olmama yani bir sıfır Poisson Dağılımı Poisson dağılımdır. dağılım Bu Binom dağılım az dağılıma rastlanan benzer ancak belirli olarak (sabit) kesikli bir olasılıkla meydana gelen olayların dağılımıdır. • Belirli bir nüfus içinde 110 yaşına kadar yaşayan insanların sayısı, • Belirli bir günde yanlış düşen telefon numaralarının sayısı, • Bir günde başlayan savaş sayısı, • Bir sigortası hayat tarafından sigortalanan belirli sayıda bir günde insandan belirli zaman aralığında ölenlerin sayısı, • Çok az satılan bir maldan bir dükkanda satılanların sayısı, • Bir kitaptaki yazım hatalarının sayısı, • Çok sayıda birimden oluşan ambalajlanmış mallardaki bozuk olanların sayısı gibi. Binom istenen Poisson olayın dağılımda olayın oluş dağılım belirli “n” deneme olasılığının fonksiyonu bir çok sayısının çok küçük olması kullanılır. Çünkü oluş olasılığının sayıda büyümesi bu ve “π” durumlarında da durumda Binom istenen fonksiyonu kullanılarak hesaplanması zorlaşır. Olayların Oluş Olasılıklarının Hesaplanması Poisson dağılımının fonksiyonu Fransız matematikçisi Poisson tarafından bulunan eşitliğe göre belirlenmektedir. P( r ) = (µr /r!) e- μ Formülde olayın “μ” meydana dağılımın geliş ortalaması, sayısı, “e“ yaklaşık 2.718’dir. Araştırıcı görülme olasılığını hesapladıktan “r” doğal istenen sonra olayın nadir olarak logaritma herhangi aşağıda tabanı görülen olup bir sayıda gösterildiği şekilde olayın birbirini izleyen sayıda görülme olasılıklarını hesaplayabilir. P( 0 ) = (µ0 /0!) e- μ= e- μ P ( 1 ) = (µ1 /1!) e- μ= μ P (0) P( n ) = (µn /n!) e- μ= (μ/n) P (n-1) Örnek: Bir hayat sigortalamış kazadan sigortası olsun. ölme bir Bir yılda olasılığı 0.001 yılda 5000 sigortalanmış olarak kişiyi kazalara karşı kişilerden herhangi birinin bilindiğine göre bir yıl boyunca 4 kişinin kazadan ölme olasılığı nedir. Bu durumda 5000 ortalama * 0.001 = 5 4 kişinin kazada ölme olasılığı P (4) = (54 /4!) e- 5= 54 (2.718)-5/24 = 0.1745 Örnek: Poisson doğma 100 dağılım olasılığı kişilik bir sınıfta göstermektedir. 1/365 tir. Bu 1Ocak tarihinde Herhangi dağılımın bir doğanların kişinin ortalaması 1 100/365 sayısı Ocakta = 0.2740 olduğuna göre 3 kişinin 1 Ocakta doğmuş olma olasılığı nedir. P(3)= (0.27403/3!) e -0.2740= 0.02057(0.76035)/6 = 0.002606 olarak bulunur. Poisson Dağılımının Parametresi ve Dağılım Şekli Poissondağılımında ortalama ve varyans birbirine eşittir. Aşağıdaki şekilde hesaplanır μ = σ2 = n.π Eşitlikte n birey sayısı π ise olayın oluş olasılığıdır. Poisson yaklaşmaktadır. dağılımın şekli ortalaması büyüdükçe simetriye Normal Dağılım : Normal sürekli bir değişkenin dağılım Binom ve dağılımdır. Normal dağılım, düzeni kullanılmaktadır. Gauss olarak tipi için geçerlidir Normal dağılım dağılım, veya isimlendirilen, ve dahil dağılımlarının doğada, uygulanmalı aynı şeklinden – tıp Poisson pek dolayı pek – çok çok istatistikte Gauss zamanda aksine kabaca sürekli de çok dağılımı, Çan alanda/bilimde eğrisi pratik uygulaması olan, sürekli bir olasılık dağılım(lar) tipidir. Bu Konum dağılım gösteren tipleri ortalama iki (μ, parametreyle aritmetik varyans (σ2,SD2, "değişim/saçınım") dır. tam ortalama) olarak ve tanımlanabilir: ölçek gösteren Bu formülde yer alan “e” sabiti 2.718’e, π sabiti kg (μ ise 3.1416’ya eşittir. Örneğin standart sapması popülasyonda olasılığı öğrencilerin 5 ( ağırlık σ öğrencilerin hesaplanmak = ortalaması 5) olan ağırlıklarının istendiğinde 65 60 normal – yukarıdaki = dağılım 69 kg formül 60 kg) ve gösteren bir arasında olma kullanılarak % (yüzde) sonuç elde edilecektir. Normal tip göre olarak dağılım ortaya fonksiyonunun çıkmaz, Basıklık-Yaygınlık özellikle (kurtosis) görüntüsü standart ve veriler sadece sapmanın belli bir büyüklüğüne saçınımının bozukluğuna göre Çarpıklık (skewness) özellikleri de ortaya çıkar. tek simetri BÖLÜM VIII İSTATİSTİK DAĞILIMLAR II Normal Dağılımın Özellikleri 1. Normal dağılım çan eğrisi şeklindedir. 2. Normal dağılım ortalama etrafında simetriktir. Ortalama, tepe değeri ve ortanca değer aynıdır. 3. Yoğunluk standartsapma ve μ+σ eğrisinin önce ve üzerinde, sonraki noktalarında) noktalar bir ortalamadan arasında ''enfleksyon/ birer (yani μ - σ bükülme'' noktası olasılıkları toplamı bulunur, 4. Yoğunluk olarak eğrisinin % 100’e ortalamadan küçük altı, yani “1” olma tüm e ve seçenek eşittir, büyük dolayısı olma ile kuramsal olasılıkları % olarak 50 şer yani 0.5’dir. 5. Kuramsal olarak yoğunluk eğrisinin -ω ile arasında +ω uzandığı düşünülebilirse de uygulamada söz konusu değildir. 6. Normal standart sapma formülden değerin de dağılım, ile bir ortalamayı anlaşılacağı ortalamaya matematiksel fonksiyon parametre üzere uzaklığının bir olarak rastgele standart olduğu için kullandığı değerin için, olasılığı sapmanın ve bu kaç katı sapma katları olduğuna göre belirlenmektedir. 7. Ortalamanın biçiminde etrafında, belirlenebilen bakışımlı alanlar ve standart her normal dağılım için eşdeğerdir. Standardize Normal Dağılım Parametreleri değerlerinden farklı normal dağılımları ortalamaları çıkarılıp standart standardize edilebilir. oluşturan sapmalara gözlem bölünerek Bu normal durumda dağılımlar değerlere ortalaması ve ortalamamaları dönüştürülmüş olur. standart ve Z standart normal dağılımın ortalaması “1”dir. dağılım ortalama etrafında farklı olan aynı olan sapmaları dağılımı standardize Bu sapmaları da “0” olarak tanımlanan ve standart sapması simetriktir. Ortalama ile +Z arasında olma olasılığı ortalama –Z arasında olma olasılığına eşittir. Normal Dağılımda Standart Sınırlar Normal bulunma dağılım olasılığı olan bu % çerçevede 95 i µ± “Normal 1.96 x sınırlar” σ değerleri olarak kabul arasında eder ve bunu dışındaki % 5 lik kısım iki uca , %2.5 ar lık paylarla “anormal” düşükler ve “anormal yüksekler” olarak pay edilir. Bu mantıkla toplumda,150.4 87 12 ± 172 cm’den mg/dL AKŞ ± 11 kısa cm boy olanlar belirlenmiş uzunluğu “istatistiksel bir sağlıklı ile belirlenmiş anormal toplumda bir kısa” veya 110.5’in üzeri “istatistiksel anormal yüksek” olarak değerlendirilecektir. Örnek 1 Bu olanların değerinden dağılım oranı 1 çerçevesinde nedir standart diye Z değeri hesaplanmak sapma sağa 0 ile 1.0 istendiğinde ve sola değerleri arasında ortalamadan (çift yönlü) (0) olan mesafede toplamın % mesafede popülasyonda % 68.26’sı 34.13 olarak herhangi bir yer almakta olduğundan hesaplanacaktır. Z değerinin 0 tek Standart ile 1 yönlü normal arasında olma arasında olma olasılığı % 34.13 tür. Örnek 2 Normal olasılığı 2 bir nedir standart aldığından diye sağa tek popülasyonda Z hesaplanmak ve taraflı sola olan hesaplamada değerinin 0 ile istendiğinde 0 mesafede 2 ortalama toplamın bunun yarısı tüm Z önce 0 olan değerinden % % 95.44 yer 47.72’si yer yüzde ne almaktadır. Örnek 3 Standart normal dağılımda değerlerinin kadarı 0.5 ile 2 arasındadır. Bu yüzdeyi hesaplamak için – 2 mesafesi arasındaki % değer alınır. Bu değer % 47.72 dir. Daha sonra 0 – 0.5 arasındaki mesafe bulunur. Tablo % A 47.72 değerinden den % bakıldığında 19.15 (0.2857) 0.5 – 2 arasında kalan değerdir. bunun çıkarıldığında da geri % 19.15 kalan % olduğu 28.57 STUDENT “t” DAĞILIMI Standardize Normal dağılımın katsayıları, sonsuz veya çok yüksek sayıda (örneğin N>300) olgu içeren durumlar İçin geçerli sayılabilir ayrıca gözlemlendiği üzere tekil bir rassal durum için: x (başka bir örneklem veya toplumun kendi özgün özet istatistiksel özelliklerine göre değil) sorgulanır. Olgu sayısı kısıtlandığı zaman aynı olasılık sınırlarını belirleyen katsayı değerleri değişir. Bu şekilde farklı örneklemlerin düzeylerinin yargılanması da olanaklı olur. Çeşitli seçenek “olgu sayıları” için belli olasılık, düzeylerini belirleyen katsayılar, Gosset (takma adı “Student”) tarafından belirlenmiş ve tablolaştırılmıştır. Olasılık kuramı ve istatistik bilim dallarında t-dağılımı veya Student's t dağılımı olarak geçen bu dağılım, genel olarak örneklem sayısı veya sayıları küçük ise ama konu değişkenin normal dağılım gösterdiği varsayılırsa kestirimsel-çıkartımsal istatistik uygulamaları için kullanılan bir sürekli olasılık dağılımıdır. t-dağılımının ortaya çıkarılması ilk defa 1908’de Dublin’de Guinness Bira Fabrikasında çalışan Kimyacı ve matematikçi William SealyGosset’ in kısıtlı örneklemlerle doğru kararlar verebilme çabasının bir sonucudur. Bulgularını yayınlarken zorunlu olarak kullandığı takma ada (Student) dayanarak dağılım bu adı taşımaktadır. Normal dağılım gösterdiğine emin olunan bir sürekli örneklem verisi için ortalama değer ve standart sapması bulunuyorsa, t-dağılımını kullanarak bulunan ortalama için güvenlik sınırları yahut daha önce kuramsal olarak önerilmiş bir değerin, bu sınırların arasında bulunup bulunmadığı araştırılabilir. Bu yaklaşım Student's t-testlerinin de temelidir. İki normal dağılımdan alınan örneklemlerin ortalamalarının farkı da normal dağılım gösterdiği için, bu farkın sıfıra eşit olduğuna ilişkin bir sonuç çıkarmak da bu çerçevede kullanılabilir. Varsayım değerlendirmesi bölümünde göreceğimiz gibi Student’s t testlerinin sonucu ( z ye benzer kavramda) “t” olarak adlandırılan bir değerle sonuçlanmaktadır. Bu tip testlerin kullanımına uygun araştırmaların -sonsuz olmayan- olgu sayılarına doğrudan bağlı bir “serbestlik derecesi” kavramı bulunmaktadır (sd) ve her “sd” için belli olasılık düzeylerine karşılık gelen kuramsal “t” değerleri bulunur. Bu tip “kritik değerlerin” simgesel gösterimi, ilgili serbestlik derecesi ve karşılık geldiği Tip-1 hata olasılık düzeyi (α) yansıtılarak – çift yönlü/kuyruklu değerlendirme ile - verilir: t(sd, α) = … örneğin t (11 , 0.05) = 2,201 , t ( 30 , 0.02) =2,457 gibi. Aşağıdaki örnek tablo parçasında görüleceği gibi sonsuz serbestlik derecesi için olan katsayılar z değerlerince belirlenen alanlara da bir yönden karşılık gelmektedir. t tablosu için üstteki olasılık değeri açıklamaları farklı olan çeşitlemeler de bulunur ancak aslında hepsi aynı anlamsal düzeyi kastederler. Görüldüğü gibi olabilecek her sonuçsal t değeri için doğrudan bir p değeri bulunmamakta, yorumlamanın belli kritik p sınırlarından küçük –veya büyük – olmasına olanak veren bir kullanım ortaya çıkmaktadır. Bir araştırma sonucu olarak bulunan “t” değerini yorumlamak için, o araştırmanın serbestlik derecesine karşılık gelen satırda, bulunmuş olan bu “t” değerinin, kritik değerler olarak verilmiş “t” değerlerine göre nerede bulunduğu saptanır. Örneğin en sağ kolondakinden bile büyükse (p=0.001 düzeyi),araştırmanın sonuçsal p değeri ;”p<0.001’”dir. Buna karşılık çift kuyruk olasılıklarına göre 0.05 kolonundaki değerlerden daha küçükse (p=0.05 düzeyi) , p>0.05 kararı ortaya çıkar. Ara kritik değerlerden ise en son hangisi aşılabildi ise onun p düzey karşılığının altında kalındığı yorumu ile bitirilir. Örnekler: sd= 12, t = 4.89 p<0.001 sd= 38, t = 2.95 p<0.01 sd= 50, t = 1.36 p>0.05 Güncel yazılımlar sonuç “p” değerlerini gerçek düzeyleri ile verir dolayısı ile tablo kullanımına artık pek gerek kalmamıştır. – Sonuçlar tablolara bakarak olduğu gibi “<“ , “>” düzeyleri ile de verilmez. Son yaklaşımlar ,“p” değerlerinin gereğinde yayınlarda da gerçek düzeyleri ile verilerek uzman okuyucuya da özellikle anlamlılık sınırına yakın sonuçlarda klinik yorum olanağı tanınması yönündedir.. BÖLÜM IX HİPOTEZ KONTROLLERİ Bütün edilen bilim dallarında örneklerden bilinmeyen yapılan yararlanarak parametreleri araştırmaların üzerinde hakkında amacı çalışılan sonuç elde popülasyonun çıkarmaktır. Sonuç çıkarma iki şekilde yapılabilir; 1. Popülasyonu temsil edecek parametrelerin tahmini, 2. Popülasyon parametreleri ile ilgili hipotezlerin test edilmesi Nedensellik yöntemlerden “farklı” bağıntısının biri "neden bulunduğunu etkenin etken"in gösterebilmek bulunmadığı bulunduklarından, ortaya var temel durumlarda "sonuç'un olduğu düzenidir. olguların ilgilenilen konmasındaki konu Başka bir deyişle, genel düzeyi, etkenin değişkenin düzeyi açısından "farklı" ise, etken farkının sonucu oluşturabileceği düşünülür. Bu veya bağı reddedilir. ortaya Bu koymak karara üzere kurulan varabilmek için hipotez bir dizi ya kabul edilir istatistik işlem kontrol olup uygulanır. Bunlar; 1. Hipotezin kurulması 2. Yapılacak kontrolün çift veya tek taraflı olmadığının kararı, 3. Test istatistiğinin seçilmesi 4. I. tip hata olasılığının belirlenmesi 5. Gerekirse belirlenmesi testin gücünün hesaplanması ve güç eğrilerinin 1. HİPOTEZ: Hipotez kontrolünün birinci aşaması araştırıcının hipotezi kurmasıdır. Hipotez kontrolünde iki tip hipotez bulunmaktadır. 1. Kontrol Hipotezi: H0 2. Karşıt Hipotez: H1 Kurulan hipotezler varsayılan dağılımın bir veya daha fazla parametresini kapsayabilir. Kurulan hipotez” hipotez birden fazla sadece bir parametreyi parametreyi kapsarsa kapsarsa “bileşik “basit hipotez” adını alır. Test ve karşıt hipotezin basit ve bileşik olmasına göre hipotez aşağıdaki sıralanabilir. 1. Basit bir hipotez basit bir karşıt hipoteze karşı test edilir. H0 : μ = a H1 : μ = b 2. Basit bir hipotezin bileşik bir hipoteze karşı test edilir. H0 : μ = a H1 : μ ≠ a 3. Bileşik bir hipotezin bileşik bir hipotezle test edilmesi H0 : μ ≥ a H1 : μ < a Üç ayrı örnekle basit ve bileşik hipotez açıklanacak olursa; 1. Bir mühendis bir araba lastiğinin ömrünün en az 60000km olup olmadığı, 2. Bir ziraatçı yeni geliştirilen diğer bir gübreye göre artırıp artırmadığı, bir gübrenin buğday rekoltesini 3. Bir doktor bir yeni ilacın herhangi bir hastalığı iyileştirme oranının % 90 olup olmadığını araştırmak istemektedir. Burada kontrol hipotezlerinde oluşturulması gerekmektedir. 1. Hipotez bileşik hipotezdir. hipotezde Karşıt bileşik hipotezdir H0 : ᶿ ≥ 60000 H1:ᶿ < 60000 2. Hipotez basit hipotezdir ancak karşıt hipotez bileşik hipotezdir H0 : μ = a H1 : μ ≠ a 3. Hipotez basit hipotezdir. Karşıt hipotezde basit hipotezdir H0 : π = 90 H1 : π = 60 2. Test İstatistiği Hipotezler belirlemesi söz sonra Hipotez kontrolü gerekir. konusu edilecek bu kurulduktan populasyondan örnekleme sonuca göre örnekten ayni dağılımına karar araştırıcının dahil vermektir. test hesaplanan genişlikteki olma Test istatistiğini örneklerden olasılığını istatistiği istatistiğin elde hesaplamak örnekten elde ve edilen verilerin bir fonksiyonudur. Örnek: Bir araştırıcı tedavisinde diğer sürmektedir. Bu hastalığı hasta ayırarak taşıyan seçer. yeni bir ilaçtan bir daha hipotezin sınanması hastalardan tamamen Daha gruplardan üretilen sonra birini bu yeni ilacın etkili ilacı konusu olarak tesadüfi hastalığın hipotezini söz tesadüfi (A) bir olduğu için hastaları üretilen spesifik ile spesifik belirli olarak öne iki tedavi sayıda gruba ederken diğer grubu eskiden beri kullanılan hastalığın süre sonunda kan özelliğine ait (B) ilacı iyileşme analizleri ile göstergesi yaparak tedavi olarak eder. kabul verilerini Belirli edilen toplar. bir bir Gözlediği verilere dayanarak; Hastalığın H0: ilaç arasında iyileşmesine fark yoktur. etki bakımından gözlenen fark yeni tesadüften ilaç ileri ile eski gelmektedir hipotezini, H1: hastalığın tedavisine etkisi bakımından yeni ilaç eski ortalamalar arası farka ilaçtan daha etkilidir, hipotezine karşı kontrol edilecektir. Burada ait kontrol örnekleme” farkının elde hipotezi dağılımıdır. hipotezle edilecek ile belirlenen Ve örnekten belirlenen “ortalamalar “ elde populasyondan arası farka edilen ortalamalar çekilen ait örneklerden örnekleme” dağılımına dahil olma olasılığını hesaplamak gerekir. Test örnekleme hipotezi geçerli dağılımının populasyonvaryansı hesaplanan olduğunda ortalaması biliniyorsa) farkın µD = 0 Z- örnekleme ortalamalar ve arası standart değeri farka sapması kullanılarak dağılımına dahil ait (eğer örnekten olma olasılığı hesaplanarak hangi hipotezin kabul edileceğine karar verilir. 3. I. Ve II. Tip Hatalar: Hipotez kontrollerinde kontrol hipotezi karşıt hipoteze karşı test edilerek karar verildiği zaman iki tip hata söz konusudur. Yapılan kontrol sonucunda doğru olan kontrol hipotezi H0 ret edildiği zaman yapılan hata I. Tip hatadır. Yani doğru olan bir kontrol hipotezi için ret kararı verildiği zaman I.tip hata yapılmış olur. I. Tip hata yapma olasılığı α simgesi ile gösterilir. II. durumlarda tip hata kontrol ise karşıt hipotezinin olasılığı β simgesi ile gösterilir. hipotezin kabulü ile H1 gerçekte yapılan hatadır. doğru II. olduğu Tip hata Hipotez kontrollerinde verilecek kararların isabetli veya hatalı olması α ve β olasılıklarına bağlıdır. VARSAYIM KABUL/ RED” BÖLGELERİ Bir varsayımı yöntemine/ sıfır testine varsayımı yargılama “test ile için istatistiği” seçenek kullanılan adı varsayım verilir. değerlendirme Bu çerçevesinde değerlendirme verilerin nesnel, sayısal tabanlı olarak uygun değerlendirilmesidir. Sıfır varsayımının, alternatif varsayım lehine “reddedileceği” olasılıksal koşula “red bölgesi” adı verilir. Eğer söz konusu istatistiğin değeri “kabul bölgesi” nedahilise bu durumda “ Kontrol Hipotezi reddedilememiştir” denir. Gerçek Durum Verilen Karar H0 Hipotezi kabul H0 Hipotezi ret H0 doğru İsabetli Karar (1 – α ) Hatalı karar (α) H1 doğru Hatalı Karar β İsabetli karar (1-β) Geçerli karar kontrol verilmiş sonucunda olasılığı kabul (1 – hipotezinin demektir. edilmesi β) kabulü Geçerli ile dır. de Bu ile (1 H1 isabetli ihtimalle –α ) olasılık hipotezin karar verilmiş “testin Gücü ile isabetli yapılan olur (veya kontrol ki bunun Hipotez Kontrolunun gücü)” denir. α ve β hata yol olasılığının açmaktadır. arasında ters ilişki vardır. α değerinin küçülmesi I. Tip azalmasına Araştırıcı olasılığını belirlemelidir. anlamlılık sınırı zarar verecek karşın hipotez Biyolojide “p<0.05” maddelerde dir. II ve insan H0: İlaç öldürücü bir etkiye sahip değildir olasılığının başlarken medikal küçülmelidir. hipotezini H1: İlaç öldürücü etkiye sahiptir, hata kontrolüne Ancak, α tip I. alanlarda sağlığına Örneğin artmasına Tip hata önkabulsel ve hayatına bir araştırıcı Şeklinde kurmuş ise α = 0.00001 gibi çok küçük olmalıdır. 4. Çift ve Tek Taraflı Kontroller Hipotez kontrolleri çift veya tek taraflı olarak yapılabilir. istatistiğinin sadece Yapılacak kontrolü araştırıcının kuracağı karşıt hipotez belirler. Araştırıcı, örnekleme örnekten dağılımına sadece dahil örnekleme önemli ise için, küçük tarafa olması ile dağılımının durumda bu Bunun hesapladığı başka ortalamasından yapılması örnekleme örnekten ilgileniyorsa, gereken dağılımının hesaplanan sapıp çift veya değişle sapmadığı taraflı ortalamasından değer bir kontroldür. büyük daha fazla veya sapanların ihtimali bulunur. H0: kabul Söz konusu edilebilir. ilacın hastalığı Gözlenen0.69 oranı iyileştirme ile oranı 0.75 0.75 olarak arasındaki fark tesadüfen ileri gelmektedir. Kontrol Hipotezi; H1: Aynı ilacın iyileştirme oranı 0.75 değildir yanı π≠ 0.75 dir. Burada araştırıcının ilgilendiği söz konusu ilacın etki oranının 0.75 olarak kabul edilip edilmeyeceğidir. Eğer belirlemiş araştırıcı ise ortalamadan küçük ortalamadan büyük olasılığına karşı 1. bu Tip hata olasılığın değerlerin değerlerin ret kontrolünde belirlemiş olur. ve olasılığını yarısını bulunduğu bulunduğu kabul da α= 0.05 örnekleme tarafa, tarafa bölgelerini diğer alır çift ve olarak dağılımında yarısını I. taraflı Tip ise hata hipotez Bazı durumlarda araştırıcı sadece örnekten hesaplanan istatistiğin örnekleme dağılımının ortalamasından küçük (veya büyük) tarafa sapması ile ilgilenebilir. Bu durumda tek taraflı hipotez kontrolü yapılır. Tek taraflı hipotez kontrolünde örnekleme dağılımın ortalamasından küçük (veya büyük) tarafa örnekten hesaplanan istatistik kadar ve daha fazla sapanların olasılığı hesaplanır. Bu durumda I. Tip hata olasılığı için dağılımın hangi tarafı ile ilgileniliyorsa o tara alınır. Örneğin doktor söz konusu ilacın tedavi oranının 0.75 den daha az olduğunu kontrol etmek istiyorsa; H0: İlacın hastalığı iyileştirme oranı 0.75 olarak kabul edilerek, gözlenen 0.69 ile 0.75 arasındaki fark tesadüften ileri gelmektedir hipotezine karşı kontrol hipotezi; H1: İlacın hastalığı iyileştirme olasılığı 0.75 ten düşüktür hipotezine karşı test eder. Bu durumda ortalamadan sol tarafta 0.69 ve daha küçük oranların bu dağılıma dahil olma ihtimalini hesaplar. Hipotezler kurulduktan ve test istatistiği hesaplandıktan sonra eğer hesaplanan test istatistiğine göre örnekten hesaplanan istatistiğin söz konusu dağılma olasılığı kararlaştırılan I. Tip hata olasılığından büyük ise yani H0 kabul bölgesine H0 hipotezi reddedilemedi denir. Aksi durumda kontrol hipotezi reddedilerek karşıt hipotez kabul edilir. 5. Testin Gücü Yapılan hipotez kontrolünün gücü daha önce de belirtildiği üzere (1 – β) dır. Β olasılığının küçülmesi ile yapılan hipotez kontrolünün gücü artar. Bir vitamin karmasında 25 mg B1 bulunması gerektiği belirtilmiştir. Üretim aşamasında değişik aralıklarla yapılan kontrollerden beher drajede bulunan B1 vitamini miktarına ait standart sapmanın 1.2 mg olduğu bilinmektedir Bu verilere göre µ= 25 mg δ = 1.2 mg Drajelerdeki B1 vitamini miktarının normal dağıldığı bilinmektedir. Söz konusu fabrikanın ürettiği vitamin karmalarından rastgele 16 ambalaj alınsa ve bunların her birinden rastgele alınan drajeler test edilse bu 16 adet drajelerde B1 ortalaması 25 mg ve standart sapması 1.2/√16 = 0.3 olacak şekilde bir normal dağılım gösterir. Yapılacak bir hipotez testinde test ve karşıt hipotez aşağıdaki gibi olsun: H0 = 25 mg H1 = µx< 25 mg Eğer birinci tip hata olasılığı α = 0.05 olarak belirlenmişse herhangi bir örnek ortalamasına ait test değeri Z = - 1.645 den daha küçük ise test hipotezi reddedilecektir. -1.645 = 𝑥𝑥−25 0.3 bağıntısından X =24.5065 olarak bulunur Hesaplanan değer 25 mg daha küçük olduğu için her drajede ortalama 25 mg B1 vitamini olduğu hipotezi reddedilmiş olacaktır. Gerçekte ortalama 25 mg B1 vitamini bulunduğu halde bu partinin yanlış olarak reddedilme olasılığı (1. Tip hata olasılığı) α = 0 0.05 tir. Geçekte ortalama B1 vitamini 25 mg dan düşük olduğu halde µ= 25 mg hipotezinin kabul edilme olasılığı (II.tip hata olasılığı) nedir. Karşıt hipotez 25 mg dan düşük olduğu yönündedir. Karşıt hipotez için 24.1 değeri alınırsa II. Tip hata olasılığı β hesaplanabilir. Bu durumda Z = 24.5065 – 24.1/0.3 = 1.355 yaklaşık 1.36 Z tablosundaki 0 ile 1.36 arasındaki Z’lerin oranının 0.4131 olduğu bulunur. Bu değerden büyük Z’lerin oranı 0.5 – 0.4131 = 0.0869’dur. Geçekte B1 vitamini ortalaması 24.1 iken 25 mg olarak saptama olasılığı % 8.69’dur. Testin gücünün hesaplanması ise 1 – 0.0869= 0.9131 dir. Yani α = 0.05 ve karşıt hipotezde µ= 24.1 ise karşıt hipotezin doğru verme olasılığı %91.31 ‘dir. BÖLÜM X REGRESYON ve KORELASYON Birçok durumda araştırıcı üzerinde çalıştığı örnekte birdenfazla özelliğe ait veri toplayabilir. Bu gibi durumlarda sadece örneği tanıtıcı istatistiklerini hesaplamak ve bilmek araştırıcı tarafından yeterli bulunmayabilir. Eldeki veriler kullanılarak iki özellik arasında bir ilişki olup olmadığı değişkenlerden birinin bir birim artmasına karşılık diğer değişkenlerde nasıl bir değişiklik oluştuğunu araştırabilir. Nedensellik bağıntı tiplerinden biri olarak “birlikte değişim bağı”, pek çok tıp araştırmasında, klinik uygulamada ve biyolojik özellikte karşımıza çıkar: Fizyolojik bir ölçütün, biyokimyasal bir özellikle bağıntısı, bir ilaca verilen yanıtın o ilacın dozuna olan bağının modeli, bir halk sağlığı ölçütünün özgün bir sağlık hizmeti sonucu ile ilgisi, vs gibi sorgulamaların hepsinin yanıtında birlikte değişimin varlığı ve gereğinde modellenmesi yatmaktadır. Biyoistatistiksel açıdan iki değişkenin – veya veri setinin – böylesi özgün değişim birliktelikleri, değişim uyumu içinde olması “bağıntı” , “bağımlılık” adını alır. İstatistiksel açıdan böylesi bağıntıların varlığına Korelasyon denir ve bunu belirlemek için farklı değişken ve düzen tipleri için farklı yöntemler bulunmaktadır. Bağıntı varlığının kanıtı için bu ilk aşama saptandı ise ve değişkenlerin özellikleri de uygunsa, bağıntının matematiksel modeli yapılandırılarak fonksiyonun katsayıları belirlenir ve bir Regresyon denklemi kurgulanır. Bir örnekten birden fazla özelliğe ait veri toplandığı zaman hesaplanması gereken istatistikler korelasyon ve regresyon katsayılarıdır. Değişkenlerden biri diğerini etkileyen etkenlerden biri olabilir, bu duruma neden – sonuç ilişkisi denir. Korelasyon Katsayısı Bir örnekten iki özelliğe ait toplanan verilerin koordinat sisteminde noktalar halinde gösterilmesi araştırıcıya iki özellik hakkında bir ön bilgi verecektir. Eğer veriler koordinat ekseninde yukarıdaki şeklin üst tarafında yer alan iki grafiğe benzer bir dağılım gösteriyorsa iki özellik arasındaki ilişkinin derecesini belirten korelasyon katsayısı ( r ) 0 veya 0’a çok yakın bir değerdedir. Bu durumda iki özellik arasında doğrusal bir ilişkiden söz edilemez. İki özelliğe ait veriler koordinat ekseninde yukarıda verilen şeklin alt tarafında kalan iki grafiğe benzer bir dağılım gösteriyorsa bir doğru üzerinde sıralanabilir olarak kabul edilmektedir. Bu iki özellik arasında tam bir ilişki olduğu anlamına gelmektedir. Yani her bir X değerine karşılık gelen bir Y değeri vardır. İki özelliğe ait veriler arasında tam bir ilişki bulunmayabilir. İki özellik arasında tam olmayan pozitif ilişkide korelasyon katsayısı 0 ile + 1 arasındadır. Bunun tersi de olasıdır. İki özellik arasında tam olmayan negatif bir ilişki söz konusu olabilir bu durumda korelasyon katsayısı -1 ile 0 arasındadır. 2 değişken arasındaki doğrusal korelasyonun en önemli ölçütü Pearsonkorelasyon– çarpım moment- katsayısıdır ve “r” ile simgelenir Yukarıdaki paragraftan da anlaşılacağı üzere koralsyon katsayısı -1 ile +1 arasında değişmektedir. Korelasyon katsayısının işareti ile ilişkinin yönü saptanır. Pearson korelasyon katsayısı normal dağılımlı veri setleri için uygundur, normallik varsayımları yerine gelmiyorsa, parametrik olmayan seçenek, korelasyonu kestirmek için kullanılabilir. Bu X ve Y değişkenlerinin gerçek değerlerini değil kendi değişkenleri içinde sıra sayılarını temel alan Spearmansırasayılar korelasyon (ρ:rho) katsayısıdır. Mutlak değerlere göre, r’nin çeşitli aralıkları için kabaca şu yorumlarda bulunmak olasıdır : 0- 0.30 : Doğrusal bağıntı yok 0.31- 0.45 : Çok zayıf doğrusal korelasyon 0.46- 0.65 : Zayıf doğrusal korelasyon 0.66- 0.80: Orta güçte doğrusal korelasyon 0.81-0.95 : Güçlü doğrusal korelasyon > 0.95 : Mutlak doğrusal korelasyon Yeterince güçlü bulunsa da hesaplanan bir "r" her zaman geçerli bir korelasyonun göstergesi değildir. Gerçek bir bağıntının varlığı ancak r’nin “0” değerinden istatistiksel açıdan anlamlı farklı olduğu kanıtlandığında kabul edilebilir. Dolayısı ile korelasyonun geçerliliği bir anlamlılık testi ile ve r’nin 0’dan farklı olduğu varsayımı ile test edilir. Değerlendirme aşağıdaki formül ile gerçekleştirilir. Sonuç “t” değeri, t dağılımının n-2 serbestlik derecesine göre değerlendirilir. Anlamlılık bulunuyorsa (p<0.05) r’nin 0’dan farklı olduğu ve korelasyonun geçerli olduğu anlaşılır. Bağıntının gücü ve yönüne ilişkin yorum ancak bu değerlendirmeden sonra yapılmalıdır. Gerçekten de çok güçlü bir "r" değeri istatistiksel anlamsızlığı nedeniyle geçersiz olabilir. Bazen de çok “anlamlı” gözüken bir sonuç - özellikle büyük örneklemler için geçerli bir korelasyon göstergesi değildir. t= r 1− r 2 n−2 Korelasyon çözümlemesi sonunda geçerli ve yeterince güçlü bir “r” değeri elde edilmiş ise regresyon çözümlemesine geçilir. Bu sonuç doğrusal bir bağıntı sorgulamanın da uygun olacağının kanıtıdır. Bu çözümlemede temel yaklaşım y bağımlı değişkeninin rassal değişimlere açık olduğu halbuki x bağımsız değişkenindeki saçılımın araştırıcının daha fazla denetiminde dolayısı ile daha düşük saçınıklıkta olabileceği düşüncesidir. Dolayısı ile y değişkeninin sorgulanacak ideal bir doğrudan uzaklıklarının karelerini minimuma indirecek bir çözüm aranır. Örnek verilerin belirlenen doğrudan uzaklıkları – artıklar – toplamı 0 edecektir. Bu yaklaşıma “en küçük kareler yöntemi” denir ve doğrusal regresyon çözümlemelerinde en çok kullanılan yöntemdir. BELİRTME KATSAYISI (R2 , r2) Belirtme katsayısı korelasyon katsayısının karesidir - örneğin, r = 0,849 r2 = 0.7208. Bu istatistik, bağımlı değişkendeki, bağımsız değişkene bağlı olarak ortaya çıkan – istatistiksel anlamdaki - varyans / değişim düzeyini belirtir. Örneğin 0.72 gibi bir belirtme katsayısı bağımlı değişkendeki değişkenlik düzeyinin % 72 oranında bağımsız değişken tarafından açıklanabildiği anlamındadır, kalan % 28 , “açıklanmamış” durumdadır. r2 değeri de 0 ile 1 arasında yer alır. Belirtme katsayısının en önemli yararı bağımlı değişkendeki değişikliğin düzeyini öngörebilme olanağı sağlamasıdır. Bir başka yönden bakıldığında ise belirtme katsayısı, regresyon çözümlemesinde saptanmış ideal uygunluk doğrusuna en yakın verilerin oranını göstermektedir bu da regresyon doğrusunun veri setini ne düzeyde doğru yansıttığının göstergesi olmaktadır. Doğru, serpilme diagramındaki noktalardan ne denli uzaksa açıklayıcılığı da o kadar zayıftır. Regresyon katsayısı Ele alınan iki değişkenden biri diğerinin fonksiyonu olarak ele alınabilir. Bir ülkenin nüfusu yıllar ilerledikçe artar. Yani pozitif bir ilişki vardır. Burada, ülke nüfusu yılların (zamanın) bir fonksiyonudur. Burada nüfus Y, zaman X ile tanımlanacak olursa ikisi arasındaki ilişki y=f(x) olarak gösterilir. Değişkenlerden biri diğerinin fonksiyonu olarak tanımlandığında eşitliğin sol tarafındaki değişken bağımlı değişken sağ tarafındaki ise bağımsız değişken denir. Bağımlı değişken birden fazla değişkenin fonksiyonu olarak da ele alınabilir. X ve Y çiftleri koordinat ekseninde noktalandığında, ilişkinin doğrusal olduğunun varsayılabileceği kararına varılmış ise fonksiyon örnekte; Y = a + bX+e şeklinde ifade edilir. Bağımsız değişkenin kendi ölçü birimi cinsinden bir birim değişmesine karşılık bağımlı değişkenin kendi ölçü birimi cinsinden ortalama olarak ne kadar değişeceğini gösteren katsayıya regresyon katsayısı denir. Korelasyon katsayısı iki özellik arasındaki ilişkinin derecesini verir ve birimi bulunmamaktadır. Buna karşılık regresyon katsayısının birimi vardır ve bağımsız değişkende bir birim değişmeye karşılık bağımlı değişkenin kendi birimi cinsinden ortalama olarak değişeceği miktardır. Bağımsız değişken X ve bağımlı değişken Y ile gösterilirse; X değişkeninin bir birim artmasına karşılı Y değişkeninin kendi birimi cinsinden ortalama olarak değişeceği miktara Y’nin X’e göre regresyon katsayısı denir ve byxolarak gösterilir. Eğer Y değişkeni bağımsız X değişkeni bağımlı ise bu durumda bxyşeklinde gösterilir. byx : Y’ninX’e göre regresyon katsayısı bxyX’in Y’ye göre regresyon katsayısı Regresyon katsayısının hesaplanması için kullanılan eşitlik genellikle ; Regresyon Katsayısı(b) = çarpımlar toplamı / Bağımsız değişkene ait kareler toplamı Regresyon katsayısının işareti ile korelasyon katsayısının işareti her zaman aynıolarak bulunur. Regresyon Denklemi İşaretlenmiş olan noktalar bir doğru üzerinde olsa idi doğrunun denklemi kolayca oluşturulabilirdi. Eğer noktalar bir doğru üzerinde değil de, doğru etrafında saçılıyorsa X ve Y değerlerine karşılık gelen noktaların hepsine birden en yakın geçecek bir doğru oluşturulabilir. Oluşturulacak bu doğruya Regresyon Doğrusu ve doğruyu oluşturan denkleme de Regresyon Denklemi adı verilir. Bu denkleme önceden tahmin denklemi de denmektedir. BÖLÜM XI SAĞLIK İSTATİSTİKLERİ Epidemiyoloji, sağlık veya sağlığa ilişkin olayların kişi, yer, zaman özelliklerine göredağılımını, nedenlerini, tanı, tedavi ve önlenmesi için uygun çözüm yollarını belirlemeye yarayançalışmaların araştırma tekniklerinin bilimi, yöntem bilimidir. Epidemiyolojik açıdan bu incelemeler, niceliksel (sayısal) olarak ifade edilince bir anlamkazanırlar. Bu durumda, bir toplumun tümünün ya da belirli özellikleri olan alt gruplarınınsağlığını etkileyen olayların, çeşitli faktörlerin etkilerinin sayısal olarak ölçülüp belirtilmesigerekmektedir. En basit ve temel ölçü belirli bir hastalığı veya özelliği olan kişilerin sayılmasıdır.Ancak, sadece vaka sayısını belirtmek konu hakkında bilgi sahibi olmak, karşılaştırmalaryapmak için yetersizdir. Ölçülerin bir ortak payda üzerinden ifade edilmesi gerekir. Bunedenle, belirli bir birime dayanan ölçütler geliştirilmiştir Ölçütün anlamlı olabilmesi için ait olduğu toplum (tüm nüfus, belirli gruplar veya olay)üzerinden belirtilmesi gerekir (“Risk altındaki toplum”). Ölçüt, NE, NEREDE, NE ZAMAN sorularını yanıtlamalıdır. ÖLÇÜT = (Pay /Payda) x Katsayı şeklindedir. PAY : İlgilenilen olay sayısı PAYDA : 1. Risk altındaki toplum / gruptaki kişi sayısı 2. Sağlık olayının görüldüğü grup 3. Başka bir olay / ölçüt KATSAYI : Olayın sıklığına göre seçilen değer (10, 100, 1.000, 10.000, 100.000, gibi) SAĞLIK ÖLÇÜTLERİNİN GENEL SINIFLANDIRILMASI Sağlık alanında kullanılan ölçütler genellikle HIZ (rate), ORAN (ratio) ve ORANTI/YÜZDE (proportion/percentage) olarak ifade edilirler. HIZ (Rate): Risk altındaki bir toplum veya grubun, belirli bir birimi (k= 100, 1.000, 10.000 gibi)içinde, belirli bir zaman diliminde gözlenen hastalık veya olay sıklığını belirtir. Matematikselolarak, bir olgunun “bütün” içindeki yerini belirten ölçülerdendir. Örnek: Ankara İli’nde 1999 yılı hipertansiyon hızının saptanması. Burada pay, 1999 yılında Ankara İli’nde hipertansiyon saptanan kişi sayısı, payda ise1999 yılı Ankara İli toplam nüfusu olmalıdır. Bulunan sayının bir katsayı ile çarpılması ile de“HIZ” elde edilmektedir. Toplumda az görülen olguların hızları için 10.000, 100.000 gibi büyük katsayılar, sıkgörülen olguların hızları için ise 100, 1.000 gibi katsayılar seçilmelidir. ORANTI (Proportion, Percentage): Hesaplama tekniği olarak hız ile aynı olmakla beraber, orantıda her zaman belirli birzaman dilimine atıf söz konusu değildir ve paydada “risk altındaki toplum” veya toplumutemsil eden örnek yoktur. “Sağlık olayı” sayısının, toplam olay sayısı veya başvuran kişi sayısınabölünmesi ile elde edilir. Tanımlayıcı çalışmalardan elde edilen ölçütler bu şekilde ifadeedilirler.Kullanılan katsayı genellikle 100 olup, yüzde olarak ifade edilir. Örnek: “A” hastanesi “B” polikliniğinde yapılan muayenelerin tanılarına göre dağılımı. Pay : Akut solunum yolu enfeksiyonu tanısı alan kişi sayısı Payda : “A” hastanesi “B” polikliniğinde muayene olan toplam kişi sayısı. Katsayı : 100 ORAN (Ratio) : Kesrin pay ve paydasında farklı olaylar veya ölçütler yer alır. Hız ve orantıdan farklıolarak, payda payı içermemektedir. Oran, farklı sağlık olaylarının ya da durumların boyutunu birbirine göreceli olarak ifade eder.Katsayı olarak genellikle 100 kullanılır, ancak bazı durumlarda da katsayı kullanılmaz. Örnek: 100 canlı doğuma karşılık isteyerek düşük sayısı Pay : İsteyerek düşük sayısı Canlı doğum sayısı Payda : Katsayı : 100 Risk altındaki toplum = a+b Sağlam = a Hasta = b a b Sağlık Göstergesi olarak Kullanılan Çeşitli Ölüm Hızları Ana Ölüm Hızı: Dünya Sağlık Örgütü ve Uluslararası Jinekoloji ve Obstetrik federasyonu gibi uluslararası sağlık örgütlerinin ana ölümünü bir kadının gebeliğinin birinci gününden doğum sonrası lohusalık döneminin 42 gününe kadar olan sürede gebelik ve dolaylı olan nedenlerle oluşan ölümler olarak tanımlanmaktadır. Ana Ölüm Hızı = Bir toplumda bir yıl içerisindeki ana ölümleri x 100.000 Aynı toplumda aynı sürede canlı doğum sayısı AÖH bir toplumda gebe kalmadaki risk derecesi hakkındaki fikir vermesinin yanısıra ana sağlığı hizmetlerinin yeterli olup olmadığı ve o toplumun genel sosyo – ekonomik düzeyi hakkında da fikir verir. Perinatal Ölüm Hızı :Bu hız toplumda ana sağlığı düzeyini, doğum öncesi bakımın yeterli ve doğumların sağlıklı koşullarda olup olmadığını gösteren önemli bir ölçüttür. Ana ölümüne göre daha sık meydana geldiği için küçük populasyonlarda ana sağlığı düzeyini değerlendirmek için kullanılmaktadır Perinatal Ölüm Hızı = Bir toplumda bir yılda 28. Haftadan sonra olan ölü doğumlar ve canlı doğup 0-7 gün içerisinde ölen bebeklerin sayısı x 1000 Toplam (canlı ve ölü) doğum sayısı Perinatal Ölüm Nedenleri; Konjenital Anomaliler, Rh uyuşmazlığı, Mekanik nedenler (travma, uterusrüptürü, kordon sarkması), toksemi, Antepartum kanama, Plasental yetmezlik, Düşük Doğum Ağırlığı, Maternal Hastalıklardır Bebek Ölüm Hızları: Yaşamın ilk dönemlerinde, gerek doğumdan önce, gerek doğumdan sonraki ölümlerin boyutunu belirlemek, halk sağlığının öncelikli konularından birirni oluşturmaktadır. Anne ve çocuk sağlığının ne durumda olduğunu, en çok öldüren nedenlerin neler olduğunu ve hangi dönemde olduğunu saptamak için çeşitli ölçütler geliştirilmiştir. Bir toplumun genel sağlık, özellikle çocuk sağlığı düzeyini belirlemek, bu konuda verilen sağlık hizmetlerinin etkinliğini değerlendirmek için kullanılan en anlamlı ve en önemli ölçütlerden birisi bebek ölüm hızıdır. Toplam Bebek Ölüm Hızı : (Bir yılda canlı doğup, 365 gün içerisinde ölen bebek sayısı/ Canlı doğum sayısı) * 1000 Bebek ölümleri ile ilgili diğer hızlar; Yeni doğan (neonatal) dönem bebek ölüm hızı : Erken yeni doğan, canlı doğup 0 – 7 gün içerisinde ölen bebekler ile ilgili hızdır. 0 – 7 günde ölen bebeklerin sayısı payda yer alır. Geç yeni doğan dönemi , canlı doğup, hayatın 8 – 28 günleri arasında ölen bebeklerle ilgili hızdır. 8 – 28 günde ölenler payda yer alırlar. Bu iki hızın toplamı yenidoğan dönemi bebek ölüm hızını verir. 1000 de 36 civarındadır. Yeni doğan dönemi sonrası ölüm hızı: Pay bir takvim yılında canlı doğan ve 29 – 365 günler arasında ölen bebek sayısını içerir, payda da ise aynı yılın canlı doğan bebek sayılarını içerir. Postnatal ve neonatal ölüm hızları toplam bebek ölüm hızını verir. DOĞURGANLIK ÖLÇÜTLERİ : Kaba Doğum Hızı : Bir toplumda doğurganlık düzeyin, genel olarak gösteren, ayrıntılı bilgi vermeyen, elde edilmesi kolay bir ölçüttür. KDH : Bir toplumda bir yıldaki canlı doğum sayıs / aynı toplumun yıl ortası nüfusu * 1000 Özel Doğurganlık Hızı : Yaşa özel doğurganlık hızı : Kadınlarda 15 – 44 veya 15 – 49 yaş dönemi doğurganlık çağı olarak adlandırılmaktadır. Herhangi bir toplumda doğurganlığın zaman içerisinde nasıl bir seyir izlediğini, sunulan aile planlaması hizmetlerinin etkinliğinin değerlendirilmesinde veya farklı toplumların doğurganlık düzeylerini karşılaştırmak amacı ile kullanılan duyarlı bir ölçüttür. Pariteye Özel Doğurganlık Hızı : Doğurganlık düzeyinin belirlenmesinde kullanılan duyarlı bir ölçüttür. Gerek aile planlaması hizmetlerinin planlanmasında, gerek sunulan hizmetlerin en çok hangi gruplarca kullanıldığının değerlendirilmesinde yararlıdır. Toplam Doğurganlık Hızı : Yaşa özel doğurganlık hızının toplanması ile elde edilir. Genel Doğurganlık Hızı : Doğurganlık çağında her 1000 kadının bir yılda yaptığı canlı doğum sayısıdır. GDH : Bir yıldaki canlı doğum sayısı/15 – 49 yaştaki kadınlar * 1000 Tamamlanmış Doğurganlık Hızı : 45 – 49 yaş grubu kadınların doğurdukları ortalama çocuk sayısıdır. Toplam Düşük Hızı : Bir toplumda düşük sorununu ne düzeyde olduğunu ve aile büyüklüğünü sınırlandırma ya da doğumlar arası aralığın uzatılması konusunda talebin düzeyini gösterir. Belli sürede isteyerek veya kendiliğinden düşük sayısı/ toplam gebelik sayısı x 100 HASTALIK (MORBİTİDE) DÜZEYİ BELİRLEYEN ÖLÇÜTLER: Epidemiyolojide en sık kullanılan hastalık ölçütleri insidans ve prevalanstır. İnsidans : Risk altındaki sağlam kişilerin belirli bir sürede hastalığa yakalanma olasılıklarını verir. Bir toplumda belli bir sürede ortaya çıkan yeni vaka sayısıdır. Payda da yıl ortası nüfus yer almaktadır. İnsidans hızı ileriye dönük tıptaki araştırmalarda veya toplumun sürekli izlenmesi, sağlıkla ilgili kayıtların tam, doğru ve sürekli tutulması ile elde edilir. Hastalıkların etiyolojilerinin açıklanmasında, sağlık sorunlarına çözümünde yapılan uygulamanın etkinliğinin değerlendirilmesinde çok yararlıdır Atak Hızı : Primer Atak Hızı : İnsidans hızının özel bir şeklidir. Bazı durumlarda toplumun tümü veya bir kesimi, hastalık riski ile bir süre için karşılaşır. Böyle durumlarda olayın boyutunu ölçmek için primer atak hızı kullanılır. İlk vaka görüldükten sonra, o hastalık için en uzun kuluçka dönemi içerisinde görülen tüm vakalar primer veya aynı kaynaktan bulaşmış olarak kabul edilir. Sekonder Atak Hızı : Genellikle bulaşıcı hastalıklar alanında kullanılır. İlk vaka görüldükten sonra ikinci en uzun kuluçka döneminde ortaya çıkan vakaların primerlerden bulaştığı, yani sekonder vakalar olduğu kabul edilir. EpizodHızı : Bağışıklık bırakmayan ve tekrarlayıcı hastalıkların sıklığını ölçmede kullanılır. Gıdaya özel Atak Hızı: Gıda zehirlenmelerinde zehirlenmeye hangi yiyeceğin neden olduğunu gösterebilmek için kullanılır. Prevalans : Belirli bir süre veya anda toplumda bulunan toplam vaka sayısının risk altındaki topluma oranıdır. Belirli bir zamanda bir hastalığın bir toplumda hangi sıklıkla olduğunu gösterir. Nokta Prevalansı : Toplumda belirli bir andaki bir zaman kesitindeki toplam vaka sayısıdır. Süre Prevalans : Toplumda belirli bir süre içinde toplam vaka sayısıdır. Ruhsal hastalıklar için önemlidir STANDARDİZASYON STANDARDİZASYON TEKNİKLERİ Standardizasyon teknikleri ile nüfusun yapısı ile ilgili sakıncalar ortadan kaldırılır. Bu amaçla kullanılan üç yöntem bulunmaktadır. Bunlar; Ortalama Ölüm Hızı Eşitinin Hesaplanması: Direkt Standardizasyonla Standardize Ölüm Hızının Hesap Edilmesi İndirekt Standardizasyon Yöntemidir. Ortalama Ölüm Hızı Eşitinin Hesaplanması Nüfus 5’er yıllık aralıklarla 13 yaş grubunabölünerek, 13 yaş dilimine ait ölüm hızları ayrı ayrı hesap edilir ve toplanır ve 13’e bölünerekaritmetik ortalama ölüm hızı elde edilerekkarşılaştırmalar bu ortalama ölüm hızı ile yapılır. Direkt Standardizasyonla Standardize Ölüm Hızının Hesap Edilmesi Karşılaştırma yapılacak her iki bölge için ayrı bir nüfus yani standart nüfus atanır ve yaşa özel ölüm hızları bustandart nüfus ile çarpılarak beklenen ölümlerbulunur. Standart nüfusun belirlenmesinde en çok kabul edilen sistem karşılaştırılacak her iki nüfusun yaş gruplarınaÖzel nüfuslarının toplanıp o yaş grubu için standart Nüfusu oluşturmalarıdır. Yaş Grupları Nüfus (X) Ölüm Sayısı KÖH Nüfus (Y) Ölüm Sayısı KÖH Standart Nüfus SKÖH (X) SKÖH (Y) 0–4 9222 180 19.5 7965 70 8.8 17187 308 151 5–9 10 – 14 15 – 19 20 – 24 25 – 29 30 – 34 35 – 39 40 – 44 45 – 49 50 – 54 55 – 59 60 – 64 65 üzeri Toplam 19576 39056 46071 55621 26780 26600 22400 18600 17920 14300 12731 11121 9080 329078 120 98 71 76 34 30 21 78 60 18 24 10 15 835 6.1 2.5 1.5 1.3 1.2 1.1 0.9 4.2 3.3 1.3 1.9 0.9 1.7 2.5 14314 29974 42715 50638 24641 28914 26517 18704 21418 16705 11312 12120 10125 316058 80 54 66 71 32 36 25 76 72 30 25 16 24 677 5.6 1.8 1.5 1.4 1.3 1.2 0.9 4.1 3.4 1.8 2.2 1.3 2.4 2,14 33890 69030 88782 106259 51421 55514 48917 37304 39338 31005 24043 23241 19205 645136 208 173 133 138 62 61 44 157 130 40 46 21 33 1554 190 124 133 149 67 67 44 153 134 56 53 30 46 1397 X Toplumun Standardize Ölüm Hızı : 1554/645136 :2,41 Y Toplumun Standardize Ölüm Hızı : 1397/645136 : 2,17 İndirekt Standardizasyon Yöntemi Yaş gruplarına göre ölüm hızları bilinmiyorsa kullanılan beş basamaklı bir yöntemdir. 1.Basamakta : Standart kabul edilen nüfusun yaşa özel ölüm hızı (Dünya Nüfusu olabilir) standart hız olarak kabul edilir. Karşılaştırılacak olan ülkeler için beklenen ölüm hızları bulunur. 2.Basamakta : İndeks ölüm hızı bulunur. Bunun için (beklenen ölüm sayıs/ nüfus)* 1000 3.Basamakta : KÖH/İÖH : Standartlaşma faktörü bulunur 4.Basamakta : Standartlaşma faktörü * KÖH 5.Basamakta: Standardize Ölüm Hızı hesap edilir. (Gözlenen Ölüm Hızı (KÖH)/Beklenen Ölüm Hızı) *100 Sağlık Kurumlarında tutulan bazı istatistikler ve hesaplama yöntemleri A-NÜFUS BAŞINA DÜŞEN HASTA YATAK SAYISI Bir yıl içinde incelenen yerleşim birimi (İlçe, il, bölge, ülke) sınırları içerisinde bulunan sağlık kurumlarının toplam hasta yatağı sayısının birimin nüfusuna bölünmesi ile elde edilir. Belli sayıda (genellikle 10,000) kişiye düşen hasta yatak sayısını ifade eder. Planlama yapmak gibi diğer amaçlar yanında yerleşim birimleri arasında kıyaslama yapmak amacıyla da kullanılır. İncelenen yerleşim birimi sınırları içindeki toplam hasta yatağı sayısı nasıl hesaplanır. 10,000 Kişiye Düşen Hasta Yatak Sayısı = İncelenen yerleşim birimi toplam nüfusu x10,000 Örnek: 674,387 nüfuslu bir ildeki toplam hasta yatağı sayısı 1,625 dir. Bu ilde 10,000 kişiye düşen hasta yatağı sayısı; Yatak sayısının nüfusa bölümüyle elde edilen sonucun on binle çarpımıdır. 10,000 Kişiye Düşen Hasta (1,625 Yatak Sayısı/ 674,387) x10,000 = 24.1 yatak şeklinde bulunur. B - YATAN HASTA SAYISI Belirli bir zaman dilimi içerisinde hastaneye yatırılan hasta sayısıdır. C - HASTA YATIRILMA ORANI Belirli bir zaman dilimi içerisinde hastaneye yatırılan hastaların bulunduğu yerleşim alanı nüfusuna oranıdır. D - ÇIKAN HASTA SAYISI Bir yıl içerisinde hastaneye yatırılan, hastaların, şifa, salah hali, ile evlerine veya başka kurumlara çıkarılmalarıdır. Ölüm vakaları da buna dahildir. E – MAKSİMUM YATILAN GÜN SAYISI İncelenen süre içinde hastanede verilebilecek bakım gün sayısının en büyük değeridir. Hesaplamada hasta yatak sayısı ile incelenen süre içindeki gün sayısı çarpılır. Örnek: 50 yataklı bir hastanenin Ocak(31 gün), Şubat(28/29 gün), Mart ayı (31 gün) için maksimum hasta bakım gün sayısı = 50 yatak * (90/91 gün) = 4500 hasta bakım günü (Şubat 28 gün ise) = 4550 hasta bakım günü (Şubat 29 gün ise) F - YATILAN GÜN SAYISI Hastanın hastanede kaldığı günlerin toplamıdır. Hesaplanmasında hastanın giriş çıkış günlerinden yalnız girdiği gün sayılır çıkış günü sayılmaz hastanın çıkış tarihinden giriş tarihi çıkarılarak elde edilir. Aynı gün yatıp çıkan hastanın hasta günü 1 gün olarak kabul edilir. G) ORTALAMA KALIŞ GÜN SAYISI Yatılan Gün Sayısı /Taburcu + Ölen sayısı H) YATAN HASTA ORANI (%) Bir yılda hastane polikliniğine başvuran hastaların ne kadarının yatırılarak tedavi edildiğini gösterir. Yatan Hasta X 100 /Poliklinik I) YATAK DEVİR HIZI Bir yatağın yılda kaç hasta tarafından kullanıldığını gösterir. Yatan Hasta /Hasta Yatağı J) DEVİR ARALIĞI (GÜN) Bir hasta yatağının kaç gün boş kaldığını gösterir. Hasta Yatağı X Süre- Yatılan Gün Sayısı /(Taburcu + Ölen) K) YATAK DOLULUK ORANI: Belirli bir zaman dilimi içerisinde hasta yataklarının ne oranda hasta tarafından kullanıldığını gösterir hesaplama formülü Yatılan Gün Sayısı X 100 Yatak Doluluk Oranı /3ay ( 90 - 92 gün) veya 1 yıl (365 gün) X hasta yatak sayısı Hasta yataklarının yeterli kullanılıp kullanılmadığını gösterir BÖLÜM XII ÖRNEKLEME GİRİŞ Bir istatistiksel karara varmak için gerekli olan sayısal değerler, bireyler veya toplumlar üzerinde ölçüm veya sayımlar yapılarak elde edilir. Belli bir konuda, o alandaki değerlendirmelerin, ölçümlerin, sayımların yapılacağı tüm olguları içeren topluluğa “Toplum: Popülasyon: Evren” denir. İlgilenilen özelliğe göre tüm Diabetliler, diabet hastaları popülasyonunu oluşturabilecekleri gibi tüm sahil çamları veya kömür madeni çalışanları veya balarıları da kendi özgün popülasyonlarını oluştururlar. Bir popülasyon kısıtlı özelliklerle tanımlanarak çok daha az sayıda birey-olgu da içerebilir – çok ender hastalıklarda olgular topluluğu gibi- . Evren, araştırma sonuçlarının genellenmek istendiği olgular-elemanlar bütünüdür. İki tür evren ayrımlanabilir: Birisi, genel evren, öteki ise çalışma evrenidir. Genel evren, soyut, tanımlanması kolay fakat ulaşılması güç ve hatta çoğu zaman olanaksız bir bütündür. Çalışma evreni, ise ulaşılabilen evrendir. Araştırmacının, ya doğrudan gözleyerek ya da ondan seçilmiş bir örnek küme üzerinde yapılan gözlemlerden yararlanarak, hakkında görüş bildirebileceği evren çalışma evrenidir Üzerinde araştırma yapılan birey (veya olgular) toplumu sınırlı sayıda ögeden oluşuyorsa böylece ölçüm veya sayım yapmak da kolaysa, araştırma toplumun tüm ögeleri üzerinde yürütülebilir (Belli bir yöredeki seyrek ve endemik bir hastalığın tüm olgularında belli bir enzimin ölçülmesi gibi). Bu tür, toplumdaki olguların tüm birimlerinin düzeylerinin saptanması ile oluşan derlemeye “Tam sayım” (tüm sayım) denilir. Ancak bir araştırma sınırlı bir birey topluluğunu değil de, sonsuz denebilecek kadar çok sayıda bireyi içeriyor ise, bu tür bir sayım, yüksek maliyet, süreç, uygulayıcı yetersizliği, tüm birimlere erişememe gibi sorunlar nedeniyle olanaksız denebilecek kadar zorlaşır. Bundan dolayıdır ki, çok özgün ayrıntılı değerlendirmelerin gerekli olduğu veya çok ender rastlanan olaylar dışında tam sayım yapılmaz. Bunun yerine, tüm toplumun yerine geçebilmek, onu simgeleyebilmek, değerlerini belli doğrulukla yansıtabilmek koşulu ile kısıtlı bir toplum parçacığı kullanılır. Çok yüksek sayıda – hatta sonsuz - N olgu içerikli bir toplumdan, n sayıda, toplumu simgeleyebilecek olgu, örnek alınması ve onun değerlendirilmesi yöntemine “örnekleme” adı verilmektedir. (Bölümsel sayım). Bu kısıtlı sayıda örneği elde etme yöntemine örnekleme dendiği gibi, eldeki kümeye de örnekleme veya, örneklem, örnek kümesi adları verilir. Bir örnekleme sonunda elde edilen örnek grubu, aşağıdaki iki temel özelliği taşımak zorundadır, aksi halde yerine geçtiği toplumu yansıtmaktan uzak kalır. 1) Yapısal Simgeleme yeteneği: Bir örnek ana toplum içinde araştırılan özellikleri gerçekten taşıyorsa o toplumu simgeleyebilir. Bunun içindir ki gerek evrende-toplumda araştırılan özelliğin tanımı, gerekse de örnek birimlerinin bu tanıma uyan bireyler olarak seçilmesi gerekir. Örneğin; doğurganlık çağındaki kadınlarla ilgili bir araştırmada örnek birimlerin “belli yaştaki (19-45) kadınlardan oluşması” simgeleme açısında zorunludur. 2) Sayısal yeterlilik: Bir örnek grubu toplum içinde aranan özelliği yansıtabileceğine güvenilen büyüklükte ise değerlendirmeye “uygun büyüklüktedir”. Bu büyüklüğü saptamada ana etken ögeler, toplumun özelliği, göz yumulacak hata ve güvenirlik sınırlarının ön kabulüdür. İkincil olarak araştırma olanakları, örnekleme işleminin tipi, varsayımın özelliği rol oynar. Yetersiz örneklemler geçerli olabilecek varsayımların kanıtlanamamasına, çok gereksizce büyük tutulmuş örneklemler ise klinik değeri olmayan farkların istatistiksel olarak anlamlı bulunmasına yol açarlar. Bu iki temel özellik çerçevesinde, yapılacak bir araştırmanın örnekleminin olabildiğince doğru sonuçlar üretebilmesi için şu aşamaların gerekliliği ortaya çıkmaktadır: • Amaçlanan varsayıma göre gerekli en az sayının saptanması • Örneklemde, Toplumsal yapıya uyumun planlanması • Uygun sayı ve yapıda örneklemin toplum içinden seçimi ve “biassız” eldesi , Koşullar ne olursa olsun, bir örneklemin, toplumun “tam” bir yansıması olması olası değildir. Bu çerçevede belli düzeyde farklılıklar göze alınır ve baştan kabul edilir. Bunların düzeyinin “toplumsal gerçeği” zedelemeyecek sınırlarda tutulması gerekir. Ancak daha önce de vurgulandığı gibi bazı “hatalar”, bu farklılaşmanın çok artmasına ve aslında örneklemin toplumu simgelememesine neden olabilir. Örneklemden elde edilen ve gereğinde toplum bilgisi olarak kullanılacak olan sonuçlarda iki temel özellik aranır: Kesinlik: Sonuç bilgisinin çok geniş bir dağılım alanı olmamasıdır. Bu, özgün bir özelliğin belirtisi olacaktır. Standart sapması çok büyük olan bir sonuç, ölçümlenen özelliğin yaklaşık büyüklüğü hakkında belirgin bir bilgi oluşmasını – kıyassal çözümlemelerde istatistik anlamlılığın bulunabilmesini – büyük oranda engeller. Geçerlilik: Elde edilen sonuç değerin gerçek toplum değeri yerine oturacak yakınlıkta olmasıdır. Kesinlik sağlanmasına rağmen – özellikle ölçüm yaklaşımları ağırlıklı -çeşitli hata kaynakları nedeni ile veriler gerçekte olduklarından farklı ölçülebilirler – tartının hep 2 kg. fazla göstermesi örneği gibi – bu da sonucun gerçekle örtüşmemesini getirir. “Gerçeklik” sağlamayan örneklemeler “sistematik hata → bias” üretirler: Bu, bilindiği gibi örneklem verisi eldesinde belli tip örneklerin alınması veya ölçümlerin yanlış saptanması tipindeki hatadır. “Kesinlik” sağlamayan örneklemelerdeki -“rassal hata” ise fazlası ile geniş, “belirleyiciliği olmayan” dağılım aralığı, uç örneklerin fazlalığı- anlamındadır ve toplumun belirgin tanımlanamamasına neden olur. Sonuç olarak bir “örnekleme” sadece sayısı ile değil, örneklerin toplumsal yapıyı gerçekçi, abartısız ve tarafsız yansıtacak biçimde sağlanması ve üzerinden elde edilen değerlerin doğru saptanmış olması ile de önem taşır. 10.2.- ÖRNEKLEME BÜYÜKLÜĞÜNÜN ÖNEMİ Örnek grubu toplumu simgelemek üzere seçilmektedir, dolayısıyla toplumun ölçüm değerlerini de taşımalıdır. Toplumun gerçek değerlerini önceden göze alınabilir – klinik açıdan fark üretmeyecek- belli hata payları ile taşıyabilecek en uygun örnek sayısının saptanması araştırma sonuçlarının güvenilirliği açısından büyük önem taşır. Zira yetersiz örnek toplumun gerçek değerlerini yansıtmaz, çok fazla örnek gerek uygulama gerekse de nesnel açılardan zorluklar getirir, yargılama “tuhaflıkları” üretebilir. Bu kavramın anlaşılması için bir nedensellik yargılamasında, “neden” olarak düşünülen bir “X” özelliğinin, iki kümedeki (Ör: hasta/sağlam) dağılımının ( % 30 ve % 50 ) farklı sayılardaki küme büyüklükleri ile (10 ar, 50 şer ve 100 er olguluk kümeler) yargılandığını varsayalım. “X” ÖZELLİĞİ VAR YOK A GRUBU 3 7 B GRUBU 5 5 “X” oranı 0.30 ve 0.50 p= 0.659 (AD) Bu koşullarda ve bu sonuca dayanarak “X” özelliği için herhangi bir anlamlı nedensel yorum yapamıyoruz. “X” ÖZELLİĞİ YOK “X” oranı VAR A GRUBU 15 35 0.30 ve 0.50 B GRUBU 25 25 p= 0.066 (AD) Bu koşullarda ve bu sonuca dayanarak “X” özelliği için herhangi bir anlamlı nedensel yorumda kuşkulu kalıyoruz!! Eğer %30 a göre %50’lik bir oranın daha yüksek olduğunu kanıtlama amacı ile araştırma yapıldıysa, bu “anlamsızlıklar” , aslında kaçırılmış anlamsızlıklardır ve “Geçerli bir varsayıma”, hatalı olarak “geçersiz demek” yanılgısını yansıtmaktadırlar. Bir varsayım geçerliliğini kanıtlamak için gerekli örneklem hesabına uyarak değerlendirildiğinde en güvenilir karara varılabilecektir. Söz konusu çalışma için 100 er olguluk örneklemle; “X” ÖZELLİĞİ YOK VAR A GRUBU 30 70 B GRUBU 50 50 “X” oranı 0.30 ve 0.50 p= 0.039 √ Bu koşullarda ve bu sonuca dayanarak “X” özelliğinin “A” grubunda, “B” ye göre daha az bulunduğunu “anlamlı” olarak söyleyebiliyoruz! Gerçekten de bu çerçevedeki bir varsayım için gerekli örneklem hesabı yapıldığında örnek kümelerinin yaklaşık 56 şar olgu içermesi gerektiği ortaya çıkmaktadır. Kavramın “fazla örneklem” yönü de söz konusudur; Aşağıdaki örnek tabloda oranları ele alalım: “X” ÖZELLİĞİ YOK “X” oranı VAR A GRUBU 30550 69450 B GRUBU 30965 69035 0.3055 0.3097 p= 0.044 √ ! Bu koşullarda ve bu sonuca dayanarak “X” özelliğinin, “A grubunda, “B” ye göre daha az bulunduğu “anlamlı” olarak söylenebilecektir. %30 düzeyinde bir olay için, binde 4.2 düzeyinde farklılık gerçek bir “anlam” taşır mı? Böylesi bir fark, “klinik” açıdan önemli olabilir mi? "Etki büyüklüğü" klinik açıdan yeterli midir? Bu anlamlılık aslında belki de klinik önem taşımayan bir farkı abartmak hatta belki de “Geçersiz bir varsayıma hatalı olarak geçerli demek” olacaktır. Anlaşıldığı üzere küme büyüklükleri sonuç yargıyı tamamen etkilemektedir. Daha önce açıklanan kavramlar çerçevesinde, istatistikte tüm değerlendirme süreçlerinde, “güvenirlik” kavramı kullanılır. Bu kavram kabaca belirli sayıların önceden kabul edilen doğruluk yüzde paylarını belirler. Bu güvenirlik alanın dışında kalan kesim “risk” veya güvensizlik alanıdır ve bu alana düşen bir ölçümsel değer, “güvenirlik alanı” tarafından belirlenmiş sınırların dışında kaldığı için, “farklı” kabul edilir. Örnek büyüklüğü saptanırken de, belli bir güvenirlik alanı içinde toplum değerini yansıtabilecek örnek sayısı saptanır. Ayrıca herhangi bir örnek grubunda elde edilen konu değerin rassal olarak tam toplum değeri kadar olması çok düşük bir olasılık olduğundan, belli bir ön kabul çerçevesinde, gerçek – ve bilinemeyecek olan- toplum değeri ile örneklemde elde edilecek olan değer arasında “göze alınabilecek bir fark” da belirtilir. Ancak bu farkın en kötü durumda bile toplumu gerçek olduğundan aşırı farklı göstermeyecek düzeyde kısıtlı olarak seçilmesi gerekir. Güven alanının belirlenmesinde bazı katsayılar kullanılmaktadır (z ve t gibi), bu katsayılar yapılması önkabul olarak varsayılmış olan hata oranlarını belirlemektedir ve her doğruluk oranı için belli bir katsayı bulunmaktadır. Gerçek toplum ortalaması ile yapılması kaçınılmaz olan ortalama hatası da “d” simgesi altında kullanılacak ve araştırıcı konusunun özellikleri çerçevesinde bu hatanın düzeyini önceden belirleyerek kabullenecektir. Çok kaba çizgilerle bu hatanın oransal ölçüm yapılmış çalışmalarda – sürekli değişkenler - , değişkenin olası standart sapmasının % 10-50 arasında olması, nitel oranlarla-sıklıklarla yapılan çalışmalarda da kuramsal oran değerlerinin %10- 20’si aralığında olması önerilir. Yine de çalışmanın özelliğine göre bilimsel mantığın dışına çıkmamak kaydı ile bu sınırlarda esneklik söz konusudur, eşdüzeylilik araştırmaları ile üstünlük kıyaslamaları farklı yaklaşımlar gösterebilirler. Bu yönde elde hiçbir bilgi yoksa pilot çalışmalarla kaba bilgilere erişilmelidir. Bunlar için; nicel, sürekli değişkenli çalışmalarda en az 15-20 örnek- aykırı değerlerden arındırılmış - , nitel değişkenli çalışmalarda- sıklık- ise, ilgilenilen olayın olası sıklığına göre en az 50 örnek alınması önerilir. Başka kaynaklardaki bilgilere dayanılarak kestirimle yola çıkılacaksa oranlarla ilgili araştırmalarda kaynakta belirtilen düzeyden daha düşük bir oranı saptamayı hedeflemek gerekir. Varsayımda öngörülecek değerlerin, saptanılması beklenen değerlerden biraz daha “küçük” tutulması, araştırma sonucunda beklenen düzeyden düşük gerçek sonuçlarla karşılaşılırsa bundan “emin olunmasını” sağlar. Varsayımda öngörülecek değerlerden daha büyük gerçek değerlere erişilirse bu sonuçlar, öngörülenden daha da yüksek güvenirlikte olur. Önçalışmanın olguları sonradan toplam örneklem içinde sayılabilir. Çözümleyici araştırmalarda ise “d” simgesi altında öngörülecek olan değer kıyassal kümelerin arasında bulunabilmesi beklenen “farkın” karşılığıdır. Bunun klinik açıdan önem taşıyabilecek bir fark olması varsayımsal kurgular açısından gereklidir. Örneklem sayısı hesaplanması öncelikle 2 temel araştırma özelliğine göre belirlenir: Tanımlayıcı araştırmalar (taramalar) Çalışmada konu edilen özelliğin ve Çözümleyici araştırmalar. (konu değişken / bağımlı değişken) nitelik veya nicelik olması çerçevesinde formüller farklılaşır. Çalışma sonuçlarının güvenirliği (Tip I. Hata) ve çözümleyici araştırmalarda ayrıca değerlendirmenin “gücü” (power) hesaplamalara yansıtılır.Ayrıca hesaplanmış bir örneklem sayısı bazı koşullara göre arttırıp , azaltılabilir. Genel çizgileri ile örneklem büyüklüğü hesaplamasının aşağıdaki özelliklerden duruma uygun olanlar göz önünde bulundurularak yapılması gerekmektedir: • Araştırmanın tanımlayıcı veya çözümleyici olması, • Konu değişkenin sürekli (nicelik) veya süreksiz (genelde oranlar) olması, • Çözümleyici özel yaklaşımların sorgulanması (korelasyon, göreli değerlendirme, sağkalım , vs), • Saptanması amaçlanan özelliğin, beklenen yaklaşık düzeyi (nitelik/nicelik) öncü veya önceki çalışmalardan- (Tanımlayıcı), • Bu beklentide ortaya çıkabilecek “kabullenilebilir” hata payı -klinik yorumu değiştirmeyecek sınırlara göre- (Tanımlayıcı), • Varsayımda saptanması amaçlanan “farklılığın” yaklaşık düzeyi (nitelik/nicelik) (Çözümleyici), • Sonuçların “güvenilirlik” düzeyi (α hata düzeyi: %5, %1, vs),- tek yönlü veya çift yönlü sorgulama yapılabilir - • Sonuç yargıların “güç” düzeyi:1-β hata düzeyi - %80, %90, vs- (Çözümleyici), -tek yönlü değerlendirilir , % 80 kabul edilebilen ve en sık kullanılan düzeydir -, • Çok “konudeğişkenli” araştırmalarda özel (max.) değerlendirme: Birden fazla konu değişkenle çalışılacağı zaman en fazla örnekleme gereksinim gösteren değişken için saptanmış büyüklüğün seçimi, • Varsayımsal çözümlemelere göre düzenleme, çokdeğişkenli çözümlemeler için örneklem artırımı, • Olgu yitimine/yanıtsızlığa/katılım reddine önlem olarak artırım, • Kıyassal kümelerin eşit sayıda olgu içerememesi koşullarında özel hesaplamalar, • Kısıtlı, belirli sayıda “evrenlerde” , örneklem sayısında azaltma. Bu özellikleri göz önünde bulundurarak daha nesnel ayrıntılara girildiğinde; ister tanımlayıcı ister çözümleyici olsun araştırmanın amacının – veya varsayımının – da nesnel olarak belirlenmesi örneklem büyüklüğünün saptanmasında ilk temel aşamadır. Buna ek olarak kabullenilebilir hatanın (tanımlayıcı) veya öngörülen farklılaşmanın (çözümleyici) belirlenmesi gerekir: • En az %4 olabileceği düşünülen anginapektoris sıklığını , % 0.8 hata ile saptamak, • “A” yöntemindeki % 20 lik yan etkiye göre ,”B” yönteminde daha düşük % 10’luk oranı kanıtlamak, • 2 yıllık izlemde beklenen 15 ay medyan sağkalıma göre yeni yöntemle %50 artışı saptayabilme, • Tedaviye bağlı olarak beklenen, en az 30 mmHglik SAB düşüşünü ± 5 mmHg hata ile kanıtlama, Bu açıklamalara yapılması kabullenilebilen α ve gereğinde β hata paylarını da katarak örneklem büyüklüğü hesaplamasının tüm verileri oluşturulur: • Yetişkin erkeklerde ortalama 48 mg/dL olabileceği düşünülen HDL düzeyini ± 5 mg/dL hata payı ile ve % 95 güvenle saptamak, • “A” yönteminde beklenecek % 78 başarıya göre ,yeni ”B” yönteminde en az % 90’a çıkılacağını , % 95 güvenle (α =0.05) ve % 80 güçle (β =0.20) saptamak… Uygun formülle hesaplanan sayı gereğinde düzeltmelerle son durumuna getirilir. Bu temel özellikler çerçevesinde kullanılacak hesaplama yaklaşımları aşağıda irdelenmektedir. ÖRNEKLEME BÜYÜKLÜĞÜ HESAPLANMASI Yukarıda vurgulanan kalıplarda düzenlenen sorgular için örneklem büyüklüğü hesaplamalarını, araştırmanın tanımlayıcı veya çözümleyici olmasına, bu ayrım içinde de konu değişkenin (veya bağımlı değişkenin) nicel veya nitel olmasına göre ayrımlayarak ele alacağız. Farklı çözümleme teknikleri için kullanılabilecek durumlara göre de ayrı yaklaşımlar sunulacaktır. Unutulmamalıdır ki burada verilecek olan yaklaşımlar en temel, en sık karşılaşılan araştırma tipleri için olanlardır. Ayrıntılar girilirse onlarca örneklem büyüklüğü hesaplama yaklaşımı bulunmaktadır. Bazı durumlar için birden fazla – az çok benzer – formülün bulunduğu da bilinmektedir. ÖRNEKLEME YÖNTEMLERİ Sadece örneklem örneklem sayısının yeterli olması elde edilecek sonuçların geçerli ve güvenilir olmasına yetmez , en bunun kadar önemli bir diğer konu da örneklemin yapısının ilgilenilen konu çerçevesinde toplumun yapısına uygun olmasıdır. Uterus kanseri taramasına erkeklerin de veya 3 yaş altında kızların alınması veya Türkiye'de erişkin erkeklerde total kolestrol düzeyi belirlenmesi için sadece Ege bölgesinde 2-3 kasabanın taranması toplumsal gerçekleri hiç bir şekilde yansıtmayacaktır. Bu nedenle örneklem yapısının belirlenmesi, planlanması ve doğru eldesi yaşamsal önem taşır. Genel anlamı ile örnekleme süreci, yöntem açısından iki ana gruba ayrılabilir; 1) Bilinçli (yargısal) örnekleme: Olasılık ilkelerine dayanmayan, doğası gereği yanlılık içerebilecek derlemeler. 2) Rastgele (olasılıklı temelli) örnekleme: Olasılık ilkelerine dayanarak örneklerin belirlenmesi. BİLİNÇLİ ÖRNEKLEME Amaçlı veya “olasılık dışı” da denebilen bu yaklaşımda, rastlantı ilkesine uymak yerine, seçilecek örneklerde, belli ön yargılara, kabullere dayanılarak belli özelliklerin aranmasıdır. Bundan dolayı bu tür örnekleme genelde simgeleme yeteneği açısından güvenilir değildir. Bilinçli örneklemede temel 3 tipten söz edilebilir: a- Monografik örnekleme b- Yoğunluk yöntemi c- Güdümlü örnekleme a- Monografik örnekleme: Sadece eldeki bilgilere ve sezgilere dayanılarak, simgelenebileceği kanı ve yargısı ile bir toplumun içinden bir alt grubun veya birkaç bireyin seçilmesidir. (Eşdüzenli) Homojen toplumlarda belli ölçüde yararlıdır, ancak genel olasılık ilkelerine uyumsuzluğu sonuçların doğruluğunu etkiler. Buna karşılık bu yaklaşım çerçevesinde, kolaylık sağlamak amacı ile ve hiçbir önyargı güdülmeksizin seçilmiş kısıtlı örneklerden gerçekleştirildiklerinde oldukça bilgi edinme değerli yaklaşımları sonuçlara uygun koşullarda erişebilmektedir. Burada araştırmacı kimlerin seçileceği konusunda kendi yargısını kullanır ve araştırmanın amacına en uygun olanları örnekleme katar. Örnek grup toplumun tipik simgesi sayılacağından içinde ortalama ve uç örneklerin bulunmasına çalışabilir. Özellik farkları çerçevesinde alt tipler ayrımlanabilmektedir: 1. Aşırı veya aykırı durum örneklemesi, 2. Maksimum çeşitlilik örneklemesi, 3. Benzeşik örnekleme, 4. Tipik durum örneklemesi, 5. Kritik durum örneklemesi, 6. Kartopu veya zincir örnekleme, 7. Kolay ulaşılabilir durum örneklemesi. Bunlarla ilgili ayrıntılar uygun kaynaklardan elde edilebilir. b- Yoğunluk yöntemi: Dağınık düzenli toplumlarda, bir özelliğe ait ölçümün, sadece o özelliği gösteren bireylerin yoğun olarak bulunduğu bir toplumun bölümünden yapılan örneklemede saptanmasıdır. Toplumda payı önemsiz küçük gruplar örnek içinde temsil edilmemektedir. Örneğin: Yetişkinlerde kalp hastalığı sıklığının saptanmasında sadece 40-65 yaş arası erkeklerin alınması gibi. Sonuçlar, eğer diğer koşullar yerine getirildi ise belli düzeyde güvenilir bilgiler üretebilir. c- Güdümlü örnekleme: Toplumu simgelemek üzere güdümlü olarak bir özel kümenin alınmasıdır. Sonuçlar istatistik olarak değer taşımayabilir hatta ne yazık ki bu tür yaklaşımlar amaca uygun sonuçların özellikle eldesi için kullanılabilmektedir. RASTGELE ÖRNEKLEME Bir evrenden, uygun büyüklükle, istatistik hesaplarla evreni simgeleme özelliği taşıyan ve tamamen rastgele yöntemle bir örneklem seçmek olasıdır. Buna “seçkisiz örnekleme” veya “basit rastgele örnekleme” de denebilmektedir. Uygun sonuç, toplumun tüm bireylerine örnek grubuna katılma olanağının tanınması ile sağlanır. Tam bir rastlantısallığın, doğal süreçler çerçevesinde, toplumdaki özel yapısallığı, örnekleme de oldukça yansıtacağı düşünülmüştür. Ancak dağınık düzenli toplum özelliklerinin araştırılmasında belli kolaylıklar ve daha fazla doğruluk/güvenirlik sağlanması amacı ile özel tipler oluşturulmuştur. Rastgele olasılıklı örneklemenin belli başlı türleri: a- Basit rastlantısal örnekleme b-Dizgeli (sistematik) örnekleme c-Katmanlı –kotalı rastgele örnekleme d-Küme örneklemesi e-Çok basamaklı örnekleme a- Basit rastlantısal örnekleme (Randomsampling ): Rastgele örnekleme kavramına uygun olarak toplumdaki her bireye eşit seçilme şansı tanıyan bir yöntemdir. Eş düzenli toplum özelliklerinde uygulanması daha sağlıklı olur, dağınık düzenli toplumlarda alt toplumlar içine uygulanır. Amaç rastlantısal seçim (kura, piyango) yapmak olduğundan ilk ana ilke olarak gereğinde tüm toplum birimlerinin listelenebilmesi seçilme olasılıklarının numaralanması ve mekanik (yansız) olarak seçim yapılması gerekmektedir. Belli bir sıra akışı ile gelen olguların bulunduğu tıp araştırmalarında rastgele belirlenmiş sıra numaraları kullanılır. Rastgele terimi körlemesine bir rassallığın belirtisi değildir. Bilinçli ama yansız bir denetim, toplum içindeki dağılımların örneklem içine de yansıması şansını arttıracak ve gerçek rastgelelik toplumun karmaşık yapısının benzeri olmak çerçevesinde ortaya çıkacaktır. Tüm evrenin numaralanması, olabildiğince eşdüzenlilik olmaz ise iyi simgeleme yapılamaması, çok yaygın bazen çok büyük sayıda örnek gereksinimi olması bu yöntemin yansızlık ve iyi simgeleme niteliklerini zedeler dolayısıyla gereğinde, diğer örnekleme türlerinin aşamalarında geçiş olarak kullanılır. Basit rastlantısal örneklemede örnekler özgün yöntemlerle belirlenir ve bu işleme “Randomizasyon” (rassalama) adı verilir. Özelikle klinik deneylerde büyük önem taşıyan bu yaklaşımla ilgili daha fazla ayrıntı ilerde verilmektedir. En basit durumu ile basit rastİantısal örnekleme ilgilenilen konu değişken dışında ikincil etkenler göz önünde bulundurmamaktadır. Basit rastgelelik, yüksek sayıdaki ( > 500) örneklemlerde, çok ender olmayan ikincil etkenlerin dengesini sağlayabilir. b- Dizgeli (sistematik) örnekleme: Rastgele örnekleme yönteminde, toplum listesi ve örneklerin saptanmasının zorunluluğunun yanı sıra rastgele olarak bazı toplum kesimlerinden hiç örnek alınmayabilir, bu da özellikle değişik düzenli toplumlarda simgelemeyi bozar. Bunları gidermek için bireyleri sıralı durumda bir toplumdan önce rastgele bir birey ile başlayarak yine yansız nesnel ön kabulü yapılan rastgele bir dizge ile örnekler alınmaya devam edilir. Bu dizge çeşitli koşullara göre örnek özelliğini değiştirmeyecek bir dizge olmalıdır. Ayrıca örneklemeyi oluşturacak bireyler topluma rastgele dağılmış bulunmalıdır. Bu yöntem tüm topluma ait numaralama ve kura koşulunu büyük ölçüde ortadan kaldırmaktadır. Dizgeli örneklemede olanaklı olgular listesi-sırasından öngörülmüş bir “k” sayısı – örnekleme aralığı denecektir – katlarına göre olgu seçilir. İlk başlangıç olgusunun sırası rastgele belirlenebilir. Örneğin 480 olgudan 20 kişilik örneklem çekilecekse 480/20 = 24 olgu aralıklık bir dizge oluşturulabilir. İlk olgu 1-24 sayıları arasından rastgele belirlenip sırası ile buna her 24 ek sayıda gelen olgu alınır – devamında başa dönüşle uygun sayıdan seçim sürdürülür. Daha biassız ve homojen seçim sağlar ancak yine ikincil etkenler göz önünde bulundurulmamıştır. c- Katmanlı rastgele örnekleme ( Stratifiedsampling) : “Katmansal etken”,sonucu oluşturduğu, değiştirdiği düşünülen ve özelliği betimlenmeye, kanıtlanmaya çalışılan “neden” dışında, sonucu etkileyebilecek diğer özellikler yani etkisi giderilmeye çalışılan “karıştırıcı etkenlerdir” . Gereğinde ikincilkarıştırıcı etkenlerin de dengelenmesi için örneklemin çeşitli ikincil etken katmanlarına/ alttoplumlarına da dağıtılması gerekir. Örneğin bir araştırmada kadınlarla erkeklerin sorgulanan etken-sonuç düzeninde zaten farklı yanıt verebilecekleri düşünülüyorsa, örneklemde cinsiyetin katman olarak düzenlenmesi gerekecektir. Toplum dağınık düzenli ise ve alt gruplar genelde araştırılan özelliği etkileyebiliyorlarsa önce bu alt gruplar ayrılır ve toplum içindeki paylarına-kotalarına göre katmanlardan rastgele örnekleme ile örnek olgu alınmasına geçilir. . “Katman” ların bazen toplum içindeki payları bellidir, buna o katmanın “kotası” denir Örneğin toplumda kadın / erkek 1 / 1 % 50 - % 50 oranındadırlar. Eğer katmanların toplum içindeki payı saptanamıyor ise her katmandan eşit örnek alınır. Sonucu etkileyebilecek ikincil etkenlerin toplum payları, örnekleme denetimli yansıtılarak, rastgele seçim; katman’lara göre yapılır. Örneklemin katmanlara göre belirlenmesi denetimsizlik nedeni ile çok değişkenli değerlendirme yapmak zorunluluğunu kuramsal olarak azaltır hatta araştırmanın varsayım özelliğine göre ortadan kaldırabilir. Şekil 10.1.- Katmanlı-kotalı örneklemenin şematizasyonu Toplumsal sonucu belirlenecek bir özellik, eğer belli bir cinsiyet açısından belirgin yokluk göstermiyorsa (ör.: prostat ca.) her iki cinsiyeti eşit içererek toplumsal düzeyi yansıtabilir. Katmanların konu açısından özellikleri aynı olmak zorunda değildir ( Ör.: Kadın / erkeklerde tip 2 diabet ) ve her katman için ayrı değerlendirme de gerçekleştirilebilir ve " toplumsal sonuç" üretmek kotalarına uygun olarak örneklemde yer alan katmanlar toplamında gerçekleşebilir. Örneğin Türkiye genelinde metaboliksendrom sıklığı saptanacaksa örneklem, hem coğrafi bölge, hem özgün yaş aralıkları hem cinsiyet katmanları, hem kır/kent ayrımı, vs gibi bu sendromun sıklığının farklı olabileceği etkenler açısından ülkedeki gerçek kotalarına göre oluşturulmalıdır. Kotaları bilinmesine karşın örneklemde yansıtılmadan yer alan katmanlar için çeşitli düzeltmelerle – güvenilirliği azaltan – kestirimlere gidilmeye çalışılır. Kotalı ve katmanlı bir örnekleme geniş evren havuzlarından – örneğin büyük hasta kümelerinden –uygun paylarla belirlenebilir. Her katmanlararası kesişimin bilinmesi ve örneklem atanmasında her birine rastgelelik uygulanarak olguların belirlenmesi gerekir. Katmanlı rastgele örnekleme yapılıyorsa hesaplanmış toplam örneklem sayısı, katmanlara, kotalarına uygun olarak dağıtılır ancak katman olgu sayılarının, bunlar bağımsız gruplarmışcasına kıyaslamalar yapmaya yetmeyeceği unutulmamalıdır. Katmanlı örnekleme için başlangıçta hesaplanan örneklem hacminin de katman sayısına göre arttırılması gereğini hatırlatalım. Örneğin cinsiyetten ve 40 yaş altı/üstü olmaktan etkilendiği bilinen bir tedavi etkinliği ile ilgili araştırma yapılacağını varsayalım: kesişim altkatmanlar oranlarının konu evren çerçevesinde E_<40 : % 36 E_40+ : % 15 , K_<40 : % 32 , K_40+ : % % 17 olarak saptanmış olduğu biliniyorsa , ve 2 farklı tedavi kümesinin belli sonuçsal özellikler açısından kıyaslanmasında kıyas kümelerinin en az 75 er kişi olması gerektiği hesaplanmışsa her tedavi kümesi: E_<40 27 (=75*0.36) , E_40+ 12 , K_<40: 24 , K_40+: 13 olgu içermelidir. Bunların kıyassal 2 kümeye dağıtımı ise olguların gelişlerine göre randomize olarak oluşturulabilir d-Küme örneklemesi (Cluster sampling) : Çok büyük toplumların kavranması -ve katmanlara ayrılmasında -sonuçta tekil bireylere erişilmesinde büyük zorluklar çıkabilir. Araştırılacak toplumda doğal olarak oluşmuş veya farklı amaçlarla yapay olarak oluşturulmuş, kendi içinde belirli özellikler açısından benzerlik gösteren olgu kümelerinin (ev, okul, sokak, vs) olması durumunda küme örneklemesi kullanılır ve kolaylık sağlar. Böylece ilk aşamada tekil olgular değil özel-benzeş olgu kümeleri seçilir ve bunların içindeki tüm olgular örnekleme katılır. Böylece birimlerin rastgele kendiliklerinden oluşturdukları gruplar (küme) ana rastlantı birimi olarak alınır ve bunlardaki tekil bireylere göre saptama yapılır. Bu saptamada da gereğinde rastgele örnekleme kullanılabilir. Örneğin; kente tümüyle rastgele dağılmış konutlardaki rastgele bireyler yerine, rastgele sokaklardaki (küme) tüm konutların bireyleri seçilebilir. e-Çok basamaklı örnekleme (Multi stagesampling): Küme örneklemesinin, diğer örnekleme türleri ile beraber, aşamalı olarak çok büyük ve karmaşık toplumlar üzerinde uygulanmasıdır. Toplum birkaç basamak halinde giderek küçülen alt gruplara katmanlı ve küme örneklemeler ile bölünür bunlardan rastgele örnekler alınarak toplum temsil edilir. Kümeler iyi tanımlanmış ve konu değişkene uygun özellikte ayrımlanmış olmalı , küme içi olgu sayısı ve yapısına ilişkin bilgi yeterli olmalıdır. Toplam küme sayısının en az 1/5 kadar küme seçilmesi - örneğin 81 ilden en az 17 il - ve bunlardan elde edilecek olgu sayısı da toplam kümeler nüfusunun en az 1/10000 i olması tercih edilmelidir. Farklı özelliklerle tanımlanmış basamaklı “kümelemeler” oluşturulabilir ve küme içinde olgu seçimi düzeyinde rastgele seçim yapılabilir. Bu tip örneklemelerde adına " Desen etkisi : Designeffect " denen ve örneklem varyansının toplumunkinden çok farklı olabilmesine neden olabilen bir bias tipine dikkat edilmeli ve bu çerçevede de örneklem sayısı artırımına gidilmelidir. BÖLÜM XIII VARSAYIM DEĞERLENDİRMESİ I PARAMETRİK KIYASLAMA YÖNTEMLERİ Farklı araştırma tasarımı düzenlerine göre kullanılabilecek yöntemler aşağıda değerlendirilecektir TOPLUM- ÖRNEK KÜMESİ ORTALAMALARININ KIYASLAMASI Bir örnek kümesinin ortalamasının, topluma ilişkin ortalama ile kıyaslanması sürecinde toplum varyansının (σ2) bilinip bilinmemesine göre, farklı işlemler yapılır: 1) Topluma ait varyans biliniyorsa, Çok geniş örneklemli ve yapısal açıdan da toplumu simgeleyebileceği kabul edilen çalışmaların sonunda toplum değeri olarak kabul edilebilecek bir ortalama ve varyansın elde bulunduğu ve bir örnek kümesi ortalamasının , bu toplum ortalamasından farklılığının yargılanacağı zaman kullanılır. Veriler; :µ ±σ Toplum Örnek kümesi Kıyaslama; t= µ−x σ : x ± SD, n özelliklerindedir. formülüne göre yapılır. n Görüldüğü gibi topluma ait varyans bilindiğinde, örnek kümesinin standart sapması kullanılmamaktadır. Yorumlama "t" tablosunda sonsuz serbestlik derecesi için olan kritik değere göre yapılacak, - “t” nin 1.96'dan büyük olmasından itibaren anlamlı farktan söz edilecektir -. Örnek: 60 yaş kümesi erkeklerde, yaşa bağlı işitme kaybının 19 ± 6 dB olduğu bildirilmektedir. Aynı yaş kümesindan, 45 işçide bu kayıp 26 ± 8 dB bulunmuştur bu kümenin ortalamasının toplum düzeyinden farklı (yüksek) olduğu söylenebilir mi? Veriler: Varsayım: µ ± σ 19 ± 6 dB, H0: x = µ H1: x ≠µ x ± SD, n 26 ± 8 dB, 45 t= 19 − 26 = 7.86 6 45 t(∞,0.001) = 3.29 p < 0.001 dir. Bu durumda H0 reddedilir, H1 kabul edilir. Sonuç: Örnek kümesinin işitme kaybı topluma göre çok ileri düzeyde anlamlı olarak daha yüksektir. 2) Topluma ilişkin varyans bilinmiyorsa Bilgi olarak toplumun sadece ortalaması elde bulunmaktadır ve bu değer bir örnek kümesi ortalaması ile karşılaştırılmaktadır. Bu tür kıyaslamalar özellikle toplum değeri olarak medikal bir kritik sınırın öngörülmesi durumunda gerçekleştirilir. Veriler; Toplum :µ Örnek kümesi Kıyaslama; t= : x ± SD, n biçimindedir. µ−x SD n formülüne göre yapılır. Örnek kümesinin standart sapması kullanılmakta ve yorumlamada da serbestlik derecesi olarak "n-1" in kritik değerlerine bakılmaktadır. Örnek: Belli operasyonel karar açısından bir arterin çapının 8 mm olması gereği bildirilmiştir. 16 kişilik bir hasta kümesinde bu ölçü 8.20 ± 0.68 mm bulunmuştur. Hastaların ortalamasının kritik sınırdan farklılığını yargılayınız. Veriler: µ 8 mm, x ± SD, n 8.2 ± 0.68 mm, 16 Varsayım: H0: x = µ t= H1: x ≠µ , 8.2 − 8 = 1.17 0.68 16 t(15,0.05) = 2.131 p > 0.05 dir. H1 reddedilecek; H0 kabul edilecektir. Sonuç: Örnek kümesi ortalaması toplumdakinden farksız bulunmuştur. İKİ ÖRNEK KÜMESİNİN ORTALAMALARININ KIYASLANMASI İki örneklem kümesinin ortalamalarının kıyaslamasında parametrik seçenek ancak iki kümenin de normal dağıldığının saptanması ile başlatılacaktır. Eğer bu beklenti doğrulandı ise ikinci aşama küme varyanslarının eşdüzeyliliğinin (F değerlendirmesi, Levene veya Bartlett testi) saptanmasıdır . Varyansların farklı veya eşdüzeyli bulunmasına göre çözümleme yaklaşımları değişecektir. A) Küme Varyansları eşdüzenli Küme verileri ve ön değerlendirme şu şekildedir; I. küme: n1 , x 1 ± SD1 II. küme: n2 , x 2 ± SD2 Daha önce açıklandığı gibi , F= SDB2 BüyükVaryans = SDK2 KüçükVaryans F < Ftablo ise ile varyanslar eşdüzenlidir. Kıyaslamada kullanılmak üzere önce "ortak varyans" olarak adlandırılan değer hesaplanır (SD2): ((n1 − 1) * SD12 ) + ((n2 − 1) * SD22 ) SD = n1 + n2 − 2 2 ve t= kıyaslama ; x1 − x2 SD 2 SD 2 + n1 n2 formülü ile gerçekleştirilir. Ortak varyansın değeri doğal olarak gerçek varyansların arasında ve denek sayısı büyük olanınkine yakın bir değerdir. Bulunan t değeri (n1 + n2 - 2) serbestlik derecesine uyan kritik t değerleri ile kıyaslanarak yorumda bulunulur. Anlamlılık söz konusu ise gerçek ortalamalara bakılarak karar ayrıntılandırılır. Örnek: Fibrinojen düzeyi 41 sağlıklı yetişkinde 306 ± 48 mg/dl, 17 kronik böbrek yetmezliği vakasında ise 348 ± 64 mg/dl bulunmuştur. Kümelerin ortalamasını kıyaslayınız, yorumlayınız. Öncelikle F testi ile küme varyansları kıyaslanır; 64 2 F = 2 = 177 . ; (16, 40) serbestlik derecesi için Ftablo = 2.10’dur. 48 F < F tablo olduğundan varyanslar eşdüzeyli kabul edilir. (48 2 * 40) + (64 2 * 16) = 1646 ; SD = 41 + 17 − 2 2 t= 348 − 306 1646 1646 + 41 17 . = 358 değerlendirme sd= 56 nın kritik t değerlerine göre (30 dan büyük serbestlik dereceleri için yakın tamsayı serbestlik derecelerine bakılabilir ancak istatistiksel yazılımların doğrudan “p” değerlerini verdiklerini anımsatalım) p < 0.001 bulunacaktır. Sonuç: Kronik böbrek yetmezlikli vakaların fibrinojen düzeyi, sağlıklı vakalara göre çok ileri düzeyde anlamlı olarak yüksek bulunmuştur. B) Küme Varyansları farklı sayılıyor Daha önce belirtilmiş olan yöntemle varyanslar kıyaslanır ve farklı bulunur ise ortalamaların kıyaslanması için ortak varyans oluşturulmadan gerçek küme varyansları kullanılır, serbestlik derecesi ise özel olarak oluşturulur. “sd” için bu kestirimle değerlendirme yapmak Aspin-Welch testi veya Smith-Satterthwaite işlemi olarak adlandırılır. t= x1 − x 2 SD12 SD22 + n1 n2 formülü kullanılır. (ortak değil gerçek varyanslar kullanılmıştır.) Kıyaslama için (n1 + n2 - 2) serbestlik derecesine değil, hesaplanacak özel bir serbestlik derecesinin kritik karşılıklarına bakılır. Bu serbestlik derecesi; (( SD12 / n1 ) + ( SD22 / n2 ) 2 sd = (( SD12 / n1 ) 2 /(n1 − 1)) + (( SD22 / n2 ) 2 /(n2 − 1)) * e eşittir. sd*, sd’den (n1 + n2 - 2) küçüktür, dolayısı ile (n1 + n2 - 2) serbestlik derecesinin karşılığı olan t değerlerinde "anlamlılık" bulunmamış ise sd*, hesaplanmadan bile "ortalamalar arasında fark bulunamadığı" sonucuna varılmalıdır. t değeri ( n1 + n2 - 2) serbestlik değerine göre "anlamlı düzeyde" görünüyor ise, gerçek sonuç için sd* hesaplanmalı ve yorum buna göre yapılmalıdır. sd* değeri genellikle tam sayı olarak bulunmaz, bu nedenle "Küçük olan tam sayı" değerine göre yorumlama yapılır. Örnek: Açlık kan şekeri ortalaması 25 sağlıklı yetişkinde 96 ± 10 mg/dl, 16 Tip-2 diyabet olgusunda ise 148 ± 20 mg/dl bulunmuştur. Kümelerin ortalamasını kıyaslayınız, yorumlayınız n1 = 25 x 1 ± SD1 = 96 ± 10 n2 = 16 x 2 ± SD2 = 148 ± 20 F= t= 400 = 4; Ftablo(15, 24) = 2.11 < 4 olup varyanslar farklıdır. 100 148 − 96 100 400 + 25 16 = 9.65 n1 + n2 - 2 = 39 serbestlik derecesine göre p < 0.001 olup ileri düzeyde anlamlı fark görülmektedir ,geçerli yargı için sd* hesaplanıp yorum yapıldığında; ((100 / 25) + (400 / 16)) 2 = 19.86 Sd = ((100 / 25) 2 / 24) + ((400 / 16) 2 / 15) * Küçük tam sayı olarak 19 serbestlik derecesi alınacaktır. t(19,0.001) = 3.88 < 9.65 ile yine ileri düzeyde anlamlı fark bulunduğu ve hastaların ortalamasının sağlıklılara göre yüksek olduğu sonucuna varılacaktır. Aşağıdaki şekilde örnek verilerinin özet istatistiksel bilgiler ve sonuç yorumla birlikte yansıtılması görülmektedir. 2 bağımsız kıyaslamasında kümeden parametrik elde edilen olmayan (Wilcoxon rank sum) testi” kullanılır. sürekli seçenek değişken olarak düzeylerinin “Mann-Whitney U Şekil 7.2. İki örneklem kümesi ortalama kıyası grafiği EŞLENDİRİLMİŞ DİZİLER Bu kavram içinde görünürde iki ölçümsel dizi (veya daha fazla) bulunmasına karşın gerçekte tek bir küme, buna karşın her küme ögesinin birden fazla "durumda" gösterdiği değerler bulunmaktadır. Örneğin aynı kişilerin yemek öncesi -yemekten 30 dakika sonraki - yemekten 2 saat sonraki - kan şeker düzeyleri gibi. Her konumdaki değer, birbirinin "Eşi" kişiler (aynı kişi) üzerinde fakat "ayrı konumlarda" elde edilmiştir. Araştırma, durumdan duruma fark eden "etken"in, gerçek bir farklılaşma yaratıp yaratmadığını denetlemek için yapılmaktadır. İki durum arasındaki farkın kuramsal olarak "0" olması, etken ögenin farklılaşım oluşturmadığını gösterecektir. Şu halde her örnek olgu için "durumlar arası" değer farklarının belirlenmesi ve bu "farklar dizisinin", farksızlık demek olan "0" ortalamalı kuramsal “toplum” değeri ile kıyaslanması gerekir. Fark dizisinin "0" dan anlamlı olarak farklı bulunması, gerçek bir fark oluştuğunu, başka bir deyişle etkenin gerçek bir işlevi olduğunu gösterecektir. Fark dizisi oluşturulurken her olgu için aynı olmak koşulu ile çıkartmanın yönü araştırıcıya kalmıştır; (1.2.- veya 2.-1) .Bir diğer önemli nokta da farkların cebirsel işaretlerinin göz önünde bulundurulmasıdır. Buna bağlı olarak "0" olan, eksi ve artı işaret taşıyan fark değerleri bulunabilir. Bilgiişlem ortamında yapılan hesaplamalarda bu koşullar doğrudan sağlanmaktadır. Örnek bir düzen şöyle oluşmaktadır; Olgu 1. 2. Durum Durum Durumlar arası fark 1 x11 x12 d1 = x11 - x12 2 x21 x22 d2 = x21 - x22 ... ... ... ... n xn1 xn2 dn = xn1 - xn2 Fark değerlerinin ortalama ( d ) ve standart sapması (SDd) hesaplanır. Bu işlem esnasında da değerlerin cebirsel işaretleri önemsenir. Fark dizisinin ortalaması doğal olarak, iki konum dizisinin gerçek ortalamalarının farkı kadar bulunacaktır. Son aşama ise n kişinin farklı konumlardan elde edilmiş fark dizisi değerini, "0" farksızlık toplumu ortalaması ile kıyaslanmaktadır. Değerlendirme "eşlendirilmiş diziler için Student's t testi" ile gerçekleştirilir. Yöntemin doğru sonuç vermesi için fark dizsinin normal dağılıma uygun olması gerekmektedir bu çerçevede DK<%30 değerlendirmesi karar için kullanılmamalıdır -. Konumlar arası değişimi yargılamada kullanılacak olan formül : t= d −0 d * n = SDd SDd n Elde edilen t değeri (n-1) serbestlik derecesine göre yorumlanır. Anlamlılık bulunması durumunda etkinin yönü, 1. ve 2. durum dizilerinin gerçek ortalamalarına bakılarak yorumlanır. Değerlendirmede 2 den fazla konum da bulunabilir (ameliyat öncesi, ameliyat süresinde, ameliyattan 1 saat sonra, 24 saat sonra gibi) ve birbirini izleyen her konum için eşlendirilmiş dizi uygulaması yapılabileceği gibi, konumlardan sadece birine göre etki bulunup bulunmaması önem taşıyabilir ve değerlendirme sadece bu konuma göre yapılabilir:(Ameliyat öncesi - 1 saat sonra , Ameliyat öncesi - 24 saat sonra, vs) ancak esas olarak aşağıda kısaca değinilecek olan çözümleme yöntemi kullanılarak genel anlamda bir farklılaşma olup olmadığı sorgulanır. Örnek: Vücut ısısına etkisi sorgulanan – düşüreceği varsayılan -bir ilaç 9 kişi üzerinde kullanılmıştır. Hastaların ilacı almadan önce ve sonraki vücut ısıları (°C) aşağıdadır. İlacın etkinliğini denetleyiniz - fark dizisi normal dağılıma uygun bulunmuştur-. Hasta Önce Sonra Fark (d) S - Ö 1 39.5 38.1 1.4 2 38.3 36.7 1.6 3 38.4 37 1.4 4 38.5 38.7 -0.2 5 39.5 38.6 0.9 6 38.2 38.7 -0.5 7 39.1 38.5 0.6 t (8,0.05) = 2.306 8 38 38 0 p < 0.05 9 38.3 37.2 1.1 X 38.64 37.94 SD ± 0.57 ± 0.78 0.7 ± 0.769 t = 0.7 * √9 / 0.769 t = 2.73 2.73 > 2.306 yani t > ttablo olduğuna göre ilacın önceden sonraya anlamlı bir etki gösterdiği, önceki değerler ortalaması = 38.64 sonraki değerler ortalaması = 37.94 olduğuna göre de etkinin "azaltım" yönünde olduğu sonucuna varılmaktadır. 8. hastanın yerinde önceki ısısı = 42 ,sonraki ısısı = 36.6 , d = 5.4 olan başka bir hasta düşünelim. Vücut ısısı fark göstermemiş bulunan ilk 8. hasta yerine, durumu ilacın etkisi yönünde (hem de fazlası ile) olan bu yeni olgu yerleştirildiğinde önceki değerler ortalaması yükselecek (39.08 e çıkmaktadır), sonraki değerler ortalaması ise düşecektir (37.78 e düşmüştür). Buna bağlı olarak da t değerinin daha da anlamlı bir düzeye erişeceği düşünülebilir, çünkü farklar ortalaması da 1.3 e erişmektedir. Halbuki farkların standart sapması SDd = 1.699 a çıktığından değerlendirmede , t = 13 . * 9 / 1699 . = 2.29 < t(8, 0.05) bulunmakta, sonuç olarak bu yeni "ve gerçekten ilaçtan etkilenmiş" olgu katıldığında ilaç etkisiz bulunmaktadır. Tüm vakalarda etki aralığı (d) "-0.5 - 1.6" arasında değişirken "5.4" gibi bir fark değeri, etki yönünde olmasına karşın SDd’ nin aşırı büyümesini, normal dağılım özelliğinin yitirilmesini ve anlamsızlığı getirmiştir böylece - önceki sonuç da göz önünde bulundurulduğundahiç beklenmemesi gerek bir sonuçla karşılaşılmaktadır. Anlaşılacağı üzere aşırı değerlerin varlığı ve yanlış değerlendirme yöntemi seçimi hatalı sonuçlar alınmasına neden olmaktadır. Bu çerçevede fark dizisinin de normal dağılıma uygunluğu durumunda parametrik yaklaşım uygulanması seçilmelidir - bu yeni düzenleme ile yapılan değerlendirme parametrik olmayan yaklaşımla anlamlı farklılığı gösterebilecektir ; Wilcoxon testi , p=0.021 -. 2 konumlu eşlendirilmiş dizilerde sürekli değişken düzeyleri farklarının değerlendirilmesinde parametrik olmayan seçenek olarak “Wilcoxon işaretli sıra sayıları testi” kullanılır. Bir örneklem kümesi üzerinde birden çok konumdaki değişim yargılanabileceği gibi, birden çok konumu bulunan birden çok kümenin bulunduğu araştırmalar da kurgulanabilir. Böylece değerlendirilebilecek “farklılaşım” konumları da artacaktır; her küme için konumlar arası değişim olup olmadığı, kümeler arasında her konumda ortalama farkı olup olmadığı, kümelerin genel değişim özellikleri arasındaki farklar ve kümeler arası konum farkları farkı gibi çok ayrıntılı irdelemeler yapılabilir. Bu tür yaklaşımlar veya en basitinden 2 den çok konum arasındaki farklılaşmalar genel olarak irdelenen tek kümeli araştırmalarda “Tekrarlı ölçümler varyans çözümlemesi” (Repeated measures ANOVA) yöntemi ile değerlendirme yapılır. Şekil - 7.3. 3 kümenin 5 konumlu izlemi grafiği BÖLÜM XIV VARSAYIM TESTLERİ II PARAMETRİK OLMAYAN VARSAYIM TESTLERİ Nicel verilerde kullanılan parametrik testlerin formülleri bu verilerin belli dağılım biçimlerine sahip oldukları düşünülerek oluşturulmuştur, (normal dağılım, t dağılımı gibi) dolayısı ile dağılımların farklı olduğu veri gruplarını (varyanslar farklı) veya dağılımın tipinin bilinmediği (veri sayısı azlığından veya ölçümlerin dengesiz dağılımından kaynaklanabilir) grupları değerlendirirken bu testlerin kullanımı yanlış sonuçlar getirebilir. Parametrik testler dağılımsal önkabuller çerçevesinde yapılandırılmışken parametrik olmayan testlerin bu tür "parametrik" temelleri dolayısı ile kısıtlılıkları yoktur bu nedenle de "dağılımdan bağımsız (distribution free) testler" adını alırlar. Bu tip testler değerlendirmedeki verilerin büyüklük sıralamasındaki sıra numaralarına göre işlem görürler dolayısı ile de "sıra sayı toplamı" testleri (rank sum) olarak da adlandırılırlar. 3 sayısal değer varsayalım : 1 , 3 , 6 ; Bunların ortalaması 3.33'dür ve "6" değeri 3. sıradadır , büyüklüklere göre sıra numarası verdiğimizde (1.,2.,3.) sıra numaraları toplamı da 6'dır. Dizideki 6 değerinin yerine 56 bulunsa idi ortalama 20'ye çıkacaktı dizinin SD değeri çok büyüyecekti halbuki 56 yine büyüklük açısından 3. sırada olacak ve sıra sayıları toplamı yine 6 olacaktı. Anlaşılacağı üzere sıra sayısı tabanlı testler gerçek değerlerin büyüklüklerinden etkilenmemektedirler dolayısı ile normal dağılmayan, uç değerler içeren veri setlerinde çok daha güvenilir sonuçlar verirler. Bu temel mantıksal yaklaşımla kurgulanan parametrik olmayan testler, kullanımlarına uygun veri setlerinde kullanıldıklarında parametrik testlerin kendi dağılımsal taban kısıtlılıkları nedeni ile anlamlılık bulamadığı durumlarda anlamlı sonuçlar bulabilme avantajına sahiptirler. Parametrik olmayan testler kıyassal kümelerin "ortalamalarını" kıyaslamazlar, genel anlamda büyüklük düzenlerini kıyaslarlar dolayısı ile normal dağılmayan verilerin bulunduğu araştırmalarda - gereğinde ortalama ve SD de eklenerek - medyan ve ÇAĞ (çeyreklikler arası aralık; IQR) değerlerinin sunulması gereklidir. Sonuç olarak, uç değerde yapay nicel değerler bulunan veya verilerin dağılım biçiminden kuşku duyulduğu durumlarda nicel özelliklerin değerlendirmesinde kullanılan testlere parametrik olmayan (non-parametrik) testler denir. Parametrik olmayan istatistiklerin olumlu yönleri şunlardır; • Öğrenimi ve uygulaması kolay ve hızlıdır. • Sınıflama sıralama özelliğine göre değerlendirildiğinden veri ölçüm ve toplamasında kolaylıklar getirebilir. • Parametrik testlerin gerektirdiği katı uygulanabilirlik koşullarını gerektirmezler. Bu olumlu taraflarına karşın duyarlılıkları daha düşüktür yani gerçek farkların ortaya çıkarılmasında (test tipine göre) parametrik testlere göre biraz daha zayıftırlar. Bundan dolayı uygun koşullarda öncelikle parametrik testlerin kullanımına öncelik verilmektedir. Ölçümsel veriler için çeşitli uygulama tiplerinde kullanılabilecek belli başlı parametrik olmayan testler şunlardır; 1) Toplum ortancasına göre, grup verilerinin kıyaslanması (işaret testi) 2) İki grup verilerinin kıyaslanması (Mann-Whitney U testi) 3) Varyans analizi (Kruskal-Wallis testi) 4) Eşlendirilmiş dizi yargılaması (Wilcoxon testi) İŞARET TESTİ Bir grubun verilerinin bir toplum ortalaması ile kıyaslanması için kullanılır. Gerçekte amaç, grubu kuramsal bir ortanca değer ile kıyaslamaktır ama eğer toplum normal dağılım gösteriyor ise zaten ortanca ve ortalama çakışık sayılabileceğinden kıyaslama toplum ortalamasına göre yapılıyor sayılabilir. Yöntem, veri dizisinde, kuramsal değerden büyük olanlara "+" işareti, küçük olanlara "-" işareti verilerek gelişir. Ortalama ile aynı değerdekiler çalışmadan çıkarılır. Bundan sonra "+" işaretlilerin sayısı (n+) ve "-" işaretlilerin sayısı (n-) saptanarak, süreklilik düzeltilmesi yapılmış bir χ2 - χ2 testi ile ilgili ayrıntılar izleyen bölümde incelenecektir - formülünde yerine konur elde edilen χ2 değeri 1 serbestlik derecesine göre yorumlanır. χ = 2 ( (n +) − (n −) − 1) 2 ( n + ) + ( n −) Örnek: Aşağıda 14 kişilik örnek grubunun kalp vurum sayıları, 80 v/d kuramsal ortalamasına göre irdelenmektedir. 80 değerine göre veriler (+) veya (-) olarak (80 e eşit olan iptal edilmiştir) değerlendirilerek; 76 80 84 90 92 104 82 78 84 90 96 104 100 87 - * + + + (n+) = 11; χ = 2 + - + + + + + + (n-) = 2 bulunmuştur. ( 11 − 2 − 1) 2 13 + = 4.92 ( χ2 (1,0.05)= 3.841 ) Bu değer χ2(1,0.05) değerine göre anlamlı fark bulunduğunu başka bir deyişle örnek grubu kalp vurum düzeyinin kuramsal ortalamadan yüksek olduğunu göstermektedir. χ2 formülüne başvurmadan başka bir formül ile, belli sayıda bir denek grubunda anlamlılık elde edilebilmesi için uygun en fazla kaç ters işaretli deneğe izin olduğu bulunabilir. Başka bir deyişle az sayıda olan işarete sahip en fazla denek sınırı saptanır. Toplam n kişilik bir grup için bu sınır sayısı; S = ((n − 1) / 2 − (0.98 * (n + 1) ) ile hesaplanır ve S alt tam sayı olarak alınabilir. Yukarıdaki örnekte; S = ((13 − 1) / 2) − (0.98 * 14 ) = 2.33 ; S = 2 olmaktadır ve bulunan 2 (-) sonuç, χ2 formülü ile de vurgulandığı gibi anlamlı fark getirmektedir. Formüldeki 0.98 değeri 0.05 anlamlılık sınırı için kullanılan bir kat sayı olup, 0.01 düzeyindeki bir anlamlılık için bu değer 1.28 alınacaktır. S sayısına dayanarak yapılacak değerlendirmeler için n ‘ in 30 dan büyük olması daha sağlıklı olmaktadır. MANN - WHITNEY U TESTİ Ölçümsel verilerin, (iki ayrı gruptan elde edilen) karşılaştırılması amacı ile kullanılır. Kıyaslama aslında medyanları ve büyüklük sıralamalarını kıyaslamaktadır. Uygulanışı: 1) Birinde n1 diğerinde n2 değer bulunan, iki ayrı grup birleştirilerek n1 + n2 değer elde edilir ve bunlar küçükten büyüğe doğru dizilirler. Gerekli olacağı için her değerin üzerine hangi gruba ait olduğu işlenir. Sonra bu değerlere yine küçükten büyüğe olmak üzere (1’den n1 + n2 ye kadar) sıra numaraları verilir. Birbirine eş olan (ortak) ölçümsel değerlerin sıra numaraları, gerçekte almak durumunda oldukları sıra numaralarının ortalaması kadardır. Bunlardan sonraki ölçümsel değerlerde, gerçekte olması gereken değeri alarak devam eder. Bu tür verilerin olabildiğince az olması testin geçerliliği açısından önemlidir. 1. Basamağın örnek üzerinde uygulanması A Grubu B (n1=8) = 7) 65 39 40 70 58 70 Grubu (n2 73 48 70 66 39 59 76 63 83 Düzenleme Grup B B A A A A B B B A B A B 58 59 63 65 66 70 70 5 6 7 9 11 11 A Ölç.De 39 39 40 ğ. 70 73 76 83 Sıra 1.5 1.5 no 11 13 14 3 A 48 4 8 15 Eş veri düzenleme: 1 ve 2 10,11 ve 12 Ort:1.5 Ort:11 2) Grupların aldığı sıra numaraları, her grup için ayrı ayrı toplanır. 1. grup sıra numaraları toplamı; T1 ve 2. grup sıra numaraları toplamı; T2 dir. Bundan sonra "U" ve "U'" değerleri bulunur. U= U′ = n1 * n2 + n1 * (n1 + 1) − T1 2 n1 * n2 + n2 * (n2 + 1) − T2 2 Sonuçlar; T1 + T2 = (n1 + n2 ) * (n1 + n2 + 1) 2 dir. ve U + U′ = n1 * n2 eşitlikleri ile kontrol edilebilir. 2. Basamağın örnek üzerinde uygulanması; T1 = 1.5 + 3 + 5 + 8 + 11 + 13 + 14 + 15 = 70.5 T2 = 1.5 + 4 + 6 + 7 + 9 + 11 + 11 = 49.5 U = 7 * 8 + ( 8 * 9 / 2 ) - 70.5 = 21.5 U′ = 7 * 8 + ( 7 * 8 / 2 ) - 49.5 = 34.5 T1 + T2 = 70.5 + 49.5 = (7 + 8) * (7 + 8 + 1) = 120 2 U + U' = 21.5 + 34.5 = n1 * n2 = 56 Herhangi bir U değeri kullanılarak- z değeri işareti farklı olarak elde edilir, sonuçta yorum değişmez- , "z " istatistiği ile çözümleme yapılır ve; Z= U − (n1 * n2 / 2) n1 + n2 + 1) * n1 * n2 12 z değeri 1.96 dan büyük ise anlamlı fark vardır. Sayısal örneğimizin biyoistatistiksel değerlendirme yazılımı ile çözümleme çıktısına göre sonuç p=0.450 'dir ve kümelerin düzeyleri arasında anlamlı fark bulunmamaktadır. Ayrı gruplardan olan ortak sıra numaralarının, toplam denek sayısının yirmide birinden fazla olmamasına özen gösterilmesi önerilmektedir. PARAMETRİK OLMAYAN VARYANS ANALİZİ (Kruskal-Wallis testi) Parametrik olmayan bir varyans analizi yöntemidir, herbiri n* denek içeren k adet grubun karşılaştırılmasında kullanılır. Her gruptaki denek sayıları 5 veya fazla ise k-1 serbestlik derecesine uygun bir X* dağılımı söz konusudur. Taest, dağılımı bilinmeyen ölçüm toplumlarında, varyans analizine göre 0.95 güvenle kullanılır. Bu testte de k grubun hepsindeki denekler birim ölçümlerine göre, sıraya konarak, sıra numarası alırlar. Her bir gruptaki deneklerin sıra numaraları toplamı o grubun toplam sıra değerini oluşturur. U testinde olduğu gibi eş değerler alacakları sıra değerlerinin ortalamasına sahiptirler. Tüm grupların sıra numaraları toplamı (T) yine T= N(N+1)/2 eşitliği ile doğrulanır ve test ölçütü; 12 H = ( N + 1) N TG 2 N − + 3 1 ( ) ∑ nG formülü ile hesaplanır. Eş değere sahip, yani ortak sıra numarası almış ölçümler var ise formülde düzeltme yapılır ve; 12 TG 2 3 − + 3 1 N ( ) H = ∑ / [1 − ( ΣOG / ( N − N ))] + 1 N N nG ( ) düzeltilmiş formülü kullanılır. Burada; N: Çalışma toplam denek sayısı nG: Bir gruptaki denek sayısı TG: Bir gruptaki sıra sayıları toplamı OG: Her bir ortak durum için hesaplanan ve (S3 - S) ye eşit olan düzeltme katsayısıdır. "S" ortaklığa giren eş ölçüm sayısıdır. Örneğin birinde 4 eş ölçüm, diğerinde 3 eş ölçüm bulunan 2 ortaklık durumunun bulunduğu çalışmada; ∑OG= (43 - 4) + (23 - 2) = 66 dır. Örnek: 3 ayrı gruptan elde edilen (grup denek sayıları farklı) kalp hızı (v/d) düzeylerinin karşılaştırılması. A gr. Ölçüm B gr. Sıra S. Ölçü C gr. Sıra S. Ölçüm Sıra S. m 76 1 84 2 90 8.5 85 4 85 4 110 14 87 7 90 8.5 122 17 94 10 104 12 115 15 96 6 120 16 98 11 85 4 107 13 125 18 n3=7 T3 n1=6 T1 = n2=5 96.5 T2= 42.5 N = 18, = 96.5 T = 18 * 19 / 2 = 171 Çalışmada iki ortaklık vardır, ilki 3 adet 85 değeri olması, diğeri, 2 adet 90 değeri olması biçimindedir, dolayısı ile; ∑OG = (33-3) + (23-2) = 30 ve H= 12 32 2 42.52 96.52 + + − (3 * 19) 5 7 18 * 19 6 [1 − (30 / (18 3 − 18))] = 8.38 Grup sayısı 3 olduğuna göre 3-1=2 serbestlik derecesi için χ2 tablosundan yorum yapılır ve χ2(2,0.02) = 7.82 olduğundan gruplar arasında kalp vurum düzeyi açısından anlamlı fark bulunduğu sonucuna varılır. Kruskal Wallis testi ile anlamlılık bulunması durumunda gerekli ikili kıyaslamalar Mann-Whitney U testi ile gerçekleştirilir ancak değerlendirmenin anlamlılık sınırı olarak Bonferroni düzeltmesi ile saptanacak olan anlamlılık sınırı kullanılmalıdır. WILCOXON TESTİ (Eşlendirilmiş diziler için) Eşlendirilmiş dizilerde, durumlar arasındaki farklılaşmanın değerlendirilmesi, parametrik olmayan Wilcoxon testi ile yapılabilir.Bazı kaynaklarda Mann Whitney U testi , “ Wilcoxon “ testi olarak geçmekte , buna karşılık eşlendirilmiş diziler için olan bu uygulama “ Wilcoxon işaretli sıra sayıları testi “ olarak geçmektedir. Uygulanışı: 1- Eşlendirilmiş dizilerde "t" testi uygulamasında olduğu gibi n denek için iki durumdaki ölçümsel değerler ve durumlar arasındaki farklar yazılır (cebirsel işaretler belirtilerek). Sonra işaretler önemsenmeden, farklar küçükten büyüğe sıralanır. (Örnek: -5.5 ile +5.6 değeri arada değer yok ise, birbirini izleyen sıra numaraları alırlar). U testinde olduğu gibi aynı sıra numarasını alan değerlere ortalama sıra numarası verilir. "0" olan farklara 1 den başlayarak sıra numarası verilir, ancak tek sayıda "0" var ise herhangi biri değerlendirmeden çıkarılır. Sıra numaralarının önüne, farkın gerçekte taşıdığı cebirsel işaret konur."0" değerlerinin yarısının önüne "+" yarısının önüne "-" işaret konur. 2- Son aşamadaki + veya - işaretli sıra numaralarından, hangisi adet olarak daha az ise, o sıra numaraları toplanır (T). Sonuçta bu T değeri kullanılarak test z istatistiği ile değerlendirilebilir - denek sayısının 25 den fazla olduğu durumlarda daha güvenilirdir-, z değeri aşağıdaki formülle bulunur; z= T − (n * (n + 1) / 4) n * (n + 1) * (2n + 1) 24 Formülde; T : Az sayıda görülen işaretin sıra numaraları toplamı n = Denek sayısı z, 1.96 dan büyükse durumlar arasında anlamlı fark vardır. Farklılaşma gerçek ortamlara bakılarak saptanır. Kilo verdirmeye yönelik bir diyet 12 hasta üzerinde uygulanmış Örnek: hastaların diyet öncesi ve sonrası ağırlıkları verilmiştir. Diyetin ağırlığa etkisi nedir? Önce Olgu (Kg) Sonr Fark a (Ö-S) sıralam (Kg) Ham Ortakları düzenleme a İşaretler i düzenle me 1 79 61 +18 11 11 +11 2 89 86 +3 4 4 +4 3 70 70 0(1) 1 1.5 +1.5 4 83 84 -1 3 3 -3 5 101 87 +14 10 10 +10 6 84 76 +8(1) 7 6.5 +6.5 7 93 83 +10 9 9 +9 8 83 83 0(2) 2 1.5 -1.5 9 81 72 +9 8 8 +8 10 91 91 0(3) İptal Tek sayıda var 0 11 96 90 +6 5 12 92 84 +8(2) 6 5 +5 6.5 + 6.5 (-) işaretler (+) işaretlerden daha azdır (2 ve 9). (-) lerin mutlak sıra değerleri toplanır. T= 3 + 1.5 = 4.5 ve sonuç z= 2.53 olduğundan, önce sonra arasında anlamlı fark, "düşüş" vardır (önce-sonra değerleri genelde (+) olduğundan veya doğrudan önce-sonra ortalamaları belirlenerek). Farklı biyoistatistik çözümleme yazılımları özellikle "ortak" değerler ve sıfırlar için değişik algoritmalar kullanabilmektedirler ve sonuçları birbirlerinden biraz fark gösterebilir. Eşlendirilmiş dizilerin çözümlemesinde ikinci bir non-parametrik yöntem olarak işaret testi de kullanılabilmektedir. Farksızlık denetimi yapan eşli dizilerde her deneğin 2 ayrı durumunun ölçümleri farkı, farksızlığı simgeleyen "0" değerine göre değerlendirilebilir, yani yine durum farklarının (aynı yöne doğru çıkartma işlemi yapıldığında), "+" veya "-" işareti ile simgelenmesi sonucu elde edilen sayılar, işaret testinde kullanılan formüllere yerleştirilerek karara varılabilir, "0" fark gösteren denekler çalışmadan çıkartılır. VARSAYIM DEĞERLENDİRMESİ-3 Kesikli değişkenler için, Çiftdeğişkenli Çözümlemeler KESİKLİ SÜREKLİ DEĞİŞKENLER İÇİN “KONTENJANS TABLOLARI” Bir nitelliğin alttip seçeneklerine (ortam değişkeni), ilgilenilen bir nitel konu değişkenin olgusal alttip dağılımının yargılanması bu başlığın temel kalıbıdır. –Örneğin kadın ve erkeklerdeki (ortam değişkeni: cinsiyet, sağlak ve solakların (konu değişken: el kullanım yönü) dağılımının kıyaslanması-. Nitel dağılım yargılamalarında büyük sorun yöntembilimsel yanlışlar yapılmasıdır. Bunlar “Bergson bias” olarak adlandırılan ve yanlış ortamlardan nitel özellik örneği olgular seçilerek hatalı nedensellikler üretilmesinden başlar, “payda belirsizliği”ne dek uzanır. Nicel konu değişken yargılamalarında olduğu gibi ikinci etkenlerin denetiminden emin olmaksızın nitel değişken yargılamalarına da hemen çiftdeğişkenli olarak girişilmesi hatalıdır. Pek çok etken bu kalıbın yapılandırılmasını farklılaştırır ve uygun çözümleme tekniğinin seçimini belirler. Nitel alt tip seçeneklerine araştırma olgularının sayısal dağılımı “kontenjans tablolar“ aracılığı ile gerçekleştirilir. Bunlar ise sorgulanan varsayımın yapısına doğrudan bağlıdır. “Çapraz tablo” adını da alan kontenjans tabloları iki nitel değişkenin alttiplerine göre olan olgu sıklık dağılımını veren “matris” düzenleridir. Sıralar bir değişken tipinin alt seçeneklerini, kolonlar diğer değişkenin alttiplerini belirler ve sıra-kolon kesişimleri “hücre” adını alır. Aşağıda tipik bir kontenjans tablosu sunulmaktadır: Kızamık var Kızamık Toplam yok Aşılanan 30 670 700 Aşılanmaya 400 500 900 430 1170 1600 n Toplam Araştırmada yer alan her veri mutlaka bir ve sadece bir hücre içeriğinde bulunmalıdır. Başlık özellikleri açısından çok fazla seçenek pek çok sorun içerecektir dolayısı ile araştırmanın özellikleri açısından da sorun yoksa “Diğer” başlığı taşyan kolon veya satırlar oluşturulabilir. Daha önce de değinildiği gibi, tipik olarak 3 kontenjans tablosu bulunr : • Tek satırlı tablo: Tek bir değişkenin alttiplerine dağılımı yansıtır :Örnekte 5 alttipli bir değişken -40 41-45 46-50 51-55 55+ Toplam Menopoza giriş yaşı görülmektedir : • Çok alttipli 2 değişken (biri en az 3 altseçenekli olmak üzere s: satır X k:kolon). Örnekte Tip-2 DM olgularının cinsiyet ve yaş aralıklarına dağılımı verilmiştir : • 4 gözlü tablo: (her biri 2 şer alttipli 2 değişken 2 dikotom değişken . Bu tablo aslında bir öncekinin Cinsiyet \ Yaş aralığı bir alt biçimi olarak ele alınabilir gözükmektedir -30 30-39 40-49 50-59 60-69 Erkek Kadın , ancak medikal alanda özel kullanımı ve kendine özgü teknikleri olması nedeni ile ayrı ele alınmaktadır.. Örnekte Grip olgularının aşılanılmışlık durumuna göre dağılımı verilmektedir : Sağlık durumu \ Aşı Var Yok Toplam Grip Var Grip Yok Araştırmanın amacı , varsayımı doğrultusunda yapılandırılmış olan kontenjans tablolarındaki veriler , bu varsayımın temel sorusu çerçevesinde belli tipik kalıplara yanıt bulmak için çözümlenebilirler : 70+ Toplam Bağımsızlık: 2 değişken bulunmaktadır ve bir değişkenin alttiplerine olan dağılımın diğer değişkenin alttipleri açısından belli bir benzerlik / ilgisizlik gösterip göstermediği bağıntı sorgulanmaktadır. Örneğin hematokrit düzeyi –nitelemesinin : Düşük /Normal/Yüksek , Parite seçeneklerine göre dağılımı : Nullipar/1-2/3-5/5+ gibi. Homojenlik / Eşdüzenlilik: Ya tek bir değişken bulunmaktadır ve bu değişkenin alttiplerine dağılım oranlarının eşdeğer olup olmadığı sorgulanır ( Ör.: Tifo olgularının yılın 4 mevsimine eş oranda dağılımının sorgulanması ) ya da 2 değişken ile , birinin alttiplerine dağılımının diğerinin tüm alttiplerinde de benzerliğinin sorgulanması ( Ör.: Kadın ve Erkeklerde en önemli 6 ölüm nedenine dağılımların benzerliğinin sorgulanması ) gerçekleştirilir. “Uyum İyiliği” değerlendirmesi – Goodness-of-fit : Normal olarak tek bir değişken bulunmaktadır ve bu değişkenin alttiplerine olan dağılımın bilinen belli tip bir dağılıma (Ör.: Bir yöredeki kan gruplarına dağılımın o toplumun bilinen dağılım düzenine uyumunun sorgulanması ) veya belli bir kuramsal dağılımın beklentilerine uygunluğu sorgulanmaktadır( Ör.: 3’er çocuklu ailelerdeki çocuk cinsiyet tiplemeleirne dağılımın Binom dağılımına uygunluğu). Kontenjans tabloloları çeşitli biyoistatisitksel yöntemlerle çözümlenebilirler: Kikare , Fisher kesin olasılık , Olabilirlik oranı (Likelihood Ratio):G2 , KolmogorovSmirnov testi , vs. Uygun testin seçimi araştırma varsayımı , hücrelerdeki veri büyüklükleri , tablo tipi, satır ve kolon sayıları gibi çeşitli etkenlerce belirlenir. KONTENJANS TABLOLARINDA ÖZELLİKLER Farklı içerik ve yapıdaki kontenjans tabloları çözüm seçenekleri ve yargılama kritik değerleri açısından bazı özellikler kullanırlar ve değerlendirmeler bunları temel alır . GÖZLENEN VE BEKLENEN DEĞERLER Kontenjans tabloların, sayısal içeriklerini, belli tip kuramsal veya oluşumsal dağılım özelliklerine uygunlukları açısından çeşitli testlerle yargılarız. Bu kavram çerçevesinde tabloda yer alan gerçek , “gözlenmiş” olan verileri, kuramsal açıdan orada olması “beklenen” bazı sanal değerlerle karşılaştırmamız söz konusudur. Tablolardaki her “hücre” tek bir değişkenin bir alttipinden olan olguların veya iki farklı değişkenin kesişen bazı alttiplerinin özelliğindeki olguların sayısını yansıtır; bunlar araştırmada gözlemlenerek sayısallaştırılmış gerçek değerlerdir ve yer aldıkları hücreye göre adreslenirler. Örneğin “sıralarda” yer alan değişkenin ikinci alttipi ile "kolonlardaki" değişkenin üçüncü alttipi “G23” adresindeki sayıdır. Tek satırlı bir tablo sadece cinsiyet tiplerinde yapılandırılarak 123 erkek ve 97 kadın yansıtıyorsa bunlar cinsiyetlere ilişkin “gözlenen“ değerlerdir. Buna karşılık eğer kuramsal olarak cinsiyetlere dağılımın eş oranda olduğu varsayılırsa bu tablodaki toplam 220 olgu için 110’ar erkek ve kadın olması “beklenir”. Farklı tablo – ve varsayım- tipleri için beklenen değerlerin hesaplanması basit “orantılandırmalara” dayanır. Tek değişkenli tabloda beklenen değerler Eğer değişkene ilişkin toplam olgu sayısında herhangi bir öngörülen oransal dağılım yapısı yoksa, her gözün beklenen değeri, toplam olgu sayısı alttip sayısına bölünerek elde edilir ve hepsi birbirine eşit olur. Eğer belli bir dağılım düzeni öngörülüyorsa veya kuramsal olarak hesaplanıyorsa her gözün beklenen değeri ;o gözün gözlenen değeri ile o göz için öngörülmüş/ hesaplanmış oranın çarpımına eşittir. İki değişkenli tabloda beklenen değerler S satır sayısına ve k kolon sayısına sahip bir kontenjans tablosunda ,her göz yer aldığı satır değişkeninin “i.” Satırında , kolon değişkeninin “j.” Kolonunda bulunarak Gij adresi taşımaktadır. Araştırma olgularının genel toplamından (N) başka , her satırın kendi toplamı (örneğin Ts1 : ilk satır toplamı) ve her kolonun kendi toplamını (örneğin Tk2 : 2. Kolon toplamı) belirlersek bir kontenjans tablosunun “adresleri” şu şekilde biçimlenir : Herhangi bir Gijgözünün beklenen değeri de bu simgeler çerçevesinde: Bij = Tsi * Tkj / N olarak hesaplanır. Aşağıdaki örnekte bu çerçevede hesaplanmış değerler verilmektedir: Farkedileceği gibi bir satırın toplam beklenen değeri o satırın toplam gözlenen değerine eşittir, aynı özellik kolonlar için de geçerlidir. Kontenjans tablolarına uygulanacak çözüm yöntemlerinin seçiminde 5’den küçük beklenen değerler taşıyan gözlerin sayısı ve toplam tablo gözleri içindeki oranı büyük önem taşır. Örneğin çok satır X çok kolonlu tablolarda – 4 gözlü tablolar dışında – bu oranın %10 dan fazla olması , o tabloya ki-kare testi uygulaması yapılmamasını öngörecektir. Bu çerçevede 3X2 lik bir tabloda, ki-kare uygulaması için tüm gözlerin beklenenlerinin en az 5 olması , 4X4 lük bir tabloda ise (16 göz) sadece bir gözün (%16.6) 5 den küçük beklen değer taşıması uygun olacaktır. Zorunlu nedenlerle bu tür tablolarla karşılaşılması durumunda ileride sözü edilecek başka yöntemler kullanılabilecektir. Bununla birlikte herhangi bir kontenjans tablosunda boş: 0 olgu bulunan gözlerin bulunması da uygun olmamaktadır. Klinik tanımsal kavramlar açıdan sakınca oluşturmuyorsa, fazla sayıda 5’den küçük değerin ve/veya boş gözlerin bulunduğu tablolarda, bazı kolon ve/veya satırların birleştirilmesi ile çözümlemelere uygun özellikte tablolar oluşturulabilir. Aşağıdaki örnekte bu yönde bir yaklaşım sergilenmektedir : C ve D kolonları klinik tanımlar açısından sorun oluşturmayacağı için birleştirilmiş ve ilk tablodaki boş gözün ortadan kalkmasınının yanı sıra düşük beklenen değerler de düzenlenmiştir. TABLO SERBESTLİK DERECESİ Diğer istatistiksel testlerin de çoğunda olduğu gibi, kontenjans tablolarında kullanılan testler de, tablonun özelliğine bağlı olarak derecelerinin kritik değerleri çerçevesinde yorumlanırlar: belirlenen serbestlik Tek değişkenli - tek satırlı - tabloda serbestlik derecesi "k" altnitelik taşıyan bir tek satırlı tablonun serbestlik derecesi, sd= k-1'dir. Toplam gözü sayılmayacaktır. sd = 4-1=3 2 değişkenli - (S x K )- tabloda serbestlik derecesi Satır başlıkları - altnitelikleri olarak "s" sayıda ve kolon altnitelikleri olarak "k" sayıda özellik taşıyan taşıyan bir tablonun serbestlik derecesi, sd= (s-1) X (k-1)'dir. sd = (2-1) X (4-1) = 3 4 gözlü tabloların serbestlik derecesi her zaman (2-1)x(2-1) = 1 'dir. KONTENJANS TABLOLARI DEĞERLENDİRME YÖNTEMLERİ Yapısının, varsayımının ve göz içeriklerinin farklılığına göre kontenjans tablolarının çözümünde farklı yöntemler kullanılır : ki-kare ( χ2 ) , Fisher kesin olasılık testi , Likelihood (olabilirlik) oranı , Kolmogorov-Smirnov testi, vs. Bu bölümde en önemli ve yoğun kullanılan yöntem olan χ2 ayrıntılandırılacak , diğer yöntemler biyoistatistik incelenecektir. yazılım çıktıları çerçevesinde sadece kullanım özellikleri ile Kİ-KARE (χ2 ) YÖNTEMİ Pearson χ2, testi bir kontenjans tablosunda gözlenen veri düzenini, sorgulanan bir varsayım düzeni çerçevesinde yargılamak için kullanılır. Temeli özel bir dağılıma ,”ki-kare” dağılımına dayanmaktadır. Test, kontenjans tablosu gözlerindeki “gözlenen” ve “beklenen” değerler üzerinde yapılandırılır ve her gözün ki-kare değeri : (G-B)2 / B şeklinde hesaplanır. Sonuçta, k kolonu ve s satırı olan bir tablonun toplam ki-kare değeri: k χ toplam = ∑ 2 i =1 s ∑χ j =1 2 ij formülü ile hesaplanır. Bir kontenjans tablosunda, koşullar ki-kare çözümlemesi için uygunsa aşağıdaki basamakları izleyen bir süreç gerçekleştirilir: 1- Tablo çerçevesinde öngörülen varsayımın belirlenmesi : Farklı tablo tipleri için farklı varsayımlar öngörülebilir. S X K tablolar için (4 gözlü tablolar dahil) temel kalıp : “Satır başlıkları arasında , kolon başlıkları açısından fark bulunup bulunmadığını“ sorgulamaktır. Örnek :Sigara içenlerle içmeyenler arasında KOAH sıklığı açısından fark bulunmaktadır ! 2- Gözlerin “beklenen” değerleri bulunur, 3- Gözlerin ve devamında da toplam tablonun sonuç ki-kare değeri hesaplanır, 4- Bulunan sonuç ki-kare değeri, tablo serbestlik derecesine uygun serbestlik derecesi kritik değerlerine göre yorumlanır. P<0.05 sonucu varsayımın geçerliliğini vurgular. Güncel yazılımlar p değerlerini doğrudan sunmaktadırlar. Anlamlı farklılık bulunması durumunda, 4 gözlü tablolardaki gerçek değerlereoranlara bakılarak ayrıntılı yorumlar üretilebilir ancak diğer tip tablolarda sadece “fark” varlığı vurgulanmış olur ve ayrıntılandırmak için gereğinde başka değerlendirmeler gerekebilir. Örnek :Cinsiyetler arasında BKI aralık sınıflarına dağılım farklılığının değerlendirilmesi. Bazı beklenenlerin hesaplanmasına örnek olarak : Kadın; 21-28 : 88 * 90 / 159 = 49.81 Erkek , >28 : 71 * 48 / 159 = 21.43 Toplam ki-kare hesabı : [(12-9,38)2 / 9.38] + [(43-40,19)2 / 40.19] + ...+ [(32-26,57)2/26,57] = 4,17 sd = (2-1) * (3-1) = 2 , χ2 (2,0.05) = 5,99, 4,17<5,99 p>0.05 Cinsiyetler arasında BKI sınıflarına dağılım açısından anlamlı fark bulunmamıştır. Örnek: 116 kişilik bir özel kümede belirlenen kan grupları dağılımının toplumun kan grupları dağılımından farklılığının değerlendirilmesi. Toplam hesabı : ki-kare [(59-67,28)2 / 67,28] + [(18-20,88)2 / 20,88] + [(23-19,72)2 / 19,72] + [(16-8,12)2 / 8,12)] = 1,019 + 0,397 + 0,545 + 7,647 = 9,608 sd = (4-1) = 3 , χ2 (3,0.05) = 9,348, 9,608 >9,348 p<0.05 Özel kümenin kan gruplarına dağılımı ile toplumunki arasında fark bulunmaktadır, küme topluma bu açıdan uymamaktadır. Yazılım kullanılarak yapılan çapraz tablo değerlendirmelerinde Sonuçlar sadece ki-kare değerlendirmesi olarak değil başka yöntem sonuçları ile de verilebilmektedir. Örneğin aşağıdaki SPSS çıktısında, gerçekleştirilmiş bir Etken gücü X Hastalık düzeyi değerlendirilmesinde ( 3 x 3 tablo) 3 ayrı sonuçsal değerlendirme bulunmaktadır Sadece Pearson ki-kare değerlendirmesi değil bir ikinci değerlendirme olarak Lİkelihood Ratio sonucu bulunmaktadır üstelik bunlar anlamlılık açısından çelişkili gözükmektedirler Ayrıca bunlardan çok daha “anlamlı” gözüken bir 3. değerlendirme – Linear-by-linear association- bulunmaktadır. Çıktıda uygun yöntem sonucunun seçimi için son derece önemli bir ipucu yansıtılmaktadır : 9 gözden 3 ünde (%33) beklenen göz değeri 5’den küçüktür. Daha önce vurgulandığı üzere 4 gözlü olmayan ( 2 X 2 ) tablolarda ki-karenin güvenirliği açısından gözlerin % 10’undan fazlasında 5’den küçük beklenen değer olması durumunda seçenek yöntem sonuçları önemsenmelidir. Likelihood Ratio– olabilirlik oranı 4 gözlü tablolar dışındaki s X k gözlü tablolarda %10 dan fazla gözde 5’den küçük beklenen değer olması durumunda likelihood Ratio sonucu – olabilirlik oranı – kullanılması daha uygundur. G2 olarak da adlandırılabilen yöntem formül olarak : 2∑ Gij ln(Gij / B ij ) değerine eşittir. Yukarıdaki örnekten de anlaşılacağı gibi normal ki-kareye göre daha “tutucu” – anlamlılık bulmamaya yatkın – sonuç verir gibi gözükse de aslında yetersiz örneklemelerle yanıltıcı anlamlılıklar üretmediği biçiminde de yorumlanabilir. Gerçekten de yüksek örneklemli, sorunsuz tablolarda nerede ise tam ki-kare sonucuna denk sonuç bulunur. “0” değeri – o altnitelikte olgu bulunmayan – gözlerin bulunmaması tercih edilmelidir. Yukarıdaki örnekte olabilirlik oranı ile saptanmış bulunan ve “anlamlı” olmayan sonucun yorum için kullanılması ancak örneklem sayısını arttırma yönüne gidilmesinin uygun olacağı düşünülmelidir. DÖRT GÖZLÜ TABLOLAR İÇİN ÖZEL DEĞERLENDİRMELER Dört gözlü tablolar değerlendirme açısından tıp alanında en çok rastlanan ve özellikli çapraz tablolardır çünkü farklı araştırma varsayımlarına uyan kullanıma sahiptirler buna bağlı olarak da çeşitli özgün değerlendirme yöntemleri kullanabilirler. Bu çerçevede en çok karşımıza çıkan varsayım soru tiplerine göre çözüm yaklaşımlarını irdeleyeceğiz. 1)Eş yapısallık sorgulaması: Bir dikotom değişkenin iki altniteliği arasında, farklı ikinci değişkenin 2 altniteliğine dağılım açısından fark olup olmadığını sorgular. Anlaşılacağı üzere bu kalıp farklı varsayımlarda farklı sorgu özellikleri ile karşımıza gelebilir. Kıyassal altnitelik kümeleri birbirlerinden bağımsızdır. Tipik bir sorunun yazılım çıktısı aşağıdaki gibi gözükür : Bu tablonun SPSS değerlendirme çıktısı ise şöyledir: Görüldüğü gibi 6 farklı “p” sonucu bulunmaktadır: Bunlardan linear-by-linear değerlendirmenin veriyi ele alış yaklaşımının farklı olduğunu görmüştük ve bizim eşyapısallık yanıtımız bununla ilgili değildir. Geriye kalan 5 sonuçtan uygun olanın seçim koşulları söyle açıklanabilir : a) Tüm beklenen değerler 5’den büyük ve tüm gözlenen değerler en az 15 ise: Değerlendirilmesi, incelenmiş olan standart ki-kare çözümlemesi ile yapılarak, 1 serbestlik derecesine göre yorumlanır. Anlamlı fark bulundu ise satırların / kolonların gerçek iç oran dağılımlarına bakılarak ayrıntılar belirtilir. Dört gözlü tabloların gözlerine, satır ve kolon toplamlarına simgesel adlar verirsek, aşağıdaki kolaylaştırılmış formülle de aynı sonuç elde edilir. Bu simgeleri diğer yöntemleri açıklarken de kullanacağız Kolaylaştırılmış χ2 formülü : χ2 = [(a * d) - ( b * c )]2 *N / (Ts1 * Ts2 * Tk1 *Tk2) Örneğimizde hiçbir gözde 5’den küçük beklenen değer olmadığı çıktıdan da anlaşılmaktadır ancak “b” ve “d” gözlerinde 15’den küçük gözlenen değerler vardır. b) Tüm beklenen değerler 5’den büyük ama gözlenen değerler içinde 15’den küçük değer var ise: Değerlendirilme için 2 seçenek bulunmaktadır: daha önce görmüş olduğumuz “Olabilirlik oranı” – likelihood ratio veya “Süreklilik düzeltmeli χ2“ değeri. Bu yaklaşım Yates χ2 adı ile de anılmaktadır. Hesaplaması yukarıda gördüğümüz kolaylaştırılmış formüle (N/2) düzeyinde bir azaltma uygulanarak gerçekleştirilir. χ2 = [((a * d) – ( b * c )) – (N/2)]2 *N / (Ts1 * Ts2 * Tk1 *Tk2) Son zamanlarda bu düzeltmenin fazlası ile “tutucu” sonuçlar verdiği ve Tip-2 hata oluşturduğu düşünülmektedir. Bu nedenle Olabilirlik oranını bu tip tablolarda kullanmak daha uygun bir seçenek olabilir. Örneğimizde hiçbir gözde 5’den küçük beklenen değer olmadığı ama 15’den küçük gözlenen değerler olduğu için “olabilirlik oranının” sonuç “p” değerinin kullanımı uygun olacaktır. Buna göre etkeni bulunduranlarla bulundurmayanlar arasında sonuç oranı açısından anlamlı fark vardır ve etkeni taşıyanlardaki sonuç oranı (%32.4) taşımayanlara göre (%15.3) daha yüksektir. Görüldüğü gibi düzeltmeli ki-kare sonucu anlamlılık yansımazken , olabilirlik oranı , standart ki-kare sonucundan daha yüksek olsa da anlamlı bir p düzeyi sunmaktadır. c) değerler Beklenen içinde var 5’den küçük - olan gözlenen değerler önemsenmiy or-: Çözümleme hipergeometrik dağılım tabanlı “Fisher kesin olasılık testi” ile gerçekleştirilecektir – sonuç bir ki-kare , vs değil doğrudan olasılık hesaplamasıdır-. Bir araştırma örnek çıktısı aşağıdadır: Çapraz tabloda 5’den küçük beklenen değer bulunmaktadır – bu örnekte 1 tane; gözleneni 7 olan gözün beklenen değeri 3.73 dür - . Fisher (exact) kesin olasılık testi için bulunan 2 sonuçtan araştırma varsayımının kurgusuna uyan seçilmelidir : Eğer sadece “farklılık” sorgulanmayıp , “yönü belirtilerek beklenen bir fark : ör.: Etkeni taşıyanlarda sonuç daha yüksektir varsayımı ! – değerlendiriliyorsa tek yönlü – 1sided- sonuç yorumlanmalıdır. Yukarıdaki örnekte varsayım bu beklenti ile kuruldu ise:”Etkeni taşıyanlarda sonuç anlamlı olarak daha yüksektir (p=0.035)”. 2)Eşlendirilmiş (Bağımlı) konumlarda değişim sorgulaması: Bir dikotom değişken iki altniteliğine dağılımlar açısından iki farklı konumda değerlendirilmektedir – eşlendirilmiş dikotom nitelik değerlendirmesi Yandaki ve üstteki alttip başlıkları aynı olup 2 farklı durumda değerlendirilmişlerdir. Bu tip bir araştırmada durumlar arası farklılaşım McNemar χ2 testi ile değerlendirilir ve : Mc Nemar χ2 =( |(b – c )| -1) 2 / (b + c) şeklinde hesaplanıp “1” serbestlik derecesine göre yorumlanır. Anlaşılacağı gibi değerlendirme sadece durumdan duruma değişmiş olan olgu sayılarını hesaba katmaktadır – bu testin gücü açısından son derece tartışmalı bir özellik olduğunu düşünüyorum -. Örnek : Belli bir konuda deneysel eğitim verecek bir kursa katılan 47 olguda kurs öncesi başarılı/başarısız değerlendirmesi yapılmış , aynı işlem kurstan sonra da gerçekleştirilmiştir. Bu verilere göre kursun etkisini yorumlayınız. Mc Nemar χ2 = ( |(18 – 7 )| -1) 2 / (18 + 7) = 100 / 25 = 4 4>3.841 : (χ2(1,0.05) Kurs öncesi başarılı iken başarısıza dönenlerin oranı % 38.3 , başarısızdan başarılıya değişenler ancak % 14.9’dur. Kurs anlamlı olarak ters etki yapmıştır. 3) Göreli Risk Değerlendirmesi : Epidemiyoloji ve klinik Biyoistatistikte Göreli Risk değerlendirmesi kısaca: belli bir etkeni taşıyanlardaki patoloji/hastalık/sonuç oranının , bu etkeni taşımayanlardaki oranın kaç katı olduğunun belirlenmesidir. Değerlendirme “bağımsız” kümeler kalıbı çerçevesinde gerçekleştirilecektir. Araştırma retrospektiv ise (vaka/kontrol) ; OR ( odds oranı) , prospektiv ise ( kohort , klinik deney) RR (Göreli Risk) kullanılacaktır. Kesitsel araştırmalar için de OR kullanılması uygundur. E(+)= a+c E(-) = b+d S(+) = a+b S(-) = c+d OR = (a * d) / (b * c) RR = [a / (a+c)] / ( b / (b+d)] [a * (b+d)] / [b * (a+c)] OR veya RR ‘nin yorumlanabilmesi için her şeyden önce değerlendirmenin yapıldığı 4 gözlü tabloda anlamlı sonuca erişilmiş olması gerekir. Örnek : Belli düzeyde Sigara içiminin , KOAH – Kronik Obstruktiv Akciğer Hastalığı – varlığı üzerindeki etkisi belli özellikte yetişkin erkeklerde vaka/kontrol araştırması olarak sorgulanmıştır. Öncelikle 4 gözlü tablo için değerlendirme gerçekleştirilmiştir: 5’den küçük beklenen değer bulunmamaktadır. Düşük gözlenen değerli göz varlığı nedeni ile Olabilirlikler oranı sonucu tercih edilecektir – standart kikare sonucu ile nerede ise tamamen aynıdırSigara içmeyenlerdeki KOAH oranı (%6.3) içenlere göre (%21.4) anlamlı olarak çok daha düşüktür . OR = (105 * 18 ) / (66 * 7 ) = 4.09 :Sigara içenler , içmeyenlere göre 4.09 kat daha fazla KOAH olma riski taşımaktadırlar. (Prospektiv bir kohort araştırmasında RR = (18/84) / (7/112) = 3.42 dirTablodaki özelliklerin bilincinde değerlendirme yapılarak - ) Bu çok özgün ve önemli konu çok daha ayrıntılı olarak “klinik biyoistatistik” kitaplarında incelenebilir.