İSTATİSTİK İstatistik kelimesi günlük hayatta farklı anlamlarda kullanılmaktadır. Televizyonda bir futbol müsabakasını izleyen bir taraftar için istatistik, maç esnasında yapılan faul sayısı, atılan korner sayısı, topa sahip olma oranları gibi değerleri, bir aile reisi için açıklanan aylık enflasyon oranlarını, başka bir birey için ülke nüfusu, ihracat değerleri, ithalat değerleri, inşa edilen konut sayıları gibi rakamları ifade ederken, akademik çalışma yapan bir bilim adamı için ise sayısal analizleri ifade etmektedir. • Bu bölümde İstatistiğin tanımı yapılarak, anakütle ve örnek kavramları açıklanacak,tam sayım ve örnekleme arasındaki fark ortaya konulacak ve son olarak anakütle, örnek, parametre ile istatistik kavramları ayrıntılı bir şekilde anlatılacaktır. •Herhangi bir araştırma konusu ile ilgili toplanan işlenmemiş ham bilgilere veri denir. Veri, araştırma konusu ile ilgili istatistiksel çalışmanın temelini oluşturur. •Veri bir anlamda araştırma konusunun delillerini teşkil eder. İstatistiksel analizler konu ile ilgili toplanan ham bilgilere dayanılarak yapılır. Dolayısıyla istatistiksel analizlerden doğru sonuçların alınması elde edilen bilgilerin doğruluğuna bağlıdır. Verilerin yanlış ya da hatalı toplanması, sonucun da yanlış veya hatalı çıkmasına neden olacaktır. •Veri toplanmadan önce araştırma ile ilgili amacın ne olduğuçok net bir şekilde ortaya konulmalı ve bu amaç çerçevesinde bilgiler toplanmalıdır •Bu ünitede seri türlerinin zaman, mekân, frekans ve kümülatif seriler olduğuna değinilmiştir. Zaman serileri zamana , mekân serileri mekâna göre sınıflandırılarak oluşturulur. Frekans serileri nitel ve nicel seriler olmak üzere ikiye ayrılırlar. Nicel seriler kendi aralarında basit, sınıflandırılmış, gruplandırılmış seriler olmak üzere dörde ayrılırlar. •Basit seri, verilerin küçükten büyüğe veya büyükten küçüğe doğru sıralanmasıyla elde edilen serilerdir. •Sınıflandırılmış seri, her bir x değerinin karşısına frekans değeri (tekrarlama sayısı) yazılarak elde edilen serilerdir. •Gruplandırılmış seri, serideki en büyük değerden en küçük değer çıkarılıp grup sayısına bölünerek elde edilen sınıf büyüklüğüne göre oluşturulan grup alt sınır ve üst sınır aralığına göre frekansları yazmak suretiyle elde edilen serilerdir. •İstatistiğin uğraş alanlarından biri de görselleştirmedir. Grafikler gözlem değerlerinin görselleştirilmesinde kullanılan önemli araçlardır. Daha çok göze hitap eden grafikler, gözlem değerlerinin matematiksel ve bilimsel temellere sahip şekiller hâlinde ifade edilmesi şeklinde tanımlanabilir. Grafikler gözlem değerlerinin daha kolay anlaşılmasını sağlamaktadır. Çünkü grafikler temsil ettikleri olayların bileşimini ve değişmelerindeki ana eğilimi tüm canlılığı ile ilk bakışta ortaya koymaktadır. Rakamların yerine grafikler görsel olarak sonuçlar verdiklerinden daha kolay anlaşılır. İyi çizilmiş bir grafik üzerinde gösterilen sonuçlar görsel olduğundan şahıslar tarafından daha anlaşılır olmaktadır. Bu bölümde grafik çeşitlerinden sırasıyla; histogram, frekans poligonu, kümülatif frekans dağılımları, daire grafiği, sütun grafiği ve pareto grafiği hakkında bilgi verilmiştir. •Serideki tüm verilerden etkilenen merkezî eğilim ölçüleri parametrik merkezî eğilim ölçüleri olarak adlandırılır. •İstatistiksel çalışmalarda en fazla kullanılan ortalama türü aritmetik ortalamadır. Aritmetik ortalama, tüm veri dizisinin toplanıp veri sayısına bölünmesiyle elde edilir. •Geometrik ortalama n tane değerin çarpımının n'inci dereceden kökü alınarak bulunur. Seride negatif bir değer veya sıfır varsa geometrik ortalama hesaplanamaz. TÜM ÜNİTELERİN ÖZETLERİ Sayfa 1 İSTATİSTİK •Harmonik ortalama, gözlem sonuçlarının çarpma işlemine göre terslerinin, aritmetik ortalamasının tersidir. Geometrik ortalamada olduğu gibi seride sıfır veya negatif değer bulunduğu durumlarda harmonik ortalama bulunması mümkün değildir. •Kareli ortalama sayısal olarak elde edilen verilerin karelerinin aritmetik ortalamasının karekökü alınarak hesaplanır. •Parametrik merkezî eğilim ölçüleri arasında H < G < ̅ < K şeklinde bir büyüklük ilişkisi vardır. •Serideki değerlerin bir kısmı dikkate alınarak hesaplanan merkezî eğilim ölçülerine parametrik olmayan merkezî eğilim ölçüleri denir. •Nitel değişkenli serileri en iyi temsil eden merkezî eğilim ölçüleri parametrik olmayan merkezî eğilim ölçüleridir. •Seride en çok tekrarlanan değere serinin modu denir. •Serideki rakamlar büyüklük sırasına konulduğunda tam ortaya düşen değere medyan denir. medyan aynı zamanda seriyi ikiye bölen değerdir. •Seriyi bölen değerlere kantiller denir. Seriyi dört eşit parçaya bölen kantillere kartiller. Seriyi on eşit parçaya bölen kantillere desiller. Seriyi yüz eşit parçaya bölen kantillere pörsentiller denir. •Serideki değerlerin birbirinden ve merkezî eğilimden uzaklaşmalarına değişkenlik denir. Az çok her seride değişkenlik olabilir. Değişkenliğin fazla olması güvenilir istatistikler elde edilmesini etkiler. Bu sebeple serilerdeki değişkenliğin ölçülmesi gerekir. Serideki bütün değerlerin hesaba katılmasıyla elde edilen değişkenlik ölçülerine parametrik değişkenlik ölçüleri denir. Parametrik değişkenlik ölçüleri, aritmetik ortalama etrafındaki dağılımı ölçerler. Aritmetik ortalamadan mutlak sapmaları kullanan değişkenlik ölçüsü ortalama sapmadır. Aritmetik ortalamadan kareli sapmaları kullanan değişkenlik ölçüleri ise varyans, standart sapma ve değişim kat sayısıdır. İçerisinde en fazla bilgi bulunduran ve seriler arasında karşılaştırma yapmada kullanılabilecek değişkenlik ölçüsü değişim kat sayısıdır. Güvenilir tahminler yapmak için serinin dağılımının simetrik olması gerekirken; aynı dağılımın normal veya normale göre dik olması gerekir. Serinin çarpıklığını çeşitli çarpıklık ölçüleri ile takip edebiliriz. Moda, medyana ve kartillere dayalı çarpıklık ölçüleri serideki tüm değerlere tabi olmadığı için parametrik olmayan çarpıklık ölçülerindendir. Aritmetik ortalama ettafındaki momentlere dayalı çarpıklık ölçüsü serideki tüm değerlere tabidir. Çarpıklık ölçüleri normal dağılımın çarpıklık katsayısı olan 0 ile karşılaştırılır. Sıfırdan küçük olan katsayılar serinin sola çarpık olduğunu, sofırdan büyük olan katsayılar serinin sağa çarpık olduğunu gösterir. Serinin basıklığı aritmetik ortalama etrafındaki mometlere dayalı olarak hesaplanır. Bulunan katsayı normal dağılımın basıklık katsayısı olan 3 ile karşılaştırılır. Basıklık katsayısı 3'ten büyük ise seri normale göre diktir. Basıklık katsayısı 3'ten küçük olduğunda seri normale göre basıktır. İndeksler zaman serilerinde temel yıla, mekân serilerinde ise ortalama değere göre üzerinde durulan dönemin veya mekânın değerdeki yüzde değişimi gösterir. Bu ünite okunduğunda tek bir malın, hizmetin veya bir iktisadi göstergenin fiyat, miktar veya değerindeki yüzde değişim hesaplanabileceği gibi birden fazla mal veya hizmetin veya iktisadi göstergenin fiyat, miktar veya değerindeki yüzde değişim de hesaplanabilir. •Bir olay kesin olarak meydana gelecekse veya kesin olarak meydana gelmeyecekse ihtimalden bahsedilemez. Bir olayın olması mümkün olduğu gibi olmaması da mümkünse bu tür olaylara ihtimalli olaylar denir. Bir olayın meydana gelme ihtimali söz konusu olayın meydana gelme sayısının o olayla birlikte meydana gelmesi mümkün sonuç sayısına bölümüdür. Birbirini engelleyen birden fazla olaydan bir veya daha fazlasının meydana gelme ihtimali bulunurken toplama kuralından yararlanılır. Birbirini engellemeyen bir TÜM ÜNİTELERİN ÖZETLERİ Sayfa 2 İSTATİSTİK veya daha fazla olayın birlikte meydana gelme ihtimali hesaplanırken çarpma kuralından faydalanılır. Bir olayın mümkün gerçekleşme yollarının ve bu yolların ihtimallerinin gösterildiği tabloya ihtimal dağılım tablosu denir •Sonuçları belirli tamsayı değerleri alan değişkenlere kesikli değişken denir. Kesikli tesadüfi değişkenlere ait dağılımların ortalaması ∑ ( )ve standart sapması ∑ formülü ile hesaplanır. •Binom olayları iki sonuçlu olaylardır. Binom olayları tekrarlanabilen olaylardır. Olayın gerçekleşmesi ihtimali denemeden demeye değişmez. X bir binom dağılımı gösteren bir değişken ise olayın n defa tekrarlanması durumunda olayın sonuçlarına ait ihtimaller 𝑥 𝑛𝑥𝑝𝑥( 𝑝) −𝑥 formülü ile hesaplanır. •Poisson olayları binom olaylarına çok benzer. Binom olayından farkı olayın bir denemede gerçekleşmesi ihtimali oldukça küçüktür. X bir poisson dağılımı gösteren bir değişken ise olayın n defa tekrarlanması durumunda olayın sonuçlarına ait ihtimaller 𝑥 𝑥 𝑥𝑋! formülü ile hesaplanır •İncelenecek bir çok sürekli değişkene ait dağılımın normal dağılıma uygun olduğu kabul edilmektedir. Normal dağılan Değişkenlere ait değerler standart değerlere dönüştürülebilir. Sürekli değişken değerleri standart değerlere dönüştürüldükten sonra ihtimal hesaplamalarına konu olabilir. Standart normal dağılım için hesaplanmış olan hazır tablolar kullanılarak sürekli bir değişkene ait ihtimal hesaplamaları yapılabilir. Dağılımın ortalaması ve standart sapması biliniyorsa standart değerler kullanılarak ihtimalin hesaplanmasına konu olan sürekli değişken değeri de hesaplanabilir. •Üzerinde durulan olayın sonuçları kesikli değişken değerleri alması durumunda olayın sonuçlarına ait ihtimal dağılımı kesikli ihtimal dağılımıdır. Söz konusu olayın 30 ya da daha fazla tekrarlanması durumunda kesikli olayın ihtimal dağılımı normal dağılıma yaklaşır. Bu durumda ilgili kesikli değişken dağılımının ortalaması ve standart sapması bulunarak değişkene ait sonuçlar standart değerlere dönüştürülür. Standart normal eğri alanları tablosu kullanılarak olayın sonuçlarına ait ihtimaller hesaplanır. TÜM ÜNİTELERİN ÖZETLERİ Sayfa 3