*STAT*ST*K

advertisement
İSTATİSTİK
İstatistik kelimesi günlük hayatta farklı anlamlarda kullanılmaktadır. Televizyonda bir futbol müsabakasını
izleyen bir taraftar için istatistik, maç esnasında yapılan faul sayısı, atılan korner sayısı, topa sahip olma
oranları gibi değerleri, bir aile reisi için açıklanan aylık enflasyon oranlarını, başka bir birey için ülke nüfusu,
ihracat değerleri, ithalat değerleri, inşa edilen konut sayıları gibi rakamları ifade ederken, akademik çalışma
yapan bir bilim adamı için ise sayısal analizleri ifade etmektedir.
• Bu bölümde İstatistiğin tanımı yapılarak, anakütle ve örnek kavramları açıklanacak,tam sayım ve
örnekleme arasındaki fark ortaya konulacak ve son olarak anakütle, örnek, parametre ile istatistik kavramları
ayrıntılı bir şekilde anlatılacaktır.
•Herhangi bir araştırma konusu ile ilgili toplanan işlenmemiş ham bilgilere veri denir. Veri, araştırma konusu
ile ilgili istatistiksel çalışmanın temelini oluşturur.
•Veri bir anlamda araştırma konusunun delillerini teşkil eder. İstatistiksel analizler konu ile ilgili toplanan
ham bilgilere dayanılarak yapılır. Dolayısıyla istatistiksel analizlerden doğru sonuçların alınması elde edilen
bilgilerin doğruluğuna bağlıdır. Verilerin yanlış ya da hatalı toplanması, sonucun da yanlış veya hatalı
çıkmasına neden olacaktır.
•Veri toplanmadan önce araştırma ile ilgili amacın ne olduğuçok net bir şekilde ortaya konulmalı ve bu amaç
çerçevesinde bilgiler toplanmalıdır
•Bu ünitede seri türlerinin zaman, mekân, frekans ve kümülatif seriler olduğuna değinilmiştir. Zaman serileri
zamana , mekân serileri mekâna göre sınıflandırılarak oluşturulur. Frekans serileri nitel ve nicel seriler olmak
üzere ikiye ayrılırlar. Nicel seriler kendi aralarında basit, sınıflandırılmış, gruplandırılmış seriler olmak üzere
dörde ayrılırlar.
•Basit seri, verilerin küçükten büyüğe veya büyükten küçüğe doğru sıralanmasıyla elde edilen serilerdir.
•Sınıflandırılmış seri, her bir x değerinin karşısına frekans değeri (tekrarlama sayısı) yazılarak elde edilen
serilerdir.
•Gruplandırılmış seri, serideki en büyük değerden en küçük değer çıkarılıp grup sayısına bölünerek elde
edilen sınıf büyüklüğüne göre oluşturulan grup alt sınır ve üst sınır aralığına göre frekansları yazmak suretiyle
elde edilen serilerdir.
•İstatistiğin uğraş alanlarından biri de görselleştirmedir. Grafikler gözlem değerlerinin görselleştirilmesinde
kullanılan önemli araçlardır. Daha çok göze hitap eden grafikler, gözlem değerlerinin matematiksel ve
bilimsel temellere sahip şekiller hâlinde ifade edilmesi şeklinde tanımlanabilir. Grafikler gözlem değerlerinin
daha kolay anlaşılmasını sağlamaktadır. Çünkü grafikler temsil ettikleri olayların bileşimini ve
değişmelerindeki ana eğilimi tüm canlılığı ile ilk bakışta ortaya koymaktadır. Rakamların yerine grafikler
görsel olarak sonuçlar verdiklerinden daha kolay anlaşılır. İyi çizilmiş bir grafik üzerinde gösterilen sonuçlar
görsel olduğundan şahıslar tarafından daha anlaşılır olmaktadır. Bu bölümde grafik çeşitlerinden sırasıyla;
histogram, frekans poligonu, kümülatif frekans dağılımları, daire grafiği, sütun grafiği ve pareto grafiği
hakkında bilgi verilmiştir.
•Serideki tüm verilerden etkilenen merkezî eğilim ölçüleri parametrik merkezî eğilim ölçüleri olarak
adlandırılır.
•İstatistiksel çalışmalarda en fazla kullanılan ortalama türü aritmetik ortalamadır. Aritmetik ortalama, tüm
veri dizisinin toplanıp veri sayısına bölünmesiyle elde edilir.
•Geometrik ortalama n tane değerin çarpımının n'inci dereceden kökü alınarak bulunur. Seride negatif bir
değer veya sıfır varsa geometrik ortalama hesaplanamaz.
TÜM ÜNİTELERİN ÖZETLERİ
Sayfa 1
İSTATİSTİK
•Harmonik ortalama, gözlem sonuçlarının çarpma işlemine göre terslerinin, aritmetik ortalamasının tersidir.
Geometrik ortalamada olduğu gibi seride sıfır veya negatif değer bulunduğu durumlarda harmonik ortalama
bulunması mümkün değildir.
•Kareli ortalama sayısal olarak elde edilen verilerin karelerinin aritmetik ortalamasının karekökü alınarak
hesaplanır.
•Parametrik merkezî eğilim ölçüleri arasında H < G < ̅ < K şeklinde bir büyüklük ilişkisi vardır.
•Serideki değerlerin bir kısmı dikkate alınarak hesaplanan merkezî eğilim ölçülerine parametrik olmayan
merkezî eğilim ölçüleri denir.
•Nitel değişkenli serileri en iyi temsil eden merkezî eğilim ölçüleri parametrik olmayan merkezî eğilim
ölçüleridir.
•Seride en çok tekrarlanan değere serinin modu denir.
•Serideki rakamlar büyüklük sırasına konulduğunda tam ortaya düşen değere medyan denir. medyan aynı
zamanda seriyi ikiye bölen değerdir.
•Seriyi bölen değerlere kantiller denir. Seriyi dört eşit parçaya bölen kantillere kartiller. Seriyi on eşit parçaya
bölen kantillere desiller. Seriyi yüz eşit parçaya bölen kantillere pörsentiller denir.
•Serideki değerlerin birbirinden ve merkezî eğilimden uzaklaşmalarına değişkenlik denir. Az çok her seride
değişkenlik olabilir. Değişkenliğin fazla olması güvenilir istatistikler elde edilmesini etkiler. Bu sebeple
serilerdeki değişkenliğin ölçülmesi gerekir. Serideki bütün değerlerin hesaba katılmasıyla elde edilen
değişkenlik ölçülerine parametrik değişkenlik ölçüleri denir. Parametrik değişkenlik ölçüleri, aritmetik
ortalama etrafındaki dağılımı ölçerler. Aritmetik ortalamadan mutlak sapmaları kullanan değişkenlik ölçüsü
ortalama sapmadır. Aritmetik ortalamadan kareli sapmaları kullanan değişkenlik ölçüleri ise varyans,
standart sapma ve değişim kat sayısıdır. İçerisinde en fazla bilgi bulunduran ve seriler arasında karşılaştırma
yapmada kullanılabilecek değişkenlik ölçüsü değişim kat sayısıdır.
Güvenilir tahminler yapmak için serinin dağılımının simetrik olması gerekirken; aynı dağılımın normal veya
normale göre dik olması gerekir. Serinin çarpıklığını çeşitli çarpıklık ölçüleri ile takip edebiliriz. Moda,
medyana ve kartillere dayalı çarpıklık ölçüleri serideki tüm değerlere tabi olmadığı için parametrik olmayan
çarpıklık ölçülerindendir. Aritmetik ortalama ettafındaki momentlere dayalı çarpıklık ölçüsü serideki tüm
değerlere tabidir. Çarpıklık ölçüleri normal dağılımın çarpıklık katsayısı olan 0 ile karşılaştırılır. Sıfırdan küçük
olan katsayılar serinin sola çarpık olduğunu, sofırdan büyük olan katsayılar serinin sağa çarpık olduğunu
gösterir. Serinin basıklığı aritmetik ortalama etrafındaki mometlere dayalı olarak hesaplanır. Bulunan katsayı
normal dağılımın basıklık katsayısı olan 3 ile karşılaştırılır. Basıklık katsayısı 3'ten büyük ise seri normale göre
diktir. Basıklık katsayısı 3'ten küçük olduğunda seri normale göre basıktır.
İndeksler zaman serilerinde temel yıla, mekân serilerinde ise ortalama değere göre üzerinde durulan
dönemin veya mekânın değerdeki yüzde değişimi gösterir. Bu ünite okunduğunda tek bir malın, hizmetin
veya bir iktisadi göstergenin fiyat, miktar veya değerindeki yüzde değişim hesaplanabileceği gibi birden fazla
mal veya hizmetin veya iktisadi göstergenin fiyat, miktar veya değerindeki yüzde değişim de hesaplanabilir.
•Bir olay kesin olarak meydana gelecekse veya kesin olarak meydana gelmeyecekse ihtimalden
bahsedilemez. Bir olayın olması mümkün olduğu gibi olmaması da mümkünse bu tür olaylara ihtimalli olaylar
denir. Bir olayın meydana gelme ihtimali söz konusu olayın meydana gelme sayısının o olayla birlikte
meydana gelmesi mümkün sonuç sayısına bölümüdür. Birbirini engelleyen birden fazla olaydan bir veya daha
fazlasının meydana gelme ihtimali bulunurken toplama kuralından yararlanılır. Birbirini engellemeyen bir
TÜM ÜNİTELERİN ÖZETLERİ
Sayfa 2
İSTATİSTİK
veya daha fazla olayın birlikte meydana gelme ihtimali hesaplanırken çarpma kuralından faydalanılır. Bir
olayın mümkün gerçekleşme yollarının ve bu yolların ihtimallerinin gösterildiği tabloya ihtimal dağılım
tablosu denir
•Sonuçları belirli tamsayı değerleri alan değişkenlere kesikli değişken denir. Kesikli tesadüfi değişkenlere ait
dağılımların ortalaması ∑ ( )ve standart sapması ∑ formülü ile hesaplanır.
•Binom olayları iki sonuçlu olaylardır. Binom olayları tekrarlanabilen olaylardır. Olayın gerçekleşmesi ihtimali
denemeden demeye değişmez. X bir binom dağılımı gösteren bir değişken ise olayın n defa tekrarlanması
durumunda olayın sonuçlarına ait ihtimaller 𝑥 𝑛𝑥𝑝𝑥( 𝑝) −𝑥 formülü ile hesaplanır.
•Poisson olayları binom olaylarına çok benzer. Binom olayından farkı olayın bir denemede gerçekleşmesi
ihtimali oldukça küçüktür. X bir poisson dağılımı gösteren bir değişken ise olayın n defa tekrarlanması
durumunda olayın sonuçlarına ait ihtimaller 𝑥 𝑥
𝑥𝑋! formülü ile hesaplanır
•İncelenecek bir çok sürekli değişkene ait dağılımın normal dağılıma uygun olduğu kabul edilmektedir.
Normal dağılan Değişkenlere ait değerler standart değerlere dönüştürülebilir. Sürekli değişken değerleri
standart değerlere dönüştürüldükten sonra ihtimal hesaplamalarına konu olabilir. Standart normal dağılım
için hesaplanmış olan hazır tablolar kullanılarak sürekli bir değişkene ait ihtimal hesaplamaları yapılabilir.
Dağılımın ortalaması ve standart sapması biliniyorsa standart değerler kullanılarak ihtimalin hesaplanmasına
konu olan sürekli değişken değeri de hesaplanabilir.
•Üzerinde durulan olayın sonuçları kesikli değişken değerleri alması durumunda olayın sonuçlarına ait
ihtimal dağılımı kesikli ihtimal dağılımıdır. Söz konusu olayın 30 ya da daha fazla tekrarlanması durumunda
kesikli olayın ihtimal dağılımı normal dağılıma yaklaşır. Bu durumda ilgili kesikli değişken dağılımının
ortalaması ve standart sapması bulunarak değişkene ait sonuçlar standart değerlere dönüştürülür. Standart
normal eğri alanları tablosu kullanılarak olayın sonuçlarına ait ihtimaller hesaplanır.
TÜM ÜNİTELERİN ÖZETLERİ
Sayfa 3
Download