İSTATİSTİK -I (OLASILIK) Hafta; 01 Yrd. Doç. Dr. Tijen ÖVER ÖZÇELİK tover@sakarya.edu.tr Konular İstatistik Temel Kavramlarına Giriş Verilerin Derlenmesi, Düzenlenmesi ve Analizi Veri Düzenleme Grafiksel Gösterimler ve Merkezi Eğilim Ölçüleri Geometrik Ortalama (G) Sapma (Dağılma) ölçüleri Asimetri ve Basıklık Ölçüleri Küme Teorisi Ve Olasılık Hesapları Olasılık Hesapları Şartlı Olasılık Rassal Değişken Sürekli Olasılık Dağılım (Birikimli-Kümülatif)Fonksiyonu Bileşik Olasılık Dağılım Fonksiyonu Beklenen değer ve Momentler Olasılık Dağılımları İstatistik Temel Kavramlarına Giriş 1. Hafta İstatistik Temel Kavramlarına Giriş Verilerin Derlenmesi, Düzenlenmesi ve Analizi Veri Düzenleme Grafiksel Gösterimler ve Merkezi Eğilim Ölçüleri 2. Hafta Geometrik Ortalama (G) Sapma (Dağılma) ölçüleri Asimetri ve Basıklık Ölçüleri (Kısa Sınav 1) 3. Hafta Küme Teorisi Ve Olasılık Hesapları Olasılık Hesapları Şartlı Olasılık) (Kısa Sınav 2) 4. Hafta Rassal Değişken Sürekli Olasılık Dağılım (Birikimli-Kümülatif)Fonksiyonu Bileşik Olasılık Dağılım Fonksiyonu (Vize) 5. Hafta Beklenen değer ve Momentler Olasılık Dağılımları İstatistik Temel Kavramlarına Giriş İstatistik Temel Kavramlarına Giriş • İstatistik kelimesinin Latincede durum anlamına gelen “Statüs” • İtalyancada devletin siyasal durumunu belirlemede kullanılan “Stato” kökünden geldiğini kabul etmektedirler. • Günlük hayatta istatistik ya da istatistikler denildiğinde, belirli bir olaya ilişkin derlenmiş sayısal bilgiler akla gelir. • Nüfus, • fiyat, • ithalat, • ihracat, • gelir, • turizm, • sağlık istatistikleri gibi. İstatistik Temel Kavramlarına Giriş • Metodoloji açısından istatistik sözcüğü; • istatistiğe konu olabilen olayların gözlenerek ilgili verilerin derlenmesi, • işlenmesi, • analizi ve yorumlanmasında kullanılan tekniklerin tümünü ifade eder. • XX. yüzyılın başlarında istatistik alanındaki gelişmeler, istatistik sözcüğüne teknik içerikli yeni bir anlam kazandırmıştır. • Buna paralel olarak istatistik sözcüğü, hakkında bilgi edinilmek istenen ve ana kütle olarak isimlendirilen yığına ilişkin sayısal karakteristikleri (parametreleri) tahmin etmek amacıyla, ilgili kütleden belirli kurallara göre seçilen istatistik birimlerinin oluşturduğu örneklem adı verilen topluluğa ilişkin sayısal karakteristikler anlamında da kullanılmaktadır. İstatistik Temel Kavramlarına Giriş Tipik olay • İstatistik de tüm diğer bilim dalları gibi olayları konu alır. Olayları; • tipik ve • toplu olaylar olarak ikiye ayırarak incelemek mümkündür. • Tipik Olaylar az sayıda faktör tarafından etkilenen olaylardır. • Eğer bir olaylar kümesinde tek bir olay, tüm olaylar kümesini temsil edebiliyorsa, bu tür olaylara tipik olay denir. • Ancak istatistik tipik olaylarla ilgilenmez. Örneğin, ideal koşullar altında ve uygun bir laboratuar ortamında iki hidrojen ve bir oksijen atomu bir araya getirilirse, su elde edilir. • Bu deney aynı koşullar altında kaç kez tekrarlanırsa tekrarlansın, her deneyin sonucunda su elde edilecektir. İstatistik Temel Kavramlarına Giriş Toplu olay • Toplu olay, bir olaylar kümesinde tek bir örnek ya da deneyin diğer örnekleri ve deneyleri, bunun sonucu olarak ta ait olduğu kümeyi temsil edemeyen olaylardır. • Örneğin; • firmaların yıllık ciroları, • trafik kazaları, • evlenmeler, • boşanmalar, • doğumlar, • ölümler ve benzeri gibi her gün karşılaşılan olaylar, birer toplu olay niteliğindedir. • İstatistik, belirli amaç ya da amaçlar doğrultusunda gözlenen toplu olaylardan derlenen sayısal verilerin işlenerek, ilgili olayların oluşturduğu yığınların bilimsel olarak incelenmesinde kullanılan teknik ve yöntemler bilimi olarak ta tanımlanabilir. İstatistik Temel Kavramlarına Giriş Betimsel İstatistik • Verilerin analiz ve sunumu için temel iki istatistik yöntemden söz edilebilir. Bunlar; • Betimsel-Tanımlayıcı (Tasviri-Descriptive) istatistik ve • Çıkarımsal (inferential) istatistik yöntemler şeklinde ifade edilebilir. • Betimsel istatistik, verilerin organize edilip özetlenip en uygun şekilde sunuma hazır hale getirilmesidir. • İstatistik seriler, tablolar, grafikler, merkezi eğilim ölçüleri, sapma ölçüleri vs. bu grupta yer alır. • Bir iş yerinde çalışan kişilerin aldıkları ücretlerin dağılımı, • ortalaması, • sapması, • Bir işletmede üretilen mamullerin günlük üretim miktarlarının dağılışı vs. betimsel istatistiklere örnek verilebilir. İstatistik Temel Kavramlarına Giriş Çıkarımsal İstatistik • Çıkarımsal istatistik ise; • seçilen örnekten hareketle anakütle parametreleri hakkında tahminlerde bulunmayı, • anakütle ile ilgili hipotezler için sorgulama yapmayı ve • karar vermeyi içerir. • Parametrik ve parametrik olmayan hipotez testleri, regresyon analizi vs. bu grupta yer alır. • Bir malın günlük satışlarının ortalamasının %95 güvenle 15;20 birim arasında olacağının tahmini çıkarımsal istatistiğe örnek gösterilebilir. • Hangi istatistik yöntem kullanılırsa çalışmanın temeli veriye dayanmaktadır. kullanılsın bir istatistik • Bu nedenle bir istatistik çalışmanın güvenilir olabilmesi için verinin doğru bir şekilde elde edilmiş olması gerekir. İstatistik Temel Kavramlarına Giriş Birim • İstatistik analize konu olan ve anakütleyi oluşturan toplu olay niteliğindeki her olaya birim adı verilir. • Kolaylıkla anlaşılabileceği gibi tüm canlı ve cansız varlıklar birer istatistik birimidir. • Ancak, maddesel bir varlığa sahip olmayan olaylar ve sosyal durumlar da birer istatistik birimi olabilirler. • Bir olayın birim olabilmesi için, ölçülmeye ya da sayılmaya elverişli olması gerekir. • Ölçülemeyen ya da sayılamayan nesneler ve olaylar istatistiksel anlamda birim oluşturamazlar. İstatistik Temel Kavramlarına Giriş Değişken (özellik) ve şık • Değişken, istatistik birimlerinin sahip oldukları özellikler olarak ifade edilir. • Şık ise, bu özelliklerin farklı ortaya çıkış biçimlerine, başka bir anlatımla değişkenlerin aldıkları değerlere denir. • Öğrenciler üzerinde yapılan bir öğrenci olarak tanımlanırken, araştırmada birim • değişken öğrencilerin cinsiyetleri, doğum yerleri, yaşları, ağırlıkları boy uzunlukları ve notları olur. • Cinsiyet değişkeninin şıkları ise kız ve erkek olarak tanımlanır. • Benzer şekilde her bir öğrencinin değişkeninin şıkları olacaktır. yaşları da yaş İstatistik Temel Kavramlarına Giriş Ölçeklerine göre değişkenler • Birim, Değişken ve Şık Örnekleri İstatistik Temel Kavramlarına Giriş Ölçeklerine göre değişkenler • Değişkenler ölçeklerine göre dört grupta incelenir. • Nominal (İsimsel) değişkenler: Nominal değişkenler sadece kalitatif (niteliksel) sınıflandırmalarda kullanılırlar. • Bu değişkenlerin ölçümü ve sıralanması mümkün değildir. İnsanların medeni hali, cinsiyeti, mesleği, göz rengi buna örnek olarak gösterilebilir. • Ordinal (Sıralama) değişkenler: Bu değişken ölçülen değerlerin birbirlerine göre büyüklüklerini belirleyen ancak bir değişkenin diğerinden ne kadar büyük ya da küçük olduğunu ifade edemeyen değişkenlerdir. • Memurların derece ve kademeleri, öğrenim durumu (ilk, orta, lise, üniversite vs.) büyük, küçük ayrımları, Likert-Semantik ölçekler (Kesinlikle Katılıyorum, Katılıyorum, Karasızım, Katılmıyorum, Kesinlikle Katılmıyorum), bu değişkene örnek gösterilebilir. İstatistik Temel Kavramlarına Giriş Ölçeklerine göre değişkenler • Interval (Aralık) değişkenler: Sıcaklık, başarı, performans gibi niceliksel değişkenleri ölçmek için kullanılır. • Aralık ölçeğinin oran ölçeğinden temel farkı bir başlangıç noktasının bulunmamasıdır. Diğer bir ifade ile “0” değeri aralık ölçeğinde yokluk ifade etmez. Örneğin termometrede görülen “0°C” belirli bir anlam taşır. • Ratio (Oran) değişkenler: Ratio değişkenler interval değişkenlere benzerler, interval değişkenlerin özelliklerine ek olarak, tanımlanabilen bir sıfır noktasına sahiplerdir, böylece “X Y’den 2 kat daha fazladır” gibi ifadeler de kullanabiliriz. • Aylık gelir, ağırlık, uzunluk, hız gibi değişkenleri ölçmek için kullanılır. noktasıdır. Bu ölçekte başlangıç “0” İstatistik Temel Kavramlarına Giriş Ölçeklerine göre değişkenler İstatistik Temel Kavramlarına Giriş Sürekli ve Kesikli (Süreksiz) değişkenler • Sürekli Değişken: Değişkenler ölçülerek, sıralanarak ya da herhangi bir analiz yöntemi kullanılarak elde edilir. İki ölçüm arası sonsuz sayıda değer alabilir. Aralık biçiminde ifade edilebilirler. Kesirli sayılar alabilir. • nicel değişkenler süreklidir diyebiliriz sayı ile ifade edilir • nitel değişkenler kesiklidir diyebiliriz sayı yerine sembolle ifade edilir. • Kesikli Değişken: Değişkenlerin ölçüleri 0, 1, 2 gibi kesin değerler alırlar. Ara değerler söz konusu değildir. Nitel değişkenler sayılarla ifade edilirse kesikli değişken sınıfına girer (Eğitim durumuna göre, okur-yazar değil=0, ilkokul=1, ortaokul=2, lise=3, üniversite=4). İstatistik Temel Kavramlarına Giriş İstatistik Temel Kavramlarına Giriş Sürekli ve Kesikli (Süreksiz) değişkenler Genel olarak ölçümler sürekli, sayımlar kesikli verileri oluşturur. Örnek sorular; Aşağıdakilerden hangisi kesikli değişkendir? • Bir galerinin herhangi bir ayda satmış olduğu otomobil sayısı • Bir kişinin boy uzunluğu • Sınavda bir sorunun çözülme süresi Aşağıdakilerden hangisi sürekli değişkendir? • Herhangi bir günde bir tiyatroya gelen izleyici sayısı • Bir ailenin çocuk sayısı • Bir bebeğin ağırlığı Örnek sorular; Aşağıdakilerden hangisi kesikli değişkendir? • Bir çağrı merkezine gelen telefonların arasındaki geçen süre • Birinin sahip olduğu ayakkabı sayısı • Sınavda bir sorunun çözülme süresi Aşağıdakilerden hangisi sürekli değişkendir? • Bir aşçının günlük kullandığı yumurta sayısı • Bir çocuğun azındaki çürük diş sayısı • Bir mandıranın günlük sattığı süt miktarı İstatistik Temel Kavramlarına Giriş Bağımlı (açıklanan) ve Bağımsız (açıklayıcı) • Bağımlı Değişken: Sebep-sonuç ilişkisinde sonuç olan değişkendir. Açıklanmak istenen değişkendir. • Bağımsız değişken: Sebep-sonuç ilişkisinde sebep durumunda olan değişkendir, ya da bağımlı değişkeni açıklayan değişkendir. İstatistik Temel Kavramlarına Giriş Ana Kütle (İstatistik Kütlesi) • Toplu olay niteliğinde ve aynı cins birimlerin oluşturduğu topluluğa “ana kütle” ya da “istatistik kütlesi” adı verilir. • Ancak, bir istatistik kütlesinden söz edebilmek için, öncelikle kütleyi oluşturan birimlerin, aynı genel nedenlerin etkisinde olması gereklidir. • Ayrıca kütle, istatistik birimlerinin toplamından farklı bir yapıya da sahip olmamalıdır. • Bir ülkede yaşayan insanlar, • belirli bir bölgedeki evler, • bir yıl süresince belirli bir yerleşim merkezinde gözlenen doğumlar, ölümler, • trafik kazaları, istatistik kütlesi için örnekler oluşturur. İstatistik Temel Kavramlarına Giriş Kütle Türleri • Gerçek ya da Varsayımsal Kütleler • Gerçek birimlerin oluşturdukları kütlelere, “gerçek kütle” adı verilir. Gerçek Birim: Maddesel bir varlığa sahip olsun ya da olmasın, gerçekte var olan, ortaya çıkmış birimlere gerçek birim denir. Ev, araba, bina, masa maddesel varlığa sahip gerçekte var olan birimleri oluştururken, ölüm, evlenme, doğum, trafik kazası gibi maddesel bir varlığa sahip olmayan ama gerçekte var olan birimler gerçek birimleri oluşturur. • Bir üniversitenin öğrencileri, bir yerleşim merkezinde bir yılda gözlenen trafik kazaları ve doğum olaylarının oluşturdukları kütleler, gerçek kütlelere örnek oluştururlar. • Henüz oluşmamış, ancak oluşturulması mümkün olan kütlelere ise “varsayımsal kütle” adı verilir. • Kolaylıkla görülebileceği gibi varsayımsal birimlerim oluşturduğu kütlelerdir. kütleler, varsayımsal • Örneğin, 25 kişilik bir25işçi grubundan rastgele seçilecek 6 kişilik bir grup için C 6 177100 farklı seçim yapılabilir. 177100 farklı 6 kişilik grupların oluşturduğu kütle varsayımsal bir kütledir. Buradaki gruplar farazi olarak mevcut olup, fiilen ortada yoktur İstatistik Temel Kavramlarına Giriş Ana Kütle (İstatistik Kütlesi) Sonlu ya da Sonsuz Kütleler • Eğer bir kütledeki birimler sonlu sayıdaysa, başka bir ifadeyle sayılabilir sayıda ise, bu tür kütlelere “sonlu (belirli)”, kütleyi oluşturan birim sayısı sayılamıyorsa, bu tür kütlelere de “sonsuz (belirsiz)” kütle adı verilir. • • Örneğin, bir köyde yaşayan insanların sayısı sayılabileceğinden bu köyde yaşayan insanların oluşturduğu kütle sonlu bir kütledir. Bir insanın vücudundaki hücre sayısı sayılamayacak sayıda olduğundan sonsuz kütledir. Sürekli ya da Süreksiz Kütleler • Parçalandıkları ya da birleştirildikleri zaman, niteliklerini kaybettikleri için, doğal birimlerden oluşan kütleler süreksiz, (Örneğin masa, araba, insan, kalem doğal birimlerdir. Masa ya da otomobil çeşitli parçalara ayrıldığında, kendi özelliklerini yani masa ya da araç olma özelliğini yitirirler) • Parçalandıkları ya da birleştirildiklerinde, niteliklerini kaybetmedikleri için de doğal olmayan birimlerden oluşan kütlelerse, sürekli kütleleri oluştururlar, (Mesela kumaş parçalara ayrılırsa özelliğini kaybetmez. Sadece daha küçük kumaş parçaları elde edilmiş olur. Tarla da aynı şekilde küçük parçalara bölünebilir) • Zaman ve mekan birimleri doğal birimler olmadıkları için, her zaman sürekli kütleleri oluştururlar. İstatistik Temel Kavramlarına Giriş Örnek (örneklem) ve Örnekleme • Örneklem • Araştırılmak istenen bir olayla ilgili kütleden, belli kurallara göre seçilmiş, kütleyi temsil ettiği varsayılan küçük bir küme örneklem olarak adlandırılır. • Örneklem anakütleyi parçalarından oluşur. oluşturan varlıkların alt • Örnekleme • Anakütle özelliklerini ortaya koyabilmek amacıyla anakütleden örnek seçme işlemine örnekleme denir. • Örnekleme ile yapılacak bir araştırmanın anakütledeki gerçek durumu ortaya çıkarabilmesi için en önemli koşul örneklemin anakütleyi temsil edebilir nitelikte olmasıdır. İstatistik Temel Kavramlarına Giriş Örnek (örneklem) ve Örnekleme • Anakütleyi temsil yeteneğine sahip bir örneklemin temel özellikleri şunlardır. • Örneklemin büyüklüğü (hacmi, miktarı) yeterli olmalıdır. • Örneklem anakütledeki dağılıma çeşit ve oran yönünden benzer olmalıdır. • Örneklem olasılıklı örnekleme yöntemlerinden biriyle seçilmelidir. • Örneklem seçiminde tarafsız davranılmalıdır. Anakütledeki bütün birimlerin örneğe girme şanslarını eşit kılmak gerekir. Verilerin Derlenmesi, Düzenlenmesi ve Analizi • Veri derleme; belirlenen amaçlar doğrultusunda gözlemlenecek birimlerin ölçülmesi ya da sayılması, sonra da bunların, ilgilenilen değişkenlere göre, hangi şıklara sahip olduğunun belirlenmesi ve kaydedilmesi işlemlerini içerir. • Birim Seçimi: Belirlenen amaç ya da amaçlar doğrultusunda, ilgilenilen toplu olayın tanımlanmasıyla “birim seçme” işlemi gerçekleştirilmiş olur. Başka bir anlatımla, kimlerin ya da nelerin gözleneceği belirlenir. Ancak birim seçilirken, amaca uygunluk ve uygulanabilirlik özelliklerinin göz önünde bulundurulması gerekir. Değişken ve Şıkların Belirlenmesi • Bir kütleyi oluşturan istatistik birimleri üzerinde birçok değişken tanımlanabilir. • Veri derlenirken sadece belirlenen amaçlar doğrultusundaki değişkenler göz önünde tutulmalıdır. • Uygulamalarda çok sayıda değişken hakkında veri toplamak zor, zaman alıcı ve maliyet yükseltici olabilir. • Değişken sayısının artması soru sayısının artmasına, soru sayısının artması da sorulara gelişigüzel cevap vermeye yönlendirebilir. • Bu sebeple seçilen değişkenler araştırmanın amacına uygun, sayısı da aşırı olmamalıdır. Değişken ve Şıkların Belirlenmesi • Uygulamalarda gözlem sayısı sonlu olmalıdır. • Benzer şekilde gözlemlere bağlı olarak ilgili değişkenlerin alacakları değerler de (şıklar da) ilgili değişken sürekli ya da süreksiz olsun, sonlu olacaktır. • Şıklar belirlenirken, gözden uzak tutulmaması gereken önemli bir nokta da gözlemlerde kullanılan ölçü biriminin araştırmanın doğasına uygun olması gereğidir. • Yani ölçü biriminin ilgili değişkenin büyüklüğü ile orantılı olmalıdır. • Örneğin bir işletmede aylık elektrik giderlerini bin TL cinsinden ifade ederken, işletmenin yıllık cirosu için milyon TL kullanmak uygun olacaktır. Peynir üreten bir işletme için kilo, teneke, ton uygun ölçülerken, süt üretimi için litre, şişe, paket uygun ölçü birimleri olacaktır. Kütlenin Sınırlandırılması • Bir istatistiksel araştırma planlanırken, araştırmanın nerede, kimlerle ve nelerle gerçekleştirileceği, ne kadar zamanda tamamlanacağı ve araştırma için ayrılan kaynaklar, ayrıca gözlem sayısının sonlu olması, kütlenin mekan ve zaman açısından sınırlandırılmasını zorunlu kılar. • Başarılı bir sınırlandırma uygulamacılara büyük kolaylık sağlar. • Böylece araştırmanın çerçevesi net bir şekilde ortaya konmuş olacak, araştırma bu sınırlar içerisindeki alana odaklanacaktır. Verilerin Taşıması Gereken Özellikleri Verilerin doğruluğu, geçerliliği ve güvenilirliğini sağlayabilmek için verilerin bazı özellikleri taşıması gerekir. Böylece veri kalitesi yükseltilmiş olacaktır. Veriler Araştırma Konusu ile İlgili Olmalıdır • Veriler belirli bir alanla ilgili olarak toplanıyorsa kendi içinde tutarlı olmalıdır. • Bu alana başka bir konuyla ilgili veri ve bilgiler alınmamalıdır. • Pazarlama konusundan söz edilirken satın almayla ilgili veriler veya başka bir işletmeye ilişkin bilgiler işin içine karıştırılmamalıdır. Verilerin Taşıması Gereken Özellikleri • Doğruluk o Veriler tekrarlanan gözlemlere dayanmalı, yöneticilerin kendi ağızlarından ifade edilmiş olmalı ve şirket kayıtlarıyla da teyit edilmiş bulunmalıdır. o Araştırmacı kendi tahminlerini, izlenimlerini ve hislerini veri olarak sunamaz. o Eğer bu şekilde bir yorum yapıyorsa bu yorumun kendisine ait olduğunu açık bir şekilde belirtmelidir. • Kalite o Verilerin kalitesi amacı uygunluktur. o Veriler işe yarıyorsa, sonuç çıkarıla biliniyorsa ve bir karara varmak mümkün ise kalitelidir. o Pratik değeri olmayan veriler kalitesizdir. o Araştırmacı araştırma kapsamına aldığı her veriyi amaca hizmet etme derecesi açısından değerlendirmelidir. o Amaca hizmet yönü zayıf olan veri ve bilgiler büyük ölçüde araştırma kapsamından çıkarılmalıdır. Verilerin Taşıması Gereken Özellikleri • Zamanındalık o Verilerin zamanında elde edilmesi anlamına gelir. o Araştırma sürecinde bazı verilere istendiği anda ulaşılamayabilir. o Ancak verilerin toplanması, organizasyonu ve analizli belirli sürelerle kısıtlıdır. o Zamanında ulaşmayan veya elde edilmeyen veri değersizdir. o Çünkü veri ihtiyaç olduğu yer ve zamanda kıymetlidir. Modası geçmiş verinin bir değeri olmaz. • Tamlık o Verilerin tam olması, incelenen alanla ilgili olarak gerekli olan hiçbir bilgiyi/veriyi dışarıda bırakmamasıdır. o Örneğin, insan kaynaklarıyla ilgili olarak personelin işletmeye seçilmesinde takip edilen yöntemler araştırılıyorsa personel seçim sistemlerinden hangilerinin uygulandığı, ne sıklıkta uygulandığı, niçin uygulanamadığı, işletmeye ne gibi yükler getirdiği tam olarak raporlanmalıdır. Veri Derleme Türleri Veri derleme süreci kabaca, sürekli ve ani ve kısmi ve genel olmak üzere iki başlık altında toplanabilir. • Sürekli Birim; Belirli bir süre içerisinde istenildiği anda gözlemlenebilen birimlerdir. Mesela insan, ticari kuruluş, konut, araçlar sürekli birimlerdir. Sürekli birimler maddesel varlığa sahip birimlerdir. • Ani Birim: Belirli bir anda ortaya çıkan ve ancak ortaya çıktıkları anda incelenebilen, maddesel varlığa sahip olmayan birimlerdir. Evlenme, boşanma, trafik kazası, ölüm ani birimlerdir. • Ani ve Sürekli Veri Derleme Ani Veri Derleme Eğer gözlemlenecek kütledeki birimler sürekli karakterdeyse, istenilen bir anda gözlenmeye hazır olan bu tür birimlerin gözlenmesi ya da kaydedilmesi işlemlerine “ani veri derleme” denir. Sürekli olayların kısa veya uzun bir zaman aralığı içinde herhangi bir anda sayılabilme, ölçülebilme imkanı vardır. Nüfus sayımları ve iş yeri sayımları bu tür veri derlemeye örnek gösterilebilir. ÖRNEK SORU • Aşağıdakilerden hangisi sürekli birimdir? A) Evlenme B) Doğum C) Ölüm D) Boşanma E) Ticari kuruluş • ÇÖZÜM: Sürekli birimler, maddesel bir varlığa sahip, istenilen herhangi bir zamanda gözlenebilen, bir anda ortaya çıkmayan ve belirli bir süre devam eden birimlerdir. Seçeneklerde verilen evlenme, boşanma, ölüm ve doğum, belirli bir anda ortaya çıkan, ancak ortaya çıktığı anda gözlemlenebilen ve maddesel bir varlığa sahip olmayan birimlerdir. Ticari kuruluş ise maddi varlığı olan, istenilen bir zamanda gözlemlenebilen ve belirli bir süre varlığı devam eden birim olduğu için sürekli birim olarak adlandırılır. Ancak unutulmaması gereken bir nokta, ticari kuruluşlarla ilgili iflaslar aniden ortaya çıkan ve belirli bir anda gözlemlenebilen birim olduğu için ani birimdir. • Doğru cevap (E) seçeneğidir. Veri Derleme Türleri • Sürekli Veri Derleme Bazı olaylar bir anda olup biterler. Bu tür olayların tekrarlanması ve belli bir zaman aralığında bir arada bulunması mümkün değildir. Eğer ilgilenilen kütle bu tür birimlerden oluşmuşsa (bu tür birimler zamana yayıldığından), belli bir zaman aralığında gözlenmeleri ve kaydedilmeleri gerekir. Bu tür işlemlere “sürekli veri derleme” denir. Bir iş yerinde belli bir zaman aralığında meydana gelen iş kazaları, makine arızalanmaları, üretim durmaları, belirli bir bölgede ve zaman aralığında evlenmeler, boşanmalar, trafik kazaları, doğumlar ve ölümlere ilişkin derlenen veriler, bu tür veri derlemeye örnek oluşturur. Veri Derleme Türleri • Genel ve Kısmi Veri Derleme • Genel Veri Derleme (Tam sayım) Hakkında bilgi edinilmek istenen kütlenin tamamının gözlenmesine “genel veri derleme” ya da “tam sayım” adı verilir. Genel nüfus ve tarım sayımları birer genel veri derlemedir. Açıktır ki, bu tür veri derleme hem pahalı hem de güçtür. Öte yandan deneylerin tahribatlı olması, üzerinde araştırma yapılan anakütlenin araştırma zamanı içerisinde değişime uğruyor olması veya kısa sürede bilgiye ulaşılmak istenmesi genel veri derleme yöntemini kullanmayı olumsuz yönde etkileyen faktörlerdir. Ancak güvenilirliğin çok yüksek tutulduğu deneylerde, anakütle hacminin az olduğu durumlarda genel veri derleme yöntemi tercih edilir. Veri Derleme Türleri • Kısmi Veri Derleme Hakkında bilgi edinilmek istenen kütleyi oluşturan birimler arasından, belirlenen amaçlar doğrultusunda yalnızca bir kısmının seçilip gözlenmesine, “kısmi veri derleme” adı verilir. Kısmi veri derleme, genel veri derlemenin pahalı oluşu, zaman alışı, gözlem birimlerinin fiziksel zarara uğraması gibi nedenlerle yapılmak istenmediği durumlarda uygulanır. Seçimlerden önce araştırma şirketlerinin seçilmiş belli noktalarda ve sınırlı sayıda seçmenle yaptığı seçmen eğiliminin belirlenmesine yönelik çalışmalar kısmi veri derlemeye örnek verilebilir. Veri Derleme Yöntemleri Birincil ve ikincil veri kaynakları • İşletmelerde veriler birincil ve ikincil kaynaklardan elde edilir. • Birincil kaynaklar incelenmek istenen ana kütleye ait birimler üzerinde yapılan araştırma ve incelemelerden oluşur. İşletmenin kendi iç kaynakları ile gözlem, deney veya alan taraması yöntemlerini kullanarak elde ettiği verilere birincil kaynak verisidir. • İkincil veri kaynakları ise işletme dışı kaynaklardan elde edilen çeşitli kurum ve kuruluşların (Türkiye İstatistik Kurumu, Devlet Planlama Teşkilatı, Hazine müsteşarlığı, Merkez bankası vs.) yayınlarından oluşur. Kitaplar, dergilerdeki makaleler, ansiklopedi maddeleri, istatistikler, tezler, gazeteler, yayımlanmış raporlar, el kitapları, broşürler, kataloglar ikincil veri kaynakları olarak sayılabilir. Birincil Kaynaktan Veri Derleme Yöntemleri • Birincil kaynaklardan veri derlemede deney, gözlem ve alan taraması yöntemleri kullanılmaktadır. 1. Deney Yöntemi Deneyler, bağımlı değişken ile bu bağımlı değişkenin değişimi üzerinde etkide bulunduğu varsayılan bağımsız (açıklayıcı, faktör) değişkenlerin sebep - sonuç ilişkilerini ortaya koymak amacıyla düzenlenmiş yapay düzenlerdir. Bu yapay düzeneklerden veri toplama yöntemine deney yöntemi adı verilmektedir. Deney yöntemi, diğer araştırma yöntemleri içinde en fazla güvenilir doğru sonuçlar veren bir uygulamadır. Bu yöntem, insan hatasını en alt düzeye düşürecek şekilde geliştirilmiştir. Deneyler aracılığı ile veri toplama yöntemine çoğunlukla deneysel çalışma, deneysel araştırma adı da verilmektedir. Birincil Kaynaktan Veri Derleme Yöntemleri 2. Gözlem Yöntemi Gözlem bir kimsenin diğer canlı ve cansız varlıklar hakkında duyu organları ile bilgi edinme yolu veya varlıkların değişik ortamlarda, çeşitli davranışları hakkında onları gözleme yolu ile bilgi toplamasıdır. Gözlem yöntemi araştırmacının uygun bulduğu her tür sosyal ve kurumsal ortamda bir veri toplama aracı olarak kullanılabilir. Gözlem tekniğinde işletmelerde personelin, yöneticilerin, müşterilerin veya bir çalışma grubunun davranışları, doğrudan veya dolaylı olarak gözlenmek suretiyle önceden oluşturulmuş, belli bir sistematiğe göre veri toplanır. Bu yöntemle yapılandırılmış (müdahaleli) veya yapılandırılmamış (müdahalesiz - doğal) yollarla veri toplanır. Birincil Kaynaktan Veri Derleme Yöntemleri 3. Alan Taraması Yöntemi Alan taraması yöntemiyle veri toplama işlemi de kendi içinde üç alt başlıkta incelenir. Bunlar mülakat, anket ve belge incelemesi yöntemleri olarak ifade edilebilir. 3.1. Mülakat Yöntemi İşletmelerde mülakat işletme sahipleriyle, profesyonel yöneticilerle müşterilerle ve çalışanlarla yapılabilir. İşletme sahibinden veya üst düzey yöneticilerden izin alınmadan çalışanlarla mülakat yapmak doğru değildir. Mülakat yönteminin etkililiği randevu alınarak yapılmasıdır. Randevu alınmadığı durumda konular yeterli ayrıntıda görüşülemeyebilir. Etkili bir mülakat için işletme yöneticisine sorulması düşünülen sorular önceden verilebilir. Üç farklı mülakat yöntemi vardır. Bunlar, biçimsel, yarı biçimsel ve biçimsel olmayan mülakat yöntemleridir. Birincil Kaynaktan Veri Derleme Yöntemleri 3.2 Anket Yöntemi Alan taraması içinde ikinci yöntem anket yöntemidir. Bireylerin bazı davranışları ve bazı düşünsel, duygusal, inançsal, güdüsel, algısal özellikleri vardır ki, yapısı gereği gözlenmesi olanaksızdır. Bu tür konuları incelemek için yapılacak araştırmalarda anket yöntemi kullanılır. Anket en basit tanımıyla Soru-cevap tekniğiyle uygulanan sistematik bir veri toplama yöntemidir. Önceden belirlenmiş insanlara bir takım sorular sorularak uygulanır. Bir çeşit yazılı iletişim tekniği ile uygulanan veri toplama yöntemidir. Uygulama alanı genellikle toplum olduğu için uygulama aşaması da oldukça güç koşullar altında yürütülür. Birincil Kaynaktan Veri Derleme Yöntemleri Anket Yöntemi • Anket İçin Soru Kağıdının Hazırlanması Anket yöntemiyle yapılacak bir araştırmadan istenilen sonuçların elde edilebilmesi için konuya uygun soruların seçilmesi ve bunların soru kağıdı üzerinde uygun biçimde düzenlenmesi çok önemlidir. Bir ankette olabilecek soru türleri şunlardır: • Standart Soru Önceden hazırlanan, aynı sözcüklerle ve aynı sırada deneklere yöneltilen sorulardır. Amaç tüm deneklerin aynı soruyu aynı biçimde anlaması, yorumlaması ve kendi görüşüne göre cevaplamasıdır. Birincil Kaynaktan Veri Derleme Yöntemleri Anket Yöntemi • Serbest Soru Katılımcıya yöneltilen bir soruya alınan yanıtlara göre görüşmeci tarafından o anda sorulması gerekli görülen sorulardır. Standart biçim, sayı ve sırada hazırlanmadığı için değişik deneklere değişik sorular yöneltilebilir. Bu nedenle alınan yanıtların değerlendirilmesi ve karşılaştırmaların yapılabilmesi oldukça güçtür. Ayrıca serbest sorularla görüşmeyi yürütmek çok güç ve çok deneyim isteyen bir iştir. Özel bilgi, beceri ve eğitim gerektirir. Birincil Kaynaktan Veri Derleme Yöntemleri Anket Yöntemi Kapalı Uçlu Soru: Kapalı uçlu soruda deneğe yöneltilen sorunun karşılığı sorunun içindedir. • Genellikle evet-hayır, sıralama, bir dizi yanıt içinden istediğini seçme biçimlerinde olabilir. • Kapalı uçlu soruda, cevap seçenekleri önceden geliştirilip sorularla birlikte verilmektedir. Bu konuyla ilgili şöyle bir örnek verilebilir. • “Eğitim durumunuz nedir?” sorusuna ( ) İlkokul ( ) Ortaokul ( ) Lise ( ) Üniversite ( ) Y. Lisans • “Okulda başarı düzeyiniz nasıldır?“ sorusu için ( ) Zayıf ( ) Orta ( ) İyi ( ) Pekiyi gibi cevaplar verilecektir. • Kapalı uçlu soruların katılımcı kişi için cevaplama kolaylığı sağlaması ve araştırmacı için değerlendirme kolaylığı vermesidir avantajlı taraflarıdır. Birincil Kaynaktan Veri Derleme Yöntemleri Anket Yöntemi • Açık Uçlu Soru: Kendisine yöneltilen soruya denek istediği yanıtı verir. Kapalı uçlu soruda olduğu gibi, önceden düzenlenen yanıtlardan birini seçmesi istenmez. Katılımcı, genel sınırlar içinde, soruyu, istediği kapsam ve derinlikte ve kendi anlatımı ile cevaplama hakkına sahiptir. “İşletmede ıskarta düşünüyorsunuz?”, oranının düşürülmesi için ne “İşletmenin ücret politikası ile ilgili ne düşünüyorsunuz?” gibi sorulara katılımcının istediği şekilde cevap vermesi istenir. • Açık uçlu ve kapalı uçlu soru türlerinden her ikisinin de iyi ve sakıncalı yanları vardır. Bir soru kağıdına yalnız kapalı uçlu ya da açık uçlu sorular konabileceği gibi ikisi birlikte de konabilir. Birincil Kaynaktan Veri Derleme Yöntemleri • Belge İnceleme Yöntemi İşletme kayıtları (belgeler) yönetim merkezinde, üretim ve hizmet sunum birimlerinde bulunabilir. Burada önemli olan nokta araştırmacının sektörü, ürünü veya hizmeti tanıyarak hangi tür kayıtlara ihtiyacı olacağını bilmesidir. Sektörü, iş grubunu tanımadan işletme kayıtları araştırılamaz. Öte yandan işletme kayıtları aynı sektörde faaliyet gösteren işletmeler arasında dahi büyük ölçüde farklılık gösterir. Kayıtların isimleri, formatı, içeriği farklı olabilir. Araştırmacı bu nedenle işletme kayıtları olgusunu geniş bir açıdan ele almalı, beklediği kayıtlara ulaşamamışsa bu kayıtların yerini tutabilecek diğer kayıtları incelemelidir. İkincil Veriler Farklı amaçlarla değişik kurum ve kuruluşlar tarafından geçmiş dönemlerde derlenmiş veriler ikincil veri adı verilmektedir. • Bu veriler yurt içi ve yurtdışı kaynaklardan elde edilebilirler. • Veriler ham ve işlenmiş şekilde de bulunabilir. • Eğer bir alanda ikincil veriler mevcutsa birincil veri toplamak hem zaman, kaynak israfına sebep olur, hem de konuya ilişkin yeterince kaynak taraması yapılmadığı anlamına gelir. • Özellikle uluslar arası karşılaştırmaların konu edildiği çalışmalarda genellikle ikincil verilere ihtiyaç duyulmaktadır. • Bu alanda Birleşmiş Milletler Teşkilatı, Dünya Bankası, Uluslararası Para Fonu gibi kuruluşlar geniş veri tabanına sahiptir. • Bunun yanında resmi olmayan bir kısım kuruluşlar da ülke ve bölge raporları yayımlamaktadır. Veri Düzenleme Grafiksel Gösterimler ve Merkezi Eğilim Ölçüleri Verilerin İşlenmesi • Yapılan bir araştırmada elde edilen veriler dağınık, düzensiz ve karmaşık bir hal içerir. • Bu şekliyle veriden anlamlı bir sonuca ulaşmak mümkün değildir. • İstatistik analizin hammaddesi niteliğinde olan bu ham verinin işlenerek düzenli ve anlaşılır hale getirilmesi gerekir. • Çeşitli kaynaklardan derlenmiş ya da bizim tarafımızdan anket, deney ya da gözlem gibi tekniklerle toplanmış olan ham verilerin anlaşılır ve düzenli hale getirilebilmesi için istatistik seriler, tablolar ve grafiklerden faydalanılır. VERİLERİN DÜZENLENMESİ VE SUNUMU Seriler; Zaman serileri Mekan serileri Dağılım serileri Basit Seri: Derlenmiş olan sayısal verilerin küçükten büyüğe doğru sıralanması ile elde edilen serilerdir. Tasnif edilmiş seri/Frekanslı seri: Bu tür serilerde tekrarlanan elemanlar bir araya getirilerek frekanslar şeklinde ifade edilen seridir. Gruplanmış seri: Belli değer aralıklarına düşen birimler bir araya getirilerek oluşturulan frekanslı serilere gruplanmış seri adı verilir. 52 Zaman serisi Verileri gün, hafta, ay, yıl gibi zaman vasfının şıklarına göre düzenlenmiş olarak gösteren serilerdir. Zaman serisi iki sütundan oluşur. Birinci sütunda zaman vasfının şıkları, ikinci sütunda ise olaya ait değerler bulunur. Örnek: Yıllara göre Türkiye nüfusu Yıllar 1950 1955 1960 1965 1970 Nüfus(milyon) 20,9 24,1 27,8 31,4 35,6 53 Veri Düzenleme Zaman Serileri • Bir değişkenin değerlerinin zamanın şıklarına göre (gün, ay, mevsim, yıl vb.) değişimini gösteren serilere zaman serisi denir. • Zaman serisi verileri eşit zaman aralıkları ile derlenmiş verilerden oluşur. Yıllar X malı fiyatı 2000 12 2001 18 2002 15 2003 20 2004 27 2005 24 Mekan serisi Toplanan verileri mekan vasfının şıklarına göre sıralanmış olarak gösteren seriler mekan serileri adını alır. Mekan vasfının şıkları ülke, bölge, il, ilçe, köy gibi şıklar olabilir. Seri iki sütundan oluşur. İlk sütunda mekan vasfının şıkları, ikici sütunda değerler bulunur. Örnek: İllere göre 1970 yılı nüfus değerleri İller Nüfus(bin kişi) İstanbul 3.019 Ankara 2.042 İzmir 1.427 Adana 1.035 Bursa 848 55 Dağılım serileri Zaman ve mekan vasfının dışında kalan maddi değişken olarak tanınan değişkenlerin şıklarına göre düzenlenmiş seriler dağılım serileridir. Bir sınıftaki öğrencilerin aldığı notlar, boy uzunluğu, ağırlık , işçi sayısı gibi özellikler örnek verilebilir. Dağılım serileri sayısal olmayan özelliklere göre de düzenlenebilir. Ancak sayısal özelliklere göre düzenlenmiş dağılım serileri daha çok kullanılmaktadır. Bu tür dağılım serileri 3 sınıfta toplanabilir. Basit seriler Frekanslı/Sınıflanmış (tasnif edilmiş) seriler Gruplanmış seriler 56 Veri Düzenleme Niceliksel (Kantitatif- Ölçülebilen) Verilerin İstatistik Bölünme Serileriyle Gösterilmesi • Niceliksel olarak ifade edilen sayısal olarak ifade edilen ya da ölçülebilir özellik taşıyan değişkenlere ait verilerin istatistik bölünme serileri ile gösterilmesinde basit, tasnif edilmiş ve gruplanmış seriler kullanılır. • Basit Seri: Derlenmiş olan sayısal verilerin küçükten büyüğe doğru sıralanması ile elde edilen serilerdir. • Tasnif edilmiş seri: Tasnif edilmiş serilerde tekrarlayan elemanlar bir araya getirilerek frekanslar şeklinde ifade edilen seridir. • Gruplanmış seri: Belli değer aralıklarına düşen birimler bir araya getirilerek oluşturulan frekanslı serilere gruplanmış seri adı verilir. Dağılım Serileri Basit seri Tasnif edilmiş/Frekanslı seri Gruplu seri 58 Basit Seri • Araştırma veya analizlerde kullanılmak üzere elde edilen veri sayısı az ise bu tür veri yapılarına BASİT SERİ adı verilir. • Verilerin büyükten küçüğe sıralanmasıyla oluşturulan seridir. veya küçükten büyüğe Örnek: 7 öğrencinin bir dersten devamsızlık sayıları 3,4,6,1,5,2,4 olsun. Verileri küçükten büyüğe doğru sıraladığımızda; basit seri; 1,2,3,4,4,5,6 elde edilir. 59 Basit Seri Örnek: Bir işletmede çalışan 25 işçiye verilecek çocuk paraları ile ilgili bir araştırma yapılmaktadır. İşçilerin çocuk sayıları aşağıda verilmiştir. 1,3,2,2,3,1,4,5,3,6,0,5,2,3,2,4,8,0,1,2,3,3,1,0,4 Verilen değerleri basit seri şeklinde düzenleyelim. 0,0,0,1,1,1,1,2,2,2,2,2,3,3,3,3,3,3,4,4,4,5,5,6,8 60 Veri Düzenleme Niceliksel (Kantitatif- Ölçülebilen) Verilerin İstatistik Bölünme Serileriyle Gösterilmesi • Basit seri örnekleri Notlar Uzunluklar Satışlar 10 143 3 22 147 4 30 155 6 43 160 7 50 167 7 55 170 7 63 176 8 70 185 8 90 191 9 Basit Seri 62 Basit Seri Örnek: 12 öğrencinin bir dersten aldığı notlar; 50, 65, 0, 30, 25, 50, 30, 45, 90, 70, 50, 75 Notlar(xi ) 0 25 30 30 45 50 50 50 65 70 75 90 63 Frekanslı seri Basit seriler bazı dönüştürülebilir küçük düzenlemelerle frekanslı seriye Gözlem sonuçlarının düzenlenerek birinci sütunda olaya ait değerleri, ikinci sütunda frekansları gösterecek şekilde hazırlanırsa sınıflanmış seri elde edilir. Örnek: 12 öğrencinin bir derse ait notları (basit seri için verilen örnek) ve frekansları Notlar(xi) Frekanslar(ni) 0 1 25 1 Not; frekans 30 2 değerlerinin 45 1 toplamının 50 3 gözlem sayısına 65 1 70 1 eşit olması 75 1 gerekir. 90 1 Frekanslı Seri Değişkenlerin çeşitli şıklarının kütlede kaç defa tekrarlandığını gösteren sayılar frekans adını alır. İncelenecek birim sayısının artması ile basit seriler yan yana veya alt alta yazılmış uzun sayı dizileri oluşturulacaktır. Bu durumda çalışma kolaylığı sağlaması için frekans serileri düzenlenir. Örnek: Daha önce basit seri olarak düzenlenen seriyi frekans serisi olarak düzenleyiniz. Basit seri; 0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 4, 4, 4, 5, 5, 6, 8 xi fi 0 3 1 4 2 5 3 6 4 3 5 2 6 1 8 1 Toplam 25 65 Veri Düzenleme Niceliksel (Kantitatif- Ölçülebilen) Verilerin İstatistik Bölünme Serileriyle Gösterilmesi • Tasnif edilmiş seri örnekleri Notlar (Xi) 1 2 3 4 5 Toplam Öğr.say (fi) 3 5 8 4 1 21 Uzunluk Fert say (Xi) (fi) 160 3 165 5 170 4 180 2 190 1 Toplam 15 Satışlar Gün say (Xi) (fi) 4 1 5 3 6 6 7 4 8 2 Toplam 16 Frekans Serilerinin Grafikle Gösterilmesi Xi 2 4 6 8 10 fi 1 5 7 4 2 67 Basit seri 18, 20, 21, 22, 23, 23, 23, 24, 24, 24, 24, 25, 25, 25, 26, 26, 26, 27, 27, 27, 27, 28, 29, 29, 30, 31, 32, 32 Ele alınan değişkenin şıkları çok sayıda ise sınıflamada sorun çıkabilir. Bu durumda gruplamaya başvurulur. Frekanslı seri X (satış adedi) 18 1 20 1 21 1 22 1 23 3 24 4 25 3 26 5 27 4 28 1 29 2 30 1 31 1 32 2 toplam 30 68 Gruplama Bir değişkenin birbirine yakın olan şıklarını bir araya getirmeye gruplama denir. Örneğin meslek istatistikleri yapılırken serbest çalışan doktor, avukat, dişçi, tüccar gibi meslekler “serbest meslekler” grubuna alınmaktadır. Gruplama ile toplanan veriler hakkında daha geniş ve açık bilgiler alınabileceği gibi, her gruba düşen frekans sayısı da büyür. Gruplamanın bu yararları yanında bazı sakıncaları da vardır. Örneğin grup sınırlarının belirtilmesi önemli bir sorundur. 69 Veri Düzenleme Niceliksel (Kantitatif- Ölçülebilen) Verilerin İstatistik Bölünme Serileriyle Gösterilmesi • Gruplanmış seri örnekleri Notlar Öğrenci sayısı 0 - 20 Uzunluk Fert sayısı Satışlar Gün sayısı 4 140 – 150 2 10 – 30 1 20 – 40 10 150 – 160 5 30 – 40 4 40 – 60 20 160 – 170 12 40 – 50 7 60 – 80 13 170 – 180 10 50 – 70 6 80 –100 3 180 – 190 6 70 – 100 3 Veri Düzenleme Niceliksel (Kantitatif- Ölçülebilen) Verilerin İstatistik Bölünme Serileriyle Gösterilmesi • Kesikli karakterdeki niceliksel verileri gruplarken sınıf aralıklarında boşluklar oluşur. • Yandaki seride KOBİ’lerde çalışan işçi sayısı değişkeni kesikli bir özelliğe sahiptir. • Bu değişken tamsayı dışında değerler almaz. • Bu sebeple sınıflar arası boşluklar oluşur. Çalışan İşçi KOBİ Sayısı Sayısı 5 – 14 10 15 – 24 20 25 – 34 25 35 – 44 15 45 – 54 5 Basit ve tasnif edilmiş serinin Gruplanmış seriye dönüştürülmesi • Basit ve tasnif edilmiş serilerle verinin anlaşılır hale gelmesi mümkün olmuyorsa böyle durumlarda veriyi sınıflara ayırarak gruplanmış seriye dönüştürmek gerekebilir. • Veriyi gruplamak için aşağıdaki Sturges sınıf aralığı formülü kullanılabilir. X max X min S 1 3,3 log N • S: Sınıf aralığı • Xmax: Verinin en büyük değeri • Xmin: Verinin en küçük değeri • N: Veri sayısı Bir verinin gruplanmış seriye dönüştürülmesi • Xmin: 25 Öğrencilerin ağırlıkları 37 67 79 58 51 33 53 95 60 64 43 66 81 58 65 50 64 50 70 25 56 46 40 56 59 51 89 57 77 60 57 63 80 77 59 73 Xmax: 95 95 25 S 11,37 11 1 3,322 log 36 • Serinin sınıf aralıkları 11 birim olacak şekilde uygun olacaktır. gruplanması Bir verinin gruplanmış seriye dönüştürülmesi Ağırlıklar Öğrenci sayısı 25 - 36 dan az 2 36 - 47 “ “ 4 47 - 58 “ “ 9 58 - 69 “ “ 12 69 - 80 “ “ 5 80 - 91 “ “ 3 91 - 100 “ “ 1 Kesikli değişkenlerde gruplu seri Kesikli karakterdeki niceliksel verileri gruplarken sınıf aralıklarında boşluklar oluşur. Yandaki seride işçi sayısı değişkeni kesikli bir özelliğe sahiptir. Bu değişken tamsayı dışında değerler almaz. Bu sebeple sınıflar arası boşluklar oluşur. sınıflar 18-20 2 21-23 5 24-26 12 27-29 7 30-32 4 toplam 30 k=5 (32-18)/5=2.8 Gruplanmış seri Paketlerin gramajları 992 993 994 995 996 997 998 999 1000 1001 1002 1003 1004 1005 frekanslar 1 1 1 2 2 2 3 5 3 2 4 1 2 1 Oluşturulan frekanslı seri sınıflar 992-994 den az 2 994-996 dan az 5 996-998 den az 4 998-1000 den az 8 1000-1002 den az 5 1002-1004 den az 5 1004-1006 dan az 3 toplam 30 Sürekli değişkene ait gruplu seri Mühendislik fakültesi dekanı öğrencilerin haftalık kaç saat çalıştıklarıyla ilgili bir çalışma yapıyor. 30 öğrenciyi tesadüfi olarak seçiyor ve onların geçen hafta kaç saat çalıştıklarını kaydediyor. 15.0, 23.7, 19.7, 15.4, 18.3, 23.0, 14.2, 20.8, 13.5, 20.7, 17.4, 18.6, 12.9, 20.3, 13.7, 21.4, 18.3, 29.8, 17.1, 18.9, 10.3, 26.1, 15.7, 14.0, 17.8, 33.8, 23.2, 12.9, 27.1, 16.6. Veriyi gruplandırıp frekans tablosunu oluşturunuz. kaç tane grup kullanacağına aşağıdaki formülle belirle 2k > n k=sınıf sayısı n=gözlem sayısı sınıf aralığını aşağıdaki formülü kullanarak bul C> R=H – L = 33.8 – 10.3 = 4.7 5 k H=verideki en büyük değer, L=verideki en küçük değer, k=grup/sınıf sayısı Çıkan sonucu 5’e yuvarla İlk sınıfın alt sınırını 10 olarak belirle ve 5 sınıf oluştur. Gruplanmış Seri Tabloları 80 Çapraz Tablolar • Bazı durumlarda değişkenin iki farklı özelliğinin aynı tabloda eşleştirilmiş olarak gösterilmesi istenebilir. • Böyle durumlarda çapraz tablo kullanılır. • Tabloda satıra istatistik birimlerin bir özelliği, sütuna diğer özelliği yazılarak ortak eleman sayıları hücrelere yazılmak suretiyle çapraz tablolar oluşturulur. • Çapraz tablolar hem niteliksel, hem de niceliksel veriler için oluşturulabilir. • Aşağıda MYO öğrencilerinin mezun oldukları lise türü ve öğrenim verilmiştir. gördükleri bölümlere göre dağılışı • Bu tablo niteliksel veriler için düzenlenmiş bir tablodur. Çapraz Tablo Örneği Lise Lise Türü Bölümler Çevre Bilgisayar Kalıpçılık Lojistik Makine Mekatronik Düz lise 27 11 16 8 17 9 Anadolu Fen 2 0 0 0 1 0 Ticaret 0 3 5 3 0 2 End. Meslek 0 9 3 5 5 2 Diğer 3 0 3 0 6 3 Toplam 32 23 27 16 29 16 Verilerin Grafiklerle Gösterilmesi •Niteliksel seriler ve Tasnif edilmiş seriler için çubuk diyagramı 1 2 3 Öğrenci sayısı 3 7 10 4 6 5 2 Öğrenci sayısı Notlar Öğrenci sayısının dağılımı 12 10 8 6 4 2 0 1 2 3 Notlar 4 5 Verilen sınıflandırılmış serinin histogramını çiziniz ? Histogram Genellikle sınıflandırılmış serilerde kullanılan bir grafik türüdür. Frekans serileri de içinde kullanılabilmektedir. Birbirine bitişik dikdörtgenlerden oluşur. Bir sınıfa ait dikdörtgenin alanı ile sınıfın frekansı eşit hale gelir. Bunun içinde her bir sınıfın ayarlanmış frekansları bulunur, sınıfların ayarlanmış frekansları bulunurken ilgili sınıfın frekansını sınıf alanına böleriz. Böylece sınıfları yatay ayarlanmış frekansları düşey eksende göstererek histogramı çizeriz. Gruplanmış serinin Histogram grafiği Bu grafiğin diğer bir ismi sütun grafiğidir. Grafiğin özelliği sürekli karakterde verilerin grafiği olması sebebiyle histogram sütunların birbirine bitişik olmasıdır Gruplanmış serinin Histogram grafiği • Sınıf aralıkları eşit olmadığı durumda da histogram grafiği yine önceki örnekte olduğu gibi çizilir, yani histogram sütunlarının alanını frekansa eşit yapacak şekilde frekansların yeniden hesaplanması gerekir. • Yanda öğrenci notları serisi farklı sınıf aralıkları ile verilmiştir 0 – 5 den az Öğrenci sayısı 10 5 – 7 den az 20 7 – 9 dan az 14 9 - 10 5 Notlar Gruplanmış serinin Histogram grafiği Notlar Öğrenci sayısı Sınıf Genişliği Ayarlanmış frekans 0–5 10 5 10/5 = 2 5–7 20 2 20/2 = 10 7–9 14 2 14/2 = 7 9 - 10 5 1 5/1 = 5 Eğer seri açık sınıflı ise histogramı çizilemez. Birinci sınıfın alt limiti veya son sınıfın üst limiti veya ortadaki gruplardan birisi yoksa bu seri açık sınıflı seri olur (20-25 sınıfında 20 veya 25 den birisi yoksa) Frekans Eğrisi (Poligonu) Histogram sütunlarının üst orta noktalarından geçen grafiktir. Bu grafik dağılımın şeklini ortaya koymada kullanılan bir grafiktir. Not sınıfları Öğrenci sayısı 25 – 36 den az 2 36 – 47 47 – 58 58 – 69 69 – 80 80 – 91 “ “ “ “ “ “ “ “ “ “ 4 9 12 5 3 91 – 100 “ “ 1 Dairesel Grafikler • Özellikle niteliksel (sayısal olmayan) değişken değerlerinin grafikle gösterilmesinde kullanılırlar. Dairenin frekanslara açısal olarak paylaştırılması ile elde edilir. Bir birimin açısal karşılığı şöyle bulunur. • Açısal değer 360 360 3 derece Toplam frekans 120 • Her kategorinin frekansı bu 3 ile çarpılarak dairedeki açısal değeri bulunur. Dairesel Grafikler Mezun old. Lise Öğr. sayısı Açısal değer End. Meslek Lis. 50 150 Düz Lise 40 120 20 60 10 30 120 360 Ticaret Lisesi Diğer Liseler Toplam Zaman Serisi Grafiği (Çizgi Grafiği) • Zamana bağlı olarak sabit aralıklarla toplanmış olan verilerin eğilimini ve değişimini izleyebilmek için çizgi grafiklerinden faydalanılır. • Grafikte yatay eksen zamanı, dikey eksen ise zaman serisi değerlerini göstermektedir. Zaman serileri artan, azalan, durağan ya da periyodik değişen veya bu özelliklerin bir kısmını içeren verilerden oluşur. • Nüfus, gelir, enerji tüketimi, konut sayısı vs. artan zaman serilerine örnek gösterilebilir. • Modası geçen, teknolojisi eskiyen ürünlerin satışı azalan zaman serisi niteliğindedir. Konutlarda tüketilen doğalgaz miktarı, meşrubat tüketimi vb. hem eğilimli hem de periyodik değişim gösteren bir özelliğe sahiptir. Artan bir zaman serisi ve grafiği Yıllar X malı fiyatı 2000 12 2001 18 2002 15 2003 20 2004 27 2005 24 Dağılım Grafiği • Aralarında ilişki olduğu düşünülen iki değişkenin birbirine göre nasıl bir değişim gösterdiğini, nasıl bir ilişki içinde olduğunu gösteren grafiklerdir. • Genellikle bu değişkenlerden bir etkileyen (bağımsız, açıklayan), diğeri etkilenen (bağımlı, açıklanan) değişken olarak ortaya çıkar. • Bir malın fiyatı ile onun talebi arasında ters bir ilişki olduğu düşünülür. • Kişilerin gelirleri ile tüketim harcamaları arasında pozitif bir ilişkinin olduğu kabul edilir. • Aşağıda öğrencilerin matematik notları ile istatistik notları arasındaki gösterilmiştir. ilişki dağılım grafiği ile Dağılım Grafiği Matematik notu 70 25 40 55 90 15 70 Dağılım Grafiği İstatistik notu İstatistik notu 60 30 50 40 80 20 80 90 80 70 60 50 40 30 20 10 0 0 20 40 60 80 Matematik notu 100 Üç boyutlu grafikler Çapraz tablo şeklindeki verilerin grafikle gösteriminde kullanılır. Bu grafikte dikey eksen frekansları, yatay eksenler ise değişkenin iki özelliğini gösterecek şekilde dizayn edilir. Lise Çevre Bilgisa yar Kalıp çılık Lojis tik Düz lise 17 11 6 8 Ticaret 2 0 0 0 Anadolu 0 3 5 13 EML 0 9 15 5 Diğer 3 0 6 0 Merkezi Eğilim Ölçüleri (Ortalamalar) • Analitik Ortalamalar • Aritmetik • Geometrik • Harmonik • Kareli ortalama • Analitik olmayan ortalamalar • Mod • Medyan • Kartil, Desil ve Santiller I. Merkezi Eğilim Ölçüleri (Ortalamalar) • Bir veri setinin merkez noktasını gösteren, serinin normal değerinin bir göstergesi olan ve veriyi tek bir değerle ifade eden değerlere merkezi eğilim ölçüleri adı verilir. Bir verinin ortalaması onun en küçük ve en büyük değeri arasında yer alır. Ortalamaların Faydaları: kısaca şöyle özetlenebilir. X min Ortalama X max Ortalamaların faydaları 1. Ortalamalar çoğu zaman serinin normal değerini gösterir. Tabi bunun için serinin dağılımının da aşırı çarpık olmaması gerekir. 2. İstatistik analiz işleminin temel elemanlarından biridir. 3. Aynı birimle ölçmek kaydıyla karşılaştırmaya imkan tanır. farklı serileri 4. Tek bir sayı olması sebebiyle hatırda tutulması kolaydır. Ortalamalar verinin tamamını kapsayıp kapsamamasına göre analitik ve analitik olmayan ortalamalar şeklinde iki grupta incelenir. 1. Analitik (Hassas ortalamalar) Verideki bütün değerleri dikkate alarak hesaplanan ortalamalardır. Analitik ortalamalar verinin özelliğine ve hesap tarzına göre dört farklı şekilde elde edilir. 1.1. Aritmetik ortalama ( X ) 1.2. Geometrik ortalama (G) 1.3. Harmonik ortalama (H) 1.4. Kareli ortalama (K). 1.1. Aritmetik ortalama • Aritmetik ortalama serideki gözlem değerleri toplamının toplam gözlem sayısına oranıdır. X 1 X 2 ........... XN X i • Basit seride X N N f 1 X 1 f 2 X 2 .... fkXk f i X i • Tasnif edilmiş seride X f 1 f 2 .... fk fi • Gruplanmış seride Xi : i. gözlem değeri f m f 2 m2 .... f k mk X 1 1 f1 f 2 .... f k fm f fi : i. değerin frekansı mi : i. sınıfın orta noktası N : toplam gözlem sayısı i i i Aritmetik ortalamanın hesaplanışında veri setindeki tüm veri değerleri kullanılır. Bir veri setinin yalnızca bir aritmetik ortalaması vardır. Aritmetik ortalamanın önemli bir sakıncası, data setindeki aşırı değerlerden kolay etkilenmesidir. Bir data setinde verilerden bir kaçı çok yüksek yada küçük değerler içeriyor ise, aritmetik ortalama, data setinin merkezi eğilim ölçümünü temsil etmek için uygun olmayabilir. Örnek: 5 öğrencinin bir sınavda almış olduğu notlar 70, 70, 70, 70, ve 100`dir. Aritmetik ortalama 76 olacaktır. Bu aritmetik ortalama veri setinin iyi bir şekilde temsil etmemektedir. Dezavantajları Aritmetik ortalama çok popüler olarak hesaplanıp kullanılmakla beraber bazı önemli dezavantajları bulunmaktadır. Aritmetik ortalama aşırı değerlere duyarlı (yani güçsüz) bir merkezsel konum ölçüsüdür. Eğer veri dizisi için asimetrik olarak sadece bir uçsal değer ya aşırı küçük ya aşırı büyük ise aritmetik ortalama o aşırı değere yaklaşma gösterir. Aritmetik ortalama her türlü ölçülme ölçekli sayısal veri için kullanılamaz. İsimsel ölçekli sayısal veriler için aritmetik ortalama anlamsızdır. Sırasal ölçekli sayısal veriler için aritmetik ortalama kullanılması büyük tartışmalara açıktır. Birçok kişi değişik kişilerin sıralamalarının aynı olduğunu kabul etmedikleri için elde edilen verilerin toplamının ve bu toplamdan çıkartılan aritmetik ortalamanın anlamsız olacağını kabul etmektedirler. Ancak işletme alanı, davranışsal bilimler ve sosyal bilimlerde, özellikle anket verileri, sırasal ölçekli olmakta, ve buna rağmen bu verilerin aritmetik ortalamaları pratikte önemli alanlarda kullanılmaktadır. Aralıksal ölçekli ve oransal ölçekli sayısal veriler için aritmetik ortalama anlamlıdır • Örnek: Adapazarı'nda nisan ayı ortalama yağışlarını tahmin etmek için geçmiş nisan ayı yağış rakamlarından rasgele 7 tanesi seçilmiş ve aşağıdaki sonuçlar elde edilmiştir. • Bu verilerden hareketle Adapazarı'nda nisan ayı yağışlarının aritmetik ortalamasını hesaplayınız. Nisan ayı yağışları (Kg) (Xi) 60 75 80 100 120 130 155 ∑Xi=720 X 1 X 2 ........... XN X N X i 720 X N 7 X 102,86 Kg Örnek Bir işletmede aynı parçayı üreten işçilerin bu parçayı üretim sürelerinin dağılımı aşağıdaki gibi gözlenmiştir. Parça üretim süresinin aritmetik ortalamasını bulunuz. 5 Parça üretim İşçi süresi(dk)(Xi) sayısı (f ) i fi.Xi 12 2 24 13 5 65 14 10 140 X f i Xi i 1 5 fi 398 28 i 1 X 14,21 dk . 12 10 15 16 7 4 105 64 8 6 4 2 0 Toplam 28 398 12 13 14 15 16 Örnek Bir işyerinde yapılan telefon görüşmelerinin süresinin dağılımı için aşağıdaki gruplanmış seri verilmiştir. Buna göre görüşme süresinin aritmetik ortalamasını bulunuz. k Görüşme Görüşme süresi sayısı (fi) mi fimi 0 - 2 1 5 X 5 f i mi i 1 k fi 670 110 i 1 2 - 4 10 3 30 4 - 6 40 5 200 X 6,09 dak ik a 45 40 6 -8 30 7 210 35 30 25 8 - 10 Toplam 25 110 9 225 670 20 15 10 5 0 1 3 5 7 9 Aritmetik Ortalamanın Avantaj ve Dezavantajları • Aritmetik Ortalamanın Avantajları: • Belirli bir değer etrafında toplanma eğilimi yüksekse aritmetik ortalama seriyi en iyi temsil eden tek bir değer verir. • Serideki değerlerin aritmetik ortalamadan sapmalarının (farklarının) toplamı sıfırdır. ( Xi − X ) = 0 • Bu özelliğinden dolayı aritmetik ortalamalar standart sapmanın hesaplanmasında kullanılır. • Serideki değerlerin aritmetik ortalamadan sapmalarının (farklarının) toplamının sonucu minimumdur. ( Xi − X )2 = min. • Aritmetik ortalamanın hesaplanmasında kullanılan gözlem sayısı arttıkça, aritmetik ortalamanın dağılımı normal dağılıma yaklaşır. • Hesaplanması ve anlaşılması kolaydır. Bundan dolayı en yaygın kullanılan ortalama çeşididir. • Aritmetik ortalamalar standart sapma, ortalama sapma vb. istatistiki ölçümlerde kullanılacağından avantajlı ve dezavantajlı özelliklerinin bilinmesinde bundan sonraki çalışmalar için faydası olacaktır. • Aritmetik Ortalamanın Dezavantajları: • Aritmetik ortalamanın hesaplamasında serideki bütün değerler hesaplamaya dâhil edilmektedir. Aritmetik ortalama serideki uç (sapan, aşırı) değerlere karşı hassastır. Seride bir veya birden fazla çok küçük veya çok büyük değer (uç değer) mevcutsa bu değerler aritmetik ortalamayı kendi yönlerine doğru sürüklerler. Bundan dolayı aritmetik ortalama normal değerinden çok uzaklaşarak seriyi temsil yeteneğini kaybedebilir. • Açık uçlu frekans dağılımının olduğu durumlarda aritmetik ortalama hesaplamak doğru olmaz. Ağırlıklı Aritmetik Ortalama • Ağırlıklı Aritmetik Ortalama: Bazı durumlarda serideki verilerin önem dereceleri (ağırlıkları) farklı olabilir. • Böyle durumlarda aritmetik ortalama hesaplanırken bu ağırlıklarında ( wi ) dikkate alınarak hesaplamaya katılması daha uygun olur. • Çeşitli seriler için ağırlıklı aritmetik ortalama ( 𝑋𝐴 ) aşağıdaki formüller yardımıyla hesaplanabilir. Tartılı Aritmetik Ortalama • Bir serideki gözlem değerlerlerinin önem dereceleri farklı olursa, bu tür serilerin aritmetik ortalaması tartılı olarak hesaplanır. • Bunun için önem derecesini gösteren katsayılar (tartılar) kullanılır. • Örnek olarak öğrencilerin ortalama notlarını hesaplarken derslerin kredileri tartı olarak düşünülürken, ücretlerin belirlenmesinde kıdem tartı olarak kabul edilebilir. ti X i Basit seride XT ti • Tasnif edilmiş seride XT t f X t f t fm t f i i i • Gruplanmış seride XT i i i i i i i Örnek Aşağıda bir öğrencinin almış olduğu dersler, notları ve kredileri verilmiştir. Not ortalamasını tartılı aritmetik ortalama cinsinden hesaplayınız. Dersler Notlar (Xi) Kredi (ti) tiXi İstatistik 70 3 210 Matematik 60 4 240 Fizik 50 3 150 Kimya 80 2 160 Toplam 260 ti=12 tiXi=760 XT tX t i i i 760 12 X T 63,33 puan Örnek Bir işletmede işçilerin saat ücretleri çalıştıkları süre (kıdem) dikkate alınarak belirlenmektedir. Veriler aşağıdaki gibi olduğuna göre bu işletmede ortalama saat ücretini tartılı aritmetik ortalama cinsinden hesaplayınız. Saat ücreti (TL) İşçi sayısı (fi) Ortalama kıdem (ti) mi f it i fitimi f imi 1.00 – 1.40 10 2.5 1.20 25 30.0 12.00 1.40 – 1.60 30 5.0 1.50 150 225.0 45.00 1.60 – 1.80 50 9.5 1.70 475 807.5 85.00 1.80 – 2.00 15 13.0 1.90 195 370.5 16.90 2.00 – 2.50 5 18.0 2.25 90 202.5 11.25 Toplam 110 935 1635.5 170.15 ftm X ft i i i i i 1635,5 X 1,75 TL / saat 935 Tartılı aritmetik ortalamanın kullanıldığı yerler - Veriler arasında önem farkı bulunması halinde kullanılır. - Oranların ve ortalamaların ortalaması hesaplanırken kullanılır. - Ortalama maliyet ve satış fiyatı, bileşik fiyat ve miktar indekslerinin hesaplanmasında da tartılı ortalama kullanılır. Örnek Bir işletmede bulunan üç tezgahın belli bir günde ürettikleri malların sayısı ve üretimlerindeki kusurlu oranları aşağıdaki tabloda verilmiştir. Buna göre bu tezgahların ürettiği mamul kütlesinin kusurlu oranını bulunuz. Tezgah lar Üretim miktarı (ti) Kusurlu oranı (Xi) tiXi A 100 0.03 3 B 200 0.05 10 C 50 0.01 0.5 ti = 350 Xi = 0.09 tiXi = 13.5 XT tX t i i i 13,5 350 X T 0,03857 Aritmetik ortalamanın özellikleri Aritmetik ortalama hassas bir ortalama olup serideki aşırı değerlerden etkilenir ve aşırı değere doğru kayma gösterir. 1 - 2 - Serinin gözlem sayısı ile aritmetik ortalaması çarpılırsa serinin toplam değeri elde edilir. NX 3- Serideki gözlem değerlerinin aritmetik ortalamadan sapmaları toplamı sıfır olur. ( X i X ) X i NX X N i NX X X 0 N 4Serideki değerlerin aritmetik ortalamadan sapmalarının kareleri toplamı minimum olur. ( X i X ) 2 Minimum 5- Aritmetik ortalama özellikle normal dağılıma yakın serilerin ortalaması için elverişlidir. 6- Bir serinin değerleri, diğer iki serinin değerleri toplamından oluşuyorsa bu serinin aritmetik ortalaması da diğer iki serinin aritmetik ortalamaları toplamına eşit olur. X =Y +Z X i Aritmetik ortalamanın alıştırmaları