ISTATİSTİK I FIRAT EMİR DERS II S S VERİ: Değişkenlere karşılık gelen denek ya da gözlem değerlerine de “Veri” denir. S Veri Toplama Yöntemleri (Veri Kaynakları) S Tutulan eski kayıtlar, yayınlanan raporlar ve yıllıklar S Anket veya saha araştırması S Deney veya gözlem yaparak veri toplama S Önceden çeşitli kurumlar tarafından ya da çeşitli araştırmalar için hazırlanmış veri bankalarından hazır verilerin kullanılması. VERİ TASNİFİ (DÜZENLENMESİ) S Verilerin Basit Seri Şeklinde Düzenlenmesi Aşağıdaki sayılar saat 24 ile 7 arasında bir telefon santraline gelen toplam 911 çağrının 36 günlük dağılımını göstermektedir. 22 31 30 48 17 22 63 44 11 63 76 6 23 54 27 35 19 30 48 28 41 26 37 35 41 64 65 52 71 105 S Dağılım Sınırları: Veri kümesinde (Dağılımda) verilerin aldığı en büyük ve en küçük gözlem değerleridir. S En büyük değer (Xmax=Maksimum): Veri kümesinin aldığı en büyük değerdir buna dağılımın üst sınırı da denir. Örneğimizde istatistik dersi final sınavından alınan en yüksek not olan 100 değeridir. S En küçük değer (Xmin=Minimum): Veri kümesinin aldığı en küçük değerdir buna dağılımın alt sınırı da denir. Örneğimizde istatistik dersi final sınavından alınan en düşük not olan 40 değeridir. S Dağılım Genişliği (Aralığı) : Dağılımın en büyük (üst sınır) değeri ile en küçük (alt sınır) değeri arasındaki farktır. Örneğimizde, S Dağılım genişliği (DG) = En büyük değer - En küçük değer = 100 - 40 = 60 S Frekans: Değişkene ait aynı değere sahip bir verinin kaç kez tekrarlandığını gösterir. Değişkene ait verinin frekansı (sıklığı) fi ile gösterilir. Verilerin Gruplanmış (Sınıflanmış) Seri Şeklinde Düzenlenmesi S Bir değişkene ait çok sayıda ve birbirinden farklı veri mevcut ise bu verileri tasnif edilmiş seri (küme) şeklinde düzenlemek zordur. Bu gibi durumlarda değişkenlerin birbirine yakın değere sahip verileri bir arada toplanarak gruplanmış seri olarak sunulabilir. S Sınıf: Eşit ya da birbirine yakın değere sahip verilerin (gözlemlerin, deneklerin) bir arada gösterilerek oluşturulan her bir gruba sınıf denir. Sınıf sayısı, k ile ifade edilir. S Sınıfın Alt Sınırı (AS): Bir sınıfta yer alan en küçük değerdir. Örneğimizde AA (birinci) grubun alt sınırı 90 ve BA (ikinci) grubun alt sınırı 85 vb. gibidir. S Sınıfın Üst Sınırı (ÜS): Bir sınıfta yer alan en büyük değerdir. Örneğimizde AA (birinci) grubun üst sınırı 100 ve BA (ikinci) grubun üst sınırı 89 vb. gibidir. S Sınıf Aralığı: Ard arda gelen iki sınıfın üst sınır (en büyük değer) ile alt sınır (en küçük değer) arasındaki farktır. Sınıf aralığı, ss ile ifade edilir. Örneğimizde AA (birinci) grubun sınıf aralığı 11 ve BA (ikinci) grubun sınıf aralığı 5 vb. gibidir S Sınıf Sıklığı (Sınıf Frekansı): Bir sınıfta yer alan gözlem ya da denek sayısıdır. Örneğimizde AA (birinci) grubun sınıf sıklığı 50 ve BA (ikinci) grubun sınıf sıklığı 60 vb. gibidir. S Kümülatif Sıklık (Frekans): Sınıf sıklıklarının üst üste eklenmesi ile oluşan sıklıklara denir. S Sınıf Orta Değeri (mi): Bir sınıfın alt ve üst sınır değerlerinin ortalaması o sınıfın orta değerini verir. S Nisbi Frekans: Bir sınıfın frekansının toplam verı sayısına bölünmesi ile elde edilir. S Kümülatif Nisbi Sıklık (Frekans): Sınıf nisbi sıklıklarının üst üste eklenmesi ile oluşan sıklıklara denir. Seriler S Sayısal veriler yıl, ay, hafta vb. gibi zamana bağlı olarak sıralanmışsa zaman serisi oluşturulmuş olur. Zaman serileri araştırılan konunun özelliğine göre artan, azalan ya da dalgalı zaman serisi olabilir Tablo 3.1.1. İstanbul’daki Araç Sayısı Yıllar 2000 2001 2002 2003 2004 2005 2006 2007 Kaynak: Kurgusal veri, yalnızca örnek amaçlıdır Araç Sayısı 200.000 230.000 270.000 330.000 380.000 450.000 490.000 550.000 S Veriler toplandıkları ülke, bölge, şehir, ilçe vb. gibi bir mekâna göre düzenlenip sıralanmışsa mekânsal seriler oluşturulmuş olur. Tablo 3.1.7. Türkiye Bölgelere Göre Kişi Başına Milli Gelir Dağılımı (2000 yılı, TL) Bölgeler Milli Gelir Marmara 24.000 Ege 18.000 İç Anadolu 1.2000 Akdeniz 9000 Batı Karadeniz 7000 Doğu Karadeniz 6000 Güney Doğu Anadolu 5500 Doğu Anadolu 4000 Kaynak: Kurgusal veri, yalnızca örnek amaçlıdır Grafiksel Sunumlar S Grafikler toplanan verilerin tasnif ve gruplama işleminden geçirildikten sonra rakamlar yerine kolayca görsel olarak algılanabilecek şekiller yardımıyla sunulmasıdır. S Daire Grafikleri Yardımıyla Verilerin Sunumu S Sütun (Çubuk) Grafikleri Yardımıyla Verilerin Sunumu S Zaman Serisi Grafikleri Yardımıyla Verilerin Sunumu (Kartezyen Grafikler) S Histogram Yardımıyla Verilerin Sunumu (Gruplanmış Verilerin Grafikleri) S Frekans Poligonu Yardımıyla Verilerin Sunumu Daire Grafiği Tatil ve Eğlence 6% Diğerleri 4% Harcama Oranları Ulaşım 8% Kira 32% Giyecek 12% Eğitim 13% Gıda 25% Sütun (Çubuk) Grafikleri Halka Arz Edilen Şirket Sayısı 35 35 25 25 14 16 29 27 29 20 19 12 10 1 4 2 11 11 3 19 90 19 91 19 92 19 93 19 94 19 95 19 96 19 97 19 98 19 99 20 00 20 01 20 02 20 03 20 04 20 05 20 06 20 07 20 08 20 09 40 35 30 25 20 15 10 5 0 Halka Arz Edilen Şirket Sayısı 2 Zaman Serisi Grafikleri Yardımıyla Verilerin Sunumu (Kartezyen Grafikler) Grafik 3.2.7. İMKB 100 Değeri İMKB 100 Değeri 800 700 600 500 400 300 200 100 0 706 319 292 282 88 382 229 126 229 190 258 436 315 203 273 240 158 295 513 415 391 225 19 86 19 87 19 88 19 89 19 90 19 91 19 92 19 93 19 94 19 95 19 96 19 97 19 98 19 99 20 00 20 01 20 02 20 03 20 04 20 05 20 06 20 07 20 08 20 09 100 459 Histogram Poligon