TEMEL BİLEŞENLER ANALİZİ TEMEL BILEŞENLER ANALIZI Temel Bileşenler Analizi, yüz tanıma, resim sıkıştırma ve örüntü tanıma gibi alanlarda yaygın olarak kullanılan istatistiksel bir metottur. Temel Bileşenler Analizi belge boyunca PCA olarak ifade edilmiştir. Bu çalışmada, Temel Bileşenler Analizi konusuna geçmeden önce konunun daha iyi anlaşılması için öncelikle matematiksel temele değinilmiştir. ÖRÜNTÜ : çoğunlukla uzaysal ve geometrik karaktere sahip, iki veya üç boyutlu bir nesne olarak düşünülebilir. Diğer bir ifadeyle örüntü, ilgilenilen varlıkla ilgili gözlenebilir veya ölçülebilir bilgilere verilen isimdir. TEMEL BILEŞENLER ANALIZI 1) MATEMATİKSEL TEMEL Bu bölümde PCA‘nın anlaşılabilmesi için gerekli olan bazı matematiksel ifadelere değinilecektir. 1.1 İSTATİSTİK İstatistik; belli bir amaç için veri toplama, tablo ve grafiklerle özetleme sonuçları yorumlama, sonuçların güven derecelerini açıklama, örneklerden elde edilen sonuçları kitle için genelleme, özellikler arasındaki ilişkiyi araştırma, çeşitli konularda geleceğe ilişkin tahmin yapma, deney düzenleme ve gözlem ilkelerini kapsayan bir bilimdir. TEMEL BILEŞENLER ANALIZI 1.2. STANDART SAPMA Standart sapma; verilerin nasıl yayıldığına dair ölçümsel olarak bilgi verir.Veri değerlerinin yayılımının özetlenmesi için kullanılan bir ölçüdür. S 2 ( X X ) n 1 TEMEL BILEŞENLER ANALIZI 1.3. VARYANS Varyans; verinin yayılımı ile ilgili bir başka ölçüm bilgisi veren kavramdır. Genellikle değişimi ölçmek için kullanılır. x x n s 2 i 1 2 i n 1 TEMEL BILEŞENLER ANALIZI 1.4. KOVARYANS Kovaryans; iki rasgele değişkenin beraber değişimlerini inceleyen bir istatistiktir. Kovaryans her zaman iki boyut arasında ölçüm yapmak için kullanılmaktadır. X değişkeni ve Y değişkeni arasındaki ölçüme bakılmak istenildiğinde ; TEMEL BILEŞENLER ANALIZI Kovaryans değeri, pozitif ise her iki değişkenin birlikte arttığı; negatif ise biri artarken diğerinin azaldığı; sıfır ise bu iki değişkenin (X,Y) bağımsız olduğu yorumu yapılabilir. TEMEL BILEŞENLER ANALIZI 1.5. KOVARYANS MATRİSİ İkiden fazla değişkene bakıldığında kovaryans matris kullanılır. Kovaryans matris cov(a,b) = cov(b,a) özelliğinden dolayı simetrik bir yapı sergilemektedir. TEMEL BILEŞENLER ANALIZI 1.6. ÖZVEKTÖRLER VE ÖZDEĞERLER Bilindiği üzere boyutlar uyumlu olduğu sürece iki matris çarpılabilir ve özvektörler bu kural için özel bir durum ifade etmektedir. Bir vektör üzerine uygulanan matris o vektörün hem büyüklüğünü hem de yönünü değiştirebilir. Buna rağmen, bir matris bazı belirli vektörler üzerinde etkidiğinde onun büyüklüğünü bir çarpan kadar katlar, yani sadece büyüklüğünü değiştirir, doğrultularını değiştirmez. Doğrultusu değişmeyen bu vektörler söz konusu matrisin özvektörleri olarak ifade edilir. Özdeğerler , özvektektörler , özuzaylar bir matrisin özellikleridir ve matris hakkında önemli bilgiler vermektedir. Özvektörler ancak kare matrislerden elde edilebilir. Bu nedenle bir özdeğer ve özvektör elde etmek için kovaryans matrisler kullanılmaktadır. TEMEL BILEŞENLER ANALIZI 1.7.TEKİL DEĞER AYRIŞIMI Tekil Değer Ayrışımı(TDA), bir matrisin çarpanlarına ayrılma türlerinden biridir ve Google’ın PageRank algoritmasından insan yüzü modellemeye, otomatik deneme notlamasından gen analizine, bilgi getirimi ve çıkarımından boyut azaltma ve veri sıkıştırmaya kadar uzanan geniş bir yelpazede kullanılan temel adımdır. TEMEL BİLEŞENLER ANALİZİ Skalerler küçük harflerle yazılır, örneğin 𝑎.Vektörler kalın küçük harflerle yazılır, örneğin a. a vektörünün 𝑖 indisindeki elemanı 𝑎𝑖 olarak gösterilir. Matrisler kalın büyük harflerle yazılır, Örneğin A. A'nın 𝑗. sütunu 𝒂𝒋 vektörü olarak, (𝑖,𝑗) hücresindeki elemanı ise 𝑎𝑖𝑗 olarak ifade edilir. TEMEL BİLEŞENLER ANALİZİ 1.8. DİK İZDÜŞÜM Şekil 1’de öncelikle bir doğru tanımlanmıştır. Şekil 2’de daha sonra noktalar bu doğruya göre çizdirilmiştir. TEMEL BİLEŞENLER ANALİZİ Şekil 3’te ise her bir noktanın doğruya göre izdüşümü alınmıştır. TEMEL BİLEŞENLER ANALİZİ 2) TEMEL BİLEŞENLER ANALİZİ Temel bileşenler yaklaşımı bağımlılık yapısını yok etme ve boyut indirgeme amaçları için kullanılmaktadır.Tanıma, sınıflandırma, boyut indirgenmesi ve yorumlanmasını sağlayan, çok değişkenli bir istatistik yöntemidir. Bu yaklaşım verinin içindeki en güçlü örüntüyü bulmaya çalışır. Bu yüzden örüntü bulma tekniği olarak da kullanılabilir. PCA’nın üç temel amacı vardır: • Verilerin boyutunu azaltma • Tahminleme yapma • Veri setini, bazı analizler için görüntülemek TEMEL BİLEŞENLER ANALİZİ PCA uygulandığında p boyutlu uzayın gerçek boyutu belirlenir. Bu gerçek boyuta temel bileşenler adı verilir. Temel bileşenlerin üç özelliği vardır : • Kolerasyonsuzlardır. • Birinci temel bileşen toplam değişkenliği en çok açıklayan değişkendir. • Bir sonraki temel bileşen kalan değişkenliği en çok açıklayan değişkendir. TEMEL BİLEŞENLER ANALİZİ Temel Bileşen Analizi bu soruna şu şekilde yaklaşmaktadır: a. Çok boyutlu verilere doğru açıdan bakarak genellikle verideki ilişkiler açıklanabilir. b. PCA’nın amacı bu “doğru açıyı” bulmaktadır. TEMEL BILEŞENLER ANALIZI Şekil 3 . 1 Veri çok boyutlu ve ilişkiler açık değildir. Şekil 3 . 2 Doğru açıdan bakıldığında çok boyutlu karmaşık veri setindeki ilişkinin lineer olduğu TEMEL BILEŞENLER ANALIZI PCA kilit noktası , problemi çözmek üzere görsel inceleme için uygun bir ‘’açı’’ yani uygun bir koordinat sistemi seçmektedir. Şekil 3 . 3 Karmaşık veri seti lineer hale getirilmiştir. Şekil 3 . 4 Yeni koordinat sisteminde verinin görüntüsü elde edilmiştir. TEMEL BILEŞENLER ANALIZI PCA’da uygun koordinat sistemi ; • 1. eksen olarak, verilerin en büyük değişiminde olan yön seçilir. • 2. eksen olarak, önceki 1.eksene dikey olan ve verilerin en büyük değişiminde olan yön seçilir. • 3. eksen olarak, önceki 1. ve 2. eksene dikey olan ve kalan verilerin en büyük değişiminde olan yön seçilir. • Böyle her zaman yeni eksen olarak verilerindeki en büyük kalan değişimde olan yön seçilmektedir. TEMEL BILEŞENLER ANALIZI Böyle seçilmiş dikey olan “en büyük değişim” yönlerin “temel bileşenler’’ denir. PCA yönleri, verilerin değişimi ile ilgili en büyük katkıda olan yönü ilk önce belirtmekte, daha sonra da daha az katkıda olan yönleri açıklamaktadır. Temel bileşenlerin yeterli sayısını belirtmek için ‘’tutulan varyans2’’ kavramı kullanılmaktadır. Kullanılacak ilk temel bileşenlerin toplam varyansı orijinal verilerin toplam varyansının %90-%95’i olmalıdır. Genel uygulamalarda,1000 boyutlu veriler için genelikle10-20 ilk temel bileşen verilerin %90-%95 değişimini vermektedir. Bir başka ifadeyle, orijinal veriler %95 doğrululukla temsil etmek için 10-20 PCA bileşeni yeterli olabilir. Örneğin, 1000 özellikli veriyi kaydetmek için bütün 1000 özelliği kaydetme yerine 10-20 ilk temel bileşen kaydedilip diğer bileşenlerin değerleri için ortalama olarak (çünkü onlar aşağı yukarı değişmez) depolanabilir. Orijinal veriler, %1-2 bellekle kaydedilebilir TEMEL BİLEŞENLER ANALİZİ Sonuç olarak ; • PCA, boyut azaltmada çok faydalı bir yöntemdir. • PCA, çok boyutlu verileri yaklaşık olarak ve daha az boyutlu veriyle temsil eder. • PCA, orijinal veriler için dik olan en büyük varyans yönleri bulup orijinal verileri bu koordinat sisteminde gösterir. • PCA, çok boyutlu verilerin görsel gösterilmesi ve incelenmesi için kullanılabilir. • PCA, veri sıkıştırma için de kullanılabilir. TEMEL BILEŞENLER ANALIZI Özetle PCA, istatistiksel bir metottur. Bir veri setindeki örüntünün tanımlanmasında, veri setinin açıklanmasında, veri içindeki benzer ve farklı desenlerin tanımlanmasında kullanılabilir. PCA verinin sıkıştırılmasına boyut azaltarak imkân vermektedir. Üstelik boyut azaltılırken veri kaybı da yaşanmamaktadır. TEMEL BILEŞENLER ANALIZI 2.1. VERİ SETİNİN HAZIRLANMASI (1.ADIM) Hazırlanan basit örnekte, PCA iki boyutlu bir veri setine uygulanacaktır. TEMEL BILEŞENLER ANALIZI x y 2,5 2,4 0,5 0,7 2,2 2,9 1,9 2,2 3,1 3 2,3 2,7 2 1,6 1 1,1 1,5 1,6 1,1 0,9 TEMEL BILEŞENLER ANALIZI 2.2. ORTALAMADAN ÇIKARMA (2.ADIM) PCA ile çalışabilmek için veri setinin her bir boyutunu kendi ortalamasından çıkarmak gereklidir. x y (𝒙 − 𝒙) (𝒚 − 𝒚) 2,5 2,4 0,69 0,49 0,5 0,7 -1,31 -1,21 2,2 2,9 0,39 0,99 1,9 2,2 0,09 0,29 3,1 3 1,29 1,09 2,3 2,7 0,49 0,79 2 1,6 0,19 -0,31 1 1,1 -0,81 -0,81 1,5 1,6 -0,31 -0,31 1,1 0,9 -0,71 -1,01 TEMEL BILEŞENLER ANALIZI TEMEL BİLEŞENLER ANALİZİ 2.3. KOVARYANS MATRİS (3.ADIM) Kovaryans matris, özdeğerler ve özvektörlerin elde edilmesi için kullanılmaktadır.Veri iki boyutlu olduğundan kovaryans matris de 2x2 boyutlu olacaktır. TEMEL BILEŞENLER ANALIZI 2.4. ÖZDEĞERLER VE ÖZVEKTÖRLER (4.ADIM) Kovaryans matris karesel bir matristir. Özvektörler ve özdeğerler bu matristen elde edilebilir. Burada önemli olan nokta bu matrisin veri seti ile ilgili verdiği bilgidir. 0.0491 𝐷 (ö𝑧𝑑𝑒ğ𝑒𝑟𝑙𝑒𝑟) = ( ) 1.2840 𝑉 (ö𝑧𝑣𝑒𝑘𝑡ö𝑟𝑙𝑒𝑟) = (−0.7352 0.6779 0.6779) 0.7352 TEMEL BILEŞENLER ANALIZI 2.5. BİLEŞENLERİN SEÇİLMESİ VE ÖZELLİK VEKTÖRÜNÜN OLUŞTURULMASI (5.ADIM) Kovaryans matristen elde edilen özvektör ve özdeğerler yardımıyla eksenler ve özellik vektörü elde edilecektir. TEMEL BILEŞENLER ANALIZI KIRMIZI : Normalize edilmiş veriler. MAVİ : Özvektörlerden elde edilmiş eksenler. TEMEL BILEŞENLER ANALIZI Özvektörlerin genişletilmesi TEMEL BILEŞENLER ANALIZI PCA, bileşenler yardımıyla veri setini temsil etmektedir. Başka bir ifadeyle veri setinin temel bileşenleri en yüksek özdeğerler ile özvektörlerden oluşmaktadır. Genellikle, özvektörler öncelikli olarak kovaryans matristen elde edilir ve daha sonra yüksek değerden düşük değere doğru sıralanır. Amaç bileşenleri veriyi temsil etme oranına göre sıralamaktır. Böylelikle en önemli bileşenden en az önemli bileşene doğru bir sıralama yapılır. Eğer bazı bileşenler atılırsa sonuçta elde edilecek veri seti orjinal veri setinden daha az boyuta sahip olabilir. TEMEL BILEŞENLER ANALIZI 2.6. YENİ VERİ SETİNİN TÜRETİLMESİ (6.ADIM) Temel bileşenler analizinin son aşamasında yeni veri seti türetilir ve en basit aşamada burasıdır. Öncelikle veri setini en iyi temsil edecek, önem derecesi en yüksek olarak seçilen bileşenler ile normalize edilmiş verinin transpozu alınarak çarpılması sonucu yeni veri seti türetilebilir. Yeni Veri Seti = Özellik Vektörü X Normalize Edilmiş Veri TEMEL BILEŞENLER ANALIZI Görüldüğü üzere ikinci değerin varyansı daha yüksektir. Bir başka ifadeyle özvektörlerin iki numaralı bileşeni veri daha iyi temsil etmektir. Bu nedenle öncelikle özvektörlerin iki numaralı kolonu işleme alınacak daha sonra da bir numaralı kolonu işleme alınacaktır. Bu bilgi bileşenlerin önem sırasının belirlenmesi açısından önemlidir. TEMEL BILEŞENLER ANALIZI Veri setindeki varyans değerleri dikkate alınarak bileşenler seçildikten sonra yeni eksen üzerine veriler yansıtılmıştır. Böylelikle iki boyutlu bir veri setine PCA uygulanmıştır. TEMEL BİLEŞENLER ANALİZİ 3) TEMEL BİLEŞENLER ANALİZİ İLE BEYAZ GÜRÜLTÜLÜ SİNÜZOİDAL DALGANIN GÜRÜLTÜ PROBLEMİNİN GİDERİLMESİ Sinyal (işaret):zaman, uzay ya da başka bir veya birkaç bağımsız değişken ile değişiklik gösteren fiziksel nicelik olarak tanımlanabilir. Matematiksel olarak, bir sinyal bir ya da daha fazla bağımsız değişkenin fonksiyonu olarak tanımlanabilir. Bir başka ifadeyle işaretler, fiziksel bir durum hakkında bilgi taşıyan, bir veya daha fazla değişkene bağlı fonksiyonlardır. TEMEL BILEŞENLER ANALIZI Doğadaki pek çok sinyal fonksiyonel bir ifadeyle tanımlanamaz. Genel olarak konuşma sinyali için farklı genlikler ve farklı frekanslarda birkaç sinüzoidal frekansın toplamı olarak aşağıdaki gibi yazılabilir : Ai(t) : Sinüzoidal dalganın genliği Fi(t) : Sinüzoidal dalganın frekansı Qi(t) : : Sinüzoidal dalganın faz kümesini temsil etmektedir TEMEL BILEŞENLER ANALIZI 3.1. PROGRAMIN AKIŞ ŞEMASI Başla Sinüzoidal sinyalin üretilmesi Sinüzoidal dalga yığınının oluşturulması SVD’nin Uygulanması PCA sonrası orijinal sinyal formatına geri dönüş Çizim ayarlarının yapılması Son TEMEL BİLEŞENLER ANALİZİ Çalışmada yukarıda tanımlı olan her bir parametrenin kullanıcı tercihine bağlı olarak alındığı bir yapı oluşturulmuş ve bir sinüzoidal sinyalin gürültü ile birlikte oluşturulması sağlanmıştır. Geliştirilen programa ait akış şeması yukardaki şekilde görülmektedir. TEMEL BILEŞENLER ANALIZI Şekilde üretilen sinyal görülmektedir. Sinyale ait tanımlamalara bağlı olarak gürültülü bir sinyal oluşturulmuştur. TEMEL BILEŞENLER ANALIZI PCA’nın tek bileşen kullanılması ile elde edilen uygulanma sonuçları TEMEL BILEŞENLER ANALIZI TEMEL BILEŞENLER ANALIZI Şekilde ilk figür gürültülü sinyal yığınını göstermektedir. Görüldüğü gibi 20 yığından oluşan sinyalin tek bir bileşeni alınarak geriye kalan bileşenlerin atılması sağlanmıştır. Bileşenlerin her biri veriyi temsil etme gücünü göstermektedir ve azalan bir sıralayama sahiptir. Eğer tüm bileşenler alınarak geri dönüşüm yapılırsa kayıpsız olarak orijinal sinyal yeniden elde edilecektir. Amacımız sinyal üzerindeki gürültüleri atmak olduğunda ve birinci bileşenin sinyali ciddi derecede temsil ettiği görüldüğünden sadece tek bileşen kullanılarak sonuçlar elde edilmiştir. PCA ile hesaplanmış yeni eksen fonksiyonu çizdirilmiştir. Son olarak orijinal sinyal ve gürültüsü temizlenmiş sinyal gösterilmiştir. TEMEL BILEŞENLER ANALIZI Bu şekilde ise PCA hesabı için üç bileşen kullanılmıştır. Sonuçlar kıyaslandığında tek bileşenli uygulamanın daha fazla veri kaybı yaşadığı ve sonuç olarak elde edilen sinyalin daha temiz olduğu söylenebilir. PCA’nın üç bileşen kullanılması ile elde edilen uygulanma sonuçları TEMEL BILEŞENLER ANALIZI TEMEL BILEŞENLER ANALIZI 4) SENTETİK ELEKTROKARDİYOGRAFİ SİNYALLERİ ÜZERİNDE QT ARALIĞININ BELİRLENMESİ Elektrokardiyografi, kardiyovasküler rahatsızlıklara tanı koyma ve değerlendirme amacıyla yaygın olarak kullanılmaktadır. Kalp hızı, ventriküler aksiyon potansiyelinin en önemli belirleyicisidir. Bu nedenle QT aralığı kalp hızıyla ters orantılı olacak şekilde değişmektedir. QT aralığının hesaplanma ve düzeltme gereği bu durumdan kaynaklanmaktadır. Bu çalışmada, sentetik elektrokardiyografi sinyalleri, bir önişleme sürecinden geçirilmiş ve temel bileşenler analizi ile sinyal üzerindeki gürültülerin azaltılması sağlanmıştır. Daha sonra sinyal özellikleri çıkarılıp son olarak QT aralıkları Bazett yöntemiyle ile belirlenmiştir. TEMEL BİLEŞENLER ANALİZİ Şekilde programın genel fonksiyonların blok diyagram olarak gösterilmiş ve her bir blok içerisinde yapılanlar kısaca özetlenmiştir. Zamansal ve spektral parametreler ile gerçeğe yakın EKG sinyalleri üretmek için kullanılmıştır. ECGSYN Önişleme Genellikle önişleme adımlarının amacı, daha doğru analiz ve ölçüm için işaretlerin sinyal-gürültü oranını optimize etmektir. Amaç kovaryans matrisin büyüklüğünü ölçerek fazlalıkları minimize etmek ve varyans ölçümü ile sinyali maksimum derecede temsil etmektir PCA QT aralığı QRS kompleksin başlangıcından T dalgasının sonuna kadar olan uzaklığı kapsar ve kalp hızı ile olan bağımlılığı nedeniyle düzeltilerek bildirilir. Bazett TEMEL BILEŞENLER ANALIZI Şekilde sentetik elektrokardiyografi (EKG) sinyalleri üretmek için tasarlanan zamansal ve spektral parametrelerin girilebildiği bir EKG dalga üreteci gösterilmektedir. Bu arayüz işlenecek sinyalin üretildiği yeri ifade etmektedir. Sentetik EKG dalga üreteci TEMEL BILEŞENLER ANALIZI Üretilen sinyal bir önişleme sürecinden geçirildikten sonra PCA ile sinyal üzerindeki gürültülerin giderilmesi sağlanmıştır ve şekilde gösterilmiştir EKG'de gürültü giderme için PCA kullanımı TEMEL BILEŞENLER ANALIZI Önişleme ve PCA sonrası EKG sinyalinin durumları TEMEL BILEŞENLER ANALIZI 5) PCA İLE İMGE SIKIŞTIRMA Öz vektör sayısına göre imgeden elde edinilen sonuçlar TEMEL BİLEŞENLER ANALİZİ 6) PCA’NIN MAKİNE ÖĞRENMESİNDE KULLANIMI Çalışmanın Adımları • Verilerin oluşturulması • Orijinal verilerin çizdirilmesi Orijinal veri seti TEMEL BİLEŞENLER ANALİZİ • PCA’nın uygulanması • İlk iki bileşenin orijinal veri setine yansıtılması Orijinal veri setine ilk iki bileşenin yansıtılması TEMEL BİLEŞENLER ANALİZİ • Özdeğerlerin çubuk grafik şeklinde verilmesi TEMEL BİLEŞENLER ANALİZİ • Verilerin ilk iki bileşendeki eksen yansıtılması Verilerin ilk iki bileşendeki eksen yansıtılması MAKALELER TÜRKİYE’DE BÖLGELERİN SOSYO-EKONOMİK GELİŞMİŞLİK SIRALAMASI: TEMEL BİLEŞENLER ANALİZİ Yazan : Ş. Mustafa ERSUNGUR / Alaattin KIZILTAN / Özgür POLAT Yer Bilgisi : Atatürk Üniversitesi, İİBF İktisat Bölümü Türkiye’deki bölgeler arasında ekonomik ve sosyal kriterler açısından büyük farklılıklar bulunmaktadır. Bölgeler arasındaki bu farklılıklar çok ciddi problemlerin ortaya çıkmasına zemin hazırlamıştır. Bu çalışmada bölgeler arasındaki sosyo-ekonomik farklılıkların hangi bileşenlerden oluştuğu saptanmaya çalışılmıştır. İstatistiki Bölge Birimlerlerine (Düzey-1 İtibariyle) ait veriler ele alınarak değişkenler arasındaki bağımlılık yapısını ortadan kaldırmak, boyut indirgemek, gelişmişlik dereceleri birbirine yakın olan bölgeleri görmek ve yorum yapmak için çok değişkenli analiz yöntemlerden Temel Bileşenler Analizi yöntemi kullanılmıştır. Lise Öğrencilerinin Kimya Dersine Yönelik Tutum Ölçeği Geliştirme Çalışması Yazan : Adnan KAN & Ahmet AKBAŞ Yer Bilgisi : Mersin Üniversitesi Eğitim Fakültesi Bu çalışmanın amacı liselerde öğrenim gören öğrencilerin kimya dersine yönelik tutumlarını ölçmeye dönük ölçme aracı geliştirmektir. 30 maddeden oluşan ölçeğin nihai formu Mersin il merkezinde eğitim-öğretim gören 10 lisenin 820 öğrencisi üzerinde uygulanmıştır. Elde edilen veriler üzerinden ölçeğin geçerliğine ilişkin bilgi elde edebilmek için döndürülmüş temel bileşenler analizi kullanılmıştır. Bu analiz sonucunda ölçeğin üç alt faktörlü bir yapıya sahip olduğu belirlenmiştir. Bunlar araştırmacılar tarafından kimya dersine yönelik olumlu duygu, olumsuz duygu ve faaliyet olarak adlandırılmıştır. Madde geçerliğine kanıt olarak madde test korelasyonları hesaplanmıştır. Madde test korelasyonlarının 0,40 ile 0,68 arası’nda değiştiği saptanmıştır. Ölçeğin benzer gruplarda aynı yapıyı verip vermeyeceğine ilişkin olarak çapraz geçerleme çalışması yapılmış ve tüm gruplardan elde edilen yapı belirlenen alt gruplar üzerinden de elde edilmiştir. Ayrıca ölçeğin güvenirliğine kanıt sağlamak amacıyla test tekrar test ve Crα güvenirlikleri hesaplanmış ve 0,92 olarak bulunmuştur. EPİSTEMOLOJİK İNANÇ ÖLÇEĞİNİN FAKTÖR YAPISININ YENİDEN İNCELENMESİ : CİNSİYET VE ÖĞRENİM GÖRÜLEN PROGRAM TÜRÜNE GÖRE EPİSTEMOLOJİK İNANÇLARIN KARŞILAŞTIRILMASI Yazan : Deniz DERYAKULU & Şener BÜYÜKÖZTÜRK Yer Bilgisi : Ankara Üniversitesi Eğitim Bilimleri Fakültesi Bu araştırmanın amacı ; Epistemolojik İnanç Ölçeğinin faktör yapısını yeniden incelemek ve üniversite öğrencilerinin epistemolojik inançlarının cinsiyet ve öğrenim görülen program türü değişkenleri açısından farklılaşıp farklılaşmadığını belirlemektir. Araştırma , 626 üniversite öğrencesi üzerinde yürütülmüştür. Grubun yaş ortalaması 20.5’dir. Gereksinim duyulan veriler , EİÖ ve bir kişisel bilgi formu aracılığıyla toplanmıştır. EİÖ ‘ nün faktör yapısının yeniden değerlendirmek için temel bileşenler analizi ve doğrulayıcı faktör analizi , cinsiyet ve öğrenim görülen program türüne göre epistemolojik inançlar arasındaki fark ise çok değişkenli varyans analizi kullanarak test edilmiştir. Faktör analizi sonuçları , bir maddenin ölçekten çıkması ve bir maddenin de farklı faktörde yer alması dışında EİÖ’ nin üç faktörlü yapısının korunduğunu göstermiştir. Öğretmenlik Mesleğine Yönelik Tutum Ölçeğinin Geçerlik ve Güvenirlik Çalışması Yazan : Yrd. Doç. Dr. Mehmet ÜSTÜNER Bu çalışmada eğitim örgütlerindeki örgütsel davranışın incelenmesinde önemli bir boyut olan mesleki tutum konusuna ilişkin bir tutum ölçeği geliştirmek amaçlanmıştır. Geliştirilen bu ölçek öğretmenlik programlarında öğrenim görmekte olan öğrencilerin Öğretmenlik mesleğine yönelik tutumunu belirlemeyi amaçlamaktadır. Ölçek tek boyutlu likert tipi bir tutum ölçeğidir . Ölçeğin denemelik formu 11 farklı öğretmenlik programında öğrenim görmekte olan 449 öğrenciye uygulanmıştır. Ölçeğin yapı geçerliliğine ilişkin olarak yapılan temel bileşenler analizi sonucunda 34 maddenin yer aldığı birinci faktörde faktör yükü değerlerinin .74 ile .41 arasında değiştiği ve faktörün toplam varyansın %30'unu açıkladığı görülmüştür. Ölçeğin toplam puanı ile her bir maddenin madde test korelasyonuna bakılmış ve madde test korelasyon değerlerinin 74 ile 42 arasında değişkenlik gösterdiği bulunmuştur . Ölçeğin ölçüt ölçek geçerliliği 89'dur. Ölçeğin güvenirliğine ilişkin olarak 116 eğitim fakültesi öğrencisine 4 hafta ara ile iki kez uygulanması sonucu elde edilen puanların kararlılığına ilişkin güvenirlik katsayısı 72 bulunmuştur. Ölçeğin iç tutarlılık katsayısı (Cronbah Alpha) 93'dür. LİKERT : Genellikle bir kavramı (faktörü) ölçmek için kullanılan anket sorularını değerlendirmek için geliştirilmiş bir tür eşit aralıklı ölçektir. Veri Zarflama Analizi Sürecinde Temel Bileşenler Analizinin Ayırım Gücünü Arttırıcı Etkisi Yazan : İ. Esen YILDIRIM Yer Bilgisi : Marmara Üniversitesi Ekonometri Bölümü, İktisadi ve İdari Bilimler Fakültesi Veri Zarflama Analizi(VZA), çeşitli karar birimlerinin çok sayıda girdi ve çok sayıda çıktıya dayalı etkinlik incelemelerinde sıklıkla başvurulan tekniklerden biridir. Çok sayıda avantajının yanı sıra,Veri Zarflama Analizi’nde girdi ve çıktı sayıları toplamının, karar birimi sayısına kıyasla yüksek olması durumunda analizin ayırım gücü düşmektedir. Belirli sayıda karar birimi için, bazı girdi veya çıktıları modelden çıkarmak suretiyle duyarlılığı arttırma çabaları, çıkarılan girdi ya da çıktının sahip olduğu bilginin kaybedilmesine yol açmaktadır. Bunun yerine, çok değişkenli istatistiksel analiz tekniklerinden Temel Bileşenler Analizi(TBA) kullanılarak boyut indirgemesine gidilmesi, analiz sürecine önemli katkılar sağlamaktadır. Bu çalışmada, TBA’nın VZA çözümlemelerinde ayırım gücünü arttırıcı etkisi, Türkiye'deki vakıf üniversitelerinin etkinlik incelemesi üzerinde sunulacaktır. Üniversite Öğrencilerinin Sosyal Ağ Siteleri Kullanım Amaçlarını Belirlemeye Yönelik Bir Ölçek Geliştirme Çalışması Yazan : Hasan KARAL & Mehmet KOKOÇ Bu çalışmanın amacı, üniversite öğrencilerinin sosyal ağ sitelerini kullanım amaçlarını belirlemeye yönelik bir ölçek geliştirmektir. Araştırmacılar tarafından literatür taraması ve öğrenci görüşleri doğrultusunda 42 taslak madde hazırlanmıştır. Uzman görüşleri doğrultusunda 15 maddeye indirgenmiştir. Taslak ölçek; 20092010 öğretim yılında Artvin Çoruh Üniversitesi, Ege Üniversitesi, Hacettepe Üniversitesi, İstanbul Üniversitesi, Karadeniz Teknik Üniversitesi, Uşak Üniversitesi ve İnönü Üniversitesi'nde lisans düzeyinde öğrenim gören 315 sosyal ağ sitesi kullanıcısı öğrenciye uygulanmıştır. Ölçeğin yapı geçerliği için temel bileşenler analizi yöntemi kullanılarak faktör analizi yapılmış, güvenirliği için test-tekrar test ve Cronbach Alpha iç tutarlık katsayıları hesaplanmıştır.Yapılan faktör analizi sonucunda toplam 14 maddeden oluşan 3 faktörlü ölçek elde edilmiştir. Ölçeğin Cronbach Alpha iç tutarlılık katsayısı 0.83, test-tekrar test güvenirliği 0.91 olarak hesaplanmıştır. Veri Madenciliğinde Temel Bileşenler Analizi ve Negatifsiz Matris Çarpanlarına Ayırma Tekniklerinin Karşılaştırmalı Analizi Yazan : Kazım YILDIZ ,Yılmaz ÇAMURCU , Buket DOĞAN Yer Bilgisi : Marmara Üniversitesi, Elektronik-Bilgisayar Eğitimi Bölümü Teknolojinin hızla gelişmesi sonucu yüksek boyutlu veriler ile çalışma zorunluluğu ortaya çıkmıştır. Geleneksel kümeleme algoritmaları yüksek boyutlu veriler ile uygulandığında kümeleme işleminin sonucu istenildiği gibi olmamaktadır.Yüksek boyutlu veriler üzerinde bu algoritmalar yetersiz kalmaktadır. Bu yüzden yüksek boyutlu veri setleri üzerinde etkili olabilecek algoritmalar geliştirilmeli veya veri setleri üzerinde boyut indirgeme yoluna gidilmelidir. Bu çalışmada boyut azaltma metotlarından temel bileşen analizi ve negatifsiz matris çarpanlarına ayırma metotları geleneksel kümeleme algoritmaları ile beraber kullanılmakta elde edilen sonuçların karşılaştırılması küme saflık ve ortak bilgi değerlerine göre yapılmaktadır. SEVİYE BELİRLEME SINAVI FEN VE TEKNOLOJİ ALT TESTİ İLE DİĞER ALT TESTLER ARASINDAKİ İLİŞKİNİN YOL ANALİZİ İLE İNCELENMESİ Yazan : Duygu ANIL , Cem Oktay GÜZELLER Yer Bilgisi : Abant İzzet Baysal Üniversitesi , Eğitim Fakültesi Bu araştırmada, 2008 yılı seviye belirleme sınavı yedinci sınıf Fen ve Teknoloji alt testi ile Türkçe, Matematik, Sosyal Bilgiler ve yabancı dil alt testi arasındaki ilişkiler yol analizi ile incelenmiştir. Araştırmanın örneklemi, 2008 yılında SBS’ye giren 962991 yedinci sınıf öğrencisinin oluşturduğu evrenden seçkisiz olarak seçilen 5000 öğrenci oluşturmaktadır. Verilerin analizinde, her bir alt teste ilişkin 1-0 olarak puanlanan ham puan matrisi kullanılarak temel bileşenler analizi yapılmış, KR 20 güvenirlik katsayısı hesaplanmış ve temel bileşenler analizinin sonucunda ortaya çıkarılan faktör yapısına dayalı olarak dışsal (Fen ve Teknoloji alt testi) ve içsel (Türkçe, Matematik, Sosyal Bilgiler ve yabancı dil alt testi) değişkenler arasındaki ilişki yol analizi ile incelenmiştir. Analiz sonucunda, her bir alt testin tek faktörlü bir yapıya sahip olduğu belirlenmiş, KR 20 güvenirlik katsayısı 0.80’den yüksek bulunmuş ve Fen ve Teknoloji alt testinin, en fazla Matematik alt testini açıkladığı tespit edilmiştir. TEZLER Temel Bileşenler Analizi Metodları İle MRI Görüntülerinin Kümelenmesi Yazan : EMİNE GEZMEZ Yer Bilgisi : Çukurova Üniversitesi / Fen Bilimleri Enstitüsü / Elektrik-Elektronik Mühendisliği Anabilim Dalı Görüntülerin sınıflandırılmasındaki en önemli problemlerden biri de görüntü boyutlarının çok fazla olmasıdır. Bu yüzden, görüntüleri sınıflandırmada iyi sonuç alabilmek için görüntü boyutlarının indirgenmesi gerekir.Bu çalışmada, Temel Bileşenler Analizi ile beynin MRI görüntülerinin boyutları indirgendikten sonra elde edilen görüntülere sınıflandırma metodları uygulanmıştır. General Hebbian Algorithm , Diamantras and Kung's APEX Rule , Expectation-Maximization Principle Component Analysis , Probabilistic Principal Components Analysis ve True-PCA olmak üzere 5 farklı Temel Bileşenler Analizi metodu kullanılmıştır. Elde edilen yeni görüntülere ise K-Means ve Fuzzy C-Means sınıflandırma metodları uygulanmıştır. Bu metodlar sonucunda elde edilen görüntüler karşılaştırılarak en iyi sonucu veren metodlar tespit edilmiştir Çok Boyutlu Sağkalım Verilerinde Denetimli Temel Bileşenler Analizine Alternatif Bir Boyut İndirgeme Yaklaşımı Yazan : ELVAN AKTÜRK HAYAT Yer Bilgisi : Ege Üniversitesi / Fen Bilimleri Enstitüsü / İstatistik Anabilim Dalı Bu çalışmada, boyut indirgemede kullanılan denetimli temel bileşenler analizi (D-TBA) ile bu yönteme alternatif bir yaklaşım olarak önerilen sağkalım ağacıyla gen seçerek uygulanan yapay sinir ağlarıyla doğrusal olmayan temel bileşenler analizinin (sağkalım ağacı temelinde YSA-DOTBA) performanslarının karşılaştırılması amaçlanmıştır. D-TBA'da, çok boyutlu gen ekspresyon verilerinden önemli genlerin belirlenmesinde Cox skorlar kullanılmıştır. Cox skorlara göre önemli olduğu belirlenen genler tekil değer ayrışması ile 3 temel bileşene indirgenmiştir. Sağkalım ağacı temelinde YSA-DOTBA yaklaşımında, önemli genlerin belirlenmesinde ise sağkalım ağacının önemlilik değerleri kullanılmıştır. Sağkalım ağacıyla önemli bulunan genler YSA'da girdi değişkeni olarak alınarak, 3 temel bileşene indirgenmiştir. D-TBA'nın varyans açıklama oranı %18.2, sağkalım ağacı temelinde YSA-DOTBA'nın varyans açıklama oranı %35.1 bulunmuştur. D-TBA ve sağkalım ağacı temelinde YSA-DOTBA'nın performansları Cox regresyon modeli (CRM) ile karşılaştırılmıştır. Elde edilen Cox regresyon modellerini karşılaştırmak için de ROC eğrileri ve C indeks hesaplanmıştır. İki modelin ROC eğrileri arasında istatistiksel olarak önemli bir fark bulunamamıştır. C indeks sonuçlarına göre, CRM-1 için tahmin edilen ve gözlenen bağımlı değişkenler arasındaki uyumun olasılığı CRM-2 için tahmin edilen ve gözlenen bağımlı değişkenler arasındaki uyumun olasılığından daha yüksektir. D-TBA'dan elde edilen temel bileşenlerin bağımsız değişken olarak alındığı CRM sonuçları sağkalım ağacı temelinde YSADOTBA'dan elde edilen temel bileşenlerin bağımsız değişken olarak alındığı CRM sonuçlarından biraz daha iyi çıkmıştır. Sonuç olarak D-TBA, sadece doğrusal ilişkileri göz önüne alırken, sağkalım ağacı temelinde YSA-DOTBA, doğrusal olmayan ilişkileri de dikkate alması ve daha fazla varyans açıklayıcılığına sahip olması açısından D-TBA'ya alternatif bir yöntem olarak değerlendirilmelidir. Temel Bileşenler Analizi ve Klinik Bir Uygulama Yazan : FATMA NESRİN TURAN Yer Bilgisi : İstanbul Üniversitesi / Sağlık Bilimleri Enstitüsü Temel Bileşenler Analizi tanım olarak; değişkenler arasındaki bağımlılık yapısının yok edilmesi ve/veya boyut indirgeme amacıyla kullanılan başlı başına bir analiz olduğu gibi başka analizler için (örn: Faktör analizi) veri hazırlama tekniği olarak da kullanılan istatistiksel bir yöntemdir. Çok değişkenli istatistiksel analizde n tane bireye (nesne) ilişkin p tane değişken (özellik) incelenmektedir. Bu özelliklerden bir çoğunun birbiriyle ilişkili olduğu (bağımlı) ve p sayısının çok büyük olması analizde sorun yaratmaktadır. Bu gibi durumlarda başvurulan en önemli tekniklerden biri olan Temel Bileşenler Analizinin amacı değişkenler arasındaki bağımlılık yapısının yok edilmesi ve/veya boyut indirgeme olduğu gibi bu analiz ayrıca çoklu regresyonda çoklu bağlantı durumunu gidermede ve çok değişkenli regresyonda değişken kümelerinde boyut indirgeme olarak kullanılmaktadır. Biz bu çalışmada Temel Bileşenler Analizini Anjina Pektorisli erkek ve kadın, sağlam erkek ve kadın olmak üzere dört grupta sekiz değişken açısından boyut indirgeme amacıyla kullandık. Anjina Pektorisli erkek ve kadın ile sağlam erkekler üç faktör ile açıklanabilirken sağlam kadınların iki faktörle açıklanabileceği sonucuna erişildi. Bu bulguların klinik özelliklerle de uyumlu olması çözümlemenin yeteneğini yansıtmaktadır. Temel Bileşenler Analizi ve Bir Uygulaması Yazan : ZEYNO KONCA Yer Bilgisi : Cumhuriyet Üniversitesi / Sağlık Türkiye'de 81 il merkezindeki T.C. Sağlık Bakanlığına bağlı bulunan yataklı tedavi kurumlarına ait, kaba ölüm hızı, uzman hekim sayısı, fiili yatak sayısı, yatak işgal yüzdesi, yatan hasta oranı, ortalama kalış gün sayısı, ameliyat sayısı gibi bir hastanenin hasta bakım kalitesini gösteren bazı ölçütler 2000 yılı için tespit edilmiştir. Temel bileşenler analizi yöntemi ile değişkenler arasındaki bağımlılık yapısı yok edilmiş ve boyut indirgeme işlemi sonucunda toplam varyansın %73.794'lük bir bölümünü açıklayan iki özdeğer dikkate alınarak, yedi ölçüt iki Temel Bileşenle ifade edilmiştir. Elde edilen Temel Bileşenler yardımıyla bir denklem yazılmış ve hastanelere ait ölçütler bu denklemde yerine konularak her hastaneye ait sayısal bir değer (Y) elde edilmiş ve elde edilen bu değerlere göre hastaneler sıralanmıştır.Yapılan sıralamada Ankara Numune Hastanesi, Antalya Devlet Hastanesi ve Bursa Devlet Hastanesi ilk üç sırada, Şırnak Devlet Hastanesi, Bolu İzzet Baysal Devlet Hastanesi ve Tunceli Devlet Hastanesi de son üç sırada yer almışlardır. Gen Dizilerinde Temel Bileşenler Analizinin Uygulanması Yazan : YALÇIN TAHTALI Yer Bilgisi : Çukurova Üniversitesi / Fen Bilimleri Enstitüsü / Zootekni Anabilim Dalı Bu çalışmada, farelerin karaciğerleri üzerine belirli zaman periyotlarında uygulanmış olan, toksikolojik çalışmalardan alınan ve cDNA mikrodizi teknolojisi kullanılarak elde edilen 6675 gen ve 20 dizi içeren verilere temel bileşenler analizi uygulanmıştır. cDNA mikrodizi analizi, birden çok deneme ya da örnekten alınan binlerce geni aynı anda analiz etmede kullanılan bir teknolojidir. Temel bileşenler analizi ise orijinal değişkenlere ait varyans - kovaryans yapısının açıklanmasını ve bağımlılık yapısının ortadan kaldırılmasını ve tüm veri yapısını ifade edebilecek ve daha az sayıda bileşen için boyut indirgenmesi amacıyla kullanılan çok değişkenli istatistik tekniğidir. cDNA teknolojisi kullanılarak, birbirine benzer ifade profilleri ile gen gruplarının oluşturulması ve gruplar içerisindeki benzer bileşen (component) yükleri vasıtasıyla birbirleriyle ilişkili genlerin tanımlanması açıklanmıştır. Bunun yanı sıra aynı veri kümesine ait korelasyon matrisinden faktörlerin ayrıştırılması ve yorumu izah edilmiştir. Kullanılan veri seti içinde, bütün veri yapısın izah edebilecek daha az sayıda bileşene indirgemek için temel bileşen sayısına karar verme yöntemlerinden bir kaçı burada değerlendirilmiştir. Bunlardan biri olan Scree grafiğe göre, eğrinin bileşen ekseninde düzleştiği bölgeye kadar olan bileşenler kabul edilmektedir.Yani eğrinin düz bir doğru halini almaya başladığı noktadan itibaren ana bileşenler reddedilebilmektedir bu yönteme göre de 9 veya 10 temel bileşenin yeterli olacağı sonucu çıkmaktadır. Bunun yanı sıra Kaiser' in ve Bartlett' önerdiği yöntemlerde göz önünde bulundurulmuştur. İlk 10 temel bileşenin bütün yapımın varyansını izah etmeye yeterli olduğu düşünülürse bu durumda %17.372'lik bir varyans kaybı ile 20 temel bileşen yerine 10 temel bileşen ile açıklamanın yeterli olduğu düşünülmektedir. Doğancı Baraj Rezervuarı Su Kalitesinin Temel Bileşenler Analizi Yardımıyla Değerlendirilmesi Yazan : AYŞE KURT Yer Bilgisi : Uludağ Üniversitesi / Fen Bilimleri Enstitüsü / Çevre Mühendisliği Anabilim Dalı Bu çalışmada, Doğancı Baraj Rezervuarı üzerindeki dört adet gözlem istasyonundan, 20022010 yılları arasında elde edilen 27 adet su kalitesi parametresi değerlendirilmiştir. Bu veriler üzerinde Temel Bileşenler Analizi uygulanarak, 27 parametre; Sıcaklık, pH, Bulanıklık, AKM, TÇM, Geçici Sertlik, Kalıcı Sertlik, Top. Sertlik, Top. Alkalinite, Kalsiyum Sertliği, Magnezyum Sertliği, Serbest Karbondioksit, Top. Demir, Top. Mangan, Klorür, Sülfat, Nitrat Azotu, Nitrit Azotu, Silisyum Dioksit, Amonyum Azotu, Çözünmüş Oksijen, Orto Fosfat Fosforu, İletkenlik, Organik Madde Miktarı, Sodyum, Potasyum ve BOİ daha sonra 5-6 bileşene indirgenmiştir.Yapılan analizle su kalitesi araştırmalarında çok fazla sayıda parametrenin ölçülmesi yerine önceden dikkatlice seçilmiş, daha az sayıdaki kritik parametrelerin tespitinin yapılabileceği gösterilmiştir. Doğrusal Olmayan Temel Bileşenler Analizi ve Sağlık Alanında Uygulaması Yazan : CANAN DEMİR Yer Bilgisi :Yüzüncü Yıl Üniversitesi / Sağlık Bilimleri Enstitüsü / Biyoistatistik ve Tıbbı Bilişim Anabilim Dalı Demir, C, Doğrusal olmayan temel bileşenler analizi ve sağlık alanında uygulaması.Yüzüncü Yıl Üniversitesi, Sağlık Bilimleri Enstitüsü, Biyoistatistik Anabilim Dalı Yüksek Lisans Tezi,Van 2010. Doğrusal Olmayan Temel Bileşenler Analizi, aralarında doğrusal veya doğrusal olmayan ilişki bulunan veri kümeleri için rakamsal ve görsel sonuçlar veren açıklayıcı bir boyut indirgeme yöntemidir. Doğrusal olmayan temel bileşenler analizinde, sayısal değişkenlerin yanında sınıflayıcı ve sıralayıcı değişkenler de aynı anda analize dahil edilebilir. Analizde gözlenen değişkenler arasındaki ilişkilerin doğrusal olduğu varsayımına gerek yoktur. Dolayısıyla, klasik olarak kullanılan yöntemlere göre bazı avantajları bulunan yeni bir yöntem olarak düşünülebilir. Bu çalışmada doğrusal olmayan temel bileşenler analizi genel olarak tanıtılmış, teorik alt yapısı açıklanmış ve konunun anlaşılmasını kolaylaştırmak amacıyla bir uygulama yapılmıştır. Uygulamada farklı değişken kombinasyonları kullanılarak elde edilen sonuçlar, tablolar ve grafikler halinde sunulmuş ve sonuçlar yorumlanmıştır. SEÇİL KARTAL CUMHURİYET ÜNİVERSİTESİ EKONOMETRİ TEZLİ YÜKSEK LİSANS