Uploaded by User3026

TEMEL BILESENLER ANALIZI

advertisement
TEMEL BİLEŞENLER
ANALİZİ
TEMEL BILEŞENLER ANALIZI
Temel Bileşenler Analizi, yüz tanıma, resim sıkıştırma ve örüntü tanıma gibi alanlarda
yaygın olarak kullanılan istatistiksel bir metottur. Temel Bileşenler Analizi belge boyunca PCA
olarak ifade edilmiştir.
Bu çalışmada, Temel Bileşenler Analizi konusuna geçmeden önce konunun daha iyi
anlaşılması için öncelikle matematiksel temele değinilmiştir.
ÖRÜNTÜ : çoğunlukla uzaysal ve geometrik karaktere sahip, iki veya üç boyutlu bir nesne
olarak düşünülebilir. Diğer bir ifadeyle örüntü, ilgilenilen varlıkla ilgili gözlenebilir veya
ölçülebilir bilgilere verilen isimdir.
TEMEL BILEŞENLER ANALIZI
1) MATEMATİKSEL TEMEL
Bu bölümde PCA‘nın anlaşılabilmesi için gerekli olan bazı matematiksel ifadelere
değinilecektir.
 1.1 İSTATİSTİK
İstatistik; belli bir amaç için veri toplama, tablo ve grafiklerle özetleme sonuçları
yorumlama, sonuçların güven derecelerini açıklama, örneklerden elde edilen sonuçları kitle
için genelleme, özellikler arasındaki ilişkiyi araştırma, çeşitli konularda geleceğe ilişkin tahmin
yapma, deney düzenleme ve gözlem ilkelerini kapsayan bir bilimdir.
TEMEL BILEŞENLER ANALIZI
 1.2. STANDART SAPMA
Standart sapma; verilerin nasıl yayıldığına dair ölçümsel olarak bilgi verir.Veri değerlerinin
yayılımının özetlenmesi için kullanılan bir ölçüdür.
S
2
(
X

X
)

n 1
TEMEL BILEŞENLER ANALIZI
 1.3. VARYANS
Varyans; verinin yayılımı ile ilgili bir başka ölçüm bilgisi veren kavramdır. Genellikle değişimi
ölçmek için kullanılır.
 x  x 
n
s 
2
i 1
2
i
n 1
TEMEL BILEŞENLER ANALIZI
 1.4. KOVARYANS
Kovaryans; iki rasgele değişkenin beraber değişimlerini inceleyen bir istatistiktir.
Kovaryans her zaman iki boyut arasında ölçüm yapmak için kullanılmaktadır. X değişkeni ve
Y değişkeni arasındaki ölçüme bakılmak istenildiğinde ;
TEMEL BILEŞENLER ANALIZI
Kovaryans değeri, pozitif ise her iki değişkenin birlikte arttığı; negatif ise biri artarken
diğerinin azaldığı; sıfır ise bu iki değişkenin (X,Y) bağımsız olduğu yorumu yapılabilir.
TEMEL BILEŞENLER ANALIZI
 1.5. KOVARYANS MATRİSİ
İkiden fazla değişkene bakıldığında kovaryans matris kullanılır. Kovaryans matris cov(a,b) =
cov(b,a) özelliğinden dolayı simetrik bir yapı sergilemektedir.
TEMEL BILEŞENLER ANALIZI
 1.6. ÖZVEKTÖRLER VE ÖZDEĞERLER
Bilindiği üzere boyutlar uyumlu olduğu sürece iki matris çarpılabilir ve özvektörler bu kural
için özel bir durum ifade etmektedir. Bir vektör üzerine uygulanan matris o vektörün hem
büyüklüğünü hem de yönünü değiştirebilir. Buna rağmen, bir matris bazı belirli vektörler üzerinde
etkidiğinde onun büyüklüğünü bir çarpan kadar katlar, yani sadece büyüklüğünü değiştirir,
doğrultularını değiştirmez. Doğrultusu değişmeyen bu vektörler söz konusu matrisin
özvektörleri olarak ifade edilir. Özdeğerler , özvektektörler , özuzaylar bir matrisin özellikleridir
ve matris hakkında önemli bilgiler vermektedir. Özvektörler ancak kare matrislerden elde
edilebilir. Bu nedenle bir özdeğer ve özvektör elde etmek için kovaryans matrisler
kullanılmaktadır.
TEMEL BILEŞENLER ANALIZI
 1.7.TEKİL DEĞER AYRIŞIMI
Tekil Değer Ayrışımı(TDA), bir matrisin çarpanlarına ayrılma türlerinden biridir ve
Google’ın PageRank algoritmasından insan yüzü modellemeye, otomatik deneme
notlamasından gen analizine, bilgi getirimi ve çıkarımından boyut azaltma ve veri sıkıştırmaya
kadar uzanan geniş bir yelpazede kullanılan temel adımdır.
TEMEL BİLEŞENLER ANALİZİ
Skalerler küçük harflerle yazılır, örneğin 𝑎.Vektörler kalın küçük harflerle yazılır, örneğin a.
a vektörünün 𝑖 indisindeki elemanı 𝑎𝑖 olarak gösterilir. Matrisler kalın büyük harflerle yazılır,
Örneğin A. A'nın 𝑗. sütunu 𝒂𝒋 vektörü olarak, (𝑖,𝑗) hücresindeki elemanı ise 𝑎𝑖𝑗 olarak ifade
edilir.
TEMEL BİLEŞENLER ANALİZİ
 1.8. DİK İZDÜŞÜM
Şekil 1’de öncelikle bir doğru tanımlanmıştır. Şekil 2’de daha sonra noktalar bu doğruya göre
çizdirilmiştir.
TEMEL BİLEŞENLER ANALİZİ
Şekil 3’te ise her bir noktanın doğruya göre izdüşümü alınmıştır.
TEMEL BİLEŞENLER ANALİZİ
 2) TEMEL BİLEŞENLER ANALİZİ
Temel bileşenler yaklaşımı bağımlılık yapısını yok etme ve boyut indirgeme amaçları için
kullanılmaktadır.Tanıma, sınıflandırma, boyut indirgenmesi ve yorumlanmasını sağlayan, çok
değişkenli bir istatistik yöntemidir. Bu yaklaşım verinin içindeki en güçlü örüntüyü bulmaya
çalışır. Bu yüzden örüntü bulma tekniği olarak da kullanılabilir. PCA’nın üç temel amacı vardır:
• Verilerin boyutunu azaltma
• Tahminleme yapma
• Veri setini, bazı analizler için görüntülemek
TEMEL BİLEŞENLER ANALİZİ
PCA uygulandığında p boyutlu uzayın gerçek boyutu belirlenir. Bu gerçek boyuta temel
bileşenler adı verilir. Temel bileşenlerin üç özelliği vardır :
• Kolerasyonsuzlardır.
• Birinci temel bileşen toplam değişkenliği en çok açıklayan değişkendir.
• Bir sonraki temel bileşen kalan değişkenliği en çok açıklayan değişkendir.
TEMEL BİLEŞENLER ANALİZİ
Temel Bileşen Analizi bu soruna şu şekilde yaklaşmaktadır:
a.
Çok boyutlu verilere doğru açıdan bakarak genellikle verideki ilişkiler açıklanabilir.
b.
PCA’nın amacı bu “doğru açıyı” bulmaktadır.
TEMEL BILEŞENLER ANALIZI
Şekil
3 . 1 Veri çok boyutlu ve ilişkiler açık
değildir.
Şekil
3 . 2 Doğru açıdan bakıldığında çok boyutlu
karmaşık veri setindeki ilişkinin lineer olduğu
TEMEL BILEŞENLER ANALIZI
PCA kilit noktası , problemi çözmek üzere görsel inceleme için uygun bir ‘’açı’’ yani uygun bir
koordinat sistemi seçmektedir.
Şekil
3 . 3 Karmaşık veri seti lineer hale
getirilmiştir.
Şekil
3 . 4 Yeni koordinat sisteminde verinin
görüntüsü elde edilmiştir.
TEMEL BILEŞENLER ANALIZI
PCA’da uygun koordinat sistemi ;
• 1. eksen olarak, verilerin en büyük değişiminde olan yön seçilir.
• 2. eksen olarak, önceki 1.eksene dikey olan ve verilerin en büyük değişiminde olan yön
seçilir.
• 3. eksen olarak, önceki 1. ve 2. eksene dikey olan ve kalan verilerin en büyük değişiminde
olan yön seçilir.
• Böyle her zaman yeni eksen olarak verilerindeki en büyük kalan değişimde olan yön
seçilmektedir.
TEMEL BILEŞENLER ANALIZI
Böyle seçilmiş dikey olan “en büyük değişim” yönlerin “temel bileşenler’’ denir.
PCA yönleri, verilerin değişimi ile ilgili en büyük katkıda olan yönü ilk önce belirtmekte, daha sonra
da daha az katkıda olan yönleri açıklamaktadır.
Temel bileşenlerin yeterli sayısını belirtmek için ‘’tutulan varyans2’’ kavramı kullanılmaktadır.
Kullanılacak ilk temel bileşenlerin toplam varyansı orijinal verilerin toplam varyansının %90-%95’i
olmalıdır. Genel uygulamalarda,1000 boyutlu veriler için genelikle10-20 ilk temel bileşen verilerin
%90-%95 değişimini vermektedir. Bir başka ifadeyle, orijinal veriler %95 doğrululukla temsil etmek
için 10-20 PCA bileşeni yeterli olabilir. Örneğin, 1000 özellikli veriyi kaydetmek için bütün 1000
özelliği kaydetme yerine 10-20 ilk temel bileşen kaydedilip diğer bileşenlerin değerleri için ortalama
olarak (çünkü onlar aşağı yukarı değişmez) depolanabilir. Orijinal veriler, %1-2 bellekle kaydedilebilir
TEMEL BİLEŞENLER ANALİZİ
Sonuç olarak ;
• PCA, boyut azaltmada çok faydalı bir yöntemdir.
• PCA, çok boyutlu verileri yaklaşık olarak ve daha az boyutlu veriyle temsil eder.
• PCA, orijinal veriler için dik olan en büyük varyans yönleri bulup orijinal verileri bu
koordinat sisteminde gösterir.
• PCA, çok boyutlu verilerin görsel gösterilmesi ve incelenmesi için kullanılabilir.
• PCA, veri sıkıştırma için de kullanılabilir.
TEMEL BILEŞENLER ANALIZI
Özetle PCA, istatistiksel bir metottur. Bir veri setindeki örüntünün tanımlanmasında,
veri setinin açıklanmasında, veri içindeki benzer ve farklı desenlerin tanımlanmasında
kullanılabilir. PCA verinin sıkıştırılmasına boyut azaltarak imkân vermektedir. Üstelik boyut
azaltılırken veri kaybı da yaşanmamaktadır.
TEMEL BILEŞENLER ANALIZI
 2.1. VERİ SETİNİN HAZIRLANMASI (1.ADIM)
Hazırlanan basit örnekte, PCA iki boyutlu bir veri setine uygulanacaktır.
TEMEL BILEŞENLER ANALIZI
x
y
2,5
2,4
0,5
0,7
2,2
2,9
1,9
2,2
3,1
3
2,3
2,7
2
1,6
1
1,1
1,5
1,6
1,1
0,9
TEMEL BILEŞENLER ANALIZI
 2.2. ORTALAMADAN ÇIKARMA (2.ADIM)
PCA ile çalışabilmek için veri setinin her bir boyutunu kendi ortalamasından çıkarmak gereklidir.
x
y
(𝒙 − 𝒙)
(𝒚 − 𝒚)
2,5
2,4
0,69
0,49
0,5
0,7
-1,31
-1,21
2,2
2,9
0,39
0,99
1,9
2,2
0,09
0,29
3,1
3
1,29
1,09
2,3
2,7
0,49
0,79
2
1,6
0,19
-0,31
1
1,1
-0,81
-0,81
1,5
1,6
-0,31
-0,31
1,1
0,9
-0,71
-1,01
TEMEL BILEŞENLER ANALIZI
TEMEL BİLEŞENLER ANALİZİ
 2.3. KOVARYANS MATRİS (3.ADIM)
Kovaryans matris, özdeğerler ve özvektörlerin elde edilmesi için kullanılmaktadır.Veri iki
boyutlu olduğundan kovaryans matris de 2x2 boyutlu olacaktır.
TEMEL BILEŞENLER ANALIZI
 2.4. ÖZDEĞERLER VE ÖZVEKTÖRLER (4.ADIM)
Kovaryans matris karesel bir matristir. Özvektörler ve özdeğerler bu matristen elde edilebilir.
Burada önemli olan nokta bu matrisin veri seti ile ilgili verdiği bilgidir.
0.0491
𝐷 (ö𝑧𝑑𝑒ğ𝑒𝑟𝑙𝑒𝑟) = (
)
1.2840
𝑉 (ö𝑧𝑣𝑒𝑘𝑡ö𝑟𝑙𝑒𝑟) = (−0.7352
0.6779
0.6779)
0.7352
TEMEL BILEŞENLER ANALIZI
 2.5. BİLEŞENLERİN SEÇİLMESİ VE ÖZELLİK VEKTÖRÜNÜN OLUŞTURULMASI
(5.ADIM)
Kovaryans matristen elde edilen özvektör ve özdeğerler yardımıyla eksenler ve özellik
vektörü elde edilecektir.
TEMEL BILEŞENLER ANALIZI
 KIRMIZI : Normalize edilmiş veriler.
 MAVİ : Özvektörlerden elde edilmiş eksenler.
TEMEL BILEŞENLER ANALIZI
Özvektörlerin genişletilmesi
TEMEL BILEŞENLER ANALIZI
PCA, bileşenler yardımıyla veri setini temsil etmektedir. Başka bir ifadeyle veri setinin
temel bileşenleri en yüksek özdeğerler ile özvektörlerden oluşmaktadır. Genellikle,
özvektörler öncelikli olarak kovaryans matristen elde edilir ve daha sonra yüksek değerden
düşük değere doğru sıralanır. Amaç bileşenleri veriyi temsil etme oranına göre sıralamaktır.
Böylelikle en önemli bileşenden en az önemli bileşene doğru bir sıralama yapılır. Eğer bazı
bileşenler atılırsa sonuçta elde edilecek veri seti orjinal veri setinden daha az boyuta sahip
olabilir.
TEMEL BILEŞENLER ANALIZI
 2.6. YENİ VERİ SETİNİN TÜRETİLMESİ (6.ADIM)
Temel bileşenler analizinin son aşamasında yeni veri seti türetilir ve en basit aşamada
burasıdır. Öncelikle veri setini en iyi temsil edecek, önem derecesi en yüksek olarak seçilen
bileşenler ile normalize edilmiş verinin transpozu alınarak çarpılması sonucu yeni veri seti
türetilebilir.
Yeni Veri Seti = Özellik Vektörü X Normalize Edilmiş Veri
TEMEL BILEŞENLER ANALIZI
Görüldüğü üzere ikinci değerin varyansı daha yüksektir. Bir başka ifadeyle özvektörlerin
iki numaralı bileşeni veri daha iyi temsil etmektir. Bu nedenle öncelikle özvektörlerin iki
numaralı kolonu işleme alınacak daha sonra da bir numaralı kolonu işleme alınacaktır. Bu
bilgi bileşenlerin önem sırasının belirlenmesi açısından önemlidir.
TEMEL BILEŞENLER ANALIZI
Veri setindeki varyans değerleri dikkate alınarak bileşenler seçildikten sonra yeni eksen
üzerine veriler yansıtılmıştır. Böylelikle iki boyutlu bir veri setine PCA uygulanmıştır.
TEMEL BİLEŞENLER ANALİZİ
 3) TEMEL BİLEŞENLER ANALİZİ İLE BEYAZ GÜRÜLTÜLÜ SİNÜZOİDAL
DALGANIN GÜRÜLTÜ PROBLEMİNİN GİDERİLMESİ
Sinyal (işaret):zaman, uzay ya da başka bir veya birkaç bağımsız değişken ile değişiklik
gösteren fiziksel nicelik olarak tanımlanabilir. Matematiksel olarak, bir sinyal bir ya da daha
fazla bağımsız değişkenin fonksiyonu olarak tanımlanabilir. Bir başka ifadeyle işaretler, fiziksel
bir durum hakkında bilgi taşıyan, bir veya daha fazla değişkene bağlı fonksiyonlardır.
TEMEL BILEŞENLER ANALIZI
Doğadaki pek çok sinyal fonksiyonel bir ifadeyle tanımlanamaz. Genel olarak konuşma sinyali
için farklı genlikler ve farklı frekanslarda birkaç sinüzoidal frekansın toplamı olarak aşağıdaki
gibi yazılabilir :
Ai(t) : Sinüzoidal dalganın genliği
Fi(t) : Sinüzoidal dalganın frekansı
Qi(t) : : Sinüzoidal dalganın faz kümesini temsil etmektedir
TEMEL BILEŞENLER ANALIZI
 3.1. PROGRAMIN AKIŞ ŞEMASI
Başla
Sinüzoidal sinyalin üretilmesi
Sinüzoidal dalga yığınının
oluşturulması
SVD’nin Uygulanması
PCA sonrası orijinal sinyal
formatına geri dönüş
Çizim ayarlarının yapılması
Son
TEMEL BİLEŞENLER ANALİZİ
Çalışmada yukarıda tanımlı olan her bir parametrenin kullanıcı tercihine bağlı olarak
alındığı bir yapı oluşturulmuş ve bir sinüzoidal sinyalin gürültü ile birlikte oluşturulması
sağlanmıştır. Geliştirilen programa ait akış şeması yukardaki şekilde görülmektedir.
TEMEL BILEŞENLER ANALIZI
Şekilde üretilen sinyal görülmektedir. Sinyale ait tanımlamalara bağlı olarak gürültülü bir
sinyal oluşturulmuştur.
TEMEL BILEŞENLER ANALIZI
PCA’nın tek bileşen kullanılması ile elde edilen
uygulanma sonuçları
TEMEL BILEŞENLER ANALIZI
TEMEL BILEŞENLER ANALIZI
Şekilde ilk figür gürültülü sinyal yığınını göstermektedir. Görüldüğü gibi 20 yığından
oluşan sinyalin tek bir bileşeni alınarak geriye kalan bileşenlerin atılması sağlanmıştır.
Bileşenlerin her biri veriyi temsil etme gücünü göstermektedir ve azalan bir sıralayama
sahiptir. Eğer tüm bileşenler alınarak geri dönüşüm yapılırsa kayıpsız olarak orijinal sinyal
yeniden elde edilecektir. Amacımız sinyal üzerindeki gürültüleri atmak olduğunda ve birinci
bileşenin sinyali ciddi derecede temsil ettiği görüldüğünden sadece tek bileşen kullanılarak
sonuçlar elde edilmiştir. PCA ile hesaplanmış yeni eksen fonksiyonu çizdirilmiştir. Son olarak
orijinal sinyal ve gürültüsü temizlenmiş sinyal gösterilmiştir.
TEMEL BILEŞENLER ANALIZI
Bu şekilde ise PCA hesabı için üç bileşen kullanılmıştır. Sonuçlar kıyaslandığında tek bileşenli uygulamanın
daha fazla veri kaybı yaşadığı ve sonuç olarak elde edilen sinyalin daha temiz olduğu söylenebilir.
PCA’nın üç bileşen kullanılması ile elde edilen uygulanma sonuçları
TEMEL BILEŞENLER ANALIZI
TEMEL BILEŞENLER ANALIZI
 4) SENTETİK ELEKTROKARDİYOGRAFİ SİNYALLERİ ÜZERİNDE QT ARALIĞININ
BELİRLENMESİ
Elektrokardiyografi, kardiyovasküler rahatsızlıklara tanı koyma ve değerlendirme amacıyla
yaygın olarak kullanılmaktadır. Kalp hızı, ventriküler aksiyon potansiyelinin en önemli belirleyicisidir.
Bu nedenle QT aralığı kalp hızıyla ters orantılı olacak şekilde değişmektedir. QT aralığının
hesaplanma ve düzeltme gereği bu durumdan kaynaklanmaktadır. Bu çalışmada, sentetik
elektrokardiyografi sinyalleri, bir önişleme sürecinden geçirilmiş ve temel bileşenler analizi ile sinyal
üzerindeki gürültülerin azaltılması sağlanmıştır. Daha sonra sinyal özellikleri çıkarılıp son olarak QT
aralıkları Bazett yöntemiyle ile belirlenmiştir.
TEMEL BİLEŞENLER ANALİZİ
Şekilde programın genel fonksiyonların blok diyagram olarak gösterilmiş ve her bir blok içerisinde yapılanlar kısaca
özetlenmiştir.
Zamansal ve spektral parametreler ile gerçeğe yakın EKG sinyalleri üretmek için kullanılmıştır.
ECGSYN
Önişleme
Genellikle önişleme adımlarının amacı, daha doğru analiz ve ölçüm için işaretlerin sinyal-gürültü oranını optimize etmektir.
Amaç kovaryans matrisin büyüklüğünü ölçerek fazlalıkları minimize etmek ve varyans ölçümü ile sinyali maksimum derecede temsil etmektir
PCA
QT aralığı QRS kompleksin başlangıcından T dalgasının sonuna kadar olan uzaklığı kapsar ve kalp hızı ile olan bağımlılığı nedeniyle düzeltilerek bildirilir.
Bazett
TEMEL BILEŞENLER ANALIZI
Şekilde sentetik elektrokardiyografi (EKG) sinyalleri üretmek için tasarlanan zamansal ve spektral parametrelerin
girilebildiği bir EKG dalga üreteci gösterilmektedir. Bu arayüz işlenecek sinyalin üretildiği yeri ifade etmektedir.
Sentetik EKG dalga üreteci
TEMEL BILEŞENLER ANALIZI
Üretilen sinyal bir önişleme sürecinden geçirildikten sonra PCA ile sinyal üzerindeki
gürültülerin giderilmesi sağlanmıştır ve şekilde gösterilmiştir
EKG'de gürültü giderme için PCA kullanımı
TEMEL BILEŞENLER ANALIZI
Önişleme ve PCA sonrası EKG sinyalinin durumları
TEMEL BILEŞENLER ANALIZI
 5) PCA İLE İMGE SIKIŞTIRMA
Öz vektör sayısına göre imgeden elde edinilen sonuçlar
TEMEL BİLEŞENLER ANALİZİ
 6) PCA’NIN MAKİNE ÖĞRENMESİNDE KULLANIMI
Çalışmanın Adımları
• Verilerin oluşturulması
• Orijinal verilerin çizdirilmesi
Orijinal veri seti
TEMEL BİLEŞENLER ANALİZİ
• PCA’nın uygulanması
• İlk iki bileşenin orijinal veri setine yansıtılması
Orijinal veri setine ilk iki bileşenin yansıtılması
TEMEL BİLEŞENLER ANALİZİ
• Özdeğerlerin çubuk grafik şeklinde verilmesi
TEMEL BİLEŞENLER ANALİZİ
• Verilerin ilk iki bileşendeki eksen yansıtılması
Verilerin ilk iki bileşendeki eksen yansıtılması
MAKALELER
 TÜRKİYE’DE BÖLGELERİN SOSYO-EKONOMİK GELİŞMİŞLİK SIRALAMASI: TEMEL BİLEŞENLER
ANALİZİ
Yazan : Ş. Mustafa ERSUNGUR / Alaattin KIZILTAN / Özgür POLAT
Yer Bilgisi : Atatürk Üniversitesi, İİBF İktisat Bölümü
Türkiye’deki bölgeler arasında ekonomik ve sosyal kriterler açısından büyük farklılıklar bulunmaktadır.
Bölgeler arasındaki bu farklılıklar çok ciddi problemlerin ortaya çıkmasına zemin hazırlamıştır. Bu çalışmada
bölgeler arasındaki sosyo-ekonomik farklılıkların hangi bileşenlerden oluştuğu saptanmaya çalışılmıştır.
İstatistiki Bölge Birimlerlerine (Düzey-1 İtibariyle) ait veriler ele alınarak değişkenler arasındaki bağımlılık
yapısını ortadan kaldırmak, boyut indirgemek, gelişmişlik dereceleri birbirine yakın olan bölgeleri görmek ve
yorum yapmak için çok değişkenli analiz yöntemlerden Temel Bileşenler Analizi yöntemi kullanılmıştır.
 Lise Öğrencilerinin Kimya Dersine Yönelik Tutum Ölçeği Geliştirme Çalışması
Yazan : Adnan KAN & Ahmet AKBAŞ
Yer Bilgisi : Mersin Üniversitesi Eğitim Fakültesi
Bu çalışmanın amacı liselerde öğrenim gören öğrencilerin kimya dersine yönelik
tutumlarını ölçmeye dönük ölçme aracı geliştirmektir. 30 maddeden oluşan ölçeğin nihai
formu Mersin il merkezinde eğitim-öğretim gören 10 lisenin 820 öğrencisi üzerinde
uygulanmıştır. Elde edilen veriler üzerinden ölçeğin geçerliğine ilişkin bilgi elde edebilmek
için döndürülmüş temel bileşenler analizi kullanılmıştır. Bu analiz sonucunda ölçeğin üç alt
faktörlü bir yapıya sahip olduğu belirlenmiştir. Bunlar araştırmacılar tarafından kimya
dersine yönelik olumlu duygu, olumsuz duygu ve faaliyet olarak adlandırılmıştır. Madde
geçerliğine kanıt olarak madde test korelasyonları hesaplanmıştır. Madde test
korelasyonlarının 0,40 ile 0,68 arası’nda değiştiği saptanmıştır. Ölçeğin benzer gruplarda
aynı yapıyı verip vermeyeceğine ilişkin olarak çapraz geçerleme çalışması yapılmış ve tüm
gruplardan elde edilen yapı belirlenen alt gruplar üzerinden de elde edilmiştir. Ayrıca
ölçeğin güvenirliğine kanıt sağlamak amacıyla test tekrar test ve Crα güvenirlikleri
hesaplanmış ve 0,92 olarak bulunmuştur.
 EPİSTEMOLOJİK İNANÇ ÖLÇEĞİNİN FAKTÖR YAPISININ YENİDEN İNCELENMESİ : CİNSİYET VE
ÖĞRENİM GÖRÜLEN PROGRAM TÜRÜNE GÖRE EPİSTEMOLOJİK İNANÇLARIN KARŞILAŞTIRILMASI
Yazan : Deniz DERYAKULU & Şener BÜYÜKÖZTÜRK
Yer Bilgisi : Ankara Üniversitesi Eğitim Bilimleri Fakültesi
Bu araştırmanın amacı ; Epistemolojik İnanç Ölçeğinin faktör yapısını yeniden incelemek ve üniversite
öğrencilerinin epistemolojik inançlarının cinsiyet ve öğrenim görülen program türü değişkenleri açısından farklılaşıp
farklılaşmadığını belirlemektir. Araştırma , 626 üniversite öğrencesi üzerinde yürütülmüştür. Grubun yaş ortalaması
20.5’dir. Gereksinim duyulan veriler , EİÖ ve bir kişisel bilgi formu aracılığıyla toplanmıştır. EİÖ ‘ nün faktör
yapısının yeniden değerlendirmek için temel bileşenler analizi ve doğrulayıcı faktör analizi , cinsiyet ve öğrenim
görülen program türüne göre epistemolojik inançlar arasındaki fark ise çok değişkenli varyans analizi kullanarak
test edilmiştir. Faktör analizi sonuçları , bir maddenin ölçekten çıkması ve bir maddenin de farklı faktörde yer
alması dışında EİÖ’ nin üç faktörlü yapısının korunduğunu göstermiştir.
 Öğretmenlik Mesleğine Yönelik Tutum Ölçeğinin Geçerlik ve Güvenirlik Çalışması
Yazan : Yrd. Doç. Dr. Mehmet ÜSTÜNER
Bu çalışmada eğitim örgütlerindeki örgütsel davranışın incelenmesinde önemli bir boyut olan mesleki tutum konusuna ilişkin bir
tutum ölçeği geliştirmek amaçlanmıştır. Geliştirilen bu ölçek öğretmenlik programlarında öğrenim görmekte olan öğrencilerin
Öğretmenlik mesleğine yönelik tutumunu belirlemeyi amaçlamaktadır. Ölçek tek boyutlu likert tipi bir tutum ölçeğidir . Ölçeğin
denemelik formu 11 farklı öğretmenlik programında öğrenim görmekte olan 449 öğrenciye uygulanmıştır. Ölçeğin yapı geçerliliğine
ilişkin olarak yapılan temel bileşenler analizi sonucunda 34 maddenin yer aldığı birinci faktörde faktör yükü değerlerinin .74 ile .41
arasında değiştiği ve faktörün toplam varyansın %30'unu açıkladığı görülmüştür. Ölçeğin toplam puanı ile her bir maddenin madde
test korelasyonuna bakılmış ve madde test korelasyon değerlerinin 74 ile 42 arasında değişkenlik gösterdiği bulunmuştur . Ölçeğin
ölçüt ölçek geçerliliği 89'dur. Ölçeğin güvenirliğine ilişkin olarak 116 eğitim fakültesi öğrencisine 4 hafta ara ile iki kez uygulanması
sonucu elde edilen puanların kararlılığına ilişkin güvenirlik katsayısı 72 bulunmuştur. Ölçeğin iç tutarlılık katsayısı (Cronbah Alpha)
93'dür.
LİKERT : Genellikle bir kavramı (faktörü) ölçmek için kullanılan anket sorularını değerlendirmek için geliştirilmiş bir tür
eşit aralıklı ölçektir.
 Veri Zarflama Analizi Sürecinde Temel Bileşenler Analizinin Ayırım Gücünü Arttırıcı Etkisi
Yazan : İ. Esen YILDIRIM
Yer Bilgisi : Marmara Üniversitesi Ekonometri Bölümü, İktisadi ve İdari Bilimler Fakültesi
Veri Zarflama Analizi(VZA), çeşitli karar birimlerinin çok sayıda girdi ve çok sayıda çıktıya dayalı etkinlik
incelemelerinde sıklıkla başvurulan tekniklerden biridir. Çok sayıda avantajının yanı sıra,Veri Zarflama
Analizi’nde girdi ve çıktı sayıları toplamının, karar birimi sayısına kıyasla yüksek olması durumunda analizin
ayırım gücü düşmektedir. Belirli sayıda karar birimi için, bazı girdi veya çıktıları modelden çıkarmak suretiyle
duyarlılığı arttırma çabaları, çıkarılan girdi ya da çıktının sahip olduğu bilginin kaybedilmesine yol açmaktadır.
Bunun yerine, çok değişkenli istatistiksel analiz tekniklerinden Temel Bileşenler Analizi(TBA) kullanılarak
boyut indirgemesine gidilmesi, analiz sürecine önemli katkılar sağlamaktadır. Bu çalışmada, TBA’nın VZA
çözümlemelerinde ayırım gücünü arttırıcı etkisi, Türkiye'deki vakıf üniversitelerinin etkinlik incelemesi
üzerinde sunulacaktır.
 Üniversite Öğrencilerinin Sosyal Ağ Siteleri Kullanım Amaçlarını Belirlemeye Yönelik Bir
Ölçek Geliştirme Çalışması
Yazan : Hasan KARAL & Mehmet KOKOÇ
Bu çalışmanın amacı, üniversite öğrencilerinin sosyal ağ sitelerini kullanım amaçlarını belirlemeye yönelik
bir ölçek geliştirmektir. Araştırmacılar tarafından literatür taraması ve öğrenci görüşleri doğrultusunda 42
taslak madde hazırlanmıştır. Uzman görüşleri doğrultusunda 15 maddeye indirgenmiştir. Taslak ölçek; 20092010 öğretim yılında Artvin Çoruh Üniversitesi, Ege Üniversitesi, Hacettepe Üniversitesi, İstanbul
Üniversitesi, Karadeniz Teknik Üniversitesi, Uşak Üniversitesi ve İnönü Üniversitesi'nde lisans düzeyinde
öğrenim gören 315 sosyal ağ sitesi kullanıcısı öğrenciye uygulanmıştır. Ölçeğin yapı geçerliği için temel
bileşenler analizi yöntemi kullanılarak faktör analizi yapılmış, güvenirliği için test-tekrar test ve Cronbach
Alpha iç tutarlık katsayıları hesaplanmıştır.Yapılan faktör analizi sonucunda toplam 14 maddeden oluşan 3
faktörlü ölçek elde edilmiştir. Ölçeğin Cronbach Alpha iç tutarlılık katsayısı 0.83, test-tekrar test güvenirliği
0.91 olarak hesaplanmıştır.
 Veri Madenciliğinde Temel Bileşenler Analizi ve Negatifsiz Matris Çarpanlarına Ayırma
Tekniklerinin Karşılaştırmalı Analizi
Yazan : Kazım YILDIZ ,Yılmaz ÇAMURCU , Buket DOĞAN
Yer Bilgisi : Marmara Üniversitesi, Elektronik-Bilgisayar Eğitimi Bölümü
Teknolojinin hızla gelişmesi sonucu yüksek boyutlu veriler ile çalışma zorunluluğu ortaya
çıkmıştır. Geleneksel kümeleme algoritmaları yüksek boyutlu veriler ile uygulandığında kümeleme
işleminin sonucu istenildiği gibi olmamaktadır.Yüksek boyutlu veriler üzerinde bu algoritmalar
yetersiz kalmaktadır. Bu yüzden yüksek boyutlu veri setleri üzerinde etkili olabilecek algoritmalar
geliştirilmeli veya veri setleri üzerinde boyut indirgeme yoluna gidilmelidir. Bu çalışmada boyut
azaltma metotlarından temel bileşen analizi ve negatifsiz matris çarpanlarına ayırma metotları
geleneksel kümeleme algoritmaları ile beraber kullanılmakta elde edilen sonuçların
karşılaştırılması küme saflık ve ortak bilgi değerlerine göre yapılmaktadır.
 SEVİYE BELİRLEME SINAVI FEN VE TEKNOLOJİ ALT TESTİ İLE DİĞER ALT TESTLER ARASINDAKİ İLİŞKİNİN
YOL ANALİZİ İLE İNCELENMESİ
Yazan : Duygu ANIL , Cem Oktay GÜZELLER
Yer Bilgisi : Abant İzzet Baysal Üniversitesi , Eğitim Fakültesi
Bu araştırmada, 2008 yılı seviye belirleme sınavı yedinci sınıf Fen ve Teknoloji alt testi ile Türkçe, Matematik,
Sosyal Bilgiler ve yabancı dil alt testi arasındaki ilişkiler yol analizi ile incelenmiştir. Araştırmanın örneklemi, 2008
yılında SBS’ye giren 962991 yedinci sınıf öğrencisinin oluşturduğu evrenden seçkisiz olarak seçilen 5000 öğrenci
oluşturmaktadır. Verilerin analizinde, her bir alt teste ilişkin 1-0 olarak puanlanan ham puan matrisi kullanılarak
temel bileşenler analizi yapılmış, KR 20 güvenirlik katsayısı hesaplanmış ve temel bileşenler analizinin sonucunda
ortaya çıkarılan faktör yapısına dayalı olarak dışsal (Fen ve Teknoloji alt testi) ve içsel (Türkçe, Matematik, Sosyal
Bilgiler ve yabancı dil alt testi) değişkenler arasındaki ilişki yol analizi ile incelenmiştir. Analiz sonucunda, her bir alt
testin tek faktörlü bir yapıya sahip olduğu belirlenmiş, KR 20 güvenirlik katsayısı 0.80’den yüksek bulunmuş ve Fen
ve Teknoloji alt testinin, en fazla Matematik alt testini açıkladığı tespit edilmiştir.
TEZLER
 Temel Bileşenler Analizi Metodları İle MRI Görüntülerinin Kümelenmesi
Yazan : EMİNE GEZMEZ
Yer Bilgisi : Çukurova Üniversitesi / Fen Bilimleri Enstitüsü / Elektrik-Elektronik Mühendisliği Anabilim Dalı
Görüntülerin sınıflandırılmasındaki en önemli problemlerden biri de görüntü boyutlarının çok fazla
olmasıdır. Bu yüzden, görüntüleri sınıflandırmada iyi sonuç alabilmek için görüntü boyutlarının indirgenmesi
gerekir.Bu çalışmada, Temel Bileşenler Analizi ile beynin MRI görüntülerinin boyutları indirgendikten sonra
elde edilen görüntülere sınıflandırma metodları uygulanmıştır. General Hebbian Algorithm , Diamantras and
Kung's APEX Rule , Expectation-Maximization Principle Component Analysis , Probabilistic Principal
Components Analysis ve True-PCA olmak üzere 5 farklı Temel Bileşenler Analizi metodu kullanılmıştır. Elde
edilen yeni görüntülere ise K-Means ve Fuzzy C-Means sınıflandırma metodları uygulanmıştır. Bu metodlar
sonucunda elde edilen görüntüler karşılaştırılarak en iyi sonucu veren metodlar tespit edilmiştir
 Çok Boyutlu Sağkalım Verilerinde Denetimli Temel Bileşenler Analizine Alternatif Bir Boyut İndirgeme Yaklaşımı
Yazan : ELVAN AKTÜRK HAYAT
Yer Bilgisi : Ege Üniversitesi / Fen Bilimleri Enstitüsü / İstatistik Anabilim Dalı
Bu çalışmada, boyut indirgemede kullanılan denetimli temel bileşenler analizi (D-TBA) ile bu yönteme alternatif bir yaklaşım olarak
önerilen sağkalım ağacıyla gen seçerek uygulanan yapay sinir ağlarıyla doğrusal olmayan temel bileşenler analizinin (sağkalım ağacı temelinde
YSA-DOTBA) performanslarının karşılaştırılması amaçlanmıştır.
D-TBA'da, çok boyutlu gen ekspresyon verilerinden önemli genlerin belirlenmesinde Cox skorlar kullanılmıştır. Cox skorlara göre önemli
olduğu belirlenen genler tekil değer ayrışması ile 3 temel bileşene indirgenmiştir. Sağkalım ağacı temelinde YSA-DOTBA yaklaşımında, önemli
genlerin belirlenmesinde ise sağkalım ağacının önemlilik değerleri kullanılmıştır. Sağkalım ağacıyla önemli bulunan genler YSA'da girdi değişkeni
olarak alınarak, 3 temel bileşene indirgenmiştir. D-TBA'nın varyans açıklama oranı %18.2, sağkalım ağacı temelinde YSA-DOTBA'nın varyans
açıklama oranı %35.1 bulunmuştur. D-TBA ve sağkalım ağacı temelinde YSA-DOTBA'nın performansları Cox regresyon modeli (CRM) ile
karşılaştırılmıştır. Elde edilen Cox regresyon modellerini karşılaştırmak için de ROC eğrileri ve C indeks hesaplanmıştır. İki modelin ROC
eğrileri arasında istatistiksel olarak önemli bir fark bulunamamıştır. C indeks sonuçlarına göre, CRM-1 için tahmin edilen ve gözlenen bağımlı
değişkenler arasındaki uyumun olasılığı CRM-2 için tahmin edilen ve gözlenen bağımlı değişkenler arasındaki uyumun olasılığından daha
yüksektir. D-TBA'dan elde edilen temel bileşenlerin bağımsız değişken olarak alındığı CRM sonuçları sağkalım ağacı temelinde YSADOTBA'dan elde edilen temel bileşenlerin bağımsız değişken olarak alındığı CRM sonuçlarından biraz daha iyi çıkmıştır.
Sonuç olarak D-TBA, sadece doğrusal ilişkileri göz önüne alırken, sağkalım ağacı temelinde YSA-DOTBA, doğrusal olmayan ilişkileri de
dikkate alması ve daha fazla varyans açıklayıcılığına sahip olması açısından D-TBA'ya alternatif bir yöntem olarak değerlendirilmelidir.
 Temel Bileşenler Analizi ve Klinik Bir Uygulama
Yazan : FATMA NESRİN TURAN
Yer Bilgisi : İstanbul Üniversitesi / Sağlık Bilimleri Enstitüsü
Temel Bileşenler Analizi tanım olarak; değişkenler arasındaki bağımlılık yapısının yok edilmesi ve/veya boyut
indirgeme amacıyla kullanılan başlı başına bir analiz olduğu gibi başka analizler için (örn: Faktör analizi) veri
hazırlama tekniği olarak da kullanılan istatistiksel bir yöntemdir. Çok değişkenli istatistiksel analizde n tane bireye
(nesne) ilişkin p tane değişken (özellik) incelenmektedir. Bu özelliklerden bir çoğunun birbiriyle ilişkili olduğu
(bağımlı) ve p sayısının çok büyük olması analizde sorun yaratmaktadır. Bu gibi durumlarda başvurulan en önemli
tekniklerden biri olan Temel Bileşenler Analizinin amacı değişkenler arasındaki bağımlılık yapısının yok edilmesi
ve/veya boyut indirgeme olduğu gibi bu analiz ayrıca çoklu regresyonda çoklu bağlantı durumunu gidermede ve çok
değişkenli regresyonda değişken kümelerinde boyut indirgeme olarak kullanılmaktadır. Biz bu çalışmada Temel
Bileşenler Analizini Anjina Pektorisli erkek ve kadın, sağlam erkek ve kadın olmak üzere dört grupta sekiz değişken
açısından boyut indirgeme amacıyla kullandık. Anjina Pektorisli erkek ve kadın ile sağlam erkekler üç faktör ile
açıklanabilirken sağlam kadınların iki faktörle açıklanabileceği sonucuna erişildi. Bu bulguların klinik özelliklerle de
uyumlu olması çözümlemenin yeteneğini yansıtmaktadır.
 Temel Bileşenler Analizi ve Bir Uygulaması
Yazan : ZEYNO KONCA
Yer Bilgisi : Cumhuriyet Üniversitesi / Sağlık
Türkiye'de 81 il merkezindeki T.C. Sağlık Bakanlığına bağlı bulunan yataklı tedavi kurumlarına ait, kaba
ölüm hızı, uzman hekim sayısı, fiili yatak sayısı, yatak işgal yüzdesi, yatan hasta oranı, ortalama kalış gün sayısı,
ameliyat sayısı gibi bir hastanenin hasta bakım kalitesini gösteren bazı ölçütler 2000 yılı için tespit edilmiştir.
Temel bileşenler analizi yöntemi ile değişkenler arasındaki bağımlılık yapısı yok edilmiş ve boyut indirgeme
işlemi sonucunda toplam varyansın %73.794'lük bir bölümünü açıklayan iki özdeğer dikkate alınarak, yedi
ölçüt iki Temel Bileşenle ifade edilmiştir. Elde edilen Temel Bileşenler yardımıyla bir denklem yazılmış ve
hastanelere ait ölçütler bu denklemde yerine konularak her hastaneye ait sayısal bir değer (Y) elde edilmiş
ve elde edilen bu değerlere göre hastaneler sıralanmıştır.Yapılan sıralamada Ankara Numune Hastanesi,
Antalya Devlet Hastanesi ve Bursa Devlet Hastanesi ilk üç sırada, Şırnak Devlet Hastanesi, Bolu İzzet Baysal
Devlet Hastanesi ve Tunceli Devlet Hastanesi de son üç sırada yer almışlardır.
 Gen Dizilerinde Temel Bileşenler Analizinin Uygulanması
Yazan : YALÇIN TAHTALI
Yer Bilgisi : Çukurova Üniversitesi / Fen Bilimleri Enstitüsü / Zootekni Anabilim Dalı
Bu çalışmada, farelerin karaciğerleri üzerine belirli zaman periyotlarında uygulanmış olan, toksikolojik çalışmalardan alınan ve
cDNA mikrodizi teknolojisi kullanılarak elde edilen 6675 gen ve 20 dizi içeren verilere temel bileşenler analizi uygulanmıştır. cDNA
mikrodizi analizi, birden çok deneme ya da örnekten alınan binlerce geni aynı anda analiz etmede kullanılan bir teknolojidir. Temel
bileşenler analizi ise orijinal değişkenlere ait varyans - kovaryans yapısının açıklanmasını ve bağımlılık yapısının ortadan kaldırılmasını
ve tüm veri yapısını ifade edebilecek ve daha az sayıda bileşen için boyut indirgenmesi amacıyla kullanılan çok değişkenli istatistik
tekniğidir. cDNA teknolojisi kullanılarak, birbirine benzer ifade profilleri ile gen gruplarının oluşturulması ve gruplar içerisindeki
benzer bileşen (component) yükleri vasıtasıyla birbirleriyle ilişkili genlerin tanımlanması açıklanmıştır. Bunun yanı sıra aynı veri
kümesine ait korelasyon matrisinden faktörlerin ayrıştırılması ve yorumu izah edilmiştir. Kullanılan veri seti içinde, bütün veri yapısın
izah edebilecek daha az sayıda bileşene indirgemek için temel bileşen sayısına karar verme yöntemlerinden bir kaçı burada
değerlendirilmiştir. Bunlardan biri olan Scree grafiğe göre, eğrinin bileşen ekseninde düzleştiği bölgeye kadar olan bileşenler kabul
edilmektedir.Yani eğrinin düz bir doğru halini almaya başladığı noktadan itibaren ana bileşenler reddedilebilmektedir bu yönteme
göre de 9 veya 10 temel bileşenin yeterli olacağı sonucu çıkmaktadır. Bunun yanı sıra Kaiser' in ve Bartlett' önerdiği yöntemlerde
göz önünde bulundurulmuştur. İlk 10 temel bileşenin bütün yapımın varyansını izah etmeye yeterli olduğu düşünülürse bu durumda
%17.372'lik bir varyans kaybı ile 20 temel bileşen yerine 10 temel bileşen ile açıklamanın yeterli olduğu düşünülmektedir.
 Doğancı Baraj Rezervuarı Su Kalitesinin Temel Bileşenler Analizi Yardımıyla Değerlendirilmesi
Yazan : AYŞE KURT
Yer Bilgisi : Uludağ Üniversitesi / Fen Bilimleri Enstitüsü / Çevre Mühendisliği Anabilim Dalı
Bu çalışmada, Doğancı Baraj Rezervuarı üzerindeki dört adet gözlem istasyonundan, 20022010 yılları arasında elde edilen 27 adet su kalitesi parametresi değerlendirilmiştir. Bu veriler
üzerinde Temel Bileşenler Analizi uygulanarak, 27 parametre; Sıcaklık, pH, Bulanıklık, AKM, TÇM,
Geçici Sertlik, Kalıcı Sertlik, Top. Sertlik, Top. Alkalinite, Kalsiyum Sertliği, Magnezyum Sertliği,
Serbest Karbondioksit, Top. Demir, Top. Mangan, Klorür, Sülfat, Nitrat Azotu, Nitrit Azotu, Silisyum
Dioksit, Amonyum Azotu, Çözünmüş Oksijen, Orto Fosfat Fosforu, İletkenlik, Organik Madde
Miktarı, Sodyum, Potasyum ve BOİ daha sonra 5-6 bileşene indirgenmiştir.Yapılan analizle su
kalitesi araştırmalarında çok fazla sayıda parametrenin ölçülmesi yerine önceden dikkatlice
seçilmiş, daha az sayıdaki kritik parametrelerin tespitinin yapılabileceği gösterilmiştir.
 Doğrusal Olmayan Temel Bileşenler Analizi ve Sağlık Alanında Uygulaması
Yazan : CANAN DEMİR
Yer Bilgisi :Yüzüncü Yıl Üniversitesi / Sağlık Bilimleri Enstitüsü / Biyoistatistik ve Tıbbı Bilişim Anabilim Dalı
Demir, C, Doğrusal olmayan temel bileşenler analizi ve sağlık alanında uygulaması.Yüzüncü Yıl
Üniversitesi, Sağlık Bilimleri Enstitüsü, Biyoistatistik Anabilim Dalı Yüksek Lisans Tezi,Van 2010. Doğrusal
Olmayan Temel Bileşenler Analizi, aralarında doğrusal veya doğrusal olmayan ilişki bulunan veri kümeleri için
rakamsal ve görsel sonuçlar veren açıklayıcı bir boyut indirgeme yöntemidir. Doğrusal olmayan temel
bileşenler analizinde, sayısal değişkenlerin yanında sınıflayıcı ve sıralayıcı değişkenler de aynı anda analize
dahil edilebilir. Analizde gözlenen değişkenler arasındaki ilişkilerin doğrusal olduğu varsayımına gerek yoktur.
Dolayısıyla, klasik olarak kullanılan yöntemlere göre bazı avantajları bulunan yeni bir yöntem olarak
düşünülebilir. Bu çalışmada doğrusal olmayan temel bileşenler analizi genel olarak tanıtılmış, teorik alt yapısı
açıklanmış ve konunun anlaşılmasını kolaylaştırmak amacıyla bir uygulama yapılmıştır. Uygulamada farklı
değişken kombinasyonları kullanılarak elde edilen sonuçlar, tablolar ve grafikler halinde sunulmuş ve sonuçlar
yorumlanmıştır.
SEÇİL KARTAL
CUMHURİYET ÜNİVERSİTESİ
EKONOMETRİ TEZLİ YÜKSEK LİSANS
Download