BÖLÜM 3 3. ÇOK DEĞİŞKENLİ REGRESYON İÇİN VEKTÖR VE MATRİS CEBRİ Bölüm 2 de, doğrusal regresyon tek değişkenli basit model olarak ele alınarak açıklanmıştı. Bölüm 4 de ise çok değişkenli (k değişkenli) model için giriş yapılacaktır. Çok değişkenli modelde değişken sayısına paralel olarak tahminlenmesi gereken parametre sayısı da artmaktadır. Bunun sonucu olarak işlemler için bazı hesaplama zorlukları ortaya çıkmaktadır. İşte bu hesaplama zorluklarını giderebilmek amacı ile kitabın bu bölümünden itibaren matris ve vektör işlemleri kullanılacaktır. Doğal olarak regresyon analizinde kullanılacak olan bu matris ve vektör işlemlerinin tanıtılması faydalı olacaktır. Kitabın bu bölümünün amacı temel doğrusal cebir konularını sadece regresyon kapsamında ele almaktır. Ayrca Bölüm 5 de verilecek olan regresyon geometrisi kısmına temel oluşturmak üzere bu kısımda vektör geometrisi incelenecektir. Bu nedenle temel teoremlerin bazıları ispatsız olarak verilecektir. Bu kitapta matrisler büyük koyu harf ile vektörler ise küçük koyu harf ile gösterilecektir. 3.1 VEKTÖRLER Bir boyutlu öklit (Euclidean) uzayındaki gerçel sayılar kümesi uzayı m ise her biri bir m ile tanımlanır. m ile gösterilir. m-boyutlu öklit kümesini tanımlayan m adet kümenin kartezyen (Catesian) çarpımı, uzayındaki bir eleman x1 x x m bir vektör olarak adlandırılır. Bu vektördeki xi değerleri vektörün elemanları m ise vektörün boyutu olarak adlandırılır. Diğer bir ifade ile m elemanlı bir vektör düzenlenmiş m adet gerçel sayıdan oluşmuştur. Derecesi m=1 olan vektörler skaler olarak adlandırılırlar. Bunlar genellikle bir boyutlu değişkenlerdir. Tanım 3.1 Uzunluk, alan, hacim, yoğunluk, kütle gibi cebirsel değerlere skaler büyüklük denir. Tanım 3.2 Hareket, hız, kuvvet gibi hem yönü hem büyüklüğü olan değerlerlere vektörel büyüklük denir. Vektör analizi hem cebirsel hem de geometrik olarak uygulanabilir. Her iki bakış açısı da önemlidir. Eğer xi elemanı belirli bir ülkedeki belirli bir yılda i-inci ailenin gelirini ifade ediyorsa x vektörünü m uzayındaki bir nokta olarak düşünmek oldukça mantıklıdır. Bununla birlikte kuvvet ve ivme gibi değerler ele alındığında her ikisinin de hem büyüklük hem de yön değerlerine sahip olduğu görülebilir. Bu değerleri orijinden yayılan oklarla ifade etmek en uygun yoldur. İlk bakış açısı cebirsel ikincisi ise geometriktir. 59 3.1.1 Vektör İşlemleri Vektörlere uygulanan iki temel işlem, vektörel toplama ve skaler çarpımdır. Aynı boyuta sahip x ve y gibi iki vektörün toplamı x+y olup aynı boyutlu bir vektörü, x1 y1 xy x y m m (3.1) tanımlar. Bir x vektörünün bir skaleri ile çarpımı, x1 x x m (3.2) olup x çarpımı da aynı sonucu verir. Bu cebirsel tanımların geometrik gösterimi Şekil 3.1 ve Şekil 3.4 de verilmiştir. İki vektörün toplamı x+y, vektörler ile orijinin tanımladığı paralel kenarın köşegeni olarak elde edilir. İki elemanlı bir vektör, 3 x 1 şeklinde tanımlanabilir. Bu vektör Şekil (3.1)’de olduğu gibi yönlü bir doğru parçası ile gösterilebilir. Doğru parçası, orjinde başlayıp, (3,1) noktasında biter. Ok ise vektörün yönünü belirtir. Bir başka y vektörü ise, 1 y 2 şeklinde verilebilir. Bu iki vektör geometrik olarak aşağıda belirtildiği şekilde toplanabilir: İki vektörden herhangi biri orjin dikkate alınarak çizilir (şekilde ilk çizilen x vektörüdür). Daha sonra diğer vektör ilk vektörün bitim koordinatından itibaren (bu bitim noktası ikinci vektör için orjin olarak kabul edilebilir) çizilir. Şekilde varılan nokta p’dir. İlk vektörün başlangıç noktası ile bu p noktasını birleştiren doğru parçası x+y vektörünü verir. Elde edilen bu vektörün koordinatları (4,3)’dür. x+y vektörü x ve y vektörlerinin geometrik olarak toplanması ile elde edilir. Eğer bu iki vektör cebirsel olarak toplanırsa, 3 1 4 xy 1 2 3 sonucu elde edilir. Görüldüğü gibi hem geometrik hem de cebirsel olarak tamamen aynı sonuçlar elde edilmiştir. Şekilden görüldüğü gibi ilk olarak y vektörü çizilseydi de aynı noktaya (p’ye) varılacak ve sonuç değişmeyecekti. Vektörel çıkarma ise Şekil 3.2 ve 3.3 de gösterilmiştir. 60 Şekil 3.1 Vektörel toplama işlemi Şekil 3.2 Vektörel çıkarma Şekil 3.3 den (x+y) vektörel toplamının, x ve y vektörlerinden oluşturulmuş paralel kenarın bir köşegeni, (x-y) farkının ise paralel kenarın diğer bir köşegeni olduğu görülmektedir. Şekil 3.3 Vektörel toplama ve çıkarmanın karşılaştırılması: Toplama x okunu takip eden y okunun ucunu x’in başlangıcı ile birleştiren köşegendir. Çıkarma ise y noktasından x noktasına oluşturulan köşegen ile tanımlanır. 61 Vektörün skaler ile çarpımında vektördeki her bir eleman skaleri ile çarpılır ve büyüklükler değişir. Eğer >0 ise yön aynı kalır, <0 ise vektör zıt yöndedir. Eğer her hangi bir skaleri için y=x ise ya da y=0 veya x=0 ise x ve y vektörleri arasında doğrusal bağlantı (collinear) vardır. Şimdi bir vektörün bir skalerle çarpımı ele alınsın. Bu duruma bir örnek olarak x vektörü 2 ile çarpılmış ve 3 6 2x 2 1 2 sonucu elde edilmiştir. Elde edilen bu vektörün yönü x vektörü ile tamamen aynıdır. Aradaki fark ise elde edilen vektörün uzunluğunun x vektörünün iki katı olmasıdır. Bu skaler negatif bir sayıda olabilir. 3 3 1x 1 1 1 Elde edilen bu iki vektör orjinal x vektörü ile birlikte Şekil 3.4 de gösterilmiştir. Şekilden görüldüğü gibi bu üç vektörün hepside orjinden geçen bir tek doğru parçası üzerindedir ve bu doğru parçası da x vektörü ile tanımlanmıştır. Şekil 3.4 Bir vektörün skalerle çarpımı Teorem 3.1 u, v ve w uzayındaki vektörler ve α skaler olmak üzere vektörel toplama ve skaler n çarpım aşağıdaki özelliklere sahiptir: n 1. u+v vektörü de uzayındadır, (toplama işlemine göre kapalılık). 2. u+v=v+u (değişme özelliği). 3. (u+v)+w=u+(v+w) (birleşme özelliği). 4. u+0=u (toplamada birim eleman). 5. v+(-v)=0 (toplamada ters eleman). 6. u vektörü de n uzayındadır, (skaler çarpım işlemine göre kapalılık). 7. (u+v)=u+v (dağılma özelliği). 62 8. (+α)u=u+ αu (dağılma özelliği). 9. (αu)=(α)u (birleşme özelliği) 10. 1(u)=u (skaler çarpım işleminde birim eleman). Teoremden görüldüğü gibi uzayındaki 0 vektörü n n uzayındaki toplama işleminin birim elemanıdır. Benzer şekilde –v vektörü, v vektörü için, toplama işleminin ters elemanıdır. Teorem 3.2 n uzayındaki bir vektör v ve skaler olmak üzere vektörel toplama ile skaler çarpım işlemininin birim ve ters elemanları aşağıdaki özelliklere sahiptir: 1. Toplama işlemine göre birim eleman eşsizdir, eğer v+u=v ise u=0. 2. Toplama işlemine göre ters eleman eşsizdir, eğer v+u=0 ise u=-v. 3. 0v=0. 4. 0=0. 5. Eğer v=0 ise =0 ya da v=0. 6. –(-v)=v. Vektörlerin basit cebirsel işlemleri ve bu işlemlerin geometrik yorumları Tablo 3.1’de verilmiştir. Tablo 3.1 Vektörlerin cebirsel ve geometrik karşılaştırılması Cebirsel işlem Geometrik Yorumu Pozitif bir skalerle çarpım 2(3,1)=(6,2) Uzunluk değişir. (Şekil 3.4) Negatif bir skalerle çarpım -1(3,1)=(-3,-1) Yön değişir. (Şekil3.4) Toplam (3,1)+(1,2)=(4,3) Çıkarma (3,1)-(1,2)=(2,-1) x ve y okları birbirini takip edecek şekilde eklenir. Oluşturulan paralel kenarın köşegeni toplam vektörü belirtir.(Şekil 3.1) x +(-y) toplamına eşittir. Oluşturulan paralel kenarın diğer köşegeni fark vektörünü belirtir. (Şekil 3.2 ve 3.3) Bu verilenler dikkate alınarak bir vektör uzayının tanımı yapılabilir. 3.1.2 Vektör Uzayı Matris teorisi cebirsel ya da geometrik olarak incelenebilir. Her iki bakış açısı da aynı derecede önemlidir. Vektör uzayının incelenmesi geometrik bir bakış açısı kazanabilmek için gereklidir. Tanım 3.3 İkili işlem, vektörel toplama ve skaler çarpım, üzerinde tanımlanmış bir küme olsun. Eğer Teorem 3.1 deki aksiyomlar kümesindeki her u, v ve w vektörleri için ve her ve skalerleri için sağlanıyor ise kümesi bir vektör uzayı olarak adlandırılır. Tanımdan da anlaşılacağı gibi bir vektör uzayı dört elemandan oluşmaktadır: bir vektörler kümesi, bir skalerler kümesi ve bu iki küme üzerine tanımlanan iki işlem. Bu özelliklerden görüldüğü gibi toplama ve bir skalerle çarpma işlemleri sonucunda elde edilen vektör yine aynı vektör uzayındadır. 63 Tanım 3.4 Bir vektör uzayının alt kümesi , eğer kendisi de uzayında tanımlanan vektörel toplama ve skaler çarpım işlemine göre vektör uzayı ise uzayının alt uzayı olarak adlandırılır. Bir kümesinin vektör uzayını oluşturabilmesi için Teorem 3.1 ile tanımlanan aksiyomların hepsinin doğrulanması gerekmektedir. Bununla birlikte uzayının alt kümesi ise ve kümesi eğer daha büyük bir vektör kümesi üzerine tanımlanan işlemler kümesi üzerine tanımlanan işlemler ile aynı ise bu on aksiyomun büyük bir kısmı daha büyük uzay tarafından garanti altına alındığı için kümesinin bir alt uzay olabilmesi için sadece aşağıda verilen teoremdeki kapalılık ile ilgili aksiyomları sağlaması yeterli olacaktır. Teorem 3.3 Eğer bir vektör uzayının boş olmayan alt kümesi ise kümesinin uzayının bir alt uzayı olabilmesi ancak ve ancak aşağıdaki iki aksiyomun sağlanmasını gerektirir: kümesinde ise u+v vektörü de kümesindedir. 2. Eğer u vektörü kümesinde ise ve bir skaler ise u vektörü de kümesindedir. Eğer bir vektör uzayının alt uzayı ise hem hem de aynı 0 vektörüne sahip 1. Eğer u ve v vektörleri olmalıdırlar. Bir vektör uzayının bir alt uzayının kendisi de bir vektör uzayı olduğundan sıfır vektörünü içermelidir. Bir vektör uzayının en basit alt uzayı sadece sıfır vektöründen, 0 oluşur. Bu alt uzayı sıfır (trivial) alt uzayı olarak adlandırılır. vektör uzayının bir diğer özel alt uzayı kendisidir. Her vektör uzayı bu iki özel alt uzaya sahiptir. Bu özel durumların haricindeki diğer alt uzaylar uygun (proper, nontrivial) alt uzaylar olarak adlandırılır. Tanım 3.5 Bir vektör uzayındaki v vektörünün doğrusal kombinasyonu, vektör uzayındaki x1, x2,…, xn vektörlerinin, v=1x1+2x2+…+nxn yapısı ile tanımlanan bir toplamıdır. Vektörlerin toplanması ve bir skalerle çarpılması işlemlerinin birlikte ele alınması sonucunda x1 ve x2 vektörlerinin doğrusal kombinasyonu olan herhangi bir iki elemanlı vektör elde edilebilir. Elde edilen bu y vektörü, y 1x1 2 x2 şeklinde ifade edilebilir. Bu eşitlikteki λ1 ve λ2 skalerleri temsil etmektedir. Eğer y vektörü, 4 y 0 şeklinde tanımlanmış ise bu vektör x1 ve x2 vektörlerinin doğrusal bir kombinasyonu olarak, 64 y 12 2 4 1 5 1 5 3 ifade edilebilir. Bu eşitlikte λ1=12/5 ve λ2=-4/5’dir. Bu değerler aşağıdaki şekilde, denklem çiftinin eşanlı olarak çözülmesi ile elde edilebilir. 2 1 2 2 4 1 2 1 3 0 1 3 1 2 Bir başka örnek için y vektörü, 6 y 3 olarak verilmiş olsun. Bu durumda x1 ve x2 vektörlerinin doğrusal bir kombinasyonu olarak, 2 1 y 3 0 1 3 şeklinde ifade edilebilir. Bu eşitlikte λ1=3 ve λ2=0’dır. Bu örnekler daha da arttırılabilir. Tanım 3.6 Bir vektör uzayının alt kümesi S v1 , v 2 , , v n olsun. Eğer uzayındaki her bir vektör S kümesindeki vektörlerin doğrusal kombinasyonu olarak yazılabiliyor ise S kümesine uzayının türeten (spanned) kümesi adı verilir. Örnek 3.1 S 1,0,0, 0,1,0, 0,0,1 kümesi, 3 vektör uzayındaki her hangi bir vektör u u1 , u 2 , u3 , u u1 1,0,0 u 2 0,1,0 u3 0,0,1 u u1 , u 2 , u3 şeklinde yazılabildiği için S kümesi Teorem 3.4 Eğer bir türeten S kümesi 3 uzayının türeten kümesidir. vektör uzayındaki vektörler kümesi S v1 , v 2 , , v n ise bu uzayı vektör uzayının bir alt uzayıdır. Türeten S kümesini de içeren vektör uzayının en küçük alt uzayı S kümesi olup uzayının tüm diğer alt uzayları türeten S kümesini de içermek zorundadır. Teorem 3.5 Sonlu sayıdaki x1, x2,…, xn (n1) vektörler kümesi için, 1x1+2x2+…+nxn=0 eşitliğini sağlayan ve hepsi sıfır olmayan (en az biri sıfırdan farklı) 1 ,…, n skalerleri mevcut ise vektörler doğrusal bağımlı aksi durumda doğrusal bağımsızdırlar. Teorem 3.6 Bir S v1 , v 2 , , v n kümesi ancak ve ancak vj vektörlerinden en az bir tanesi S kümesindeki diğer vektörlerin doğrusal bir kombinasyonu olarak yazılabiliyor ise doğrusal bağımlıdır. 65 Sonuç 3.6.1 Bir vektör uzayındaki iki vektör u ve v ancak ve ancak bir vektör diğerinin skalerle çarpımı, u=v olarak ifade edilebilitor ise doğrusal bağımlıdır. Tanım 3.7 Bir vektör uzayındaki S v1 , v 2 , , v n vektörler kümesi, eğer V vektör uzayını türetiyorsa, S kümesi doğrusal bağımsız ise, vektör uzayının bazıdır. Bu tanım her vektör uzayının sonlu sayıda vektörden oluşan bir baza sahip olduğunu belirtmez. Birim vektörlerden oluşan bir S e1 , e 2 , , e n kümesi n için standart baz olarak adlandırılır. Teorem 3.7 Eğer S v1 , v 2 , , v n bir vektör uzayı için baz oluşturan vektör kümesi ise vektör uzayındaki her vektör S kümesindeki vektörlerin bir ve yalnız bir doğrusal kombinasyonu ile yazılabilir. İspat: vektör uzayı S kümesi tarafından türetildiğinden vektör uzayındaki her hangi bir u vektörü u c1 v1 c2 v 2 cn v n ile ifade edilebilir. u vektörünün bir diğer doğrusal kombinasyonunun u b1 v1 b2 v 2 bn v n olduğu varsayılsın. İkinci ifade ilk kombinasyondan çıkarılarak, u u c1 b1 v1 c2 b2 v 2 cn bn v n 0 bulunur. S kümesindeki vektörler doğrusal bağımsız olduklarından bu denklem için elde edilebilecek tek çözüm, c1 b1 0, , cn bn 0 sıfır çözümüdür. Diğer bir deyişle tüm i=1,…,n için bi=ci olup u vektörü verilen S baz kümesi için tek bir şekilde temsil edilebilir. Teorem 3.8 Eğer S v1 , v 2 , , v n bir vektör uzayı için baz oluşturan vektör kümesi ise vektör uzayındaki n adet vektörden daha fazlasını içeren her küme doğrusal bağımlıdır. Tanım 3.8 Eğer bir vektör uzayı n adet vektörden oluşan baza sahip ise n sayısı vektör uzayının boyutu olarak adlandırılır. Bir vektör uzayı eğer n adet doğrusal bağımsız vektör içeriyor ise bu uzaydaki her hangi n+1 adet vektör doğrusal bağımlıdır. Bu durumda vektör uzayının boyutu n olarak belirlenir. Eğer bir vektör uzayı sonlu sayıda n adet x1, x2,…, xn doğrusal bağımsız vektör kümesi içeriyorsa ve her hangi n+1 adet vektörün tanımladığı küme doğrusal bağımlı ise örnek uzayının boyutu n olarak belirlenir. Bu vektör uzayı n adet vektörden daha azı ile türetilemez ve doğrusal bağımsız vektör sayısı n adetten daha fazla olamaz. 66 Şekil 3.5 2 uzayındaki sıfırdan farklı iki vektörü x1 ve x2 göstermektedir. Bu vektörler bir diğeri ile orantısal bir ilişkiye sahip olmadıkları için doğrusal bağımsızdırlar. Pozitif bölgedeki taralı alan, x1 ve x2 vektörleri tarafından türetilmiştir. Bu bölge, x1 ve x2 vektörleri sadece λ1 ve λ2 gibi pozitif skalerler ile çarpıldıktan sonra λ1x1+λ2x2 olarak elde edilebilirler. Vektörler negatif skalerler ile çarpıldığında negatif bölgedeki taralı alan ortaya çıkar. 2 uzayındaki bir diğer nokta olan x1-x2 vektörlerin doğrusal kombinasyonu ile bulunabilir. Doğrusal bağımsız her hangi x1 ve x2 gibi vektör çifti 2 uzayını türetir. Şekil 3.5 x ve y vektörleri ile türetilen 2 Daha genel olarak her hangi doğrusal bağımsız vektör kümesi x1, x2,…, xn n uzayını türetir. Örneğin Şekil 3.5 de verilen x1 ve x2 vektörlerinin tanımladığı noktalar Şekil 3.6 da tekrar ele alınsın bu noktalar orijin ile ilişkili tüm düzlemi türetmekle birlikte 3 uzayının tümünü türetemezler. 67 Şekil 3.6 x ve y vektörleri ile türetilen düzlem Bazı önemli vektör uzayları aşağıda verilmiştir: ikilileri kümesi,…, n 3 uzayının bir alt uzayıdır. tüm gerçel sayılar kümesi, tüm n elemanlı gerçel sayılar kümesi, mn 2 tüm gerçel sayı tüm mn boyutlu matrisler kümesi. Bir boyutlu uzay ile belirtilsin. Sabit bir x1 vektörünün mümkün olabilecek tüm 1 skalerleriyle çarpılması sonucu orijinle x1 doğrultusunda bir düz doğru oluştuğu Şekil 3.7’den görülmektedir. Her bir 1x1 vektörü ok veya nokta ile ifade edilebilir. Yukarıdaki açıklama L: 1x1 1 (3.14) ifadesiyle özetlenebilir. Şekil 3.7 x1 vektörü ile oluşturulan L doğrusu 68 Şekil 3.8 da boyut sayısı bir arttırılmıştır ve iki farklı renkte ok başı kullanılmıştır. Düzlem içinde bulunan ok başları beyaz olup, düzlem dışındaki siyahtır. Üç boyutlu uzayda iki adet sabitlenmiş vektörün oluşturduğu noktalar seti Şekil 3.8 da gösterilmektedir: 1 , 2 P: 1x1+2x2 (3.15a) P ifadesi x1 ve x2’nin tüm mümkün doğrusal kombinasyonlarının seti olarak adlandırılır ve x1, x2 vektörleri ile orijin arasında kalan düzlemi belirtir. Geometrik olarak, x1 ve x2’nin uygun doğrusal kombinasyonları dikkate alınarak P düzleminde herhangi bir nokta oluşturabileceği görülmektedir. Uygun doğrusal kombinasyon ile açıklanmak istenen 1 ve 2 ‘nin eşitlik (3.15a) ya uygun olarak seçilmiş olmasıdır. Bu koşula uyulması durumunda elde edilen nokta, P düzleminin altında ya da üstünde olmayacaktır. Aşağıda 1 ve 2 skalerlerinin nasıl belirlenebileceği açıklanmıştır. Şekil 3.8 x1 ve x2 vektörleri ile oluşturulabilen P düzlemi. P= 1x1+2x2 olup 1 ve 2 değerlerine bağlı olarak düzlem sınırsız bir şekilde genişletilir. İki boyutlu uzay 2 ile belirtilsin. Bu vektör uzayı tüm iki elemanlı gerçel vektörlerden oluşur. Bu uzaydaki herhangi bir vektörün x1 ve x2 vektörlerinin doğrusal kombinasyonu olarak ifade edilebileceği açıktır. Bununla birlikte x1 ve x2 vektörleri keyfi olarak seçilmişti. Bu nedenle aşağıdaki iki boyutlu birim vektör çifti ele alınsın, 1 e1 0 2 0 e2 1 deki herhangi bir c vektörü de bu vektörlerin doğrusal bir kombinasyonu olarak ifade edilebilir. Bu durum için λ değerlerinin belirlenmesi basittir. Daha önce verilen iki örnek için, 0 1 4 0 40 01 , 1 4 ve 2 0 1 0 6 3 60 31 , 1 6 ve 2 3 şeklinde λ1 ve λ2 değerleri bulunabilir. Görüldüğü gibi elde edilen bu değerler x vektörlerinin elemanlarıdır. 69 Bu örneklerdeki vektör çiftlerinin herbiri (x1,x2 ve e1, e2) iki boyutlu uzay 2 için uygun bir baz teşkil edebilir. Bu sonuca göre bir bazın benzersiz (eşsiz) olmadığı söylenebilir. Herhangi iki vektörün 2 ’de uygun bir baz olabilmesi için onların farklı yönlerde olması gereklidir. Eğer x1 ve x2 aynı yönde ise Şekil 3.4’de gösterildiği gibi bir vektör bir skalerle çarpılarak diğer vektöre dönüştürülebilir ve daha sonra bu vektörün çarpımları x1 ve x2 vektörlerinin doğrusal bir kombinasyonu olarak ifade edilebilir. Farklı yönlerdeki bu baz vektörler, doğrusal bağımsız vektörler olarak ifade edilebilecektir. x1 ve x2 vektörleri eğer sadece, 1x1+2x2=0 (3.15b) eşitliğini λ1=λ2=0 için sağlıyorsa doğrusal bağımsızdırlar. Eğer λi için sıfırdan farklı bir tek değer bile bulunabiliyorsa bu vektörler doğrusal bağımlıdır. x1 ve x2 vektörleri, 2 x1 1 6 x2 3 şeklinde tanımlanırsa, bu iki vektörün aynı yönde farklı uzunlukta olduğu görülebilir. Bu durumda 3x1-x2 doğrusal kombinasyonu sıfır değerini verecektir. Bununla birlikte aşağıda verilen x1 ve x2 vektörleri, 2 x1 1 1 x2 3 için λ1x1+λ2x2=0 eşitliğini sağlayan sıfırdan farklı λ1 ve λ2 değerleri bulmak imkansızdır. Bu vektörler için birinci elemanı sıfıra indirgeyecek λ1 ve λ2 çifti bulunabilir, örneğin, λ1=1 ve λ2=-2 gibi. Fakat bu λ çifti ikinci elemanları asla sıfıra indirgeyemeyecektir. Bu tanıma göre 2 için bir baz vektör çifti, birbirinden bağımsız herhangi iki elemanlı vektör olarak tanımlanabilir. İki boyutlu vektör geometrisinden görüleceği üzere, verilen bir baza göre belirtilen bir vektörün eşsiz olarak temsil edilebilmesi için y 1x1 2 x2 eşitliğini bir ve yalnız bir adet λ1, λ2 çiftinin sağlaması gerekmektedir. 2 de x1 ve x2’nin baz vektörler olarak verilmesi durumunda bu uzaydaki herhangi bir y vektörünün bu baz vektörlerin eşsiz bir doğrusal kombinasyonu olarak ifade edilebileceği belirtilmişti. Buna göre x1, x2ve y vektörleri doğrusal bağımlıdır. Çünkü, 1x1 2 x2 y 0 denkleminde sıfırdan farklı bir λ (y’nin katsayısı –1 olduğu için) değeri mevcuttur. Bu durumda 2 de genişletilmiş x1, x2 ve y vektör setine göre ifade edilebilecek herhangi bir v vektörünün mevcut olup olmadığı sorulabilir. Bu soruya verilecek yanıt şüphesiz evettir, fakat katsayılar eşsiz olmayacaktır. Örneğin; x1, x2 ve y vektörleri, 70 2 x1 1 1 x2 3 1 y 1 şeklinde verilmiş ise x1, x2ve y’nin doğrusal bir kombinasyonu olarak, 6 v 8 vektörü elde edilebilir. Bu kombinasyon, v 2x1 2x2 0y şeklindedir. Fakat v için (6,8) değerini verebilecek pek çok λ değerleri mevcuttur. Genel doğrusal kombinasyon, v 1x1 2 x2 3y yeniden düzenlenerek, v 3y 1x1 2 x2 şeklinde de yazılabilir. Daha sonra da λ3 için herhangi bir keyfi değer atanarak sol taraf belirli iki elemanlı bir vektör haline getirilir ve bu vektör x1 ve x2’nin doğrusal bir kombinasyonu şeklinde ifade edilebilir. x1, x2ve y’nin oluşturduğu bu tür vektör setleri, daha önce belirtildiği gibi zincir (span) ya da türeten seti olarak adlandırılır. Tam bir üç boyutlu uzay oluşturmak için diğerlerinden bağımsız olarak belirtilebilecek üçüncü bir vektöre ihtiyaç vardır. Bu nedenle P düzleminin dışına çıkılır. Bunun sonucu olarak bu üç boyutlu uzaydaki noktalar setinin bütünü T: 1x1+2x2+3x3 1 , 2 , 3 (3.16) ifadesiyle oluşturulabilir. Bu ifade üç boyutlu uzayda x1, x2 ve x3 oluşumu (veya zinciri) olarak belirtilir. Başka bir deyişle x1, x2 ve x3 bu üç boyutlu uzayın temelini oluşturmaktadır. Elemanları gerçel sayı olan üç elemanlı bir vektör üç boyutlu uzayda bir nokta tanımlar. Üç boyutlu uzay 3 ile tanımlanır ve bu uzaydaki herhangi bir v vektörü üç doğrusal bağımsız vektörün uygun bir setinin eşsiz doğrusal kombinasyonu olarak ifade edilebilir. Bu üç vektör 3 için bir baz oluşturur. Bu bazı oluşturan vektörler, 1 e1 0 0 0 e2 1 0 0 e3 0 1 şeklinde seçildiklerinde bir vT 3 2 5 vektörü, v 3e1 2e2 5e3 eşitliği ile verilebilir. Bu vektörlerden herhangi iki tanesi (örneğin e1, e2) ele alındığında bunların tüm doğrusal kombinasyonları 3 uzayında bir alt vektör uzayı oluşturur. Bunun nedeni herbir zincir vektöründe üçüncü bileşenin sıfır olmasıdır. Örneğin; 71 1 x1 2 3 5 x 2 1 1 şeklinde üç elemanlı iki vektör ele alındığında bu vektörler Şekil 3.9’da görüldüğü gibi bir düzlem yüzeyi oluştururlar. Şekilde bu düzlem x1Ox2 ile belirtilmiştir. Şekil 3.9 Eşitlik (3.16), n boyutlu uzay için genelleştirilebilir. M: 1x1+2x2+…+mxm i (3.18a) Eşitlik (3.18a), m adet sabit vektörün tüm mümkün doğrusal kombinasyonlarının setidir ve m boyutlu bir alt uzay olarak adlandırılır. Eğer m=1 ise alt uzay düz bir doğru m=2 ise alt uzay bir düzlemdir. m>2 olması durumunda ise alt uzay bir hiper düzlem olarak adlandırılır. Sadece m=n olması durumunda n adet birbirinden bağımsız vektör mevcuttur (x1, x2,…, xn) ve bu vektörlerin tümü n boyutlu uzayı oluşturur. Bu n boyutlu uzaydaki herhangi bir vektör veya bir y noktası için 1, 2,…, m katsayılarının sadece ve sadece bir tek seti mevcuttur ve bu set, y=1x1+2x2+…+nxn (3.18b) eşitliği ile bulunabilir. Bu katsayılar, (x1, x2,…, xn) vektörlerine göre y’nin koordinatları olarak adlandırılırlar. Konu daha da genelleştirilirse, tüm n adet gerçel eleman içeren vektörler uzayını oluştururlar. n n ’deki her bir vektör, n doğrusal bağımsız vektörün bazı uygun setlerinin bir eşsiz doğrusal kombinasyonu olarak ifade edilebilir. Teorem 3.7 ile bu doğrusal kombinasyon eşsiz olmak zorundadır. Eğer k adet n elemanlı doğrusal bağımsız vektörün bir seti alınmış ise bu set n ’in bir alt uzayını oluşturur. Bu alt uzayın boyutu bu alt uzaydaki doğrusal bağımsız vektör sayısına eşittir. n elemanlı vektörler için v1, v2, … ,vk eğer, vi v j 0 tüm i j için sonucu sağlanıyorsa bu vektör seti ayrık ortogonal settir. 3.1.3 İç Çarpım Uzayı 72 Buraya kadar bir vektörün yönlü bir doğru parçası olduğu vurgulandı bununla birlikte bir vektörün uzunluk, açı, uzaklık gibi farklı geometrik özellikleri de mevcuttur. Bu kısımdan itibaren tanımlanan özellikler açıklanmaya çalışılmıştır. m adet sıradan oluşan vektör sütun vektörüdür. Örneğin, x41 vektörü bir sütun vektörüdür. 3 4 x 4 x1 7 6 n adet sütundan oluşan vektör ise sıra vektörüdür. x13 vektörü örnek olarak verilebilir. x1x3 2 2 5 Bir sütun vektörünün sıra vektörü olarak ifadesi o vektörün transpozu (evriği) olarak adlandırılır ve xT ile gösterilir. Yukarıdaki tanımdan anlaşılacağı gibi bir sütun vektörünün transpozu, 3 4 x 4 x1 7 6 x1T4 3 4 7 6 şeklinde bir sıra vektörü, bir sıra vektörünün transpozu da, y1x3 2 2 5 y T 31 2 2 5 şeklinde bir sütun vektörü oluşturur. Aynı boyutlu m1 iki gerçel vektör x ve y nin önemli bir skaler fonksiyonu nokta (dot) çarpımdır, x1Tm y m1 x11 x12 y11 m y 21 x11 y11 x12 y 21 x1m y m1 x1i y i1 c x1m i 1 y m1 x1Tm y m1 y1Tm xm1 x, y i 1 xi yi . m (3.4) Bu çarpım iç (inner) çarpım olarak da adlandırılır. Elde edilen sonuç değeri c bir skalerdir. Teorem 3.9 u, v ve w n uzayındaki vektörler skaler olmak üzere iç çarpım aşağıdaki özelliklere sahiptir: 1. uTv=vTu 2. uT(v+w)= uTv+uTw 3. (uTv)=(uT)v=uT(v) 4. vT v v 2 73 5. vTv0, ve vTv=0 ancak ve ancak v=0. Pisagor teoremi ile bir vektörün uzunluğu veya normu, bir vektörün kendisiyle nokta çarpımının x 2 2 xxT x11 xn21 (3.5) kare kökü olup vektörün uzunluğu x sembolü ile gösterilir. Tanım 3.9 İç çarpım işlemi kullanılarak n uzayındaki bir v v1 , v2 , , vn vektörünün uzunluğu (normu), x x, x1 2 xT x v12 v22 vn2 (3.6) olarak elde edilir. Vektörün normu geometrik bir özelliğini temsil eder. Vektörlerin nokta çarpımı iki boyutlu uzayda vektörün karesel uzunluğu olarak düşünülebilir, Şekil 3.10 de bu durum Pisagor teoremiyle açıklanmıştır. Örnek 3.2 x =(3,1) vektörünün karesel uzunluğunu bulunuz. 2 2 Çözüm: xxT x11 x21 32 12 10 şeklinde olup uzunluğu 10 dur. Şekil 3.10 Vektörlerin karesel uzunlukları ve Pisagor teoremiyle ilişkisi a)İki boyutlu, b)Üç boyutlu Teorem 3.10 n uzayındaki bir vektör v ve bir skaler olsun. Skalerin mutlak değeri olmak üzere skaler ile vektörün çarpımının uzunluğu: v v . Her hangi bir v vektörü v 1 ise birim uzunlukta (normalize) vektör olarak adlandırılır. Teorem 3.11 n uzayındaki sıfırdan farklı her hangi bir v* vektörü, 74 v 1 * v v* uygulanarak normalize edilir. Örnek 3.3 v=(3,-1,2) vektörünün birim vektörünü bulunuz ve uzunluğunun 1 olduğunu doğrulayınız. Çözüm: Birim vektör, v 1 1 2 3 3, 1, 2 , , 2 2 2 v 14 14 14 3 1 2 olup, 2 2 2 14 3 1 2 14 1 14 14 14 koşulu sağlandığı için birim vektördür. n uzayındaki iki vektör arasındaki uzaklığı (distance) tanımlamak için ilk olarak 2 uzayında tanımlanan iki nokta u=(u1,u2) ve v=(v1,v2) ele alınacaktır. Düzlemdeki iki nokta arasındaki d uzaklığı, analitik geometri ile, d u1 v1 u2 v2 2 2 eşitliği ile tanımlanır. Vektör cebrinde bu uzaklık Şekil 3.11 de gösterildiği gibi, u-v vektörünün uzunluğu olarak düşünülebilir: uv u1 v1 u2 v2 2 2 . Şekil 3.11 İki boyutlu uzayda iki vektör arasındaki uzaklık Tanım 3.10 n uzayındaki iki vektör, u ve v, arasındaki uzaklık, 75 d u, v u v ile belirlenir. Uzaklık ile ilgili önemli özellikler aşağıda verilmiştir: 1. d(u,v)0 2. d(u,v)=0, ancak ve ancak u=v ise. 3. d(u,v)= d(v,u). Doğrusal bağımsız vektörler farklı yönlerde oldukları için bu vektörler arasındaki açıda sıfırdan farklıdır. Bu açı vektör elemanlarına göre ifade edilebilir. Sıfırdan farklı iki vektör x ve y arasındaki açıyı belirlemek için Şekil 3.12 deki OAB üçgeni dikkate alınsın. Şekilden görüldüğü gibi –y ve x-y vektörleri bulunabilir. x-y vektörünün uzunluğu AB arasındaki uzaklığa eşittir. Kosinüs kuralı, c2 a2 b2 2ab cos kullanılarak, 2 2 2 x y x y 2 x y cos (3.7a) ve bu ifade basitleştirilerek, xT y x y cos x ve y vektörleri arasındaki açı, xT y x, y cos x y x y (3.7b) formülü ile hesaplanır. Eşitlik (3.7b) nin iki özel durumu mevcuttur. Bunlardan birincisi x ve y vektörlerinin doğrusal bağımlı olmasıdır. Bu durumda, x= λy yazılabilir. Vektörlerin doğrusal bağımlı olması durumunda (3.7b) eşitliğinin sağ tarafı için bir, bunun sonucunda θ=00 olarak bulunur. İkinci bir durumda x ve y vektörlerinin birbirine dik olmasıdır. Bu durumda θ=900 olup Cos θ=0 olarak elde edilir. Cos θ=0 olması için xTy=0 olması gerekir. Bu durum gerçekleştiğinde, diğer bir deyişle iki vektör arasındaki açı 900 olduğunda bu iki vektörün ortogonal olduğu söylenebilir. Bazı özel durumlar için eşitlik (3.7b) nin değerleri aşağıda verilmiştir: xT y x, y cos 1 0 x y x y cos xT y x, y 1 x y x y cos xT y x, y 0 2 x y x y 76 Şekil 3.12 x ve y vektörleri arasındaki açı Eşitlik (3.7b) nin sağ tarafı mutlak değerce 1 değerini aşamaz. Bu sonuç vektör normu ile ilgili önemli bir eşitsizliği tanımlayan, aşağıdaki teoremin ispatı ile elde edilebilir. Teorem 3.12 Eğer u ve v, n uzayındaki iki vektör ise, uT v u v eşitsizliği sağlanır, burada uT v , uTv iç çarpımının mutlak değeridir. İspat: Eğer u=0 ise uT v 0T v 0 ve u v 0 v 0 olduğundan eğer u=0 ise teorem sağlanır. Eğer u0 ise, t her hangi bir gerçel sayı olmak üzere, tu+v vektörü dikkate alınsın. (tu+v)T(tu+v)0 oldundan, tu v tu v t 2 uT u 2t uT v vT v 0 T ve a=uTu, b=2(uTv) ve c=vTv yazılarak at2+bt+c0 karesel eşitsizliği elde edilir. Karesel ifade asla negatif olamayacağı için ya karmaşık köke sahiptir ya da tekrarlı bir gerçel köke sahiptir. Bununla birlikte karesel formül diskriminantın sıfırdan küçük ya da eşit olduğunu belitmektedir, sonuç olarak, b2-4ac0 b24ac 4(uTv)24(uTu)(vTv) (uTv)2(uTu)(vTv) ve her iki tarafın köre kökü alınarak, uT v uT u vT v u v ispat tamamlanır. Bu eşitsizlik Cauchy-Schwarz eşitsizliği olarak adlandırılır. Teorem 3.13 Eğer u ve v, n uzayındaki iki vektör ise, uv u v 77 İspat: İç çarpım özellikleri kullanılarak, u v u v u v 2 T u v uT u v vT u v 2 u v uT u 2 uT v vT v 2 2 2 u v u 2 uT v v 2 Cauchy-Schwarz eşitsizliği uT v u v ile, 2 2 uv u 2 u v v uv u v 2 2 2 (3.8) eşitsizliği her tarafı da büyük eşit sıfır olduğundan karekök alınarak, uv u v ispat tamamlanır. Bu eşitsizlik üçgen eşitsizliği olarak adlandırılır Eşitsizlik (3.8) Cauchy-Schwarz eşitsizliğinin iki vektörün toplamının karesel uzunluğu için de geçerli olduğunu belirtmektedir. Sıfırdan farklı iki vektör ancak ve ancak dik açı olşuşturuyor ise nokta çarpımları sıfırdır. Bu tipteki vektörler ortogonal vektör olarak adlandırılır. Tanım 3.11 n uzayındaki iki vektör u ve v olsun. Eğer, u, v uT v 0 (3.9) ise ortogonaldirler. Eşitlik (3.9) da iki vektörün nokta çarpımlarının sıfır olması durumunda bu iki vektörün birbirine ortogonal olduğu belirtilmişti. Ortogonallik vektör uzunlukları dikkate alınarak da ifade edilebilir. Şekil 3.13 den görüldüğü gibi, eğer (x+y) ‘nin uzunluğu (x-y) ‘nin uzunluğuna eşit ise x ile y vektörleri birbirine ortogonaldir: xy 2 xy 2 x y T x y x y T x y x T x 2x T y y T y x T x 2x T y y T y 4x T y 0 78 Sonuç olarak ortogonallik özelliğinin sağlanabilmesi için eşitlik (3.9) un sağlanması gerektiği görülmektedir. Şekil 3.13 Bu şekiller herhangi bir boyut için de geçerlidir. a) x1 ve x2 ortogonal b) x1 ve x2 ortogonal değil. Eğer u ve v vektörleri birbirine ortogonal ise eşitsizlik (3.8) eşitlik durumunu tanımlayarak Pisagor denklemini verir. Teorem 3.14 Eğer u ve v, 2 2 uv u v uzayındaki iki vektör ise, ancak ve ancak n 2 koşulu sağlanıyorsa ortogonaldirler. Üç boyutlu uzay için de x1 2 değerinin vektörün karesel uzunluğu olduğu doğrulanabilir. Örneğin Şekil 3.10b’de Pisagor teoremi ilk olarak ABC üçgenine uygulanarak AC’nin karesel uzaklığı 2 2 x11 x 21 elde edilir. Daha sonra teorem ACD üçgenine uygulanarak, AD vektörünün karesel uzunluğu 2 2 2 ( x11 x21 ) x31 x1 2 (3.17) olarak elde edilir ve teorem üç boyutlu uzay için de doğrulanmış olur. x1=(2 4 3) şeklinde verilmiş vektörün karesel uzunluğu için, x1 2 x1x1T 2 2 4 2 32 29 ve uzunluğu için ise x1 29 sonucu elde edilir. Tanım 3.12 Bir iç çarpım uzayındaki S v1 , v 2 , , v n vektörler kümesi eğer S kümesindeki her vektör çifti ortogonal ise ortogonal vektörler kümesi olarak adlandırılır. Ortogonallik özelliğine ek olarak S kümesindeki her bir vektör birim vektör ise S kümesi ortanormal olarak adlandırılır. Eğer S kümesi bir bazı tanımlıyor ve Tanım 3.12 deki özelliklere sahip ise ortogonal baz ya da ortanormal baz olarak adlandırılır. n uzayının bazını oluşturan birim vektörler, 79 0 0 0 1 … em e2 1 0 1 0 e1 0 ile tanımlanıp ortanormaldirler ve standart bazı tanımlarlar. Bununla birlikte özelliğine sahip tek baz birim vektörlerin tanımladığı baz değildir. n n için ortanormallik için standart olmayan ortanormal bazlar da vardır. Örnek 3.4 Aşağıdaki S kümesinin 3 uzayı için bir ortanormal baz olduğunu gösteriniz. 1 1 2 2 2 2 2 2 1 S , , 0 , , , , , , 3 3 3 3 2 2 6 6 Çözüm: İlk olarak üç vektörün ortogonal olduğu gösterilir: 1 1 v1v 2 0 0 6 6 v1v3 2 3 2 v 2 v3 2 3 2 0 0 2 2 2 2 0 9 9 9 İkinci aşamada üç vektörün her birinin uzunluğunun 1 birim olduğu gösterilir. v1 v1T v1 1 1 0 1 2 2 v 2 vT2 v 2 2 2 8 1 36 36 9 v3 vT3 v3 4 4 1 1. 9 9 9 Teorem 3.15 Eğer S v1 , v 2 , , v n bir iç çarpım uzayı deki sıfırdan farklı vektörlerin ortogonal kümesi ise S kümesi doğrusal bağımsızdır. 3.1.3 Vektör Geometrisinde Ortogonal İzdüşüm İki boyutlu uzayda x1=(1 -1) ve x2=(2 1) vektörleri dikkate alınsın. Bu vektörler bütün uzayı tanımlayacaklardır. y = (4 1) şeklinde verilen bir vektörün x1 ve x2’ye göre koordinatlarını bulabilmek için eşitlik (3.15a) kullanılarak, 1x1T 2 xT2 y 1 2 4 1 2 1 1 1 80 1 22 4 1 2 1 yazılabilir ve bu denklem sisteminin çözümüyle λ1=2, λ2=1 elde edilir. y vektörünün x1 ve x2’nin doğrusal bir kombinasyonu olarak ifade edileceği görülmektedir. Bu durum Şekil 3.14’de geometrik olarak görülmektedir. L1 doğrusunun (alt uzayının) x1 tarafından L2 alt uzayının ise x2 tarafından oluşturulduğu görülmektedir. Daha sonra λ1=2 ve λ2=1 alınarak bir paralel kenar ile şekil tamamlanmıştır. Şekil 3.14 İzdüşüm ile y’nin koordinatlarının x1 ve x2’ye göre geometrik olarak ifade edilmesi. Başka bir deyişle, y’nin koordinatlarını bulmak için ilk olarak L2’ye paralel olacak şekilde L1 üzerine y’nin izdüşümü alınarak λ1 elde edilir. Daha sonra benzer bir işlem λ2 için yapılır, L1’e paralel olacak şekilde L2 üzerine y‘nin izdüşümü alınır. En basit izdüşüm yapısı ortogonal izdüşümdür. Bu durum x1 ile x2’nin birbirine ortogonal olmaları durumunda ortaya çıkar, (bkz Şekil 3.15). Şekil 3.15 x1 üzerine y’nin ortogonal izdüşüm Şekil 3.16 İki boyutlu ortogonal izdüşüm 81 Eşitlik (3.9) ile tanımlanan vektörler için ortogonallik şartı oldukça basit olduğu için ortogonal izdüşümü hesaplamak da oldukça basittir. x1 vektörünün tanımladığı L1 doğrusu üzerine y’nin ortogonal izdüşümü y1 ile belirtilmiş ve Şekil 3.16’de gösterilmiştir. y1 izdüşüm vektörü L1 üzerinde bulunacağı için eşitlik (3.2) de verilen bir vektörün x1 bir skalerle λ çarpımı şeklinde y1=λx1 (3.19) ifade edilebilir. Burada sorun λ katsayısının belirlenebilmesidir. Şekil 3.16’dan görülebileceği gibi y1 ile y birleştirilerek y-y1 vektörü tanımlanabilir. Bu işlemde elde edilen vektör ile x1 arasındaki ortogonal yapı korunmalıdır. (y-y1) ve x1 ortogonal olduğundan eşitlikler (3.9) ve (3.19) kullanılarak, (y-λx1)T x1=0 yT x1 x1T x1 0 y T x1 x1T x1 (3.20) elde edilir. Eşitlik (3.20), eşitlik (3.19)’da yerine konarak T yT x (3.21) y1 T 1 x1 x1 x1 sonucu bulunabilir. Eşitlik (3.21) in sağındaki ilk bileşenin payı ve paydası bir skaleri tanımladığı için transpozları kendilerine eşittir. Bu eşitlikteki y1 ifadesi x1 üzerine y nin ortogonal izdüşümünü belirtmektedir. Bazı çzlışmalarda y1 izdüşüm vektörü projx1 y ile gösterilir. Tanım 3.13 Bir iç çarpım uzayındaki vektörler u ve v olsun v0 olmak üzere v vektörü üzerine u vektörünün ortogonal izdüşümü, uT v projv u T v v v ile tanımlanır. Örnek 3.5 2 uzayındaki uT=(4,2) vektörünün vT=(3,4) vektörü üzerine ortogonal izdüşümünü bulunuz. Çözüm: projv u 4, 2 3, 4 3, 4 20 3, 4 uT v v T v v 25 3, 4 3, 4 12 16 , . 5 5 Geometrik yapı Şekil 3.17 de gösterilmiştir. 82 Şekil 3.17 Örnek 3.5 için ortoganal izdüşüm Bu izdüşüm vektörünün karesel uzunluğu, y1 2 y 1T y 1 2 x1T x1 2 yT x T 1 x1T x1 x1 x1 y1 2 y x 2 T 1 (3.22) x1T x1 olup, normu veya uzunluğu ise y T x1 (3.23) y1 x1 şeklindedir. Şekil 3.16 incelendiğinde, ortogonal izdüşüm y1 in L1 üzerindeki y ye en yakın alt nokta olduğu görülebilir. Ortogonal olmayan ve y 1* ile gösterilebilecek diğer herhangi bir izdüşümün y noktasına olan uzaklığı daha fazla olacaktır. y y 1* uzaklığı y y 1 uzaklığından daha büyüktür. Çünkü y y 1* dik üçgenin üçgeninin hipotenüsüdür. Üç boyutlu durum Şekil 3.18’de gösterilmiştir. Şekil 3.18 Üç boyutlu uzayda ortogonal izdüşüm 83 Teorem 3.16 1x1+2x2+…+mxm alt uzayı üzerine y vektörünün ortogonal izdüşümü bu alt uzaydaki y vektörüne en yakın noktayı belirtir. Diğer bir ifade ile iç çarpım uzayındaki vektörler u ve v için v0 olmak üzere, d u, projvu d u, v eşitsizliği geçerlidir. Burada uT v . vT v Doğrusal cebirde bir ortanormal bazı kullanarak işlem yapmanın bir çok avantajı vardır. Aşağıda böyle bir bazın nasıl elde edilebileceği açıklanmıştır. Süreç üç adımdan oluşmakta ve Gram-Schmidt ortanormalizasyon süreci olarak adlandırılmaktadır: 1. İç çarpım uzayı için bir baz ile başla. Bazın birim vektörlerden oluşması ya da ortogonal olması gerekli değildir. 2. Verilen bazı ortogonal baza dönüştür. 3. Ortogonal bazdaki her bir vektörü ortanormal baza dönüştümek için normalize et. Bu süreç aşağıdaki teorem kullanılarak uygulanabilir. Teorem 3.17 Gram-Schmidt ortanormalizasyon süreci için, , v n bir iç çarpım uzayındaki baz olsun. 1. B v1 , 2. için ortogonal bir bazı tanımlayan B w1 , , w n kümesi, w1 v1 vT2 w1 w 2 v 2 T w1 w1 w1 w3 v3 vT3 w1 vT3 w 2 w w2 1 w1T w1 wT2 w 2 … wn vn vTn w1 vTn w 2 w w2 1 w1T w1 wT2 w 2 vTn w n 1 w n1 wTn1w n1 ile hesaplanır. wi olmak üzere B u1 , wi 3. ui Örneğin 2 , un kümesi için bir ortanormal bazı tanımlar. uzayı için baz vektör kümesi Şekil 3.19 da gösterildiği gibi {v1,v2} olsun. W ile tanımlanan ortogonal baz kümesini tanımlamak için ilk olarak orijinal vektörlerden her hangi biri keyfi olarak seçilir. Seçilen vektör v1 olsun. İkinci aşamada v2 vektörüne ortogonal ikiknci bir vektör bulunur. Şekil 3.19 den görüldüğü gibi v 2 projv1 v 2 vektörü bu özelliğe sahiptir. Sonuç olarak, w1 v1 84 w 2 v 2 projv1 v 2 v 2 vT2 w1 w1 w1T w1 ortogonal {w1,w2} kümesi elde edilir. W kümesindeki vektörler normalize edilerek, w1 w 2 , w1 w 2 u1 , u2 2 için ortanormal baz bulunur. Şekil 3.19 2 düzleminde Gram-Schmidt ortanormalizasyon süreci Örnek 3.6 2 için aşağıda verilen baz vektör kümesine Gram-Schmidt ortanormalizasyon sürecini uygulayın. B 1,1 , 0,1 Çözüm: w1 v1 1,1 w2 v2 0,1 vT2 w1 w1 w1T w1 1 1 1 1,1 , 2 2 2 Bulunan B w1 , w 2 kümesi 2 için ortogonal bir bazdır. Bu kümedeki her bir vektör normalize edilerek, u1 2 2 w1 1 2 1,1 1,1 , w1 2 2 2 2 u2 w2 1 1 1 2 2 2 1,1 , , w2 1 2 2 2 2 2 2 Bulunan B u1 , u2 kümesi 2 için ortanormal bir bazdır ve Şekil 3.20 de gösterilmiştir. 85 Şekil 3.20 Örnek 3.6 için baz ve ortanormal baz. Gram-Schmidt ortanormalizasyon sürecinden elde edilen ortanormal küme bazdaki vektörlerin sıralamasına bağımlıdır. Örnek 3.6 da keyfi olarak seçilen vektör v1 yerine v2 alınsaydı bulunan ortanormal baz değişecekti. 3.2 MATRİSLER Matris sayı veya elemanların sıralar ve sütunlar şeklinde düzenlendiği dikdörtgen bir dizindir. Matrisi oluşturan bu sıra ve sütunların sayısı matrisin boyutunu belirler. Örneğin, m adet sıra ve n adet sütundan oluşan bir A matrisi aşağıda gösterilmiştir. A mxn a 11 a 21 a m1 a12 a 22 am2 a1n a 2 n a mn Matrisin içindeki aij değerleri matrisin elemanlarıdır. Bu kitapta Amxn ifadesi, m sıra ve n sütundan oluşan bir matrisi ifade edecektir ve sıra sayısı ilk sütun sayısı ise ikinci indisle tanımlanacaktır. Örneğin aij, i-nci sıra j-inci sütundaki elemandır. Tüm elemanları gerçel sayılardan oluşan matrisler gerçel matrislerdir ve A mn ile tanımlanır. Matrisler üzerine açıklanacak ilk konu matris işlemleridir. Temel matris işlemleri ise toplama ve çarpma işlemleridir. 3.2.1 Matris İşlemleri İki matrisin toplanabilmesi için boyutlarının eşit olması gereklidir. Boyutları eşit olan iki matrisin, Amn, Bmn toplamı karşılıklı elemanlarının toplamına, A B aij bij cij C (3.24) eşittir. Örnek 3.6 Aşağıdaki A ve B matrislerinin toplamını elde ediniz. 86 1 3 A 2x 2 4 2 6 4 B 2x 2 7 5 1 6 7 Çözüm: A 2 x 2 B 2 x 2 4 7 11 3 4 7 C . 2 5 7 2 x 2 Bir matrisin skaleri ile çarpımı, a 11 a A A 21 a m1 a12 a1n a 22 a 2 n a m 2 a mn (3.25) olarak tanımlanır. Eğer A boyutu mn ve B boyutu np olan matrisler ise bu matrislerin çarpımı, n AB aij b jk ai1b1k ai 2 b2 k ain bnk cik C j 1 (3.26a) eşitliği ile tanımlanır. Her bir cik elemanı için bu çarpım işlemi eşitlik (3.4) ile tanımlanan vektörlerin nokta çarpımına denktir. A matrisinin i-inci satır elemanı B matrisinin karşılık gelen kıncı sütun elemanı ile çarpılır ve elde edilen değerler toplanarak C matrisinin cik elemanı elde edilir. Çarpım işlemlerinin ön koşulu soldaki matrisin sütun sayısının sağdaki matrisin satır sayısına eşit olmasıdır. Çarpım sonucunda elde edilen C matrisinin boyutu mp olur. Eşitlik (3.26a) dan bu matrisin ik-ıncı elemanının, n cik aij b jk (3.26b) j 1 eşitliği ile elde edilebileceği görülebilir. Matris çarpımlarında matrislerin konumu (sıralaması) önemlidir. Boyutları dikkate alındığında AB çarpımı geçerli olup BA çarpımı geçerli değildir. B matrisi için p=m alınarak, n BA bri aij c rj C i 1 çarpımı elde edilebilir. Örnek 3.7 Aşağıdaki A ve B matrislerinin çarpımını elde ediniz. A 3x 2 1 3 4 2 5 0 3 2 B 2x 2 4 1 Çözüm: A 3 x 2 B 2 x 2 C3 x 2 1 3 (1)(3) (3)(4) (1)(2) (3)(1) 9 1 3 2 4 2 4 1 = (4)(3) (2)(4) (4)(2) (2)(1) 4 6 . (5)(3) (0)(4) 5 (5)(2) (0)(1) 15 10 0 87 Yukarıda belirtildiği gibi matrislerin çarpımı matrisleri oluşturan vektörlerin çarpımları ile elde edilir. Vektörel çarpımlar istatistikte olukça önemlidir. Örneğin verilen an1 ve bn1 boyutlu a nx1 a1 a 2 a n b nx1 b1 b 2 bn vektörler iki şekilde çarpılabilir: Birincisi eşitlik (3.4) ile tanımlanan nokta çarpımdır ve sonucunda bir skaler elde edilir. İkincisi ise aşağıda tanımlanan ve dış çarpım olarak adlandırılan çarpım, a n1b1Tn a1 a 2 b1 a n b2 a1b1 a b bn 2 1 a n b1 a1b2 a 2 b2 a n b2 a1bn a 2 bn C nxn a n bn (3.27) olup işlem sonucunda bir matris elde edilir. Teorem 3.2 Çarpmanın toplama üzerine dağılma özelliği, matrislerin boyutları çarpmaya uygun olmak üzere, A(B C) AB AC şeklinde matrisler için uygulanabilir. Bir Amn matrisinin transpozu (evriği) A Tnm şeklinde ifade edilir ve A matrisinin sıraları ile sütunları yer değiştirilerek elde edilir. Başka bir deyişle A matrisinin i-inci sırası AT matrisinin iinci sütununu oluşturur. A 3x 2 matrisinin kendisi ve transpozu aşağıda verilmiştir. A 3x 2 3 4 2 5 7 1 3 2 A T23 5 4 7 1 Teorem 3.3 AT matrisinin (vektörünün) transpozu A matrisine (vektörüne) eşittir. A T T A Teorem 3.4 Matris toplamlarının transpozu, (A B C)T AT BT CT şeklindedir. Teorem 3.5 Matris çarpımlarının transpozu, ABC T CT BT AT şeklindedir. 88 Teorem 3.6 A ve B matrisleri ancak ve ancak boyutları birbirine eşit ve karşılık gelen tüm elemanları birbirine eşit aij= bij i=1,…m j=1,…n ise eşit A=B matrislerdir. Sıra ve sütun sayıları eşit olan (m = n) matrisler kare matris olarak adlandırılır. 5 4 6 4 2 9 1 3 2 A 3x 3 Köşegen elemanları haricindeki elemanları sıfıra eşit olan kare matris, köşegen matris olarak bilinir. Bir matrisin köşegen matris olabilmesi için köşegen elemanlarından bir tanesinin sıfırdan farklı olması yeterlidir. Köşegen matrisler genellikle D harfi ile tanımlanırlar. 1 0 0 0 D 4x4 0 0 3 0 0 7 0 0 0 0 0 5 Teorem 3.7 Eğer D1 ve D2 köşegen matrisler ise bu matrislerin çarpımları da bir köşegen matristir. D1D2=D2D1=D D matrisinin i-inci elemanı, D1 ve D2’nin i-inci elemanlarının çarpımından elde edilir. Tüm elemanları bire (1) eşit olan köşegen matris birim matristir ve I harfi ile belirtilir. I 3x 3 1 0 0 0 1 0 0 0 1 (3.28) Teorem 3.8 Herhangi bir A matrisinin soldan ya da sağdan birim matris ile çarpılması A matrisini değiştirmez. IA AI A Bu özelliği birim matrisin matris işlemlerinde etkisiz eleman olarak kullanılmasını sağlar. Matrislerin sağdan ya da soldan çarpılmalarının önemini de dikkate alan, aşağıdaki işlem bu duruma bir örnek olarak verilebilir. A BA IA BA (I B)A Birim matris baz vektörler üzerine dış çarpın uygulanarak, n n I n e e Eii i 1 T i i i 1 elde edililebilir. Bir baz vektörün bir diğeri ile dış çarpımı Eij=eiej sonucunda elde edilen matrisin ij-inci elemanı 1 diğer elemanları sıfırdır. Örneğin, 89 1 0 e1 0 ve e 2 1 0 0 0 1 0 E12 e1eT2 0 0 0 . 0 0 0 Birim matrisin bir skaleri ile çarpımı sonucu elde edilen ve tüm köşegen elemenları eşit fakat birden (1) farklı köşegen matris ise skaler matristir. D 3 x 3 I 33 0 0 0 0 0 0 Tüm elemanları sıfır olan matris boş (null) ya da sıfır matrisi olarak adlandırılır ve 0 ile gösterilirler. Alt üçgen matris, a11 a A 21 an1 0 a22 an 2 0 0 ann ve üst üçgen matris, a11 0 A 0 a12 a22 0 a1n a2 n ann şeklinde tanımlanır. Köşegen elemanlarının üstündeki (üst üçgen) aij elemanları ile köşegen elemanlarının altındaki (alt üçgen) aji elemanlarının tümünün bire bir eşit olduğu matris simetrik matristir. Simetrik matrisin transpozuda kendisine eşittir, A=AT (3.29) Başka bir deyişle A matrisinin aij elemanı, AT matrisinin aji elemanına eşittir. Simetrik bir matris aşağıda gösterilmiştir. A 3x 3 4 2 3 2 1 2 3 2 6 Teorem 3.9 Her hangi bir gerçel kare matris A için, A matrisi simetrik olmasa da A+AT simetrik matristir. Teorem 3.10 Her hangi iki gerçel kare matris A ve B için, A ve B matrisleri simetrik olsa da AB matrisi simetrik olmayabilir. Teorem 3.11 Her hangi iki gerçel kare matris A ve B için, eğer B matrisi simetrik ise ATBA matrisi simetrik olup bu ifadenin tersi geçerli olmayabilir. 90 Eğer bir matrisin elemanları AT=-A özelliğini sağlıyor ve köşegen elemanları sıfır ise çarpık simetrik matris olarak adlandırılır. Diğer bir ifade ile aii=0 ve aij=-aji olmalıdır. 0 1 6 A 1 0 5 6 5 0 Matrisi çarpık simetrik bir matrisdir. Teorem 3.12 Her hangi bir gerçel kare matris A için A-AT matrisi çarpık simetrik matrisi tanımlar. Teorem 3.13 Her hangi bir gerçel kare matris A, simetrik ve çarpık simetrik bir matrisin toplamı A A AT A A T 2 2 olarak elde edilebilir. Bir kare matrisin köşegen elemanlarının toplamı matrisin izi (trace) olarak adlandırılır, tr(A) şeklinde gösterilir ve m tr A a11 a 22 a mm aii (3.30) i 1 eşitliğinden hesaplanır. Eşitlik (3.30) dan görülebileceği gibi matrisin izi bir skalerdir. Matris kare matris değilse izi tanımsızdır. Teorem 3.14 I matrisi nn boyutlu birim matris ise tr I n ’dir. Teorem 3.15 A matrisi kare matris ise transpozunun izi kendi izine eşittir. tr A T tr A . Teorem 3.16 Her hangi bir gerçel matris A için, tr A T A 0 olup, ancak ve ancak A=0 ise tr A T A 0 sağlanır. Teorem 3.17 Her hangi bir gerçel matris A için, tr A T A tr AA T aij2 . i j Teorem 3.18 A ve B aynı boyutlu kare matrisler ise toplamlarının izi, izlerinin toplamına eşittir. tr A B tr A tr B . Teorem 3.19 Eğer ABC, BCA, CAB matris çarpımları kare matrisleri tanımlıyor ise, tr ABC tr BCA tr CAB . İspat: Sadece A ve B matrisleri için tr(AB)=tr(BA) olduğu ispatlanacaktır. AB matrisinin boyutu mm’dir. Bu matrisin i-inci köşegen elemanı, 91 n cii aij b ji j 1 şeklinde olduğu için, m n tr ( AB) aij b ji i 1 j 1 eşitliği ile elde edilir. BA matrisi ise nn boyutludur. Bu matrisin j-inci köşegen elemanı, m d ii b ji aij i 1 şeklinde elde edildiği için, n m tr (BA) b ji aij tr ( AB) j 1 i 1 sonucu elde edilir. Bu sonuç, tr (ABC) tr (BCA) tr (CAB) şeklinde genişletilebilir. Sıraları ortanormal vektör setinden oluşan boyutu rc olan bir P matrisi için PPT=Ir eşitliği sağlanır. Bununla birlikte PTP çarpımı c boyutlu bir birim matrisi Ic vermesi şart değildir. Eğer P matrisinin sütunları ortanormal vektör setini tanımlıyor ise PTP=Ic sağlanır fakat PPT çarpımı birim matrise eşit olmayabilir. Ortanormal sıralara sahip kare matrisler doğrusal cebirde özel bir sınıfı tanımlar bu matrislerin aynı zamanda sütunları da ortanormaldir ve PT P PT P I (3.31) eşitliğini sağlarlar. Koşulu sağlayan P matrisi ortogonal matris olarak adlandırılır. Eğer i) P kare matris ii) PTP=I ve iii) PPT=I koşullarından her hangi ikisinin sağlanması üçüncün de sağlandığını ve P matrisinin bir ortogonal matris olduğunu belirtir. Ortogonal matrisler ile ilgili eşitlik (3.31) e denk bir diğer özdeşlik ters matrisler kısmında verilecektir. Teorem 3.20 Eğer P ortogonal bir matris ise tr(PTAP)=tr(A) dır. Bir matrisin kuvvetinin alınabilmesi için kare matris olması gereklidir. Boyutu mn olan bir A matrisi için AA çarpımı ancak ve ancak m=n durumu için geçerlidir. Diğer bir deyişle A2 matrisi sadece A kare matris ise mevcuttur. Bu durumda tüm pozitif k tam sayıları için Ak matrisi tanımlıdır. Skaler aritmetikte x0=1 olup matris cebrinde eğer A kare matris ise A0=I ile tanımlanmıştır. Gerçel sayılar cebrinde a2=-1 eşitliğini sağlayan bir gerçel skaler yoktur. Bununla birlikte, 0 1 A 1 0 gerçel matrisi A2=-I eşitliğini sağlar. Bu matris ortogonal bir matris olup soldan her hangi bir (x,y)T noktası ile çarpılması sonucunda, orijinde merkezlenmiş bir daire boyunca, bu noktayı 900 açı ile saat yönünde döndürerek (y,-x)T noktasını elde eder: 92 0 1 x y 1 0 y x Skaler cebrinden farklı olarak her hangi bir B0 matrisi için B2=0 sonucu sağlanabilir. Örneğin, 2 5 1 B 2 4 10 1 2 5 matrisi B2=0 eşitliğini sağlar. Bk-10 ve Bk=0 koşullarını sağlayan matrisler, k indeksli, nilpotent matrisler olarak adlandırılır. Yukarıda tanımlanan B matrisi indeksi 2 olana bir nilpotent matristir. Skaler cebrinden farklı olarak AB=0 eşitliğinin sağlanması için ne A matrisinin ne de B matrisinin sıfıra eşit boş matris olması gerekli değildir. Örneğin, 1 1 A 1 1 1 1 B 1 1 matrisleri için AB=0 eşitliği sağlanmaktadır. Teorem 3.21 A her hangi bir gerçel matris olmak üzere, ancak ve ancak A=0 ise ATA=0 eşitliği sağlanır. Teorem 3.22 A ve B her hangi iki gerçel matris olmak üzere, ancak ve ancak ATAB=0 ise AB=0 eşitliği sağlanır. Teorem 3.23 A, B ve C her hangi üç gerçel matris olmak üzere, ancak ve ancak ATAB= ATAC ise AB=AC eşitliği sağlanır. Kare matrislerin bir diğer önemli özel durumu ise idempotent matristir. A matrisi bir kare matris olsun. Eğer; A A2 (3.32) eşitliği sağlanıyorsa A matrisi idempotent matristir. Başka bir deyişle matrisin kendisi ile çarpımı orijinal matrisi veriyorsa bu matris idempotent matristir. Simetrik olsun olmasın herhangi bir kare matris (3.32) eşitliğini sağlıyorsa idempotent matristir. Fakat bu kitapta sadece simetrik idempotent matrislerle ilgilenilecektir. Bu matrisler istatistik teorisinde önemli bir yer tutmaktadır. Örneğin bir x değişkeni yi xi x dönüşüm ile ortalamadan sapmaları ifade eden bir değişkene döştürülebilir. Bu dönüşüm bir idempotent matris kullanılarak aşağıda açıklandığı şekilde gerçekleştirilebilir: Tüm elemanları bir değerinden oluşan n1 boyutlu, 1 1 1 (3.33) vektörü tanımlansın. Bu vektörün kendi ile iç çarpımı, 93 1T 1 1 1 1 n 1 (3.34) vektörün boyutunu tanımlayan bir skaleri verir. Vektörün dış çarpımı ise, 1 11 1 1 1 1 1 T 1 Jn 1 (3.35) tüm elemanları 1 değerinden oluşan ve Jn ile gösterilen nn boyutlu bir matrisdir. Eşitlik (3.33) de tanımlanan vektör kullanılarak elde edilen, 1 M I n 11T n (3.36) matrisi, 1 1 1 1 1 M 2 I n 11T I n 11T I n 11T 11T 2 11T 11T n n n n n 2 1 2 1 I n 11T 2 1 1T 1 1T I n 11T 2 11T M n n n n eşitliğinden görüldüğü gibi simetrik ve idempotent bir matristir. x değişkeninin ortalaması matris gösteriminde, 1 x 1T x n (3.37) eşitliği ile tanımlanır. Eşitlik (3.36) de verilen M matrisi kullanılarak, y=Mx vektör denklemi ile 1 1 y Mx I n 11T x x 1 1T x n n x x1 (3.38) ortalamadan sapmalara dönüştürülmüş değişken elde edilir. Görüldüğü gibi simetrik ve idempotent M matrisi her hangi bir değişken için ortalamadan sapmalara göre tanımlanan değişkeni elde eden bir dönüşümü vermektedir. Yukarıda elde edilen yeni değişken y için y 0 olacaktır. Yeni bir dönüşüm z=My ile tanımlansın. Eşitlik (3.38) den z y y1 y olduğu ya da z=My=M2x= Mx görülebilir. Diğer bir deyişle idempotent bir matris ile gerçekleştirilen bir operasyonun tekrarlanmasının her hangi bir etkisi yoktur. İstatistikteki kullanılan bir diğer önemli özellik olan ortalamadan sapmaların kareler toplamını ifade eden x x 2 değeri xTMx eşitliği ile elde edilebilir: 1 1 xT Mx xT I n 11T x xT x xT 1 1T x n n xT x xT 1x xT x nx 2 (3.39a) 94 Diğer bir deyişle aşağıdaki ifadeler birbirine denktir: x x x 2 2 i nx 2 xT x nx 2 xT Mx (3.39b) Eşitlik (3.39) ile verilen xTMx değeri Kısım 3.6 da açıklanacak olan bir karesel formu tanımlamaktadır. İdempotent matrislerle ilgili bazı önemli teoremler aşağıda verilmiştir. Teorem 3.24 Eğer A idempotent ve tekil olmayan bir matris ise A=I’dır. Teorem 3.25 Eğer A, elemanları aij ve i-inci köşegen elemanı sıfır olan bir idempotent matris ise A matrisinin i-inci sıra ve j-inci sütun elemanlarının hepsi sıfırdır. Teorem 3.26 Eğer A ve B her ikisi de idempotent olan matrisler ise, AB çarpımının da idempotent olması için AB=BA olması gereklidir. Teorem 3.27 Eğer A idempotent ve A+B=I ise B matrisi de idempotendir ve AB=BA=0’dır. Teorem 3.28 Eğer A idempotent P ortogonal matris ise PTAP matrisi idempotentdir. Teorem 3.29 Eğer A, rankı r olan idempotent bir matris ise PT AP Er olacak şekilde bir P ortogonal matrisi mevcuttur. Burada Er, r adet köşegen elemanı bir ve kalan elemanları sıfır olan bir köşegen matristir. Doğrusal cebirdeki bir diğer matris yapısı permütasyon matrisidir. Eğer bir A kare matrisinin her bir sırası ve her bir sütunu sadece bir tek 1 elemanını içeriyor ve geri kalan elemanları sıfır ise permütasyon matrisi olarak adlandırılır. Derecesi n olan kare matrisler için n! kadar permütasyon matrisi vardır. Örneğin n=3 ise altı adet permütasyon matrisi P, 1 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0 0 1 0 1 0 0 0 1 1 0 0 0 0 1 1 0 0 0 1 0 0 0 1 0 1 0 0 0 1 1 0 0 0 1 0 1 0 0 ile tanımlanmıştır. Permütasyon matrisinin her bir sırası p Ti bir adet 1 ve (n-1) adet sıfır değeri içerdiğinden p Ti p i 1 ve bir diğer sıra p Tj , 1 değerini farklı bir elemanında içerdiği için p Ti p j 0 olup bu sonuçlar P matrisinin ortogonal bir matris olduğunu gösterir. Eğer bir A kare matrisi ATA=AAT (3.40) özelliğine sahip ise normal matris olarak adlandırılır. Bir gerçel matrisin normu, A A, A 1 2 i j aij2 tr A T A (3.41) şeklinde hesaplanır. 3.2.2 Matrisin Bölümlenmesi Bazı durumlarda bir matrisin alt matrislere ayrılması faydalı olabilir. Bu işleme matrisin bölümlenmesi işlemi adı verilir. Bir matris çeşitli şekillerde bölümlenebilir. Örneğin, mn boyutlu bir A matrisi, 95 A A 11 A 21 A12 A 22 (3.42) şeklinde alt matrislere ayrılabilir. Burada A11 matrisi m1n1, A12 matrisi m1n2, A21 matrisi m2n1 ve A22 matrisi m2n2, boyutludur. Ayrıca m1+m2=m ve n1+n2=n olduğu görülebilir. Bölümlenmiş bir matrisin transpozu, A A 11 A 21 T T T A12 A11 T A 22 A12 AT21 AT22 (3.43) şeklindedir. Bölümlenmiş matrisler için toplama kuralı matrisler için tanınlanan genel kuralla aynıdır. Diğer bir deyişle karşılıklı bölümlerin boyutları aynı olmalıdır. Teorem 3.30 Eğer A11 ve A22 kare alt matrisler ise, matrislerin boyutları aynı olmak zoruda değil, A tr A tr 11 A 21 A12 tr A11 tr A 22 A 22 Teorem 3.31 Eğer A matrisi simetrik ise A11 ve A22 matrisleri de simetriktir. Teorem 3.32 Eğer A matrisi köşegen ise A11 ve A22 matrisleri de köşegendir. Teorem 3.33 Eğer A matrisi üst üçgen matris ise A11 ve A22 matrisleri de üst üçgendir. AB şeklinde iki matrisin çarpımı, bu matrisler alt matrislere ayrılmış olsalar bile sembolik olarak gösterilebilirler. Bunun için matrislerin boyutlarının çarpım için uygun olması yeterlidir. Eğer B matrisi np boyutlu ve, B12 B B 11 B 21 B 22 şeklinde parçalanmış ise Bjk alt matrisleri njpk boyutludur. Bu durumda AB çarpımı mevcuttur. Çünkü Aij’nin boyutları minj ve Bjk’nin ise njpk’dır ve alt matrislerin karşılıklı elemanları, A AB 11 A 21 A12 B11 B12 A11B11 A12B12 A 22 B 21 B 22 A 21B11 A 22B12 A11B12 A12B 22 A 21B12 A 22B 22 (3.44) şeklinde çarpılıp, toplanarak çarpım matrisi elde edilir. 3.2.3 Bir Matrisin Rankı ve Ters Matrisi Herhangi bir mn boyutlu A matrisi ele alınsın. A matrisinin sütunları tanımlar. Aynı şekilde A’nın sıraları da n m uzayındaki n vektörü uzayında m vektörü belirler. A matrisindeki maksimum doğrusal bağımsız sıra sayısı r ile belirtilsin, r m . Eğer r, m’den küçük ise doğrusal bağımsız sıra vektörlerinin alt seti sayısı birden daha fazla olabilir. Örneğin, dört sıralı (m=4) bir matris ele alındığında, 1,2,4 sıraları bir doğrusal bağımsız set tanımlayabildiği gibi 1,3,4 sıraları da bir diğer doğrusal bağımsız seti tanımlayabilir. Fakat dört sıranın tümü doğrusal bağımlıdır. Bu durumda r=3’dür. Bu A matrisi için herhangi r doğrusal bağımsız sıranın bir setinin oluşturduğu ve 96 ~ kalan m-r sıranın ihmal edildiği rn boyutlu bir A matrisi tanımlanabilir. A matrisindeki ~ maksimum doğrusal bağımsız sütun sayısı c ile belirtilsin. Bu c değeri aynı zamanda A ~ matrisindeki maksimum doğrusal bağımsız sütun sayısını da belirtir. A matrisindeki her bir sütun r elemana sahiptir. Buna göre, cr eşitsizliği verilebilir. (3.45a) n uzayındaki herhangi bir vektör, r adet doğrusal bağımsız vektörün doğrusal bir kombinasyonu şeklinde verilebilir. Yukarıda sıralar için verilen işlem benzer şekilde sütunlar içinde gerçekleştirilebilir. A matrisindeki c adet doğrusal bağımsız sütunun bir alt seti ~ ~ alınır ve kalan n–c adet sütun ihmal edilerek mc boyutlu bir A matrisi oluşturulabilir. A matrisindeki maksimum doğrusal bağımsız sıra sayısı r ile belirtildiği için bu değer aynı zamanda ~ ~ ~ A matrisindeki maksimum doğrusal bağımsız sıra sayısını belirtmektedir. Fakat A ’daki her bir sıra c elemana sahip olduğu için, rc (3.45b) şeklindedir. Eşitlik (3.45a) ve (3.45b) birlikte ele alınarak, r=c (3.45c) elde edilebilir. Sonuç olarak mn boyutlu bir A matrisinin maksimum doğrusal bağımsız sıra sayısı, maksimum doğrusal bağımsız sütun sayısına eşittir. Bu sayı matrisin rankı olarak tanımlanır ve (A) sembolü ile gösterilir. Açık olarak görüleceği gibi bir matrisin rankı satır veya sütun sayılarından en küçük olanını aşamaz. Başka bir deyişle, (A) min(m,n) (3.46) eşitsizliği verilebilir. (A)=m durumunda matris tam sıra ranklı (A)=n durumunda ise tam sütun ranklıdır. Örnek 3.3 Aşağıda verilen A matrisinin rankını belirleyiniz. 1 2 3 4 A 1 0 1 1 2 2 4 5 Çözüm: A matrisi incelendiğinde 1,2 sıraları ve 1,3 sıralarının doğrusal bağımsız olduğu, bununla birlikte Sıra1+Sıra2–Sıra3 = 0 olduğu içinde üç sıranın doğrusal bağımlı olduğu görülebilir. Sonuç olarak r=2’dir. A matrisinin üçüncü sırası ihmal edilerek, ~ 1 2 3 4 A 1 0 1 1 ~ ~ şeklinde bir A matrisi elde edilebilir. A ’nın tüm sütun çiftleri doğrusal bağımsızdır. Buna göre c ~ en azından 2 olmalıdır. Fakat bu değer aynı zamanda 2 değerini aşamaz. A matrisindeki herhangi bir sütun, bu matrisin sütun çiftlerinin doğrusal bir kombinasyonu olarak, 97 Sütun 3 = Sütun 1 + Sütun 2 Sütun 4 = Sütun 1 + 1.5 Sütun 2 Sütun 1 = 3 Sütun 3 – 2 Sütun 4 Sütun 2 = Sütun 3 – Sütun 1 ifade edilebilir. Buna göre r=c=2=(A) bulunur. Alternatif olarak A matrisinin sütunları ele alınırsa ~ doğrusal bağımsız üç sütunun oluşturduğu bir set bulunamaz ve yukarıda gösterildiği gibi A matrisi içinde aynı sonuç geçerlidir. Ranklarla ilgili teoremler ve bazı açıklamalar aşağıda verilmiştir. Teorem 3.34 A matrisinin transpozunun rankı A matrisinin rankına eşittir. A T A Teorem 3.35 Eğer A, rankı r olan bir idempotent matris ise tr(A)=r ‘dir. Özel bir durum olarak A, nn boyutlu rankı n olan bir kare matris ise A matrisi tekil değildir ve eğer nn boyutlu AB BA I n (3.47a) bir B matrisi mevcut ise A matrisinin ters matrisi olarak adlandırılır ve A-1 ile belirtilir. Bu ters matris eşsizdir. Bu kısımda ters matrislerin hesaplanması ve bazı özellikleri verilmiştir. A matrisinin nn boyutlu bir kare matris olduğu kabul edilsin. Bu matrisin tersinin mevcut olması için gerekli şart aşağıda dört değişik tanımla verilmiştir. Bu tanımların hepsi aynı anlamı taşımaktadır. 1) A matrisi tekil olmayan bir matris olmalıdır. 2) A matrisinin rankı n olmalıdır. 3) A matrisinin n sırası doğrusal bağımsız olmalıdır. 4) A matrisinin n sütunu doğrusal bağımsız olmalıdır. Ters matrisin elde edilmesi çalışmalarına 22 durumu ile başlanacaktır. A matrisi ve ters matrisi A-1 aşağıda verilmiştir. a A 11 a21 a12 a22 12 A1 11 21 22 Ters matris tanımından, AA1 I (3.47b) genel denklemi elde edilir. İlk olarak eşitlik (3.47b) nin her iki tarafının birinci sütunları ele alınsın, a11 a12 11 1 a 21 a 22 21 0 ters matrisin elemanları bilinmemektedir. Denklemler bu elemanlar için çözülürse, 98 11 a 22 a11a 22 a 21a12 21 a 21 a11a 22 a 21a12 eşitlikleri elde edilir. Eşitlik (3. 47b) nin ikinci sütunları için, 12 a12 a11a 22 a 21a12 22 a11 a11a 22 a 21a12 sonuçları elde edilir. Bu sonuçlar kullanılarak ters matris, A 1 a22 1 a11a22 a21a12 a21 a12 a11 (3.48) şeklinde bulunur. A-1 matrisindeki her bir eleman A’daki elemanların bir fonksiyonudur. Ters matristeki her bir eleman a11a22 a12a21 ortak bölenine sahiptir. Bu değer A matrisindeki tüm elemanların bir fonksiyonu olup A matrisinin determinantı olarak tanımlanır. Ters matrisler konusu determinant kavramı açıklandıktan sonra detaylandırılacaktır. Teorem 3.36 Eğer A, B, C matrisleri tekil olmayan matrisler ise bu matrislerin çarpımlarının tersi, ABC1 C 1B 1 A 1 şeklinde elde edilir. Teorem 3.37 Ters matrisin tersi orijinal matrisi verir. A 1 1 A Teorem 3.38 Bir matrisin transpozunun tersi, tersinin transpozuna eşittir. A A T 1 1 T Teorem 3.39 Bir üst (veya alt) üçgen matrisin terside bir üst (veya alt) üçgen matristir. Teorem 3.40 Eğer A matrisi, A A 11 0 0 A 22 şeklinde parçalanmış ve tekil değilse (A, A11, A22 matrisleri kare matrislerdir) A matrisinin tersi, A 1 A 1 11 0 0 1 A 22 şeklinde elde edilir. Teorem 3.41 A matrisi, 99 A A 11 A 21 A12 A 22 şeklinde parçalanmış, A11 ve A22 tekil olmayan kare matrisler ise A matrisinin tersi, B11 A 1 1 A 22 A 21B11 1 B11A12 A 22 A 221 burada B11 A11 A12 A 221 A 21 1 A 221 A 21B11A12 A 221 ’dir ya da 1 1 A 1 A11 A12B 22 A 21A11 A 1 11 1 B 22 A 21A11 1 A12B 22 A11 B 22 1 şekline elde edilir, burada B 22 A 22 A 21A11 A12 1 ’dir. İspat: İlk olarak B12 B A 1 B 11 B 21 B 22 alınsın ve AB = I olduğundan, A11 A 21 A12 B11 B12 I A 22 B 21 B 22 daha sonrada, A11B11 A12B 21 I A11B12 A12B 22 0 A 21B11 A 22B 21 0 A 21B12 A 22B 22 I denklemleri elde edilebilir. Üçüncü denklemden, 1 B 21 A 22 A 21B11 bulunur ve birinci denklemde yerine konup B11 için çözülürse, 1 B11 A11 A12 A 22 A 21 1 elde edilir. Benzer işlemler ikinci ve dördüncü denklemlere uygulanarak, 1 B12 A11 A12B 22 1 B 22 A 22 A 21A11 A12 1 elde edilir. Matrisdeki kalan sütunları elde etmek amacıyla, BA=I çarpımı kullanılarak, B11A11 B12 A 21 I B11A12 B12 A 22 0 100 B 21A11 B 22 A 21 0 B 21A12 B 22 A 22 I denklem seti elde edilir. Bu setteki ikinci denklemden, B12 B11A12 A 221 elde edilir ve bu değer ilk setin dördüncü denkleminde yerine konarak B22 için çözülerek, B 22 A 221 A 221 A 21B11A12 A 221 elde edilir. Elde edilen son iki eşitlik ilk A-1 matrisinin ikinci sütununu verir. Son setin üçüncü denklemi ve ilk setin birinci denkleminden, 1 B 21 B 22 A 21A11 1 1 1 B11 A11 A11 A12B 22 A 21A11 elde edilir. İspat tamamlanır. Bir matrisin tersinin alınması üzerine tanımlanmış önemli teoremlerden biri de Sherman-MorrisonWoodbury teoremidir. Bu teoremin sonuçları Bölüm 7 de sunulan PRESS istatistiği ve Bölüm 11 de tanımlanan etkili bir veri noktasının tanı istatistikleri için temel oluşturur. Açıklanan teorem iinci veri noktasının veri seti dışında bırakıldığı durumlar için bazı önemli regresyon istatistiklerinin kolay bir şekilde hesaplanmasını sağlamaktadır. Boyutu pp olan ve tekil olmayan bir A matrisi ve p boyutlu bir sütun vektörü a ele alınsın. Regresyon uygulaması için A=XTX ve aT xTi alınır. Burada xTi 1 xi1 xik vektörü X matrisinin i-inci sırasıdır. Bu durumda (A-aaT) matrisi XTX matrisinin i-inci sırasının çıkarıldığı matrisi temsil eder. Bu matrisin tersi ise aşağıdaki teorem ile elde edilir. Teorem 3.42 A aaT A 1 1 A1aaT A 1 1 aT A1a A matrisinin rankı n’den küçük ise tekil matristir ve ters matrisi mevcut değildir. Tekil matris konusu matrisin boş uzayı kavramı ile ilişkilidir. Boyutları mn olan ve rankı (A)=r olan bir A matrisi ele alındığında en az bir tane r adet doğrusal bağımsız sıranın oluşturduğu set ve en az bir tane de r adet doğrusal bağımsız sütunun oluşturduğu set mevcuttur. Bunun sonucu olarak A matrisinin satır ve sütunları, ilk r sırası ve ilk r sütunu doğrusal bağımsız olacak şekilde düzenlenebilir ve daha sonra ilk r sıra ve sütun dikkate alınarak parçalanabilir. A A 11 A 21 A12 A 22 Elde edilen A11 matrisi rr boyutlu tekil olmayan bir kare matristir. Homojen denklem seti, Kısım 3.3.3 da detaylı olarak açıklanacaktır, Ax=0 (3.49) 101 şeklinde verilebilir. x vektörü n adet bilinmeyen eleman içeren sütun vektörüdür. Eşitlik (3.49)’un sağ tarafı 0 vektörü olduğu için denklem seti homojendir. Eğer Ax=b ve b≠0 ise denklem sistemi homojen değildir. Eğer x1, eşitlik (3.49)’un bir çözümü ise c herhangi bir skaler olmak üzere cx1’de bu eşitliğin bir çözümüdür. Eşitlik (3.49)’un çözümler seti A matrisinin boş uzayı olarak bilinen bir vektör uzayını oluştururlar. İlk olarak boş uzayın boyutu araştırılacaktır. Bu boyut alt uzayı tanımlayan birbirinden bağımsız vektör sayısıdır. A matrisinin son m–r sırası çıkarılıp ve x vektörü de A matrisinin sütunlarına uygun olarak parçalanırsa, A11 x A12 1 0 x2 (3.50) eşitliği elde edilir. Bu ifade de x1, r adet x2 ise kalan n–r adet elemanı içerir. Sonuç olarak n adet (n≥r) bilinmeyen içeren r adet doğrusal bağımsız denklemli bir set elde edilir. Eşitlik (3.50), A11x1 A12 x2 0 1 şeklinde yeniden yazılabilir. A11 tekil olmadığı için tersi mevcuttur ve bu ifade soldan A11 ile çarpılarak, 1 x1 A11 A12 x2 (3.51) elde edilir. x2 alt vektöründeki n-r eleman herhangi bir şekilde belirlenebilir. Fakat x2 belirlendikten sonra x1 alt vektörü eşitlik (3.51) kullanılarak atanabilir. Eşitlik (3.51) kullanılarak eşitlik (3.50) deki çözüm vektörü, x A 1A x 1 11 12 x 2 x2 I n-r (3.52) şeklinde düzenlenebilir. Elde edilen (3.52) eşitliği n sıra ve n–r sütuna sahiptir. Bu n–r sütun doğrusal bağımsızdır. Bunun nedeni de sütunları doğrusal bağımsız olan In-r alt matrisinin mevcut olmasıdır. Bir birim matrisin sütunları (sıraları) doğrusal bağımsızdır. Sonuç olarak eşitlik (3.52), n–r adet n elemanlı doğrusal bağımsız vektörü eşitlik (3.50)’nin tüm çözümleri için n–r adet doğrusal kombinasyon şeklinde ifade eder. Eşitlik (3.50), çıkarılan sıralar [A11 A12]’nin sıralarının doğrusal bir kombinasyonu olduğu için, eşitlik (3.49) içinde bir çözüm verir. Buna uygun olarak çıkarılan sıralar, cT A11 A12 formunda gösterilebilir. Burada cT herhangi uygun bir r elemanlı sıra vektörüdür. Bu ifade sağdan x ile çarpılabilir. cT A11 A12 x 0 Bunun nedeni ise, x’in eşitlik (3.50) ü sağlamasıdır. Buna göre her bir x çözümü çıkarılan sıralara göre ele alınır ve eşitlik (3.52), eşitlik (3.49) için bu çözüm vektörünü belirler. A matrisinin boş 102 uzayı n–r boyutludur. Buradan çıkarılacak önemli bir sonuç: r ranklı ve boyutları mn olan bir A matrisi için; Sütun sayısı = rank + boş uzay boyutu n = r + (n – r ) (3.53) eşitliği yazılabilir. Eşitlik (3.53)’in özel bir durumu mxn boyutlu bir A matrisinin rankının n–1 olmasıdır. Bu durumda A matrisinin boş uzayının boyutu 1’dir ve Ax=0 denkleminin tüm çözümleri orjinden geçen bir tek doğru üzerindedir. Eğer çözüm vektörü, xT x1 x2 xn ise cxT cx1 cx2 cxn vektörü de (c herhangi bir sabit) bir çözüm vektörüdür. Eşitlik (3.53)’in sonucu çeşitli matrislerin rankları üzerine verilen bazı önemli teoremlerin basit ispatlarını oluşturur. Örnek 3.4 34 boyutlu A matrisi ve 41 boyutlu x vektörü aşağıda verildiği gibi bir homojen denklem seti oluşturmaktadır, Ax=0. A matrisinin boş uzayını bulunuz. x1 1 2 3 4 0 1 2 1 1 x 2 0 x 2 4 4 5 3 0 x4 Çözüm: Matrisin sıraları ikişerli olarak doğrusal bağımsızdır. Fakat üç sıra birlikte ele alındığında, Sıra 1 + Sıra 2 – Sıra 3 = 0 doğrusal bağımsız olmadıkları görülebilir. Bu nedenle A matrisinin rankı ikidir. A matrisinin üçüncü sırası çıkarılarak, x1 1 2 3 4 x 2 0 1 2 1 1 x 0 3 x 4 homojen denklem seti elde edilir. Sütun 1 ve 3 doğrusal bağımsız olduğundan yukarıdaki denklem seti, 1 3 x1 2 4 x 2 1 1 x 2 1 x 3 4 şeklinde elde edilir ve bu denklemler x1 ve x3 için çözülerek, x1 2 x 2 1 / 2 x 4 x3 - 3/2x 4 sonuçları bulunur. Denklem sistemi için çözüm vektörü, 103 x 2 1 0 0 1/ 2 0 x 2 3 / 2 x 4 1 olarak elde edilir. Çözüm olarak verilen matris iki doğrusal bağımsız sütuna sahiptir ve herhangi bir çözüm dört elemanlı iki doğrusal bağımsız vektörün bir doğrusal kombinasyonu şeklinde ifade edilmiştir. Bu çözüm vektörleri 4 ’de iki boyutlu bir boş uzay oluştururlar. Çözüm için tanımlanan [x2 x4] vektörü herhangi bir değer alabileceği için sonsuz sayıda çözüm vektörü T mevcuttur. Elde edilen herhangi bir çözüm, başlangıç denklem seti için de bir çözüm oluşturur. Bu durum çözümdeki her bir sütun vektörünün çıkarılan sırayı sağladığının, 2 12 1 0 0 2 4 4 5 0 ve 2 4 4 5 0 3 2 0 1 gösterilmesi ile ispatlanabilir. Herhangi bir x çözüm vektörü, bu iki sütun vektörünün doğrusal bir kombinasyonu olduğu için x, sistem üçüncü denklemi de sağlar. İlk iki denklemi de sağladığı belirlenmiş olduğundan bu çözüm, tanımlanan denklem sistemi için de bir çözüm oluşturur. A matrisinin boş uzayının boyutu 2’dir. Bu sonuç A matrisinin sütun sayısı rankından çıkarılarak elde edilir. Boş uzaydaki her bir vektör (çözüm vektörü), A matrisindeki her bir sıraya ortogonaldir. A matrisinden çıkarılacak sıranın seçiminde aldatıcı bir keyfilik olduğu düşünülebilir. Fakat aslında durum böyle değildir. Örneğin sistem, 3 4 x3 1 2 x1 1 1 x 1 2 x 4 2 şeklinde parçalanırsa, x3 3x1 6 x 2 x 4 2 x1 4 x 2 denklemleri elde edilir ve çözüm vektörü, 0 1 0 1 x 3 6 4 2 x 1 x 2 şeklindedir. Elde edilen son çözüm sistemi tanımlayan A matrisinin boş uzayının başka bir tanımını verir. Boş uzayın boyutu 2’dir ve son çözümdeki matrisin sütunları doğrusal bağımsızdır. Bununla birlikte elde edilen bu boş uzay daha önce eşitlik elde edilen ile aynıdır. Çünkü son çözümdeki her bir sütun vektörü ilk çözümün sütun vektörlerinin doğrusal bir kombinasyonu olarak ifade edilebilir. 104 1 0 3 2 2 1 1 0 0 0 1 6 4 - 2 1 1 0 0 2 12 0 0, 2 1 2 3 2 1 ve 2 12 0 1, 4 1 2 3 2 1 Sonuç olarak boş uzaylar aynıdır. Başlangıç adımında A matrisinden birinci veya ikinci denklem çıkarılsaydı da boş uzayın belirlenmesinde herhangi bir fark olmayacaktı. Teorem 3.43 Eğer A, mn boyutlu r ranklı herhangi bir matris ve P mm boyutlu, Q ise nn boyutlu tekil olmayan kare matrisler ise, PA AQ PAQ A eşitlikleri sağlanır. Başka bir deyişle, A matrisi tekil olmayan bir matrisle soldan veya sağdan çarpılırsa A matrisinin rankı değişmez. İspat: PA A eşitliğini ispat etmek için A matrisinin boş uzayındaki herhangi bir vektör olarak m ele alınsın; Am=0 ve PAm=0 olacak ve sonuç olarak m vektörü aynı zamanda PA’nın boş uzayında da yer alacaktır. Buna karşın PA’nın boş uzayındaki herhangi bir vektör s ile belirtilerek, PAs=0 yazılabilir. P tekil olmayan bir matris olduğu için bu eşitlik soldan P-1 ile çarpılarak, As=0 elde edilir. Görüleceği gibi s aynı zamanda A’nın boş uzayındadır. Sonuç olarak PA ve A aynı boş uzaya sahiptirler. Bu nedenle rankları aynıdır. Açıklanan ispatlardan yararlanarak, AQ A için ispat, AQ QT AT AT A şeklinde yapılabilir. Tüm bu sonuçlar ile, PAQ A eşitliği yazılabilir. Ranklarla ilgili diğer bir teorem ise dikdörtgen bir matris ile diğer uygun bir dikdörtgen matrisin çarpımları için genel durumu ifade eder. Teorem 3.44 A matrisi mn, B matrisi ns boyutlu ise AB çarpımının rankı, bu matrislerden rankı daha küçük olanın rankına eşit veya daha küçüktür. AB min A , B 105 İspat: x vektörü A matrisinin boş uzayındaki herhangi bir vektör olsun, Bx=0 ve ABx=0 yazılabilir. Bu durumda x vektörü AB’nin boş uzayında da bulunmaktadır. Fakat A matrisi kare matris olmadığı için ters matrisi bulunamaz, bu nedenle, ABy=0 işleminden By=0 işlemine geçilemez. Sonuç olarak, B’nin boş uzayının boyutu AB’nin boş uzayının boyutu eşitsizliği elde edilebilir. AB ve B’nin sütun sayısı aynı olduğu için eşitlik (3.53)’den, AB B ve transpoz işlemi kullanılarak, AB BT AT AT A sonucu elde edilerek teorem ispatlanmış olur. Ranklarla ilgili önemli bazı teoremler aşağıda ispatsız olarak verilecektir. Teorem 3.45 Boyutları nn olan iki kare matris A ve B’nin rankları r ve s ise AB’nin rankı , AB r s n eşitsizliğini sağlar. Teorem 3.46 A ve B matrislerinin toplamının rankı, A B A B eşitsizliğini sağlar. Teorem 3.47 Boyutları np olan bir A matrisi için: AT A AAT A T A . Teorem 3.48 A boyutu mn olan bir matrisi a boyutu m1 ve b boyutu n1 olan vektörler ise ancak ve ancak A=abT eşitliğini sağlayan sıfırdan farklı a ve b vektörleri var ise (A)=1 olur. Teorem 3.49 A matrisinin bir alt matrisi A1 ise (A1)(A). 3.2.4 Matrisin Determinantı Determinantın yaygın tanımı nn sayıda elemanların a11 a12 a1n a21 a22 a2 n an1 an 2 ann biçimindeki sıralanışıdır. Bu n uzayındaki n adet vektörün oluşturduğu kümedir. Görüldüğü gibi determinant, vektör kavramı ile iç içedir. Örneğin x v1 1 y1 2 uzayında, x v2 2 y2 vektörlerinin oluşturduğu ve Şekil 3.15 de gösterilen paralel kenar ele alısın. 106 Şekil 3.15 Paralel kenarın alanının OBB´ ve B´BCC´ alanlarının toplamından OAA´ ve A´ACC´ alanlarının toplamının çıkarılması ile elde edilebileceği açıktır: S 1 1 1 1 x2 y2 y1 2 y2 x1 x1 y1 2 y1 y2 x2 2 2 2 2 x1 y2 y1 x2 Hesaplanan x1y2-y1x2 sonucu matematikte, x1 x2 y1 y2 şeklinde gösterilebilir. Sonuç olarak, x1 x2 y1 y2 x1 y2 y1 x2 (3.54) eşitliği geçerlidir. Buradan determinantın bir değer olduğu bu değerin hesabının nasıl yapıldığı ve 2 uzayında nın v1 ve v2 vektörlerinin tanımladığı paralel kenarın alanını gösterdiği sonucu elde edilir. Eğer n=3 ise, x1 v1 y1 z 1 x2 v 2 y2 z 2 x3 v 3 y3 z 3 vektörlerinin kümesi, x1 x2 x3 y1 y2 y3 x1 y2 z3 z2 y3 y1 z2 x3 x2 z3 z1 x2 y3 y2 x3 z1 z2 z3 107 ile hesaplanır ve bu sonuç paralel yüzün hacmini verir. Benzer şekilde n=n boyutu için de değeri bulunabilir. Görülüyorki fonksiyonu bir geometrik şeklin alan hacim gibi değerlerini ifade etmektedir. Aşağıda 22 ve 33 boyutlu determinantlar elemanları indislenerek tanımlanmıştır: 2 a11 a12 a 21 a 22 a11 a11a 22 a12 a 21 a12 a13 3 a 21 a 22 a31 a 23 a11a 22 a33 a12 a 21a33 a12 a 23a31 a13a 22 a31 a13a 21a32 a11a 23a32 a32 a33 Eşitliklerin sağ taraflarından determinantın her satır ve sütundan yalnızca bir eleman almak koşulu ile oluşturulan çarpımların toplamı olduğu görülür. Her terimde yer alan elemanların sayısı determinantın satır veya sütun sayısına eşittir. Toplanan terimlerin sayısı ise satır veya sütun permütasyon sayısı n! kadardır. Terimlerin yarısı (-) diğer yarısı da (+) işaretlidir. Terimlerdeki işaretlerin, terimleri oluşturan çarpımların sütun indislerinin inversiyon sayılarının tek veya çift olmasından ileri geldiği açıktır. 3 determinantı incelendiğinde sütun indisleri, 123 213 231 321 312 132 olup her bir permütasyonun inversiyon sayısı bulunduğunda 3 determinantının açılımındaki terimlerin işaretleri elde edilir. Her hangi bir A matrisinin determinantı genellikle det A ya da A ile gösterilir. Determinant için daha genel ve kolay bir yöntem 33 boyutlu bir matris örneği üzerinde aşağıda açıklanmıştır: a11 A a21 a31 a12 a22 a32 a13 a23 a33 şeklinde verilmiş olsun. Eğer a11 elemanına ait satır ve sütun çıkarılırsa, a 22 a 32 a 23 a33 alt matrisi elde edilir. A matrisinden i-inci sıra ve j-inci sütun silindikten sonra elde edilen 22 boyutlu alt matrisin determinantı M ij a 22 a 23 a32 a33 (3.55) ile belirtilsin. Mij, bir minör olarak isimlendirilir. cij 1 i j M ij (3.56) ifadesi ise kofaktör başka bir deyişle işaretli minördür. Eğer i+j toplamı çift ise, Mij’nin işareti 108 değişmez, i+j toplamı tek ise işaret değiştirir. Kofaktörler yardımı ile A matrisinin determinantı bir tek sıra veya sütuna göre, A a11c11 a12c12 a13c13 (3.57) şeklinde elde edilebilir. Bu tanımdan da anlaşılacağı gibi A herhangi bir sıra veya sütunun elemanlarına göre elde edilebilir. nn boyutlu genel durum için determinant, A ai1ci1 ai 2ci 2 aincin i 1,......, n (3.58a) veya A a1 j c1 j a2 j c2 j anj cnj j 1,......, n (3.58b) eşitliklerinden bulunabilir. Bu ifadedeki kofaktörler n–1 boyutlu alt matrislerdir. Her bir aij elemanına karşılık gelen cij değerleri bulunarak elde edilen matris A ile bölünerek ters matris A-1 elde edilebilir: c11 c12 1 A c21 c22 A c31 c32 1 c13 1 c23 A CT c33 (3.59) Teorem 3.50 A matrisi simetrik ise A matrisinin determinantı, A AT transpozunun determinantına eşittir. Teorem 3.51 A matrisinin herhangi iki sırasının veya sütununun değiştirilmesi ile bir B matrisi elde edilirse, B matrisinin determinantı A matrisinin determinantının ters işaretlisine eşittir. B A Teorem 3.52 Aynı elemandan oluşan iki veya daha fazla sıraya (veya sütuna) sahip matrisin determinantı sıfırdır. a b İspat: Sadece 22 boyutlu matris için verilecektir. A ise determinant: a b A ab ab 0 Teorem 3.53 A matrisinin herhangi bir sırasının (veya sütununun) herhangi bir değerle çarpılıp bir başka sırası (veya sütunu) ile toplanması ile elde edilen B matrisinin determinantı A matrisinin determinantına eşittir. Teorem 3.54 Eğer A matrisinin sıraları (veya sütunları) doğrusal bağımlı ise A 0 , doğrusal bağımsız ise A 0 ’dır. Buna uygun olarak tekil olmayan matrisler sıfırdan farklı, tekil matrisler ise sıfır determinanta sahiptir. Teorem 3.55 Bir üçgen matrisin determinantı köşegen elemanlarının çarpımına eşittir. 109 A a11 a22 a33 ..... ann Teorem 3.56 Bir köşegen matrisin determinantı köşegen elemanlarının çarpımına eşittir. A a11 a22 ..... ann Teorem 3.57 Birim matrisin determinantı I 1 bire eşittir. Teorem 3.58 Bir A matrisinin herhangi bir sıra (veya sütunu) bir sabiti ile çarpılarak B matrisi elde edilirse, elde edilen matrisin determinantı orijinal matrisin determinantının katıdır. B A Teorem 3.59 Eğer A matrisinin tüm elemanları ile çarpılarak B matrisi elde edilirse B matrisinin determinantı, B n A şeklinde elde edilir. Teorem 3.60 İki kare matrisin çarpımının determinantı bu matrislerin determinantlarının çarpımına eşittir. AB A B Teorem 3.61 Eğer P bir ortogonal matris ise determinantı P 1 veya P 1 şeklindedir. Teorem 3.62 Eğer P bir ortogonal matris ve A kare bir matris ise, P T AP A eşitliği sağlanır. İspat: P matrisi ortogonal bir matris ise Teorem 3.61 ile P 1 . Ortogonal matrisler simetrik olduğundan Teorem 3.50 ile P P T olduğundan P P T 1 koşulları sağlanır. Bu durumda P T AP P T A P A elde edilir. Teorem 3.63 A matrisi, A A 11 A 21 A12 A 22 şeklinde alt matrislere ayrılmış ve A11 ile A22 kare matrislerdir. Eğer A12=0 veya A21=0 ise, A A11 A 22 olarak elde edilir. İspat: A22 matrisinin birim matris olması durumunda, 110 A A11 0 0 I A11 bulunabilir. Bu sonuç kullanılarak 0 0 A11 0 I A A 11 0 A12 0 I 0 A 22 A A11 A 22 elde edilerek teoremin ispatı yapılabilir. Daha sonra bu teorem ile A A11 A12 0 I A11 ifadesi tanımlanarak teorem üçgen (alt veya üst) matrisin determinantı için genişletilerek, A12 I 0 A11 A A 11 0 A 22 0 A 22 0 A A11 A 22 A12 I sonucu bulunur. Parçalanmış matrislerin determinantı için genel tanım aşağıdaki şekilde verilebilir. A11 ve A22 kare ve tekil olmayan matrisler olmak üzere, 1 I A12 A 22 B1 I 0 ve I 0 B 2 1 - A 22 A 21 I şeklinde B1 ve B2 matrisleri tanımlanarak, 1 A A12 A 22 A 21 B1 AB 2 11 0 0 A 22 çarpımı elde edilir. B1 B 2 1 olduğu için, 1 A A 22 A11 A12 A 22 A 21 (3.60a) veya benzer bir şekilde alternatif olarak, 1 A A11 A 22 A 21A11 A12 (3.60b) şeklinde elde edilebilir. Teorem 3.64 A-1 matrisinin determinantı A matrisinin determinantının devriğidir. A 1 1 A 3.3 DENKLEM SİSTEMLERİNİN ÇÖZÜMÜ 111 Eşanlı doğrusal denklemler kümesi ile istatistiksel doğrusal modeller konusunda oldukça sık karşılaşılır. Bu kısımda doğrusal denklemlerin çözümlü ve çözümlü ise eşsiz bir çözümün varlığı ve çözümlerin özellikleri ile ilgili kriterler araştırılacaktır. Homojen olmayan bir doğrusal denklem sistemi, x1a11 x2 a12 xm a1m b1 x1a21 x2 a22 xm a2m b2 (3.61a) x1an1 x2 an 2 xm anm bn şeklinde tanımlanıp, bu sistem matris notasyonunda, Ax=b (3.61b) ifadesi ile verilebilir. Bu eşitlikte A, nm boyutlu matris x, m1 boyutlu vektör b ise n1 boyutlu bir vektördür. Verilen aij ve bj seti için Ax=b eşitliğini sağlayan bir xi seti mevcut mudur? Bu soru için dikkate alınabilecek üç durum sözkonusudur. 1) Eşitliğin çözümü yoktur. Bu durumda sistemin eşitliğini sağlayan bir x vektörü yoktur ve sistem tutarsızdır. 2) Sistemin eşitliğini sağlayan bir tek x seti vardır. Bu durumda sistemin bir tek çözümü vardır. 3) Sistemin eşitliğini sağlayan birden fazla x vektörü vardır. Eğer eşitliği sağlayan birden fazla x vektörü varsa sonsuz sayıda çözüm bulunabilir. Sistemin çözümü ile ilgili çalışmalara geçilmeden önce ilk aşamada bir matrisin rankını değiştirmeyen basit satır (sütun) işlemleri açıklanacaktır. Matrisin satırları (sütunları) üzerinde basit elemanter işlemler olarak adlandırılan üç operasyon tipi vardır: 1) İki satırın (sütunun) yer değiştirmesi. 2) Bir satırın (sütunun) her hangi bir skaler 0 ile çarpılması. 3) j-inci satırın (sütunun) katının i-inci satıra (sütuna) eklenmesi. Yukarıdaki işlemler bir Im birim matris üzerine uygulansın. i-inci satırı (sütunu), j-inci satırı (sütunu) ile değişen matris Eij, (Fij) şeklinde, i-inci satırı (sütunu) 0 skaleri ile çarpılan matris Ei(), Fi() ile ve j-inci satırı (sütunu) ile çarpılıp i-inci satıra (sütuna) eklenen matris Ei(/j), Fi(/j) ile gösterilecektir. Burada E (ya da F) boyutu mm olan birim matristen elemanter işlemler ile elde edilen matristir ve elemanter matris olarak adlandırılır. Örneğin m=3 alınarak, 0 0 1 E13 0 1 0 1 0 0 1 0 0 E 2 7 0 7 0 0 0 1 1 0 0 E 3 5 / 2 0 1 0 0 5 1 112 0 0 1 F13 0 1 0 1 0 0 1 0 0 F2 7 0 7 0 0 0 1 1 0 0 F3 5 / 2 0 1 5 0 0 1 Matrislerden görüldüğü gibi, Fij=Eij, Fi()=Ei(), olmakla birlikte Fi / j E j / i EiT / j . Boyutu mn olan bir A matrisi bir dizi elemanter işlem ile boyutu olan mn bir B matrisine dönüştürülebilir. Diğer bir deyişle, EkEk-1…E1A=B koşulunu sağlayan sonlu sayıda mm boyutlu elemanter matris vardır. Bu eşitlik kısaca B=EA şeklinde gösterilebilir. Boyutu mn olan bir A matrisi bir dizi elemanter satır (sütun) işleminin uygulanması ile eşelon (echelon) matrise indirgenebilir. Bir eşelon matrisin yapısı aşağıda tanımlanmıştır: 1) Eğer bir satır sıfırdan farklı bir elemana sahip ise sıfırdan farklı ilk elemanın değeri 1 olup pivot elemandır. 2) Eğer bir sütun pivot elemana sahip ise pivot elemanın altındaki tüm elemanlar sıfırdır. 3) Eğer bir satır pivot elemana sahip ise bu satırın üstündeki her bir satırın pivot elemanı en az bir sütun solda yer alır. Aşağıdaki H matrisi bir eşelon matristir: 0 0 H 0 0 1 h13 h14 h15 0 0 1 h25 0 0 0 1 0 0 0 0 h16 h26 h36 0 Matrisin üç adet pivot elemanı vardır. Eşelon matrislerin rankını belirlemek oldukça kolaydır. Tüm elemanları sıfırdan farklı satırların sayısı matrisin rankını belirler yukarıdaki matris için (H)=3. Boyutu mn olan her A matrisi bir dizi elemanter işlem ile eşelon matrise dönüştürülebilir. Diğer bir deyişle, EkEk-1…E1A=H koşulunu sağlayan sonlu sayıda mm boyutlu elemanter matris vardır. Bir eşelon matrisi elde etmek için kullanılabilecek üç adımlı algoritma şağıda verilmiştir: Adım 1. Alt sırasında en az bir tane sıfırdan farklı elemanı olan ilk sütunu ji belirle. Eğer böyle bir sütun yok ise işlemi durdur. Adım 2. Eğer aiji 0 ise i-inci sırayı ji sütunundaki elemanı sıfırdan farklı her hangi bir sıra ile değiştir. Adım 3. ji sütunundaki sıfırdan farklı elemanları elemanter işlemler ile sıfıra indirge. 113 Elde edilen matris henüz eşelon formunda değildir çünkü her sıradaki pivot elemanlar 1 değerinde değildir. Her bir sıra pivot elemanın değerine bölünerek eşelon matris elde edilir. Örnek 3.5 Aşağıdaki 35 boyutlu matrisi elemanter işlemler ile eşelon yapıya indirgeyin. 0 0 1 2 3 A 2 4 2 0 4 2 4 1 2 7 Çözüm: Algoritma izlendiğinde, Adım 1 j1=1, Adım 2 a11=0 olduğundan satır 1 ve 2 yer değiştirir. 2 4 2 0 4 A 2 E12 A 0 0 1 2 3 2 4 1 2 7 Adım 3 satır 1 satır 3 den çıkarılır. 2 4 2 0 4 A 3 E 3 1 / 1A 2 0 0 1 2 3 0 0 1 2 3 Adım 1 e dönülür. Adım 1 j2=3, Adım 2 a230 olduğundan satır değiştirme gerekli değildir. Adım 3 satır 2 satır 3 den çıkarılır. 2 4 2 0 4 A 4 E 3 1 / 2A 3 0 0 1 2 3 0 0 0 0 0 Adım 1 e dönülür ve işlem durdurulur. Son aşamada pivot elemanı 1 değerine eşitlemek için satır bir ½ ile çarpılır. 1 2 1 0 2 A 5 E1 0.5A 4 0 0 1 2 3 0 0 0 0 0 A matrisi üzerine yapılan elemanter işlemler: H A 5 E1 0.5E3 1 / 2E3 1 / 1E12 A ile özetlenebilir. A matrisinin rankının (A)=2 olduğu da görülmektedir. Örnek 3.6 Örnek 3.5 da elde edilen eşelon matrisin bir dizi elemanter sütun işlemi ile 1 0 0 0 0 H 4 0 1 0 0 0 0 0 0 0 0 matrisine dönüştürülebileceğini gösteriniz. Çözüm: İlk olarak sütun 2 ile sütun 3 yer değiştirsin. 114 1 1 2 0 2 H 2 HF23 0 1 0 2 3 0 0 0 0 0 Sütun 1 i kullanarak sütun 2,3 ve 5 in ilk satır elemanlarını sıfır değerine dönüştür. 1 0 0 0 0 H 3 H 2 F2 1 / 1F3 2 / 1F5 2 / 1 0 1 0 2 3 0 0 0 0 0 Son olarak Sütun 2 yi kullanarak sütun 4 ve 5 in ikinci satır elemanlarını sıfır değerine dönüştür. 1 0 0 0 0 H 4 H 3 F4 1 / 1F4 2 / 2F5 3 / 2 0 1 0 0 0 0 0 0 0 0 elde edilir. Teorem 3.65 Boyutu mn ve rankı r olan her A matrisi, E boyutu mm ve F boyutu nn olan elemanter (tekil olmayan) matrisler ve H boyutu mn olan eşelon matris olmak üzere, I EAF HF r 0 0 0 şeklinde gösterilebilir. Eğer A matrisi tekil olmayan bir matris ise A matrisi bir dizi elemanter işlem (ileri doğru eleme) ile E1A=H eşelon matrise ve daha sonra yine elemanter işlemler (geriye doğru eleme) ile eşelon matris E2H=Im birim matrise dönüştürülebilir. Matrisler arasındaki ilişki yapısının E2E1A =Im ve A-1=E2E1 olduğu görülmektedir. Bu yaklaşım ileride açıklanacak olan Gauss eleme yöntemini tanımlamaktadır. Teorem 3.66 Boyutu nn ve rankı n olan (tekil olmayan) her A matrisi, E boyutu nn ve F boyutu nn olan elemanter (tekil olmayan) matrisler olmak üzere, EAF I n şeklinde gösterilebilir. Sonuç 3.66.1 Her tekil olmayan matris elemanter matrislerin çarpımı olarak yazılabilir. EAF=In olduğundan ve elemanter matrislerin tersi yine elemanter bir matrisi tanımladığından, A E 1F 1 E k E k 1 E1 1 F1F2 Fl 1 E11 E k 1Fl1 F11 eşitliği elde edilir. Bazı durumlarda bir A matrisini eşelon yapıya indirgemenin yanı sıra bu indirgemeyi gerçekleştiren E matrisinin de bulunması istenebilir. EA=H eşitliği kullanılarak, A ve H matrisleri genişletilerek, 115 EA : I H : E yazılabilir. Bu eşitlik mn boyutlu A matrisini eşelon yapı indirgemek yerine boyutu m(n+m) olan (A:Im) matrisini eşelon yapıya indirger. Bu yaklaşım eğer A matrisi tekil olmayan bir matris ise A matrisinin tersinin elde edilmesinde kullanılabir. Teorem 3.67 Boyutu nn ve rankı n olan (tekil olmayan) her A matrisi için eğer (A:In) matrisi eşelon forma indirgenir ise eşelon yapının ilk matrisi birim matrisi ikinci matrisi ise ters matrisi (In:A-1) verir. İspat: Teorem 3.66 dan EAF=In olduğu bilinmektedir. Bu ifade önce sağdan F-1 ile ve sonra soldan F ile çarpılarak FEA=In elde edilir. FE=G matrisi elemanter matrislerin çarpımı olduğundan yine bir elemanter matristir. Sonuç olarak GA=In eşitliği ile A matrisi birim matrise In indirgenebilir. Bu sonuç kullanılarak, G(A:In)=(GA:G)=(In:A-1) ispat tamamlanır. Diğer bir deyişle eğer (A:In) matrisi eşelon yapıya dönüştürülüse elde edilen matrisin ilk bloğu birim matrisi ikinci bloğu ise A matrisinin tersini verecektir. Örnek 3.7 Aşağıdaki matrisin tersini eşelon yöntemi ile bulunuz. 0 1 1 A 1 1 1 3 4 3 Çözüm: A matrisine birim matris eklenerek, 0 1 1 1 0 0 A1 1 1 1 0 1 0 3 4 3 0 0 1 Satır 1 ile 2 yer değiştirerek, 1 1 1 0 1 0 A 2 0 1 1 1 0 0 3 4 3 0 0 1 Satır 1 in üç katını satır 3 den çıkartarak, 1 1 1 0 1 0 A3 0 1 1 1 0 0 0 1 0 0 3 1 Satır2 yi satır 3 den çıkararak ve satır 3 ü -1 ile çarparak, 116 1 1 1 0 1 0 A4 0 1 1 1 0 0 0 0 1 1 3 1 Matris eşelon yapıya dönüşmüştür. İndirgemeye devam etmek için satır 3 satır 1 ve 2 den çıkarılarak, 1 1 0 1 2 1 A5 0 1 0 0 3 1 0 0 1 1 3 1 son olarak satır 2 satır 1 den çıkarılarak, 1 0 0 1 1 0 A6 0 1 0 0 3 1 0 0 1 1 3 1 Araştırılan ters matris, A 1 0 1 1 0 3 1 . 1 3 1 3.3.1 Gauss eleme yöntemi A tekil olmayan bir matris olsun ve Ax=b eşanlı doğrusal denklen sistemi ele alınsın. Denklem sisteminde katsayılar matrisi A’dır. Amaç x çözüm vektörünü bulmaktır. Teorem 3.66 dan görüldüğü gibi GA=I denklemini sağlayan G elemanter matrisi vardır. Elemanter matris iki elemanter matrisin çarpımı G=E1E2 olarak düşünülebilir. İlk aşamada E1A=H eşelon matris ve ikinci aşamada E2H=I birim matris elde edilir. Çözüm için genişletilmiş (augmented) matris (A:b), A matrisine b vektörünün bir sütun olarak eklenip sütun boyutunun bir arttırılması ile elde edilen, a11 a12 a1m a a 2m a A : b 21 22 a n1 a n 2 a nm b1 b2 bn (3.62) matris genişletilmiş matristir, ele alınsın. İlk adımda ileri doğru eleme yöntemi ile E1(A:b)=(H:E1b) eşelon yapısı elde edilir. İkinci adımda geriye doğru eleme yöntemi ile E2(H:E1b)=(I:E2E1b) birim matris yapısı elde edilir. Sağ tarafta elde edilen x=E2E1b çözüm vektörüdür. Bu sonuç için, E2E1A= E2H=I olduğundan A-1=E2E1 ve x=A-1b için çözümün A-1b=E2E1b eşitliğini sağladığı görülebilir. Örnek 3.8 Aşağıdaki denklem sisteminin çözümünü bulunuz. 2 x1 x2 3x3 1 117 5x1 2 x2 6 x3 5 3x1 x2 4 x3 7 Çözüm: Denklem sistemi Ax=b yapısında, 2 1 3 x1 1 5 2 6 x 2 5 3 1 4 7 3 tanımlanır. Genişletilmiş matrise, 2 1 3 1 5 2 6 5 3 1 4 7 ileri doğru eleme yöntemi ile satır işlemleri uygulanarak eşelon yapısındaki A matrisi, 1 0.5 1.5 0.5 3 5 0 1 0 0 1 1 ve son olarak geriye doğru eleme yöntemi ile, 1 0 0 3 0 1 0 2 0 0 1 1 matrisi elde edilir. Çözüm vektörü x=(x1 x2 x3)=(3 -2 1) olarak elde edilmiştir. 3.3.2 Kramer Kuralı Boyutu nn olan bir A matrisinin i-inci satır ve j-inci sütunu silinerek elde edilen (n-1)(n-1) boyutlu matris Aij olsun. Eşitlik (3.56) den aij elemanının kofaktörü tanımlanmıştır. Boyutu nn olan elemanları kofaktörlerden oluşan matris C olsun. Eğer A matrisi tekil değilse eşitlik (3.59) sağlanır. Bu eşitlikden, A I n CT A bulunur. Görüldüğü gibi CTA matrisinin tüm köşegen elemanları A değerine eşittir ve n A aij cij j 1 eşitliği yazılabilir. Bu ifade A determinantının j-inci sütuna göre açılımı olarak adlandırılır. Şimdi Ax=b denklem sistemi dikkate alınsın. Eşitlik (3.59) dan, n xj bi cij i 1 A j=1,…,n (3.63a) 118 sonucu bulunur. Şimdi j-inci sütuna göre açılan A j determinantı dikkate alınsın. A(j) matrisinin ij-inci kofaktörü A(j) matrisinin j-inci sütunun ve i-inci satırının silinmesi ile elde edilir. Bu nedenle A matrisinin elemanının ij-inci kofaktörüne, cij eşittir. Sonuç olarak A j i 1 bi cij sağlandığından eşitlik (3.63a), A j xj (3.63b) A olarak bulunur. Örnek 3.9 Örnek 3. da verilen denklem sistemini Cramer yöntemi ile çözünüz. 1 Çözüm: A 1 5 1 2 3 2 1 3 6 21 A 2 7 1 4 A 3 5 5 6 14 3 7 4 2 1 1 5 2 5 7 2 1 3 A5 2 6 7 3 1 7 3 1 4 Determinant değerleri eşitlik (3.63b) de yerine konarak, çözüm vektörü x=(x1 x2 x3)=(3 -2 1) olarak elde edilmiştir. 3.3.3 Homojen Denklem Sistemleri Eğer eşitlik (3.61) ile tanımlanan denklem sistemi, x1a11 x2 a12 xm a1m 0 x1a21 x2 a22 xm a2 m 0 x1an1 x2 an 2 (3.64a) xm anm 0 şeklinde tanımlanmış ise homojen denklem sistemi olarak adlandırılır. Bu sistem matris notasyonunda, Ax=0 (3.64b) ifadesi ile verilebilir. x=0 bu sistem için daima bir sonuç verdiğinden sistem her zaman çözümlüdür. Bu çözüm sıfır çözümü (trivial) olarak adlandırılır. Doğal olarak homojen denklem sistemlerinde x0 şeklinde bir çözümün varlığı araştırılır. Eğer (A)=n ise ATA tekil olmadığı için eşitlik (3.64b) kullanılarak ATAx=0 elde edildiğinden sadece x=0 çözümü vardır. Sonuç olarak sıfırdan farklı bir çözümün olabilmesi için (A)<n olmalıdır. Diğer bir deyişle eğer (A)<n ise A matrisinin n adet sütunu, a1, a2,…,an doğrusal bağımlı olacağından, x1a1+x2a2+…+xnan=0 denklemini sağlayan sağlayan sıfırdan farklı x1, x2,…,xn değerleri bulunabilir. Sonuç olarak Ax=0 sistemi için sıfırdan farklı çözüm vardır. Eğer (A)<n için x0 şeklinde bir çözüm var ise bu 119 durumda her hangi bir skaler olmak üzere, x vektörüde sistemin bir çözümünü tanımladığından sistem için sonsuz çözüm mevcuttur. Teorem 3.68 Ax=0 homojen denklem sisteminde A bir kare matris olmak üzere sıfırdan farklı çözüm ancak ve ancak A matrisi tekil ise vardır. İspat: Eğer (A)=n ise Ax=0 sistemini sağlayan doğrusal bağımsız x vektörleri yoktur. Teorem 3.69 Ax=0 homojen denklem sisteminde denklem sayısı bilinmeyen sayısından daha az ise sıfırdan farklı çözüm daima vardır. İspat: Boyutu mn olan bir A matrisi için Ax=0 homojen denklem sistemi tanımlansın. Eğer m<n ise (A)<m<n eşitsizliği geçerli olduğundan Teorem 3.68 e göre ispat tamamlanır. Diğer bir deyişle n-(A) adet doğrusal bağımsız x vektörü Ax=0 denklemini sağlar. Örnek 3.10 Aşağıdaki homojen doğrusal denklem sistemini çözünüz. x1 x2 5x3 x4 0 x1 x2 2 x3 3x4 0 3x1 x2 8x3 x4 0 x1 3x2 9 x3 7 x4 0 Çözüm: Katsayılar matrisi A eşelon yapıya yapıya dönüştürülerek, 5 1 1 1 5 1 1 1 1 1 2 3 0 1 7 / 2 2 3 1 8 1 0 0 0 0 0 0 1 3 9 7 0 0 (A)=2 bulunur. x3=2 ve x4= atanarak, x2 7 2 ve x1 x2 10 3 elde edilir ve çözüm kümesi, x1 , x2 , x3 , x4 3,7,2,0 1, 2,0,1 . Homojen olmayan denklem sistemlerinin Ax=b çözümü ile ilgili bazı önemli teoremler aşağıda verilmiştir. Teorem 3.70 Ax=b denklem sisteminin tutarlı olabilmesi (bu sistemi sağlayan en az bir adet x vektörünün mevcut olması) için gerek ve yeter koşul, katsayı matrisinin A rankı ile genişletilmiş matrisin (A:b) rankının eşit olması gereklidir. (A)=(A:b) İspat: Genişletilmiş matrisin (A:b) rankı A matrisinin rankına eşit ya da bir fazladır. A matrisinin sütunları, a1,…,an kullanılarak, x1a1 x2a2 xnan b sistemin tanımlansın. Sistem ancak ve ancak b vektörü A matrisinin sütunlarının doğrusal bir kombinasyonu olarak yazılabiliyor ise bir çözüme sahiptir. Bu durum ise ancak ve ancak b vektörü 120 A matrisinin sütun uzayında ise mümkündür. Diğer bir deyişle ancak ve ancak (A)= (A:b) durumu geçerli ise çözüm vardır. Teorem 3.71 Eğer A boyutu mn olan bir matris ve (A)=(A:b)=p ve p<n ise bilinmeyen n-p adet xi değeri keyfi olarak atanır ve kalan p adet xi eşsiz olarak belirlenir. Bu tip çözümler çoklu çözüm olarak adlandırılır. Teorem 3.72 Eğer A boyutu mn olan bir matris ve (A)=(A:b)=n ise Ax=b denklemini sağlayan bir eşsiz x vektörü mevcuttur. İspat: Ax=b denkleminin her iki tarafı AT ile çarpılsın ATAx=ATb. (A)=n olduğundan ATA matrisi tekil olmayan bir matristir. Bu nedenle x=(ATA)-1ATb eşsiz bir çözüme sahiptir. Tanımlanan bir Ax=b denklem sistemi için yukarıda verilen teoremler aşağıdaki gibi özetlenebilir. A boyutu mn olan bir matris ise: (A)=(A:b)=n ise eşsiz çözüm (A)=(A:b)<n ise çoklu çözüm (A)=(A:b)+1 ise çözümsüz. 3.4 DOĞRUSAL DÖNÜŞÜMLER Doğrusal dönüşümler doğrusal cebir ve doğrusal modeller kapsamında önemli bir konu başlığıdır. n A boyutu mn olan bir matris ve x boyutu n1 olan uzayındaki bir vektör olsun. Boyutu m1 olan bir y vektörü, y=Ax (3.65) denklemi ile tanımlansın. Elde edilen y vektörü m uzayındadır. Bu işlem, A dönüşümü ile x vektörü y vektörüne dönüştürülmüştür, şeklinde ifade edilebilir. Eşitlik (3.65) n uzayındaki x vektörünü m uzayındaki y vektörüne taşımak ya da x noktasını y noktasına taşımak olarak değerlendirilebilir. n uzayındaki her hangi iki vektör x1 ve x2 olsun eğer, y1=Ax1 y2=Ax2 olarak tanımlanırsa x1 vektörü y1 vektörüne ve x2 vektörü de y2 vektörüne A dönüşümü ile dönüştürülmüştür. Eğer c1 ve c2 her hangi iki gerçel sayı olmak üzere x3 vektörü, x3= c1x1+c2x2 denklemi ile belirlenmiş ise A dönüşümü kullanılarak x3 vektörü y3 vektörüne; y3=Ax3=A(c1x1+c2x2)= Ac1x1+Ac2x2 =c1y1+c2y2 dönüştürülür. Denklemden görüldüğü gibi c1x1+c2x2 vektörü c1y1+c2y2 vektörüne dönüştürülmüştür. Eşitlik (3.65) ile tanımlanan n uzayındaki vektörlerin dönüşümü doğrusal homojen dönüşüm olarak adlandırılır ve genellikle basit olarak doğrusal dönüşüm şeklinde ifade edilir. Bu dönüşümün özel bir 121 durumu 0=A0 eşitliği olup bir sıfır vektörünü bir diğer sıfır vektörüne dönüştürmektedir. Bu nedenle dönüşüm homojen olarak adlandırılır. n uzayındaki her hangi iki vektör x1 ve x2 ile her hangi iki skaler c1 ve c2 için, A(c1x1+c2x2)= c1(Ax1)+ c2(Ax2) elde edildiğinden doğrusaldır. Diğer bir deyişle iki vektörün doğrusal bir kombinasyonunun A dönüşümü, dönüştürülmüş iki vektörün aynı doğrusal kombinasyonu ile elde edilmektedir. Bir x vektörünün, y=Ax dönüşümü ve y vektörünün, z=By dönüşümü ele alınsın. Dönüşümler yerine konarak, z=By=B(Ax)=(BA)x elde edilir. Burada BA matrisi x vektörünü doğrudan z vektörüne taşıyan dönüşümdür. Bu yaklaşım her hangi sonlu sayıdaki dönüşüm için genişletilebilir. Yanıtı araştırılan bir diğer soru ise dönüşüm sonucu elde edilen vektörler kümesinin bir vektör uzayı yapısında olup olmadığıdır. Teorem 3.73 Bir A dönüşümü ile n vektör uzayındaki her bir vektörün dönüşümünden elde edilen vektör kümesi, S y / y Ax, x n bir vektör uzayını tanımlar. Dönüşümler üzerine bir diğer önemli soru da bir vektörü kendi katlarına dönüştürecek dönüşüm ile ilgilidir. Bu problem doğrusal cebirde özdeğer problemi olarak adlandırılır. 3.5 MATRİSİN ÖZDEĞERLERİ (KARAKTERİSTİK KÖKLERİ) Boyutu nn olan bir A matrisi ile tanımlanan dönüşüm ele alınsın. n uzayındaki sıfırdan farklı bir x için bir gerçel sayı olmak üzere, Ax=x (3.66) dönüşümü var ise x vektörü x vektörünün katı olduğundan bu dönüşüm x vektörünü kendi katlarına dönüştürmektedir. Bu eşitlikteki gerçel sayı özdeğer x vektörü ise özvektör olarak adlandırılır. Eşitlik (3.66)’da bilinmeyen x vektörünün yanısıra bir de bilinmeyen skaler mevcuttur. Her bir ’ya bir x vektörü karşılık gelir. Bu değerleri, özdeğerler ya da karakteristik kök olarak, x vektörleri ise öz vektörler ya da karakteristik vektörler olarak bilinirler. Eşitlik (3.66) homojen yapıda, A I x 0 (3.67) 122 eşitliği ile verilebilir. Eşitlik (3.67) verilen herhangi bir n için eşitlik (3.66)’ya eşittir. Doğrusal denklemlerin çözümü ile ilgili temel bilgilerden, eğer (A-I) matrisi tekil olmayan bir matris ise eşitlik (3.67) için sadece x=0 sonucu elde edilir. Bu çözüm her hangi bir değeri için geçerli olacaktır. Çözüm olarak x=0 vektörünün bulunması doğrusal homojen bir dönüşümü diğer bir deyişle orijini tanımlayan 0 vektörünün kendi içine dönüştürüldüğünü belirtir. Sonuç olarak x=0 bir özvektörü tanımlamaz. Bununla birlikte =0 değerime sahip bir özdeğer olabilir. Problem eşitlik (3.66) ü sağlayan x0 olacak şekilde bir vektörün bulunmasıdır. Eşitlik (3.67) için bir çözümün var olabilmesi ancak ve ancak A-I matrisinin tekil bir matris diğer bir deyişle determinantının sıfıra eşit olması AI 0 (3.68a) durumunda gerçekleşir. Bu determinant değeri skalerine göre bir n-inci dereceden polinom denklemini, pA A I 0 (3.68b) tanımlar. Polinom A matrisinin karakteristik denklemi olarak bilinir ve denklemin kökleri matrisin özdeğerlerini verir. Özdeğerler karakteristik denklemin kökleri olduğundan karakteristik kök olarak da adlandırılırlar. Derecesi n olan bir polinom n adet kök değerine sahiptir. Kök değerlerinin her birinin faklı olması gerekli olmayıp katlı kök bulunabilir. Kökler gerçel ya da karmaşık olabilir. Karakteristik polinom, pA p0 p1 pn1 n1 n 1 2 n (3.69) olup eğer A matrisi gerçel bir matris ise pi değerleri de gerçeldir. Bu nedenle gerçel bir matrisin karmaşık özdeğerleri ancak eşlenik çiftlerde ortaya çıkabilir. Özdeğerlerin hesaplanmasına yardımcı olmak üzere n=3 alınarak, p p0 p1 p2 2 p3 3 1 2 3 polinomu ele alınsın, bu polinom için, verilen 1, 2, 3 sayılarının tanımladığı elemanter simetrik fonksiyonlar, s1 1 2 3 s2 12 13 23 s3 123 2 12 22 32 2 13 23 33 ve kuvvet toplamları, 1 1 2 3 tanımlansın. Polinom açık olarak, p 1 2 2 3 23 p 3 1 2 3 2 12 13 23 123 123 p 3 s1 2 s2 s3 yazıldığında, p0=-s3, p1=s2, p2=-s1, eşitlikleri geçerli olup, s1 1 1 s1 s2 1 2 1 2 2 2 s12 2s2 s3 1 3 1 31 2 2 3 6 3 s13 3s1s2 3s3 özdeşlikleri elde edilir. Eşitliklerden görülebileceği gibi si ve σi değerleri arasında bire bir ilişki vardır. Yukarıda açıklanan yaklaşım benzer yapıda daha yüsek dereceli polinomlara uygulanabilir. Boyutu nn olan bir A matrisinin kk boyutlu alt matrisi n-k sıra ve n-k sütunun silinmesi ile elde edilir. Eğer silinen sıra ve sütun indisleri aynı ise elde edilen alt matris A matrisinin ana alt matrisi olarak adlandırılır. Örneğin 33 boyutlu bir alt matris A matrisinin birinci, üçüncü ve dördüncü sıraları ile birinci, üçüncü ve dördüncü sütunlarından elde edilmiş ise A matrisinin ana alt matrisidir. Eğer seçilen alt matris A matrisinin kuzey batı köşesinde ise ön (leading) ana alt matrisidir. Yukarıda tanımlanan 33 boyutlu ana alt matris ön ana alt matris değildir. 33 boyutlu ana alt matris ilk üç sıra ve sütundan oluşturulur ise ön ana alt matrisi tanımlar. Bir (ön) ana alt n k matrisin determinantı (ön) ana minör olarak adlandırılır. A matrisinin kk boyutlu adet farklı ana minörü vardır. Bunların toplamı M k A ile belirtilsin. Özel durum olarak M1 A tr A ve M n A A . Matrisin karakteristik polinomunun katsayıları ile M k A fonksiyonlarının ilişkisi, pn1 M1 A , pn2 1 M 2 A , 2 , p1 1 n 1 M n1 A , p0 1 M n A n olup eğer A matrisinin özdeğerleri 1,…, n ise, sk 1 , , n M k A k=1,…,n ilişkisi tanımlanabilir. Matrisler ile ilgili önemli özelliklerden ikisi denklik (equivalent) ve benzerliktir (similar). A ve B matrisleri aynı boyutta ve aynı ranka sahipler ise denk matrisler olarak adlandırılırlar. Bu özelliklere ek olarak kare matris iseler benzer matrisler olarak adlandırılırlar. Kısım 3.1 de simetrik matrisler tanımlanmıştı. Doğrusal cebirde önemli bir yer tutan simetrik matrislerin genelde diğer matrislerde bulunmayan bazı özellikleri aşağıda açıklanmıştır: 1- Simetrik matrislerin özdeğerlerinin tümü gerçeldir. 2- Simetrik matrislerin farklı özdeğerlerinin tanımladığı özvektörler ortogonaldir. 3- Simetrik matrislerin özvektörleri bir n uzayı tanımlar. 4- Simetrik matrislerin rankı sıfırdan farklı özdeğerlerin sayısına eşittir. 124 5- Simetrik matrisler ortogonal bir dönüşüm ile köşegenleştirilebilir. Teorem 3.74 Eğer A matrisi simetrik ise özdeğerleri gerçeldir. İspat: Matrisin bir karmaşık özdeğere +i sahip olduğu kabul edilsin. Burada i, - 1 değerini belirtsin. Bu özdeğere karşılık gelen bir özvektör x+iy şeklinde verilsin. Buna göre, Ax iy i x iy yazılabilir. Daha sonra bu denklem gerçel ve izafi bileşenlere, Ax=x-y ve Ay=x-y, ayrılabilir. Birinci denklem yT ve ikinci denklem xT ile soldan çarpılarak, yTAx=yTx-yTy xTAy=xTx+xTy elde edilir. A simetrik bir matris ise, yTAx= xTAy eşitliği sağlanır, (bir skaler kendi transpozuna eşittir). Bu iki denklem birbirinden çıkarılarak, 0 xT x y T y sonucu elde edilir. Özvektörlerin sıfır olmayan, xTx>0 ve/veya yTy>0 bir çözüme sahip olması gerektiğinden, =0 elde edilir. Bunun sonucu olarak da karmaşık bir özdeğer olamayacağı görülmektedir. Özvektörler de y=0 olup, gerçeldir. Örnek 3.11 Aşağıdaki 22 ve 33 boyutlu matrislerin özdeğerlerini bulunuz. 3 5 A 2 4 Çözüm: I 2 A I 2 B 3 5 3 4 B 5 5 3 2 3 5 C 5 7 7 0 0 D 0 3 5 0 5 4 5 3 4 10 1 2 olup özdeğerler 1 ve -2 dir. 4 4 2 3 5 20 1 4 olup denklemin 5 1 2 4 için 2 29 çözümü 1,2 1 2i bulunduğundan özdeğerler karmaşıktır. I 2 C 3 5 5 2 3 7 25 5 29 olup denklemin 7 5 için çözümü 1,2 5 29 çözümü elde edilir. I 3 D 7 3 5 5 4 7 7 2 101 4 olup özdeğerler 7 ve 1 2 7 101 2 dir. Örneklerden görüldüğü gibi simetrik olmayan bir matris (A ve B gibi) için özdeğerler gerçel olmayabilir. Bunula birlikte simetrik matrislerin (C gibi) özdeğerleri daima gerçeldir. 125 Doğrusal cebirde önemli konulardan biri de matrislerin çarpanlara ayrılması ve köşegenleştirilmesidir. Bu konu ile ilgili bazı teoremler aşağıda verilmiştir. Teorem 3.75 Eğer A matrisinin boyutu mn ve rankı r ise, her ikisinin de rankı r olan ve boyutları sırası ile mr ve rn olan B ve C matrisleri için, A=BCT eşitliği sağlanır. Teorem 3.76 Eğer A matrisinin boyutu mn ve rankı r ise, tekil olmayan E ve F matrisleri için, I EAF D r 0 0 0 eşitliği sağlanır. Teorem 3.77 Eğer A gerçel matrisinin boyutu mn rankı n ve Q boyutu mn yarı ortogonal, QTQ=In, matris ve U boyutu nn gerçel pozitif köşegen elemanlı üst üçgen matris olmak üzere, A=QU eşitliği sağlanır. Teorem 3.78 Eğer A matrisinin boyutu nn kare simetrik bir matris ve P ortogonal matris ise, PTAP= eşitliği sağlanır burada bir köşegen matris olup köşegen elemanları A matrisinin özdeğerlerinden P ortogonal matrisi ise bu özdeğerlere ait özvektörlerden oluşur. Teorem 3.79 A matrisinin özdeğerlerinin çarpımı bu matrisin determinantına eşittir, A n i 1 i İspat: Teorem 3.78 ile PTAP= ve Teorem 3.62 ile P T AP A olduğundan, A Λ ve n A 12 n i i 1 ispat tamamlanır. Farklı bir ispat matrisin karakteristik denkleminde, I n A 1 2 =0 alınarak, A 1 n n i 1 n i ve A n i 1 i bulunabilir. Sonuç 3.79.1 Eğer P ortogonal bir matris ise A ile PTAP matrislerinin özdeğerleri özdeştir. Örnek 3.12 A matrisinin, 1 3 0 A 0 1 0 2 1 5 126 karakteristik denklemini, özdeğerlerini, determinantını ve rankını bulunuz. Çözüm: pA I 3 A 1 5 0 ile 1 3 0 0 1 0 2 1 5 1 5 olup karakteristik tanımlanmıştır. Özdeğerler ise 5 ve 1 olup 1 katlı kökdür. denklem pA denkleminde =0 alınarak, pA A 1 A 1 5 5 3 2 ve sonuç olarak, A 5 bulunur. Determinant değeri sıfırdan farklı olduğu için A matrisinin rankı (A)=3. Bir köşegen matrisin determinantı köşegen elemanlarının çarpımına eşit olduğundan köşegen matrislerin kaşegen elemanları aynı zamanda özdeğerlerine eşittir. Benzer bir durum üçgen matrisler için de geçerlidir. Teorem 3.80 Bir A matrisi ancak ve ancak tüm özdeğerleri sıfırdan farklı ise tekil değildir. Eşdeğer olarak A matrisi ancak ve ancak özdeğerlerinden en az biri sıfır ise tekildir. İspat: Eğer boyutu nn olan A matrisinin bir özdeğeri =0 ise, I n A A 1n A 0 ve sonuç olarak A 0 . Teorem 3.81 Simetrik bir A matrisinin rankı, bu matrisin sıfırdan farklı özdeğerlerinin sayısına r eşittir. İspat: Teorem 3.78 ile PTAP=. P matrisi tekil olmadığından, (A)= () olduğu görülebilir. Ayrıca köşegen matristir. Bu nedenle rankı sıfırdan farklı köşegen elemanlarının sayısına eşit olduğundan (A)= ()=r. Teorem 8.60 Eğer A matrisi boyutu nn olan idempotent bir matris ise, r adet özdeğeri 1 ve n-r adet özdeğeri 0 olan, A matrisi için, I T 1 AT r 0 0 0 eşitliğini sağlayan tekil olmayan bir T matrisi vardır. Teorem 8.61 Her hangi bir A idempotent matrisi için, tr A A . İspat: T-1AT=M alınarak Teorem 8.60 ile (A)=(M)=r ve tr(A)=tr(M)=r bulunur. Teorem 8.63 Boyutu nn olan bir A matrisi ancak ve ancak, (A)+(In-A)=n 127 ise idempotent matristir. Teorem 8.64a A ve B aynı boyutlu idempotent matrisler olsun ancak ve ancak AB=BA=0 ise A+B matrisi de idempotenttir. Teorem 8.64b Eğer A+B idempotent ise, (A+B)=(A)+(B). Teorem 8.65 Eğer AB=A ve BA=B ise hem A hem de B idempotent matrislerdir. Teorem 8.66 A matris boyutu nn rankı r olan simetrik idempotent bir matris olsun. A matrisi pozitif yarı tanımlıdır.( Tam ranklı olmayan tüm idempotent matrisler pozitif yarı tanımlıdır.) İspat: A matrisinin tüm özdeğerleri 0 ve1 olduğundan pozitif yarı tanımlıdır. Teorem 8.67 Boyutu nn olan bir kare matris A=(A1 A2) olsun. Eğer (A1)+(A2)=n ve A1A2=0 ise, A1 A1T A1 1 A1T A 2 A T2 A 2 1 A T2 I n eşitliği sağlanır. İspat: İlk olarak, AT A A T A 1T 1 A 2 A1 A1T A 2 A1T A1 A T2 A 2 0 0 A T2 A 2 matrisi ele alınsın. A matrisi tekil olmadığı için (A kare matris olduğundan) ATA matrisi de A1T A1 ve A T2 A 2 matrisleri de tekil değildir. A1 matrisi n1 sütunlu ise A2 matrisi n2=n-n1 sütunludur. Bu durumda (A1)=n1 ve (A2)= n2. Aşağıda ispat için iki yaklaşım verilecektir. İlk yaklaşımda A AT A AT I n alınacaktır. Bu durumda, 1 AT A 1 I n A AT A AT A1A 2 1 1 0 A1 A A2 A2 0 T 2 A1 A1T A1 A1T A2 AT2 A2 AT2 1 1 bulunur. İkinci yaklaşımda ise C1 A1 A1T A1 1 A1T ve C2 A2 AT2 A2 AT2 olup C1 ve C2 1 idempotenttir. Teorem 8.64a ile C1C2=C2C1=0 olduğundan C1+C2 matrisi de idempotenttir ve Teorem 64b ile Teorem 3.82 A matrisinin bir özdeğeri için özvektörü x olsun. Her hangi s ve t skalerleri için, sItA matrisinin özdeğeri olan s-t nın özvektörü, A matrisinin özdeğeri için özvektörü olan x dir. İspat: sI tA x sx t x s t x . Teorem 3.83 Ak matrisinin özdeğerleri, A matrisinin özdeğerlerinin k-ıncı kuvvetine eşittir. Fakat her iki matrisinde özvektörleri aynıdır. 128 İspat: Ak x Ak 1 Ax Ak 1x kx Teorem 3.84 Bir idempotent matrisin her bir özdeğeri sıfır ya da birdir. İspat:Teorem 3.83 kullanılarak A2x= λ2x ve A idempotent bir matris ise, A2x =Ax= λx λ(λ-1)x=0 ve herhangi bir x özvektörü sıfır vektörü olmadığından, λ=0 ya da λ=1 bulunur. Teorem 3.85 A-1 matrisinin özdeğerleri A matrisinin özdeğerlerinin evriğine eşittir. Fakat her iki matrisin özvektörleri aynıdır. İspat: Ax=λx bu eşitlik soldan A-1 ile çarpılarak x=λ A-1x veya A-1x =(1/ λ)x elde edilir. Teorem 3.86 Bir özvektör iki faklı özdeğere ait olamaz. İspat: A matrisinin iki faklı özdeğeri 12 olsun. Bu durumda x0 için Ax=1x ve Ax=2x olup 1x=2x sağlanmalıdır fakat olduğundan 12 bu eşitlik sadece x=0 için sağlanır. Teorem 3.87 A matrisinin farklı özdeğerlerine karşılık gelen özvektörler doğrusal bağımsızdır. Eğer A matrisi simetrik ise özvektörler ortogonaldir. İspat: A matrisinin özvektörlerinin kümesi x1,…,xn ve j özdeğerine karşılık gelen özvektör xj olsun. Birbirine eşit her hangi iki j olmadığı ve bu özvektör kümesinin doğrusal bağımlı olduğu varsayılsın. Özvektörler rn olmak üzere doğrusal bağımsız olanlar x1,…,xr olarak düzenlensin. Bu durumda, j=r+1,…,n olmak üzere, r x j ij x i i 1 r j x j j ij x i (3.70a) i 1 yazılabileceği için, r r i 1 i 1 j x j Ax j ij Ax i ij i x i (3.70b) eşitlikleri elde edilir. Eşitlikler (3.70a) ve (3.70b) kullanılarak, ij i j x i 0 r (3.70c) i 1 bulunur. x1,…,xr vektörleri doğrusal bağımsız olduğundan, eşitlik (3.70c), ij i j 0 i=1,…,r j=r+1,…,n sonucunu verir. Varsayım gereği ij olduğundan tüm i=1,…,r ve j=r+1,…,n için αij=0 ve xr+1=…=xn=0 olmalıdır. Bu ise mümkün değildir çünkü xr+1,…,xn özvektörler olduğundan sıfırdan farklı olmalıdır. Sonuç olarak r=n olup farklı özdeğerlere ait özvektörler doğrusal bağımsızdır. 129 A matrisinin birbirinden farklı iki özdeğeri i vej olsun. Bu durumda, Axi=xi ve Axj=xj koşulunu sağlayan iki özvektör xi ve xj mevcuttur. Sonuç olarak, A matrisi simetrik olduğundan, i x Tj x i x Tj Ax i x Ti A T x j x Ti Ax j i x Ti x j bulunur. ij olduğundan, x Ti x j 0 elde edilir. Teorem 3.88 T-1AT= eşitliğini sağlayan bir T matrisi ancak ve ancak her biri A matrisinin özvektörü olan birbirinden bağımsız n adet vektör kümesi mevcut ise elde edilebilir. Örneğin aşağıda verilen ve temel Jordan bloğu olarak adlandırlan kk boyutlu üst üçgen matris, 0 0 Jk 0 0 1 0 0 1 0 0 0 0 0 0 1 0 sadece bir tane özvektöre x=(1,0,…,0) sahip olup k adet bağımsız özvektörü olmadığından köşegenleştirilemez. Bununla birlikte, 0 0T I k 1 0 T JTk J k ya da J k J k T 0 0 0 I k 1 elde edilebilir. Teorem 3.89 Eğer B=T-1AT eşitliğini sağlayan bir tekil olmayan T matrisi var ise A ve B matrisleri benzer matrislerdir. Benzer matrisler aynı özdeğer kümesine sahiptir. Fakat özvektörler kümesi aynı değildir. İspat: I n B I n T1AT T1 I n A T olduğundan, I n B I n T1AT T1 I n A T I n A aynı özdeğer kümesi sonucu bulunur. Bununla birlikte Ax=x ise B(T-1x)= (T-1x) olup özvektör kümesi aynı değildir. Teorem 3.90 Boyutu nn olan simetrik bir A matrisinin her hangi bir özdeğeri k defa tekrarlanıyor ise bu özdeğere karşılık gelen k adet ortogonal vektör mevcuttur. İspat: Teorem 3.78 ile AP=P eşitliğini sağlayan ortogonal bir P matrisi vardır. k2 olacak şekilde katlı bir özdeğer 1 olsun. Köşegen matris, I Λ 1 k 0 0 Λ2 olarak bölümlensin. Burada köşegen alt matris 2, A matrisinin 1 den farklı n-k adet özdeğerini içerir. P matrisi de yukarıdaki bölümlenmeye uygun olarak P=(P1:P2) bölümlensin. Sonuç olarak, P1T P1 I k , P2T P2 I nk ve P1T P2 0 olduğundan, 130 AP1=1P1 ve AP2=P12 elde edilebilir. P1 matrisi k adet sütuna sahiptir. P1T P1 I k olduğundan P1 matrisinin k adet sütunu doğrusal bağımsız ve ortanormaldir ve AP1=1P1 eşitliği sağlandığından bu sütunların her biri 1 özdeğerinin bir özvektörüdür. Teorem 3.91 n boyutlu simetrik A matrisinin sahip olduğu n adet özdeğerin 1, … ,n hepsinin birbirinden farklı olması gerekli değildir Örnek 3.13 Aşağıda verilen A matrisinin özvektörlerini bulunuz. 4 2 A 2 1 4 Çözüm: Karakteristik denklem A I 2 2 2 (4 ) (1- )-4 2 5 0 1 ve karakteristik kökler, 1=5 ve 2=0olarak elde edilir. 1 için 4 5 2 x1 1 2 x1 2 1 5 x 2 4 x 0 2 2 ve x1 2x2 elde edilir. Sonuç olarak 1=5 için özvektör, x1 2x2 x x 2 2 şeklinde olup görüldüğü gibi özvektörün bir elemanı herhangi bir değeri serbestçe alabilir ve eğer x değeri herhangi bir için bu eşitliğini sağlıyorsa, c bir sabit olmak üzere cx değeri de bu eşitliği sağlar. Elde edilen herhangi bir özdeğere karşılık gelen özvektörler eşsiz olaraktanımlanabilmeleri için normalize edilir. 1=5 için bulunan özvektör normalize edilerek, 2 x1 1 5 5 şeklinde elde edilir. 2=0 için özvektör, 2 x1 4 2 x1 4 0 0 2 1 0 x2 2 1 x2 ve x2 2x1 elde edilir. Sonuç olarak 2=0 için özvektör, x1 x1 x 2 x 1 2 131 bulunur ve normalize edilerek: 1 5 x2 2 5 Farklı özdeğerlere karşılık gelen özvektörler ortogonaldir. Özvektörler bir X matrisi şeklinde, 2 x2 1 X x1 5 5 5 2 5 1 yazılabilir. XTX matrisi ise, 1 0 XT X XXT 0 1 şeklinde elde edilir. Görüldüğü gibi özvektörlerin oluşturduğu matris ortogonal bir matristir. Daha sonra XTAX matrisi, 2 1 5 4 2 2 5 2 5 2 1 1 5 5 1 5 5 5 0 2 5 0 0 1 şeklinde elde edilir. Görüldüğü gibi elde edilen matrisin köşegen elemanları özdeğerleri vermektedir ve matrisin rankı sıfırdan farklı özdeğer sayısına eşittir. Teorem 3.92 Boyutu nn olan simetrik bir A matrisinin özdeğerlerine ait özvektörler n uzayını oluştururlar. Teorem 3.93 Bir A matrisinin köşegen elemanlarının toplamı (izi) özdeğerlerinin toplamına eşittir, n tr A i . i 1 İspat: Kare bir A matrisinin izi, tr (A) a11 a22 ann şeklindedir. mn boyutlu A ve nm boyutlu B matrisleri için Teorem 3.18 ile, tr (AB) tr (BA) eşitliği verilebilir. Teorem 3.78 PT AP Λ kullanılarak, tr (Λ) tr PT AP tr APT P P matrisi ortogonal olduğundan tr()=tr(A) elde edilir. Sonuç olarak, 1 2 n a11 a22 ann ispat sağlanır. Teorem 3.94 Özdeğerleri 1, 2,…, n olan her hangi bir nn boyutlu A matrisi için, 132 tr A k ik n k=1,2,… i 1 Teorem 3.95 Bir simetrik ortogonal matris sadece 1 ve -1 özdeğerlerine sahiptir. Teorem 3.96 Eğer A matrisi tekil ise tekil olmayan bir A+I matrisini tanımlayan bir skaleri daima vardır. İspat: A matrisinin özdeğerleri 1, 2,…, n olsun. A+I matrisinin özdeğerleri i+ olacaktır. Bu nedenle her hangi i için A+I tekil olmayan bir matrisdir. Özellikle eğer i0 olmak üzere en küçük özdeğer i ise A+I matrisi 0, i aralığındaki her hangi bir için tekil olmayan matristir. Teorem 3.97 Her ikisinin de boyutu n1 iki vektör x ve y olsun. xyT matrisinin n-1 adet özdeğeri sıfıra bir tanesi ise yTx değerine eşittir. 3.6 KARESEL FORMLAR VE POZİTİF TANIMLI MATRİSLER Bir satır xT vektörünün bir A matrisi ve sütun x vektörü ile çarpımı xTAx karesel form olarak adlandırılır. Karesel formlar istatistikte ve özellikle varyans analizi teorisinde oldukça sık kullanılırlar. A matrisinin uygun bir seçimi sonucunda varyans analizindeki kareler toplamları xTAx yapısında gösterilebilirler. Örneğin, x Ax x1 T x2 1 2 3 x1 x3 4 7 6 x 2 2 2 5 x 3 x12 4 x2 x1 2 x3 x1 2 x1 x2 7 x22 2 x3 x2 3x1 x3 6 x2 x3 5x32 (3.71a) x12 x1 x2 4 2 x1 x3 2 3 7 x22 x2 x3 2 6 5x32 (3.71b) x12 7 x22 5x32 6 x1 x2 5x1 x3 4 x2 x3 (3.71c) bir karesel formdur ve sonuç bir skaleri tanımladığı için xTAx bir skaler fonksiyondur. xTAx tüm mümkün xi çiftlerinin A matrisinin bir elemanı ile çarpımlarının toplamıdır. Örneğin eşitlik (3.71a) deki 4x2x1 terimi x2x1 çiftinin A matrisinin ikinci sırası ile birinci sütunundaki eleman ile çarpılarak elde edilmiştir. Eşitlik (3.71b) de ise x2x1 teriminin katsayısının A matrisinin iki elemanının, birinci sütun ikinci satırdaki eleman ile ikinci sütun birinci satırdaki eleman, toplamı olduğu görülebilir. Eğer x boyutu n1 olan ve elemanları xi, i=1,…,n ile tanımlanan bir vektör, A ise boyutu nn olan ve elemanları aij, j=1,…,n ile gösterilen bir kare matris ise eşitlik (3.71a) genel olarak, x T Ax xi x j aij i j xi2 aii xi x j aij i i j ve eşitlik (3.71b) ile (3.71c) genel olarak, 133 x T Ax xi2 aii xi x j aij a ji j i i (3.72) şeklinde ifade edilebilir. Eşitlik (3.71c) tekrar ele alınsın, x T Ax x12 7 x22 5x32 6 x1 x2 5x1 x3 4 x2 x3 x12 7 x22 5x32 x1 x2 1 5 x1 x3 1 4 x2 x3 0 4 1 1 1 x 5 7 0 x 4 4 5 T x T Bx elde edilir. Görüldüğü gibi B matrisi A matrisinden farklı olmakla birlikte iki karesel form eşittir. Sonuç olarak xTAx şeklindeki bir karesel formu ifade eden eşsiz bir A matrisi yoktur. Kullanılabilecek pek çok matris vardır. Bu matrislerin köşegen elemanları eşit olup köşegen dışındaki simetrik aij=aji elemanların toplamları eşittir. Örneğin eşitlik (3.71a), 2342 789 1 x Ax x 2336 7 1.37 x 794 2.63 5 T T (3.73a) olarak ifade edilebilir. Eğer eşitlik (3.71b), x T Ax x12 x1 x2 3 3 x1 x3 2.5 2.5 7 x22 x2 x3 2 2 5x32 1 3 2.5 x Ax x 3 7 2 x 2.5 2 5 T T (3.73b) olarak yazılır ise A matrisi simetriktir bu nedenle eşsizdir. Diğer bir deyişle belirli bir karesel form bir simetrik A matrisi için eşsizdir. Simetrik olmayan bir A matrisi için ½(A+AT) simetrik olduğundan karesel form xT[½(A+AT)]x olarak tanımlanabilir. Örneğin eşitlik (3.73a) deki A matrisine ½(A+AT) uygulanarak eşitlik (3.71b) daki simetrik matris elde edilebilir. Simetri nedeni ile aij=aji olduğundan eşitlik (3.72), x T Ax xi2 aii 2 xi x j aij i (3.74) j i olarak tanımlanabilir. Karesel formu eşsiz olarak belirlediği için A matrisinin simetrik olaması önemlidir. Bu nedenle özellikle Bölüm 4 de incelenerek karesel formlar için A matrisinin daima simetrik olmasına dikkat edilecektir. A matrisi nn boyutlu simetrik bir matris ve x vektörü n elemanlı bir sütun vektörü ise karesel formun genel yapısı, 134 xT Ax a11 x12 2a12 x1 x2 2a13 x1 x3 2a1n x1 xn a22 x22 2a23 x2 x3 2a2n x2 xn a33 x32 2a3n x3 xn (3.75) a nn x n2 ifadesi ile verilebilir. Tüm x≠0 sütun vektörleri için eğer xTAx>0 ise karesel form ve A matrisi pozitif tanımlıdır. Eğer tüm x≠0 sütun vektörleri için xTAx0 ise karesel form ve matris pozitif yarı tanımlıdır. Yukarıdaki eşitsizliklerin yönü değiştirilerek negatif tanımlı ve negatif yarı tanımlı karesel form ve matrisler tanımlanabilir. Eğer bir form bazı x vektörleri için pozitif, diğerleri için negatif ise tanımsızdır. Teorem 3.98 Her hangi bir gerçel A matrisi ve tüm gerçel x vektörleri için xTAx=0 eşitliği ancak ve ancak A matrisi çarpık simetrik ise sağlanır. Teorem 3.99 Eğer A ve B matrisleri simetrik ise tüm gerçel x vektörleri için xTAx= xTBx eşitliği ancak ve ancak A=B ise sağlanır. Teorem 3.100 Gerçel simetrik matris A’nın pozitif tanımlı olabilmesi için gerek ve yeter koşul A matrisinin tüm özdeğerlerinin pozitif tanımlı olması gerekir. Pozitif yarı tanımlı bir matrisin özdeğerleri negatif değildir. Teorem 3.101 Gerçel simetrik bir A matrisinin pozitif tanımlı olabilmesi için gerek ve yeter koşul A matrisinin her bir alt matrisinin determinantının pozitif olması gerekir. a11 0 a11 a12 a 21 a 22 0 a11 a12 a1n a 21 a 22 a 2 n a n1 A1 0 A2 0 An 0 a n 2 a nn A 0 Teorem 3.102 Pozitif tanımlı bir matrisin determinantı pozitiftir. Teorem 3.103 Eğer A boyutu nn rankı rn ve pozitif yarı tanımlı matris ise L köşegen elemanlarının r adedi pozitif ve n-r adedi sıfır olan bir alt üçgen matris olmak üzere, A=LTL şeklinde ayrıştırılabilir, (Cholesky ayrışımı). İspat: Teorem 3.77 de verilen A=QU eşitliği nn boyutlu bir A matrisi için nn boyutlu ortogonal bir P matrisi ve nn boyutlu pozitif köşegen elemanlı bir L alt üçgen matrisin var olduğunu belirtir. Bu durumda A=LP olup AAT=LPPTLT=LLT ispat tamamlanır. Teorem 3.104 A matrisi simetrik ve pozitif tanımlı bir matris ise, 135 A=TTT eşitliğini sağlayan tekil olmayan bir T matrisi mevcuttur. İspat: A matrisinin özvektörlerinden oluşan P matrisi kullanılarak Teorem 3.78 ile PTAP= ve A=PPT elde edilebilir. A matrisi pozitif tanımlı ise tüm özdeğerleri pozitiftir. Bu nedenle bir köşegen matris olan matrisi =1/21/2 (3.76a) şeklinde yazılabilir. Burada 1/2 matrisi Λ1 2 1 0 0 0 2 0 0 0 n (3.76b) şeklindedir. Buna uygun olarak, A=P1/21/2PT=( P1/2)( P1/2)T elde edilir. Sonuç olarak, T= P1/2 olduğu görülebilir. T matrisi tekil olmayan matrislerin çarpımı olduğundan tekil olmayan bir matristir. Teorem 3.105 A matrisi boyutu nn ve pozitif yarı tanımlı bir matris ise B2=A eşitliğini sağlayan bir B matrisi vardır. Bu matris A matrisinin karekökü olarak adlandırılır ve A1/2 ile gösterilir. İspat: Teorem 3.78 ile PTAP= ve eşitlik (3.76b) ile 1/2 tanımlanmıştır. Sonuç olarak B=P1/2PT bulunur. B matrisi B2=A eşitliğini sağlayan simetrik pozitif (yarı) tanımlı matristir. Teorem 3.106 B2=A eşitliğini sağlayan pek çok B matrisi vardır. Fakat B=A1/2 eşitliğini sağlayan sadece bir tek pozitif yarı tanımlı B matrisi vardır. Teorem 3.107 A matrisi nn boyutlu ve pozitif tanımlı ve P, nm boyutlu rankı m olan bir matris ise PTAP pozitif tanımlıdır. Teorem 3.108 A matrisi nm boyutlu rankı m olan bir matris ise ATA pozitif, AAT pozitif yarı tanımlıdır. Teorem 3.109 A matrisi nm boyutlu rankı k (k m, k n) olan bir matris ise ATA ve AAT çarpımlarının her ikisi de pozitif yarı tanımlıdır. Teorem 3.110 A ve B pozitif tanımlı matrislerse A-B ve B-1-A-1 matrisleri de pozitif tanımlıdır. Teorem 3.111 A1 ve A2 matrisleri simetrik, A2 pozitif tanımlı matris ve eğer A1-A2 matrisi pozitif yarı tanımlı (veya pozitif tanımlı) ise A1 A2 ’dir. Teorem 3.112 136 Teorem 3.113 Simetrik boyutu nn olan bir A matrisinin özdeğerleri 12…n ise, n x T Ax 1 xT x eşitsizliği sağlanır. İspat: Teorem 3.78 den PTAP= olup, y=PTx doğrusal dönüşümü tanımlansın. n n i 1 i 1 x T Ax x T PΛΛT x y T Λy i y i2 1 y i2 1 y T y 1 x T PP T x 1 x T x Diğer eşitsizlik benzer şekilde elde edilir. xTAx/xTx oranı Rayleigh böleni (quotient) olarak adlandırılır. 3.7 BİR DİKDÖRTGEN MATRİSİN TEKİL DEĞER AYRIŞIMI Kısım 3.5’de verilen özdeğer analizi bir kare matrise uygulanmaktaydı. Bu kısımda özdeğer analizi, tekil değer ayrışımı adı verilen benzer bir ayrışımı geliştirmek için kullanılacaktır. Tekil değer ayrışımı daha sonra anabileşen analizini vermekte kullanılır. X boyutları np olan (n>p) olan bir matris ise XTX pp boyutlu bir simetrik kare matristir. Bu matrisin özdeğerleri ve özvektörlerin tanımladığı Z matrisi kullanılarak, XTX =ZZT (3.77) ifadesi verilebilir. Burada köşegen matris olup elemanları XTX matrisinin özdeğerleridir. Benzer olarak XXT matrisi de simetrik bir kare matristir, fakat boyutu nn’dir. XXT matrisinin rankı en çok p olabileceği için sıfırdan farklı özdeğerlerinin sayısıda en çok p olabilecektir. Elde edilen bu sıfırdan farklı özdeğerler XTX matrisinin özdeğerleri ile aynıdır. XXT matrisi n–p adet sıfıra eşit özdeğere sahiptir. Bu n–p adet özdeğer ve onların özvektörleri aşağıda verildiği şekildedir. XXT matrisi özvektörlerinin matrisi V ile belirtilmektedir. Bu matris XTX ile XXT matrisinin müşterek p adet özdeğerine karşılık gelen özvektörlerden oluşmaktadır. Her bir özvektör vi n1 boyutludur. XXT matrisi için, XXT =VVT (3.78) eşitliği verilebilir. Eşitlik (3.77) ve (3.78) birlikte ele alınarak dikdörtgen matris X, X=V1/2ZT şeklinde yazılabilir. Burada 1/2 matrisi, eşitlik (3.76b) de tanımlanan, XTX matrisinin p adet özdeğerinin pozitif kareköklerinin oluşturduğu köşegen matristir. Buna göre 1/2 1/2= ’dır. Eşitlik (3.78) dikdörtgen X matrisinin tekil değer ayrışımıdır. 1/2 matrisinin elemanları tekil değerlerdir ve V ile Z’deki sütun vektörleri ise sol ve sağ tekil vektörlerdir. D1/2 bir köşegen matris olduğundan, p X 1i 2 v i z Ti i 1 137 şeklindedir. Teorem 3.114 Boyutu mn ve (A)=r>0 olan bir matris A olsun. A=S1/2 TT Eşitliğini sağlayan, boyutu mr ve STS=Ir olan bir S matrisi, boyutu nr ve TTT=Ir olan bir T matrisi ve boyutu rr olup köşegen elemanları pozitif olan bir köşegen matrisi vardır. Tekil değer ayrışımında S ve T matrislerinin elde edilebileceği pek çok yaklaşım vardır. Fakat S ve T matrislerini eşsiz olarak elde etmenin doğru yöntemi, AATS=S eşitliğinden S ve matrislerini belirleyip daha sonra T=ATS-1/2 eşitliğinden T matrisini elde etmektir. Aletrnatif olarak, AATT=T eşitliğinden T ve matrislerini belirleyip daha sonra S=AT-1/2 eşitliğinden S matrisini elde etmektir. 3.8 MATRİSLERDE TÜREV İŞLEMİ Eğer f(b) fonksiyonu k adet farklı bi katsayısını içeriyorsa bu fonksiyonun her bir bi’ye göre kısmi türevi alınabilir. Bu kısmi türevlerin bir sütun vektörü formundaki genel tanımı, f (b) b1 f (b) b f (b) b k (3.79a) şeklindedir. Bu kısmi türevler bir sıra vektörü şeklinde düzenlenebilir. Bu işlemde vektör ve matrislerdeki toplama ve çarpma işlemleri için boyutların uyumlu olması sağlanmalıdır. f(b)’nin bir doğrusal fonksiyon olduğu kabul edilerek, f (b) aT b = a1b1 a2 b2 ak bk yazılabilir. Bu eşitlikteki ai değerleri birer sabittir. Bu ifadeye eşitlik (3.79a)’nin uygulanması ile, a1 a T b b T a a 2 a b b a k (3.79b) sonucu elde edilebilir. Eğer f(b) fonksiyonu bi değerleri açısından karesel ise, f (b) bT A b şeklinde ifade edilebilir. A ile belirtilen matrisin simetrik olduğu kabul edilerek, 138 a11 a A 12 a1k a12 a 22 a2k a1k a 2 k a kk yazılabilir. Bunun sonucu olarak, bT A b a11b12 2a12b1b2 2a13b1b3 2a1k b1bk a22b22 2a23b2 b3 2a2k b2 bk akk bk2 olarak elde edilir. Bu ifadenin kısmi türevleri, (b T A b) 2 (a11b1 a12b2 a1k bk ) 2a1b1 b1 ................................................................................... (b T A b) 2 (a1k b1 a 2 k b2 a kk bk ) 2a k b bk şeklinde bulunur. Eşitliğin en sağındaki ai değerleri A matrisinin sıralarını ifade etmektedir. Bu kısmi türevler bir sütun vektörü olarak, a1 a 1b a a b (b A b) 2 2 2 b 2Ab 2 b a k a k b T (3.80) elde edilebilir. Eşitlik (3.79b) ve (3.80) doğrusal ve karesel formların standart diferansiyel sonuçlarını verir. 3.9 MAKSİMUM – MİNİMUM DEĞERLER ve JAKOBYEN Maksimum ve minimum değerler için bazı önemli sonuçları matris notasyonunda vermek yararlı olacaktır. Bir skaler y değişkeni, n bağımsız değişkenin fonksiyonu olarak, y f x1 , x2 , ,xn f x tanımlanabilir. Bu fonksiyonun toplam diferansiyeli, dy f1dx1 f 2 dx2 f n dxn (3.81) olarak verilir. Burada 139 fi y xi i 1,..., n şeklindedir. dxi, xi’deki herhangi bir değişikliği belirtir. Küçük bir dxi için birinci dereceden diferansiyel y değişkeninde oluşan değişimin yaklaşık bir değerini verir. Kısmi türev vektörü f ve diferansiyel vektörü dx, f1 y f 2 f x fn dx1 dx dx 2 dxn ile belirtilerek y’nin birinci dereceden diferansiyeli dy f T dx ifadesi ile verilebilir. Eğer y değişkeni, x x1 xn x2 noktasında durağan bir değere sahipse x*’ın yakınındaki tüm noktalar için dy=0 olacaktır. Bu noktalarda dx≠0 olacağı için eşitlik (3.81) dikkate alındığında bir durağan değer için gerekli şartın, f=0 olduğu görülmektedir. Başka bir deyişle durağan noktada tüm kısmi türevler sıfırdır. Bir durağan nokta bir maksimum nokta olabilir. Bu durumda x* çevresindeki tüm noktalarda fonksiyonun değeri azalır. İkinci bir durum ise durağan noktanın bir minimum noktası olmasıdır ki bu durumda x* çevresindeki tüm noktalarda fonksiyonun değeri artar. Sonlanarak bir eğer noktası olabilir. Bu durumda x*’dan uzaklaşılan bazı yönlerde fonksiyon azalır diğer yönlerde ise artar. Ortaya çıkabilecek bu muhtemel durumlar arasındaki farkı ayırt edebilmek için ikinci dereceden diferansiyel d2y kullanılır. İkinci dereceden diferansiyel ile toplam diferansiyelin birinci dereceden diferansiyeli bulunabilir. Bu ifade de x* noktasından uzaklaşmanın dy değerinde oluşturduğu değişim için yaklaşım elde edilmesini sağlar. Bir maksimum değer için dy sıfırdan bir negatif değere doğru azalacaktır, bu nedenle d2y negatif bir değer alabilecektir. Buna uygun olarak bir minimum değer için d2y pozitif değer alabilir. Eğer noktası için d2y bazı dx değerleri için pozitif diğerleri için negatif değer alır. Eşitlik (3.81) toplam diferansiyeli, d2 y f1dx1 f 2 dx2 f n dxn dx1 x1 f1dx1 f 2 dx2 f n dxn dx2 x 2 f1dx1 f 2 dx2 f n dxn dxn x n = f11dx12 2 f12dx1dx2 2 f13dx1dx3 2 f1n dx1dxn 140 f 22dx22 2 f 23dx2 dx3 2 f 2n dx2 dxn (3.82) + f nn dx n2 şeklinde elde edilir. Burada, fij f ji 2 y xi x j ifadesi ile verilir. dxi2 ise dxi diferansiyelinin karesidir. Eşitlik (3.82)’den görülebileceği gibi ikinci dereceden diferansiyel dx’in karesel bir formu olarak yazılabilir. Karesel form matrisi ikinci dereceden kısmi türevlerin simetrik Hessien matrisidir. f11 y f 21 F 2 x f n1 2 f12 f 22 fn2 f1n f 2 n f nn sonuç olarak, d 2 y dxT Fdx (3.83) eşitliği yazılabilir. Bu ifadeye uygun olarak F pozitif tanımlı ise d2y pozitif, negatif tanımlı ise negatiftir. Bir x* noktasında maksimum veya minimum mevcut olması için şartlar aşağıda özetlenmiştir. Birinci derece şartı İkinci derece şartı Maksimum f y 0 x F 2 y x 2 negatif tanımlı Minimum f y 0 x F 2 y x 2 pozitif tanımlı Kısıtlı Maksimum veya Minimum; y=f(x1, … ,xn) fonksiyonun durağan değerleri araştırılırken x’lerin bağımsız değişkenler olduğu varsayılmıştı. Bu nedenle n adet keyfi diferansiyel dx1, dx2 ,...., dxn belirlenebilmekteydi. Bununla birlikte bazı problemlerde x’ler bir veya daha kısıta sahip olabilirler ve bu durumda y’nin bir maksimum veya minimumu bu kısıtlar dikkate alınarak bulunmak zorundadır. Fonksiyonun bir tek maksimum veya minimuma sahip olduğu varsayımı ile problem aşağıdaki şekilde ifade edilebilir: Verilen m adet (m<n) kısıt altında y’yi maksimum (minimum) yapan x* vektörünü bulun. y j (x) 0 j 1, , m Kısıt sütun vektörü, 141 y1 x y x y ( x) 2 y m x ve Lagrange çarpanları sütun vektörü, 1 λ 2 m Bu veriler kullanılarak yeni bir amaç fonksiyonu, f x λ T yx (3.84) tanımlanır. değeri ve x’lerden oluşan mn adet değişkenin oluşturduğu bir skalerdir. ’nin durağan bir değeri için birinci derece koşulu tüm mn adet birinci dereceden kısmi türevin, T x f λ (x) x x y x λ 0 (3.85) sıfır olmasıdır. λ T yx 1 y1 x 1 , x 2 ,, x n + 2 y 2 x1 , x 2 ,, x n + m y m x 1 , x 2 ,, x n olup kısmi türevleri, y y y 2 y λ T y (x) m m 1 1 2 x 1 x 1 x 1 x 1 x 1 ............................................................................................. y y y 2 y λ T y (x) m m 1 1 2 x n x n x n x n x n şeklindedir. Bu ifadede, y1 x i y y 2 x x i i y m xi i 1,2, , n olarak verilmiştir. f x , n1 boyutlu bir vektör olduğu için, x λ T y(x) değerinin de n sıralı olacak şekilde düzenlenmesi gereklidir. Kısmi türevler nm boyutlu G matrisi ile, 142 y1 x 1 y1 G x 2 y1 x n y 2 x1 y 2 x 2 y 2 x n y m x1 y m y x 2 x 1 y m x n y x 2 y x n belirtilebilir. Bu durumda f Gλ x x yazılabilir ve durağan bir nokta için birinci derece koşul, f Gλ 0 x y(x) = 0 (3.86) şeklindedir. Eşitlik (3.86)’deki ikinci denklem durağan noktanın kısıtları sağlamasını garanti eder. Maksimum ve minimumu ayırt edebilmek için eşitlik (3.83)’deki karesel formun pozitif mi yoksa negatif mi tanımlı olduğunun araştırılması gereklidir. Fakat bu çalışma sadece kısıtları ihlal etmeyen dx vektörleri için yapılır. j-inci kısıtın, y j x1 , x2 , , xn 0 toplam diferansiyeli, 0 dy j y j x1 dx1 y j x 2 dx2 y j x n dxn olarak verilebilir. Her bir kısıt için benzer bir şart mevcuttur. Bu eşitliği sağlayan dx vektörleri kısıtları ihlal etmez ve bu vektörler, GTdx=0 (3.87) eşitliği ile elde edilebilir. Pek çok durumda F matrisi sabitlerden oluşur, bu matrisin tanımsızlığı herhangi x değerlerinin bağımsızlığı ile oluşturulabilir. 3.10 DOĞRUSAL VE ORTOGONAL DÖNÜŞÜMLER Her ikisi de n boyutlu olan x vektörünün y vektörüne doğrusal dönüşümü (transformasyonu), y=Ax (3.88a) şeklinde yazılabilir. Burada A, nn boyutlu dönüşüm katsayılar matrisidir. Eğer A matrisi tekil değilse dönüşüm birebirdir. Bu durumda y vektörünün x üzerine ters dönüşümü, x=A-1y (3.88b) şeklindedir. Eğer AAT=I ise bu doğrusal dönüşüm ortogonal dönüşümdür. Buna uygun olarak A matrisinin sıraları ortogonaldir ve uzunlukları bir birimdir. Ortogonal dönüşümler vektörler 143 arasındaki uzaklık ve açıları değiştirmez. Başka bir deyişle vektörler arasındaki uzaysal ilişkiler ortogonal dönüşüm ile değişmez. Teorem 3.115 Eğer P matrisi ortogonal ise x vektörünün Px olarak tanımlanan doğrusal dönüşümü x vektörünün uzunluğunu değiştirmez. İspat: Eğer P ortogonal ise PTP=I olduğundan, Px x T P T Px x T x x elde edilerek ispat tamamlanır. Bu ifadenin tersi geçerli değildir. Başka bir deyişle sıfırdan farklı bir x vektörünün uzunluğunu değiştirmeyen her dönüşüm matrisi ortogonal değildir. Örneğin, Q 1 x T x xxT şeklinde tanımlanan bir idempotent matris için Qx=x doğrusal dönüşümünde xTQTQx=xTx olup Q x x eşitliği sağlanır fakat Q matrisi ortogonal değildir. Teorem 3.116 Eğer x vektöründen y vektörüne dönüşüm y=Ax şeklinde tanımlanmış ise ve A tekil olmayan bir matris ise dönüşümün Jacobianı J A 1 olarak tanımlanır. Jacobian, elemanları dyi dx j aij ile tanımlanan A matrisinin tersinin determinantıdır. Eğer A matrisi ortogonal ise J A1 AT 1 olup J 1 sonucu elde edilir. Örnek 3.14 y 1T 3 10 20 ve y T2 6 14 21 vektörleri ile katsayı matrisi, 1 1 1 A 1 0 1 1 2 1 olarak verilmiş olsun doğrusal dönüşümleri elde ediniz. 1 1 1 Çözüm: x1= Ay1= 1 0 1 1 2 1 3 33 10 = 17 20 3 ve 1 1 1 x2= Ay2= 1 0 1 1 2 1 6 41 14 = 15 21 1 olarak y1’in x1’e ve y2’nin x2’ye doğrusal dönüşümü elde edilir. Bunlar ortogonal dönüşümler değildir. Çünkü 144 3 0 0 AA 0 2 0 I 0 0 6 T çarpımı birim matrisi vermemektedir. A matrisinin sıraları ayrık ortogonaldir, köşegen dışı elemanlar sıfırdır, fakat uzunlukları bir birim değildir. Bu dönüşüm her bir sıra kendi uzunluğuna bölünerek ortogonal hale dönüştürülebilir. Bu işlem ile sıraların uzunluğu bir birim olacak şekilde ölçeklenmiş olur. Elde edilen A* matrisi ve ortogonal dönüşüm, 1 3 x1* A * y 1 1 2 1 6 1 3 0 2 6 33 3 3 1 2 y 1 17 2 1 6 3 6 1 ve x *2 41 3 A y 2 15 2 1 6 * olarak bulunur. İki vektör (u ve v) arasındaki uzaklığın karesi, (u-v)T(u-v) şeklindedir. Bu ifadeden faydalanarak orijinal y vektörleri arasındaki ile ortogonal transformasyon sonucu elde edilen x vektörleri arasındaki uzaklığın değişmediği ispatlanabilir: y1 y 2 T y1 y 2 x1 x 2 x1 x 2 26 Bir alt uzay içine bir vektörün izdüşümü dönüşümlerin özel bir durumudur. İzdüşüm EKK’da anahtar bir adımdır, bkz.Bölüm 5. 145