YILDIZ ÜNİVERSİTESİ YAYINLARI Sayı.228 www.ieeeturkiye.wordpress.com adına yüklenmiş olup toplumları geliştiren bilginin herhangi bir şekilde ulaşılaşılamaz olmasını kabullenemeyen kişi veya kişiler tarafından upload edilmiştir.saygılarımzla... İŞARET VE SİSTEM ANALİZİNDE OLASILIK YÖNTEMLERİ Yazanlar: Prof. George R. COOPER Purdue Üniversitesi Öğretim Üyesi Prof. Clare D. McGILLEM Purdue Üniversitesi Öğretim Üyesi Çeviren: Prof. Metin YÜCEL Yıldız Teknik Üniversitesi Öğretim Üyesi ÇEVİRENİN ÖNSÖZÜ Yıldız Üniversitesi’nde, 1978-1979 Öğretim Yılından bu yana, Elektrik Mühendisliği ile Elektronik ve Haberleşme Mühendisliği Bölümlerinde okutmakta olduğum, “Mühendislikte Olasılık” ve Fen Bilimleri Enstitüsü Elektronik ve Haberleşme Mühendisliği Anabilim Dalı, lisansüstü programında verdiğim “Sistem Analizinde Olasılık Yöntemleri” derslerini içermesi ve bu derslerim için temel ders kitabi olarak kullandığım bu mükemmel eseri Türkçemize kazandırmaktan büyük bir mutluluk duymaktayım. Halen Amerika Birleşik Devletlerinin pek çok üniversitesinde okutulmakta olan bu eserin Türkçe’sinin, meslek arkadaşlarıma, öğrencilerime, konuyla ilgilenen mühendislerimize ve bilim adamlarımıza yardımcı olacağını ümit ederken, düzenlemede, daktilo etmede ve diğer pek çok konuda öneri ve eleştirilerini aldığım değerli mesai arkadaşlarıma teşekkürü bir borç bilirim. Kitabın hazırlanması, daktilo edilmesi aşamalarında oluşmuş ve gözden kaçan hataların düzeltilmesi konusunda sayın okurlarımızdan bağışlanmayı diler, değerli eleştirilerini beklerim. Metin YÜCEL Temmuz ,1988 ÖNSÖZ Bu kitap, olasılık teorisi, rasgele işlemeler, ve rasgele girişler için sistem analizine bir giriş sunmaktadır. Öğrencilerin sistem analizi ile ilgili, katlama ve dönüşüm teknikleri gibi genel yöntemleri bildiği düşüncesiyle bu kitap, üçüncü ve dördüncü sınıf mühendislik öğrencileri düzeyine uygun olacak şekilde yazılmıştır. Ayrıca lisansüstü öğrencilerine de, daha önce tanıştıkları oldukça dağınık kaynaklardaki bilgilerin topluca gözden geçirilmesine olanak sağlaması açısından faydalı olacaktır. Bu bir mühendislik kitabi olduğundan, yapılmaya çalışılan, katı bir teoriden çok uygulamaya yöneliktir ve öğrenci, bu kavramların mühendislik problemlerine uygulanmasına ait pek çok örnek bulacaktır. Gene de matematik bazdan tamamen uzaklaşılmamıştır. Hatta, temel konuların birinde uzmanlaşmak isteyen biri, dilediğinde, daha ileri çalışmalar için karşılaşılabilecek güçlüklerden çoğu ortaya konularak gereken önem verilmiştir. Bu eserin yazarları, güç anlaşılır konuların tekrarlanmasının eğitim işlevine en iyi biçimde hizmet ettiğine inanmaktadırlar, bu nedenle, bu kitapta olasılık ve rasgele işleme konularında ilk olmak amaçlanmıştır. Kuşkusuz son olmayacaktır. Kitap çok kapsamlı bulunmayabilir fakat yazarların, mühendislik problemlerinin çözümlerinde en kullanışlı buldukları konular ele alınarak hazırlanmıştır. Bu kitaptaki önemli konuların bazılarının kısaca gözden geçirilmesi, kullanılabilecek çeşitli yolların incelenmesi için bir basamak oIuşturacaktır. Ayrık olasılığın elemanter kavramları Bölüm 1’de öncelikle sezgi yoluyla anlaşılabilmesi bakış açısından bağıl frekans yaklaşımı ve sonra daha teknik bir bakış açısından da aksiyomik yaklaşım tanıtılmıştır. Bütün bu kavramlar, kutulardan siyah ve beyaz toplar seçilmesi gibi alışılmış örnekler yerine, mühendisler için daha anlamlı basit örneklerle sergilenmiştir. Raslantı değişkeni kavramı, Bölüm 2 boyunca, olasılık dağılım ve yoğunluk fonksiyonlari, beklendik değer ve koşullu olasılık kavramları ile sunulmuştur. Bu bölümün kayda değer özelliği, pek çok farklı olasılık yoğunluk fonksiyonunun ve karşılaştırılabilir fiziksel durumların daha kapsamlı incelenmesidir. Bölüm 3’te raslantı değişkeni kavramının iki ve daha çok raslantı değişkeni V ile istatistik bağımsızlık ve ilişki kavramlarının tanıtılmasını içeren bir devamı niteliğindedir. Rasgele işleme ve sınıflandırılmasına ilişkin genel incelemeler Bölüm 4’de verilmiştir. Burada, mühendislik problemlerinin çözümünde kullanışlı olacak olasılık modellerinin seçimi üzerinde durulmuştur. Buna uygun olarak, matematik baza yönelmeksizin çeşitli işleme sınıflandırmalarının fiziksel önemine gereken özen gösterilmiştir. Bu bölümde, sonraki bölümlerde sürecek olan dikkat çekici bir konu, gözlenen örnek fonksiyondan rasgele işlemenin beklendik değerinin kestirimi, uygulama sorunlarıyla verilmiştir. Özilişki ve çaprazilişki fonksiyonlarının özellik ve uygulamaları Bölüm 5’de incelenmiştir. İlişki fonksiyonlarının yapısını ayrıntılı olarak ortaya koymaya yönelik pek çok örnek sunulmuştur. Özilişki fonksiyonu kestiriminin önemi nedeniyle daha ayrıntılı biçimde ele alınmıştır. Bölüm 6’da, Spektral yoğunluk kavramını tanıtmada, rasgele işlemenin frekans domeni gosterilişine geçilmiştir. Spektral yoğunluğu, ilişki fonksiyonunun Fourier dönüşümü olarak tanımlamakla yetinen diğer kitapların aksine, konunun fiziksel önemini de ortaya koymak üzere daha genel bir yaklaşım benimsenmiştir. Bu bölüm eserin en zor bölümüdür, fakat yazarlar, bilgilerin bu biçimi ile verilmesi gerektiğine inanmaktadırlar. Öğreticiler, diledikleri takdirde 6-2 paragrafındaki temel problemlerden bazılarını işlemeyebilirler ve herhangi bir boşluk oluşmasına engel olmak üzere, Spektral yoğunluğun, ilişki fonksiyonlarının Fourier dönüşümü açıklamakla yetinebilirler. Bölüm 7, ilişki fonksiyonları ve spektral yoğunluk kavramlarının, lineer sistemlerin rasgele girişlere cevaplarının analizinde kullanılmasını öngörmektedir. Bir anlamda bu bölüm yapılan bütün çalışmaları toplayan son aşamadır, ve özellikle bu kavramları kullanmak zorunda olan mühendisler için oldukça değerlidir. Bu yüzden, mühendislik problemleri ile ilgili ve gerek duyulan hem gerçekçi ve hem de kullanışlı matematik modeller için gereği vurgulanmak amacıyla oldukça çok örnek içermektedir. Bölüm 8, sistem analizi kavramlarının bir devamı olarak, bir anlamda optimum sistemleri ele almaktadır. Elemanter biçimi ile hem bilinen işaretler için klasik uyumlu filtreler ve hem de rasgele işaretler için Wiener filtresi incelenmiştir. VI Genel olarak her bölüm, öğrencinin bilgisini genişletmesine yol göstermek amacıyla kaynaklar içermektedir. Aynı zamanda Bölümlerin sonlarında, özenle seçilmiş problemler yer almaktadır. Bir başka özellik de, bu eserde incelenen yöntem ve kavramları öğrenme ve kullanmada pek çok paragrafın sonunda alıştırmalar vardır. Öğrenci bu alıştırmaları, okuma ödevlerinin bir parçası olarak değerlendirmeli ve bir sonraki paragrafa geçmeden önce her birini çözmek için çaba göstermelidir. Bu alıştırmaların varlığının, kuşkusuz öğreticinin öğrenciye ödev olarak verecegi ek problemlerin sayısında bir azalma oluşturacağı açıktır. Yazarlar için, meslek arkadaşları ve öğrencilerinden aldıkları teşvik ve yardımları takdirle anmak büyük bir zevk olmuştur. Bu konuda, takdirle anılması gerekenleri liste halinde buraya sığdırmak mümkün olmayacaktır. Ancak adını vermeden geçemedikleri değerli görüş ve önerilerinden yararlandıkları, Prof.J.Y.S.Luh ve P.A.Wintz’e şükranlarını sunarlar. Eserin müsveddelerini sabır ye dikkatle okuyan Prof.James L.Massey’e ve Prof.J.E.Kemmenly’ye sonsuz şükranlarını sunarlar. Ayrıca basım ile ilgili çalışmaları titizlikle yürüten Mr.Lewis A.Thurman’ı takdirle anmak gerekir. Bu arada, ilk notlar olarak bu eseri kullanan ve eleştirilerini gönderen yüzlerce ögrencilerine de teşekkür ederler. Temmuz 1971 George R. COOPER Clare D.McGILLEM VII İÇİNDEKİLER BÖLÜM 1 OLASILIĞA GİRİŞ 1-1 1-2 1-3 1-4 1-5 1-6 1-7 1-8 1-9 1 Olasılığın Mühendislikteki Uygulamaları 1 Olasılığın Tanımı 7 Bağıl Frekans Yaklaşımı 8 Elemanter Set Teorisi 14 Aksiyom Olarak Yaklaşım 21 Koşullu Olasılık 25 Bağımsızlık 31 33 Birleştirilmiş Deneyler Bernoulli Denemeleri 35 Problemler 40 Kaynaklar 42 BÖLÜM 2 RASLANTI DEĞIŞKENLERİ 44 2-1 Raslantı Değişkeni Kavramı 44 2-2 Dağılım Fonksiyonları 47 2-3 Yoğunluk Fonksiyonu 50 2-4 Beklendik Değer ve Momentler 54 59 2-5 Gauss Raslantı Değişkeni 2-6 Gauss ile Bağıntılı Yoğunluk Fonksiyonları 63 2-7 Diğer Olasılık Yoğunluk Fonksiyonları 71 2-8 Koşullu Olasılık Yoğunluk Fonksiyonları 78 2-9 Örnekler ve Uygulamalar 83 Problemler 91 Kaynaklar 95 BÖLÜM 3 İKİ VEYA DAHA ÇOK RASLANTI DEĞİŞKENİ 3-1 İki Raslantı Değişkeni 96 3-2 Koşullu Olasılığa Yeniden Bakış 101 96 VIII 3-3 3-4 3-5 3-6 BÖLÜM 4 4-1 4-2 4-3 4-4 4-5 4-6 BÖLÜM 5 5-1 5-2 5-3 5-4 5-5 5-6 5-7 5-8 5-9 İstatistik Bağımsızlık 106 Raslantı Değişkenleri Arasındaki İlişki 108 İki Raslantı.Değişkeninin Toplamının Yoğunluk Fonksiyonu 112 Karakteristik Fonksiyon 117 Problemler 122 Kaynaklar 124 RASGELE İŞLEME 125 Giriş 125 Sürekli ve Ayrık Rasgele İşleme 126 Tayin Edilebilir ve Tayin Edilemez 128 Rasgele İşleme Durağan ve Durağan Olmayan Rasgele İşleme 129 Ergodik olan ve Ergodik Olmayan 131 Rasgele İşleme İşleme Parametrelerinin Ölçülmesi 132 Problemler 138 Kaynaklar 140 İLİŞKİ FONKSİYONLARI Giriş 141 Örnek: Binary İşlemenin Özilişki Fonksiyonu 145 Özilişki Fonksiyonlarının Özellikleri 148 Özilişki Fonksiyonlarının Ölçümü 151 Özilişki Fonksiyonuna ait örnekler 153 Çapraz İlişki Fonksiyonları 156 Çapraz İlişki Fonksiyonlarının Özellikleri 157 Çapraz İlişki Fonksiyonuna ait Örnek ve Uygulamalar 159 Örneklenmiş Fonksiyon için İlişki Matrisi 163 Problemler 167 Kaynaklar 170 141 IX BÖLÜM 6 6-1 6-2 6-3 6-4 6-5 6-6 6-7 6-8 6-9 6-10 BÖLÜM 7 7-1 7-2 7-3 7-4 7-5 7-6 7-7 7-8 7-9 7-10 SPEKTRAL YOĞUNLUK 171 Giriş 171 Spektral Yoğunluk ve Fourier Dönüşümü Arasındaki Bağıntı 172 Spektral Yoğunluğun Özellikleri 176 Spektral Yoğunluk ve Kompleks Frekans Domeni 182 Spektral Yoğunluğun Karesel Beklendik Değerini Bulmak 184 Spektral Yoğunluğun Özilişki Fonksiyonu ile Bağlantısı 190 Beyaz Gürültü 195 Çapraz Spektral Yoğunluk 197 Spektral Yoğunluğun Ölçülmesi 198 Spektral Yoğunluğa ait örnek ve Uygulamalar 204 Problemler 210 Kaynaklar 213 RASGELE GİRİŞLERE LINEER SİSTEMLERiN CEVABI 214 Giriş 214 Zaman Domeninde Analiz 215 Sistem Çıkışının Beklendik ve Karesel Beklendik Değeri 215 Sistem Çıkışının Özilişki Fonksiyonu 219 Giriş ve Çıkış Arasında Çapraz İlişki 224 Zaman Domeninde Sistem Analizi Örnekleri 226 Frekans Domeninde Analiz 230 Sistem Çıkışında Spektral Yoğunluk 230 Giriş ve Çıkış Arasında Çapraz Spektral Yoğunluk 234 Frekans Domeni Örnekleri 234 Problemler 240 Kaynaklar 244 X BÖLÜM 8 8-1. 8-2 8-3 8-4 8-5 8-6 EKLER EK A A-1 A-2 A-3 A-4 A-5 EK B EK C EK D EK E EK F OPTİMUM LİNEER SİSTEMLER Giriş 245 Optimumluk Ölçütleri 246 Optimum Sistemdeki Kısıtlamalar 247 Parametre ayarlaması ile Optimumlaştırma 248 İşaret- Gürültü Oranını Maksimum Yapan Sistemler 254 Karesel Ortalama Hatayı Minimum Yapan Sistemler 261 Problemler 267 Kaynaklar 268 245 MATEMATIK TABLOLAR 269 Trigonometrik Özdeşlikler 269 Belirsiz İntegraller 270 Belirli İntegraller 271 Fourier Dönüşümü 273 Tek Yanlı Laplace Dönüşümü 275 SIKLIKLA KARŞILAŞILAN OLASILIK DAĞILIMLARI 277 BİNOM KATSAYILARI 282 NORMAL OLASILIK DAĞILIM FONKSIYONU 283 İLİŞKİ FONKSIYONU-SPEKTRAL YOĞUNLUK ÇİFTLERİ TABLOSU 284 ÇEVRİMSEL İNTEGRAL 285 XI ÇEVİRİDE YER ALAN BAZI TERİMLERİN İNGİLİZCE’DEKİ KARŞILIKLARI olasılık : probability koşullu olasılık : conditional probability bileşik olasılık : joint probability karşılıklı seçkin olay : mutually exclusive event tamamlayıcı : complement raslantı değişkeni : random variable olasılık dağılım fonksiyonu : probabilitiy distribution function or cumulative distribution function olasılık yoğunluk fonksiyonu : probability density function : mean value, expected value beklendik değer karesel beklendik değer : mean square value : variance değişinti ilişki : correlation katlama : convolution özilişki : autocorrelation çapraz ilişki : crosscorrelation : process işleme rasgele, raslantı : random, stochastic tayin edilebilir : deterministic durağan : stationary spektral yoğunluk : spectral density kestirim : estimation beyaz gürültü : white noise devrik : reversal www.ieeeturkiye.wordpress.com adına yüklenmiş olup toplumları geliştiren bilginin herhangi bir şekilde ulaşılaşılamaz olmasını kabullenemeyen kişi veya kişiler tarafından upload edilmiştir.saygılarımzla... 1 BÖLÜM 1 OLASILIĞA GİRİŞ 1-1 OLASILIĞIN MÜHENDİSLİKTEKİ UYGULAMALARI Elemanter olasılık teorisine başlamadan önce mühendislik problemlerinin çözümlerinde oldukça elverişli olması nedeniyle bu yolun izlendiğini belirtmek yararlı olacaktır. Bunu iki şekilde açıklamak olasıdır. Bunlardan ilki, olasılığın, evrensel fizik kuralları üzerinde durmaktan çok ve bazen çok daha elverişli bir matematik yol olmasından kaynaklanmıştır, ikincisi ise alışageldiğimiz mühendislik uygulamalarında karşımıza çıkan ve olasılık kavramlarının kullanılmasının kaçınılmaz olduğu pek çok ve farklı durumlardır. Olasılık teorisinin karakteristik özelliği, herhangi şekilde belirsizliğin söz konusu olduğu durumlarla ilgilenmesidir. Olasılıkla bağlantılı en çok sözü edilen olaylar; zar atılması, iskambil destesinden kart çekilmesi, rulet diskinin çevrilmesi gibi durumlardır. Olasılık kurallarının yeterince bilinmemesi nedeni ile buna benzer durumlar oldukça karmaşıklık göstermektedirler. Olasılık teorisine, gerçek yaşamda oldukça az raslanan ve sadece iyi yetişmiş matematikçilerin yaklaşabileceği esrarlı ve gizli bir konu olarak bakılmıştır. Olasılık teorisindeki belirsizliğin dağılmasından sonra bile, bir başka görüş olarak, fiziksel problemlere olasılık’la yaklaşmanın ikinci derecede düşünülmesi gerektiği ve istenen tam sonuç yerine eksik bir bilgi elde edileceği kuşkusunun yer almasından kaynaklanmıştır. Ne var ki bu görüşlerin her ikisi de yanlıştır. Olasılık teorisinin ileri sürülen güçlüğüne bakıldığında, onun sadece, az sayıda temel kavramlarla tam olarak tanımlanabilen herhangi matematik veya analiz dalı kadar belirsiz olduğu söylenebilir. Bundan sonraki açıklamalar olasılık teorisinin temelinin sadece üç aksiyomla yeterlikle tanımlanabileceğini gösterecektir. Bu üç aksiyom ve bunun uygulamaları ile daha ileri kavramlar kolay anlaşılır bir mantık dizisi ile verilmeye çalışılmıştır. 2 Bugünkü eğitim uygulamasında her koşul altında, fizik yasalarını deterministik, değişmez ve kesinlikle doğru kabul eden görüş, tam doğru analiz için olasılık teorisinin kullanılmasıını engelleyen bir tutum olmuştur. Buna göre, dinamik bir sistemin cevabını tanımlayan bir yasa ile, sistemin uyarıcısının tam olarak bilinmesi halinde, cevabın tam doğru olarak elde edileceği kabul edilmektedir. Örneğin Ohm Yasası; V(t)=R.i(t) olarak bilinmektedir. Buna göre t zamanının her değeri için tam doğru olduğu varsayılır. Geniş anlamda (gözle görülen şekli ile) bu varsayım iyi bir tanım sayılmaktadır. Ancak dar anlamda (gözle görülmeyen şekli ile) bu kabul tamamen yanlıştır. Gerçekten eğer bir yüksek kazançlı amplifikatörün girişine büyük bir direnç bağlanması ve meydana gelen gürültünün dinlenmesı ile kolayca görülebilir. Modern fiziğin ve doğa bilgilerimizin ışığı altında, doğal yasaların deterministik ve doğru olduğu görüşü savunulamaz. Bunlar için en iyi açıklama doğal ortalama davranışların belirlenmesi ile sağlanır. Bu ortalama davranışlar pek çok önemli durumda, gerçekten gözlemlenene oldukça yakındır ve bu nedenle meydana gelecek farklılıklar önemli olmamaktadır. Bu gibi hallerde deterministik yasalar oldukça değerlidir. Çünkü sistemin davranışını minimum çaba ile belirtmeye olası kılar. Aynı oranda önemli bir başka nokta da, rasgele farklılıkların bazen deterministik cevaptan daha önemli olması halidir. Bu gibi durumlarda olasılık kavramlarından türetilen analitik yöntemler esastır. Yukarıdaki açıklamalardan, ekseriya doğru cevap olarak bakılan sonuçların tamamen doğru olmadıkları açıkça görülmektedir. Ancak onlara gerçek yaşamda hiç bir zaman karşılaşılmayacak, idealize edilmiş özel yaklaşımlar gözü ile bakılabilir. Diğer yandan olasılık yaklaşımı, doğruluk için zayıf bir yaklaşım olarak düşünülemez ve bir fiziksel gerçeği oldukça yakınlıkla ortaya koyan bir yöntemdir. Daha da ileri giderek bu yaklaşımın deterministik sonuçu da içerdiğini ve bu sonucun onun özel bir hali olduğu söylenebilir. 3 Şimdi mühendislikte karşımıza çıkan ve olasılık kavramlarının kullanılmasını gerektiren durumlarla ilgili sorunlara kısaca değineceğiz. RASGELE GİRİŞ İŞARETLERİ Fiziksel sistemlerin ödevlerini uygunlukla yapabilmeleri için sistemlere bir tür zorlayıcı fonksiyon (giriş işareti) uygulamak gerekir. Giriş işaretleri genellikle öğretim amaçları ya da belirli tip sistem analizleri için uygun ve basit matematik ifadelerle verilir, ancak bunlar gerçek uygulamalarda nadiren karşımıza çıkarlar. Giriş işaretleri genelde bir miktar belirsizlik taşımaktadır, bu özelliği dolayısı ile rasgele işaretler olarak değerlendirilirler. Buna pek çok örnek gösterilebilir. Örneğin bir haberleşme sisteminin giriş işareti olarak ele alınan konuşma ve müzik işaretleri, bir sayısal bilgisayara uygulanan rasgele digitler (0 ve 1 işaretleri), bir uçağın uçuş kontrol sistemine uygulanan rasgele kumanda işaretleri, üretilmiş bir cihazın bazı karakteristiklerinin ölçülmesinden türetilmiş ve bir işlem kontrol sisteminin girişine uygulanmış rasgele işaretler, bir otomobilin gücünün yönlendirilmesinde direksiyonun hareketleri, bir trafik kontrol sisteminde, çeşitli denetim noktalarında geçen araçların sayısı, bir binanın ısıtma ve soğutma sistemine giriş olarak, dış ve iç ısı değişimlerinin etkisi ve buna benzer pek çokları sıralanabilir. RASGELE BOZULMALAR (DISTURBANCES) Pek çok sistem, giriş ve çıkışında arzu edilen işarete ek olarak arzu edilmeyen işaretlerin etki etmesi durumu ile karşı karşıyadır. Bu tip karışmalar hemen hemen daima rasgele bir yapıdadır ve istenen işaretin mevcut olmaması halinde bile olasılık yöntemlerinin kullanılmasını gerektirir. Bozulmaya neden olan bu karışan işaretleri tanıtmada belirli birkaç yöntem sözkonusudur. Bir örnek olmak üzere eğer yüksek kazançlı bir amplifikatorün çıkışı bir hoparlöre bağlanmış ise, dinleyen sık sık cızırtı, hışırtı, vurma sesi gibi sesler duyacaktır. Bu rasgele gürültü, amplifikatör devresindeki iletim elektronlarının ısıl hareketlerinden ya da tüp veya transistörlerden geçen elektron (veya delik)lerin sayısının rasgele degişimlerinden kaynaklanır. 4 Bir kimsenin bu gürültü değerinin her bir zamana karşı gelen niceliğini hesaplayacağının umulmayacağı açıktır. Çünkü bu değer milyarlarca hareketli bağımsız yükün bir arada oluşturduğu etkiyi ifade eder. Buna rağmen, bu gürültü işaretinin ortalama gücünün, frekans spektrumunun ve hatta algılanan gürültü işaretinin belirli bir değerden büyük olabilme olasılığının hesaplanması mümkündür. Pratik uygulamalarda bu büyükler, amplifikatorün kalitesini saptamada, ani dalga şekli hakkında bilgi sahibi olmaktan daha çok önem taşımaktadır. İkinci bir örnek olmak üzere bir radyo ya da televizyon alıcısını ele alalım. Daha önce belirttiğimiz gibi alıcı içinde meydana gelecek gürültüye ilave olarak antene ulaşan rasgele gürültü de etkisini gösterecektir. Bu ilave gürültü genel olarak gökyüzünde oluşan elektriksel deşarjlardan, ve onların antene olan uzaklıklarından, canlıların oluşturduğu etkilerden, uzaydaki radyasyonlardan veya anten çevresini saran cisimlerden yayılan ısıl radyasyonlardan ve yansımalardan kaynaklanır. Bu nedenlerden en iyi alıclar ve amplifikatörler kullanılsa bile algılanan işaretler mutlaka gürültü ile birleşmiş bir yapıda olacaktır. Bu gibi durumlarda da ortalama güç ve frekans spektrumu gibi büyüklüklerin hesaplanması, ani değerlerın hesaplanmasından çok daha elverişli olacaktır. Bir başka örnek de, bir otomatik kontrol sistemine bağlı olarak yönlendirilebilen büyük bir radar anteni olarak verilebilir. Anten üzerine etkiyen rüzgar, rasgele bir kuvvet oluşturur. Bunun kontrol sistemi tarafından kompanse edilmesi gerekmektedir. Kompanzasyon tam yapılmadığı sürece anten yönünde, daima, arzu edilen yöne göre bir farklılık olacaktır. O halde bu farklılığın etkin (effektif) değerinin bilinmesi daha doğrusu hesaplanabilmesi önemli olacaktır. Farklı bir durum da bir uçağın hava akımları fazla olan bir bölgede uçması, bir geminin fırtınalı bir denizde seyretmesi, bir askeri aracın kaba bir arazi üzerinde yol alması gibi olaylar olarak ele alınabileceğidir. Bütün bu durumlarda etkiyen rasgele kuvvetler karmaşık bir mekanik sistem üzerine etki ederler ve sistemin kontrolunda güçlükler yaratırlar. Bu rasgele giriş işaretlerine sistemin nasıl tepki göstereceğinin hesaplanması oldukça önemlidir. 5 RASGELE SİSTEM KARAKTERİSTİKLERİ Sistemin kendisi, bilinmeyen ve zaman içinde rasgele değişken bir karakteristiğe sahip olabilir. Bazi tipik örnekler şunlardır; bir uçağın yükü (yolcu sayısı ve kargo ağırlığı), bu uçuştan diğerine değişirn gösterir, Troposfer haberleşme sisteminde kanal mesafeleri bir andan diğerine değişir. Bir elektrik güç sisteminde yük (kullanılan enerji miktarı rasgele bir değişim gösterir ve bir telefon haberleşme sisteminde telefonarını kullanan abonelerin sayısı an be an değişir. SİSTEM GÜVENİLİRLİĞİ Bütün sistemler pek çok sayıda bağımsız elemanların bir araya gelmesinden oluşmuştur ve bu elemanlardan bir veya birkaçının arızalanması veya tamamen bozulması, sistemin tamamının ya da bir kısmının çalışmamasına sebep olur. Bu tip bozulmaların ne zaman olacağı bilinmez fakat her bir eleman için bozulma zamanı olasılığını hesaplamak genellikle mümkündür ve buradan sistem için ‘ORTALAMA BOZULMA SÜRESİ’ (Mean time to failure) hesaplanabilir. Bu tip güvenirlik çalışmaları olasılıkla çok yakından ilgilidir, ve dizayn mühendisliğinde oldukça büyük önem taşır. Sistemler daha karmaşık yapılara sahip oldukça, daha çok eleman gerektirir ve maliyeti yükselir. Dolayısı ile güvenilirlik sorunlarının çözümü güçleşir ve özel bir önem göstermek gerektirir. KALİTE KONTROLU Sistem güvenirliğini iyileştirmekte önemli bir yöntem her bir bağımsız elemanın kalitesini iyileştirmektir. Bu genellikle muayene işlemi ile sağlanır. Üretimin her aşamasında her bir elemanı ayrı ayrı muayene etmek oldukça masraflıdır. Bu nedenle elemanların muayenesi için rasgele seçilmiş elemanlarla çalışma kuralının geliştirilmesi gerekli olmuştur. Bu kural olasılık kavramlarına dayalıdır ve en az masrafla üretimin kalitesinin korunması amacına uygunlukla hizmet eder. İNFORMASYON TEORİSİ İnformasyon teorisinin ana hedefi, basılı (matbu) sayfaların konuşmanın, resimlerin, grafik ve nümerik bilgilerin veya ısı, uzaklık, hız radyasyon yoğunluğu ile yağmur miktarı gibi fiziksel gözlemlere ait mesajları içeren informasyon için nicel 6 bir ölçme sağlamaktır. Bu nicel ölçme, haberleşme kanallarının, bu informasyonun bir yerden diğerine hem uygunlukla ve hem de yeterli şekilde taşınmasını sağlamak açısından gereklidir. Bu tip mesaj ve gözlemler önceden hemen hemen hiç bilinmediklerinden ve rastgele bir özellik gösterdiklerinden bunları sadece olasılık açısından tanımlama olanağımız vardır. Bu nedenle informasyonun yaklaşık ölçülmesi bir olasılık sorunudur. Biraz daha ileri giderek, haberleşme kanallarının rasgele işaretlerle etkilenmeleri, onların informasyon taşımadaki yeteneklerini sınırlayacağını ve bu nedenle kanalların bu taşıma kapasitelerinin belirlenmesi gerektiğini koşullardaki söylenebilir. Bu sorunun çözümünde gene olasılık kavramlarından hareket etmek gerekecektir. Yukarıda sıralanan olaylardan da görüleceği gibi, hemen hemen bütün mühendislik çalışmalarında bir miktar belirsizlik ya da rastgelelik olduğu görülecektir. Bu durum günümüz mühendisliğinde olasılık kavramlarını temel bir araç olarak kullanmayı gerektirir. Sistem analizi konusunda da, rastgele işaretler ve bozulmaların bazı tanımları gerekmektedir. Rasgele işaretleri matematiksel olarak tanımlamada iki genel yöntem vardır. Bunlardan ilki ve en önemli olanı rasgele büyüklüğün bir olasılık modeli ile karakterize edilmesi sureti ile değerlendirilmesidir. Bu yöntem daha ileride açıklanacaktır. Rasgele işaretlerin olasılık modeli ile tanımları sistem analizinde doğrudan doğruya kullanılamazlar çünkü onlar raslantı değişkenin zamanla nasıl değiştiği ya da onun frekans spektrumunun ne olduğu hakkında oldukça az şey ifade ederler. Ancak sistem analizinde oldukça yaygın şekilde kullanılan, rastgele değişkenlere ait istatiksel özellikleri belirtmede yararlı olurlar. Rasgele sinyallenin istatistik modeller ile karakterize edilmesi durumunda, yaklaşık ortalama değerler setini bilinmesi söz konusudur. Bunlardan bazıları şunlardır; beklendik değer, değişinti, ilişki fonksiyonu, spektrum yoğunluğu vs. Bu ortalama değerler, rasgele bir işareti önceden değindiğimiz olasılık modeli ile belirtme ilkesinden daha az duyarlıkla ortaya koyarlar fakat bu sistem analizi için çok daha elverişlidir. Çünkü bu şekilde sözü edilen büyükler doğrudan ve diğerine göre daha basit yöntemlerle hesaplanabilir. İstatistiksel ortalamalardan bazılarına ilerideki bölümlerde değinilecektir. 7 1-2 OLASILIĞIN TANIMI Elemanter olasılıkla çalışmada en ciddi engellerden biri “olasılık” teriminin yeterli bir tanımına varabilmektir. Gerçekten değişik başarı derecelerine sahip ve halen kullanılan 4 veya 5 farklı olasılık tanımı vardır. Bütün bunlar kavram ve uygulamadaki eksikliklerden kaynaklanmıştır. Biraz şakacı bir yaklaşımla; en başarılı tanımın, olasılık terimini tanımsız bırakmak olduğu söylenebilir. Olasılığa çeşitli yaklaşımlardan iki tanesinin uygun ve kullanışlı olduğu dikkati çeker, bunlar BAĞIL FREKANS YAKLAŞIMI ve AKSİYOM OLARAK YAKLAŞIM’dır. Bağıl frekans yaklaşımı, bazı önemli fiziksel özelliklerle olasılık kavramının bağ kurmasına yol açar ve olasılık kavramları ile gerçek yaşamın ilişkisini mümkün kılar. Bu nedenle olasılığın mühendislik sorunlarına uygulanışı hemen hemen daima bağıl frekans kavramlarına başvurmak sureti ile sağlanır. Herhangi bir mühendis bilinçli olarak bunu gerçeklememiş olsa bile aynı yolu izleyecektir. Bağıl frekans yaklaşımını sınırlayan, onun, fiziksel nedenlerden dolayı analizi oldukça karmaşık durumlar için yaklaşık matematiksel yapıdan sonuç çıkarmak sureti ile kullanılmasının güçlüğüdür. Bu durum bağıl frekans yaklaşımının bu gibi durumla karşılaşıldığında çözüme ışık tutacak daha kolay bir yolun bulunabileceği fikrini verir. Daha kolay yol bizi aksiyom olarak yaklaşıma götürür. Aksiyom olarak yakaşım bir olayın olasılığını belirli postulatları sağlayan bir sayı olarak ele alır, aksi halde tanımsız olduğunu belirtir. Bu sayının gerçek yaşamla ilgili olup olmadığı, postulatlardan çıkarılan matematik bünyedeki gelişmelere bağımlı değildir. Mühendislik, bu yaklaşımı, oldukça yapay ve gerçeklerden kopuk olduğunu ileri sürerek, kabullenmeyebilirler ancak hatırlamaları gerekir ki devre teorisinin tümü temel olarak aynı yolla geliştirilmiştir. Devre teorisi için temel postulatlar hatırlanacağı gibi Kirchhoff Yasaları ve enerji sakımıdır. Aynı matematiksel yapı, soyut sembollerle tanımlanan hangi fiziksel büyüklük olursa olsun vardır. Mühendisin görevi bu matematiksel yapı ile gerçek yaşam arasında bir bağ kurmaktır. Bunun tam doğru olması yerine herkesçe, kabul edilebilir olması yeterlidir ve ancak gerçek sorunların çözümlenmesi amacı ile uygunlukla kullanılabilirliği önemlidir. 8 Yukarıdaki açıklamalardan mühendisler için olasılığa en uygun yaklaşımın iki tane olduğu görülecektir. Bunlar fiziksel gerçekleri basit sonuçlara bağlamada kullanılan bağıl frekans kavramı ile daha karmaşık durumlar için matematiksel yaklaşımları geliştirme amacı ile kullanılan aksiyom olarak yaklaşımdır. Şimdi bunlara ait temeller üzerinde durulacaktır. 1-3 BAĞIL FREKANS YAKLAŞIMI Paragraf başlığından da anlaşılacağı gibi, olasılığa bağlı, frekans yaklaşımı, herhangi belirli bir olayın oluş frekansı ile yakından ilgili olduğunu vurgulamaktadır. OLAY sözcüğü olasılık teorisinin en önemli ana kavramlarından biridir. Olay yapılan bir deneyin olası bütün sonuçlarından herbiri veya onların kombinasyonlarıdır. Örneğin bir madeni para atılması deneyinde sonuç yazı veya turadır. Burada her bir sonuç bir olayı simgeler. Bu kavramları daha yakından inceleme olanağını sağlamak açısıdan DENEY ve OLUŞ terimleri ile tanımak gerekmektedir. Deney için uygun bir tanım olmasına rağmen kavramların daha iyi anlaşılabilmesi için bazı örnekler üzerinde çalışmak daha yararlı olacaktır. Örnekler Tablo 1-1’de verilmiştir. Ancak olası oluşlar deneyi yapanın arzusuna bağlı olarak çeşitli şekillerde tanımlanabilir. DENEY Madeni bir para atılması Tek bir zar atılması İskambil destesinden bir kart çekilmesi Bir gerilimin gözlenmesi Bir gerilimi gözleme Bir gerilimi gözleme OLASI OLUŞLAR Tura ve Yazı 1,2,3,4,5 ye 6 Olası 52 farklı kart Sıfırdan büyük, sıfırdan küçük V’den büyük, V’den küçük V1 ile V2 arasında, V1 ile V2 arasında değil. TABLO 1-1 Bu Tablodaki bütün deneylerin oluş sayıları sonludur. Bu durum incelememizin başlangıç noktasını oluşturur ve Ayrık Olasılık (özel halini)halini belirtir. Bir çok halde sonsuz sayıda oluş karşımıza çıkabilir. Örneğin bir gerilimin gözlenmesinde, gözlenecek muhtemel değerler sürekli olabilir. Bu 9 tip bir olasılık sürekli olasılık adını alır. Ayrık olasılık için var olan bütün yöntem ve terimler sürekli olasılık için de geçerli olduğundan açıklamamızı ayrık olasılık hali için sürdürmek, konuyu daha kolay sunabilmek açısından daha yararlı olacaktır. OLAY; deney yapanın özel isteğine bağlı bir veya daha fazla oluş’tur. Örneğin zar atma deneyinde herbir oluş 1,2,3,4,5,6’dan biri bir olayı ifade edebileceği gibi çift sayıları elde etme, tek sayıları elde etme, 3’ten büyük sayıları elde etme veya daha değişik kombinasyonlar birer olay olarak ele alınabilir. Daha karmaşık deneyleri, daha karmaşık olayların seti olarak genişletmek mümkündür. Örneğin 10 tane madeni parayı atarak değişik ve çok sayıda oluşlar elde etmek bir deneyi belirtebilir ve oluşların her biri bir olay olarak değerlendirilebilir. Örneğin bir mühendislik sorunu olan, 10.000 aboneli bir telefon sisteminde belirli bir zamanda 2000 abonenin birden görüşmesi olağan bir olaydır ve olasılığın bilinmesi istenir. Buna benzer pek çok sayıda olası olaylar olduğu açıktır. Eğer bir deneyin oluşları deney sonuçlanmadan önce belirsiz ise, olası oluşlar, RASGELE OLAYLAR’dır. Bu olayların herbirine, bu olayın olasılığı denilen bir sayı vermek olasıdır. Bu sayı olayın ne kadar olası olduğunun bir ölçüsü olacaktır. Genel olarak bu sayılar varsayımdır. Varsayılan değer deney hakkındaki sezgilerimize bağlıdır. Örneğin eğer madeni bir para atılmışsa biz iki olası oluş bekleriz, bunlar YAZI ve TURA’dır. Bu örnekte iki oluş benzerdir. Bu nedenle bu olaya özgü olmak üzere eşit olasılık varsayılmıştır. Daha önce belirttiğimiz gibi, olasılık, bir olayın oluşmasındaki bağıl frekansla ilgilidir. Bir madeni para atma deneyinde zamanın yarısında tura ve diğer yarısında da yazı geleceği beklenir. Daha genel olarak, eğer bir deney N kez yapılmış ve beklenen A olayı NA kez gerçeklenmiş ise, A olayının olasılığının, Pr(A)= NA/N (1-1) olduğu varsayılır. N deney içinde A olayının NA kez olması gerekmez. Ancak deney hakkındaki önyargımız bu sayıyı kabul 10 etmiştir. Varsayımımızın geçerliliğini, deneyi yapmak ve A olayının meydana geldiği NA sayısını bulmak sureti ile gösterebiliriz. Eğer varsayımımız doğru ise N büyük değerler aldıkça NA/N oranı Pr(A)’ya yaklaşacaktır. Aslında bu bir istatistik problemi olup burada incelenmeyecektir. Olasılığa bağıl frekans yaklaşımı, olasılığın önemli bir takım özelliklerini ortaya koyar. Madem ki NA ve N’in her ikisi de pozitif gerçel sayılardır ve NA ≤ N ‘dir, o halde olasılık 0’dan büyük ve 1’den küçük bir sayıdır. Şimdi bir adım daha ileri giderek, bir deneye ait oluşların A,B,…….,M olduğunu varsayalım ve bu deney sonucunda bu oluşlardan sadece biri meydana gelsin (yani olayımız olsun). Bir deneyde çeşitli oluşlardan sadece bir tanesi meydana gelebiliyorsa bu tip sorunlardaki bütün olayların her biri KARŞILIKLI SEÇKİN (Mutually Exclusive) olaylar adını alır. (Örnek olarak 6 yüzlü bir zar düşünelim. Her bir deney sonucu 6 olası yüzden birini göreceğiz, iki yüzü aynı bir anda görme olasılığı yoktur). Eğer N deney içinde A olayı NA kez, B olayı NB kez ve……..M olayı NM kez olmuş ise, NA + NB + NC + … + NM = N ve dolayısı ile olacaktır. NA / N + NB/N + NC/N +…+ NM/N = 1 Bu bağıntı bize Pr(A) + Pr(B) + Pr(C) + …+Pr(M) = 1 (1.2) olduğunu göstermektedir. Buradan şunu söyleyebiliriz. Verilen bir deneyde bütünleşmiş tüm karşılıklı seçkin olayların ayrı ayrı olasılıklarının toplamı bire eşittir. Bu kavramlar aşağıdaki 4 temel madde ile özetlenebilir. 1. 0 ≤ Pr(A) ≤ 1. 2. Karşılıklı seçkin olayların tam seti için Pr(A) + Pr(B) + Pr(C) +…+ Pr(M) = 1 3. Olası olmayan bir olayin olasılığı Pr(A)=0 4. Gerçek bir olayın olasılığı Pr (A) = 1 11 Konuyu daha kolay anlaşılabilir hale getirmek üzere çalışmalarımızı bir örnek üzerinde sürdürelim. İçinde tamamen karışık halde çeşitli değerlerde dirençler bulunan bir büyük kutu olduğunu varsayalım ve örneğin kutu içinde 100 adet 1 Ω ’luk, 500 adet 10 Ω ’luk 150 adet 100 Ω ’luk ve 250 adet de 1000 Ω ’luk direnç olsun. Birisi kutuya elini sokup rastgele bir direnç alsın. Alınan bu direnç, değeri bakımından 4 oluştan oluşur. Şimdi bu oluşların herbirinin bir olay olarak değerlendirilmesi sureti ile bu olaylara ait olasılıkları inceleyelim, Pr (1 Ω ) =100/1000 = 0.1 Pr (100 Ω ) = 150/1000= 0.15 Pr (10 Ω ) =500/1000 = 0.5 Pr (1000 Ω ) =250/1000= 0.25 Burada her birinin pozitif, 1’den küçük ve toplamlarının 1’e eşit olduğu kolayca görülmektedir, çoğu kez ilgilenilen, bir defada birden fazla oluşun söz konusu olduğu durumlardır. Örneğin eğer bir madeni para iki kez atılırsa her iki atışta da tura gelmesi olayının olasılığı hesaplanmak istenebilir. Bu tip bir olasılık BİLEŞİK OLASILIK (Joint Probability) adını alır. Bileşik olasılık Pr (A,B) notasyonu ile gösterilir ve olayların birleşik olduğunu belirtir. Gene önceki örneğimize benzer bir örnek üzerinde açıklamalarımızı sürdürelim. Gene bir kutu değişik değerlerde direnç söz konusu olsun ve bunun yanında da dirençlerin farklı güç değerleri olduğunu varsayalım. Kutudaki dirençlerin değerleri ve güçlerinin tablo 1-2’de gösterildiği şekilde dağılmış olduğu kabul edilmiş olsun. Direnç Güç 1W 2W 5W Toplam 1Ω 50 50 0 100 10 Ω 300 50 150 500 Değerleri 100 Ω 90 0 60 150 1000 Ω 0 100 150 250 toplam 440 200 360 1000 12 Bu örnekte bileşik olasılığı anlatmadan önce, seçilen bir direncin sadece güç değerlerine göre olan ve daha önce değerlerine göre hesapladığımız BASİT OLASILIKLARINI (Marginal Probability) hesaplamaya çalışalım. Pr (1 W ) = 440/1000=0,44 Pr ( 5 W ) = 360/1000== 0,36 Pr ( 2W ) = 200/1000= 0,20 . Şimdi 5 Watt gücünde 10 Ω ’luk bir direncin çekilebilme olasılığını (birleşik olasılık) hesaplamaya çalışalım. Tablodan görüleceği gibi bu özelliğe sahip 150 adet direnç mevcuttur. O halde Pr (10 Ω , 5 W) =150/1000 = 0,15 Geri kalan 11 bileşik olasılık aynı yolla hesaplanabilir. Bu bileşik olasılıklardan bazılarının örneğin Pr (1 Ω , 5W), Pr (100 Ω , 2W), Pr (1000 Ω , 1W), sıfıra eşit olacağı görülmektedir. Bu aşamada bileşik olasılık, basit olasılıklar arasında bir ilişki kurulması gerekmektedir. Hatırlanacağı. gibi bir madeni paranın iki kez atılması deneyinde olası oluşlar TT,TY, YT,YY’dir. Bu deneyde iki kez tura gelme olasılığı; Pr (T,T) = Pr (T) Pr (T) = ½ x ½ =1/4 yazılabilir. Burada iki basit olasılığın çarpımı bize sonucu vermiştir. Ancak bu örnek dirençle dolu kutu örneği için geçerli değildir. Hatırlanacağı gibi Pr (5 W) =360/1000=0,36 ayrıca Pr (10 Ω ) = 0.5 olmaktadır. Demek ki bu örnek için basit olasılıkların çarpımı bileşik olasılığa eşit değildir. Pr(10 Ω ) . Pr(5W) = 0.5 x 0.36 = 0.18 ≠ Pr (10 Ω , 5W) = 0.15 Bu noktada, açıklık için yeni bir olasılık kavramı tanımlamak gerekmektedir. Bu KOŞULLU OLASILIK (Conditional Probability) adını alır, “sonuçlanmış bir B olayına göre A olayının olasılığı” olarak tanımlanır ve Pr(A/B) ile gösterilir. 13 Gene bunu bir örnek üzerinde açıklamaya çalışalım, 5 Watt gücünde olma koşulu ile 10 Ω ’luk bir direncin seçilme olasılığını düşünelim. Bu 5 Watt koşulunu sağlayan 360 dirençten 150 tanesidir. Yani Pr (10 Ω |5 W) =150/360 = 0.417 Şimdi de Pr(10 Ω I 5W) değerini 5 Watt’lık dirençler için daha önce hesapladığımız Pr (5 Watt) = 0,36 basit olasılıkla çarpalım; Pr (10 Ω | 5 W) Pr (5 W) = 0.417 x 0.36 = 0.15 = Pr (10 Ω , 5 W) Bu çarpımın bize bileşik olasılığı verdiği görülmektedir. Aynı sonuç, Pr (5 W| 10 Ω ) =150/500 = 0.30 hesaplanacak olursa da görülecektir. Pr (5 W|10 Ω ) Pr (10 Ω ) = 0.30 x 0.5 = Pr (10 Ω ,5 W) (1-3) ve gene çarpım bileşik olasılıktır. Bu bilgilerin ışığı altında bileşik olasılık genel bir eşitlik ile özetlenebilir ve Pr (A, B) = Pr (A | B) Pr (B)= Pr (B | A) Pr (A) (1-4) İki olayın bileşik olasılığı; birinci olayın basit olasılığı ile birinciye göre ikinci olayın koşullu olasılığının çarpımı ile ifade edilir. Şimdi yeniden iki madeni para atma deneyine dönelim ve iki tura gelme halini ele alalım. Pr(T,T) = Pr(T).Pr(T) yazmıştık. Bu ifade bu örnek için gerçekten doğrudur. Çünkü parayı ilk attığımızda meydana gelen olay, paranın ikinci atışta meydana getirecegi olayı etkilemez. Bu tip olaylara İSTATİSTİK OLARAK BAĞIMSIZ olaylar (Statistically Independent) adı verilir ve ancak Pr (A | B) = Pr ( A) ve Pr (B | A) = Pr (B) ise doğrudur. Bu ifadeler, A olayının olasılığını, B olayının olmuş veya olmamış olması halinden bağımsızlığını vurgulamaktadır. Daha iyi bir ifade ile sadece ve sadece Pr (A,B) = Pr (A) Pr (B) (1-5) 14 koşulunu sağlayan olaylara istatistik olarak bağımsız olaylar adı verilir. Şimdiye kadar incelenen paragraflarla ayrık olasılığın birçok temel kavramına ait kısa bir özet matematik kanıtlara başvurulmaksızın anlaşılır biçimde sunulmuş, bağıl frekans kavramlarına ait bütün olasılıklar belirli sayısal örnekler yardımı ile formülleştirilmeye çalışılmıştır. Bu örneklerden (bağıl frekans yaklaşımı kullanmak sureti ile) çok karmaşık olmayan fiziksel durumlar söz konusu olduğunda, çeşitli olayların olasılıklarının sayılarla belirtebilmenin güç olmayacağı açıktır. Ancak, bir deneyin olası pek çok oluşu olduğunda ve olayları tanımlamada farklı ve çok sayıda yollar bulunması halinde, bu tür yaklaşımın uygulanmasındaki güçlükler de açıkça görülecektir. Bu durumun özellikle, ayrık haldeki sonuçları sürekli hale geçmek için geliştirmeye yöneldiğimizde doğruluğunu görürüz. Bu sebeple, yukarıda incelediğimiz bütün düşünüşleri, daha incelikle ve bundan sonraki incelemeler için daha sağlam bir dayanak temin eden matematik baza oturtmak sureti ile yeniden gözden geçirmek gereklidir. ALIŞTIRMA 1-3 On adet transistordan oluşan bir grupta iki tane bozuk transistor olduğu bilinmektedir. Gruptan bir transistor seçilip ölçülüyor ve sonra ikinci bir transistor seçilip ölçülüyor. a- Her ikisinin de sağlam olma b- İkincisinin bozuk olma c- Her ikisinin de bozuk olma olasılıklarını bulunuz. 1 - 4 ELEMANTER SET TEORİSİ 1-3 Paragrafında öğrendiklerimizi daha iyi biçimde formüle etmek, bu paragrafta tanıştığımız bilgileri aksiyom olarak yaklaşımın çerçevesi içinde değerlendirmek olacaktır. Ancak bunu gerçeklemek üzere öncelikle elemanter set teorisine ait kavramların kısa bir tekrarı gereklidir. SET: eleman olarak adlandırılan şeylerin (obje) bir topluluğudur. (Küme) 15 A = { α 1 , α 2 ,..., α n } (1-6) olarak gösterilir. Burada A seti ve α 1 , α 2 ,..., α n de bu sete ait elemanları belirtir. Örneğin bir A seti 1’den 6’ya kadar olan tam sayılardan meydana gelmiş olabilir. (A={1,2,3,4,5,6}). Burada α 1 = 1, α 2 = 2,..., α 6 = 6 elemanlardır. ALT SET: Bir A setinin elemanlarından birini, bir kaçını ya da hepsini içeren setlere A setinin alt setleri adı verilir, Örneğin yukarıdaki örnek için B = {1,2,3}, C = {1}, D = {1,2,3,4,5,6} A setinin birer alt setidir. Bir B setinin, A’nın bir alt seti olduğunu ifadede B ⊂ A notasyonu kullanılır. Ayrıca her setin kendisinin alt seti olduğunu belirtelim. Olasılık teorisinin ilgilendiği her set, S ile göstereceğimiz ve uzay seti olarak adlandırılan büyük bir setin elemanlarıdır. O halde bütün setler uzay setinin alt setleridir. Olasılık teorisinin uzay seti; bir deneyin tüm oluşlarını eleman kabul eden sete verilen addır. Örneğin bir zar atma deneyi için uzay seti S = {1,2,3,4,5,6} 1,2,3,4,5,6 sayıları bize zarın yüzlerinde bulunan numaraları belirtir. BOŞ SET: İçinde hiç bir eleman bulunmayan sete boş set adı verilir ve 0 ile ifade edilir. Bir S={1,2,3,4,5,6} setinde 26 = 64 alt set vardır. Bunlar, ∅,{1},...,{6},{1,2},{1,3},...,{5,6},{1,2,3},..., S Genel olarak bir S uzay seti (veya herhangi bir set) n elemana sahipse 2n alt set söz konusudur. Set teorisinin grafik açıklamasında Venn diyagramlarının kullanılması kolay anlaşılmayı sağlar. 16 Bu diyagramlarda S bir dik dörtgenle ve alt setler ise bu dikdörtgenler içinde kapalı döngülerle gösterilmiştir. Şekil 1-1’de bir Venn diyagramı gösterilmiştir. Burada B seti A’nın bir alt seti, C seti de B’nin (ve dolayısı ile A’nın) bir alt setidir. EŞiTLiK: A ve B setleri birbirine sadece ve sadece A setindeki her elemanın B setindeki her elemana eşit olması halinde eşittir. Sadece ve sadece A⊂ B B⊂A ise A = B Kolayca anlaşılabildiğinden Venn diyagramı gösterilmemiştir. TOPLAM-BİRLEŞİM: İki setin toplamı A ikisinin de elemanlarından oluşan bir gösterilmiştir. Birleşim yasası (associative ikiden fazla setin toplanması sonucu yazılabilir. setinin ve B setinin her settir. Bu şekil 1-2’de law) geçerli olduğundan, parantez kullanılmadan (A + B) + C =A + (B + C) =A+ B + C 17 Değişim (commutative) yasası da geçerli olduğundan, A+B=B+A A+A=A A+φ =A A+S=S A + B = A, B ⊂ A ise ÇARPIM-KESİŞİM: İki setin çarpımı, her iki sete ait ortak elemanların oluşturduğu bir settir. AB ile gösterilir ve Şekil 1-3’de gösterilmiştir. 18 Venn diyagramının incelenmesinden, AB = BA AA = A Aφ = φ AS = A AB = B, B ⊂ A Eğer çarpımda ikiden fazla set söz konusu ise, buna ait Venn diyagramı Şekil 1-4’de gösterilmiştir. ŞEKİL 1-4: Üç Setin Çarpımı Buradan görüldüğü gibi (AB)C = A(BC) = ABC A(B + C) = (AB) + (AC) Eğer AB = φ ise A ve B setleri karşılıklı seçkin (bileşik olmayan) setlerdir. Bu tip setler Venn diyagramında birbirini kesmeyen döngülerle tanıtılabilirler. 19 TAMAMLAYICI (COMPLEMENT, INVERSE): Bir A setinin tamamlayıcısı A setinin elemanlarını taşımayan S setidir ve A ile gösterilir. Buna ait Venn diyagramı Şekil 1-5’de gösterilmiştir. ŞEKİL 1-5: A Setinin Tamamlayıcısı Şekilden de görüleceği gibi, ∅=S S =∅ (A) = A A+ A = S AA = ∅ A ⊂ B, A = B, B ⊂ A ise A = B ise Buna ilave olarak genellikle başvurulan De Morgan Yasası da, ______ ( A + B) = A B ____ ( AB) = A + B olarak verilmiştir. 20 ÇIKARMA-FARK: İki setin A-B farkı içinde B’nin elemanlarının bulunmadığı A seti elemanlarının oluşturduğu settir. Bu şekil 1-6’da gösterilmiştir. Fark A - B = A B = A – AB olarak da tanımlanabilir. (A-B) notasyonu ekseriya içinden B alınmış A olarak okunur. Venn diyagramından aşağıdaki ifadeler kolayca yazılabilir. ( A − B) + B ≠ A ( A + A) − A = ∅ A + ( A − A) = A A−∅ = A A−S = ∅ S−A= A Bir çıkarma (fark) işlemini içeren çalışmalarda parantezin kaldırılmamasına dikkat edilmelidir. Yukarıdaki işlemleri sayısal örnekler üzerinde göstermek yararlı olacaktır. Bunu yapmak üzere S setinin 1’den 6’ya kadar tam sayılardan oluştuğunu kabul edelim. S ={1,2,3,4,5,6} 21 Bunun yanı sıra tanımlayalım. A= {2,4,6}, B = {1,2,3,4}, C = {1,3,5} setlerini Biraz evvel sunduğumuz tanımlardan (A + B) = {1,2,3,4,6}, (B + C) = {1,2,3,4,5} A + B + C = {1,2,3,4,5,6} = S = A + C AB = {2,4}, BC = {1,3}, AC= ∅ ABC = ∅ , A = {1,3,5} = C, B = {5,6} C = {2,4,6} = A, A - B ={6},B- A = {1,3} A - C = {2,4,6} = A, C - A = {1,3,5} = C, B - C = {2,4} C - B = {5}, (A - B) + B = {1,2,3,4,6} oldukları kolayca görülecektir. 1-5 AKSİYOM OLARAK YAKLAŞIM Şimdi, kısaca özetlediğimiz set kavramları ile olasılık teorisinin ilişkisini ortaya koymak gerekmektedir. Bu ilişki, elemanları bir deneyin bütün oluşları (olası tüm oluşlar seti) olan ve OLASILIK UZAYI adı verilen setin tanımlanması ile açıklanabilir. Örneğin bir deney yapıcı olası oluşlar olarak bir zarın altı yüzünü seçmiş ise, zar atma deneyi ile bütünleşmiş olasılık uzayı; S = {1,2,3,4,5,6} seti olacaktır. S olasılık uzayının çeşitli alt setleri olaylar olarak tanımlanabilir. Örneğin zar atılması deneyinde 2 olayı, 2 oluşunun 22 elde edilmesine (zarın atılması sonucu 2 gelmesine), 1,2,3 olayı da 1,2, ve 3 oluşlarından herhangi birinin elde edilmesine karşı gelir. Her bir deneyde en az bir oluş elde edildiğinden S (olasılık uzayı) gerçek bir olaya ve (boş set) de olası olmayan bir olaya karşı gelir. Tek bir elemandan oluşan bir olay elemanter olay adını alır. İkinci olarak, daha önce değindiğimiz gibi, her bir olaya, OLAYIN OLASILIĞI adı verilen bir sayı verilmiştir. Eğer olay A olarak verilmiş ise A olayının olasılığı Pr (A) olarak ifade edilir. Verilen bu sayı (sayısal değer) aşağıdaki üç koşulu (AKSİYOMLARI) sağlamak zorundadır. Eğer AB = ∅ ise (1-7) (1-8) (1-9) Pr( A) ≥ 0 Pr( S ) = 0 Pr (A + B) = Pr (A) + Pr (B) Olasılığın tüm yapısı bu aksiyomlardan elde edilebilir. Bu aksiyomlar birer postulat olup bunları ispatlamaya çalışmanın anlamsız olduğunu belirtelim. Bunların geçerlilikleri için olası tek test, teori sonuçlarının gerçek yaşama uygun olup olmadığıdır. Herhangi fizik teorisi için de aynı şeyler geçerlidir. Çok sayıda önermenin sonuçları bu aksiyomlardan elde edilebilir ve burada bir kaç tanesi verilmeye çalışılmıştır. İlk olarak, madem ki, S∅ = ∅ ve S + ∅ = S ‘dir. O halde 1-9 eşitliğinden Pr( S + ∅) = Pr( S ) = Pr( S ) + Pr(∅) yazılabilir. Buradan, Pr(∅) = 0 olduğu bulunur. İkinci olarak madem ki, AA = ∅ ve A + A = S ‘dir. O halde 1-9 eşitliğinden, Pr( A + A ) = Pr( A) + Pr( A ) = Pr( S ) = 1 (1-10) (1-11) elde edilir. 1-11 ve 1-7 eşitliklerinden Pr( A) = 1 − Pr( A ) ≤ 1 (1-12) 23 bulunur. Bu nedenle, bir olayın olasılığı 0 ile 1 arasında olması gereken bir sayıdır. Eğer A ve B olayları karşılıklı seçkin değiller ise, 1-9 eşitliği geçerli değildir. Mamafih daha genel bir sonuç elde edilebilir. Şekil 1-3’deki Venn diyagramından açıkça görüleceği gibi, A+B=A+ AB yazılabilir ve A ile uygulanması ile A B karşılıklı seçkindirler. 1-9 eşitliğinin Pr (A + B) = Pr (A + A B) = Pr (A) + Pr A B) yazılabilir. Aynı şeklin incelenmesi ile B = AB + A B olduğu ve AB ile A B ‘nin karşılıklı seçkinliği açıkça görülecektir. Gene 1-9 eşitliği yardımı ile, Pr (B) = Pr (AB + A B) = Pr (AB) + Pr ( A B) (1-13) elde edilir. Son bulunan Pr(A+B) ifadesi ile 1-13 eşitliğinden Pr( A B)’ler yok edilirse, Pr (A + B) = Pr (A) + Pr (B) - Pr (AB) ≤ Pr (A) + Pr (B) (1-14) elde edilir ki bu da aranan sonuçtur. Bu aşamada, aksiyom olarak yaklaşımın geçerliliğini ortaya koyabilmek üzere, olasılık uzayı yapısını da gösteren örnek problemler vermek yararlı olacaktır. İlk olarak, olasılık uzayı, S={1,2,3,4,5,6} olan tek bir zarın atılması durumunu ele alalım. Burada elemanter olaylar zarın gelmesi olası üst yüzeyleri ile bağlantılı tamsayılardır ve bunların karşılıklı seçkin olaylar oldukları açıktır. Eğer bu elemanter olayların olasılıkları eş varsayılırsa, herhangi biri için olasılık yalnızca, Pr(α i ) = 1 , 6 α i = 1,2,...,6 olacaktır. 24 Bu varsayımın bağıl frekans yaklaşımından kaynaklandığını, ancak aksiyom olarak yaklaşımın çatısında yalnızca bir önerme olduğunu ve buna benzer pekçok varsayımın daha yapılabileceğini belirtelim. Şimdi aynı olasılık uzayı için A = {1,3} = {1} + {3} olayını ele alalım. 19 eşitliğinden, Pr (A) = Pr {1} + Pr {3} = 1/6+1/6 = 1/3 elde edilir ve bu da zarın bir kez atılması deneyinde, 1 ve 3 oluşlarından herhangi birinin gerçeklenebilme olasılığını gösterir. A={1,3} ve B = {3,5} olması halinde Pr(A+B)’nin hesaplanması arzu edilirse daha karmaşık bir durumla karşılaşılır. A ve B karşılıklı seçkin olmadıklarından, 1-14 eşitliğinin kullanılma gereksinimi vardır. Yukarıdaki örnekten de açıkça görüleceği gibi Pr(A) = Pr(B) = 1/3’tür. Ancak AB = {3} olduğundan Pr(AB)= 1/6’ ya eşittir. O halde 1-14 eşitliğinden, Pr (A+B) = Pr (A) + Pr (B) - Pr (AB) = 1/3 + 1/3 - 1/6 = ½ olur. Aynı probleme değişik bir açıdan da yaklaşım yapılmak sureti ile aynı sonuca varılabilirdi. Şöyle ki; A+B ={1,3,5} olup, üç karşılıklı seçkin elemanter olaydan oluştuğuna göre, 1-9 eşitliği yardımı ile Pr(A+B) = Pr{1} + Pr{3} + Pr{5} = 1/6+1/6+1/6 = ½ bulunurdu. Bu sonucun; hem A olmasının, hem B olmasının hem de her ikisinin olmasının olasılığı olarak anlamlandırılabileceğini belirtelim. ALIŞTIRMA 1-5 Altı yüzlü bir zarın olasılık uzayı için olaylar, A = {1}, sayılar}, C = {çift sayılar} olarak verilmiştir. B = {tek 25 a - Pr(A + B)’yi b - Pr( AB )’yi c - Pr(A + C)’yi d - Pr( BC )’yi hesaplayınız . 1-6 KOŞULLU OLASILIK Bir olayın meydana geldiği kesinleşmiş olduğunda, diğer bir olayın, bağıl frekans yaklaşımı ilkesine dayalı olarak koşullu olasılığı 1-3 paragrafında tanıtılmıştı. Aksiyom olarak yaklaşımda koşullu olasılık tanımlanmış bir niceliktir. Eğer bir B olayı, sıfırdan farklı bir olasılığa sahip ise, o halde B’ye göre A olayının koşullu olasılığı Pr( AB ) , Pr( B ) > 0 (1-15) Pr( B ) olarak tanımlanır. Burada Pr(AB), AB olayının olasılığıdır. Daha önceki incelemelerimizde 1-15 eşitliğinin payı Pr(A,B) olarak yazılmış ve A ve B olaylarının bileşik olasılığı olarak adlandırılmıştı. Bu değerlendirme, eğer A ve B olayları elemanter olaylar ise kesin olarak doğrudur, ancak en genel halde bu değerlendirme set teorisi kavramlarına uygun olacak şekilde iki setin çarpımı AB olarak ele alınmalıdır. Gerçekten, eğer A ve B karşılıklı seçkin iseler AB seti bir boş set olacak ve Pr(AB) = 0 olacaktır. Diğer yandan eğer A, B setinin bir alt seti ise (A ⊂ B) o halde AB = A olacak ve Pr( A | B) = Pr( A) ≥ Pr( A) Pr( B) Eğer B ⊂ A, ise AB = B ve Pr( A | B) = Pr( A | B) = Pr( B) =1 Pr( B) yazılabilecektir. Mamafih genel olarak; A ⊂ B ve B ⊂ A olmaması hallerinde dahi Pr(A) ve Pr(A|B)’nin bağıl büyüklüklerinin dikkate alınacağı iddia edilemez. Şimdiye kadar olan incelemelerimizde temel aksiyomları sağlayacak şekilde koşullu olasılığı tanımladık. Bağıl frekans yaklaşımı incelenirken, toplam deney sayısına oranlanmış 26 oluşların sayısı olarak açıkça ifade edilmişti, ancak aksiyom olarak yaklaşımda koşullu olasılık nicelik olarak tanımlanmıştır. Bu nedenle bunların bağımsız olarak olasılıklarının geçerliliklerini göstermek gerekmektedir. İlk aksiyom, Pr( A | B) ≥ 0 ‘dır ve bu 1-15 eşitliğinden görüldüğü gibi tamamen doğrudur. Çünkü pay ve payda pozitif sayılardır. İkinci aksiyom, Pr( S | B) = 1 ‘dir ve bu da B ⊂ S olup SB = B ve Pr(SB) = Pr(B) olduğundan açıkça görülmektedir. Üçüncü aksiyomun geçerliliğini göstermek üzere AC= ∅ olan bir C olayını ele alalım. (A ve C karşılıklı seçkindirler). O halde Pr[(A+C)B] = Pr[(AB) + (CB)] = Pr(AB) + Pr(CB) olur. AB ve CB karşılıklı olduklarından bu tip olaylarda 1-9 eşitliği geçerlidir. Bu şekilde 1-15 eşitliğinden Pr[(A + C) | B] = Pr[(A + C)B] Pr( AB ) Pr(CB ) = + = Pr( A | B) + Pr(C | B) Pr(B) Pr( B ) Pr( B ) elde edilir. Bu şekilde üçüncü aksiyom da sağlanmış olur ve koşullu olasılığın her durumda geçerli olduğu açıkça görülür. Koşullu olasılık konusunu daha derinleştirmeden, olayları elemanter olmayan bir örnek üzerinde çalışmalarımızı sürdürelim. Deneyimiz gene bir zar atılması ve olası oluşlarımız da 1’den 6’ya kadar tam sayılar olsun. A olayı A={1,2} olarak tanımlansın. Daha önceki bilgilerimizden Pr(A) = 1/6+1/6 = 1/3 olduğu açıktır. B olayı çift sayıların gelmesini öngören üç elemanter olaydan oluşmuş olsun. B = {2,4,6} , Pr(B) 1/2 ’dir. AB olayı da AB = {2} ve Pr(AB) = 1/6 olacaktır. Bu halde Pr(A|B) koşullu olasılığı, 27 1 Pr ( AB ) 6 1 Pr ( A B ) = = = 1 3 Pr (B ) 2 olur ve bir zar atılması deneyinde, çift sayılara göre (çift sayılar içinde) 1 veya 2 gelme olasılığının 1/3’e eşit olduğunu gösterir. Diğer yandan 1 veya 2’ye göre (1 veya 2 içinde) çift sayıların gelmesi koşullu olasılığının bulunması istenebilir. Bu da, 1 Pr ( AB ) 6 1 Pr (B A) = = = 1 2 Pr ( A) 3 olur ve bu sonucun doğruluğu açıkça görülmektedir. Koşullu olasılığın en önemli uygulama alanlarından biri TOPLAM OLASILIĞIN hesaplanmasında kullanılmasıdır. A1,A2,....,An gibi karşılıklı seçkin n olay ile keyfi bir B olayını ele alalım, şekil 1-7 Ai olayları uzay setini tamamen kaplamış olsunlar. Bu halde, A1 + A2 + ... + An = S (1-16) yazılabilir. Aİ ve AJ (i ≠ j) karşılıklı seçkin olduklarından BAİ ve BAJ’ler de karşılıklı seçkindirler. 1-16 eşitliğinden B = B(A1 + A2 +...+ An) = BA1 + BA2 + ..... + BAn yazılabilir ve 1-9 eşitliğine göre, Pr (B) = Pr(BA1) + Pr(BA2) +....+ Pr (BAn) elde edilir. (1-17) 1-15 eşitliği dikkate alınırsa, Pr(BAi) = Pr(B|Aİ).Pr(Aİ) ve bu 1-17 eşitliğinde yerine yazılırsa Pr (B) = Pr (B|A1).Pr (A1) + Pr (B|A2) Pr (A2) + ...... + Pr (B|An) Pr(An) (1-18) 28 ŞEKİL 1-7: Toplam Olasılık İçin Venn Diyagramı elde edilir. Buradaki Pr(B) büyüklüğü TOPLAM OLASILIK adını alır ve 1-18 eşitliği ile koşullu olasılıklar cinsinden ifade edilir. Toplam olasılığın uygulanışını göstermek üzere bir örnek ele alalım. Altı gözü olan dirençle dolu bur kutu düşünelim. Kutunun her bir gözünde tablo 1-3’de gösterilen çeşitli değer ve sayıda dirençler olsun. Direnç Değerleri Göz numaraları Ohm 1 2 3 4 5 6 toplam 10 Ω 500 0 200 800 1200 1000 3700 100 Ω 300 400 600 200 800 0 2300 11000 Ω 200 600 200 600 0 1000 2600 1000 1000 1000 1600 2000 2000 8600 toplam TABLO 1-3 : Kutudaki Dirençlerin Dağılımı 29 Eğer gözlerden biri rasgele seçilerek, seçilen o gözden herhangi bir direnç çekilirse, çekilen direncin 10 ohm olma olasılığı nedir? 1-18 eşitliğinde Aİ olaylarına karşı gelen burada 6 gözden birinin rasgele seçilmesidir ve bu olaylar için eş olasılık varsayılmıştır. Pr (Aİ) = 1 6 i =1, 2, 3, 4, 5, 6 B olayı 10 ohm’luk bir direnç çekilmesidir ve koşullu olasılıklar gözlerin bu özellikte dirençlerinin sayıları ile bağlantılıdır. Yani 500 1 = 1000 2 200 2 Pr (B A3 ) = = 1000 10 1200 6 Pr (B A5 ) = = 2000 10 Pr (B A1 ) = 0 =0 1000 800 1 Pr (B A4 ) = = 1600 2 1000 1 Pr (B A6 ) = = 2000 2 Pr (B A2 ) = olmaktadır. O halde 10 ohm’luk direnç çekilmesi olasılığı 1-18 eşitliğinden Pr (B ) = 1 1 1 2 1 1 1 6 1 1 1 × + 0 × + × + × + × + × = 0.3833 2 6 6 10 6 2 6 10 6 2 6 olacaktır. Yukarıda koşullu olasılıkların hesabında bağıl frekans yaklaşımının kullanıldığını belirtmek yararlı olacaktır. Ancak 1-10 eşitliği ile tanımlanan temel bağıntının aksiyom olarak yaklaşımdan türetildiğini ifade edelim. 1-18 eşitliğindeki Pr(Aİ) olasılıklarına ekseri (priori) BİRİNCİL OLASILIK olarak başvurulur, çünkü Aİ olaylarının olasılıkları herhangi bir deney yapılmadan önce tanımlanabilmektedir. B olayı deney yapıldıktan sonra elde edilirse Ai olaylarını ortaya koyan olasılıklar, Pr(Ai|B) koşullu olasılıklarıdır. Bu olasılıklar 1-15 eşitliğinin yeniden yazılması ile daha önce gördüğümüz şekilde tanımlanabilirler. 30 Pr(AiB) = Pr(Ai|B) Pr(B) = Pr(B|Ai) Pr(Ai) Bu ifadenin son kısmı B ve A’nın yerleri değiştirilmek sureti ile elde edilmiştir. Rasgele terimi genellikle eş olasılık anlamında kullanılmaktadır. Bundan sonra ikinci eşitlik yazılabilir. Pr (B Ai ) Pr ( Ai ) Pr ( Ai B ) = , Pr (B ) ≠ 0 (1-19) Pr (B ) Burada 1-18 eşitliği yerine yazılarak, Pr ( Ai B ) = Pr (B Ai ) Pr ( Ai ) Pr (B A1 )Pr ( A1 ) + ... + Pr (B An ) Pr ( An ) (1-20) elde edilir. Pr(Ai|B) koşullu olasılığı ekseriye İKİNCİL (Posteriori) OLASILIK adını alır, çünkü ancak deney yapıldıktan sonra değerlendirilebilir. 1-19 ve 1-20 eşitlikleri BAYES TEOREMİ olarak bilinirler. Bir ikincil olasılık biraz önce incelediğimiz örnek üzerinde gösterilebilir. Gözlerden çekilen direncin 10 ohm’luk olduğu bilindiğine göre, bunun üçüncü gözden çekilebilme olasılığı nedir? Madem ki B gene 10 ohm’luk direnç seçilebilme olasılığıdır, o halde Pr(B|Ai) olasılıkları daha önce hesaplanan koşullu olasılıklara eşittir. Daha ileri giderek birincil olasılıkların 1/6’ya eşit olduğu bilindiğine göre, 1-19 eşitliğinden ve daha önce hesaplanan Pr(B) kullanılmak sureti ile, 2 1 10 6 Pr ( A3 | B ) = = 0.0869 0.3833 olur. Bu on ohm’luk direncin üçüncü gözden gelebilme olayına ait olasılıktır. ALIŞTIRMA 1-6 Tablo 1-3’ü kullanarak a) 100 Ω ’luk bir direncin ikinci gözden çekilebilme olayının b) 1000 Ω ’luk bir direncin ikinci gözden çekilebilme olayının, olasılıklarını hesaplayınız. 31 1-7 BAĞIMSIZLIK Olasılıkta istatiktistiksel bağımsızlık çok önemli bir kavramdır. Bu kavram bağıl-frekans yaklaşımında, bir madeni paranın iki kez atılması örneğinde olduğu gibi bir deneyin iki kez tekrarlanmasını incelemek sureti ile tanıtılmıştı ve herhangi şekilde birinci denemenin sonucunun ikinci denemeyi etkilemediği açıklanmaştı. Bu kavram biraz daha geliştirilecek ve olayların daha genel matematiksel ifadesi ortaya konulmaya çalışılacaktır. Ancak değişmeyen tanım, A ve B olayları, sadece ve sadece Pr (AB) = Pr (A) Pr (B) (1-21) koşulunun sağlanması durumu için bağımsız olduğudur. Pek çok fiziksel durumda, olayların bağımsızlığı varsayılır, çünkü bir olayın diğerine bağlı olmasında görünen belirgin bir mekanizma yoktur. Diğer hallerde elemanter olayların kabul edilmiş olasılıkları, bunlar yardımı ile tanımlanmış diğer olayların bağımsızlığını görebilmemize yol açar. Bu gibi durumlarda, bağımsızlık açıkça görülemeyebilir, ancak 1-21 eşitliği ile kolayca bulunabilir. Bağımsızlık kavramı ikiden çok olay için genişletilebilir. Örneğin üç olayın var olması durumunda bağımsızlık için kombinasyonlar aşağıda gösterilmiştir. Pr (A1A2) = Pr (A1) Pr (A2) Pr (A2A3) = Pr(A2) Pr (A3) Pr (A1A3) = Pr (A1) Pr (A3) Pr (A1A2A3) = Pr (A1)Pr(A2)Pr(A3) Üç olayın bağımsızlığı için bu dört durum gerçeklenmelidir. Bağımsızlığı ifade eden bu çiftler, olayların tam seti için bağımsızlığı ifadede yeterli değildir. Genelde, eğer n olay varsa, 32 Pr (AİAJ....Ak) = Pr (Aİ) Pr (AJ) ..... Pr (Ak) (1-22) koşulunun sağlanması gereklidir ve her bir tamsayılar seti n’e eşit veya daha azdır. 1-22 eşitliğine göre n olayının bağımsızılığı için 2n (n + 1) eşitlik gerekmektedir. Bağımsızlık için önemli bir uyarma 1-14 eşitliğinin özel hali için ortaya konabilir. Pr (A + B) = Pr (A) + Pr (B) - Pr (AB) ve eğer A ve B olayları bağımsız iseler, Pr (A + B) = Pr (A) + Pr (B) - Pr (A) Pr (B) (1-23) olur. Bağımsızlığın bir başka sonucu da eğer A1, A2 ve A3’ün hepsi bağımsız iseler olur. Pr [A1 (A2 + A3)] = Pr (A1) Pr (A2+ A3) (1-24) Bu üç olayın ikişer bağımsız olmaları durumunda 1-24 eşitliği geçerli değildir. Genel olarak, eğer A1 ,A2 ,....,An bağımsız olaylar ise, o halde onlardan herhangi biri, toplam çarpım ve tamamlayıcı şekillerinde herhangi diğer olaylardan bağımsızdır. Fiziksel durumlara ait örnekler, daha çok bir deneyin iki veya daha fazla denenmesi ile bütünleşmiş bağımsızlıklar gösterirler. Kuşkusuz tek bir deneme ile bütünleşmiş setlerde bağımsızlığı tanımlamak olasıdır, ancak bu setler herhangi bir fiziksel durumu ifade etmeyebilirler. Örneğin tek bir zar atılması deneyinde A = {1,2,3} ve B={3,4} olaylarını ele alalım. Daha önceki sonuçlardan Pr(A) = 1/2 ve Pr(B) = 1/3 olduğu bilinmektedir. AB olayı {3} olan tek bir elemana sahiptir o halde Pr(AB) = 1/6’dır. Bu şekilde, Pr(AB) = 1/6 = Pr(A).Pr(B) = 1/2.1/3 = 1/6 33 yazılabilir ve A ve B olayları bağımsızdır denilir, ancak bunun fiziksel anlamı yeterince açık değildir. Bundan sonra incelenecek paragrafta, birden fazla deneyin veya verilen bir deney için birden fazla denemenin bulunduğu durumlar incelenecek ve bu incelemeler konunun açıklığa kavuşmasına yardımcı olacaktır. 1-8 BİRLEŞTİRİLMİŞ DENEYLER Şimdiye kadar sunulan olasılıkla ilgili çalışmalarımızda, olasılık uzayı S yalnızca tek bir deneyle bütünleşmiş biçimde ele alınmıştı. Bu bakış açısı, gerçeğe uygun pekçok soruna yaklaşabilmek bakımından oldukça sınırlıdır, bu nedenle konuyu herhangi şekilde genişletmek gerekmektedir. Şimdi iki deneyin yapıldığı bir durum ele alalım. Örneğin deneylerden biri bir zarın atılması, diğeri de bir madeni paranın atılması olabilir. Bu halde bulunması istenen olasılık zar için 3 sayısının gelmesi, para içinde yazı gelmesi olabilir. Bir diğer durumda da ikinci deney birincinin yinelenmesinden oluşabilir. Birlikte ele alınan bu iki deney bir BiRLEŞiK DENEY şeklindedir ve bu durum için uygun olasılık uzayının bulunmasını gerektirir. Bir deneyin uzayı S1 ve diğer deneyin uzayı S2 olsun. S1 uzayının elemanları, S1 = {α 1 , α 2 ,..., α n } ve S2 uzayının elemanları da, S 2 = {β 1 , β 2 ,..., β m } olarak tanımlanmış olsun. Bu durumda yeni bir uzay biçimi karşımıza çıkar. Buna KARTEZYEN ÇARPIM UZAYI adı verilir. Kartezyen çarpım uzayının elemanları şu şekilde sıralanır. (α 1 , β 1 ), (α 1 , β 2 ),..., (α i , β j ),..., (α n , β m ) Bu şekilde eğer S1 n elemana ve S2 de m elemana sahipse kartezyen çarpım uzayı, daha önce 1-4 paragrafında incelenen çarpım veya kesişim ile karıştırılmaması açısından S = S1 x S2 olarak gösterilebilir. 34 Birleştirilmiş deneyler için kartezyen çarpım uzayının tanıtılması bakımından, yukarıda değindiğimiz zar ve para atılması denemeleri için, açıklamaya çalışalım. Zar atılması deneyi için S1 uzayı S1 = {1,2,3,4,5,6) ve para atılması deneyi için S2 uzayı S2 ={Tura, Yazı} = {T, Y} ‘dir. Kartezyen çarpım uzayı aşağıdaki 12 elemandan oluşur, S = S1 X S2 = {(1,Y), (1,T), (2,Y), (2,T), (3,Y), (3,T), (4,Y), (4,T), (5,Y), (5,T), (6,Y), (6,T)} Şimdi yeni olasılık uzayının olaylarını tanımlamak gerekir. Eğer A1, S1 içinde bir olay olarak ele alınan bir alt set ve A2 de S2 içinde bir olay olarak ele alınan bir alt set ise, A = A1 X A2 S uzayı içinde bir olaydır. Örneğin burada A1 = {1,3,5} ve A2 = {T} olsun. Bunlara karşı gelen A olayı, A = A1 X A2 = {(1,T), (3,T), (5,T)} olur. A olayının olasılığını belirlemede, bu iki deneyin bağımsız olup olmadığının düşünülmesi gereklidir. Burada incelenecek tek durum, bunların bağımsız olmaları halidir. Bu gibi durumlarda çarpım uzayında olasılık, sadece kendi (orijinal) uzaylarındaki olasılıkların çarpımıdır. O halde A1 olayının olasılığı S1 uzayındaki Pr(A1) ve A2 olayının olasılığı S2 uzayındaki Pr(A2) ise, S uzayındaki A olayının olasılığı, Pr (A) = Pr (A1 x A2) = Pr(A1) Pr(A2) olacaktır. (1-25) 35 Bu sonuç, yukarıdaki örnekten sayısal olarak gösterilebilir. A1 = {1,3,5} için Pr(A1) = 1/6+1/6+1/6 = 1/2 A2 = {T} için ve Pr(A2) = 1/2 bilindiğine göre, zar atılmasında tek sayılan ve para atılmasında turayı elde etme olasılığı, Pr (A) = (1/2)(1/2) = 1/4 olur. Yukarıdaki fikirleri, ikiden fazla deney için doğrudan genelleştirmek olasıdır. Ancak bu özel bir durum için yani aynı deneyin keyfi sayıda yinelenmesi durumu için yapılacaktır. 1-9 BERNOULLİ DENEMELERİ Burada incelenen durum, n defa yinelenen bir deneyde, tam olarak k defa olması istenen özel bir olayın olasılığını bulmaktır. Örneğin, bir madeni paranın 10 kez atılması durumunda tam olarak 4 kez tura gelebilmesinin olasılığı nedir? Bu tip yinelenen deneyler BERNOULLI DENEMELERİ olarak bilinirler. Bir deney içinde olasılığı Pr(A) = p olan bir A olayını düşünelim. Bu olayın olmama olasılığı Pr( A ) = q olacaktır. Burada p+q = 1’dir. Sonra deneyin n kez yineleyelim ve bu denemelerin birbirinden bağımsız olduğunu varsayalım. Bu bağımsızlık, denemelerden herhangi birinin oluşu, herhangi şekilde geçmiş ya da gelecek denemelerin oluşlarına bağlı olmadığını ifade eder. Bundan sonra A olayının k kez meydana gelmesi olasılığını hesaplayalım. Burada k, herhangi özel bir sıra örneğin ilk kez denemeyi belirtsin. Denemeler bağımsız olduğundan, bu olaya ait olasılık, 36 Pr( A) Pr( A)... Pr( A) Pr( A ) Pr( A )... Pr( A ) = pk qn-k 14442444 3 144424443 k adet n-k adet olacaktır. Ancak herhangi farklı sıra ile ortaya çıkan tam k tane olayın olmasında birçok alternatif vardır. Bağımsızlık nedeni ile bütün bu alternatifler yukarıda gösterilen durumla aynı olasılığa sahiptirler. Herhangi sıra ile A olayının k kez olması, belirli bir sıra ile k kez olan karşılıklı seçkin A olaylarının toplamıdır ve bu şekilde A’nın k kez olması olasılığı, belirli bir sıra için yukarıda verilen olasılığın farklı sıraların numaralı ile çarpılması ile elde edilir. Ortaya atılan bu farklı sıraların numarası sadece n elemanı bir set içinden k elemanın alınması ile elde edilen bir sayıdır. Bu sayı, kombinasyon teorisine göre binom katsayıları adını alır ve n n! = (1-26) k k!(n − k )! olarak tanımlanır. Örneğin eğer, n= 4 ve k = 2 ise n 4! = =6 k 2!2! ‘dir. A olayının tam iki kez olması için 6 farklı sıra söz konusudur. Bunlar kolayca şu şekilde gösterilebilir. AA A A , A A A A , A A A A, A A A A, A AA A , A A AA Şimdi A olayının k kez olması için hesaplanması istenen olasılık kolayca yazılabilir. n p n (k ) = Pr{A olayının k kez olması} = p k q n − k (1-27) k Bu sonucun bir uygulamasını göstermek üzere binary sayılarından (0 ve 1) oluşmuş her biri "1 sözcük" ‘word’ 32 sayı (digit) olarak düzenlenmiş bir bilgisayar düşünelim. Eğer bir binary sayının yanlış okunma olasılığı 10-3 ise, bir 37 sözcükteki 1 hatanın olasılığı ne olacaktır? Bu durumda n = 32, k = 1, p = 10-3 olacaktır. O halde, 32 1 31 Pr {1 sözcükteki 1 hata} = P32(1) = 10 −3 (0,999 ) ≈ 0.031 1 olur. Bir sözcükteki hiç hata olmama olayının olasılığı da kolayca bulunabilir. ( ) Pr(1 sözcükte hiç hata yok} = p32(0) 32 0 32 32 = 10 −3 (0,999 ) = (0,999 ) ≈ 0.9685 0 Bernoulli denemelerinin farklı pek çok pratik uygulamaları vardır. Örneğin n elemanı bir sistemde herhangi bir elemanın bozuk olma (veya bozulma) olasılığı P olarak bilindiğine göre, sistemde bir elemanın bozuk olma olasılığı n P {1 eleman bozuk} = pn(1) = p.q ( n −1) 1 olur. ( ) Bazı durumlarda bir A olayının en az k kez olmasının ya da k kezden fazla olmamasının olasılığının hesaplanması ilginç olabilir. Bu olasılıklar arzu edilen olaya dahil edilebilen bütün oluşların olasılıklarının toplamı ile kolayca hesaplanabilirler. Örneğin eğer bir madeni para atılması deneyinde para 4 kez atılmış ise en az iki tura gelmesinin olasılığı ne olacaktır? Bu durum için p = q = ½ ve n= 4’dür. Daha önce gördüğümüz yolla, tam iki tura gelme olasılığı 4 2 P4 (2) = (1 / 2 ) (1 / 2) 2 = (6)(1 / 4)(1 / 4) = 3 / 8 2 Benzer şekilde üç tura gelmesi olasılığı, 4 3 1 P4 (3) = (1 / 2 ) (1 / 2 ) = (4)(1 / 8)(1 / 2) = 1 / 4 3 ve dört tura gelmesi olasılığı 4 4 0 P4 (4) = (1 / 2 ) (1 / 2 ) = (1)(1 / 16)(1) = 1 / 16 4 olacaktı. 38 O halde en az iki tura gelme olasılığı Pr {en az iki tura gelmesi} = p4(2) + p4(3) + p4(4)=3/8+1/4+1/16 = 11 / 16 olmaktadır. Buna benzer problemler için genel bağıntılar oldukça kolay ifade edilebilir, ancak pekçok durum söz konusudur. Mamafih bunlar aşağıdaki tablo ile özetlenebilir. Pr {A olayının n denemede k kezden az olması} = k −1 ∑p n (i ) i =0 Pr {A olayının n denemede k kezden fazla olması} = n ∑p n (i ) i = k +1 Pr {A olayının n denemede k kezden fazla olmaması} = k ∑p n (i ) i =0 Pr {A olayının n denemede en az k kez olması} = n ∑p n (i ) i=k Bernoulli denemelerine ilişkin son bir uyarı, n’in oldukça büyük değerler alması halinde pn(k)’nın hesaplanmasının uygun duruma getirilme zorunluğudur. Bu durumda binom katsayıları ve p ile q’nun büyük kuvvetleri hesaplamayı güçleştirdiğinden genellikle hesaplamalarda daha basit fakat yaklaşık bir yol izlemek gereklidir. Bu yaklaşım, De Moivre-Laplace Teorem olarak bilinmektedir. Eğer npq >> 1 ve Ik – npI’nin mertebesi npq ‘nün mertebesine eşit veya daha küçük ise bu yaklaşım n 1 − ( k − np ) 2 / 2 npq p n (k ) = p k q n− k ≈ ε 2πnpq k olarak tanınır. De Moivre-Laplace teoremi, ileride incelenecek sürekli olasılık için ek bir özellik taşımaktadır. Mamafih basit bir örnek ayrık olasılık için yararını belirtmeye yeterlidir. Varsayalım ki bir madeni para 100 kez atılsın ve k kez tura gelmesi istensin (burada k = 50 civarında olsun), k’nın yaklaşık 40 ila 60 arasındaki değerleri için, p = q = ½ ve n = 100 bilindiğine göre; 39 p n (k ) ≅ 1 50π e −( k −50 ) 2 / 50 100 binom katsayılarını aynı mertebede bir k için olur. Bu da k hesaplanmaya çalışmaktan çok daha kolay olduğunu göstermektedir . ALIŞTIRMA 1-9 Bir şehirde 60 saatlik bir hafta sonu boyunca ölümle sonuçlanan 15 trafik kazası olmaktadır. Bu süre içinde 1 saatlik peryottaki kaza olasılığı, diğer birer saatlik peryotlardaki kaza olasılıklarına eşit olduğu varsayılarak, a) 6 saatlik peryotta hiç kaza olmama olasılığı nedir? b) " " 5 kaza olma olasılığı nedir? c) Bütün hafta sonu boyunca hiç kaza olmama olasılığı nedir? 40 PROBLEMLER 1-1 Tek bir zar atıldığında, aşağıdaki olaylara ait olasılıkları hesaplayınız. a- 3 sayısının gelmesi b- 3’ten küçük sayıların gelmesi. c- Bir tek sayı gelmesi. 1-2 İki zar atıldığında, aşağıdaki olaylara ait olasılıkları hesaplayınız. a- Toplamın 7 olması, b- Toplamın 5’ten büyük olması, c- Toplamın bir tek sayı olması. 1-3 Bir firma, güçleri 1/5 , 1/4 ve 1/3 hp ve çalışma gerilimleri 120 V ac, 240 V ac ve 120 V dc olan küçük elektrik motorları üretmektedir. Motor tipleri yalnızca plakalarından ayırdedilebilmektedir. Bir dağıtıcı firmanın elinde ayrıntıları tabloda verilen 2500 adet motor vardır. Güç 1/5 1/4 1/3 Toplam 120 V AC 250 150 100 500 240 V AC 120 v DC 750 500 250 250 250 0 1250 750 Toplam 1500 650 350 2500 Motorlardan birinin plakasız olduğu saptanıyor. Aşağıdaki olaylara ait olasılıkları bulunuz. a-Plakasız motor gücünün 1/4 hp olması. b-Plakasız motorun çalışma geriliminin 120 V dc olması. c-Plakasız motorun gücünün 1/4 hp ve çalışma geriliminin 120 V dc olması. d-Plakasız motorun gücünün 1/3 hp ve çalışma geriliminin 120 V dc olması. 1-4 Problem 1-3’de 120 V ac besleme gerilimine sahip motorlardan %10’u ve 120 V dc motorlardan %2’sinin yanlış etiketlenmiş olduğu varsayıldığına göre, a-Rasgele bir motor seçildiğinde, bunun yanlış etiketli olma olasılığı nedir? b-1/4 hp gücünde bir motor seçildiğinde bunun yanlış etiketli olma olasılığı nedir? c-Rasgele bir motor seçildiğinde, bunun 1/5 hp gücünde ve yanlış etiketli olma olasılığı nedir? 41 1-5 Aşağıdaki olasılıkları hesaplayınız. a-Birbiri peşisıra bir iskambil destesi 5 kez kesiliyor. En az üçünde as çıkması. b-Beş kartlı bir poker elinde en az üç as olması. c-Floş için bir kart çekilmesi. 1-6 n elemandan oluşan S uzay setinin 2n alt kümesi olduğunu ispatlayınız. 1-7 Bir S olasılık uzayı, S = {1,2,3,4,5,6,7,8,9,10} olarak tanımlanmıştır. Bu uzaya ait üç alt küme, A = {1,2,3}, B = {1,3,5,7,9}, C = {2,4,6,8,10}. olduğuna göre A+B B+C A+C AB AC BC setlerini bulunuz. ABC A B C AB AB BC A-C C-A A-B (A-B)+B (A-B)+C 1-8 Problem 1-4 için Venn diyagramını çizerek değerlendiriniz. 1-9 Bir olasılık uzayında, A, B ve C gibi tanımlanmış üç olay için, Pr(A+B+C) = Pr (A) + Pr (B) + Pr (C) - Pr (AB) - Pr (AC) - Pr (BC) + Pr (ABC) olduğunu gösteriniz. 1-10 Bir daktilograf bazen vurmak istediği tuş yerine o tuşun hemen sağındaki veya solundaki tuşa yanlışlıkla vurur. Bunların herbirine ait olasılıklar 0,05’tir. Bir yazı makinasında E, R ve T harfleri yanyana bulunmaktadır. İngilizce dilinde E harfinin kullanılma olasılğı 0,1031, R harfinin 0,0484 ve T harfinin ise 0,0796’dır. İngilizce bir metnin kopya edilmesi halinde, R harfinin yazılma olasılığı nedir? 42 1-11 Belirli bir haberleşme sisteminde mesajlar 0 ve 1 olan binary sayıları ile kodlanmışlardır. Kodlamadan sonra 0 gönderilme olasılığı 0,45 ve 1 gönderilme olasılığı 0,55’tir. Haberleşme kanalında, 0 gönderilen işaret 0,1 olasılıkla 1 olarak ve 1 gönderilen işaret 0,2 olasılıkla 0 olarak alınmaktadır. a-İşaret sıfır olarak alındığında, sıfır gönderilmiş olma olasılığı nedir? b-İşaret bir olarak alındığında, bir gönderilmiş olma olasılığı nedir? 1-12 Eşyetenekli iki takımın karşılaşmaları durumunda, a-Dört oyundan üçünü mü yoksa 8 oyundan beşini mi kazanmak daha olasıdır? b-Dört oyundan en az üçünü mü yoksa 8 oyundan en az beşini mi kazanmak daha olasıdır? 1-13 Bir futbol kalecisi, kalesine atılan şutlardan 2/3’ünü yakalamaktadır. Bir oyunda maç boyunca kaleye 5 şut atılmıştır. Takımının kazanabilmesi için kendisine atılan şutlardan 3’ünü yakalaması gerekmektedir. a-Kalecinin atılan bu 5 şuttan hiçbirini yakalayamama olasılığını bulunuz. b-Takımının oyunu kazanma olasılığı nedir? 1-14 Çok kanallı bir mikrodalga hattı 10 aboneli özel bir telefon haberleşmesini sağlamaktadır. Her bir abone puant zamanlarda iletişimin uygunlukla yapılabilmesinin sağlanmasında, a-Abonelerin %90’ının zamanın tamamı boyunca konuşabilmesi için, b-Bütün abonelerin zamanın %90’ı süresince konuşabilmeleri için, kaç kanala gerek vardır? KAYNAKLAR 1.Bölüme ait kaynaklar aşağıda verilmiştir. Beckmann,P., Elements of Applied Probability Theory. New York: Harcourt, Brace and World,Inc.,1938 Davenport,W.B.,Jr., and W.L.Root, Introduction to Random Signals and Noise. New York:McGraw-Hill,Inc.,1958 Drake,A.W., Fundamentals of Applied Probability Theory. New York:McGraw-Hill,Inc.,1967 43 Gnedenko,B.Y. and A.Ya.Khinchin, An Elementary Introduction to the Theory of Probability. New York:Dover Publications, Inc.,1962 Lanning,J.H.,Jr. Ve R.H.Battin, Random Processes in Automatic Control. New York:McGraw Hill,Inc.,1956 Papoulis,A., Probability, Random Variables, and Stochastic Processes. New York:McGraw Hill,Inc.,1965 Parzen,E., Modern Probability Theory and Its Applications. New York:John Wiley and Sons,Inc.,1969 Thomas,J., An Introduction to Statistical Communication Theory. New York:John Wiley and Sons, Inc.,1969 44 BÖLÜM 2 RASLANTI DEĞİŞKENLERİ 2-1 RASLANTI DEĞİŞKENİ KAVRAMI Bir önceki bölümde herhangi bir deneyle bağlantılı olası oluş sayılarının sonlu olması durumu ayrıntılı olarak açıklanmıştı. Ancak oluşların sonlu sayıda olması olanaksızdır, çünkü gerçek yaşamda oluşlar sonlu değildirler. Bu varsayımlar sadece bir madeni para atılması, bir zar atılması, kutulardan direnç seçilmesi gibi deneyler için gerçekten doğrudur ve uygulanır. Buna rağmen gerçek yaşamda, olası oluşları sonlu olmayan pek çok deney sözkonusudur. Bu bölümün amacı şimdiye kadar incelenen olasılık kavramları ile bağlantılı olarak bu tip deneylerle tanışmayı sağlamaktır. Bir deneye ait oluş sayılarının sonlu olmama durumunu tanıtmada iyi bir yol olarak bir kutudan bir direnç çekilmesi deneyi düşünülebilir. Bir önceki bölümde yapılan 1 ohm’luk, 10 ohm’luk ya da herhangi farklı değerde direnç çekilme deneyi hatırlanacaktır. Bu örneklerde çekilen dirençlerin etiketlerinin 1 ohm veya 10 ohm olması belirtilmek istenmişti. Dirençlerin gerçek değerlerinin etiket değerlerine yakın değerler olduğu kabul edilir ve bu değerlerden bilinmeyen fakat ölçülebilir bir miktar farklılık gösterdikleri bilinir. Etiket değerlerinden farklılıklar üretimin niteliğine bağlıdır ve bize yalnızca direnç değerinin belirli sınırlar arasında olduğunu ifade ederler. Madem ki herhangi bir direncin değeri tam olarak bilinmemektedir, o halde o bir raslantı değişkenidir. Bu konuyu daha derinleştirmek üzere, her biri 100 ohm olarak etiketlenmiş bir kutu direnç düşünelim. Üretim toleransları nedeni ile kutudaki her bir direncin birbirinden farklı değerleri vardır. Daha ileri giderek sonsuz sayıda olası direnç değeri söz konusudur, bu nedenle bir direnç çekilmesi deneyi sonsuz sayıda olası oluşa sahiptir. Hatta bütün direnç değerlerinin 99,99 ohm ile 100,01 ohm arasında olduğu bilinse bile, bu sınırlar içinde sonsuz sayıda değer vardır. Buradan şu önemli durum karşımıza çıkar, tam olarak 100 ohm’luk bir direncin çekilebilme olayının tanımlanan olasılığı gerçekte sıfırdır. Diğer yandan değerleri 99,9999 ohm ile 100,0001 ohm arasındaki dirençlerin çekilebilme olasılığı sıfırdan farklıdır. 45 Genel olarak bir direncin gerçek değeri bir raslantı değişkenidir ve belirli sınır değerleri arasında olduğu varsayılır. Raslantı değişkenlerini zaman fonksiyonları ile birlikte düşünmek olasıdır ve gerçekten bu notlarda ele alınan çoğu uygulamalar bu tipten olanlardır. Esasen raslantı değişkenleri ve rasgele zaman fonksiyonları üçüncü bölümde ayrıntılı olarak ele alınacaktır. Bu iki kavram arasındaki bağıntıyı vurgulamak üzere konudan bir an için ayrılmak ve bu bölümdeki çalışmalarımızla ilgili önemli bir fiziksel olguyu ortaya koymak yararlı olacaktır. Tipik bir rasgele zaman fonksiyonu şekil 2-1’de X(t) olarak gösterilmiştir. Verilen bir fiziksel olgu için bu özel zaman ŞEKiL 2-1: Bir Rasgele Zaman Fonksiyonu fonksiyonu, oluşabilecek sonsuz sayıdaki zaman fonksiyonlarından sadece biridir. Gözlemlenebilen olası tüm zaman fonksiyonlarının tamamı (kolleksiyonu) bir rasgele işlemeye aittir ve bu {x(t)} olarak gösterilecektir. Bu olası zaman fonksiyonlarına ait "olasılık fonksiyonları" da tanımlanmış ise yukarıda değindiğimiz bu zaman fonksiyonlarının kolleksiyonu "ENSEMBLE" (BÜTÜN) adını alır. Ensemble'nin herhangi özel bir fonksiyonu, örneğin x(t) ÖRNEK FONKSİYON olarak bilinir ve herhangi bir zaman için örneğin t1 anında, örnek fonksiyonun değeri, X(t1) veya yalnızca X1 olarak gösterilecektir ve bu gibi değer bir raslantı değişkenidir. Bu şekilde, özetle x(t) gözlenen bir örnek fonksiyon olduğuna göre, X1 = x(t1) rasgele değişkendir. 46 Rasgele işleme ile bütünleşmiş bir raslantı değişkeni yukarıda değindiğimiz direnç örneği ile bütünleşmiş raslantı değişkeninden çok daha karmaşık bir kavramdır. Öncelikle, zaman eksenindeki her bir an için farklı bir raslantı değişkeni söz konusudur. Ancak genel olarak iki farklı zamana karşı gelen iki farklı raslantı değişkeni arasında bir ilişki vardır, ikinci olarak ilgilendiğimiz, örnek fonksiyondan tüm ensemblenin örnek fonksiyonlarına kadar var olan bir rasgeleliktir. Rasgelelik zamanın bir anından diğerine de düşünülebilir ancak bu rasgele işlemenin temel öğesi değildir. Bu nedenle burada incelenen raslantı değişkeni olasılığının tanımı, aynı zamanda rasgele işlemenin olasılığının tanımıdır. Bizim başlangıç incelemelerimiz raslantı değişkenleri üzerinde yoğunlaşacak ve daha ileride rasgele işlemeye yönelecektir. Mühendislik açısından, bir raslantı değişkeni yalnızca rasgele bir deneyin oluşunun sayısal bir ifadesidir. Bu arada belirli bir deneyin olası oluşlarının setinin S = { α } örnek uzayı veya birim set olduğunu anımsayalım. Oluş α olduğunda, X raslantı değişkeni X( α ) olarak belirtebileceğimiz bir değere sahiptir. Bu açıdan bir raslantı değişkeni, sadece örnek uzayı boyunca tanımlanan gerçel değerli bir fonksiyondur ve gerçekten bir raslantı değişkeninin temel tanımı yalnızca (matematiksel açıdan biraz sınırlandırmak koşulu ile) bu tip bir fonksiyondur. Genelde mühendislik uygulamaları için örnek uzayının tam açıklıkla bilinmesi gerekmez. Yalnızca ilgilenilen raslantı değişkenleri ile bütünleşmiş çeşitli olayların olasılıklarını ortaya koyabilmek gerekir ve bu olasılıklar çoğu kez doğrudan doğruya fiziksel durumlardan çıkarılabilir. Raslantı değişkeninin tam olarak tanımlanabilmesi için ne tür olaylar arzu edildiği ve uygun olasılıkların nasıl bulunacağı soruları bu bölümün paragrafları içinde yanıtlanacaktır. Bir raslantı değişkeninin belirli sınırlar arasında herhangi değerde olduğu varsayılabilirse, buna sürekli rasgele değişken adı verilebilir. Aşağıdaki paragraflarda, aksi söylenmediği sürece bütün raslantı değişkenleri sürekli varsayılacaktır. Ancak ayrık raslantı değişkenleri de (bunlar sayılabilir bir setin elemanları kabul edilmek kaydı ile) tamamen aynı yöntem ile değerlendirileceklerdir. 47 2-2 DAĞILIM FONKSİYONLARI Birinci bölümde görülen olasılık kavramları çerçevesi içinde sürekli raslantı değişkenlerini incelemek üzere olasılık uzayı ile bütünleşmiş olayları tanımlamak gerekmektedir. Bu olayları tanımlamada pek çok yol vardır, ancak aşağıda açıklanan yöntem hemen hemen herkes tarafından kabul edilmektedir. Yukarıda tanımlanan şekli ile X bir raslantı değişkeni olsun ve x de bu raslantı değişkenin alabileceği herhangi bir değer olsun. Olasılık dağılım fonksiyonu; gözlemlenen X raslantı değişkenin alabileceği (müsade edilen) x değerine eşit ya da küçük olması olayının olasılığı olarak tanımlanır. Matematik olarak PX ( x) = Pr( X ≤ x) yazılır. Mühendislik dallarında olasılık dağılım fonksiyonunu Px(x) ile ifade etmek oldukça yaygındır ancak pek çok matematik kitabı, bu fonksiyon için Fx(x) notasyonunu kullanmaktadır. (Olasılık dağılım fonksiyonlarını ifadede Px(x) yerine P(x)'in de kullanılabileceğini belirtelim). Tanımı gereğince, madem ki olasılık dağılım fonksiyonları birer olasılıktır, o halde birinci bölümde incelenen temel aksiyomlar ile bazı özellikleri sağlamalıdırlar. Ayrıca olasılık dağılım fonksiyonları aynı zamanda x'in de bir fonksiyonudur (x daha önce değindiğimiz gibi X’in olası değerleridir) ve bu nedenle genel olarak x’in bütün değerleri için geçerli olmalıdır. Buradan olasılık dağılım fonksiyonları, hem birer olasılık olma ve hem de birer fonksiyon olma gereksinimlerini yerine getirme durumundadırlar. Bunlar aşağıdaki şekilde özetlenebilir. 1. 2. 3. 4. 0 ≤ Px ( x) ≤ 1 −∞< x < ∞ Px(- ∞ ) = 0 Px( ∞ ) = 1 Px(x), x’in artan değerleri ile azalmaz. Pr (x1 < X ≤ x2) = Px(x2) – Px(x1) 48 Olası bazı dağılım fonksiyonları Şekil 2-2’de gösterilmiştir. Şekilde (a) − ∞ , + ∞ aralığında olası bütün değerleri alabilen sürekli bir raslantı değişkenini göstermektedir, (b) olası değerleri a ile b arasında yer alan sürekli bir raslantı değişkeninin ve (c) ise olası değerleri sadece ve sadece 0, a, b veya c olabilen ayrık bir raslantı değişkeninin olasılık dağılım fonksiyonlarına aittir. Şekil 2-2 (c)’dekine benzer dağılım fonksiyonlarında, X<x olduğu kadar X = x’in de PX(x)'in tanımı kapsamına girdiğini anımsatmak yararlı olacaktır. O halde bu şekil için örneğin PX(a) = 0,4’e eşittir, 0,2’ye eşit değildir. ŞEKİL 2-2: Bazı Olası Olasılık Dağılım Fonksiyonları Olasılık dağılım fonksiyonları aynı zamanda gözlenen raslantı değişkeni X’in x’ten büyük olması (eşit değil) olayının olasılığını tanımlamada da kullanılabilir. Bu olay, yalnızca PX(x) olasılığına ait bir olayın tamamlayıcısı olduğundan, Pr(X>x) = 1 – PX(x) olacaktır. Bir örnek olmak üzere Şekil 2-3’teki olasılık dağılım fonksiyonunu ele alalım. Bu fonksiyon biraz evvel sıraladığımız bütün koşulları sağlamaktadır. Şekilden (olası pek çok durum arasında) aşağıdaki durumların doğru olduklarını görmek mümkündür. 49 ŞEKİL 2-3 : Bir Olasılık Dağılım Fonksiyonu Pr (X ≤ -5) = 0.25 Pr (X > -5) = 1 – 0.25 = 0.75 Pr (X > 8) = 1 – 0.9 = 0.1 Pr (-5 < X ≤ 8) = 0.9 – 0.25 = 0.65 Pr ( X ≤ 0) = 1 – Pr(X >0) = 1-0.5 = 0.5 ALIŞTIRMA 2-2 Herhangi bir X raslantı değişkeni aşağıda verilen olasılık dağılım fonksiyonuna sahiptir. PX(x) = 0 1 1 = + x 2 2 =1 − ∞ < x ≤ -1 -1 < x < 1 1 ≤ x< ∞ 1 için olasılık nedir? 4 3 b-) X > için olasılık nedir? 4 c-) X’in varsayılabilen maksimum değeri nedir? a-) X = 50 2-3 YOĞUNLUK FONKSiYONU Her ne kadar dağılım fonksiyonları tek bir raslantı değişkeninin olasılık modeli için tam bir tanım ise de ilgilenilen pek çok hesaplama için en elverişli biçim değildir. Bunun için P(x)’in kendisi yerine P(x)’in türevini kullanmak tercih edilebilir. Bu türeve "olasılık yoğunluk fonksiyonu" adı verilir ve eğer varsa aşağıdaki ifade ile tanımlanır. dPX ( x) ε →0 ε dx Olasılık yoğunluk fonksiyonunun fiziksel önemi en iyi şekilde olasılık elemanı "PX(x)dx" cinsinden belirtilebilir. Bunu şu şekilde gösterebiliriz; p X ( x) = lim PX ( x + ε ) − PX ( x) = p X ( x)dx = Pr ( x < X ≤ x + dx ) (2-1) 2-1 eşitliği açıklıkla, PX(x)dx olasılık elemanının, X raslantı değişkeninin x ve x + dx arasında yer alması olayının olasılığına eşit olduğunu göstermektedir. Madem ki PX(x) bir yoğunluk fonksiyonudur ve bir olasılık belirtmez o halde değerinin 1’den az olması gerekmez ve negatif olmayan herhangi bir değer olabilir. Yoğunluk fonksiyonuna ait genel özellikler aşağıdaki gibi özetlenebilir. 1. pX(x) ≥ 0 −∞< x < ∞ ∞ 2. ∫p X ( x)dx = 1 −∞ x 3. PX(x) = ∫p X (u )du −∞ x2 4. ∫p X ( x)dx = Pr( x1 < X ≤ x 2 ) x1 Olasılık yoğunluk fonksiyonuna örnek olmak üzere, Şekil 2-2’de gösterilen dağılım fonksiyonlarına karşı gelen yoğunluk fonksiyonları Şekil 2-4’te gösterilmiştir. Ayrık bir raslantı değişkeni olma özel hali için yoğunluk fonksiyonları bir 51 ŞEKiL 2-4: Şekil 2-2’deki Dağılım Fonksiyonlarına Karşı Düşen Yoğunluk Fonksiyonları delta fonksiyonları dizisinden oluşmaktadır. Her bir delta fonksiyonu, dağılım fonksiyonundaki süreksizliğe uygun olarak, büyüklüğüne eşit bir alana sahiptir. Yoğunluk fonksiyonları hem sürekli ve hem de ayrık fonksiyonların bir araya gelmelerinden oluşabilir. Pek çok farklı matematiksel şekilde karşımıza çıkan olasılık yoğunluk fonksiyonları vardır ancak mühendislikteki sistem analizlerinde bunlardan yalnızca bir kaçı önemlidir. Bunlardan bazıları bu bölümün paragraflarında incelenecektir ve çeşitli yoğunluk fonksiyonlarını içeren tablo EK B’de verilmiştir. Mühendislikte, sistem analizi sorunlarının çözümlerinde sık sık karşılaşılan bir durum, bir raslantı değişkeninin, olasılık yoğunluk fonksiyonu bilinen bir başka raslantı değişkeni ile fonksiyonel olarak bağıntılı olması ve ilk raslantı değişkenine ait olasılık yoğunluk fonksiyonunun hesaplanmasının istenmesidir. Örneğin akım ya da gerilimin olasılık yoğunluğu fonksiyonu bilindiğinde, buna bağlı olarak güç değişiminin olasılık yoğunluk fonksiyonunun bulunması istenebilir. Ya da bir gerilim veya akım üzerinde bazı lineer olmayan çalışmalar yapıldıktan sonra olasılık yoğunluk fonksiyonunun bulunması istenebilir. Bu konuda burada tam bir açıklama yapılmayacaktır, ancak birkaç elemanter kavramın tanıtılması ilerideki çalışmalarımıza yardımcı olacaktır. 52 Şimdi konuya matematiksel bir çerçeve çizmek üzere, Y raslantı değişkeninin, başka bir X raslantı değişkeninin tek değerli, gerçel bir fonksiyonu olduğunu varsayalım. Bunu Y = f(X)* şeklinde yazabiliriz. Burada X’in olasılık yoğunluk fonksiyonu PX(x) verilmiş olsun ve PY(y) ile ifade edeceğimiz Y raslantı değişkeninin olasılık yoğunluk fonksiyonunun bulunması istensin. Eğer bir an için f(X)’i, X’in sürekli, artan bir fonksiyonu olarak değerlendirirsek, ŞEKiL 2-5: Değişkenlerin Dönüştürülmesi Şekil 2-5 (a)’da görülen durum söz konusudur. X raslantı değişkeninin x ve x + dx arasında yer alması ile Y raslantı değişkeninin y + dy arasında yer alacağı açıktır. Bu olayların olasılıkları PX(x).dx ve PY(y).dy olduğundan, pY(y) dy = pX(x) dx * Bu aynı zamanda X’in ve Y’nin olası değerlerinin y = f (x) olarak da bağlantılı olduğunu ifade eder. 53 yazılabilir. Buradan istenen olasılık yoğunluk fonksiyonu dx pY ( y ) = p X ( x ) (2-2) dy elde edilir. Kuşkusuz 2-2 eşitliğinin ikinci tarafında x’e karşı gelen değer y cinsinden yazılmalıdır. Eğer f(X), X’in sürekli, azalan bir fonksiyonu ise, Şekil 2-5 (b), benzer sonuç elde edilecektir, ancak bu kez türev negatif işaret taşır. Olasılık yoğunluk fonksiyonu pozitif olmak zorunda olduğundan ayrıca şeklin geometrisinden de görüleceği gibi türevin mutlak değerinin alınması gerektiği kolayca anlaşılacaktır. O halde her iki durum için de, dx PY(y)=pX(x) (2-3) dy yazılmalıdır. Verilen bir Y için f(X)’in türevlerinin bir kısmının pozitif ve bir kısmının negatif bölgelerde olması durumu da karşımıza çıkabilir. Bu gibi durumlarda kısımlar ayrı ayrı incelenmeli ve karşı gelen olasılık yoğunlukları toplanmalıdır. Bunu açıklamak üzere bütün raslantı değişkenlerinin dönüşümlerini gösterecek bir örnek üzerinde çalışalım. Y = X2 fonksiyonu ile bağlı iki raslantı değişkeni ele alalım. Şekil 2-6 bu durumu göstermektedir ve örneğin, skala faktörü hariç, biri gerilim raslantı değişkenini ifade etmiş olsun. dx/dy türevinin mutlak değeri, dx 1 = dy 2 y olarak verildiğine göre, her bir y değerine iki x değeri karşı gelmektedir. (x = m y ). İstenen olasılık yoğunluk fonksiyonu yalnızca, pY(y)= 1 2 y [p ( y ) + p (− y )] X X y≥ 0 (2-4) 54 X= - y X= y ŞEKİL 2-6: Karesel Düzen Dönüşüm Daha ileri giderek y’nin hiçbir zaman negatif değerler alamayacağı söylenebilir, yani; py(y) = 0 ‘dır. y<0 Raslantı değişkenlerinin dönüşümleri ile ilgili diğer bazı uygulamalar ileride incelenecektir. ALIŞTIRMA 2-3 X raslantı değişkeninin olasılık yoğunluk fonksiyonu pX(x) = K {u(x + 1) - u(x - 1)} şeklindedir. Burada u(.) birim basamak fonksiyonunu ifade eder. a- K değerini hesaplayınız b- X >3/4 için olasılığı hesaplayınız c- X’in minimum değerini bulunuz. 2-4 BEKLENDİK DEĞER ve MOMENTLER İstatistik yöntemlerle ilgili en önemli ve temel kavramlardan biri raslantı değişkeninin ya da raslantı değişkenli fonksiyonların ortalama değerlerinin bulunmasıdır. Zaman fonksiyonları için ortalama değerlerin bulunması, belirli bir zaman aralığında integral alınıp elde edilen değerin bu aralık süresine 55 bölünmesi sureti ile elde edilen, elektrik mühendislerinin yakından bildikleri bir kavram olup, bu şekilde zaman fonksiyonunun de bileşeninin, karesel ortalama değerinin (effektif değer) veya ortalama gücün elde edilmesi sağlanır. Bu tip zaman ortalamaları, zamana bağlı rasgele fonksiyonlar için de önemlidir, ancak zaman fonksiyonunun tek bir zamana karşı gelen değeri ile tanımlanmış tek bir raslantı değişkeni söz konusu olduğunda hiç bir anlam ifade etmez. Bunun yerine, raslantı değişkeninin kabul edilebilir olası değerleri sınır değerleri boyunca integre edilmek sureti ile ortalama değerin bulunması gerekir. Bu tip bir işleme "ensemble ortalaması" adı verilir ve sonuç beklendik değerdir. Beklendik değeri ifade etmede Standard olarak farklı pek çok notasyon kullanılmaktadır, ancak mühendislikte en yaygın olanları X = E[X ] = ∞ ∫ xp( x)dx (2-5) −∞ dir. E[X] sembolü genellikle "X in beklendik değeri" ya da " X’in matematiksel beklendiği" olarak okunur. Daha ileride değineceğimiz, gibi, bir çok halde bir raslantı değişkeninin pratikteki önemi, raslantı değişkeninin ait olduğu rasgele işlemlemeden herhangi örnek fonksiyonunun zaman ortalamasına eşit olması ile belirlenir. Bu durumda bir akım yada gerilim fonksiyonunun beklendik değeri onun dc bileşenini bulmaya özdeştir. Bu akıl yüretme burada açıklama amacı ile kullanılmıştır. x’in herhangi bir fonksiyonunun beklendik değeri benzer hesaplama ile de elde edilebilir. E [ f ( X )] = ∞ ∫ f ( x) p( x)dx (2-6) −∞ f(x) = xn fonksiyonunun, raslantı değişkenlerinin genel momentlerini açıklamakta özel bir önemi vardır. Böylece ∞ [ ] ∫x Xn =E Xn = n p ( x)dx (2-7) −∞ elde edilir. x’in en önemli momentleri n = 1 için yukarıda incelenen beklendik değer ile n = 2 için karesel beklendik değerdir. 56 ∞ [ ] ∫x X2 =E X2 = 2 (2-8) p ( x)dx −∞ Gerçekten karesel beklendik değerin öneminin altını çizmek gerekir. Genellikle bir rasgele gerilim veya akımın karesinin zaman ortalamasına eşit olduğu varsayılabilir. Bu durumda karesel beklendik değer (bir dirençteki) ortalama güç ile orantılıdır ve rasgele gerilim veya akımın etkin (effektif) değerinin karesine eşittir. Aynı ilke ile merkezi momentleri de tanımlamak olasıdır. Bunlar sadece raslantı değişkenleri ile onların beklendik değerleri arasındaki farkların momentleridir. Bu şekilde n inci merkezi moment, (X − X ) n [ ] = E (X − X ) = n ∞ ∫ (x − X ) n p ( x)dx (2-9) −∞ olacaktır. n = 1 için merkezi momentin sıfır olacağı açıktır, n = 2 için merkezi moment oldukça önemlidir ve özel bir adı vardır. Bu ad "değişinti" (variance) olarak bilinir ve ile sembolize edilir. ∞ σ 2 = ( X − X ) = ∫ ( x − X ) 2 p( x)dx 2 (2-10) −∞ Değişik bir yolla değişinti, toplamların beklendik değerlerine ait kuralın kullanılması ile de tanımlanabilir. Bu kural, E [ X 1 + X 2 + ... + X m ] = E [ X 1 ] + E [ X 2 ] + ... + E [ X m ] olarak bilindiğine göre, [ ] [ σ 2 = E ( X − X ) = E X 2 − 2 XX + (X ) 2 2 [ ] ] = E X 2 − 2 E [ X ]X + ( X ) 2 = X 2 + 2 XX + (X ) = X 2 − ( X ) 2 2 (2-11) 57 olur ve görüldüğü gibi değişinti karesel beklendik değer ile beklendik değerin karese arasındaki farka eşittir. Değişintinin karekökü σ "standard sapma" (Standard deviation) olarak bilinir. Elektrik devrelerinde değişinti genellikle gerilim veya akımın ac bileşeninin (bir dirençteki) ortalama gücü ile bağlantılı olmaktadır. Değişintinin karekökü effektif değer ölçen bir voltmetre veya ampermetrenin gösterdiği değer olarak karşımıza çıkar. Yukarıda incelediğimiz beklendik değerler ve momentleri açıklamak üzere, Şekil 2-7 de gösterilen uniform olasılık yoğunluk fonksiyonuna sahip bir rasgele değişken düşünelim. ŞEKiL 2-7: Bir Uniform Olasılık Yoğunluk Fonksiyonu Örneğin bu 20 ve 40 volt arasında lineer olarak değişen testere dişi bir gerilim fonksiyonunun olasılık yoğunluk fonksiyonu olsun. Bu fonksiyon matematiksel olarak şu şekilde tanımlanır. p( x) = 0 = 1/20 =0 − ∞ < x ≤ 20 20 < x ≤ 40 40 < x < ∞ Bu raslantı değişkeninin beklendik değeri 2-5 eşitliğinin kullanılması sureti ile elde edilirse, 58 40 1 1 x2 X = ∫ x( )dx = ⋅ 20 20 2 20 40 = 20 1 (1600 − 400) = 30 40 bulunur. Bu değer, biraz önce de sözünü ettiğimiz, testere dişi dalganın ortalama değerinden başka bir şey değildir. Karesel beklendik değer ise 2-8 eşitliğine göre 40 1 1 x3 X = ∫ x ( )dx = 20 20 3 20 2 40 2 = 20 1 (64 − 8)10 3 = 933.3 60 olur ve bu rasgele değişkene ait değişinti de 2-11 eşitliğinden σ 2 = X 2 − (X ) = 933.3 − (30)2 = 33,3 2 olarak hesaplanır. Temel varsayıma bağlı olarak rasgele işlemleme değerlendirilebilir; eğer testere dişi gerilim bir dc voltmetre ile ölçülse idi 30 voltluk bir değer okunacaktı. Eğer effektif değer ölçen bir ac voltmetre kullanılsaydı (dc’ye cevap vermeyen) bu kez okunacak değer 33.3 volt olacaktı. ALIŞTIRMA 2-4 Bir X rasgele değişkeninin olasılık yoğunluk fonksiyonu 1 p X ( x) = [u ( x) − u ( x − 2)] ’dir. 2 2 Y = X rasgele değişkeni için a-) Beklendik değeri b-) Karesel beklendik değeri c-) Değişintiyi hesaplayınız. 59 2-5 GAUSS (GAUSSIAN) RASLANTI DEĞİŞKENİ İnceleyeceğimiz çeşitli yoğunluk fonksiyonlarından en önemlisi kuşkusuz Gauss ya da Normal yoğunluk fonksiyonudur. Bu fonksiyon pekçok sebeplerden dolayı önemlidir, bunlardan bazıları şu şekilde özetlenebilir. 1- Fiziksel olarak, gözlemlenen raslantı değişkenleri ortamında pek çok farklı durum için iyi bir matematik modeldir. Ayrıca teorik açıdan da iyi bir model olarak yaygınlıkla kullanılmaktadır. 2- Pek çok sayıda rasgele değişkeni uygunlukla içine alabilen, genişlemeye açık birkaç yoğunluk fonksiyonundan biridir. 3- Gauss raslantı değişkenlerinin doğrusal (linear) kombinasyonları yeni fakat gene Gauss olan raslantı değişkenleri elde edilmesini sağlarlar. Hemen hemen diğer pekçok yoğunluk fonksiyonları için bu özellik yoktur. 4- Yalnızca Gauss raslantı değişkeninden türetilmiş rasgele işlemlemelerde, istatistiksel anlamda bütün birinci ve ikinci momentlere ait bilgiler tam olarak elde edilebilir. Diğer işlemlemelerde bu gerçeklenememektedir. 5- Sistem analizinde, doğrusal (linear) ve doğrusal olmayan (nonlinear) durumlarda tam bir istatistiksel analiz için Gauss işlemlemesi genel olarak tektir. Gauss yoğunluk fonksiyonunun matematik ifadesi [ ] [ p( x) = 1 / 2π σ exp − (x − X ) / 2σ 2 2 ] −∞< x<∞ ‘dir. Burada X ve σ 2 sırasi ile beklendik değeri ve değişintiyi ifade etmektedir. Buna karşı gelen dağılım fonksiyonu daha kapalı bir biçimde yazılamaz. Yoğunluk fonksiyonu ile dağılım fonksiyonuna ait şekiller, sırası ile şekil 2-8 (a) ve (b)’de gösterilmiştir. Bu eğriler ile ilgili bazı noktaları açıklamak yararlı olacaktır. Bunlar, 60 1- Yalnızca tek bir maksimum vardır, bu da beklendik değere karşı gelen noktadadır. 2- Yoğunluk fonksiyonu, beklendik değere göre simetriktir. 3- Yoğunluk fonksiyonunun genişliği Standard sapma ( σ ) ile orantılıdır. 2 σ genişliği maksimum değerin 0,607 katına karşı gelen noktada söz konusudur. Bunlar aynı zamanda maksimum mutlak kayma noktalarıdır. ŞEKİL 2-8: Gauss Raslantı Değişkeni (a) Yoğunluk Fonksiyonu (b) Dağılım Fonksiyonu 4- Yoğunluk fonksiyonunun maksimum değeri standard sapma ( σ ) ile ters orantılıdır. Madem ki yoğunluk fonksiyonunun alanı bire eşittir o halde bu fonksiyon σ ’yi sıfıra yaklaştırmak sureti ile impuls veya delta fonksiyonunu ifadede kullanılabilir. Bu matematiksel olarak şu şekilde belirtilir, [ δ ( x − X ) = lim σ →0 (1 / 2π σ ) exp − (x − X ) / 2σ 2 2 61 ] (2-13) Delta fonksiyonunun bu ifade şekli, diğerlerine göre, sonsuza kadar integre edilebilme avantajı sağlamaktadır. Gauss dağılım fonksiyonu, elemanter fonksiyonlar cinsinden kapalı biçimde ifade edilemez. Ancak genelde, tablolanmış bir fonksiyon olarak bilinmektedir. Yoğunluk ve dağılım fonksiyonları arasındaki ilişkiden, genel anlamda, Gauss dağılım fonksiyonu x P( x) = x [ ] 2 ∫ p(u )du = (1 / 2π σ ) ∫ exp − (u − X ) / 2σ du −∞ 2 (2-14) −∞ olarak belirtilebilir. Bu fonksiyon beklendik değerin 0 ve değişintinin 1 değeri için ( X = 0, σ = 1 ) tablolanmıştır. Dağılım fonksiyonu daha çok φ (x) ile gösterilir ve x φ ( x) = (1 / 2π ) ∫ exp[− u 2 / 2]du (2-15) −∞ olarak tanımlanır. Basit değişken dönüşümleri ile genel Gauss dağılım fonksiyonları, φ (x) cinsinden hesaplanabilir. P ( x) = φ [( x − X ) / σ ] (2-16) φ (x) değerleri için hazırlanmış tablo EK D’de verilmiştir. Tablo sadece x’in sıfırdan büyük değerleri için hazırlanmış olduğundan sık sık kullanacağımız bir eşitlik vermek gerekecektir. Bu eşitlik φ (− x) = 1 − φ ( x) (2-17) ‘dir. Gauss rasgele değişkenine ait pek çok önemli özelliklerin varlığı açıktır ancak iki veya daha fazla Gauss rasgele değişkenini içeren problemlerde yararı daha belirgin şekilde ortaya çıkmaktadır. Ayrıca yüksek mertebeden momentlerinin kolayca hesaplanabileceği de unutulmamalıdır. 2-9 eşitliği ile tanımlanan n’inci merkezi moment Gauss rasgele değişkeni için 62 (X − X ) n n tek için n çift için =0 = 1.3.5...(n − 1)σ n (2-18) olacaktır. Bu eşitliğin kullanılmasına bir örnek olmak üzere n = 4 için, dördüncü merkezi moment (X − X ) 4 = 3σ 4 olur. Burada dikkat edilmesi gerekli bir noktayı hatırlatalım, n inci genel moment Xn ile n inci merkezi moment arasındaki bağıntı, n = 2 için daha önce değinilen kadar basit değildir. Örneğin n = 4 için, 4 üncü genel moment Gauss rasgele değişkeni için X 4 = 3σ 4 + 6σ 2 ( X ) 2 + (X ) 4 olmaktadır. Gauss yoğunluk fonksiyonu konusunu bitirmeden önce 2-12 eşitliğinde verilmiş Bernoulli denemeleri ile bütünleşmiş olasılık kavramının n’in büyük değerleri için yaklaşık ifadesini (1-28 eşitliği) karşılaştırmak ilginç olacaktır, k ve n’in tam sayı olmaları durumu hariç De Moivre-Laplace yaklaşımı, beklendik değeri np ve değişinti npq olan Gauss yoğunluk fonksiyonu ile aynı görünümdedir. Bernoulli olasılıklarının ayrık oldukları dikkate alınırsa, bu durum için gerçek yoğunluk fonksiyonları n’in ortalaması ile artan sayıda bir ( δ ) delta fonksiyonları setidir, ve n’in artması sonucu bu delta fonksiyonlarının belirttiği alan Gauss kuralını izler. Bununla yakından ilgili önemli bir başka sonuç da "Merkezi Limit Teoremi"dir. Bu ünlü teorem aynı olasılık yoğunluk fonksiyonuna sahip çok sayıda bağımsız değişkenlerin toplamı ile ilgilidir. Eğer bağımsız raslantı değişkenleri X 1 , X 2, ..., X n ise toplam Y = (1 / n )[ X 1 + X 2 + ... + X n ] 63 olarak tanımlanır. O halde n’in büyük olması halinde, Y’nin yoğunluk fonksiyonu X’lerin yoğunluk fonksiyonlarına bakılmaksızın Gauss yoğunluk fonksiyonuna yaklaşacaktır. Bu teorem daha genel koşullar için de geçerlidir. Ancak burada konumuzun kapsamı dışında kalmaktadır. Önemli olan, fiziksel durumlar olarak karşımıza çıkan ve bir çok bağımsız birleştirilmiş olayın sonucu olan, oldukça rasgelelik içeren durumların tanınmasıdır. Bu, bir iletken içindeki elektronların sıcaklıkla dalgalanışı, bir transistor veya bir elektron tüpünde elektron yada deliklerin çarpışma gürültüsü, ortamdaki turbilans, okyanus dalgaları ve diğer pekçok rasgele değişimlerin fiziksel kaynakları için geçerlidir. O halde bağımsız elemanların olasılık yoğunluk fonksiyonları (ve genel olarak henüz saptanamamış yukarıda değindiğimiz olaylara ait yoğunluk fonksiyonları), gözlemlenen değişimlerin birer Gauss yoğunluk fonksiyonu olarak ele alınması öngörülmektedir. Merkezi limit teoremi bu varsayım için kuramsal bir yalınlık sağlar ve hemen hemen bütün durumlarda deneysel ölçmeler bu varsayıma karşı bir başka alternatif getirmemiştir. ALIŞTIRMA 2-5 Gauss raslantı değişkeninin a-) Beklendik değerinden küçük değerler için olasılığı, b-) Beklendik değerin iki yanında m σ arasında olasılığı bulunuz c-) Olasılığın 0,01’den büyük olmaması için beklendik değerden ne kadar uzaklaşmak gerektiğini ( σ ) değişinti cinsinden bulunuz. 2-6 GAUSS ( RASLANTI DEĞİŞKENİ) İLE BAĞLANTILI YOĞUNLUK FONKSİYONLARI Önceki paragrafta Gauss yoğunluk fonksiyonunun çok önemli olduğunu gösteren bazı nedenleri açıklamıştık. Pratik uygulamalarda karşılaşılan bir başka neden de çok sayıda olasılık yoğunluk fonksiyonunun Gauss yoğunluk fonksiyonu ile bağlantılı olması ve ondan türetilebileceğidir. Bu paragrafın amacı, karşılaşılan bu tip yoğunluk fonksiyonlarını göstermek ve hangi koşullarda karşılaşılacağını belirtmektir. Burada bunların tamamı yerine en önemli birkaçı sıralanmıştır. 64 Güç Dağılımı : Bir devredeki gerilim veya akımın rasgele değişken olması durumunda, direnç elemanından harcanan güç akımın ya da gerilimin karesi ile orantılı rasgele bir değişkendir. Bu durum için dönüşüm 2-3 paragrafında incelenmişti. Burada bir Gauss akım ya da gerilimin gücü ile bütünleşmiş olasılık yoğunluk fonksiyonunun hesaplanmasında kullanılacaktır. Örneğin I bir rasgele değişken I(t1) olsun ve pI(i)’nin Gauss yoğunluğu olarak ele alınsın, güç rasgele değişkeni W, W=R.I2 ile verilir, ve pw(W ) olasılık yoğunluk fonksiyonunun bulunması istenir. 2-4 eşitliğinin bir sonucu olarak bu olasılık yoğunluk fonksiyonu, ( )[ ( pW ( w) = 1 / 2 Rw p I ) ( w / R + pI − w / R )] w≥0 =0 w>0 (2-19) olarak yazılabilir. Eğer I beklendik değeri sıfır olan bir Gauss fonksiyonu ise, [ p I (i ) = (1 / 2π σ i ) exp − i 2 / 2σ I2 ] dir. Burada σ I2 , I akımının değişintisidir, aynı zamanda σ I 'nın akımın etkin (effektif) değeri olarak fiziksel bir anlamı vardır. Ayrıca yoğunluk fonksiyonu pI(i)=pI(-i) olarak simetriktir. Böylece 2-19 eşitliğindeki iki terim eş değerlidir ve gücün olasılık yoğunluk fonksiyonu; [ pW ( w) = (1 / σ I 2π .Rw ) exp − w / 2 Rσ I2 =0 65 ] w≥0 w<0 (2-20) Bu yoğunluk fonksiyonu Şekil 2-9’da verilmiştir. Gücün, doğrudan doğruya hesaplanan beklendik değeri, [ ] W = E RI 2 = Rσ I2 ve gücün değişintisi ise, σ W2 = W 2 − (W ) = E [R 2 I 4 ] − (W ) 2 ( = 3R 2σ I4 − Rσ I2 2 ) 2 = 2.R 2σ I4 olur. ŞEKİL 2-9: Gauss Akımının Gücünün Yoğunluk Fonksiyonu Güç için, olasılık yoğunluk fonksiyonunun ω = 0 değerinde sonsuz olduğunu belirtelim. Bu durumda gücün en olası değeri sıfıra eşittir. Bu da akımın en olası değerinin sıfır olmasından kaynaklanmıştır. Burada (dW/dI) dönüşümünün türevi sıfırdır ve olasılık yoğunluk fonksiyonunda bir delta fonksiyonunun söz konusu olmadığını belirtmek önemli sayılabilir. Rayleigh Dağılımı: Rayleigh olasılık yoğunluk fonksiyonu çeşitli farklı fiziksel durumlarda karşımıza çıkar. Örneğin daha ileride ele alınacak Gauss yoğunluk fonksiyonları olarak ele alınan akım veya gerilim fonksiyonlarının tepe değerleri zarfı Rayleigh yoğunluk fonksiyonu ile çözümlenebilir. Bu yoğunluk fonksiyonu ilk kez farklı frekanslardaki pek çok sinüs dalgasının toplamının zar 66 fını hesaplama amacı ile ortaya atılmıştı (Lord Rayleigh,1880). Aynı zamanda bu yoğunluk fonksiyonu ateşli silahların mermi veya toplarının hedefe yöneltilmeleri ile ve bunlarla bütünleşmiş hatalarla yakından ilgilidir. Eğer birbirine dik koordinat sisteminde, her iki koordinattaki hatalar bağımsız ve Gauss olasılık yoğunluk fonksiyonlarına sahiplerse ve eğer dik koordinat sisteminin orijini hedef olarak saptanmışsa, bir eksen boyunca oluşacak hata X ve diğer eksen boyunca da oluşacak hata Y alınmak sureti ile toplam hatalı mesafe R= X 2 +Y2 olur. X ve Y sıfır beklendik değerli ve eşit değişintili bağımsız Gauss rasgele değişkenleri olduğunda, R ifadesine ait olasılık yoğunluk fonksiyonu, [ p R (r ) = (r / σ 2 ) exp − r 2 / 2σ 2 =0 ] r≥0 r<0 (2-21) olacaktır. Buna Rayleigh olasılık yoğunluk fonksiyonu adı verilir ve 2 Şekil 2-10’da iki farklı σ değeri için gösterilmiştir. Rasgele değişkenin en olası değeri σ değeridir, ancak fonksiyon maksimum noktaya göre simetrik değildir. ŞEKİL 2-10: Rayleigh Olasılık Yoğunluk Fonksiyonu Rayleigh Dağılımına sahip bir rasgele değişkenin beklendik değeri 67 ∞ ∞ 0 0 [ ] R = ∫ rp R (r )dr = ∫ (r 2 / σ 2 ) exp − r 2 / 2σ 2 dr = (π / 2)σ olarak kolayca hesaplanabilir, karesel beklendik değer ise, ∞ ∞ 0 0 [ ] R 2 = ∫ r 2 p R (r )dr = ∫ (r 2 / σ 2 ) exp − r 2 / 2σ 2 dr olmaktadır. Böylece R’nin değişintisi, σ R2 = R 2 − (R ) = [2 − (π / 2)]σ 2 = 0.429σ 2 2 olarak elde edilir. Buradaki değişintisin, Gauss rasgele değişkenlerine ait σ 2 değişintisinden farklı olduğunu belirtelim. Aynı zamanda yoğunluk fonksiyonunun da Gauss yoğunluk fonksiyonuna benzemediğini hatırlatalım. Burada beklendik değer ve değişinti sadece σ 2 paremetresine bağlıdır ve istenildiği gibi değiştirilemez. Rayleigh dağılımının kullanılışı ile Gauss rasgele işlemesinin zarfına varabilmeye daha sonraki bölümde yer verilecektir. Maxwell Dağılımı : Termodinamikte klasik bir problem, ideal bir gaz içindeki bir molekülün hızının olasılık yoğunluk fonksiyonunun bulunmasıdır. Burada temel varsayım her bir hız bileşeninin sıfır beklendik değerli ve σ 2 =k T/m değişintili Gauss rasgele değişkeni olmasıdır. Burada k Boltzmann katsayısını, T mutlak sıcaklığı ve m de molekülün kütlesini ifade etmektedir. Bu şekilde toplam hız, V = V X 2 + VY 2 + VZ 2 68 ‘dir ve buna Maxwell dağılımı adı verilir. Sonuç olarak yoğunluk fonksiyonu. [ pV (v) = 2 / π (v 2 / σ 2 ) exp − v 2 / 2σ 2 =0 olarak verilmiştir. ] v≥0 v<0 (2-22) Maxwell dağılımlı raslantı değişkeninin beklendik değeri (ortalama molekül hızı) bilinen yolla, V = 8 /πσ olarak bulunabilir. Karesel beklendik değer ve değişinti, V 2 = 3σ 2 σ V = V 2 − (V ) = (3 − (8 / π ))σ 2 2 2 = 0,453σ 2 olmaktadır. Kinetik hesaplandığında, enerjinin beklendik değeri buradan ε = (1 / 2)mV 2 ve E [ε ] = (1 / 2 )mV 2 = (3 / 2)mσ 2 = (3 / 2)m(kT / m). = (3 / 2)kT olarak klasik sonuç elde edilir. Chi-Square Dağılımı: Bir raslantı değişkeni olarak, X 2 = Y12 + Y22 + ... + Yn2 tanımlanmışsa, yukarıdaki sonuçların genelleştirilmesi söz konusudur. Burada Y1 , Y2 ,..., Yn sıfır beklendik değerli ve değişintileri 1'e eşit bağımsız Gauss raslantı değişkenleridir. X2 raslantı değişkenine (serbestlik derecesi n olan) Chi-Square Dağılımı adı verilir ve olasılık yoğunluk fonksiyonu, [( p( x 2 ) = x 2 =0 ) n / 2 −1 ] [ / 2 n / 2 (n / 2 − 1)! exp − x 2 / 2 69 ] x2 ≥ 0 x2 < 0 (2-23) ‘dır. Rasgele değişkenlerin (değişintinin 1 olmasını sağlamak sureti ile) uygun olarak normalleştirilmesi ile daha önce incelenen Güç Dağılımı'nın n=1 için Chi-square dağılımına, Rayleigh Dağılımında hatalı mesafenin karesinin (R2), n=2 için Chi-square Dağılımına ve Maxwell Dağılımı'nda hızın karesinin (V2), n=3 için gene Chi - square Dağılımına eşit olduğu görülecektir. Bu son durum molekül enerjisinin olasılık yoğunluk fonksiyonunun elde edilmesine yol gösterecektir. Chi - Square rasgele değişkeninin beklendik değeri ve değişintisi bileşenlerinin değişintilerinin 1 kabul edilmesi nedeni ile kolayca bulunabilir. Bunlar X2 =n (σ ) 2 2 X = 2n ‘dır. Log - Normal Dağılım : Karşılaşılabilecek farklı bir durum da Gauss Dağılımı ile bağlantılı bir rasgele değişkenin, diğer bir rasgele değişkenin logaritması olarak tanımlanması şeklinde ortaya çıkar. Örneğin haberleşme sistemlerinde, taşıyıcı ortamda sinyal gücündeki zayıflama neper birimi ile ifade edilen ve A= ln (W giriş/Wçıkış) neper olarak hesaplanan kavramdır. Burada W giriş ve Wçıkış sırası ile giriş ve çıkıştaki sinyal gücünü belirtmektedir. Deneysel gözlemler gerçekten A zayıflamasının Gauss raslantı değişkenine oldukça yakın olduğunu göstermiştir. Bu nedenle ortaya çıkan sorun güç oranının olasılık yoğunluk fonksiyonunun araştırılmasıdır. Bu sonucu genelleştirmek üzere iki rasgele değişkenin 70 Y = ln X veya eşdeğer olarak X = eY şeklinde bağıntılı olduğunu varsayalım ve Y’nin beklendik değeri Y , değişintisi σ Y2 olan bir Gauss rasgele değişkeni olsun. 2-3 eşitliği kullanılarak X’in olasılık yoğunluk fonksiyonu kolayca yazılabilir. [ ] [ p X ( x) = 1 / 2π σ y x exp − (ln x − Y ) / 2σ Y2 2 =0 ] x≥0 x<0 (2-24) Bu Log-Normal olasılık yoğunluk fonksiyonu olarak bilinir. Mühendislik uygulamalarında 10 tabanı, e tabanından daha sık kullanılmaktadır, ancak e tabanı dönüşüm bakımından daha çok kolaylık sağlar. ŞEKİL 2-11: Log-Normal Olasılık Yoğunluk Fonksiyonu Şekil 2-11 iki farklı yoğunluk fonksiyonunu göstermektedir. LogNormal rasgele değişkenin beklendik değeri ve değişintisi aşağıda verilmiştir. 71 [ ] = [exp(σ ) − 1]exp 2(Y + (1 / 2)σ X = exp Y + (1 / 2)σ Y 2 σX 2 Y2 Y2 ) 2-7 DİĞER OLASILIK YOĞUNLUK FONKSİYONLARI Gauss rasgele değişkenleri ile ilişkili yoğunluk fonksiyonlarına ek olarak pek çok değişik tipte yoğunluk fonksiyonları karşımıza çıkmaktadır. Bunlardan bazıları burada açıklanmış ve hangi durumlarda karşılaşıldığı kısaca özetlenmiştir. Uniform Dağılım : Uniform dağılıma örnek vermek amacı ile, daha önceki paragraflarda kısaca değinilmişti. Burada uniform dağılım genelleştirilecektir. Uniform dağılım çoğu kez rasgele değişken için tercih edilebilir herhangi bir değerin bulunmadığı fiziksel durumlarda karşımıza çıkar. Örneğin rasgele bir anda olan (radyo aktif partiküllerin emisyonu gibi) olayların genellikle eş olasılıklı olduğu varsayılır. Bir sinusoidal kaynağın bilinmeyen faz açısı genel olarak 2 π r radyanlık bir aralık boyunca uniform dağılımlı olarak değerlendirilir. Peryodik bir pulslar dizisinde pulsların zamana göre durumları (radar sinyallerinin taşınması gibi), zamanın sıfır noktasına göre gerçek durumları bilinmediği takdirde, bir peryot boyunca uniform dağılımlı oldukları varsayılır. Bütün bu durumlar ilerideki örneklerde yer alacaktır. Uniform olasılık yoğunluk fonksiyonu genelde p( x) = 1 /( x1 − x 2 ) =0 x1 < x ≤ x 2 dışında (2-25) olarak ifade edilebilir. Buradan kolayca X = (1 / 2)( x1 + x 2 ) (2-26) 72 ve σ X = (1 / 12)( x 2 − x 1 )2 2 (2-27) olduğu görülür. Uniform dağılımın önemli uygulamalarından biri analog - sayısal dönüşümle bütünleşmiş hataların ortaya konmasında kullanışlıdır. Bu işlem, sürekli bir sinyalin herhangi bir andaki değerinin alınıp bunun sabit sayıda binary digitlerine sahip bir binary sayıya dönüştürülmesini içerir. Binary digitlerinin sabit bir sayı yalnızca değerlerin ayrık bir setini verdiğinden, gerçek değerle ona en yakın ayrık değer arasındaki fark bir hata ortaya koyacaktır. Bu durum Şekil 2-12’de gösterilmiştir. Hatanın - ∆x / 2 ile ∆x / 2 aralığında uniform dağılımlı olduğu varsayılır, burada ∆x birbirine en yakın iki değer düzeyi arasındaki farktır. Bu şekilde 2-26 eşitliğinden hatanın beklendik değeri sıfır ve 2-27 eşitliğinden de değişintisi ya da karesel beklendik değeri (1/12)( ∆x )2 olarak bulunur. ŞEKİL 2-12: Analog - Digital Dönüşümde Hata Üstel ve Bağımlı Dağılımlar : Uniform dağılımı incelerken rasgele zaman birimlerinde meydana gelen olayların daha çok bu zaman birimlerinde eş olasılıkla 73 oluştuğunu varsaymıştık. Eğer olaylar arasındaki ortalama zaman aralığı τ ile gösterilirse ∆t zaman aralığında olan bir olayın olasılığı, bu zaman aralığının nerede olduğuna bakılmaksızın yalnızca ∆t/ τ ‘ya eşittir ve olayın olma aralığı ∆t, τ ’ya göre oldukça kısadır. Bu kabulden hareketle, olaylar arasındaki zaman aralığı için bir olasılık dağılım fonksiyonu (ve dolayısı ile yoğunluk fonksiyonu) türetmek olasıdır. Bu türetmeyi yapmak üzere Şekil 2-13’ü ele alalım. Bir olayın t0+ τ ile to+ τ +∆t rasgele zaman aralığında olması olayının olasılığını bulmaya çalışalım. τ için dağılım fonksiyonu P( τ ) olduğunda ∆t aralığında meydana gelecek olayın olasılığı aynı zamanda t0 ile t0+ τ aralığında olayın olmama olasılığı ile to+ τ +∆t aralığında olayın olma olasılıklarının çarpımına eşittir. (Bu iki olay bağımsızdır). O halde, ŞEKİL 2-13: Olaylar Arasındaki Zaman Aralığı 1- P( τ ) = olayın t0 ile t0+ τ aralığında olmama olasılığı ∆t / τ = olayın ∆t aralığında olma olasılığıdır ve P(τ + ∆t ) − P(τ ) = [1 − P(τ )](∆t / τ ) yazılabilir. Her iki tarafın ∆t ’ye bölünmek ve yaklaşmasını sağlamak sureti ile, lim [P (τ + ∆t ) − P(τ )] / ∆t = dP (τ ) / dτ = (1 / τ )[1 − P (τ )] ∆t →0 74 ∆t ’nin sıfıra olacağı açıktır. Elde edilen birinci mertebeden diferansiyel denklemin çözülmesi ile, P(τ ) = 1 − exp[− τ / τ ] τ ≥0 (2-28) elde edilir. Keyfi katsayının bulunmasında, P(0) = 0 olduğu ve τ ’nun negatif olamayacağı olguları değerlendirilir. Olaylar arası zaman aralığına ait olasılık yoğunluk fonksiyonu 2-28 eşitliğinin diferansiyeli alınmak sureti ile P(τ ) = (1 / τ ) exp[− τ / τ ] =0 τ ≥0 τ <0 (2-29) bulunur. Bu üstel olasılık yoğunluk fonksiyonu olarak bilinir ve Şekil 2-14’de ortalama zaman aralığının iki farklı değeri için gösterilmiştir. Kabul edildiği gibi, τ ’nun beklendik değeri yalnızca ŞEKİL 2-14: Üstel Olasılık Yoğunluk Fonksiyonu ∞ E [τ ] = ∫ (τ / τ ) exp[− τ / τ ]dτ = τ 0 değişinti ise σ τ = (τ )2 2 olarak karşımıza çıkar. 75 Bu yoğunluk fonksiyonunun yalnızca tek bir parametresi vardır (Rayleigh gibi). Bu nedenle beklendik değerle değişinti birbirlerine bağlı olup, birinin bulunması ile diğeri kolayca hesaplanabilir. Üstel dağılımın bir uygulamasını göstermek üzere, bir uzay gemisinde bir elemanın diğerlerinden bağımsız olarak bozulması düzgün olarak ortalama 100 günde olmaktadır. Bu uzay gemisi bütün elemanları fonksiyonlarını tam yapacak şekilde 200 günlük bir görev üstlenmiştir. Herhangi bir elemanın bozulmadan görevini tamamlaması olasılığı nedir? Bu, ilk elemanın bozulmasının 200 günden daha fazla olması olayının olasılığını bulmaya eşdeğerdir, ve basit olarak, P(200); bu aralığın 200 güne eşit yada daha küçük olduğunu belirttiğine göre, {1-P(200)} ‘e eşittir. O halde 2-28 eşitliğinden 1 − P(τ ) = 1 − [1 − exp{−τ / τ }] = exp{−τ / τ } ve τ = 100 , τ = 200 için 1 - P(200) = exp[-200/100] = 0.1352 olacaktır. Üstel dağılımdaki rasgele değişkenler birbirine yakın olaylar arasındaki zaman aralığıdır. Bu rasgele değişken, herhangi bir olayla onu izleyen k inci olay arasındaki zaman aralığı olarak genelleştirilebilir. Bu rasgele değişken için olasılık yoğunluk fonksiyonu "ERLANG DAĞILIMI" olarak bilinir. [ ] pk (τ ) = τ k −1 exp[− τ / τ ] / (τ ) (k − 1)! k =0 τ ≥0 τ <0 k=1,2,3,.. (2-30) Bu tip bir rasgele değişken k inci mertebeden Erlang rasgele değişkeni adını alır. Üstel dağılım k = 1 için bu dağılımın özel bir halidir. Genel olarak beklendik değer ve değişinti sırası ile k τ ve 2 k (τ ) ’ye eşittir. Genel Erlang dağılımı mühendislikte sistemlerin güvenirliğini ilgilendiren pek çok uygulama alanına sahiptir. Örneğin bir sistemin aboneleri 76 (kullanıcıları) için bekleme süresi (telefon ve trafik sistemleri gibi), bir haberleşme sisteminde belirli sayıdaki abonenin rasgele konuşma talep ve sürelerini sağlamak üzere kanal sayısı vs. gibi. Erlang dağılımı aynı zamanda küçük bir notasyon değişikliği yapılarak gamma dağılımı ile bağlantılı olmaktadır. β = 1 / τ ve α da k’nın tamsayı değerlerine karşı gelen sürekli bir parametre olduğunda, gamma dağılımı; [ ] p (τ ) = β α τ α −1 / τ (α ) exp[− βτ ] =0 τ ≥0 τ <0 (2-31) olmaktadır. Gamma dağılımına ait beklendik değer ve değişinti sırası ile α / β ve α/β2 ‘dir. Delta Dağılımı : Daha önce değindiğimiz gibi, olası olaylar yalnızca ayrık bir setin değerleri olarak varsayıldığında, karşı gelen olasılık yoğunluk fonksiyonu bir delta fonksiyonları seti olarak karşımıza çıkar. Bu kavramı formülleştirmek ve olası herhangi bir uygulamasını göstermek yararlı olacaktır. Bir örnek olmak üzere Şekil 2-15’de gösterilen binary dalga şeklini ele alalım. Bu dalga şekli, verilen bir tepe değeri için en büyük ortalama gücü ile pekçok haberleşme ve kontrol sisteminde karşımıza çıkan bir şekildir. ŞEKiL 2-15: Genel Bir Binary Dalga Şekli 77 İleride, rasgele işlemleme konusunda, daha ayrıntılı inceleyeceğiz, ancak şimdi belirli herhangi bir anda X = x(t1) olarak bir rasgele değişken ele alınacaktır. Bu rasgele değişkenin sadece x1 ve x2 gibi iki olası değer alacağı kabul edilir. x1 değerini alma olasılığı p1 ve x2 değerini alma olasılığı p2=1–p1 olarak değerlendirilirse, X’in olasılık yoğunluk fonksiyonu, (2-32) p( x) = p1δ ( x − x1 ) + p 2δ ( x − x 2 ) olur. Bu rasgele değişkene ait beklendik değer; ∞ X = ∫ x[ p δ ( x − x ) + p δ ( x − x )]dx 1 1 2 2 −∞ = p1x1+p2x2 olarak kolayca elde edilebilir. Karesel beklendik değer de benzer şekilde, ∞ 2 X = ∫ x [ p δ (x − x ) + p δ (x − x )]dx 2 1 1 2 2 −∞ = p1x12 + p2x22 bulunur, o halde değişinti, σ 2 = X 2 − (X ) = p1 x12 + p 2 x 22 − ( p1 x1 + p 2 x 2 )2 2 = p1 p 2 ( x1 − x 2 ) 2 olur. Burada p2 yerine 1–p1 yazılmak sureti ile son şekline varılabilir. Herhangi sayıda ayrık değerleri olan rasgele değişkenler için mevcut delta dağılımlarının benzerlik gösterdiği açıktır. O halde x1, x2, ..., xn gibi n olası ayrık değer söz konusu ise ve her bir değere karşı gelen olasılıklar P1, P2,..,Pn ise, olasılık yoğunluk fonksiyonu; n p ( x ) = ∑ p i δ ( x − xi ) (2-33) i =1 olacaktır. 78 n ∑p =1 i i =1 olduğu bilinmektedir. Yukarıdaki teknik aynen uygulanarak bu rasgele değişkenin beklendik değeri n X = ∑ pi xi i =1 olarak, karesel beklendik değer de n X 2 = ∑ pi xi2 i =1 olarak hesaplanabilir. Buradan değişinti, σ 2 X n = ∑ pi x − ∑ pi x i i =1 i =1 n 2 2 i n n = (1 / 2)∑∑ p i p j (xi − x j ) 2 i =1 i =1 olarak elde edilecektir. Çok değerli delta dağılımı, haberleşme ve kontrol sistemleri ile bağlantılı olarak ortaya çıktığı gibi, analog - digital dönüşüm gerektiren sistemler için de karşımıza çıkar. Tipik olarak değer sayıları 2’nin kuvvetleri olan tam sayılar seti bir binary digitler seti olarak gösterilebilir. 2-8 KOŞULLU OLASILIK VE YOĞUNLUK FONKSİYONLARI Koşullu olasılık kavramı, ayrık olayların oluşları ile bağlantılı olarak 16 paragrafında tanıtılmıştı. Anımsanacağı gibi bu, aynı bir olasılık uzayında olmuş bir olaya göre bir diğer olayın olasılığının ne olacağının bulunması idi. Bu kavramın sürekli bir rasgele değişken için genelleştirilmesi istenebilir. Bu paragraftaki incelemeler tek bir rasgele değişkeni kapsamına alacak biçimde sunulacak, tanım ve örnekler verilecektir. İki veya daha çok rasgele değişken için açıklamalar üçüncü bölümde yer alacaktır. 79 İlk olarak, bir X rasgele değişkeni için olmuş bir M olayı verildiği halde koşullu olasılık dağılım fonksiyonunun ne olacağı sorunu yanıtlanmalıdır. Bir an için M olayının herhangi bir olay olduğu düşünülürse dağılım fonksiyonu genel olarak P( x / M ) = Pr[X ≤ x | M ] = Pr[ X ≤ x, M ] / Pr( M ) Pr( M ) > 0 (2-34) yazılır. Burada, {X ≤ x, M } ve X (ζ ) ≤ x ζ ∈M koşulunu eşitliğinin kullanılması ile setin sürekli durum için karşılığı elde edilir. P(x/M)’in geçerli bir olasılık dağılım fonksiyonu olduğu gösterilebilir ve dolayısı ile diğer dağılım fonksiyonları ile aynı özelliğe sahip olması gerekir. Bunlar şu şekilde özetlenebilir. 1. 0 ≤ P ( x | M ) ≤ 1 −∞< x < ∞ 2. P (−∞ | M ) = 0 P (∞ | M ) = 1 3. P ( x | M ) x’in artan değerleri ile azalmaz. 4. Pr[x 1 < X ≤ x 2 | M ] = P( x 2 | M) − P( x1 | M) ≥ 0 x1 < x 2 için Şimdi koşul ile ilgili olarak M olayı hakkında açıklama yapmak gereklidir. Bunun için çeşitli durumlar karşımıza çıkar. Örneğin, 1- M olayı, X rasgele değişkeni cinsinden belirtilebilen bir olay olabilir. Buna ilişkin örnekler bu bölümde ele alınacaktır. 2- M olayı, bir başka rasgele değişkene bağlı sürekli ya da ayrık bir olay olabilir. Buna ilişkin örnekler bir sonraki bölümde incelenecektir. 3- M olayı, hem X rasgele değişkenine ve hem de başka bir rasgele değişkene bağlı bir olay olabilir. Bu oldukça karmaşık durum incelenmeyecektir. 80 Yukarıda sıralanan ilk alternatifi göstermek üzere, M olayı M {X ≤ m} olduğunu kabul edelim. Bu halde 2-34 eşitliğine göre koşullu olasılık dağılım fonksiyonu P( x | M) = Pr{X ≤ x | M ≤ m} = Pr{X ≤ x, M ≤ m}/ Pr{X ≤ m} olarak yazılabilir. Şimdi x’in ya da m’in daha büyük olması durumları için olası iki alternatif söz konusudur. Eğer x ≥ m ise X ≤ m olayı, X ≤ x olayını da kapsamına alır ve Pr{X ≤ x, X ≤ m} = Pr{X ≤ m} yazılabilir. Bu nedenle, P( x | M) = Pr{X ≤ m}/ Pr{X ≤ m} = 1 x≥m elde edilir. Diğer yandan eğer x ≤ m ise o halde {X ≤ x} olayını da kapsamına alacak ve P( x | M) = Pr{X ≤ x}/ Pr{X ≤ m} = P( x) / P(m) bulunacaktır. Bunlara göre, koşullu olasılık dağılım fonksiyonu sonuç olarak Şekil 2-16’da gösterilmiştir m Şekil 2-16: Bir Koşullu Olasılık Dağılım Fonksiyonu 81 Koşullu olasılık yoğunluk fonksiyonu daha önce açıklanan şekli ile dağılım fonksiyonu ile ilişkilidir. (2-35) p ( x | M ) = dP ( x | M ) / dx Bu,daha önce incelenen olasılık yoğunluk fonksiyonuna ait özellikleri taşımaktadır, bunlar; 1. p ( x | M ) ≥ 0 −∞< x < ∞ ∞ 2. ∫ p(x M )dx = 1 −∞ ∞ 3. P ( x | M ) = ∫ p(u / M )du −∞ x2 4. ∫ p( x | M)dx = Pr[x 1 < X ≤ x2 | M] x1 olarak sıralanabilir. Eğer Şekil 2-16 örnek olarak alınırsa koşullu olasılık yoğunluk fonksiyonu ∞ p ( x | M ) = (1 / P (m))(dP ( x) / dx) = p ( x) / P (m) = p ( x) / ∫ p( x)dx , x<m −∞ =0 x≥m olacaktır. Bu durum Şekil 2-17’de gösterilmiştir. ŞEKİL 2-17: Şekil 2-16’ya Karşı Düşen Koşullu Yoğunluk Fonksiyonları 82 Koşullu olasılık yoğunluk fonksiyon aynı zamanda koşullu ortalama değerlerin ve koşullu beklendik değerlerin bulunması amacı ile kullanılabilirler. Örneğin koşullu beklendik değer ∞ ∫ xp( x | M )dx E[X|M] = (2-36) −∞ ve daha genel biçimde, herhangi bir f(X)’in koşullu beklendik değeri ∞ E[f(X)|M] = ∫ f ( x) p( x | M )dx (2-37) −∞ olarak ifade edilir. Koşullu beklendik değeri göstermek üzere yukarıdaki p(x)’in Gauss yoğunluk fonksiyonu olduğu varsayılsın, p( x) = (x − X )2 exp − 2σ 2 2π σ 1 Örneğin basitleştirmek üzere m = X olsun. O halde, m= X ∫ (1 / P ( m) = ) [ ] 2π σ exp − (x − X ) / 2σ 2 dx = 1 / 2 2 −∞ ve ) [ ( ] p (x M ) = p ( x) /(1 / 2) = 2 / 2π σ exp − (x − X ) / 2σ 2 , 2 =0 x< X x≥ X olur. Bu şekilde beklendik değer, E [x M ] = X ∫ 2x / −∞ 0 = [ ] 2π σ exp − (x − X ) / 2σ 2 dx ∫ 2(u + X )/ 2 [ ] 2π σ exp − u 2 / 2σ 2 du −∞ = X − 2 /πσ olacaktır. Sözcüklerle ifade edersek, bu sonuç, verilen bir rasgele değişkene göre bir Gauss rasgele değişkenin koşullu beklendik değeri kendi beklendik değerinden daha küçük ve 83 X− 2 π ‘dir. σ 2-9 ÖRNEKLER VE UYGULAMALAR Şimdiye kadar incelenen konularda sürekli bir rasgele değişkenin olasılık dağılım ve olasılık yoğunluk fonksiyonları temel kavramlarına değinilmişti. Bu konuyu iki ve daha çok rasgele değişken için açmadan önce bunların basit mühendislik problemlerine nasıl uygulanacağını bir kaç örnekle göstermek yararlı olacaktır. Birinci örnek olmak üzere Şekil 2-18 (a)’da gösterilen elemanter gerilim regülasyon devresini ele alalım. Bu devre Şekil 2-18 (b)’de gösterildiği gibi ideal akım-gerilim karakteristiğine sahip bir zener diyotla sağlanmıştır. Bu devrede gerilim Vz = 10 ŞEKİL 2-18: Zener Diyod Gerilim Regülatörü (a) Regülatör Devresi (b) Zener Diyod Karakteristiği Volt'a ulaşana kadar akım sıfırdır ve bundan sonra diyot uçlarındaki gerilim sabit kaldığı sürece dış devreye akım verilecektir. Bu tip bir devre genellikle katı-hal düzenlerine sınırlı gerilim uygulanabilmesi amacı ile kullanılır. Örneğin RL, 9 Volt ile çalışan transistorlu bir amplifikatör devresi olabilir ve eğer gerilim 10 Volt'u geçerse bu cihaz zarar görebilir. Kaynak gerilimi Vs olup nominal değeri 12 Volt’tur. Ancak onun gerçek dalga şekli bir testere dişi dalgalanma gösterir ve bu nedenle bir rasgele değişkendir. Amacımız için bu rasgele değişkenin 9 ile 15 Volt arasında ünifom bir dağılım gösterdiği varsayılacaktır. 84 Zener diyotlar özellikleri açısından V2 gerilimlerinin yanı sıra güç kayıpları açısından da sınırlıdırlar. Bu nedenle ortalama gücü W z = 3 Watt olan bir diyot için çalışmalarımızı sürdüreceğiz. O halde istenen R seri direncinin gerekli kayıp limitleri içinde değerinin bulunması olacaktır. Zener diyot iletimde iken uçlarındaki gerilim V2=10 Volt ve içinden geçen akım IS = VS − V Z − IL R ve VS > VZ (R + RL ) 10(R + 10) = RL 10 Burada IL yük akımı 1A’dır. Diyottaki güç kaybı, WZ = V Z I Z = = VZ (V S − VZ ) − I LV Z R 10VS − 100 − 10 R VS>R+10 olacaktır. Bu gücün, kaynak gerilimi Vs’in bir fonksiyonu olarak grafiği Şekil 2-19’da ve Vs ile W z’nin olasılık yoğunluk fonksiyonları da Şekil 2-20’de gösterilmiştir. ŞEKİL 2-19: Diyod Güç Tüketimi ile Kaynak Gerilimi Arasındaki Bağıntı 85 ŞEKİL 2-20: (a) Vs’in Olasılık Yoğunluk Fonksiyonu (b) W z’in Olasılık Yoğunluk Fonksiyonu Wz’nin yoğunluk fonksiyonunun sıfırda büyük bir delta fonksiyonuna sahip olduğu görülmektedir. O halde diyot büyüklük bir zaman kesiminde iletimde değildir, ancak W z ile Vs bu sınırlar içinde doğrusal olarak bağımlı olduklarından W’nin daha büyük değerleri için üniformdur. Paragraf 2-3’de incelenen yoğunluk fonksiyonlarının dönüşümleri ile pW ( w) = PV (R + 10 )δ (w) + R RW pv + R + 10 10 10 =0 50 − 10 R bu sınırlar dışında 0≤w≤ olduğu kolayca görülecektir. Burada Pv(.) VS’in dağılım fonksiyonudur. O halde δ fonksiyonun belirttiği alan yalnızca diyodun iletime geçmesine sebep olan Vs gerilim değerinden daha az olma olasılığıdır. Diyodun güç kaybına ait beklendik değer, E [WZ ] = WZ = ∞ ∫ wp (w)dw W −∞ ∞ = ∞ R ∫ wP (R + 10)δ (w)dw + ∫ w 10 p V V 0 −∞ 86 Rw + R + 10 dw 10 olarak verilir. Birinci integral (delta fonksiyonunun w=0’da olması nedeni ile) sıfıra eşittir. İkinci integral uniform yoğunluk fonksiyonu 1 pV (v ) = 6 ,9 < v ≤ 15 cinsinden yazılarak (50 / R )−10 WZ = ∫ 0 (5 − R ) R 1 w dw = 1.2 R 10 6 2 bulunur. Diyotta güç kaybının beklendik değerinin 3 Watt'a eşit ya da daha küçük olması gerektiğinden (5 − R )2 ≤3 1 .2 R R ≥ 2.19Ω 0<R≤5 olacaktır. R’nin 2,19 ohm’dan büyük değerleri için 3 Watt sınır koşulu sağlanmış ve devrenin uygunlukla çalışacağı anlamı çıkar. Gerçekte R direncinin seçimi 12 volt’luk kaynak geriliminde istenen çıkış gerilimi yolu ile hesaplanır. Eğer istenen çıkış gerilimi 9 volt ise R değeri, R= 3 = 3.33Ω 9 10 olacaktır. Bu değer 2,19 ohm’luk koşul değerinden daha büyüktür ve uygundur. Bir başka örnek olarak, Şekil 2-21’de gösterilen bir dc voltmetresi için ölçme alanını artırıcı bir direnç seçilmesi sorununu ele alalım. Elimizdeki ölçme aletinin 1000 ohm iç dirençli olduğunu ve içinden 100 mikro amper geçtiğinde tam sapma yaptığını varsayalım. Ölçme aletine 10 volt uygulandığında tam sapma sağlanması için seçilmesi gereken R direncinin değerinin ne olması gerektiği sorusuna yanıt aramaktayız. 87 ŞEKİL 2-21 Voltmetre Direnci Seçimi Bunu sağlayan R direncinin nominal değeri (R* ile göstereceğimiz) R* = (10/10-4) – 1000 = 9,9 x 104 Ω dur. Ancak bu direnç 105 ohm’luk dirençlerin bulunduğu bir kutudan rasgele seçilerek kullanılacaktır. Üretim toleransları açısından gerçek direnç, beklendik değeri 105 ohm ve Standard sapması 1000 ohm olan bir rasgele değişkendir. Bu rasgele değişken bir Gauss rasgele değişkeni olarak değerlendirilecektir. (Standard sapmanın, beklendik değer yanında küçük olması durumlarında bu genel bir kabul sayılmaktadır. Büyüklükler açısından çok doğru olmasa bile pozitif oldukları sürece sorun yoktur). Bu varsayımlarla oluşturulacak voltmetrenin sınıfının 2’den büyük olmama olasılığını araştırmaya çalışalım. Direncin kabul edilebilir en küçük değeri Rmin = [ (10-0,2)/ 10-4] -1000 = 9,7x104 ve en büyük değeri Rmax = [ (10+0,2)/ 10-4] -1000 = 10,1x104 olur. Rasgele seçilen direncin olasılığı bu iki limit arasında olacaktır. 88 [ 4 4 ] 10 ,1×10 4 ∫ p (r )dr PC = Pr 9,7 × 10 < R ≤ 10,1 × 10 = (2-38) R 9 , 7×10 4 burada pR(r), R direncine ait Gauss olasılık yoğunluk fonksiyonudur ve ( ) ( ) r − 10 5 1 pR(r) = exp − 2 10 6 2π (1000 ) 2 olarak bilinmektedir. 2-38 eşitliği ile verilen integral standard Gauss dağılım fonksiyonu, Φ (.) , cinsinden ifade edilebilir. Bu şekilde ( ) ( PC = Φ 10,1 × 10 4 − 10 5 / 10 3 − Φ 9,7 × 10 4 − 10 5 / 10 3 ) bulunur. Basitleştirerek, PC = Φ (1)- Φ (-3) = Φ (1) – [1Φ (3)] elde edilir. Ek D’de verilen tablodan değerler alınmak sureti ile Pc = 0,8413 - [1 - 0.9987] = 0.8400 bulunur. Bu sonuç herhangi bir kaynaktan seçilen direnç nominal olarak gerçek değerinde olmasa bile, mevcut olasılığın, ölçme aleti için kabul edilebilir duyarlık sınırları içinde kaldığını ortaya koymaktadır. Üçüncü ve son örnek koşullu olasılığa ait bir uygulamayı öngörmektedir. Bu örnek bir otoyolda bütün araçların hızının ölçülmesi ve 70 mil/h’ten fazla hız yapan araçların hızlarını kaydeden bir trafik ölçüm sistemine aittir. Eğer araçların hızı Rayleigh dağılımına uygun bir rasgele değişken ve en olası hız değeri 50 mil/h’e eşit ise, aşırı hızların beklendik 89 değerinin ne olacağının bulunması istenmektedir. Bu araçların hızlarının, hız limitinden büyük hızlara göre koşullu beklendik değeri bulmaya ve ondan limitin çıkarılmasına eşdeğerdir. Araç hızı S ile gösterilirse, aranan koşullu dağılım fonksiyonu, P[s S > 70] = Pr{S ≤ s, S > 70} Pr{S > 70} (2-39) olur. Madem ki pay yalnızca S>70 için sıfırdan farklıdır, o halde 2-39 eşitliği P[s|S>70] = 0 [P(s ) − P(70)] = [1 − P(70)] s ≤ 70 (2-40) s>70 olarak yazılabilir. Burada P(.), S raslantı değişkeninin olasılık dağılım fonksiyonudur. 2-40 eşitliğinin payı sadece S’in 70 ile s arasındaki olasılığı ifade eder. Paydası ise S’in 70’ten büyük olma olasılığıdır. Koşullu olasılık yoğunluk fonksiyonu 2-40 eşitliğinin s’e göre diferansiyeli alınmak sureti ile bulunur. Bu şekilde P(s|S>70) = 0 p (s ) = (1 − P(70)) s ≤ 70 s > 70 elde edilir. Burada p(s) 2-41 eşitliği ile verilen Rayleigh yoğunluk fonksiyonudur. Bu fonksiyon Şekil 2-22’de gösterilmiştir. s − s2 p (s ) = . exp 2 2 (50) 2(50) =0 90 s≥0 s<0 (2-41) ŞEKİL 2-22: Rayleigh Dağılımlı Raslantı Değişkeninin Koşullu ve Koşulsuz Yoğunluk Fonksiyonları P(70) değeri 2-41 eşitliği ile kolayca elde edilebilir. s s2 49 P(70) = ∫ . exp − ds = 1 − exp− 2 2 50 0 (50 ) 2(50 ) 70 olur. O halde 49 1 - P(70) = exp − 50 olacaktır. Koşullu beklendik değer ise, ∞ s2 − s2 1 exp ds 2 49 70∫ (50)2 ( ) 2 50 exp − 50 49 7 = 70 + 50 2π . exp 1 − Φ 50 5 = 70 + 27,2 E [S S > 70] = olarak bulunur. Bu şekilde aşırı hızın beklendik değeri 27,2 mil/h olmaktadır. Ancak Rayleigh modelinin trafik sistemleri için uygun bir model olmadığı, sonucun incelenmesinden kolayca görülmektedir. (Gerçek olgulara göre 27,2 mil/h aşırı hız oldukça fazladır). Ancak bu örnek koşullu beklendik değerin genel hesaplama tekniğini göstermek açısından yararlıdır. 91 PROBLEMLER 2-1 İki zar atıldığında ilgilendiğimiz olay üst yüklerin toplamı olsun. Bu toplam bir raslantı değişkeni olarak alındığında, a-Bu raslantı değişkenine ait olasılık dağılım fonksiyonunu çiziniz. b-Bu raslantı değişkeninin 7 ile 9 arasındaki değerleri için olasılık nedir? c-Aynı işlemi 5 zarın atılması olayı için düşünerek buna ait olasılık dağılım fonksiyonunu çiziniz. 2-2 Bir X raslantı değişkenine ait olasılık dağılım fonksiyonu şekilde görülmektedir. a-Px(0), nedir? b-X raslantı değişkeninin 0 < x ≤ ∞ aralığında olasılığı nedir? c-X raslantı değişkeninin 5 < x ≤ 10 aralığında olasılığı nedir? 2-3 Bir güç kaynağına her biri 2 watt çeken 5 yük, tek tek veya bir arada bağlanabilmektedir. Her yük diğerlerinden bağımsız olarak zamanın dörtte biri kadar devrede kalmaktadır. a-Kaynaktan çekilen gücün dağılım fonksiyonunu çiziniz. b-Kaynaktan çekilen gücün yoğunluk fonksiyonunu çiziniz. c-Eğer kaynak yalnızca 6 watt çıkış verebiliyorsa, yük gereksinmesini karşılama olasılığı nedir? 2-4 Bir X raslantı değişkeninin olasılık yoğunluk fonksiyonu p ( x ) = A.e − x x>1 =0 x ≤1 olarak verilmiştir. a-A katsayısının değerini bulunuz. b-X raslantı değişkeninin 1 < x ≤ 2 için olasılığı bulunuz. c-X raslantı değişkeninin olasılık dağılım fonksiyonunu çiziniz. 92 2-5 Problem 2-4’teki raslantı değişkeni için, a-Beklendik değeri, b-Karesel beklendik değeri, c-Değişintiyi, bulunuz. 2-6 Bir raslantı değişkeninin olasılık yoğunluk fonksiyonu, 1 p( x ) = , − 3 ≤ x ≤ 7 10 = 0 , dışında olarak verilmiştir. a-Beklendik değeri, b-Karesel beklendik değeri, c-Değişintiyi, d-Dördüncü merkezi momenti bulunuz. 2-7 a-P(x); sıfır beklendik değerli Gauss raslantı değişkenine ait dağılım fonksiyonu olduğuna göre, beklendik değeri X olan Gauss dağılımı için aşağıdaki ifadeyi ispatlayınız P(x - X ) = 1 - P( X - x) b-X bir Gauss raslantı değişkeni olsun, X değerlerinin %10'u 60’ın altında ve %5'i 90’ın üstünde yer alıyorsa, X’in beklendik değer ve değişintisi ne olur? 2-8 Bir Gauss raslantı değişkeninin beklendik değeri 2 ve değişintisi 4’tür. a-Olasılık yoğunluk fonksiyonunu yazınız. b-Yoğunluk fonksiyonunun x=2, x=0 ve x=4 için değerlerini hesaplayınız. c-X raslantı değişkeninin 0’dan büyük ve ikiden büyük değerleri için olasılıkları bulunuz. d-X raslantı değişkeninin ( X − σ ) < x ≤ ( X + σ ) için olasılığı bulunuz. 2-9 Bir Gauss akımının beklendik değeri 1 A ve Standard sapması 4 A’dir. Bu akım 10 ohm’luk bir dirençten geçirilmektedir. a-Dirençte harcanan gücün beklendik değerini hesaplayınız. b-Dirençte harcanan gücün değişintisini hesaplayınız. c-Akımın beklendik değerinin, gücün beklendik değer ve değişintisine etkisi nasıldır? 93 2-10 Gauss gerilim ya da akımla ilgili güce ait olasılık yoğunluk fonksiyonunun sonsuza gittiği noktada, gerilim ve akımın sıfır olduğunu gösteriniz (2-20 eşitliği). 2-11 Düz bir yüzeyde yuvarlanan bilyaların ortogonal hız bileşenleri, sıfır beklendik değer ve 10 feet/s standard sapmalı bağımsız Gauss raslantı değişkenleridir. a-Bilyaların en olası hızı (toplam hız) nedir? b-Hızın beklendik değeri nedir? c-Bir bilyanın hızının 20 feet/s’den büyük olma olasılığı nedir? 2-12 Görülen fonksiyon, Simpson veya üçgen yoğunluk fonksiyonu olup üçgen ikizkenardır. a-Olasılık yoğunluk fonksiyonu p(x) için bir ifade yazınız. b-Beklendik değeri hesaplayınız. c-Değişintiyi hesaplayınız. 2-13 θ raslantı değişkeni 0 ile 2π arasında uniform dağılım göstermektedir. θ ile bağlantılı X raslantı değişkeni X = cos θ eşitliği ile verildiğine göre, a-X raslantı değişkeninin olasılık yoğunluk fonksiyonunu bulunuz. b-X’in beklendik değerini hesaplayınız. c-X’in değişintisini hesaplayınız. 2-14 a-Problem 2-13’deki raslantı değişkeni için, p(x|M) koşullu olasılık yoğunluk fonksiyonunu bulunuz.Burada M olayı, ( 0 ≤ θ ≤ π / 2 )’dir ve bu fonksiyonu çiziniz. b-Aynı olay için koşullu beklendik değeri hesaplayınız. 2-15 Bir radar sisteminin gönderdiği darbe işaretlerinin genlikleri Rayleigh dağılımı göstermektedir. Bu darbe genliklerinin olasılık yoğunluk fonksiyonu 2 p(r ) = r.e − r / 2 r≥0 =0 r<0 94 şeklinde olsun, ancak radar ekranında gözlenen darbeler, gürültünün önlenmesi için belirlenen r0 sınır değerinden büyük bir R değerine sahip olmalıdır. a-Ekranda görülen darbelerin olasılık yoğunluk fonksiyonunu bulunuz ve çiziniz, p(r|R>r0) . b-Ekrana çıkan darbeler için koşullu beklendik değeri hesaplayınız. 2-16 Bir M olayı, M=(m1<X ≤ m2 ) olarak verilmiştir. a- P(x|M), koşullu olasılık dağılım fonksiyonunun [P(x ) − P(m1 )] P (x M ) = m1 < x ≤ m2 [P(m2 ) − P(m1 )] =0 x ≤ m1 =1 x > m2 şeklinde olduğunu gösteriniz. b- p(x) = (1/8)x =0 0< x≤4 dışında verildiğine göre, p(x|M)'i M=(1<X ≤ 3) için bulunuz. 2-17 Bir X raslantı değişkeni, bir Y raslantı değişkenine lineer olan aşağıdaki bağıntı ile bağlıdır. Y = aX + b Bu tür bir dönüşüm sistem analizinde çok yaygındır. a-pY(y) yoğunluk fonksiyonunu, pY(x) cinsinden bulunuz. b-X raslantı değişkeni için beklendik değer X ve değişinti σ X2 olduğunda Y raslantı değişkenine ait beklendik değer ve değişintiyi bulunuz. 2-18 Elektronik ac voltmetrelerin değişik tipleri, uygulanan dalga şekillerinin farklı karakteristikleri ile orantılı sapmalar yaparlar. Buna rağmen skalalar bir sinüs işaretinin effektif değerini ölçmek amacı ile ölçeklendirilirler. Bir başka dalga şekli için okunan değer effektif değer olmayabilir. Bu alete sıfır beklendik değer ve 10 V Standard sapmalı bir Gauss gerilimi uygulandığı varsayılsın. Aşağıdaki şıklar için 95 aletten ne okunacaktır? a-Ölçmede tam dalga doğrultulmuş dalga şeklinin ortalaması sapma ile orantılıdır. Bunun anlamı X(t) uygulandığında sapma X(t)’nin mutlak değerinin beklendik değeri ile orantılı olacağıdır. b-Ölçmede sapma dalga şeklinin zarfının ortalaması ile orantılıdır. Gauss dalga şeklinin zarfının Rayleigh dağılımı olduğu hatırlanmalıdır. KAYNAKLAR: Bölüm 1’deki kaynaklara bakınız. Özellikle Beckmann, Lanning ve Battin, Papoulis ve Parzen. 96 BÖLÜM 3 İKİ VEYA DAHA ÇOK RASLANTI DEĞİŞKENİ 3-1 İKİ RASLANTI DEĞİŞKENİ Şimdiye kadar yapılan bütün incelemeler tek bir raslantı değişkeni içeren durumlar üstünde odaklanmıştı. Örneğin bu raslantı değişkeni herhangi bir andaki bir akım ya da gerilimin değeri olabiliyordu. Ancak, rasgele bir akım ya da gerilimin herhangi bir andaki değeri, zaman fonksiyonunun tümünün yapısını belirtme açısından yeterli değildir. Bu tip zaman fonksiyonları sonlu olsalar bile onlarla bütünleşmiş sonsuz sayıda raslantı değişkene sahiptirler. Bu nedenle sürekli zaman fonksiyonlarının durumlarının, tek bir raslantı değişken ile gerçeğe daha yakın nasıl tanımlanabileceği sorunu gündeme gelmektedir. Bu bölümün amacı iki raslantı değişkeni ele alarak bu genişletebilme çabasında ilk adımı atmaktır. Bu yaklaşım, sonsuz sayıdaki raslantı değişkene yönelik amaç için önemli olmayan bir aşama olarak değerlendirilebilir, ancak ileride daha iyi anlaşılacağı gibi, iki raslantı değişkenin zaman olarak birbirinden keyfi bir zaman aralığı kadar ayrılmasının sağlanması gereksinme duyulan tek durumdur. Eğer raslantı değişkenleri, zaman olarak, herhangi iki an için tanımlanabiliyorsa, o halde hemen hemen bilinen bütün sistem analizi yöntemlerinin kullanılması ile zaman fonksiyonunun büyük bir kısmına ait bütün bilgiler elde edilebilir. Sistem analizinde karşılaşılan bir başka durum da sistemin giriş ve çıkışı arasında, gerek aynı anda ve gerekse farklı anlarda, bir bağıntının bulunmasının gerekliliğidir. Burada da gene iki raslantı değişken söz konusudur. İki raslantı değişkeni içeren durumların daha iyi anlaşılmasını sağlamak açısından, bir önceki bölümde incelediğimiz olasılık dağılım ve olasılık yoğunluk fonksiyonları kavramlarını geliştirmek gerekmektedir. Sözü edilen bu iki raslantı değişkeni X ve Y ile gösterilirse BİLEŞİK OLASILIK DAĞILIM FONKSİYONU P( x, y ) = Pr[ X ≤ x, Y ≤ y ] olarak tanımlanır. Bunun yalnızca; X raslantı değişkeninin x'e eşit veya küçük olması olayının ve Y raslantı değişkeninin de y'ye eşit veya küçük olması olayının olasılığı olduğunu belirtelim. 97 telim. Buradan doğrudan doğruya bir raslantı değişkeni için var olan olasılık dağılım fonksiyonu genişletilebilir. Bileşik olasılık dağılım fonksiyonu daha önce tek bir.değişken için incelenenler ile tamamen benzer özelliklere sahiptir. Bunlar aşağıdaki gibi özetlenebilir. 1. 0 ≤ P( x, y ) ≤ 1 2. P(− ∞, y ) = P( x,−∞ ) = P(− ∞,−∞ ) = 0 3. P(∞, ∞ ) = 1 4. P( x, y ) x ve y’nin artan değerleri ile azalmaz. 6. P(∞, y ) = PY ( y ) , P( x, ∞ ) = PX ( x ) Yukarıda özetlenen bu 5 maddeden de anlaşılacağı üzere Px(x) ve PY(y) ile gösterilen bu iki dağılım fonksiyonunun aynı bir matematiksel fonksiyon olması gerekmez. Bileşik olasılık dağılım fonksiyonuna bir örnek olmak üzere iki madeni paranın atılmasındaki oluşları ele alalım; ilk madeni para ile ilgili raslantı değişken X olsun ve yazı gelirse 0 tura gelirse 1 değerine sahip olduğunu varsayalım. Benzer şekilde ikinci madeni para ile ilgili değişken Y ve gene yazı ve tura gelmesi sırası ile 0 ve 1 olarak gösterilsin. Buna ait bileşik olasılık dağılım fonksiyonu P(x,y) Şekil 3-1’ de gösterilmiştir ve görüleceği gibi yukarıda sıralanan tüm özellikleri sağlar. ŞEKİL 3-1: Bileşik Olasılık Dağılım Fonksiyonu 98 Bileşik olasılık yoğunluk fonksiyonunu dağılım fonksiyonunun diferansiyeli olarak tanımlamak olasıdır. Madem ki iki ayrı değişken söz konusudur o halde diferansiyel kısmı diferansiyel olarak ele alınmalıdır. p ( x, y ) = ∂ 2 P ( x, y ) ∂x∂y (3-1) Burada diferansiyel alınma sırası önemli değildir. Olasılık elemanı; p(x,y) dx dy = Pr [x < X ≤ x + dx, y < Y ≤ y + dy] (3-2) olarak bilinir. Bileşik olasılık yoğunluk fonksiyonunun özellikleri tek bir raslantı değişkeni için açıklanandan farklı olmayıp aşağıdaki gibi özetlenebilir. 1- p(x,y) ≥ 0 −∞< x < ∞ −∞ < y < ∞ ∞ ∞ 2- ∫ ∫ p(x, y )dxdy = 1 − ∞− ∞ x y 3- P ( x, y ) = 4- p X ( x ) = ∫ ∫ p(u, v )dvdu − ∞− ∞ ∞ ∫ p(x, y )dy pY ( y ) = −∞ 5- Pr[x1 < X ≤ x 2 , y1 < Y ≤ y 2 ] = ∞ ∫ p(x, y )dx −∞ x2 y2 ∫ ∫ p(x, y )dydx x1 y1 İkinci maddenin, herhangi bileşik olasılık yoğunluk fonksiyonunun altında kalan alanın 1’e eşit olduğunu belirttiğini not edelim. Bileşik olasılık yoğunluk fonksiyonuna ait bir örnek olmak üzere yoğunluk fonksiyonları x1 ve x2 arasında ve de y1 ve y2 arasında sabit olan bir çift raslantı değişkeni ele alalım. Bu halde 99 p( x, y ) = 1 (x2 − x1 )( y 2 − y1 ) , x1 < x < x2 y1 < y < y2 , dışında =0 (3-3) Buna ait yoğunluk fonksiyonu ve karşı gelen dağılım fonksiyonu Şekil 3-2’de gösterilmiştir. ŞEKİL 3-2 : (a) Bileşik Dağılım (b) Yoğunluk Fonksiyonları Bileşik olasılık yoğunluk fonksiyonu, tek bir raslantı değişkenin yoğunluk fonksiyonunda olduğu gibi, iki raslantı değişkene ait beklendik değerlerin hesaplanmasında kullanılabilir. Genelde f(XY) gibi herhangi fonksiyonun beklendik değeri E [ f ( X , Y )] = +∞+∞ ∫ ∫ f (x, y ) p(x, y )dxdy (3-5) − ∞− ∞ olarak bulunabilir. ilerideki bölümlerde f(X,Y) = X.Y olması durumu için bulunacak beklendik değer daha ayrıntılı olarak incelenecektir. Bu beklendik değer İLİŞKİ (CORRELATlON) olarak bilinir ve E [ XY ] = ∞ ∞ ∫ ∫ xy. p(x, y )dx.dy − ∞− ∞ (3-4) 100 eşitliği ile verilmiştir. Bu hesaplamaya basit bir örnek olarak Şekil 32(b)’de gösterilen bileşik yoğunluk fonksiyonunu ele alalım. Belirli bir bölge dışında her yönde sıfıra eşit olduğuna göre, 3-4 eşitliği 2 2 1 E [XY ] = ∫ dx ∫ xy dy ( x 2 − x1 )( y 2 − y1 ) x1 y1 x y x2 = (x2 − x1 )( y 2 − y1 ) 2 1 = y 2 2 x1 x2 y1 y2 1 (x1 + x 2 )( y1 + y 2 ) 4 olarak yazılabilir. Bileşik olasılık yoğunluk fonksiyonuna ait 4. özellik, bileşik olasılık yoğunluğunun değişkenlerden biri boyunca integre edilmesi ile diğer değişkene ait basit olasılık yoğunluk fonksiyonunun elde edilebileceğini belirtmektedir. Buna göre, Şekil 3-2’teki yoğunluk fonksiyonu için, y2 p x ( x) = ∫ (x y1 = = 1 2 − x1 )( y 2 − y1 ) 1 dy [y ] −y ) y2 (x2 − x1 )( y 2 1 y1 1 x 2 − x1 (3-6a) ve x2 pY ( y ) = ∫ (x x1 = = 1 2 dx − x1 )( y 2 − y1 ) 1 (x2 − x1 )( y 2 1 y 2 − y1 [x ] −y ) x2 1 x1 (3-6b) 101 olarak basit olasılık yoğunluk fonksiyonları elde edilir. ALIŞTIRMA 3-1 Yukarıda incelenen örnekte x1 = 1 , x2 verilmiştir. = 2 , y1 = 1 ve y2 = 4 olarak a-) X ≥ 1 ve Y ≥ 3 için olasılığı hesaplayınız b-) X ≥ 1,5 ve Y ≤ 2 için olasılığı hesaplayınız c-) E [X Y]’yi bulunuz. 3-2 KOŞULLU OLASILIĞA YENiDEN BAKIŞ Şimdi iki raslantı değişkeni için bileşik olasılık kavramını tanıtmaya çalıştık. Sırası gelmişken daha önce incelediğimiz koşullu olasılığı daha genelleştirmek olasıdır. Koşullu olasılık yoğunluk fonksiyonunun önceki tanımında verilen herhangi keyfi bir M olayı söz konusu idi ve bununla ilgili bir örnek verilmişti, incelememizde bu kez M olayının herhangi başka bir Y raslantı değişkeni ile bağlantılı olması durumu ele alınacaktır. Verilen bir M olayının Y değişkeni cinsinden ifade edilmesinde pek çok farklı yollar mevcuttur. Örneğin M olayı Y ≤ y olayı olabilir. O halde Pr(M) yalnızca Y raslantı değişkeninin basit olasılık yoğunluk fonksiyonuna eşit olacaktır, PY(y). Bir önceki bölümde 2-34 eşitliği ile verilen koşullu olasılık dağılım fonksiyonunun temel tanımından PX (x Y ≤ y ) = Pr[ X ≤ x, M ] P ( x, y ) = Pr( M ) PY ( y ) (3-7) olduğu görülecektir. Bir başka olası tanım da M'nin y1<Y ≤ y2 olayı olması durumudur. Gene 2-34 eşitliği yardımı ile, PX (x y1 < Y ≤ y 2 ) = P( x, y 2 ) − P( x, y1 ) PY ( y 2 ) − PY ( y1 ) (3-8) elde edilir. Yukarıda açıklanan her iki durum için de M olayı sıfır olmayan bir olasılığa sahiptir: Pr(M) > 0 . Ancak en yaygın koşullu 102 olasılık biçimi Y = y olması durumudur. Y’nin sürekli dağılım gösterdiği bütün durumlarda Pr(M) = 0’dır. Koşullu olasılık dağılım fonksiyonu bir oran olarak tanımlandığından genellikle bu durumlar için de var olacaktır. Bu y1=y ve y2 =y+ ∆ y olmasını sağlamak ve ∆ y’nin limitte sıfıra yaklaştırmak sureti ile 3-8 eşitliğinden elde edilebilir. P ( x, y + ∆y ) − P( x, y ) ∂P ( x, y ) / ∂y = ∆y → 0 P ( y + ∆y ) − P ( y ) ∂PY ( y ) / ∂y Y Y PX (x Y = y ) = lim x ∫ p(u, y )du = (3-9) −∞ pY ( y ) Buna karşı gelen koşullu olasılık yoğunluk fonksiyonu da p X (x Y = y ) = ∂PX (x Y = y ) ∂x = p ( x, y ) pY ( y ) (3-10) olacaktır. Bu şekil en yaygın kullanılan şekildir. X ve Y’nin yerleri değiştirilmek sureti ile pY ( y X = x ) = p ( x, y ) p X (x ) (3-11) elde edilir. Koşullu yoğunluk fonksiyonunun bu şekli oldukça sık kullanılır ve daha kısa bir ifade ile gösterilebilir. Herhangi bir karıştırma tehlikesi yoksa koşullu yoğunluk fonksiyonları p ( x, y ) pY ( y ) p ( x, y ) p( y x ) = p X (x ) p (x y ) = (3-12) (3-13) olarak yazılabilir. Bu iki eşitlikten, 1-19 paragrafında ayrık durum için verilen, BAYES TEOREMİ 'nin sürekli durum için ifadesi elde edilebilir, p(x1y)’ler kısaltılmak sureti ile p( y x ) = p (x y ) p Y ( y ) p X (x ) (3-14) 103 Gene 3-12 ve 3-13 eşitliklerinden yararlanarak toplam olasılığı hesaplamak olasıdır. p X (x ) = ∞ ∞ −∞ −∞ ∞ ∞ −∞ −∞ ∫ p(x, y )dy = ∫ p(x y )p ( y )dy Y (3-15) ve pY ( y ) = ∫ p(x, y )dx = ∫ p(y x ) p (x )dx X (3-16) Bu eşitlikler, 1-18 ile ayrık durum için verilen eşitliklerin sürekli durum için karşılıklarıdır. Koşullu yoğunluk fonksiyonlarının kullanılışı farklı pek çok durumda karşımıza çıkar, ancak en yaygın olanı (ve büyük olasılıkla en basiti) gözlenen herhangi bir büyüklüğün, iki büyüklüğün toplamı olması durumudur. Genellikle bizim karşılaşacağımız konularda bunların sinyal ve gürültü olduğu düşünülebilir. Örneğin, X(t) sinyalinin N(t) gürültüsü ile bozulmuş olduğunu varsayalım, ancak gözlemleyebileceğimiz tek büyüklük bu ikisinin Y(t) toplamı olacaktır. Bu durumda birbiri ile bağlantılı uç raslantı değişkeni söz konusudur ve aralarındaki bağıntı Y=X+N olmaktadır. Burada gözlenen Y değerine göre X’in koşullu olasılık yoğunluk fonksiyonunun bulunması istenmektedir p(x/y). Gözlenen Y değerine göre X’in en olası değerinin ne olduğu ilgimizi çekmektedir, bu X’in gerçek değeri (yani X’in gürültüden bağımsız bir şekilde gözlemlenen değeri) için bu koşullu olasılık p (x y ) = p( y x ) p X (x ) pY ( y ) olacaktır. Eğer p(y/x)’in bulunması istenmiş olsaydı tek sorun N gürültü sinyali olacak ve buna ait PN(n) yoğunluk fonksiyonunun bilindiği varsayılacaktı. Bu şekilde N=Y – X ve X’e göre p( y x ) = p N (n = y − x ) = p N ( y − x) 104 İstenen koşullu olasılık yoğunluğu p(x/y) şimdi p (x y ) = p N ( y − x ) p X (x ) = pY ( y ) p N ( y − x ) p X (x ) (3-17) ∞ ∫ p ( y − x ) p (x )dx N X −∞ olarak yazılabilir. Paydadaki integral 3-16 eşitliğinden hesaplanabilir. Bu şekilde eğer sinyalin px(x) yoğunluk fonksiyonu ve gürültünün pN(n) yoğunluk fonksiyonu biliniyorsa, p(x/y) koşullu olasılık yoğunluk fonksiyonunu hesaplamak mümkündür. Y’nin y1 gibi bir değeri gözlenmiş olsun. p(x/y1) için x’in değerinin maksimum olması, X’in gerçek değeri için iyi bir kestirim (yaklaşım) demektir. Yukarıdaki açıklamaları daha iyi değerlendirebilmek amacı ile koşullu olasılığa bir örnek vermeye çalışalım. Sinyalin X raslantı değişkeni olduğunu ve üstel bir yoğunluk fonksiyonuna sahip bulunduğunu varsayalım. pX(x)= b.exp (-bx) =0 x ≥0 x<0 Bu tip bir yoğunluk fonksiyonu örneğin bir uzay probunun algıladığı bir sinyal olarak karşımıza çıkabilir. Uzay probu belirli zaman aralıklarında yüksek enerji partiküllerini sayabilir ve bunları yeryüzüne göndermek amacı ile gerilime dönüştürebilir. Sinyale karışan gürültünün Gauss dağılımlı ve sıfır beklendik değerli olduğu varsayılırsa, gürültünün yoğunluk fonksiyonu, p N (n ) = n2 exp − 2 2π σ N 2σ N 1 olacaktır. 3-17 eşitliğinin paydasında görülen Y'nin yoğunluk fonksiyonu ( y − x )2 pY ( y ) = ∫ exp − exp[− bx ]dx 2 2π σ N 2σ N 0 2 y − bσ N 2 b 2σ N b = exp − by + 1 + erf 2 2 2 σ N ∞ b (3-18) 105 olur. Buradaki hata fonksiyonu (erf) normal olasılık dağılım fonksiyonu ile ilgilidir ve erf ( z ) = 2 π z ∫ε −u 2 ( ) du = 2Φ 2 z − 1 0 olarak tanımlanır. Herhangi şekilde yalnızca p(x/y) aranırsa, x’in bir fonksiyonu olmaması nedeni ile pY (y)’yi hesaplamak gerekmez. O halde verilen bir Y için pY(y) yalnıza bir sabittir. İstenen koşullu yoğunluk fonksiyonu 3-17 eşitliğinden ( y − x )2 b p (x y ) = exp − exp[− bx] 2 2π σ N pY ( y ) 2σ N =0 x≥ 0 x <0 (3-19) şeklinde de yazılabilir. Şekil 3-3 y’nin iki farklı değeri için bu durumu göstermektedir. ŞEKİL 3-3: p(x|y) fonksiyonu (a) y < bσ 2 için (b) y > bσ 2 için 106 Daha önce değindiğimiz gibi, özel bir Y değeri gözlendiğinde, X’in gerçek değeri için uygun bir yaklaşım (kestirim) p(x/y)’yi maksimum yapan x değeridir. Koşullu olasılık yoğunluk fonksiyonu; üs minimum olduğunda x’e göre maksimum olmaktadır. O halde x’in bu değeri üs ifadesinin türevinin sıfıra eşitlenmesi sureti ile hesaplanabilir. Bu şekilde 2 2x – 2(y-b σ N ) = 0 x = y - bσ N 2 (3-20) 2 elde edilir. Bu, y-b σ N > 0 koşulu sağlandığında maksimum noktasını belirler. Aksi halde p(x/y) üzerinde sıfır eğimli bir nokta yoktur ve en büyük değer x =0’da meydana gelecektir. Bu sebeple varsayalım ki Y = 2 y1 değeri gözlensin. Eğer y1>b σ N ise X için yaklaşık kestirim 2 2 Xˆ = y − bσ olur. Diğer yandan eğer y1<b σ ise X için yaklaşık 1 N N 2 kestirim Xˆ = 0 olacaktır. Gürültünün daha küçülmesi, ( σ N → 0 ) , ile X’in kestiriminin, gözlenen y1 değerine yaklaşacağını belirtelim. ALIŞTIRMA 3-2 0-10 volt aralığında uniform dağılımlı bir de sinyali, 0 beklendik değerli ve 2V2 değişintili bağımsız, Gauss dağılımlı bir gürültü sinyali mevcutken ölçülmüştür. a-) Sinyal voltajı 0<y0<10 arasında ölçülmüş olsaydı, b-) Sinyal voltajı y0<0 için ölçülmüş olsaydı, c-) Ölçülen değer yo = 5 volt olsaydı, gürültü sinyaline ait en iyi kestirimler ne olacaktı? 3-3 iSTATiSTiK BAĞIMSIZLIK istatistik bağımsızlık kavramı, ayrık olaylarla bağlantılı olarak daha önce tanıtılmıştı, ancak sürekli halde de aynı oranda önem taşımaktadır. Çeşitli fiziksel kaynaklardan ortaya çıkan raslantı değişkenleri hemen hemen daima istatistik olarak bağımsızdırlar. Örneğin bir devredeki bir direncin ürettiği rasgele termal gerilim, bir başka direnç tarafından üretilen rasgele termal gerilim ile hiçbir şekilde bağlantılı değildir. 107 Raslantı değişkenleri aynı kaynaktan fakat farklı zamanlar için tanımlanmışlar olsa bile gene istatistik bağımsızlık söz konusu olabilmektedir. Örneğin aynı bir direncin yarın üreteceği termal gerilim, bugün ürettiği termal gerilime bağlı değildir. Eğer iki raslantı değişkeni istatistik olarak bağımsız ise bir raslantı değişkeni hakkındaki diğeri hakkında herhangi bir özellik belirtmez. İstatistik olarak bağımsız raslantı değişkenlerinin bileşik olasılık yoğunluk fonksiyonları, daima iki basit olasılık yoğunluk fonksiyonunun çarpımı olarak ifade edilebilir. Bu bağıntı, p(x,y) = pX(x)pY(y) (3-21) olup istatistik bağımsızlığın tanımı olarak kullanılabilir. Tanım için bu ifade gerekli ve yeterlidir. Bir örnek olmak üzere bu koşulu sağlayan bileşik olasılık yoğunluk fonksiyonu 3-3 eşitliğinde görülmektedir. O halde bu iki raslantı değişkeni istatistik olarak bağımsızdır. İstatistik bağımsızlığın sonuçlarından biri de 3-5 eşitliği ile tanımlanan ilişki (correlation) ile ilgilidir. Bileşik olasılık yoğunluk fonksiyonu ayrılabilir olduğundan 3-5 eşitliği E [ XY ] = ∞ ∞ ∫ xp (x )dx ∫ yp ( y )dy X −∞ Y −∞ = E [X ]E [Y ] = X Y (3-22) olarak yazılabilir. O halde iki istatistiksel bağımsız raslantı değişkenin çarpımının beklendik değeri yalnızca onların beklendik değerlerinin çarpımına eşittir. Eğer herhangi birinin beklendik değeri sıfıra eşit ise sonuç sıfıra eşit olacaktır. İstatistik bağımsızlığın bir diğer sonucu da koşullu olasılık yoğunluk fonksiyonlarından basit olasılık yoğunluk fonksiyonlarına geçilebilmeyi sağlamasıdır. Örneğin 3-12 eşitliği hatırlanırsa, p (x y ) = p ( x, y ) pY ( y ) 108 ve eğer X ile Y istatistik olarak bağımsız iseler bileşik olasılık, basit olasılıkların çarpımı olarak ifade edilebileceğinden, p (x y ) = p X ( x ) pY ( y ) = p X (x ) pY ( y ) p( y x ) = p( x, y ) p X ( x ) pY ( y ) = = pY ( y ) p X (x ) p X (x ) ve benzer şekilde, elde edilir, 3-4 RASLANTI DEĞİŞKENLERİ ARASINDA İLİŞKİ (CORRELATION) Yukarıda değinildiği gibi, bileşik olasılık yoğunluk fonksiyonunun önemli uygulamalardan biri, iki raslantı değişkenin ilişkisini (correlation) ortaya koymaktır. Bu, bir raslantı değişkenin herhangi şekilde diğer raslantı değişkene bağlı olup olmadığı demektir. X ve Y raslantı değişkenleri olası x ve y değerlerine sahiplerse, bunların çarpımlarının beklendik değeri, ilişki olarak bilinir ve 3-5 eşitliği ile tanımlanır. E [XY ] = ∞ ∞ ∫ ∫ xyp(x, y )dxdy = XY (3-5) − ∞− ∞ Eğer iki raslantı değişkenin ikisininde ayrı ayrı beklendik değerleri sıfırdan farklı ise, raslantı değişkenlerden beklendik değerlerin çıkarılması sureti ile ilişkinin bulunması çok daha kolaylıkla elde edilebilir. Böylece, E [( X − X )(Y − Y )] = ( X − X )(Y − Y ) ∞ ∞ = ∫ ∫ (x − X )( y − Y )p(x, y )dxdy (3-23) − ∞− ∞ bulunur. Buna COVARIANCE (kovaryans) adı verilmektedir. İki raslantı değişkeni için covariance, tek bir raslantı değişkeni için variance (değişinti) ve analogdur. Eğer iki raslantı değişkenin ilişkisinin mertebesinin (derecesi), onlara ait büyüklükler dikkate alınmaksızın, bulunması 109 istenirse o zaman İLİŞKİ KATSAYISI veya NORMALLEŞTİRİLMİŞ COVARIANCE aranan yaklaşık büyüklük olmaktadır. İlişki katsayısı ρ ile gösterilir ve X − X Y − Y σ X σ Y ρ = E ∞ ∞ x − X y − Y . p ( x, y )dxdy = ∫ ∫ σY − ∞− ∞ σ X (3-24) olarak tanımlanır. Burada her bir raslantı değişkenden beklendik değerinin çıkarıldığını ve standard sapmaya bölündüğünü hatırlatalım. Bu şekilde elde edilen raslantı değişkeni genellikle "standardlaştırılmış değişken" olarak adlandırılır. Standardlaştırılmış bir raslantı değişkenin beklendik değeri sıfıra ve değişintisi 1’e eşittir. İlişki katsayısı ρ ’nın bazı özelliklerini incelemek üzere ve n raslantı değişkenlerini standardlaştırılmış değişkenler olarak tanımlayalım. ξ= X−X η= σX ξ =0 Y −Y σY η =0 2 ση2 = 1 σξ = 1 O halde ρ = E [ξη ] olacaktır. Şimdi [ ] [ ] E (ξ ± η ) = E ξ 2 ± 2ξη + η 2 = 1 ± 2 ρ + 1 = 2(1 ± ρ ) ( 2 ) ve ξ m η 2 daima pozitif olduğundan onun beklendik değeri de pozitif olmak zorundadır. O halde 2(1 ± ρ ) ≥ 0 110 yazılabilir. Buradan ρ ’nun 1’den daha büyük sayısal bir değer alamayacağı görülmektedir. Yani -1 ≤ ρ ≤ 1 dır. Eğer X ve Y istatistik olarak bağımsız iseler ρ = E [ξη ] = ξη = 0 olur, çünkü her ikisinin de beklendik değeri sıfırdır. Bu şekilde, istatistik olarak bağımsız raslantı değişkenleri için ilişki katsayısı daima sıfıra eşittir. Ancak tersinin doğru olduğu söylenemez, ilişki katsayısının sıfır olması (ileride görüleceği üzere Gauss dağılımlı olmadıkları sürece) X ve Y’nin istatistik bağımsızlığını belirtmez. İlişki katsayısı herhangi bir çift raslantı değişkeni için tanımlanabilir ancak özellikle raslantı değişkenlerinin ayrı ayrı ya da bileşik olarak Gauss dağılımlı olmaları durumu için özel bir önemi vardır ve oldukça kullanışlıdır. Bu gibi durumlarda bileşik olasılık yoğunluk fonksiyonu aşağıdaki gibi yazılabilir. p( x, y ) = 1 2πσ X σ Y 1 − ρ 2 . − 1 (x − X )2 ( y − Y )2 2(x − X )( y − Y )ρ exp + − (3-25) 2 2 σ XσY σY 2 2 1 − ρ σ X ( ) ρ = 0 için bu denklem aşağıdaki şekli alacaktır, 1 (x − X )2 ( y − Y )2 p( x, y ) = exp− + 2 2πσ X σ Y σ Y 2 2 σ X = p X (x ) pY ( y ) 1 Bu ifade istatistik olarak bağımsız Gauss raslantı değişkenlerini belirtir. O halde ρ = 0 olması, değişkenlerin Gauss dağılımlı olmaları durumu için istatistik bağımsızlığı ifade eder. 111 Genel olarak herhangi raslantı değişkenleri için bazı sonuçları değerlendirmede ilişki katsayısını kullanmak ilginç olabilir. Örneğin standardlaştırılmış değişken tanımından hareket ederek ve X = σ Xξ + X Y = σ Yη + Y yazılabilir ve buradan XY = E [(σ X ξ + X )(σ Y η + Y )] = E [σ X σ Y ξη + Xσ Y η + Y σ X ξ + XY ] (3-26) = ρσ X σ Y + XY olmaktadır. Daha başka bir örnek olmak üzere, [ ] [ ] E ( X ± Y ) = E X 2 ± 2 XY + Y 2 = X 2 ± 2 XY + Y 2 2 = σ + (X ) ± 2 ρσ X σ Y ± 2 XY + σ Y2 + (Y ) 2 X 2 2 = σ X2 + σ Y2 ± 2 ρσ X σ Y + (X ± Y ) 2 verilebilir. Son terim yalnızca ( X m Y ) ’nin beklendik değerinin karesi olduğundan ( X m Y ) ’nin değişintisi [σ ( ] 2 X ±Y ) = σ X2 + σ Y2 ± 2 ρσ X σ Y (3-27) olacaktır. Raslantı değişkenleri ilişkili olmadıklarında (uncorrelated, ρ = 0 ), toplamın veya farkın değişintisi, ayrı ayrı değişintilerinin toplamına eşittir. ALIŞTIRMA 3-4 X, Y, Z olan üç raslantı değişkeni, yeni bir raslantı değişkeni oluşturmak amacı ile toplanmıştır, W=X+Y+Z 112 Raslantı değişkenleri arasında normalleştirilmiş ilişki katsayıları; ρ XY = 0 , ve ρ XZ = 1 / 2 ρ YZ = −1 / 2 ‘dir. Raslantı değişkenlerine ait beklendik değerler ve değişintiler ise X =1 , Y =1 , 2 2 2 σ X = σY = σ Z =1 Z = −1 olarak verilmiştir, a-) W’nin beklendik değerini , b-) W’nin değişintisini bulunuz. 3-5 İKİ RASLANTI DEĞİŞKENİNİN TOPLAMININ YOĞUNLUK FONKSİYONU Yukarıdaki incelemeler iki raslantı değişkenin toplamı (veya farkı) ile bütünleşmiş beklendik değer ve değişintinin, ayrı ayrı raslantı değişkenlerinin beklendik değerleri ve değişintileri ile ilişki katsayısının bilinmesi sureti ile raslantı değişkenlere ait olasılık yoğunluk fonksiyonlarına gerek duyulmaksızın hesaplanabileceğini göstermektedir. Ancak iki raslantı değişkenin toplamının olasılık yoğunluk fonksiyonunun bulunması daha güç bir sorun olarak karşımıza çıkar. Bununla ilgili bir durum burada yalnızca iki raslantı değişkenin istatistik olarak bağımsız olması durumu için ele alınacaktır. En genel durumun incelenmesi konumuzun dışında kalmaktadır. X ve Y, olasılık yoğunluk fonksiyonları pX(x) ve pY(y) olan, istatistik olarak bağımsız iki raslantı değişkeni olsun ve toplamları Z=X+Y ifadesi ile verilsin. Z’nin olasılık yoğunluk fonksiyonu pz(z)’nin bulunması istendiğinde bu durum en iyi şekilde, 3-4’te gösterildiği gibi grafik olarak açıklanabilir. 113 ŞEKİL 3-4: X+Y=Z < z Bölgesinin Gösterilişi Z için olasılık dağılım fonksiyonu yalnızca PZ ( z ) = Pr (Z ≤ z ) = Pr ( X + Y ≤ z ) olur ve bileşik olasılık yoğunluk fonksiyonu p(x,y)’nin x+y=z çizgisinin altında kalan kısım boyunca integrasyonu ile bulunabilir. x , her bir sabit y değeri için − ∞ < x < z − y koşulunu sağlamak zorundadır. Bu şekilde PZ ( z ) = ∞ ∞ ∫ ∫ p(x, y )dx.dy (3-28) − ∞− ∞ olduğundan, X ve Y’nin istatistik olarak bağımsız olması özel hali için bileşik olasılık yoğunluk fonksiyonu ayrılabileceğinden PZ ( z ) = ∞ ∞ ∫ ∫ p (x ) p ( y )dxdy X Y − ∞− ∞ ∞ = ∫ p ( y )∫ p (x )dxdy Y X −∞ yazılabilir, Z’nin olasılık yoğunluk fonksiyonu, PZ(z)’nin, z’ye göre diferansiyeli alınmak sureti ile elde edilir. 114 p Z (z ) = dPZ ( z ) ∞ = ∫ p y ( y ) p X ( z − y )dy dz −∞ (3-29) Z yalnızca ikinci integralin üst sınırında mevcut olduğuna göre yukarıdaki ifade ile elde edilir. Böylece Z’nin olasılık yoğunluk fonksiyonu sadece X’in ve Y’nin olasılık yoğunluk fonksiyonlarının KONVOLUSYONU'dur. 3-28 eşitliğinin görünmektedir. aşağıdaki PZ ( z ) = şekilde yazılabileceği açıklıkla ∞ ∞ ∫ ∫ p(x, y )dydx − ∞− ∞ ve aynı şekilde olasılık yoğunluk fonksiyonu p Z (z ) = ∞ ∫ p (x ) p (z − x )dx X Y (3-30) −∞ olarak yazılabilir. 3-29 ve 3-30 eşitlikleri sistem analizinde yakından tanıdığımız konvolusyon integralinin iki eş biçimde yazılmasından başka bir şey değildir. Bu işlemi bir örnek üzerinde göstermek amacı ile şekil 3-5’te verilen iki yoğunluk fonksiyonu ele alalım. ŞEKİL 3-5: İki Raslantı Değişkenine Ait Yoğunluk Fonksiyonu Bunlar analitik olarak; 115 ve pX(x) = 1 = 0 0 ≤ x ≤1 dışında py(y) = e-y =0 y≥0 y<0 olarak ifade edilebilirler. Konvolusyon Z’nin sıfırdan büyük ve sıfırdan küçük olmasına bağlı olarak iki kısımda ele alınmalıdır. 3-30 eşitliğine uygun yaklaşık diyagram şekil 3-6’da gösterilmiştir. 0 < z ≤ 1 için konvolusyon integrali z p Z ( z ) = ∫ (1)e −( z − x ) dx = 1 − e − z 0 < z ≤1 0 ve z>1 için aynı integral 1 p Z ( z ) = ∫ (1)e −( z − x ) dx = (e − 1)e − z 1< z < ∞ 0 olur. z<0 için pz(z)=0’dır çünkü pX(x)=0, x <0 ve py(y)=0, y<0’dır. Sonuç yoğunluk fonksiyonu şekil 3-6 (c)’de görülmektedir. ŞEKİL 3-6 : Yoğunluk Fonksiyonlarının Konvolusyonu (a) 0 < z < 1, (b) 1 < z < , pZ(z) 116 İki bağımsız Gauss raslantı değişkeninin toplamının incelenmesi ilginçtir. Bu değişkenlere ait olasılık yoğunluk fonksiyonları, pX(x)= py(y)= olsun. Z=X+Y olduğuna göre 3-30 eşitliğinden Z için yoğunluk fonksiyonu (x − X )2 (z − x − Y )2 p Z (z ) = exp − exp − dx 2 2πσ xσ y ∫ 2σ y 2σ X 1 olmaktadır. Bu integrasyon sonucunun 1 p z (z ) = 2π σ x 2 + σ y 2 ( ) [z − (X + Y )]2 exp− 2 σ 2 + σ 2 x y ( ) (3-31) olduğunun gösterilmesi öğrenciye alıştırma olarak bırakılmıştır. Bu sonuç iki bağımsız Gauss raslantı değişkeninin toplamının gene bir Gauss raslantı değişkeni olduğunu, meydana gelen yeni Gauss raslantı değişkeninin beklendik değerinin sözü edilen bağımsız iki değişkenin beklendik değerlerinin toplamına ve değişintisinin de bağımsız değişkenlere ait değişintilerin toplamına eşit olduğu açıkça göstermektedir. Daha çok sayıda Gauss raslantı değişkenlerinin toplanması sonucu elde edilecek yeni değişkenlerin de Gauss değişkeni olarak kalacağı görülecektir. Yani herhangi sayıda bağımsız Gauss raslantı değişkenlerinin toplamı sonucunda elde edilecek raslantı değişkenleri gene Gauss tipinde bir raslantı değişkenidir. Bu özelliği taşıyan yoğunluk fonksiyonlarının yeniden oluşturulabilir özellik taşıdıkları söylenebilir, Burada ispatlanmayacak olmasına rağmen ilişkili Gauss raslantı değişkenlerinin toplamları sonucu elde edilen raslantı değişkenlerinin de birer Gauss raslantı değişkeni olacağını belirtelim. Buna ait beklendik değer, her birinin beklendik değerlerinin toplamı olarak ve değişintisi de 3-27 eşitliği yardımı ile hesaplanabilir. 117 3-6 KARAKTERİSTİK FONKSİYON Bir önceki paragrafta bağımsız iki raslantı değişkenin toplamlarının olasılık yoğunluk fonksiyonunun, bunların ayrı ayrı yoğunluk fonksiyonlarının konvolusyonu ile elde edilebildiği gösterilmişti, ikiden daha çok raslantı değişkenin toplamı söz konusu olduğunda, sonuç yoğunluk fonksiyonunun, herbir raslantı değişkeninin hesaba katılacağı şekilde konvolusyon işlemini yinelemek sureti ile elde edileceği açıktır. Bu uzun ve yorucu bir işlem olduğundan daha kolay bir yol olup olmadığının araştırılması doğaldır. Sistem ve devre analizinde konvolusyonla karşılaşıldığında, hesaplamayı basitleştirmede, bilinen dönüşüm yöntemleri kullanılabilir. Bilindiği gibi konvolusyon dönüşüm domeninde yalnızca çarpımla sağlanabilmektedir. Konvolusyonun yinelenmesi sorunu da dönüşüm domeninde çok sayıda çarpım ile başarılır. Bu nedenle yoğunluk fonksiyonunu elde etmede dönüşüm yöntemlerinin kullanılmaya çalışılması yararlı gibi görünmektedir. Bu paragrafta bunun nasıl başarılacağı ortaya konmaya çalışılacaktır. Bir X raslantı değişkeninin KARAKTERİSTİK FONKSiYONU, φ (u ) = E [e juX ] (3-32) olarak tanımlanır ve bu beklendik değer ∞ φ (u ) = ∫ p(x )e juX dx (3-33) −∞ eşitliği ile elde edilir. 3-33 eşitliğinin sağ tarafı, (üstel ifadede - işareti hariç), p(x) yoğunluk fonksiyonunun Fourier Dönüşümüdür. Karakteristik fonksiyon için işaret farklılığı kuraldan çok alışılmışlıktan kaynaklanmıştır. Dönüşümün özelliklerinde ve uygulamalarında bir farklılık oluşturmaz. Ters Fourier dönüşümü ile benzerlikten yararlanarak, yoğunluk fonksiyonu , ∞ p ( x) = (1 / 2π ) ∫ φ (u )e − jux du −∞ eşitliğinden elde edilebilir. (3-34) 118 Karakteristik fonksiyonun bir uygulamasını göstermek üzere, yeniden X ve Y bağımsız raslantı değişkenlerinin toplamının (Z = X+Y) olasılık yoğunluk fonksiyonunun bulunması sorununu ele alalım. Bu raslantı değişkenleri için karakteristik fonksiyonlar, ∞ φ x (u ) = ∫ p (x )e jux x dx −∞ ve ∞ φ Y (u ) = ∫ p ( y )e juy Y dy −∞ dir. Konvolüsyon, dönüşümlerin (burada karakteristik fonksiyonların) çarpımına karşı geldiğinden Z değişkeninin karakteristik fonksiyonu, φ Z (u ) = φ X (u )φY (u ) olur. Sonuç olarak Z için yoğunluk fonksiyonu ∞ 1 juz p Z (z ) = ∫ φ X (u )φ Y (u )e du 2π −∞ (3-35) olarak bulunur. Bu yöntemi açıklamak üzere, bu önceki paragrafta incelenen uniform dağılımlı X ve üstel dağılımlı Y raslantı değişkenleri için uygulanırsa, pX(x) =1 =0 0 ≤ x ≤1 dışında ve buna ait karakteristik fonksiyon 1 e juz φ X (u ) = ∫ (1)e dx = ju 0 1 jux = (e ju ) −1 ju ve benzer şekilde, pY ( y ) = e − y =0 y≥0 y<0 0 119 ve buna ait karakteristik fonksiyon da, ∞ ∞ φ Y (u ) = ∫ e e −y 0 juy e (−1+ ju ) y 1 dy = = (− 1 + ju ) 0 (1 − ju ) olarak bulunur. O halde Z’nin karakteristik fonksiyonu, φ Z (u ) = φ X (u )φY (u ) = e ju − 1 ju (1 − ju ) olur ve buna karşılık gelen yoğunluk fonksiyonu, ∞ ju 1 e − 1 − juz p Z (z ) = ∫ e du 2π −∞ ju (1 − ju ) ∞ ∞ − juz ju (1− x ) 1 e 1 e = du − ∫ ∫ du 2π −∞ ju (1 − ju ) 2π −∞ ju (1 − ju ) = 1 - e-z 0 < z < 1 için -z =(e–1)e 1 < z < ∞ için ( ) olarak elde edilir. İntegrasyonlar standard ters Fourier dönüşüm yöntemi ile ya da tablolar yardımı ile çözümlenebilir. Karakteristik fonksiyonun diğer bir uygulaması da rasgele bir değişkenin momentlerinin bulunmasında kullanılmasıdır. Eğer φ (u)’nun türevi alınacak olursa sonuç, dφ (u ) = ∫ p ( x )( jx )e jux dx du −∞ ∞ olur. u=0 için türev, 120 dφ (u ) = j ∫ xp( x )dx = jX du u =0 −∞ ∞ (3-36) olmaktadır. Daha yüksek mertebeden türevler integral içinde x’in daha yüksek mertebeden kuvvetlerini içerir, bu sebeple n inci genel moment 1 d nφ (u ) X n = E X n = n n j du u =0 [ ] (3-37) olarak tanımlanabilir. Eğer karakteristik fonksiyon uygunsa, bu doğrudan yaklaşımda istenen integralleri hesaplamaktan daha kolay elde edilebilir. Yukarıdaki sonuçlar bazı belirgin gelişmelere açıktır. Örneğin 3-35 eşitliği keyfi sayıda bağımsız raslantı değişkeni için genişletilebilir. Eğer X1, X2,...., Xn bağımsız raslantı değişkenleri ise ve karakteristik fonksiyonları φ1 (u ), φ 2 (u ),...., φ n (u ) olduğuna göre, Y = X1 + X2 + .... + Xn gibi bir raslantı değişkenin tanımlanması halinde, Y’nin karakteristik fonksiyonu φ Y (u ) = φ1 (u )φ 2 (u )....φ n (u ) olacak ve yoğunluk fonksiyonu da ∞ 1 − juy pY ( y ) = ∫ φ1 (u )φ 2 (u )....φ n (u )e du π 2 −∞ (3-38) olarak elde edilebilecektir. Karakteristik fonksiyon, raslantı değişkenlerinin bağımsız olmamaları durumunda da kullanılabilir. Örneğin, eğer X ve Y raslantı değişkenleri bir bileşik yoğunluk fonksiyonuna (p(x,y) ) sahipse, o halde onlara ait bir bileşik karakteristik fonksiyon söz konusudur ve bu, 121 φx, y (u, v ) = E.e j (uX + vY ) ∞ ∞ = ∫ ∫ p(x, y )e j (ux + vy ) dxdy (3-39) − ∞− ∞ olmaktadır. Karşı gelen ters dönüşüm bağıntısı ise 1 ∞ ∞ p ( x, y ) = φ xy (u, v )e − j (ux +vy ) dudv 2 ∫ ∫ 2(2π ) −∞−∞ (3-40) olacaktır. Bileşik karakteristik fonksiyon, raslantı değişkenleri arasındaki ilişkinin bulunmasında kullanılabilir. Örneğin ∂ 2φ xy (u , v ) E [ XY ] = XY = − ∂u∂v u =v =0 (3-41) ve daha genel olarak [ i EX Y k ] i+k 1 ∂ φ xy (u , v ) = X Y = i + k i k j ∂u ∂v u =v =0 i k (3-42) 3-37, 3-40 ve 3-42 eşitlikleri ile verilen sonuçlar, gerekli integrasyon ve türevlerin daima hesaplanabileceğinden, özellikle Gauss raslantı değişkenleri için kullanışlıdır. Gauss raslantı değişkenlerinin önemli özelliklerinden bir bütün mertebelerden momentlerin ve ilişkilerinin yalnızca ilk iki moment ve ilişki katsayısının bilinmesi ile elde edilebileceğidir, ALIŞTIRMA 3-6 Bernoulli dağılımının karakteristik fonksiyonu φ = 1 − p + ptju olarak verildiğine göre (a) Beklendik değeri, (b) Karesel beklendik değeri, (c) Üçüncü merkezi momenti bulunuz. 122 PROBLEMLER 3-1 X ve Y raslantı değişkenlerine ilişkin ortak olasılık yoğunluk fonksiyonu p(x,y) = K 0<x<1 0 < y <x =0 dışında şeklinde verilmektedir. a-p(x,y) olasılık yoğunluk fonksiyonunu çiziniz. b-P(x,y) dağılım fonksiyonunu belirleyerek çiziniz. c-K’nın değerini bulunuz. d- X <(1/2) ve Y> 0 olayının ortak olasılığı nedir? e- X’in basit olasılık yoğunluk fonksiyonu pX(x)’i bulunuz. 3-2 Problem 3-1’de verilen iki raslantı değişkeni için, a- E[XY]’yi bulunuz. b- Bu iki raslantı değişkeni istatistik bağımsız mıdır? 3-3 X ve Y raslantı değişkenlerine ilişkin bileşik olasılık yoğunluk fonksiyonu, p(x,y) = K.e-(3x+4y) x>0, y>0 =0 dışında şeklindedir. a- K’nın değerini belirleyiniz. b- P(x,y) bileşik olasılık dağılım fonksiyonunu bulunuz. c- 0< X ≤ 1 ve 0<Y ≤ 2 olma olasılığını belirleyiniz. d- X ve Y’nin basit olasılık yoğunluk fonksiyonlarını bulunuz . 3-4 Problem 3-1’deki iki raslantı değişkeni için p(x/y) ve p(y/x) koşullu olasılık yoğunluk fonksiyonlarını bulunuz. 3-5 Bir dikdörtgenin kenarları raslantı değişkenleridir. X tabanı 0 ile 5 arasında uniform dağılımlı bir raslantı değişkeni ve yüksekliği 0 ile X arasında uniform dağılımlı bir raslantı değişkenidir. Dikdörtgenin alanının beklendik değerini bulunuz. 3-6 Bir işaret olduğu varsayılan X raslantı değişkeni 0 ile 10 arasında uniform dağılım göstermektedir. X’ten bağımsız bir başka raslantı değişkeni N, -10 ile 10 arasında üçgen dağılımlıdır (maksimum yoğunluk 0’da). Gözlenebilen raslantı değişkeni Y = X+N ’dir. 123 a- y= -5,0 ve 5 için p(x/y) koşullu olasılık yoğunluk fonksiyonunu x’e bağlı olarak tanımlayınız ve çiziniz. b- Bir gözlem sonucu y= -5 olduğuna göre, X’in gerçek değerine en iyi kestirim nedir? 3-7 İki raslantı değişkeninin beklendik değerleri sıfır ve değişintileri sırasıyla, 25 ve 36 olup ilişki katsayıları 0,4’tür. a-Toplamlarının değişintisi neye eşittir? b-Farklarının değişintisi neye eşittir? c- a ve b şıklarını ilişki katsayısının -0,4’e eşit olması durumu için tekrarlayınız. 3-8 İstatistik bağımsız iki raslantı değişkeni X ve Y’nin beklendik değerleri sıfır ve değişintileri sırasıyla 36 ve 64’tür. İki yeni raslantı değişkeni, U = 4X + 3Y V = 3X – 4Y biçiminde tanımlanmıştır. U ve V’nin ilişki katsayılarını bulunuz. 3-9 Bir X raslantı değişkeni bir başka Y raslantı değişkenine Y = aX + b ilişkisiyle lineer olarak bağlıdır. X ve Y’nin ilişki katsayısının a ρ XY = a olduğunu gösteriniz. (Yani a pozitifse ρ XY = −1 ’dir). ρ XY = 1 , a negatifse 3-10 θ ve ψ istatistik bağımsız iki raslantı değişkeni olsunlar ve her ikisi de 0 ile 2π aralığında uniform dağılımlı olsunlar. Yeni bir raslantı değişkeni φ = θ + ψ biçiminde tanımlanmaktadır. a- φ ‘nin olasılık yoğunluk fonksiyonunu bulunuz. 124 b- φ = θ +ψ , = θ + ψ − 2π , θ + ψ ≤ 2π 2π < θ + ψ ≤ 4π olduğuna göre φ ‘nin olasılık yoğunluk fonksiyonunu bulunuz. (a) şıkkında düzgün dağılımlı iki raslantı değişkeninin toplamının üçgen dağılımlı olduğuna, buna karşılık (b) şıkkında düzgün dağılımlı iki raslantı değişkeninin mod 2π anlamında uniform dağılımlı olduğuna dikkat ediniz. 3-11 a- Sıfır beklendik değer ve σ 2 değişintili bir Gauss raslantı değişkeninin karakteristik fonksiyonunu bulunuz. b- Karakteristik fonksiyonu kullanarak, bir Gauss işlemesinin n inci merkezi momentine ilişkin (2-18) denklemi ile verilen sonucu kontrol ediniz. KAYNAKLAR Bölüm 1’deki kaynaklara bakınız, özellikle Beckmann, Papoulis ve Parzen 125 BÖLÜM 4 RASGELE İŞLEME 4-1 GİRİŞ İkinci bölümde belirtildiği gibi rasgele işleme, olasılık tanımları ile bütünleşmiş zaman fonksiyonlarının bir kolleksiyonudur. Olasılık tanımları, tüm raslantı değişkenlerinin basit ve bileşik olasılık yoğunluk fonksiyonlarını içerebilir ve bunlara belirli anlarda işlemeyi belirten fonksiyonlar olarak bakılabilir. Olasılık tanımlarının bu türü tektir ve burada incelenecektir. Zaman fonksiyonlarının tüm kolleksiyonu bir bütündür (ensemble) ve {x(t)} ile belirtilir, burada ensemblenin herhangi bir üyesi, x(t), ensemblenin örnek fonksiyonu ya da sadece örnek fonksiyon olarak bilinir. Genel olarak rasgele bir işlemenin yalnızca bir örnek fonksiyonu gözlenebilir. Diğer bütün örnek fonksiyonlar gözlenemediği halde, olması olası tüm durumları belirtir. Herhangi bir örnek fonksiyon X(t) ile gösterilir. X(t)’nin herhangi bir t1 zamanına karşı gelen değeri bir raslantı değişkenini tanımlar ve X(t1) ile ya da yalnızca X1 ile gösterilir. Raslantı değişkeni kavramlarından rasgele işlemeye doğru ilerleme mekanik olarak ele alındığında oldukça basittir ve buna ait ana ilkeler daha önce incelenmiştir. Ancak daha güç olan adım, raslantı değişkenleri ile rasgele işlemenin fiziksel özellikleri arasında bağ kurulmasını sağlayan kavramların geliştirilmesidir. Bu nedenle, bu bölümde, bu bağıntı, birkaç açıklayıcı örnekle ortaya konulmaya çalışılacaktır. Rasgele işlemeyi incelemede ilk adımlardan biri, verilen herhangi bir işlemenin karakteristiklerinin tanımlanmasında kısa yoldan yararlanılabilecek, uygun terminolojiyi geliştirmektir. Bunu sağlamada elverişli bir yol, çiftler şeklinde düzenlenmiş tanımlayıcı setlerin kullanılması ve işlemeyi tanımlamada bu tanımlayıcı setlerden yararlanılmasıdır. Bu tanımlayıcı setler aşağıda sıralanmıştır. 126 1- Sürekli - Ayrık 2- Tayin Edilebilir - Tayin Edilemez 3- Durağan - Durağan Olmayan 4- Ergodik - Ergodik Olmayan 4-2 SÜREKLi VE AYRIK RASGELE İŞLEME Bu terimler genelde raslantı değişkenlerinin olası değerleri için kullanılırlar. Sürekli bir rasgele işleme, X(t1), X(t2) ve bunun gibi raslantı değişkenlerinin, belirli sınırlar arasındaki olası değerlerinden herhangi bir değeri alabileceği varsayılan bir işlemedir. İletkenlerdeki ısıl dalgalanmaların gürültüsü, transistor veya elektron tüplerinde oluşan çarpışma gürültüsü ve rüzgarın hızı, sürekli rasgele işlemeye ait örnekler olarak verilebilir. Tipik bir örnek fonksiyon ve buna karşı düşen olasılık yoğunluk fonksiyonu Şekil 4-1’de gösterilmiştir. ŞEKİL 4-1: Sürekli Rasgele İşleme (a) Tipik Örnek Fonksiyonu (b) Yoğunluk Fonksiyonu Bu örnekte, olası değerlerin sınırı yarı sonsuzdur. 127 Sürekli rasgele işleme için daha duyarlı bir tanım, olasılık dağılım fonksiyonunun sürekli olmasıdır. Bu aynı zamanda yoğunluk fonksiyonunun herhangi bir impuls ( δ ) fonksiyonu içermediğini belirtir. Ayrık bir rasgele işleme yalnızca belirli izole edilmiş ve genellikle sonlu sayıda değerler alabilir. Bunların dışında herhangi bir değer alması söz konusu değildir. Örneğin, bir anahtarın rasgele açılıp kapanmasından dolayı gerilim değeri ya 0 ya da 100 volt olan bir örnek fonksiyon, ayrık bir rasgele işlemeye aittir. Bu durum Şekil 4-2’de görülmektedir. Olasılık yoğunluk fonksiyonunun yalnızca impuls ( δ ) fonksiyonlarından oluşacağı açıktır. ŞEKİL 4-2: Ayrık Rasgele İşleme (a) Tipik Örnek Fonksiyon (b) Yoğunluk Fonksiyonu Hem sürekli ve hem de ayrık elemanlar içeren durumlar da söz konusu olabilir. Buna karışık işleme adı verilir. Örneğin, ideal bir doğrultucudan, bir akımın geçmesi halinde, zamanın yarısında doğrultucu çıkışındaki akım sıfır olacaktır. Buna karşı düşen olasılık yoğunluk fonksiyonu kısmen sürekli ve kısmen de impuls fonksiyonu içerek bir özellik gösterir, Şekil 4-3. 128 ŞEKİL 4-3: Karışık Bir Rasgeleİşleme (a) Tipik Örnek Fonksiyonu (b) Yoğunluk Fonksiyonu Örnek fonksiyonların zamana göre sürekli olması durumlarında bir raslantı değişkeni herhangi bir zaman değeri için tanımlanabilir. Raslantı değişkenlerinin yalnızca belirli ayrık zamanlarda olma durumu (nokta işlemesi veya zaman serileri) burada incelenmeyecektir. 4-3 TAYİN EDİLEBİLİR VE TAYİN EDİLEMEZ RASGELE İŞLEME Şimdiye kadar olan incelemelerimizin pek çoğunda, her bir örnek fonksiyonun bir rasgele zaman fonksiyonu olduğunu ve bu nedenle gelecek değerlerinin, gözlenen geçmiş değerlerinden tam olarak elde edilemeyeceği görülmüştü. Bu tür bir rasgele işleme tayin edilemez (nondeterministic) rasgele işleme olarak adlandırılır. Hemen hemen doğal bütün işlemeler, tayin edilemez rasgele işlemelerdir, çünkü bunları üreten ana kaynaklar ya gözlenemez ya da oldukça karmaşıktır. Bir önceki paragrafta ele alınan bütün örnekler, tayin edilemez rasgele işlemeye aittir. Ancak,herhangi bir örnek fonksiyonun geçmiş değerlerine ait bilgiler yardımı ile gelecek değerlerine ait bilgilerin tam olarak elde edilebilmesi mümkün olan bir rasgele işleme tanımlamak olasıdır. Bu tür bir işlemeye tayin edilebilir (deterministik) rasgele işleme adı verilir. Bir örnek olmak üzere, her 129 Bir örnek olmak üzere, her bir örnek fonksiyonu X (t ) = A cos(ω .t + θ ) şeklinde olan rasgele işleme düşünelim, burada A ve ω sabitleri θ ise olasılık dağılım fonksiyonu belirli bir raslantı değişkenini göstermektedir. Herhangi bir örnek fonksiyon için, t’nin bütün değerlerinde, θ aynı bir değere, ensemblenin diğer örnek fonksiyonlarından farklı değere sahip tir. Bu durumda tek rasgele değişim ensemble boyunca olur ve zamana bağlı değildir. X(t1) , X(t2) ve bunun gibi raslantı değişkenleri tanımlamak ve bunlar için olasılık yoğunluk fonksiyonlarını hesaplamak mümkün olmaktadır. Tayin edilebilir rasgele işleme kavramı biraz yapay görünmesine karşın genellikle bir veya iki parametresi hariç bilinen işaretler için bir olasılık modeli elde etmede elverişlidir. Örnek olarak 4-1 eşitliği ile verilen işleme, genlik ve frekansı bilinen, ancak alıcı ile verici arasındaki uzaklık duyarlıkta bilinemediğinden fazı bilinmeyen bir radyo işaretini uygunlukla belirtebilir. 4-3 DURAĞAN VE DURAĞAN OLMAYAN RASGELE İŞLEME X(t1) şeklinde bir raslantı değişkeni için olasılık yoğunluk fonksiyonunun belirtilebileceğine daha önce değinilmişti. Ancak bu yoğunluk fonksiyonunun t1 zamanındaki değer ile bağlantılı olacağı dikkate alınmalıdır. Eğer bir işlemenin bütün basit ve bileşik yoğunluk fonksiyonları zaman başlangıcının seçimine bağlı değilse bu işlemenin Durağan (stationary) olduğu söylenir. Bu durumda daha önce incelenen bütün beklendik değerler ve momentler sabit olup zamanın mutlak değerinden bağımsızdır. Eğer herhangi olasılık yoğunluk fonksiyonları zaman başlangıcının seçimine bağlı ise bu işleme Durağan Olmayan bir işlemedir. Bu durumda beklendik değerlerin ve momentlerin biri ya da fazlası zamana bağlı olacaktır. Durağan olmayan rasgele giriş işaretleri ile ilgili sistem analizi sorunları, durağan giriş işaretlerine oranla daha karmaşıktır. Bu nedenle bundan sonraki incelemelerimizde aksi söylenmediği sürece durağan işleme hali anlaşılmalıdır. Herhangi bir işlemenin geçmişte sonlu herhangi bir zamanda başlaması ve gelecekte sonlu bir zamanda bitmesi kaçınılmaz olduğundan, gerçekte fiziksel olarak mevcut durağan bir rasgele işlemenin olmadığı açıklıkla söylenebilir. 130 Herhangi bir işlemenin, geçmişte sonlu herhangi bir zamanda başlaması ve gelecekte sonlu bir zamanda bitmesi kaçınılmaz olduğundan, gerçekte fiziksel olarak, durağan bir işlemenin olmadığı açıklıkla söylenebilir. Ancak, gözlem süresi boyunca farkedilir bir değişim göstermeyen işlemeler pekçok fiziksel durum için geçerlidir. Buna benzer durumlarda, işlemenin durağan varsayılması bizi gerçekle oldukça yakınlık gösteren uygun bir matematik modele götürür. Verilen herhangi bir durum için durağanlık yaklaşımının yapılmasının uygun olup olmadığının saptanması kolay olmayabilir. Durağan olmayan işleme, işlemeyi üreten düzene ve işlemenin gözlem süresine bağlıdır. Temel bir kural olarak, kaynakta belirgin bir değişim olmadığı ya da aksi kesin olmadığı durumlarda işlemenin durağan varsayılması alışılagelmiştir. Örneğin, bir dirençteki elektronların rasgele hareketlerinin ürettiği ısıl gürültü, normal koşullar altında durağan varsayılabilir. Ancak, eğer direnç içinden geçen akımın zaman zaman kesilip sonra yeniden akması ile ısınıyorsa, durağanık yaklaşımının yanlış olduğu açıktır. Bir başka örnek olmak üzere, durağan bir kaynaktan bir saatlik peryod boyunca gelen rasgele rüzgar hızını durağan varsaymak anlamlı olabilir ancak genel anlamda bir haftalık peryod için bu yaklaşımın kullanılmasının uygun olmayacağı açıktır. Tayin edilebilir işlemeler belirli özel koşullar hariç durağandırlar. Bu koşulların varlığını kabul etmek alışılmıştır. Ne var ki herhangi biri bunun tedbirli bir seçim olduğunun farkına varmalıdır. Bunun doğal bir oluş olması gerekmez. Örneğin (4-1) eşitliğinde tanımlanan rasgele işleme durumu için okuyucu (beklendik değeri hesaplamak suretiyle) θ ‘nın 0 ile 2 π arasında uniform dağılımlı olması hali için kesinlikle durağan olmayacağını kolayca gösterebilir. Bütün basit ve bileşik yoğunluk fonksiyonlarının zaman başlangıcından bağımsız olması istemi, sistem analizi için gerekli olduğundan çok, daha inandırıcıdır. Genelde daha yumuşatılmış bir yol, bir raslantı değişkeninin, X(t1), t1 zamanından bağımsız olması ve iki raslantı değişkeni arasındaki ilişkinin E[X(t1)X(t2)], yalnızca t2-t1 zaman farkına bağlı olması durumudur. Bu iki koşulu sağlayan işleme Geniş Anlamda Durağan (wide sense stationary) adını almaktadır. Geniş anlamda durağanlık, beklendik değer, karesel beklendik değer, değişinti ve herhangi bir çift raslantı değişkeninin ilişki katsayısının zaman başlangıcının seçiminden bağımsız ve sabit olduğunu garanti eden bir özellik gösterir. 131 Rasgele girişlere, sistemlerin cevabı ile ilgili ilerideki incelemelerde, bu cevapların elde edilmesi, işlemenin durağan ya da geniş anlamda durağan varsayılması sonucu kolayca sağlanabilir. Her iki durağanlık durumu için de sonuçlar aynı olacağından incelemelerimizde bu iki durum arasındaki farklılık önemli sayılmayabilir. 4-5 ERGODİK VE ERGODİK OLMAYAN RASGELE İŞLEME Bazı durağan rasgele işlemeler ensemblenin hemen hemen tüm üyeleri*, tüm ensemblenin sahip olduğu aynı istatistik davranışı gösteren bir özelliğe sahiptirler. Bu şekilde tek bir tipik örnek fonksiyonun incelenmesi ile bu istatistik davranışı saptamak mümkündür. Bu tip işlemeye Ergodik (ergodic) işleme adı verilir. Ergodik işlemelerin beklendik değer ve momentleri ensemble ortalamaları ile olduğu kadar zaman ortalamaları ile de hesaplanabilir. Örneğin n. moment; ϕ n X = 1 T →∞ 2T n ∫ x p(x )dx = lim −∞ T ∫ X (t )dt n (4-2) −T olarak bulunur. Ancak bu durum işleme durağan olduğu sürece geçerlidir. O halde ergodik bir işleme aynı zamanda durağan bir işlemedir. (4-2) eşitliğindeki özelliği sağlamayan bir işleme ergodik olmayan bir işlemedir. Durağan olmayan bütün işlemeler ergodik olmayan işlemelerdir, ancak durağan olduğu halde ergodik olmayan işlemeler de olabilir. Örneğin, örnek fonksiyonu; X (t ) = Y . cos(ω .t + θ ) (4-3) * Hemen hemen bütün üyeleri terimi, toplam olasılığı sıfır olan örnek fonksiyonlar setini belirtir. Ensemblenin diğer örnek fonksiyonları aynı davranışı göstermeyebilir. Ne var ki sıfır olasılık bu tip örnek fonksiyonların imkansız olduğu anlamına gelmez. 132 şeklinde olan bir işleme ele alınsın. Burada ω bir sabiti, Y (ensembleye göre) bir raslantı değişkenini ve θ da 0 ile 2 π arasında uniform dağılımlı bir başka raslantı değişkenini göstermektedir. Ayrıca θ ve Y istatistik bağımsız raslantı değişkenleridir. Y’nin herhangi bir örnek fonksiyon için sabit, farklı örnek fonksiyonlar için farklı olması nedeni ile durağan olmasına karşı ergodik olmayan bir işleme olduğu görülmektedir. İşlemenin yalnızca bir örnek fonksiyonu gözlenebildiğinden, herhangi fiziksel bir işlemenin uygun yaklaşımla ergodikliğini ispatlamak genel olarak güçtür, ancak olanaksız değildir. Bu nedenle aksini zorlayıcı fiziksel nedenler söz konusu değilse, işlemenin ergodik varsayılması alışılagelmiş bir durumdur. 4-6 İŞLEME PARAMETRELERİNİN ÖLÇÜLMESİ Bir raslantı değişkeninin istatistiksel parametreleri, çeşitli t zamanlarında, X(t) raslantı değişkeni ile bütünleşmiş istatistiksel parametreler setidir. Bunlar, daha önce değinilen, beklendik değer, karesel beklendik değer, değişinti, vs.dir. İşlemenin durağan olma durumunda, işleme parametreleri bu tip raslantı değişkenleri için aynıdır ve bu nedenle tek bir parametreler setinin ele alınması alışılmış bir tutumdur. Pratik önemi olan incelenebilir bir sorun, tek bir örnek fonksiyonun (Sonlu uzunlukta) gözlenmesinden işleme parametrelerinin kestirilmesidir, (estimating). Tek bir örnek fonksiyon söz konusu olduğundan, parametrelerin kestirimini elde etmede ensemble ortalamasının alınması olanaksızdır. Eğer işleme ergodik ise bu uygun bir yaklaşım olacaktır. Çünkü, sonsuz zaman için zaman ortalaması, (4-2) eşitliği uyarınca ensemble ortalamasına eşdeğerdir. Öncelikle {x(t)} ergodik rasgele işlemesine ait beklendik değerin kestirimi sorunu ele alınsın. Bu kestirim X olarak gösterilecek ve sonlu zaman ortalaması şeklinde hesaplanacaktır. Buna göre ensemblenin keyfi herhangi bir örnek forksiyonu için bi kestirim; T 1 Xˆ = ∫ X (t )dt T 0 (4-4) 133 olsun. Xˆ nin herhangi bir denemede tek bir sayı ve aynı zamanda bir raslantı değişkeni olduğunu belirtelim. O halde farklı zaman aralıklarının kullanılması ya da farklı örnek fonksiyonlarının gözlemlenmesi farklı sayıların elde edilmesi sonucunu doğuracaktır. Bu nedenle Xˆ gerçek beklendik değere ( X ) tam olarak eşit olamaz ancak eğer ölçme uygun ise bu iki değer birbirine çok yakındır. Bu iki değerin birbirine ne kadar yakın olması gerektiği aşağıda açıklanacaktır. Xˆ bir raslantı değişkeni olduğundan bir beklendik değeri ve değişintisi vardır. Eğer Xˆ , X ‘in iyi bir kestirimi ise Xˆ ’nın beklendik değeri X ’e eşit ve değişintisi olabildiğince küçük olmalıdır. 4-4 eşitliğinden Xˆ ’nin beklendik değeri, 1 1 E [Xˆ ] = E ∫ X (t )dt = ∫ E [ X (t )]dt T T T = T T 0 0 [ ] 1 1 T Xdt = X t 0 = X ∫ T 0 T (4-5) olur. Beklendik değer hesaplamasında ve integrasyondaki değişiklik bu durum için genel ve müsade edilebilir bir uygulamayı göstermektedir. Buna benzer değişikliklerin hangi durumlarda mümkün olacağı 7. Bölümde daha ayrıntılı olarak işlenecektir. 4-5 eşitliğinden Xˆ ‘in kendine özgü bir beklendik değeri olduğu açıktır. Zamana göre sürekli integrasyon durumu için Xˆ ’in değişintisinin bulunması daha karmaşık olup incelenmeyecektir, mamafih ayrık zaman durumu değerlendirilecektir. Değişintinin 1/T ile orantılı olarak belireceğini belirtmek yararlı olabilir. Bu nedenle, beklendik değerin daha iyi bir kestirimi, daha uzun bir zaman aralığı boyunca, örnek fonksiyonun ortalaması alınmak sureti ile bulunur. T sonsuza yaklaştıkça değişinti sıfıra yaklaşır ve kestirim gerçek beklendik değere eşit olur, (ergodik işlemleme için gerektiği gibi) . Pratik açıdan 4-4 eşitliği ile istenen integrasyon analitik olarak nadiren çözümlenebilir. Çünkü X(t) açık biçimde bir matematik ifadeyle tanımlanmamış olabilir. Bunun çözümlenmesinde bir başka seçenek gözlemlenen X(t)’nin eş zaman aralıklı örneklerine bağlı kalınmak suretiyle sayısal integrasyon yapmaktır. 134 Bu şekilde, eğer X 1 = X (∆t ), X 2 = X (2∆t ),...., X N = X ( N∆t ), ise X ‘in kestirimi 1 Xˆ = N N ∑X (4-6) i i =1 olarak tanımlanabilir. Bu 4-4 eşitliğinin ayrık zaman karşılığıdır. Xˆ kestirimi gene bir raslantı değişkenidir ve bir beklendik değeri vardır. Bu değer, [] 1 N 1 E Xˆ = E ∑ X i = N i =1 N 1 N = ∑X = X N i =1 N ∑ E [X ] i i =1 (4-7) olmaktadır. Bu nedenle kestirim hala kendine özgü bir beklendik değere sahiptir. Xˆ ‘in değişintisini bulmak üzere, gözlemlenen örneklerin zaman olarak yeterli aralıklarda olduğu ve böylece bunların istatistiksel bağımsızlığı varsayılacaktır. Bu varsayım bu aşama için uygunluk sağlar. Daha genel bağıntılar bir sonraki bölümün paragraflarının ışığı altında değerlendirilecektir, Xˆ ’in karesel beklendik değeri 4-8 eşitliği ile tanımlanabilir. () 1 2 E Xˆ = E 2 N 1 XiX j = 2 ∑∑ i =1 j =1 N N N N N ∑∑ E[X i Xj ] (4-8) i =1 j =1 Burada çift toplam iki ayrı toplamın çarpımından kaynaklanmaktadır. Örnek değerlerin istatistik bağımsız varsayılmasının sonucu, [ ] E XiX j = X 2 i= j = (X ) 2 yazılabilir. Böylece, i≠ j 135 () [ 1 2 2 E Xˆ = 2 N X 2 + N 2 − N ( X ) N ( ) ] (4-9) elde edilir. 4-8 eşitliğindeki çift toplamdan elde edilen bu sonuçta toplam N2 terim vardır, i = j koşulu sadece N terim için sözkonusudur. 4-9 eşitliği () 1 2 2 1 E Xˆ = X 2 + 1 − (X ) N N 1 2 = σ X 2 + (X ) N (4-10) biçiminde yazılabilir. Şimdi X ‘in değişintisi aşağıdaki şekilde yazılabilir. ( ) ( ) { [ ]} = N1 σ 2 Var Xˆ = E Xˆ − E Xˆ 1 = σ X2 N 2 + (X ) − ( X ) 2 X2 2 (4-11) Bu sonuç beklendik değerin kestiriminin değişintisinin, yalnızca ana işlemenin değişintisinin 1/N katı olduğunu göstermektedir. Bu nedenle daha çok sayıda örneğin ortalamasının alınması, kestirimin niteliğini iyi yönde etkileyecektir. Yukarıdaki sonucu göstermek üzere, karesel (kare alan) bir düzenden geçen sıfır beklendik değerli bir Gauss rasgele işlemesinin değişintisinin kestiriminin ve çıkışın beklendik değerinin kestiriminin hesapIanmasının istendiği düşünülsün. Aynı zamanda çıkışın beklendik değerinin kestiriminin standard sapmasının gerçek beklendik değerden % 10’dan az olmasının sağlanması için ortalamaya katılacak örnek sayısının ne olması gerektiği de sorulmaktadır. Beklendik değeri sıfır olan Gauss işlemesinin gözlemlenen örnek fonksiyonu Y(t) ve buna ait değişinti de σ Y 2 olsun. Bu örnek fonksiyonun karesi alınıp bunu X(t) ile gösterirsek, X(t) = Y2(t) yazılabilir. 136 [ ] = E [Y ] = 3σ X = E Y 2 = σY2 X2 4 Y4 olduğu bilinmektedir. O halde, σ X = X 2 − ( X ) = 3σ Y − σ Y = 2σ Y 2 2 4 4 4 bulunur. Buradan, X’in kestiriminin aynı zamanda σ Y 2 ’nin kestirimi olduğu açıkça görülmektedir. Bir adım daha ileri giderek X ’in kestiriminin değişintisinin % 10’dan daha küçük hata istemini karşılaması açısından, 0.01( X ) = 0.01σ Y 4 2 olması gerektiği söylenebilir. (4-11) eşitliğinden, () 1 1 Var Xˆ = σ X 2 = (2σ Y 4 ) = 0.01σ Y 4 N N yazılmak suretiyle, istenilen duyarlığın sağlanabilmesi için gereken istatistik bağımsız örnek sayısının N = 200 olduğu görülecektir. Yukarıda ele alınan konular, yalnızca bir rasgele işlemenin beklendik değerinin kestirimi sorununa yanıt bulmakla kalmaz, aynı zamanda beklendik değeri sıfır olan bir işlemenin değişintisinin nasıl kestirildiğini de ortaya koyar. Aynı genel yol beklendik değeri sıfırdan farklı bir rasgele işlemenin değişintisinin kestirilmesi için geliştirilebilir. Bu, aşağıdaki alıştırmada ete alınmıştır. ALIŞTIRMA 4-6 Ergodik bir rasgele işlemenin örnek fonksiyonu X(t) olsun. Bu örnek fonksiyonun beklendik değeri X ve degişintisi σ X2 varsayılsın. σ X2 ‘nin kestiriminin, σˆ X = 2 () 1 N N ˆ X i2 − X ∑ N − 1 i =1 N −1 2 137 () ile hesaplanabileceğini gösteriniz. Burada Xˆ 4-6 eşitliği ile verilen X ‘in kestirimini ifade eder ve bu kestirimin [ ] E σˆ X 2 = σ X 2 özelliğine sahip olduğu bilinmektedir. Ayrıca ortalama faktörünün 1/N yerine 1/(N-1) olmasının nedenini açıklayınız. 138 PROBLEMLER 4-1 İlk şekilde görülen sistemde anahtar başlangıçta 1 konumundadır. t=0’da bir para atılmakta ve eğer tura gelmişse anahtar 2 konumuna getirilmektedir. Yazı gelmesi durumunda anahtarın konumu değiştirilmemektedir. t=1’de yeniden para atılmakta ve anahtar birinci atıştaki kurallara göre hareket ettirilmektedir. İşlem t=2’de tekrarlanmaktadır. t=3’de anahtar 1 konumuna getirilmekte ve orada tutulmaktadır. Bir örnek olarak üç atış sonucu TTY ise ilişkin fonksiyon ikinci şekilde görüldüğü gibi olacaktır. a-Yukarıda açıklanan rasgele işlemeye ait tüm olası örnek fonksiyonları çiziniz. b-Belli bir örnek fonksiyonun olma olasılığı nedir? c-Bir X raslantı değişkeni v(0,5) olarak tanımlansın. Bu raslantı değişkeninin alabileceği tüm olası değerler nelerdir? Bu bir sürekli raslantı değişkeni midir? 4-2 Paragraf 4-1’de sıralanan dört tanımlayıcı çifte göre aşağıdaki rasgele işaretleri sınıflandırınız. Sınıflandırmanın temeli, tamamiyle doğru olup olmadığı değil, işlemeye uygun yaklaşıklıkla bir olasılık modeli sağlayıp sağlamadığı olmalıdır. a-10 yıl yarı ömürlü bir radyoaktif kaynaktan bir saatlik peryod boyunca gözlenen alfa partiküllerinin yayılma oranı (saniyede parçacık olarak). Gözlem süresi 10 yılık peryoddur, b-Herhangi bir anda, 10 dakikalık peryod boyunca, 24 saatlik bir peryod boyunca ve 360 günlük bir peryod boyunca gözlenen bir telefon santralından yapılan telefon konuşmalarının sayısı olarak tanımlanan bir raslantı değişkeni ile gösterilen bir işleme. c- a bir sabit ve Y bir raslantı değişkeni olmak üzere X(t) = at + Y 139 biçiminde örnek fonksiyonlara sahip bir işleme. d- Y bir raslantı değişkeni ve ω 0 bir sabit olmak üzere, X (t ) = Y cos ω 0 t şeklinde örnek fonksiyonlara sahip bir işleme, e- Y bir raslantı değişkeni olmak üzere, X(t) =Y biçiminde örnek fonksiyonlara sahip bir işleme. 4-3 t0, 0 ile T arasında düzgün dağılımlı bir raslantı değişkeni olmak üzere, şekilde görülen peryodik örnek fonksiyonlara sahip bir rasgele işleme ele alınıyor. Burada A ve T sabitlerdir. a-P(x) olasılık dağılım fonksiyonunu belirleyerek çiziniz. b-p(x) olasılık yoğunluk fonksiyonunu belirleyerek çiziniz, c- X , X 2 ve σ 2 büyüklüklerini bulunuz, d- <•> zaman ortalamasını göstermek üzere <x> ve <x2> büyüklüklerini bulunuz, e- İşleme durağan mıdır? Ergodik midir? 4-4 t0, 0 ile T arasında uniform dağılımlı bir raslantı değişkeni ve Y, t0’dan istatistik bağımsız, ±1 değerlerini eş olasılıkla alan bir raslantı değişkeni olmak üzere şekilde görülen peryodik örnek fonksiyona sahip bir rasgele işleme ele alınıyor. T peryodu bir sabittir. a-Bu işlemeyi dört tanımlayıcı çifte göre sınıflayınız. b-Bu işleme için p(x) olasılık yoğunluk fonksiyonunu bularak değişimini çiziniz. c- X ve X 2 büyüklüklerini hesaplayınız. d-< x > ve <x2> büyüklüklerini hesaplayınız, e- İşleme durağan mıdır? Ergodik midir? 140 4-5 Beklendik değeri 200 ve değişintisi 49 olan bir Gauss rasgele işlemesinden alınan on gerilim ölçümü aşağıda verilmiştir. 207 202 184 204 206 198 197 213 191 201 a-Rasgele işlemenin beklendik değerinin kestirimini hesaplayınız. b-Beklendik değerin kestiriminin beklendik değeri nedir? c-Beklendik değerin kestiriminin değişintisi nedir? d-Rasgele işlemenin değişintisinin kestirimini hesaplayınız. e-Rasgele işlemenin beklendik değer ve değişintisinin kestirimleri neden gerçek beklendik değer ve değişintiye eşit değildir. 4-6 Merkezi Limit Teoreminden çok genel koşullar altında, çok sayıda istatistik bağımsız raslantı değişkenlerinin ortalamasının bir Gauss dağılımına yaklaştırılabileceği bilinmektedir. Problem 4-5’ deki ölçümlerde önyargı olmaksızın ortalamanın olasılık yoğunluk fonksiyonu yaklaşıklıkla, n p ˆ xˆ = X 2πσ () −n (xˆ − X )2 / 2σ 2 e biçimindedir. X ölçümlerin gerçek beklendik değeri ve σ 2 de gerçek değişintisidir .Bu ifadeyi ve problem 4-5’te elde edilen σ 2 ’yi kullanarak, X ’in, yüzde 99 kesin olarak içinde kalacağı sınırları belirleyiniz. KAYNAKLAR Bölüm 1’ deki kaynaklara bakınız, özellikle Beckmann, Davenport, ve Root, Lanning ve Battin ve Papoulis. 141 BÖLÜM 5 İLİŞKİ FONKSİYONLARI 5-1 GİRİŞ İki raslantı değişkeni arasındaki ilişki konusuna 3-4 paragrafında değinilmişti. Şimdi, rasgele işleme kavramlarına kısa bir giriş yapıldığı da dikkate alınarak, bu iki konu ile bağlantılı olarak rasgele işlemelerin (olasılıktan çok) istatistik tanımlarını yapmak mümkündür. Rasgele işlemeye ait bütün bilgileri uygunlukla birleştirmesi nedeni ile olasılık tanımlarının en ideal olanı olmasına karşı, pek çok mühendislik sorunu için bu mükemmelliğe ne gerek vardır ve ne de mümkündür. Eğer temel amaç rasgele büyüklükler üzerine odaklanmışsa, olasılık modelinin tamamı gerekli değildir, ortalama güç ya da frekansa göre güç dağılımı yeterli olacaktır. Eğer rasgele büyüklüklerin olasılık dağılım fonksiyonları bilinmiyorsa, olasılık modelinin kullanılması mümkün olmaz. Her iki durum için de belirli ortalama değerler cinsinden ifade edilebilen istatistik tanımlar, olasılık açısından uygun bir yaklaşım sayılabilirler. 3-4 paragrafında iki raslantı değişkeni arasındaki ilişki’nin, bu değişkenlerin çarpımının beklendik değeri olduğu belirtilmişti. Eğer bu iki raslantı değişkeni iki farklı zaman için aynı bir rasgele işlemenin örnekleri olarak tanımlanmışlarsa, bu beklendik değer, zaman fonksiyonlarının ne kadar çabuk değişebildiklerini gösteren bir özellik gösterir. Seçilen bu iki zamanın birbirine çok yakın olması halinde raslantı değişkenlerinin oldukça yüksek ilişkili olduğu söylenebilir, çünkü zaman fonksiyonları büyük farklılıklar doğuracak biçimde yeterince hızlı değişim göstermezler. Diğer yandan seçilecek iki zamanın birbirinden oldukça uzak olması durumunda raslantı değişkenlerinin değerleri arasında oldukça az ilişki olduğu kabul edilecektir, çünkü herhangi bir belirgin değişim söz konusu olabilir. Daha önce tanımlanan ilişki, raslantı değişkenlerinin zaman fonksiyonları ile bütünleşmiş olmasının gerekli olmadığı durumlar için, yalnızca tek bir sayıdan oluşmuştu. Ancak şimdi incelenecek durumda her bir raslantı değişkeni çifti, aralarındaki zaman farklılığına bağlı olabilir. Bu nedenle iki raslantı değişkeni arasındaki zaman farklılığı ile yaklaşık bir ilişki 142 fonksiyonu tanımlanır. Eğer iki raslantı değişkeni aynı bir rasgele işlemeden kaynaklanıyorsa bu fonksiyon ÖZİLİŞKİ fonksiyonu, farklı rasgele işlemelerden kaynaklanıyorsa ÇAPRAZ İLİŞKİ fonksiyonu olarak adlandırılır. Eğer X(t) bir rasgele işlemeye ait bir örnek fonksiyon ise ve raslantı değişkenleri, X1=X(t1) ve X2=X(t2) olarak tanımlanmışlarsa özilişki fonksiyonu, R X (t1 , t 2 ) = E [X 1 X 2 ] = ∞ ∞ ∫ dx ∫ x x p(x , x )dx 1 −∞ 1 2 1 2 2 −∞ olarak tanımlanır. Bu tanım hem durağan olan ve hem de durağan olmayan rasgele işlemeler için geçerlidir. Ancak, öncelikle ilgilenilecek durağan işleme için 5-1 eşitliğinin sadeleştirilmesi mümkündür. Bir önceki bölümden anımsanacağı gibi geniş anlamda durağan bir işleme için benzer bütün ensemble ortalamaları zaman başlangıcından bağımsızdır. Geniş anlamda durağan işlemeye uygun olarak, R X (t1 , t 2 ) = R X (t1 + T , t 2 + T ) = E [ X (t1 + T ) X (t 2 + T )] yazılabilir. Görüldüğü gibi eşitlik yalnızca t2-t1 zaman farkına bağlıdır. t2t1 zaman farkı τ ile gösterilmek ve RX(0, t2-t1) ifadesinde sıfır kaldırılmak suretiyle 5-1 eşitliği yeniden R X (t1 , t 2 ) = R X (0, t 2 − t1 ) = E[ X (0)X (t 2 − t1 )] şeklinde yazılabilir. Bu durağan bir işlemeye ait özilişki fonksiyonun tanımıdır, ve yalnızca τ ’ya bağlı olup t1 değerinden bağımsızdır. Zaman başlangıcına bağlı olmama söz konusu olduğundan ensemble ortalamaları alınır ve 5-2 eşitliği uygulamada aşağıdaki genel şekli ile kullanılır. R X (τ ) = E [X (t1 ) X (t1 + τ )] Durağan olmayan işlemelerle ilgili ilişki fonksiyonları, örnekler arası zaman farkının yanı sıra, ensemble ortalamasının alındığı, belirli bir zamana bağlıdır ve Rx(t1,t2) ya da RX(t1, τ ) R X (τ ) = E [X (t )X (t + τ )] 143 şeklinde yazılmak zorundadır. Burada ve incelenecek bölümlerde aksi söylenmedikçe bütün durumlardaki ilişki fonksiyonlarının geniş anlamda durağan rasgele işlemeye ait olduğu varsayılacaktır. Belirli bir örnek fonksiyon için zaman cinsinden özilişki fonksiyonu aşağıdaki biçimde tanımlamak mümkündür. T 1 ℜ X (τ ) = lim T →∞ 2T ∫ x(t )x(t + τ )dt = x(t )x(t + τ ) (5-3) −T Burada <.> sembolü zaman ortalamasını belirtmektedir. Ergodik işleme özel hali için x(t )x(t + τ ) , her x(t) için aynıdır ve ℜ X (τ ) ‘ye eşittir. Matematik olarak, ergodik işleme ℜ x (τ ) = R X (τ ) olarak ifade edilebilir. Ergodik varsayımı çoğu kez ilişki fonksiyonlarının hesaplanmasında sadelik sağlar ve yalnızca bu özel durum için geçerlidir. 5-2 eşitliğinden, τ = 0 için Rx(0)=E[X(t1).X(t2)] yazılabileceğinden, özilişki fonksiyonu τ = 0 için işlemenin karesel beklendik değerine eşittir. τ ‘nun sıfırdan farklı değerleri için R X (τ ) özilişki fonksiyonu X(t) ve X(t+ τ ) dalga şekillerinin benzerliğinin bir ölçüsü olarak düşünülebilir. Bu noktayı açıklığa kavuşturmak üzere, X(t)’nin sıfır beklendik değerli, durağan bir işleme olduğu ve tanımlanan fonksiyonun, Y(t)= X(t) - ρ . X (t + τ ) şeklinde verildiği varsayılsın. Y(t)’nin karesel beklendik değerini minimum yapacak değerinin hesaplanması ile X(t+ τ ) dalga şeklinin X(t) dalga şekli içinde ne miktarının bulduğu ölçülebilecektir. ρ ’nun hesaplaması, ve bulunan ifadenin ρ ‘ya göre türevinin sıfıra eşitlenmesi ile mümkün olur. Bu yol aşağıda verilmiştir. { } { E [Y (t )] = E [ X (t ) − ρ . X (t + τ )] 2 2 { } } = E X 2 (t ) − 2 ρ . X (t ) X (t + τ ) + ρ 2 X 2 (t + τ ) σ Y = σ X − 2 ρ .R X (τ ) + ρ σ X dσ Y = −2 R X (τ ) + 2 ρ .σ X = 0 dρ R (τ ) ρ= X σX 2 2 2 2 2 2 2 144 5-5 eşitliğinden, ρ ‘nun RX( τ ) ile doğrudan bağlantılı olduğu ve ilişki katsayısı olarak daha önce görüldüğü hatırlanacaktır. ρ katsayısı X(t) dalga şeklinin τ saniye geçildikten sonra kalan kısmının bir parçası gibi düşünülebilir. ρ ‘nun istatistik bazdan hesaplanabileceği, ensemble boyunca örnek fonksiyonun sınırlandırılmış ortalaması olduğu ve bu özelliğin genel olduğu önemlidir ve hatırda tutulmalıdır. Daha önce değinildiği gibi ilişki katsayısı, ρ , -1 ile 1 arasında değişmektedir. ρ = 1 için dalga şekillerinin eş olduğu anlaşılır ve iki dalga şekli için tam ilişkilidir denir. ρ = 0 için dalga şekillerinin tamamen ilişkisiz olduğu ve X(t+ τ ) dalga şeklinin X(t) dalga şekli içinde hiç bulunmadığı anlaşılmalıdır. ρ = −1 için ise dalga şekillerinin eş olduğu ancak işaretlerinin zıt olduğu bilinmektedir, yani X(t+ τ ), X(t)’nin ters işaretlisidir. Ergodik bir işleme ya da rasgele olmayan bir işaret için değişinti yerine ortalama güç ve ensemble ilişki fonksiyonu yerine zaman ilişki fonksiyonu alınabilir. RX( τ ) hem ilişki katsayısı ρ ‘ya ve hem de işlemenin değişintisi σ X2 ‘ye bağlı olduğundan, RX( τ )’nun herhangi belirli bir değerinin önemini tahmin etmek, bunlardan birinin bilinmemesi durumunda olanaksızdır. Örneğin eğer bir rasgele işleme sıfır beklendik değerli ve özilişki fonksiyonu pozitif değerli ise, çoğu X(t1) ve X(t1+ τ ) raslantı değişkenlerinin büyük olasılıkla aynı işaretli oldukları söylenebilir.* Eğer özilişki fonksiyonu negatif değere sahipse raslantı değişkenlerinin işaretlerinin zıt olduğu söylenir. Eğer sıfıra çok yakınsa zıt işaretli de, aynı işaretli de olabilecekleri düşünülebilir. * Bu eğer p(x), x1=0 eksenine göre simetrik ise kesinlikle doğrudur. 145 5-2 ÖRNEK: BINARY İŞLEMENİN ÖZİLİŞKİ FONKSİYONU Yukarıda ele alınan kavramlar, çok basit bir özilişki fonksiyonuna sahip bir rasgele işlemeyi örnek alarak değerlendirmeyle daha açıkça görülebilir. Şekil 5-1 sıfır beklendik değerli, durağan, ayrık tipik bir fonksiyonu göstermektedir. Bu işlemede yanlızca m A olası iki değer sözkonusudur. Örnek fonksiyon bu değerlerden birinden diğerine eş olasılıkla her "ta" saniyede değişebilir ya da aynı kalır. " t0 " zamanı "ta" uzunluğu boyunca uniform dağılımlı ve ensemblenin olası zaman fonksiyonlarına bağlı bir raslantı değişkenidir. Bunun anlamı, ensemble düşünüldüğü sürece eş olasılıkla herhangi bir zamanda değerce değişebileceğidir. Aynı zamanda herhangi bir aralıkta X(t)’nin değerinin, herhangi başka bir aralıktaki değerinden istatistik olarak bağımsız olduğunu varsayalım. Şekil 5-1: Ayrık ve Durağan bir Örnek Fonksiyon 146 Bu işlemenin özilişki fonksiyonu kesin biçimde türetmeden çok yaklaşım yolu izlenerek hesaplanacaktır. İlk olarak | τ |, ta’dan büyükse; t1 ve t1+ τ =t2 aynı aralıkta olamaz, X1 ve X2 istatistik bağımsızdır. X1 ve X2 sıfır beklendik değerli olduğundan, çarpımlarının beklendik değeri (3.22)’de gösterildiği gibi sıfırdır. R X (τ ) = E [X 1 X 2 ] = X 1 X 2 = 0 ≥ 0 | τ |, ta’dan daha küçükse t1 ve t1+ τ aynı aralıkta olabilir veya olmayabilir. Bu tamamen to‘ın değerine bağlıdır. Madem ki to herhangi bir yerde olabilir o halde, eş olasılıkla, aynı aralıkta olma olasılığı ta ile τ arasındaki fark ile orantılıdır. Özel olarak τ ≥ 0 için t 0 ≤ t1 ≤ t1 + τ < t 0 + t a t1 + τ − t a < t 0 ≤ t1 O halde olduğu ve buradan olacağı görülür. Pr (t1 ve t1+ τ ’nun aynı aralıkta olması) = Pr [(t1 + τ − t a < t 0 ≤ t1 )] = (1 / t a )[t1 − (t1 + τ − t a )] = (t a − τ ) / t a t0 için olasılık yoğunluk fonksiyonunun sadece 1/ta olduğu bilindiğine göre yukarıdaki ifade yazılabilir. τ < 0 için ise t 0 ≤ t1 + τ ≤ t1 < t 0 + t a ve buradan t1 − t a < t 0 ≤ t1 + τ olacağı görülür. Böylece Pr ( t1 ve t1+ τ aynı aralıkta) = Pr[(t1 − t a ) < t 0 ≤ (t1 + τ )] = (1 / t a )[t1 + τ − (t1 − t a )] = (t a + τ ) / t a Sonuç olarak genelde, 147 Pr (t1 ve t1+ τ aynı aralıkta) = (ta - | τ | ) /ta olacaktır. Her ikisinin aynı aralıkta alınması halinde X1 ve X2 çarpımı daima A olur, aynı aralıkta alınmamaları halinde ise çarpım sıfırdır. O halde, t − | τ | | τ | 2 R X (τ ) = A 2 a = A 1 − ta ta =0 0 ≤ τ ≤ ta τ ≥ ta (5-6) Bu fonksiyon şekil 5-2’de gösterilmiştir, ŞEKiL 5-2 Önceki çalışmaların ışığı altında bu özilişki fonksiyonunun fiziksel anlamını incelemek ilginçtir, | τ |’nun küçük olması halinde (t0’dan küçük) artan bir olasılık sözkonusudur, X(t1) ve X(tl+ τ ) aynı değere sahip olacak ve özilişki fonksiyonu pozitif olma özelliği gösterecektir. | τ |’nun to’dan büyük olması halinde eş olasılıkla X(t1) ve X(t1+ τ ) aynı değerlerde olduğu kadar zıt değerlerde olacak ve özilişki fonksiyonu sıfıra eşit olacaktır. τ =0 için özilişki fonksiyonu A2 olacaktır. karesel ortalama değere eşit 148 5-3 ÖZİLİŞKİ FONKSİYONLARININ ÖZELLİKLERİ Durağan rasgele işlemelerin bütün özilişki fonksiyonlarının sahip olduğu birkaç önemli genel özellik aşağıda özetlenmiştir. 1- Rx(0) = X 2 ’dir. O halde bir rasgele işlemenin karesel beklendik değeri yanlızca özilişki fonksiyonunda τ yerine sıfır yazılmak suretiyle daima elde edilebilir. 2- Rx( τ ) = Rx(- τ ) olup, özilişki fonksiyonu τ ’ya göre çift bir fonksiyondur, çünkü geçiş yönü dikkate alınmaksızın aynı çarpım değerleri setinin ortalaması alınarak bulunmuştur. 3- R X (τ ) ≤ R X (0) özilişki fonksiyonunun en büyük değeri daima τ =0’da meydana gelir. τ ‘nun diğer değerleri için büyük olabilir ancak en büyük değer değildir. Bu durum aşağıdaki şekilde kolayca gösterilebilir. [ ] [ ] E ( X 1 ± X 2 ) = E X 12 + X 22 ± 2 X 1 X 2 ≥ 0 2 [ ] E X 12 + X 22 = 2 R X (0) ≥ E (2 X 1 X 2 ) = 2 R X (τ ) ve buradan R X (0) ≥ R X (τ ) (5-7) 4- Eğer X(t) bir dc bileşene sahipse ya da bir beklendik değeri sözkonusu ise Rx( τ ) sabit bir bileşene sahip olacaktır. Örneğin, X(t)=A ise R X (τ ) = E [X (t1 ) X (t1 + τ )] = E [AA] = A 2 (5-8) Daha genel olarak eğer X(t) bir beklendik değere sahip (sıfırdan farklı) ve sıfır beklendik değerli bir N(t) bileşeni de varsa, X(t) = X + N(t) olur ve buradan R X (τ ) = E {[X + N (t1 )][X + N (t1 + τ )]} [ ] = E (X ) + XN (t1 ) + XN (t1 + τ ) + N (t1 )N (t1 + τ ) 2 = ( X ) + R N (τ ) 2 E [N (t1 )] = E [N (t1 + τ )] = 0 (5-9) 149 Bu durum için bile RX( τ ) sabit bir bileşene sahiptir. 5- Eğer X(t) peryodik bir bileşen içeriyorsa, R X (τ ) da aynı peryotlu peryodik bir bileşene sahip olacaktır. X (t ) = A. cos(ω .t + θ ) şeklinde ise, burada A ve ω sabitleri, θ da 0 ile 2π aralığında uniform dağılımlı raslantı değişkenini belirtmektedir. 1 2π =0 p(θ ) = 0 ≤ θ ≤ 2π sınırlar dışında O halde, R X (τ ) = E [A. cos(ω .t1 + θ )A. cos(ω .t1 + ωτ + θ )] A2 A2 = E cos(2ω .t1 + ωτ + 2θ ) + cos ωτ 2 2 2 2π A 1 [cos(2ω .t1 + ωτ + 2θ ) + cos ωτ ]dθ = ∫ 2 0 2π = A2 cos ωτ 2 (5-10) ve en genel durum için X (t ) = A. cos(ω .t + θ ) + N (t ) burada θ ve N(t1) bütün t1 değerleri için istatistiksel bağımsızdır. 5-9’daki yöntem uygulanarak, R X (τ ) = A2 cos ωτ + R N (τ ) 2 (5-11) kolayca elde edilebilir. Sonuç olarak özilişki fonksiyonunda peryodik bir bileşene sahip olduğu görülecektir. 6- Eğer {X(t)} sıfır beklendik değerli bir ergodik işleme ise ve peryodik bileşene sahip değilse, lim R X (τ ) = 0 τ →∞ (5-12) 150 olur. τ ‘nun büyük değerleri için zamanın ilerlemesi ile geçmiş değerlerin etkisi dışında kalması sağlanmaktadır, o halde raslantı değişkeni istatistik bağımsızlık özelliği gösterirler. 7- Özilişki fonksiyonları keyfi herhangi bir şekle sahip olamazlar. Şekli açıklamada bir yol, özilişki fonksiyonunun Fourier dönüşümü cinsinden ifade edilmesine izin verilmesidir. Eğer ℑ[R X (τ )] = ∞ ∫ R (τ )e − jωτ X dτ −∞ ise sınırlama ℑ[R X (τ )] ≥ 0 (5-13) (bütün τ ‘lar içindir.) Bu sınırlamanın nedeni bir sonraki bölümde spektral yoğunluğun incelenmesinden sonra açıklığa kavuşacaktır. Bu sınırlamanın dışında özilişki fonksiyonunun varlığı engelleyen diğer şeyler arasında fonksiyonun üstünün düz olması, düşey kenarları olması, ve genellikle süreksizliklerin olması sayılabilir. Özilişki fonksiyonu ile ilgili bir noktanın da ortaya konması gerekir. Bir rasgele işlemenin bileşik olasılık yoğunluk fonksiyonuna ait bilgilerden tek bir özilişki fonksiyonu elde etmek uygun olmasına karşın aksi doğru değildir. Pek çok farklı rastgele işleme, bizi aynı özilişki fonksiyonuna götürebilir. Daha ileri gidilerek, daha sonra görüleceği gibi bir lineer sistemin giriş işaretinin özilişki fonksiyonuna etkisi olasılık yoğunluk fonksiyonları hakkında herhangi bir şey bilinmesine gerek olmaksızın hesaplanabilir. Bu nedenle, bir rasgele işlemenin ilişki fonksiyonuna ait özellikleri, olasılık yoğunluk fonksiyonuna ait özelliklerle eş değildir, ve gerçekte daha az bilgi verirler. Alıştırma 5-3 Bir özilişki fonksiyonu R X (τ ) = 100ε −10 τ + 100 cos 10τ + 100 151 şeklindedir, Bu işlemenin beklendik değerini, karesel beklendik değerini ve değişintisini bulunuz. 5-4 ÖZİLİŞKİ FONKSİYONLARININ ÖLÇÜMÜ Lineer Sistem analizinde rasgele girişler için özilişki fonksiyonu önemli bir rol oynadığından, önemli bir uygulama sorunu, deneysel olarak gözlemlenen rasgele işlemler için bu fonksiyonların hesaplanmasıdır. Genelde bileşik yoğunluk fonksiyonları nadiren bilindiğinden bu yoğunluk fonksiyonları yardımı ile hesaplanmayabilir. Ensemblenin tek bir örnek fonksiyonu gözlenebileceğinden bir ensemble ortalamasının bulunmasıda söz konusu olamaz. Bu koşullar altında tek seçenek işlemlemenin ergodik varsayılması halinde sonlu zaman aralığından zaman özilişki fonksiyonunun hesaplanmasıdır. Bunu gösterebilmek üzere, 0-T aralığında gözlenen özel x(t) gerilim veya akım fonksiyonu ele alınsın. Bu durumda bu dalga şekli için bir ilişki kestirimi tanımlamak olasıdır. Rˆ X (τ ) = 1 T −τ T −τ ∫ x(t )x(t + τ )dt 0 ≤ τ << T (5-14) 0 Bu kestirim bir raslantı değişkenidir ve R̂ X (τ ) ile gösterilmiştir. Ortalama zamanı T olmayıp T- τ alınmıştır, çünkü bu kısım x(t) ve x(t+ τ )’nun içinde olabileceği tek olası aralıktır. Pratik uygulamaların pek çoğunda x(t)’nin matematik ifadesinin nedeni ile 5-14’te verilen integrasyonun çözümü olanaksızdır. Diğer bir yöntem sürekli dalga şeklinin örneklenmesi sureti ile ayrık duruma geçilip 5-14 eşitliğidir ayrık halde yaklaşık ifadesini yazmaktır. Bu şekilde eğer örnek fonksiyonun 0, ∆t ,2∆t ,...., N∆t zamanlarına karşı gelen x(t) değerleri xo,x1,x2,....,xN olarak ifade edilirse 5-14 eşitliğinin ayrık eşdeğeri Rˆ X (n∆t ) = N −n 1 ∑ xk xk +n N − n + 1 k =0 n=0,1,2,...,M (5-15) M<<N olur. Bu kestirimde ensemble boyunca raslantı değişkenidir ve Rˆ X (n∆t ) ile gösterilir. N oldukça büyük (birkaç bin mertebesinde) olduğundan bu işlem en iyi bir şekilde, sayısal bir bilgisayarla çözümlenir. Bu amaçla hazırlanmış standart programlar vardır. Bu kestirimin kalitesini saptamak üzere, Rˆ X (n∆t ) ‘nin bir raslantı 152 değişkeni olması, alınan değerlerin anlamlı olması kullanılan örnek fonksiyona ve alınan örnekler setine bağlı olması nedeneyle, beklendik değer ve değişintisinin hesaplanması gereklidir. Beklendik değer N −n 1 E Rˆ X (n∆t ) = E X k X k +n ∑ N − n + 1 k =0 N −n N −n 1 1 [ ] = E X X = R X (n∆t ) ∑ k k +n N − n + 1 ∑ N − n + 1 k =0 k =0 = R X (n∆t ) [ ] olduğundan kolayca elde edilir. Böylece kestirimin beklendik değeri, özilişki fonksiyonunun gerçek değerine eşit olur. Bu tip bir kestirim kutupsuz (Unbiased) olarak adlandırılır. Kestirimin değişintisinin bulunması oldukça güçtür ve ayrıntıları konumuzun dışında kalmaktadır, bununla beraber kestirimin değişintisinin [ M ] Var Rˆ X (n∆t ) ≤ (2 / N ) ∑ R X 2 (k∆t ) (5-16) k =− M olduğunu söyleyebiliriz. Verilen bir duyarlık derecesi anlama geldiğini açıklamak fonksiyonunun her iki yanda istensin. Eğer efektif hatanın 16 eşitliği (t = 4 ∆ t) için 4 için örnek sayısı cinsinden bu sonucun ne açısından şekil 5-2 de gösterilen özilişki 4 nokta ile (M = 4) kestiriminin bulunması % 5 veya daha küçük olması isteniyorsa 5- (.05 A ) ≥ (2 / N ) ∑ A [1 + ( k ∆t / 4∆t )] 2 2 4 2 k = −4 ve bu çözümlendiği takdirde N için N ≥ 2200 elde edilir. Eğer ilişki fonksiyonun daha duyarlı bir kestirimi gerekli ise daha sık örnek alınması ve daha çok hesaplama yapılması gerektiği açıktır. 153 ALIŞTIRMA 5-4 Şekil 5-2’de gösterildiği biçimde üçgen bir özilişki fonksiyonu için, efektif hatanın %1’e eşit ya da daha küçük olması halinde N değerinin ne olması gerekeceğini her iki yanda 5 nokta ile (M=5) hesaplayınız. 5-5 ÖZİLİŞKİ FONKSİYONUNA AİT ÖRNEKLER Çapraz ilişki fonksiyonlarını incelemeye başlamadan önce, karşımıza çıkabilecek bazı durumları değerlendirmek ve olası uygulamalarına ait fikir vermek üzere bazı tipik özilişki fonksiyonlarını incelemek yararlı olacaktır. Bu açıklamalar tüm ayrıntıları içermeyecek fakat bazı yeni kavramlarla tanışmayı sağlayacaktır. Şekil 5-2’de görülen üçgen ilişki fonksiyonu, üniform zaman aralıklarında değişim gösteren tipik rasgele binary işaretlerine aittir. Bu tip bir işaret sürekli haberleşme ve kontrol sistemlerinin pek çoğunda işaretlerinin peryodik örneklenmesi ve bunların binary sayılara dönüştürülmesiyle karşımıza çıkar. Şekil 5-2’de gösterilen ilişki fonksiyonu, beklendik değeri sıfır varsayılan rasgele işlemeye aittir, fakat bu durumla her zaman karşılaşılmaz. Örneğin eğer rasgele işaret A ve (-A yerine) sıfır değerlerini alıyorsa, bu halde işlemenin beklendik değeri A/2 ve karesel beklendik değeri A2/2 olur. Sonuçta özilişki fonksiyonu şekil 5-3’te görüldüğü gibi olur ve 5-9 eşitliğinin bir uygulamasıdır. ŞEKİL 5-3: Beklendik Değeri 0’dan Farklı Olan Binary İşlemenin Özilişki Fonksiyonu 154 Bununla beraber bütün binary zaman fonksiyonlarının özilişki fonksiyonlarının üçgen biçimde olacağı söylenemez. Örneğin diğer genel bir tip binary işaret değişimleri tamamen rasgele zamanlarda olan bir özellik gösterebilir. Eğer bütün zamanlarda eş olasılıklı ise, her bir aralığın süresi ile bağlantılı olasılık yoğunluk fonksiyonu 2-7 paragrafında değinildiği gibi üstel olmaktadır. Sonuçta elde edilecek özilişki fonksiyonu da şekil 5-4’te görüldüğü gibi üstel olacaktır. Bu tip bir özilişki fonksiyonunun bilinen matematiksel gösterilişi R x (τ ) = A 2 ε −α τ (5-17) şeklindedir. Burada α , saniyedeki aralık sayısının ortalamasıdır. Şekil 5-4’te görülen tipte binary işaretleri ve özilişki fonksiyonları karşımıza radyoaktif monitoring düzenlerle bağlantılı olarak oldukça sık çıkmaktadır. Bir partikül dedektörünün çıkışında rasgele oluşan pulslar bir flip-flop devresini tetiklemede kullanılmak suretiyle binary işaret üretilir. Bu tip bir işaret hem partiküller arasındaki zaman ortalamasını hem de oluşan ortalama hızı ölçmede uygunluk sağlar. ŞEKİL 5-4: (a) Rasgele Zaman Aralıklarında Tetiklenen Binary İşaret (b) Karşı Düşen Özilişki Fonksiyonu 155 Binary olmayan bir işaretin özilişki fonksiyonu da üstel olabilir. Örneğin oldukça geniş bantlı bir gürültü (herhangi bir olasılık yoğunluk fonksiyonuna sahip) bir alçak geçiren RC filtresinden geçtiğinde filtre çıkışında görülen işaretin özilişki fonksiyonu hemen hemen üstel bir yapıda olacaktır. Bu sonuç bölüm 7’de ayrıntılı olarak ele alınacaktır. Şimdiye kadar tartışılan bütün özilişki fonksiyonları nın bütün değerleri için pozitif olarak ele alınmıştır. Gerekli olmamalarına karşın iki genel tip özilişki fonksiyonu negatif bölgede değerlere sahiptir. Bunlar R x (τ ) = A 2 ε −α τ cos βτ (5-18) R x (τ ) = A 2 sin πγτ / πγτ (5-19) ve denklemleri ile verilmiş olup Şekil 5-5’de gösterilmiştir. (a) (b) ŞEKİL 5-5: (a) Band Geçiren Filtre ve (b) Alçak Geçiren Filtre Çıkışlarında Oluşan Özilişki Fonksiyonları 156 5-18 eşitliğindeki özilişki fonksiyonu geniş band gürültü uygulanan dar banda geçiren filtrenin çıkışına, 5-19 eşitliğindeki özilişki fonksiyonu ise ideal alçak geçiren filtre çıkışına eşittir. Bu sonuçların her ikisi de 6. ve 7, bölümde türetilecektir. Sinyal ve filtre analizi ile bağlantılı olarak çeşitli tipte özilişki fonksiyonunun olmasına rağmen burada en çok karşılaşılan birkaçı verilmeye çalışılmıştır. Öğrenci 5-3 paragrafında verilen özilişki fonksiyonlarına ait özellikleri bütün özilişki fonksiyonlarının taşıdıklarına ve doğruladıklarına dikkat etmelidir. ALIŞTIRMA 5-5 Şekil 5.4-a’da gösterilen binary dalga şeklinde değerlerin A ve 0 arasında olduğunu düşünerek sonuçta elde edilecek özilişki fonksiyonuna ait eğriyi çiziniz ve uygun noktalara değerleri yazınız. 5-6 ÇAPRAZ İLİŞKİ FONKSİYONLARI İki ayrı rasgele işlemeye ait raslantı değişkenleri arasında bir ilişki düşünmek olasıdır. Bu durumlarla, bir sisteme birden çok rasgele işaretin uygulanması veya rasgele gerilim ya da akımın sistemin farklı noktalarındaki değerlerini karşılaştırma hallerinde karşılaşılır. Eğer rasgele işlemeler geniş anlamda bileşik durağan ise ve bu işlemelere ait örnek fonksiyonlar X(t) ve Y(t) ile ifade ediliyorsa X1= X(t1) Y2 = Y(t1+ τ ) olup bu iki raslantı değişkeni için çapraz ilişki fonksiyonunu tanımlamak olasıdır. R XY (τ ) = E [ X 1Y2 ] = ∞ ∞ ∫ dx ∫ x y p(x , y )dy 1 −∞ 1 2 1 2 2 (5-20) −∞ Çapraz ilişki fonksiyonunda indisin sırası önemlidir, indisin ikinci harfi, (t1+ τ ) da alınan raslantı değişkenini belirtir. Aynı iki zaman için tanımlanabilir bir başka özilişki fonksiyonu da vardır. Bu kez 157 Y1= Y(t1) X2= X(t1+ τ ) R XY (τ ) = E [Y1 X 2 ] = alınarak ∞ ∞ −∞ −∞ ∫ dy1 ∫ y1 x 2 p( y1 , x2 )dx2 (5-21) Her iki rasgele işlemenin bileşik olarak durağan olduğu varsayılması nedeniyle, bu çapraz ilişki fonksiyonlarının yalnızca τ zaman farkına bağlı olacağını belirtelim. Zaman çapraz fonksiyonları, belirli bir çift örnek fonksiyon için daha önce olduğu gibi tanımlanabilir. T 1 ℜ XY (τ ) = lim x(t ) y (t + τ )dt T →∞ 2T ∫ −T (5-22) ve T 1 ℜ YX (τ ) = lim y (t )x(t + τ )dt T →∞ 2T ∫ −T (5-23) Eğer rasgele işlemeler bileşik ergodik özelliği gösteriyorlarsa, bu halde 5-22 ve 5-23 eşitlikleri örnek fonksiyonlarının her çifti için bizi aynı sonuca götürecektir. O halde ergodik işlemeler için, ℜ XY (τ ) = R XY (τ ) ℜ YX (τ ) = RYX (τ ) (5-24) (5-25) olacaktır. Genelde, çapraz ilişki fonksiyonunun özilişki fonksiyonuna göre daha somut bir fiziksel açıklaması yoktur. Yalnızca iki raslantı değişkeninin birbirine ne kadar bağlı (ilgili) olduğunun bir ölçüsüdür. Buna karşın sistem analiziyle ilgili ilerdeki incelemelerde giriş ve çıkış arasında belirli çapraz ilişkinin, oldukça kesin ve önemli bir fiziksel özellik taşıdığı görülecektir. 5-7 ÇAPRAZ İLİŞKİ FONKSİYONLARININ ÖZELLİKLERİ Tüm çapraz ilişki fonksiyonlarının genel özellikleri özilişki fonksiyonlarına ait özelliklerden oldukça farklıdır. Bunlar aşağıdaki gibi özetlenebilirler, 1- Rxy(0) ve Ryx(0) büyüklüklerinin özel olarak fiziksel bir anlamı yoktur. 158 anlamı yoktur ve karesel beklendik değeri ifade etmezler. Ancak, Rxy(0) = Ryx(0) özelliğini taşırlar. 2- Çapraz ilişki fonksiyonları genel olarak τ ’nun bir çift fonksiyonu değildir. Bununla beraber aşağıdaki eşitlikle verilen bir çeşit simetri vardır. RYX (τ ) = R XY (− τ ) (5-26) Bu sonuçlardan, Y(t)’nin (zaman olarak) bir yönde kaydırılması, X(t)’nin aksi yönde kaydırılmasına eşdeğer olduğu görülecektir. 3- Çapraz ilişki fonksiyonunun maksimum değerinin τ = 0 ’da olması gerekmez. Bununla beraber R XY (τ ) ≤ [R X (0 )RY (0 )] 1/ 2 (5-27) olduğu gösterilebilir. R yx (τ ) için de benzer ifade yazılabilir. Çapraz ilişki fonksiyonunun maksimumu herhangi bir noktada olabilir, ancak değeri bu eşitlikteki değerden büyük olamaz. 4- Eğer iki rasgele işleme istatiksel olarak bağımsız ise, R XY (τ ) = E [X 1 , Y2 ] = E [ X 1 ]E [Y2 ] = XY = RYX (τ ) (5-28) olur. Buna ilave olarak, her iki işleme de sıfır beklendik değerli ise bütün τ değerleri için çapraz ilişki fonksiyonu kaybolur. Bununla beraber, bunun aksinin doğru olması gerekmez. Çapraz ilişki fonksiyonunun sıfır olması ve işlemelerden birinin sıfır beklendik değerli olması, bu rasgele işlemenin bileşik Gauss raslantı değişkenleri olmasının dışında istatistik bağımsızlığı ortaya koymaz. 5- Eğer X(t), bir durağan, rasgele işleme ve X& (t) onun zamana göre türevi ise, X(t) ve X& (t)’nin çapraz ilişki fonksiyonu R X&X& (τ ) = dR X (τ ) dτ (5-29) olarak tanımlanır. 5-29 eşitliğinin sağ tarafı özilişki fonksiyonunun τ ’ya göre türevinden başka birşey değildir. Bu temel türev tanımı kullanılarak kolayca gösterilebilir. 159 X (t + ε ) − X (t ) X& (t ) = lim ε ε →0 Buradan [ ] R XX& (τ ) = E X (t )X& (t + τ ) X (t ) X (t + τ + ε ) − X (t )X (t + τ ) = E lim ε ε →0 R (τ + ε ) − R X (τ ) dR X (τ ) = lim X = ε →0 ε d (τ ) limit ve beklendik değer işlemlerindeki yer değiştirmelere sürece izin verilebilir. Eğer bu işlem tekrarlanırsa, fonksiyonunu göstermek de olasıdır. Bu fonksiyon, R X& (τ ) = R X&X& (τ ) = − d 2 R X (τ ) dτ 2 X& (t ) var olduğu X& (t ) ’nin özilişki (5-30) olacaktır. Görüldüğü gibi eşitliğin ikinci tarafı ana özilişki fonksiyonunun τ ’ya göre ikinci türevi olmaktadır. ALIŞTIRMA 5-7 X1 E ± R X (0 ) RY (0 ) Y2 2 değerini inceleyerek 5-27 eşitliğini ispatlayınız. 5-8 ÇAPRAZ İLİŞKİ UYGULAMALAR FONKSİYONLARINA AİT ÖRNEK VE Daha önce değinildiği gibi, çapraz ilişki fonksiyonlarının uygulamalarından bir iki ya da daha çok rasgele girişe sahip sistemlerle ilgili idi. 160 Bunu daha ayrıntılı olarak ortaya koymak üzere, örnek fonksiyonu, Z (t ) = X (t ) ± Y (t ) şeklinde olan bir rasgele işleme düşünülsün. X(t) ve Y(t) de rasgele işlemenin örnek fonksiyonlarıdır. O halde tanımlama, raslantı değişkenleri Z 1 = X 1 ± Y1 = X (t1 ) ± Y (t1 ) Z 2 = X 2 ± Y2 = X (t1 + τ ) ± Y (t1 + τ ) şeklindedir. Z(t)’nin özilişki fonksiyonu ise RZ (τ ) = E [Z 1 Z 2 ] = E [( X 1 ± Y1 )( X 2 ± Y2 )] = E[ X 1 X 2 + Y1Y2 ± X 1Y2 ± Y1 X 2 ] = R X (τ ) + RY (τ ) ± R XY (τ ) ± RYX (τ ) (5-31) olur. Bu sonuç herhangi bir sayıda raslantı değişkeni için kolayca genişletilebilir. Genel olarak bu tip bir toplamın özilişki fonksiyonu, toplama katılan bütün özilişki fonksiyonlarının toplamına ilave olarak bütün çapraz ilişki fonksiyonlarının toplamına eşit olacaktır. Eğer iki rasgele işlemenin istatistiksel olarak bağımsızlığı sözkonusu ise ve bunlardan birinin beklendik değeri sıfır ise 5-31 eşitliğindeki her iki çapraz ilişki fonksiyonu kalmayacak ve toplamın özilişki fonksiyonu özilişki fonksiyonlarının toplamından oluşacaktır. Peryodik sinyallerin rasgele gürültüden ayrılması ile bağlantılı olarak karşılaşılan bu sonucun önemini göstermek üzere bir örnek verelim. X(t) istenen örnek fonksiyon X (t ) = A cos(ω .t + θ ) (5-32) şeklinde olsun. Burada θ bir raslantı değişkenidir. Daha önce gösterildiği gibi bu işlemeye ait özilişki fonksiyonu 1 R X (τ ) = A 2 cos ωτ 2 (5-33) 161 şeklindedir. Ayrıca bu işaretle istatistik bağımsız Y(t) örnek fonksiyonu sıfır beklendik değerli rasgele gürültüyü belirttiğine ve özilişki fonksiyonu RY (τ ) = B 2ε −α τ (5-34) şeklinde verilmiş olduğuna göre, gözlenen Z(t) büyüklüğüne ait özilişki fonksiyonu 5-31 eşitliğindeki gibi RZ (τ ) = R X (τ ) + RY (τ ) 1 −α τ = A 2 cos ω .t + B 2 ε 2 (5-35) olacaktır. τ ŞEKİL 5-6: Sinüsoidal İşaretin Gürültü İle Toplamının Özilişki Fonksiyonu Bu fonksiyon Şekil 5-6’da ortalama gürültü gücü y2’nin ortalama işaret gücü (1/2)A2’den daha büyük olması hali için gösterilmiştir. Şekilden görüleceği üzere (gürültü özilişki fonksiyonu τ sonsuza giderken sıfıra yaklaşması nedeniyle τ ’nun büyük değerleri için özilişki fonksiyonunun daha çok işarete bağlı olduğu açıktır. Böylece alınan işaret ile gürültüye ait özilişki fonksiyonunu ölçmede yaklaşık yöntemin kullanılması ile sinüsoidal işaretin çok küçük miktarını gürültünün büyük miktarından ayırmak olasıdır. 162 Bilinen küçük bir işareti, sinyal-gürültü birleşiminden ayırmada bir başka yöntem çapraz ilişki işleminin yapılmasıdır. Bununla ilgili tipik bir örnek X(t) işareti gönderen radar sistemi olabilir. Herhangi bir hedeften geri dönen işaret X(t)’nin çok küçük bir parçasıdır ve gidip gelme süresi kadar zamanca gecikmelidir. Radar girişinde gürültü daima var olduğundan algılanan işaret Y (t ) = aX (t − τ 1 ) + N (t ) (5-36) olarak tanımlanabilir. Burada "a" birden küçük olan bir sayı, τ 1 işaretin gidip gelmesinden dolayı zaman gecikmesi, N(t) ise alıcıdaki gürültüdür. Tipik bir durum için dönen işaret aX(t- τ 1 ) ortalama gücü, gürültünün ortalama gücü N(t)’den çok daha küçüktür. Gönderilen işaretin ve toplam alıcı girişinin çapraz ilişki fonksiyonu R XY (τ ) = E [X (t )Y (t + τ )] = E[aX (t )X (t + τ − τ 1 ) + X (t )N (t + τ )] = aR X (τ − τ 1 ) + R XN (τ ) (5-37) olacaktır. İşaret ve gürültü istatistik bağımsız ve sıfır beklendik değerli (çünkü bunlar RF bandpass işaretlerdir) olduklarından X(t) ve N(t) arasındaki çapraz ilişki fonksiyonu bütün değerleri için sıfırdır. Bu sebeple 5-37 eşitliğine göre, R XY (τ ) = aR X (τ − τ 1 ) (5-38) olur. Özilişki fonksiyonlarında maksimum değerin orijinde meydana geldiği anımsanırsa τ ’nun R xy (τ ) maksimum olacak şekilde ayarlanması halinde τ = τ 1 , olacak ve bu değer hedefe olan mesafeyi gösterecektir. Çapraz ilişki fonksiyonlarının gerçek ölçümleri 5-4’te özilişki fonksiyonlarının ölçümleri için önerilen yolla ortaya konulabilir. Çapraz ilişki fonksiyonları söz konusu olduğunda ölçmenin bu tipi hala kutuplanmamıştır ancak kestirimin değişintisi için 5-16’da verilen sonuç özellikle yukarıda ele alınan radar örneğindeki gibi işaret ilave ilişkisiz gürültü içeriyorsa kesin doğru değildir. Genel olarak söylemek gerekirse, çapraz ilişki fonksiyonunun kestiriminde verilen bir değişintiyi elde etmek için istenen örnek sayısı, özilişki için istenenden çok daha büyüktür. 163 5.9 ÖRNEKLENMİŞ FONKSİYON İÇİN İLİŞKİ MATRİSİ Peryodik zaman aralıkları ile örneklenmiş tek bir zaman fonksiyonu durumunda oluşan işareti ifadede onu vektörel olarak göstermek kullanışlıdır. Sadece N gibi sonlu sayıda örnek ele alındığında herbir örnek değeri, (N X 1)!lik vektörün bir elemanı olacaktır. Böylece eğer örnek zamanları t1, t2,...,tN ise X(t) zaman fonksiyonu vektör olarak X (t1 ) X (t ) 2 X = ... X (t N ) şeklinde ifade edilebilir. Eğer X(t) bir rasgele işlemenin bir örnek fonksiyonu ise X vektörünün her bir elemanı bir raslantı değişkenidir. Bu durumda her bir raslantı değişkeni çifti arasındaki ilişkiyi veren (NXN) boyutlu ilişki matrisini tanımlamak olasıdır. [ R X = E XX T ] X (t1 ) X (t1 ) X (t1 ) X (t 2 ).... X (t1 ) X (t N ) X (t ) X (t ) X (t ) X (t ).... 2 1 2 2 =E ... X (t N ) X (t1 )................... X (t N ) X (t N ) Burada XT , X’in transpozesidir. Matrisdeki her bir elemanın beklendik değeri alındığında o eleman rasgele işlemenin X(t)’den gelen özilişki fonksiyonunun özel bir değeri olur. 164 R X (t1 , t1 )R X (t1 , t 2 )....R X (t1 , t N ) R (t , t )R (t , t ) X 2 1 X 2 2 RX = .... R X (t N , t1 )...............R X (t N , t N ) (5-39) X(t)’den gelen rasgele işleme geniş anlamda durağan RX’in bütün bileşenleri yanlızca zaman farkının bir fonksiyonu olur. Eğer örnekler arasındaki aralık ∆t ise, t 2 = t1 + ∆t t 3 = t1 + 2∆t … t N = t1 + ( N − 1)∆t olur ve R X [0]R X [∆t ]...R X [( N − 1)∆t ] R [∆t ]R [0] X X . RX = . . R X [( N − 1)∆t ]........R X [0] (5-40) Burada özilişki fonksiyonunun simetri özelliği görülecektir. R X [i.∆t ] = R X [− i.∆t ] . Bu simetrinin bir sonucu olarak RX (durağan olmasa bile) simetrik bir matristir, ama köşegen (ve buna paralel bütün köşeler) eş elemanlardan oluşur. Her ne kadar daha önce RX sadece bir mantık sonucu olarak tanımlanmışsa da, örnek değerden oluşan raslantı vektörünün ilişki matrisi ifade için oldukça genel bir yol değildir. Daha genel bir yol kovaryans matrisini tanımlamaktır. Bu matris raslantı değişkeninin değişinti ve kovaryans'larından oluşur. Genelde iki raslantı değişkeni arasındaki kovaryans [ ] E {[X (t i ) − X (t i )] X (t j ) − X (t j ) } = σ iσ j ρ ij (5-41) 165 olarak tanımlanır. Burada X (t i ) = X (t i ) ’nin beklendik değeri X (t j ) = X (t j ) ’nin beklendik değeri σ i2 = X (t i ) ’nin değişintisi σ 2j = X (t j ) ’nin değişintisi σ ij = X (t i ) ve X (t j )’nin normalleştirilmiş kovaryans katsayısı; Bu değer i=j için 1’e eşittir. Kovaryans matris [ ( Λ X = E ( X − X ) X T − X −T )] (5-42) olarak tanımlanır. Burada X , X’in beklendik değeridir. Kovaryans tanımlarının kullanılması sonucu, σ 12 σ σ ρ Λ x = 2 1 21 ... σ N σ 1 ρ N 1 σ 1σ 2 ρ12 σ 22 ... ... ... ... ... ... σ 1σ N ρ1N ... ... σ N2 . (5-43) ρ ii = 1 i=1,2,... ,N olduğundan , 5-43 elde edilecektir. Bunun açındırılması ile Λ x ’nin ise Rx’ in ilişkisi kolayca gösterilebilir, Λ x = Rx − X .X T (5-44) Eğer rasgele işleme sıfır beklendik değerli ise Λ x = Rx olacaktır. Kovaryans matrisi çin verilen yukarıdaki gösteriliş hem durağan hem de olmayan rasgele işleme için geçerlidir. Bununla beraber 166 geniş anlamda durağan işleme durumunda, bütün değişintilerin ve verilen bir köşegen (diyagonal) için ilişki katsayılarının aynı olduğu bilinmektedir. O halde σ i2 = σ 2j = σ 2 ρ ij = ρ i − j i,,j = 1,2,….,N i,,j = 1,2,….,N ve 1 ρ 1 Λ x = σ 2 ... ... ρ N −1 ρ1 1 . ... ... ρ2 ρ1 . . ... ... ... . 1 ...ρ1 ρ N −1 ρ N −2 ... ρ1 1 (5-45) elde edilir. Kovaryans matrisleri konusunu bitirmeden önce, bu matrisin Gauss işlemesinden N raslantı değişkeni için bileşik olasılık yoğunluk fonksiyonu ile ilişkili olarak oynadığı rolün önemini vurgulamak gerekir. Daha önce değinildiği gibi Gauss işlemesi herhangi sayıda raslantı değişkeni için bileşik olasılık yoğunluk fonksiyonu yazmaya olanak veren birkaç işlemeden biridir. Bu bileşik olasılık yoğunluk fonksiyonunun türetilmesi konumuzun dışındadır, ne var ki bunun p( x ) = p[x(t1 ), x(t 2 ),..., x(t N )] = 1 (2π )N . exp − 1 x T − x T Λ −1 (x − x ) x 2 ΛX ( ) olduğu gösterilebilir. Burada, Λ x , Λ x ’in determinantı ve Λ x −1 ise inversidir. (5-46) 167 PROBLEMLER 5-1 Şekilde görülen biçimde örnek fonksiyonlara sahip durağan bir rasgele işleme göz önüne alınıyor. t 0 ± n.t a peryodik anlarda, b genişlikli ve ±A genliklerini eşit olasılıklarla alan bir dikdörtgen darbe bulunmaktadır. t0 anı,darbe genliğinden bağımsız, ta peryodu boyunca uniform dağılımlı bir raslantı değişkenidir. a- Rx( τ ) özilişki fonksiyonunu bulunuz. b- ℜ(τ ) , zaman özilişki fonksiyonunu bulunuz. c- Bu işlem ergodik olabilir mi? d- İşlemenin karesel beklendik değeri nedir? 5-2 Durağan bir rasgele işlemenin örnek fonksiyonu, V(t), şekilde peryodik dikdörtgen dalga şekilleridir. Her örnek fonksiyonun genliği X, ±100 arasında düzgün dağılımlı bir raslantı değişkenidir. Her örnek fonksiyonun t0 başlangıç gecikme zamanı X’ten bağımsız bir raslantı değişkeni olup dalga şeklinin T peryodu boyunca uniform dağılım gösterir. ( f(t) birim genlikli T peryodlu dikdörtgen dalga şekli olmak üzere, V(t)=X.f(t-t0) yazılabileceğini düşünmek hesaplarda kolaylık sağlayacaktır.) a- RV( τ ) özilişki fonksiyonunu hesaplayınız ve çiziniz. b- ℜ(τ ) zaman özilişki fonksiyonunu hesaplayınız. 5-3 Problem 5-2’de tanımlanan rasgele işlemenin V(t) örnek fonksiyonları 1 ohm’luk direncin uçlarında ölçülen gerilimlerdir. Dirençte harcanan gücün özilişki fonksiyonunu bulunuz. 168 5-4 Durağan bir rasgele işlemenin özilişki fonksiyonu R x (τ ) = 4.ε −τ cos πτ + cos 3πτ şeklindedir. a- İşleme için X 2 ve σ 2 büyüklüklerini hesaplayınız. b- Hangi ayrık frekans bileşenlerine sahiptir? c- Bu ilişki fonksiyonu, zamanca | τ |= 0,25s ayrılmaları halinde raslantı değişkenleri hakkında ne bilgi vermektedir? d- X(t) ve X(t- τ ) raslantı değişkenlerinin ilişkisiz olduğu en kısa zaman aralığı nedir? e-Tüm sinüsoidal bileşenleri işaret, diğer tüm bileşenleri de gürültü olarak düşünürsek, işaret -gürültü oranı ne olur? 5-5 Sıfır beklendik değerli durağan rasgele işlemenin örnek fonksiyonları olan X(t) ve Y(t) gibi iki işaret ele alınsın. X(t)’den r katsayısı kadar kaydırılmış Y(t+ τ ) işaretini çıkararak yeni bir fonksiyon oluşturulsun. Z(t) = X(t) - r.Y(t+ τ ) a- σ Z2 ‘yi minimum yapan r değerini bulunuz. b- a şıkkında belirlenen r hangi değer aralığında değişebilir? 5-6 Şekildeki fonksiyonlardan hangileri bir özilişki fonksiyonu olamaz? Neden? 169 5-7 Bir rasgele işlemenin örnek fonksiyonları X (t ) = Y . cos(ω .t + θ ) şeklinde olup burada Y, ω ve θ istatistik bağımsız raslantı değişkenleridir. Y’nin beklendik değeri 2 ve değişintisi 4’tür. θ , - π ile π aralığında uniform dağılımlıdır, ω da -5 ile 5 aralığında uniform dağılımlıdır. a- İşleme durağan mıdır? b- Rx( τ ) özilişki fonksiyonunu bulunuz. 5-8 İstatistik bağımsız iki rasgele işleme X(t) ve Y(t)’ye ilişkin özilişki fonksiyonları, −2 τ R x (τ ) = 2.e cos ωτ −3 τ 2 RY (τ ) = 9 + e olarak verilmiştir. Üçüncü bir rasgele işleme Z(t)’nin örnek fonksiyonları, Z(t) = W.X(t).Y(t) olup burada W, beklendik değeri 2 ve değişintisi 9 olan bir raslantı değişkenidir. a- Rz( τ )’yu bulunuz. b- Z(t)’nin beklendik değer ve değişintisini belirleyiniz. 5-9 İki rasgele işlemeye ait örnek fonksiyonlar, X (t ) = A. cos(ω 0 .t + θ ) ve Y (t ) = B. sin (ω 0 .t + θ ) olup burada θ , 0 ile 2 π aralığında uniform dağılımlı bir raslantı değişkenidir ve A ile B sabittir. a- R XY (τ ) ve RYX (τ ) çapraz ilişki fonksiyonlarını bulunuz. b-Bu ilişki fonksiyonlarının τ = 0 ’daki değerleri ne anlam taşır? 5-10 Problem 5-1’de tanımlanan rasgele işlemeye ait örnek fonksiyonları şekilde görülen yarım dalga doğrultucusuna uygulanmaktadır. 170 a- Çıkışın özilişki fonksiyonu RY (τ ) ’yu bulunuz. b- Çapraz ilişki fonksiyonu R XY (τ ) ’yu bulunuz. c- Çapraz ilişki fonksiyonu RYX (τ ) ’yu bulunuz. 5-11 Bir Z(t) raslantı vektörü, iki ortak, durağan bağımsız, skaler rasgele işlemenin örnek fonksiyonları X(t) ve Y(t)’nin kombinasyonundan oluşmaktadır. Özel olarak, X (t ) + Y (t ) Z (t ) = X (t ) − Y (t ) olsun. R X (τ ) = ε −τ RY (τ ) = ε + ε olduğuna göre RZ( τ ) lişki matrisini bulunuz. −τ −2 τ 5-12 Özilişki fonksiyou, R X (τ ) = ε cos πτ + 1 olan durağan bir rasgele işleme, ∆t =0,5 s’lik peryodik zaman aralıklarında örneklenmektedir. −τ a- Bu işlemeden alınan üç örnek kümesi için tüm kovaryans matrisini yazınız. b- N örnek için genel kovaryans matrisini yazınız. KAYNAKLAR Bölüm 1’deki kaynaklara bakınız. Özellikle Beckmann, Davenport ve Root, Papoulis ve Thomas. 171 BÖLÜM 6 SPEKTRAL YOĞUNLUK 6-1 GİRİŞ Lineer sistemlerin analizinde Fourier ve Laplace dönüşümlerinin kullanılması sıklıkla ve yaygınlıkla başvurulan ve çalışmalarda büyük ölçüde kolaylık sağlayan bir yoldur. Bu kolaylığın ana nedeni, zaman domenindeki katlama (convolution) integralinin, frekans domeninde yerini yalnızca bir çarpıma bırakmasından kaynaklanmaktadır. Frekans domeni yöntemlerinin yaygınlıkla kullanıldığı dikkate alındığında, bu yöntemlerin sistem girişlerinin rasgele yapıda da olması halinde kullanılabilir olup olmadığının sorulması doğaldır. Bu sorunun yanıtı, onların biraz daha dikkat gerektiren yeni düzenlemeler yapılması koşuluyla gene kullanışlı olabileceğidir. Ancak, usulüne uygun kullanıldığında, frekans domeni yöntemleri temelde rasgele işaretler için de, rasgele olmayan işaretler için olduğu kadar yararlar sağlayacaktır. Bu konuya başlamadan önce, rasgele olmayan bir zaman işaretinin frekans domeni ifadesini özetlemek yararlı olacaktır. Bunun en doğal ifade biçimi, bizi frekans spektrumu kavramına götüren Fourier dönüşümüdür. Herhangi rasgele olmayan bir zaman fonksiyonu, f (t)’nin Fourier dönüşümü, F (ω ) = ∞ ∫ f (t )e − jωt dt (6-1) −∞ olarak tanımlanır. Örneğin f(t) bir gerilimi belirtiyorsa, F(w)’nın birimi volt/Hz olacaktır. Bunun anlamı, f(t) işaretini sinüsoidal işaretlerin toplamı şeklinde göstermek, buna karşı düşen frekans ekseni boyunca bu bileşenlerin bağıl büyüklük ve faz değerlerinin elde edilmesidir. Anlaşılacağı gibi f(t) işaretinin Fourier dönüşümünün büyüklüğü, frekansın fonksiyonu olarak genlik yoğunluğu gibi fiziksel bir anlam taşır. Frekansa göre f(t)’nin enerji dağılımının açık bir göstergesidir. Tamamen aynı yolla bunu rasgele bir işarete uygulamak, uygun görülebilir. Bu şekilde Fourier dönüşümü herhangi bir x(t) örnek fonksiyona uygulandığında, FX (ω ) = ∞ ∫ x(t )e −∞ − jωt dt 172 yazılacaktır. Bu bir rasgele işlemenin frekans domeni ifadesi olarak karşımıza çıkar. Ne var ki en az iki nedenle bu olanaksızdır. Öncelikle herhangi sabit bir ω için ensemblenin olası örnek fonksiyonlarının her birinin farklı değere sahip olması nedeniyle ensemble boyunca Fourier dönüşümü bir raslantı değişkeni olacaktır. Bunun nedeni, (belirli bir frekans değeri için) işlemenin ifadesi yerine yalnızca işlemenin bir üyesinin ifadesinin elde edilmesidir. Ancak, ikinci neden olmamış olsaydı, bu fonksiyonu ensemble boyunca beklendik değeri bulmak amacı ile kullanmak mümkün olabilecekti, ikinci ve daha önemli neden yukarıda yazılı FX( ω )’nın en azından durağan işleme için mevcut olmadığı ve kullanılmasının mümkün olamayacağıdır. Kullanılabilmesi için, ∞ ∫ x(t ) dt < ∞ (6-2) −∞ olması temel koşuldur. Bu koşul, sıfırdan farklı herhangi geniş anlamda durağan rasgele işlemeye ait örnek fonksiyon için kesinlikle sağlanamaz. Alışılmış anlamda Fourier dönüşümü, impuls ve benzeri terimler içeren genel fonksiyonlar için, nadiren mümkün olması dışında, mevcut değildir. Alışılmış Fourier dönüşümünün, rasgele işlemeye ait frekans domeni gösterilişini elde etmede sorunlarla karşılaşıldığı görüldü. O halde akla, birleşme faktörü taşıdığından, Laplace dönüşümü gelecektir. Tek yanlı Laplace dönüşümü f(t)’nin yalnızca t ≥ 0 değerleri için tanımlanması nedeniyle, geniş anlamda durağan rasgele işleme için düşünülemez. Ama iki yanlı Laplace dönüşümü konuya çözüm getirebilecektir. Laplace dönüşümü pozitif değerler için olduğu kadar negatif değerler için de uygundur. Bu durumda Laplace dönüşümü rasgele işlemenin hemen hemen bütün durağan örnek fonksiyonları için vardır. Bu yaklaşımın, dönüşüm için mükemmel olduğu düşünüldüğünde, bu kez karşımıza dönüşüm-ters dönüşüm sorunu çıkmaktadır. Bu sorunla ilgili incelemeler için Kompleks Değişkenler Teorisi'ne gerek vardır. Bu konu ise çalışma alanımızın ötesinde olduğundan daha fazla ayrıntıya girilmeyecektir. Sonuç olarak, en basit ve kabul edilebilir yaklaşım, yeniden Fourier dönüşümüne dönmek ve yeni durum için ustaca çözümler getirmeyi araştırmaktır. 6-2 SPEKTRAL YOĞUNLUK VE FOURİER DÖNÜŞÜMÜ ARASINDAKİ BAĞLANTI Fourier dönüşümü tekniğinin kullanılmasında, her bir örnek fonksiyonun dönüşümünün mevcut olmasını sağlamak üzere durağan 173 nin örnek fonksiyonunun düzenlenmesi zorunludur. Bunu sağlamada çeşitli yollar vardır. Bunlardan en kolayı sonlu aralıkta yeni bir örnek fonksiyon tanımlamaktır.O halde, XT(t) = X(t) t ≤T <∞ =0 t >T yazılabilir ve bu işaret kırpılmış (truncated) işaret adını alır. T sonlu kaldıkça (6-2) eşitliğindeki koşulu sağlar ve alındığı durağan işlemenin sonlu karesel beklendik değere eşit olmasına neden olur. Böylece, XT(t)’nin Fourier dönüşümü alınabilir. Gerçekten de XT(t), karesinin integrali alınabilme özelliğine sahiptir. Bu, . ∞ ∫ X (t ) T 2 (6-4) dt < ∞ −∞ şeklinde ifade edilir.Bu özellik aşağıdaki açıklamalarda kullanılacaktır. XT(t), Fourier dönüşümü alınabilir bir ifade olduğundan bu dönüşüm, ∞ FX (ω ) = ω ∫ X (t )e dt T <∞ − t T (6-5) −∞ şeklinde yazılabilir. Herhangi bir örnek fonksiyona ait Fx( ω )’nın beklendik 2 değerinin limit altında olmaması hali için bile FX (ω ) ‘nin beklendik değerinin limit içinde kaldığını göstermek üzere aşağıdaki incelemelerde T’nin sonsuza götürülmesi gereklidir. Bunu göstermede ilk adım, XT(t) ile FX( ω )’ya Parseval Teoremi'ni uygulamaktır. xT(t) =0 , | t |>T olduğundan, T ∫ X T (t )dt = 2 −T 1 2π ∞ ∫ F (ω ) X 2 dω (6-6) −∞ yazılabilir. XT(t)’nin gerçel zamanlı bir fonksiyon olma durumunda, 2 FX (ω ) = FX (ω )FX (− ω ) olduğunu kaydedelim. Burada FX(- ω ), FX( ω )’nın kompleks eşleniğidir. (*) Parseval Teoremi, f(t) ve g(t) gibi döşümü alınabilir zaman fonksiyonları F( ω ) ve sırasıyla bunların Fourier dönüşümleri olduğunda ∞ ∞ −∞ −∞ ∫ f (t ) g (t )dt = (1 / 2π ) ∫ F (ω )G(−ω )dω olduğunu açıklar. G( ω ) 174 Aranan büyüklük, frekansın fonksiyonu olarak ortalama güç dağılımı olduğundan, ikinci adım, toplam zaman 2T boyunca, (6-6) eşitliğinin her iki yanının ortalamasının alınmasıdır. Her iki taraf 2T ile bölünerek, 1 2T T 2 ∫ X T (t )dt = −T 1 4π .T ∞ ∫ F (ω ) X 2 (6-7) dω −∞ elde edilir. (6-7) eşitliğinin sol yanının, -T ile T aralığında örnek fonksiyonun ortalama gücü ile orantılı olduğu görülecektir. Daha doğru tanımla, XT(t)'nin effektif değerinin karesidir. Hatta, ergodik işleme için bu büyüklük T için işlemenin karesel beklendik değerine yaklaşır. Ancak, bu aşamada T’nin sonsuza gitmesi, FX( ω )’nın limit içinde kalmaması nedeniyle olanaksızdır. Ensemblenin herhangi bir örnek fonksiyonu X(t)’ye karşı düşen FX( ω )’nın ensembleye bağlı bir raslantı değişkeni olacağı hatırlanmalıdır. (6-4) eşitliğinden görüldüğü gibi integralin daima pozitif büyüklüklü olarak mevcut olması nedeniyle, 2 (1/T) FX (ω ) ’nin beklendik değerinin limitinin mevcut olduğunu varsaymak, (hatta kanıtlamak) akılcı bir yaklaşımdır. O halde, (6-7) eşitliğindeki ifadenin her iki yanının beklendik değeri, integrasyon ve beklendik değer alma operasyonları yer değiştirilerek ve T → ∞ için limit arandığında, T ∞ 2 E (1 / 2T ) ∫ X T2 (t )dt = E (1 / 4π .T ) ∫ FX (ω ) dω −T −∞ ∞ T { 2 lim (1 / 2T ) ∫ X T2 (t )dt = lim (1 / 4π .T ) ∫ E FX (ω ) dω T →∞ T →∞ −T ∞ } (6-8) −∞ [{ 2 } ] < X 2 >= (1 / 2π ) ∫ lim E FX (ω ) / 2T .dω T →∞ −∞ elde edilir. Durağan işleme için karesel beklendik değerin zaman ortalaması, karesel beklendik değere eşittir ve (6-8) eşitliği, ∞ [{ 2 } ] X 2 = (1 / 2π ) ∫ lim E FX (ω ) / 2T .dω T →∞ −∞ (6-9) olarak yazılabilir. (6-9) eşitliğinin sağ yanındaki integral içindeki terim SX( ω ) ile gösterilir ve rasgele işlemenin Spektral Yoğunluğu adını alır. 175 [ 2 ] S X (ω ) = lim E FX (ω ) / 2T T →∞ (6-10) Burada beklendik değer alınmadan T → ∞ için limit alınmasına izin verilmesinin mümkün olmadığı anımsanmalıdır. Eğer X(t) bir gerilimi belirtiyorsa, SX( ω )’nın birimi (volt)2/Hz olur ve bunun integrali (6-9) eşitliğinden görüleceği gibi karesel beklendik değere eşittir. ∞ X 2 = (1 / 2π ) ∫ S X (ω )dω (6-11) −∞ Spektral yoğunluğun, fiziksel bazda, ortalama güç kavramından hareketle özel bir hal olarak açıklanması mümkündür. X(t), 1 ohm’luk dirençle birlikte ele alınan bir gerilim veya akım olduğunda X 2 dirençte harcanan ortalama güce eşittir. Spektral yoğunluk, ω / 2π Hz’de merkezlenmiş, 1 Hz band genişliğindeki ortalama güç olarak belirtilebilir (band genişliği birimi Hz olup r/s değildir. Bunun nedeni (6-11) eşitliğindeki 1/2 π çarpanıdır). Spektral yoğunluk analizi ile ilgili şimdiye kadar olan açıklamalar, konuya başlangıç için verilmesi gereken temel bilgilerden bir anlamda daha kapsamlı olarak sunulmuştur. Bu yolun izlenmesinin nedeni, açıklamaların daha yüzeysel olması durumunda, yapılabilecek matematik hatalardan sakınmaya yöneliktir. Kuşkusuz spektral yoğunluğun başlangıç çalışmalarında, bu yöntem okuyucu için daha güç olacaktır, ancak bu ek güçlüğün emekleri boşa çıkarmadığı hissedilir ve hatta incelemenin karmaşıklığı nedeniyle tam olarak anlaşılmaması halinde bile okuyucuyu, frekans domeninde daha az güçlükle karşılaşması konusunda bilgili kılmaya yardımcı olur. Spektral yoğunluğa bir başka yaklaşım, 6-6 paragrafında verilen özilişki fonksiyonuna dayalı bir tanımla ilgilidir. Uygulamaya yönelik bakış açısından bu tanım muhtemelen burada verilen genel yaklaşımdan daha kolay anlaşılır ve daha kullanışlı bir özellik gösterir. Ancak temel tanıtımın ortaya koyduğu fiziksel anlatımı göstermez. Spektral yoğunluğun özelliklerinin daha ayrıntılı incelenmesine geçmeden, sistem analizinde rasgele işleme girişin spektral yoğunluğu, rasgele olmayan işaret girişinin dönüşümü ile aynı rolü oynamaktadır. En önemli farklılık, spektral yoğunluğun, gerilim 176 yoğunluğu yerine güç yoğunluğunu ifade etmesidir. Bu şekilde, sistem için bir gerilim transfer fonksiyonu yerine bir güç transfer fonksiyonu tanımlamak gerekecektir. ALIŞTIRMA 6-2 Yukarıda tanımlanan spektral yoğunluk, ( ω )’nın hem pozitif ve hem de negatif değerleri için mevcut olduğundan, bazen "İki Yanlı Spektral Yoğunluk" olarak adlandırılmaktadır. Ancak bazı yazarlar f= ω / 2π ’nin fonksiyonu olarak tanımlanan ve yalnızca f’in pozitif değerleri için var olan "Tek Yanlı Spektral Yoğunluk" olarak bilinen tanımı tercih ederler. Eğer tek yanlı spektral yoğunluk GX(f) olarak verilmişse, rasgele işlemenin karesel beklendik değeri, ∞ X 2 = ∫ G X ( f )df 0 olmaktadır. ω = 2πf ’in herhangi bir değeri için GX(f) ve SX(f) arasındaki bağıntı nedir? 6-3 SPEKTRAL YOĞUNLUĞUN ÖZELLİKLERİ Spektral yoğunluğun en önemli özelliği tek bir cümle ile ω 'nın gerçel, pozitif ve çift bir fonksiyonu olduğu şeklinde özetlenebilir. Fourier dönüşümü ile ilgili çalışmalarımızda, işaretlerin büyüklüklerinin gerçekten daima gerçel ve pozitif olduğu anımsanacaktır. Bu nedenle işlemenin beklendik değeri de aynı özellikleri taşıyacaktır. Diğerlerinden daha sık karşılaşılan Spektral yoğunluğun özel biçimi, "rasyonel" olarak adlandırılan ve polinomların oranı olarak verilen türdür. Spektral yoğunluk ω ’nın çift fonksiyonu olduğundan, polinomlar ω ’nın yalnızca çift kuvvetlerini içerir, yani, S X (ω ) = ( S 0 ω 2 n + a 2 n − 2ω 2 n − 2 + ... + a 2ω 2 + a 0 ω 2 m + b2 m −2ω 2 m −2 + ... + b2ω 2 + b0 ) (6-12) olarak yazılabilir. İşlemenin karesel ortalama değeri sonlu olduğunda, SX( ω )’nın altında kalan alan, (6-11) eşitliğinden, sonlu olmak zorundadır. Bu durumda m>n olmalıdır. Çok özel bir durum olan beyaz gürültü dışında, bu koşulun daima kabul edildiği varsayılacaktır. 177 Beyaz gürültü, bütün ω değerleri için sabit spektral yoğunluğa sahip rasgele işlemeye verilen addır, bu SX( ω )=S0 ile ifade edilir. Ne var ki bu tür bir işleme (karesel beklendik değeri sonsuz olduğundan) fiziksel olarak mevcut değildir. Ancak, matematik açıdan bakıldığında, aksine davranıldığında çok zor olan hesaplamaları son derece kolaylaştırması nedeniyle, sıklıkla başvurulan elverişli bir yoldur. Bu kavramın kullanılması ile ilgili nedenler ve açıklamalar ileride daha ayrıntılı olarak ele alınacaktır. Bu tip spektral yoğunluklar süreklidir, dolayısıyla dc veya peryodik bileşen içeren rasgele işlemelere ait olamaz. Spektral yoğunluğun birim band genişliği başına ortalama gücü temsil ettiği düşünülürse, bu durum kolayca anlaşılacaktır. Rasgele işlemede herhangi bir dc bileşen ayrık bir frekans spektrumuna sahip olduğundan, sıfır band genişliğinde sonlu bir ortalama gücü belirtir. Sıfır band genişliginde sonlu güç, sonsuz güç yoğunluğuna karşı düşer. O halde bu durum için spektral yoğunluk sıfır frekansında sonsuz bunun dışında sonlu olur, yani ω =0'da δ fonksiyonu içerir. Benzeri bir durum da peryodik bileşenler için o frekanslarda δ fonksiyonlarının oluşmasıdır. Bu sonuçların dikkate alınması, spektral yoğunluğun hesabında sonucu daha sağlıklı elde etmede ve aynı zamanda (6-10) eşitliğinin kullanılmasını açıklamada yardımcı olacaktır. Arzu edilen yapıyı ortaya koymak üzere örnek fonksiyonu X(t) = A + B cos ( ω 1t + θ ) (6-13) olarak verilen bir rasgele işleme ele alınsın. Burada, A, B ve ω 1 sabitleri ve θ ise 0 ile 2 π arasında üniform dağılımlı bir raslantı değişkenini göstermektedir. p (θ ) = 1 / 2π 0 ≤ θ ≤ 2π Kırpılmış örnek fonksiyonun Fourier dönüşümü, T FX (ω ) = ∫ [A + B. cos(ω t + θ )]e 1 − jωt dt −T [ = A e − jωt / − jω + B.e ] T −T − j [(ω 1+ω ).t +θ ] + B.e j [(ω1−ω )t +θ ] / 2[ j (ω 1 − ω )] −T T / 2[− j (ω 1 + ω )] −T T olur. Sınır değerleri yerine yazılıp sadeleştirme yapıldığında, 178 [( )] FX (ω ) = (2 A. sin ωT / ω ) + B e jθ sin (ω − ω1 )T / (ω + ω 1 ) (6-14) elde edilir. FX( ω ) büyüklüğünün karesi dokuz terimden oluşacaktır. Bunlardan bazıları θ değişkeninden bağımsız ve diğerleri ise exp(±jö) veya exp(±j2 θ ) içermektedir. θ içeren bütün terimlerin beklendik değerlerinin hesaplanması sonucu kalkacağı tahmin edilebilir. Bunu göstermek üzere ifade sembolik biçimde yazılırsa, [ FX (ω ) = 4 A 2 sin 2 ω .T / ω 2 + B 2 sin 2 (ω − ω 1 )T / (ω − ω 1 ) 2 + sin 2 (ω + ω1 )T / (ω + ω 1 ) 2 ] 2 + C (ω )e 2 jθ + C (− ω )e − jθ + D(ω )e j 2θ + D(− ω )e − j 2θ (6-15) elde edilir. Şimdi, θ içeren herhangi bir terimin beklendik değeri ele alınsın. Bunların tümü G( ω ) exp(jn θ ) şeklindedir ve beklendik değeri, [ 2π ] 2π E G (ω )e jnθ = G (ω ) ∫ (1 / 2π )e jnθ dθ = (G (ω ) / 2π )e jnθ / jn 0 0 =0 n = ± 1,±2,... (6-16) olacaktır. Böylece (6-15) eşitliğindeki dört terim sıfıra eşit olacak ve eşitliğin beklendik değeri, [ E FX (ω ) 2 ] = 4 A [sin ω.T / ω ]+ B [ (sin (ω − ω )T /(ω − ω ) ) 2 2 2 2 2 2 1 ( ) + sin 2 (ω + ω 1 )T / (ω + ω 1 ) ] 2 1 (6-17) olarak bulunacaktır. (6-10) eşitliğinden spektral yoğunluk, S X (ω ) = lim { 2 A 2T [sin ω .T / ω .T ] + (B 2T / 2 )[sin (ω − ω 1 )T / (ω − ω 1 )T ] 2 2 T →∞ + (B 2T / 2 )[sin (ω + ω 1 )T / (ω + ω 1 )T ] 2 (6-18) olur. Limiti incelemek üzere, ilk terimin ana bölümü ele alındığında, 179 lim T [sin ω .T / ω .T ] 2 T →∞ genel biçim gözlenmektedir. Bu limit, ω sıfırdan farklı olmak üzere sin2 ω T’nin 1’den büyük olamayacağı ve payda T ile artacağından açıkça sıfıra eşittir. Ancak, ω = 0 için, sin ω .T =1 ω .T ω =0 olup limit sonsuz olacaktır. Bu nedenle lim T [sin ω .T / ω ] = K .δ (ω ) 2 T →∞ (6-19) yazılabilir. Burada k, δ fonksiyonunun altında kalan alanı belirtir. k değeri (6-19) eşitliğinin her iki yanında alanların eşitlenmesi ile bulunabilir. ∞ lim ∫ T .[sin ω .T / ω .T ] dω = 2 T →∞ −∞ ∞ ∫ K .δ (ω )dω (6-20) −∞ Eşitliğin sol yanındaki integral T>0 için bütün π değerlerine göre tablolanmıştır. Böylece limit işlemi önemini yitirir ve (6-20) eşitliği, π .K sonucuna varılmasını sağlar. Tamamen benzeri işlem (6-18) eşitliğindeki diğer terimler için kullanılabilir. Sonucun aşağıdaki ifade olduğunu göstermek okuyucuya bir alıştırma olarak bırakılmıştır. S X (ω ) = 2π . A 2δ (ω ) + (π / 2 )B 2δ (ω − ω 1 ) + (π / 2 )B 2δ (ω + ω 1 ) (6-21) Buna ait spektral yoğunluk Şekil 6-1’de görülmektedir. (6-21) eşitliğinin gerçekten aranılan karesel beklendik değeri bulmak için yol gösterdiğini ortaya koymak üzere bu spektral yoğunluğun alanını hesaplamak ilginçtir. (6-11) eşitliğinden, 180 ∞ X 2 = (1 / 2π ) ∫ {(2π . A 2δ (ω ) + (π / 2 )B 2δ (ω − ω 1 ) −∞ + (π / 2 )B 2δ (ω + ω 1 )}dω [ (6-22) = (1 / 2π ) 2π . A + (π / 2 )B + (π / 2 )B 2 2 2 ]= A 2 + (1 / 2 )B 2 yazılabilir. Okuyucu aynı sonucu, X2(t)’nin ensemble ortalamasını alarak kolayca bulabilir. ŞEKİL 6-1: dc ve Sinüsoidal Bileşenlerin Spektral yoğunluğu Spektral yoğunluğun hem sürekli ve hem de ayrık bileşenlere sahip olması da olasıdır. Bu tür bir örnek, haberleşme ya da örneklenmiş data kontrol sistemleriyle bağlantılı olarak sıklıkla karşılaşılan ve Şekil 6-2’de gösterilen rasgele darbe genlik dizisidir. Burada bütün darbelerin aynı biçime sahip olduğu ve büyüklüklerinin darbeden darbeye, istatistik ŞEKİL 6-2: Rasgele Genlikli Darbe Dizisi 181 bağımsız rsalantı değişkenleri olduğu varsayılacaktır. Ancak bütün bu 2 raslantı değişkenleri aynı bir beklendik değer, Y , ve aynı değişintiye, σ Y sahiptir. Darbelerin tekrarlanma peryodu t1, bir sabit ve referans zamanı herhangi bir örnek fonksiyon için t1 aralığı boyunca uniform dağılım gösteren t0 raslantı değişkenidir. Bu örnek için spektral yoğunluğun türetilmesi burada değerlendirilemeyecek kadar uzundur, ancak sonuç ifade bazı önemli noktaları ortaya koymaktadır. Bu sonuç, f(t), temel darbe biçiminin Fourier dönüşümü cinsinden ifade edilebilir ve, S x (ω ) = F (ω ) {(σ Y2 / t1 ) 2 ( + 2π (Y ) / t1 2 2 ) ∑ δ (ω − (2π .n / t ))} ∞ 1 (6-23) n = −∞ elde edilir. Eğer temel darbe biçimi t2 genişliğinde dikdörtgen ise buna karşı düşen spektral yoğunluk Şekil 6-3’de görüldüğü gibi olacaktır. (6-23) eşitliğinden çıkarılan genel sonuçlar aşağıdadır. ŞEKİL 6-3 : Rasgele Genlikli Dikdörtgen Darbe Dizisine Ait Spektral Yoğunluk 1- Hem sürekli spektral büyüklükler ve hem de δ fonksiyonlarının belirttiği alanlar temel darbe işaretinin Fourier dönüşümü büyüklüklerinin karesi ile orantılıdır. 2- Darbelerin peryodik olma durumunda bile darbe genliklerinin beklendik değeri sıfır ise, ayrık bir spektrum söz konusu olamaz. 3- Darbe genliklerinin değişintisi sıfır ise, sürekli bir spektrum oluşamaz. 182 Spektral yoğunluğun diğer özelliği, rasgele işlemenin türevi ile ilgilidir. X(t)= dX(t)/dt olduğu ve X(t)’nin aşağıdaki gibi tanımlanmış SX( ω ) spektral yoğunluğa sahip olduğu varsayılsın. [ 2 ] S X (ω ) = lim E FX (ω ) / 2T T →∞ Kırpılmış işaretin türevi X& T (t ) , jω .FX (ω ) Fourier dönüşümüne ve buna ek olarak (±T’deki süreksizlik nedeniyle) olası iki sabit terime sahiptir, ve bunlar limitte görülmeyecektir. Bu nedenle türevin spektral yoğunluğu, S X& (ω ) = lim E [ jω .FX (ω )(− jω )FX (− ω ) ]/ 2T T →∞ [ 2 ] = ω 2 lim E FX (ω ) / 2T = ω 2 S X (ω ) T →∞ (6-24) olur. Buradan, diferansiyel almak suretiyle ilk işlemeye ait spektral yoğunluğun yalnızca ω 2 katı spektral yoğunluğa sahip yeni bir işleme yaratılmış olduğu görülür. Bu bağıntıdan S X& (ω ) ‘nın ω =0 için sonlu olması durumunda SX( ω )’nın ω =0 için sıfıra eşit olacağı kaydedilmelidir. Daha ileri giderek, ω ’nın sonsuza gitmesi durumunda SX( ω ) , 1/ ω 2‘den daha hızlı bir düşüş göstermezse S X& (ω ) ω ’nın büyük değerleri için bir sabite yaklaşacak ve türevin karesel beklendik değeri sonsuz olacaktır. Bu, diferansiyeli alınamaz rasgele işleme haline karşı düşer. ALIŞTIRMA 6-3 Durağan rasgele işlemenin bir örnek fonksiyonu rasgele genlikli binary dalga şeklinin tekrarlanması biçimindedir. (Genlikler eş olasılıkla 0 veya 1 olmaktadır). Peryot 1 ms’dir. f= 0, 500, 1000 Hz için spektral yoğunluğu hesaplayınız. 6-4 SPEKTRAL YOĞUNLUK VE KOMPLEKS FREKANS DOMENİ Spektral yoğunluk, şimdiye kadar olan incelemelerimizde, ω gerçel açısal frekansın bir fonksiyonu olarak tanımlanmıştı. Ancak, 183 uygulamalarında, sistemin transfer fonksiyonunun çok kullanışlı biçim olmasından, kompleks frekans (s) cinsinden ifade edilmesi oldukça elverişlidir. Bu değişiklik yalnızca j ω ’nın s ile değiştirilmesi suretiyle sağlanabilir. Bu nedenle, kompleks frekans domeninde j ω ekseni boyunca spektral yoğunluk daha önce incelenenle aynı olacaktır. Kompleks frekans gösterilişi, alışılmış dönüşümde ω yerine -js veya ω 2 yerine –s2 yazılmak suretiyle gerçeklenir. Sonuç spektral yoğunluk genelde Sx(-js) olarak gösterilmelidir, ancak bu notasyon bir anlamda yeterli görülmemektedir. Bu sebeple, s planında spektral yoğunluk yalnızca SX(s) olarak gösterilecektir. SX(s) ve SX( ω )’nın bağıl büyüklükleri nedeni ile farklı fonksiyonlar olacakları açıktır, bu yüzden notasyon daha çok semboliktir. Yalnızca ω ’nın çift kuvvetlerini içeren rasyonel spektral yoğunluk özel hali için, bu ω 2 yerine –s2 yazmakla sağlanır. Örneğin, ( S X (ω ) = 10(ω 2 + 5) / ω 4 + 10ω 2 + 24 ) rasyonel spektral yoğunluğu ele alınsın. Bu ifade s‘in bir fonksiyonu olarak yazılmak istendiğinde, ( )( S X (s ) = S X (− jω ) = 10 − s 2 + 5 / s 4 − 10 s 2 + 24 ) (6-25) olur. Herhangi bir spektral yoğunluk, orantı katsayısı hariç, kompleks frekans domeninde kutup-sıfır gösterilimi ile de belirtilebilir. Bu tür gösteriliş, bir sonraki paragrafta değinileceği üzere, genellikle belirli hesaplamaları sonuçlandırmada elverişlidir. (6-25) eşitliğindeki spektral yoğunluk açıklama amacıyla ele alınırsa, eşitlik aşağıdaki şekilde çarpanlara ayrılabilir ve kutup-sıfır gösterilişi Şekil 6-4’te görüldüğü gibi olur. Bu şekil aynı zamanda, bu ifade biçiminin daima j ω eksenine göre simetrik olması gibi önemli bir noktayı belirtir. Spektral yoğunluk rasyonel olmadığında, ω ’ların –js’ler ( )( ) ( )( S X (s ) = −10 s + 5 s − 5 / (s + 2 )(s − 2 ) s + 6 s − 6 184 ) ile değiştirilmesi esesı değişmemesine rağmen sonuç kolaylıkla elde edilemez. Örneğin, spektral yoğunluk (6-23) eşitliğinde verildiği gibi ŞEKİL 6-4: Bir Spektral Yoğunluk için Kutup-Sıfır Gösterilişi olduğunda, kompleks frekans domeninde, 2 2 S X (s ) = F ( s ) F (− s ) σ Y / t1 + 2π (Y ) / t12 ( ) ( ) ∑ δ (s − ( j 2πn / t )) ∞ 1 n = −∞ (6-26) olarak ifade edilebilir. Burada F(s), f(t) ana dalga şeklinin Laplace dönüşümüdür. Buna ek olarak spektral yoğunluğu, sistem analizinde daha kullanışlı kılan, kompleks frekans (s)’in karesel beklendik değerinin hesaplanmasında oldukça yararlar sağlamasıdır. Buna ilişkin uygulamalar bir sonraki paragrafta incelenecektir. ALIŞTIRMA 6-4 Bir spektral yoğunluk, ( ) S X (ω ) = 1 / ω 4 + 4 şeklinde verilmiştir. Bu spektral yoğunluk için kompleks frekans domeni kutup noktalarını belirleyiniz. Cevap: ±1±j1 6-5 SPEKTRAL YOĞUNLUKTAN KARESEL BEKLENDİK DEĞERİ BULMAK Konularımızın içinde spektral yoğunluğu incelerken, rasgele iişlemenin karesel beklendik değerinin aşağıdaki şekilde tanımlandığı gösterilmişti. 185 ∞ X 2 = (1 / 2π ) ∫ S X (ω )dω (6-11) −∞ Bu nedenle, karesel beklendik değer spektral yoğunluğun alanı ile orantılıdır. Spektral yoğunluğun karmaşık bir biçimde olması ya da ω ’nın yüksek mertebeden kuvvetlerini içermesi halinde, (6-11)’de görülen integralin hesaplanması çok güç olacaktır. Bu tür bir integralin çözümünde integrasyon değişkeninin kompleks değişkene (j ω yerine s koymak suretiyle) çevirmek ve kompleks domende kapalı çevrim boyunca integral öngören teoremleri uygulamaktır. Karesel beklendik değeri hesaplamada bu muhtemelen en kolay ve güvenli yoldur. Ancak, belki de okuyucunun sahip olmadığı kompleks değişkenler bilgisine gerek vardır. İlgilenenler için işlem sırası bu paragrafın sonunda verilecektir. Öncelikle incelenecek değişik bir yöntem, rasyonel spektral yoğunluklar için tablolanmış bazı sonuçlardan yararlanmaktır. Bunlar çeşitli dereceden polinomlar için tablolanmıştır ve kullanılışı yalnızca uygun sayıları yerlerine koymaktan ibarettir. Bu genel yapı, spektral yoğunluğun simetri özelliğinden kaynaklanır. Bunun sonucu olarak rasyonel spektral yoğunluk daima çarpanlarına ayrılabilir. S X (s ) = c( s )c(− s ) / d ( s )d (− s ) (6-27) Burada c(s); sol yarıbölge sıfırlarını, c(-s); sağ yarıbölge sıfırlarını, d(s); sol yarıbölge kutuplarını, d(-s) ; sağ yarıbölge kutuplarını içermektedir. (6-11) eşitliğinin gerçel integrasyonu, kompleks değişken (s) cinsinden ifade edildiğinde, karesel beklendik değer, j∞ j∞ X = (1 / 2π . j ) ∫ S X ( s )ds = (1 / 2π . j ) ∫ [c( s )c(− s ) / d ( s )d (− s )]ds 2 − j∞ − j∞ 186 (6-28) olur. Rasyonel spektral yoğunluk özel hali için, c(s) ve d(s), s’in polinomlarıdır ve c( s ) = c n −1 s n−1 + c n −2 s n − 2 + ... + c0 d ( s ) = d n s n + d n−1 s n −1 + ... + d 0 olarak yazılabilir. c(s) katsayılarından bazıları sıfıra eşit olabilir, fakat d(s); c(s)’den daha yüksek mertebeden olmalıdır aynı zamanda sıralamada eksik bir katsayı bulunmamalıdır. (6-28) eşitliğindeki yapıya sahip olan integraller, n’in 10'a kadar olan değerleri için tablolanmıştır. n’in 3 veya 4’ten büyük değerleri için genelde sonuçlar, kesinliğinden şüphe edilecek kadar karmaşıklık gösterirler. Özet bir tablo Tablo 6-1’de verilmiştir. j∞ I n = (1 / 2π . j ) ∫ c( s )c(− s ) / d ( s )d (− s )ds − j∞ c( s ) = c n −1 s n −1 + c n −2 s n − 2 + ... + c0 d ( s ) = d n s n + d n−1 s n −1 + ... + d 0 I 1 = c02 / 2d 0 d1 I 2 = (c12 d 0 + c02 d 2 ) / 2d 0 d1 d 2 I3 = ( ) c 22 d 0 d 1 + c12 − 2c0 c 2 d 0 d 2 + c02 d 2 d 3 2d 0 d 3 (d 1 d 2 − d 0 d 3 ) TABLO 6-1 Bir hesaplama örneği olmak üzere, ( )( S X (ω ) = ω 2 + 4 / ω 4 + 10ω 2 + 9 ) spektral yoğunluğu ele alınsın. ω ’lar –js’lerle değiştirildiğinde ifade ( )( ) ( )( )( S X ( s ) = − s 2 − 4 / s 4 + 10 s 2 + 9 = − s 2 − 4 / s 2 − 1 s 2 − 9 187 ) (6-29) olur. Çarpanlarına ayrılarak, S X ( s ) = ( s + 2)(− s + 2) /( s + 1)( s + 3)(− s + 1)(− s + 3) (6-30) elde edilir. Buradan, c(s) = s + 2 d(s) = (s+1)(s+3) = s2 + 4s + 3 olduğu görülecektir. Bu durumun n 2 için olduğu anlaşılacaktır. c1 = 1 c0 = 2 d2 = 1 d1 = 4 d0 = 3 bulunur. Tablo 6-1’den I2 olarak tanımlanan büyüklük hesaplanırsa, [ ] I 2 = c12 d 0 + c02 d 2 / 2d 0 d1 d 2 = (1) (3) + (2) 2 (1) / 2(3)(4)(1) = (3 + 4 )/24 = 7 /24 2 bulunur. X = I 2 olduğundan, 2 X 2 = 7 / 24 elde edilir. Bu işlem, teorinin iyi anlaşılmasını gerektirmeyen, yalnızca sonuca kolay varma yolunu gösteren elverişli bir aracı tanımlamaktadır. Ancak biraz dikkat gerektirdiği açıktır. Öncelikle, yukarıda değinildiği gibi, c(s)’in d(s)’ten daha küçük mertebeden olması gerekir. İkinci olarak c(s) ve d(s)’in yalnızca sol yarıbölgede köklere sahip olması gerekir. Son olarak da d(s)’in j ω ekseninde kökü olmaması gerekmektedir. (6-28) eşitliğinde verilen türde integralin hesaplanmasında genel ve daha sağlıklı yöntemin kompleks integrasyonun kullanılması ile sağlandığına daha önce değinilmişti. Buna ait teorinin kısa bir özeti EK F’te verilmiş ve kavramlar burada spektral yoğunluktan karesel beklendik değeri elde etmede bir başka yöntemi tanıtmak üzere açıklanmıştır. Öğrenciye bu genel yolun etkinliğinin tanıtılması, burada yalnızca bu yöntemin işleyiş biçimi inceleneceğinden, önemlidir. Öğrenci, bu teori ile ilgili bütün kavramları bilmediği takdirde matematik araçları kullanırken pek çok yanlışlık yapabileceğini ve bu nedenle yeterli teoriyi en kısa zamanda öğrenmesi gerektiği konusunda uyarılmalıdır. 188 Bir sonraki yöntem, artıkların (residue) hesaplanmasına dayalıdır. Ters Laplace dönüşümünün hesaplanması ile bağlantılı olarak çoğu kez yaptıklarımıza benzer bir yol izlenir. Örneğin (6-29) ve (6-30) eşitlikleri ile yukarıda verilen spektral yoğunluk ele alınsın. Bu spektral yoğunluk Şekil 6-5’te görülen kutup-sıfır düzenlemesi ile belirtilebilir. (6-28) eşitliği ile gösterilen integrasyon çevrimi j ω ekseni boyuncadır, ancak, EK F’de incelenen kompleks integrasyon yöntemi kapalı bir çevrim gerektirmektedir. Böyle bir kapalı çevrim hem sol ve hem de sağ yarıbölgeleri çevreleyebilen sonsuz yarıçaplı bir yarıdaire eklenerek elde edilebilir. Şekil 6-6’da görüldüğü gibi, sol yarıbölge kullanıldığında cebirsel işaretlerde daha az güçlüklerle karşılaşılır. Şekil 6-5: Bir Spektral Yoğunluk için Kutup-sıfır Gösterilişi Şekil 6-6: Karesel Beklendik Değeri Bulmada İntegralin Yolu 189 Bu kapalı çevrim boyunca integral almak j ω ekseni boyunca integralle aynıdır, R → ∞ için önemi olmayan bu yarıdairenin kullanılması gerekmektedir. Rasyonel spektral yoğunluk için payda polinomunun, pay polinomundan daha yüksek mertebeden olması durumunda, yalnızca çift kuvvetler mevcut olduğundan, doğru olacaktır. Kompleks değişkenler teorisinin temel bir sonucu, kompleks domende basit bir kapalı çevrim boyunca integral değerinin bu çevrimin içerdiği kutuplardaki artıkların toplamının 2 π j katına eşit olduğunu ortaya koyar (EK F'e bakınız). Tanım gereği karesel beklendik değer 1/(2 π j) çarpanına sahip olduğundan ve seçilen kapalı çevrim sol yarıbölgeyi kapsadığından karesel beklendik değer genel olarak aşağıdaki gibi belirtilebilir. X 2 = ∑ (sol yarı bölge kutup artıkları) (6-31) Örnek olarak yalnızca sol yarıbölgede -1 ve -3 de kutupları olan bir durum incelenecektir. Artıklar, SX(s)’in sorudaki kutuplara ait faktörlerle çarpılarak ve s’ler kutup değerleri olarak yerlerine konulmak suretiyle kolayca elde edilebilir. Böylece, K −1 = [( s + 1) S X ( s )]s = −1 = [− ( s + 2)( s − 2) /( s − 1)( s + 3)( s − 3)]s =−1 = 3 / 16 K −3 = [( s + 3) S X ( s )]s = −3 = [− ( s + 2)( s − 2) /( s + 1)( s − 1)( s − 3)]s =−3 = 5 / 48 yazılır. Buradan (6-31) eşitliği ile, X 2 = (3 / 16) + (5 / 48) = 7 / 24 elde edilir. Bu sonuç daha önce hesaplananla aynı değerdedir. Eğer kutuplar basit yapıda değil iseler, daha genel yol EK F'de artıkların hesaplanmasında kullanılabilmek üzere açıklanmıştır. Genelde karesel beklendik değer (6-31) eşitliği ile hesaplanır. ALIŞTIRMA 6-5 Çevrim integrasyonunu kullanarak spektral yoğunluk ifadesi aşağıda verilen rasgele işlemeye ait karesel beklendik değeri hesaplayınız ve 190 ( S X (ω ) = ω 2 / ω 4 + 3ω 2 + 2 ) Tablo 6-1 'i kullanarak sonucu kontrol ediniz. Cevap: (1/1,41)-(1/2) 6-6 SPEKTRAL BAĞLANTISI YOĞUNLUĞUN ÖZİLİŞKİ FONKSİYONU İLE Özilişki fonksiyonu 5.Bölümde, iki zaman fonksiyonunun çarpımının beklendik değeri olarak tanıtılmıştı. Bu bölümde, bunların Fourier dönüşümlerinin çarpımının beklendik değeri ile bağlantılı olduğu gösterilecektir. Söz konusu iki beklendik değer arasında doğrudan bir bağ olması gerektiği görülecektir. Hemen hemen daima, sezgi yoluyla, spektral yoğunluğun, özilişki fonksiyonunun Fourier (veya Laplace) dönüşümü olduğu düşünülür ve bu umulan sonuçtur. İlk olarak durağan olmayan rasgele işleme durumu ele alınacak ve sonra elde edilen sonuçlar özelleştirilerek durağan duruma geçilecektir. (6-10) eşitliğindeki spektral yoğunluk, [ 2 ] S X (ω ) = lim E Fx (ω ) / 2T T →∞ (6-10) olarak tanımlanmıştı, burada FX( ω ) kırpılmış Fourier dönüşümüdür. O halde, T FX (ω ) = ∫X T (t ).e − jω .t dt (6-32) −T yazılabilir. (6-32) eşitliği, (6-10) eşitliğinde yerine yazılarak ve 2 FX (ω ) = FX (ω ).FX (− ω ) olduğu bilindiğine göre, T T − jω .t 1 S X (ω ) = lim (1 / 2T )E ∫ X T (t1 )e dt1 ∫ X T (t 2 )e − jω .t 2 dt 2 T →∞ −T −T bulunur. t1 ve t2 indisleri, integraller çarpımının çift katlı integral olarak yazılması halinde değişkenlerin ayırt edilebilmesi için yazılmıştır. Böylece (6-33) eşitliği, 191 T T S X (ω ) = lim (1 / 2T )E ∫ dt 2 ∫ e − jω (t 2−t1) X T (t1 ) X T (t 2 )dt1 T →∞ −T −T T T −T −T = lim (1 / 2T ) ∫ dt 2 ∫ e − jω (t 2−t1) E[ X T (t1 ) X T (t 2 )]dt1 T →∞ (6-34) olarak yazılabilir. Beklendik değer alma işleminin, çift katlı integralin içine alınmasının bu durum için de geçerli olduğu gösterilebilir, ancak ayrıntıları burada incelenmeyecektir. Yukarıdaki eşitlikte, integral içindeki beklendik değerin kırpılmış işlemenin özilişki fonksiyonu olduğu anlaşılacaktır. O halde, E [X T (t1 ) X T (t 2 )] = R X (t1 , t 2 ) =0 ve t1 , t 2 ≤ T dışında (6-35) → ∞ dt 2 = dτ yerine konarak, (6-34) eşitliği, S x (ω ) = lim (1 / 2T ) T →∞ T − t1 T ∫ dτ ∫ e −T − t1 − jωτ R X (t1 , t1 + τ )dt1 −T olur. Sınır değerleri (6-35) eşitliğine göre düzenlenmiştir. İntegrasyon sırası değiştirilerek ve limit içeri alınarak τ ’ya göre integral, T − jωτ ( ) lim 1 / 2 T ∫−∞T →∞ ∫−T R X (t1 , t1 + τ )dt1 e dτ ∞ S X (ω ) = (6-36) şeklini alır. (6-36) eşitliğinden, spektral yoğunluğun, öziliski fonksiyonunun zaman ortalamasının Fourier dönüşümü olduğu açıkça görülmektedir. Bu, aşağıdaki gibi daha kısa ifade ile özetlenebilir. S X (ω ) = ℑ{< R X (t , t + τ ) >} 192 (6-37) (6-37) eşitliği ile verilen bağıntı aynı zamanda durağan olmayan işleme için de geçerlidir. İşleme, durağan rasgele bir işleme olduğunda, özilişki fonksiyonu zamandan bağımsız olur. O halde, < R X (t1 , t1 + τ ) >= R X (τ ) yazılabilir. Benzer şekilde geniş anlamda durağan rasgele işlemenin spektral yoğunluğu yalnızca, özilişki fonksiyonunun Fourier dönüşümüdür. Yani, ∞ S X (ω ) = ∫R X (τ )e − jωτ dτ −∞ = ℑ{R X (τ )} (6-38) dir. Wiener-Khinchine bağıntısı olarak bilinen, (6-38) eşitliği, zaman domeni (ilişki fonksiyonu) ve frekans domeni (spektral yoğunluk) arasında geçiş sağlaması nedeniyle, rasgele işaret analizinde son derece önemlidir. Fourier dönüşümünün mükemmelliği dolayısıyla, geniş anlamda durağan rasgele işlemenin özilişki fonksiyonu, spektral yoğunluğun ters Fourier dönüşümü olmaktadır. Durağan olmayan işleme durumu için özilişki fonksiyonu, spektral yoğunluktan elde edilemez, yalnızca (6-37) eşitliğinden görüleceği gibi, ilişki fonksiyonunun zaman ortalaması olarak bulunabilir. Bundan sonraki incelemelerde (6-38) eşitliğinin geçerli olduğu, yalnızca, geniş anlamda durağan işleme ile çalışılacaktır. Bu sonuçların kolay bir örneği olarak, R X (τ ) = A.e −β τ , A>0, β >0 (6-39) şeklinde bir özilişki fonksiyonu düşünülsün. τ ’daki mutlak değer işareti özilişki fonksiyonunun simetrik oluşundan kaynaklanmaktadır. Bu fonksiyon Şekil 6-7(a)’da gösterilmiştir ve τ =0 için türevde süreksizlik olduğu görülmektedir. Bu nedenle (6-39) eşitliğini iki integralin toplamı biçiminde yazmak gerekir, (biri τ ’nun negatif, diğeri pozitif değerleri için olmak üzere). 193 a) Özilişki Fonksiyonu ve b) Spektral Yoğunluk Arasındaki Bağlantı O halde, S X (ω ) = 0 ∞ βτ − jωτ βτ − jωτ ∫ A.e e dτ + ∫ A.e e dτ 0 −∞ = A.e ( β − jω )τ 0 ∞ / (β − jω ) −∞ + A.e ( β − jω )τ / − (β + jω ) 0 ( = A.[1 / (β − jω ) + 1 / (β + jω )] = 2 Aβ / ω 2 + β 2 (6-40) ) yazılır. Bu spektral yoğunluk Şekil 6-7(b) ‘de görülmektedir. Durağan durum için verilen bir spektral yoğunluktan ters Fourier dönüşümü kullanılarak, karşı düşen özilişki fonksiyonunu da bulmak mümkündür. ∞ R X (τ ) = (1 / 2π ) ∫ S X (ω )e jωτ dω (6-41) −∞ Bu sonuçla ilgili bir uygulama bir sonraki paragrafta verilecektir. (6-40) eşitligindeki sonucu elde etmede, orijinde eğim süreksizliği nedeniyle, integral iki kısma ayrılmıştı. Bütün durumlar için uygulanabilir olan farklı bir yol, özilişki fonksiyonunun simetrik olma avantajını kullanmaktır. (6-38) eşitliği, 194 ∞ S X (ω ) = ∫R X (τ )[cos ωτ − j. sin ωτ ].dτ −∞ biçiminde yazıldığında, üstel terim sinüs ve kosinüs cinsinden yazılmak suretiyle, R X (τ ) sin ωτ ’nun tek bir fonksiyon olduğu dikkate alınarak integralin sıfır olacağı açıkça görülmektedir. Diğer yandan R X (τ ) cos ωτ çift bir fonksiyondur ve - ∞ ’dan ∞ ’a kadar integral, 0’dan ∞ ’a kadar olan integral sonucunun tam iki katıdır. Bu nedenle, ∞ S X (ω ) = 2∫ R X (τ ) cos ωτ .dτ (6-42) 0 bir seçenek olarak orijinin iki yanında integrasyon gerektirmez. Geniş anlamda durağan işleme için buna karşı düşen ters dönüşüm ifadesi, ∞ R X (τ ) = (1 / π )∫ S X (ω ) cos ωτ .dω (6-43) 0 olarak kolayca verilebilir. Daha önce de değinildiği üzere, spektral yoğunluk ve ilişki fonksiyonu arasındaki bağıntı, Laplace dönüşümü cinsinden de ifade edilebilir. Ancak, Laplace dönüşümünün sistem analizinde en sık kullanılan biçiminde dönüşümü alınan zaman fonksiyonunun, zamanın negatif değerleri için sıfır olması gerektiği hatırlanmalıdır. Özilişki fonksiyonları daima τ ’nun çift fonksiyonları olduklarından, τ ’nun negatif değerleri için hiçbir zaman sıfır olamazlar. Bu yüzden buradaki uygulamada iki yanlı Laplace dönüşümü kullanmak gereklidir. Buna karşı düşen dönüşüm çifti, ∞ S X (s) = ∫R X (τ )e − sτ dτ (6-44) −∞ j∞ R X (τ ) = (1 / 2π . j ) ∫ S X ( s )e + sτ ds (6-45) − j∞ olarak kolayca gösterilebilir. Sonlu karesel beklendik değere sahip bir işlemenin spektral yoğunluğunun jω ekseni üzerinde kutup'a sahip olması mümkün olamayacağından, (6-45) eşitliğindeki integrasyon çevrimi daima jω ekseni üzerinde olacaktır. 195 ALIŞTIRMA 6-6 Durağan olmayan rasgele işleme aşağıda verilen özilişki fonksiyonuna sahiptir. R X (t , t + τ ) = sin (4πτ + 2πτ ) + (1 / 2) cos 2πτ SX( ω )’yı hesaplayınız. 6-7 BEYAZ GÜRÜLTÜ Beyaz gürültü kavramına daha önce değinilmişti. Bu ad, bütün ω değerleri için sabit olan bir spektral yoğunluğa verilmiştir ve SX( ω )=S0 olarak değerlendirilir. Bu tür bir işlemenin ilişki fonksiyonunu hesaplamak ilginçtir. Yapılması gereken en iyi şey sonuçtan hareket ederek doğruluğunu göstermeye çalışmaktır. R X (τ ) = S 0δ (τ ) ile verilen ve δ fonksiyonu içeren bir özilişki fonksiyonu ele alınsın. Bunun (6-38) eşitliğine uyarlanması, ∞ S X (ω ) = ∫R X (τ )e − jωτ dτ −∞ ∞ = ∫ S δ (τ )e 0 − jωτ dτ = S 0 (6-46) −∞ beyaz gürültü için bir sonuca varmayı sağlar. Buradan, beyaz gürültüye ait özilişki fonksiyonunun sadece spektral yoğunluğa eşit bir alanla temsil edilen bir δ fonksiyonu olduğu açıktır. Beyaz gürültü kavramı daha önce de değinildiği gibi imajinerdir. Çünkü, bu tür bir işleme, spektral yoğunluğunun alanı sonsuz olmasından dolayı sonsuz karesel beklendik değere sahiptir. Aynı sonuç ilişki fonksiyonunda da görülür. Karesel beklendik değerin τ − 0 için özilişki fonksiyonunun değerine eşit olması gerektiği anımsanacaktır. Bununla beraber, beyaz gürültü kavramının, lineer sistemlerin analizinde son derece önemli bir yeri vardır. Sistemin band genişliği, rasgele giriş işaretinin frekans sınırlarından büyük olması durumunda, sistemin bu işareti geçirmesi olayı sıkça karşılaşılan bir durumdur. Bu gibi hallerde, girişin spektral yoğunluğunun beyaz gürültü varsayılması, dikkate değer herhangi bir hata ile karşılaşılmaksızın sistem cevabının hesaplanmasına önemli ölçüde kolaylık sağlar. Buna ait örnekler 7. ve 8. Bölümlerde incelenecektir. Sıklıkla kullanılan diğer bir kavram Band Sınırlı Beyaz Gürültü'dür. Bu, bir spektral yoğunluğun sonlu band genişlik boyunca sabit ve bu frekans sınırları dışında sıfır olmasına karşı düşer. 196 S X (ω ) = S 0 ω ≤ 2πW =0 ω > 2πW (6-47) Şekil 6-8(a)’da band sınırlı beyaz gürültü görülmektedir. Bu spektral yoğunluk da karesel beklendik değeri sonlu olmasına rağmen (gerçekten de, X 2 = 2WS 0 ) imajinerdir. Neden? İsteğe bağlı olarak iyi bir yaklaşım sağlayabilir ve pek çok analiz probleminde elverişlilik sağlar. ŞEKİL 6-8: Band Sınırlı Beyaz Gürültü a) Spektral Yoğunluk b) Özilişki Fonksiyonu Bu tür bir işlemede, özilişki fonksiyonu, (6-41) eşitliğinden kolaylıkla elde edilir ve, ∞ R X (τ ) = (1 / 2π ) ∫ S X (ω )e jωτ dω −∞ 2πW = (1 / 2π ) ( jωτ jωτ ∫ S 0 e dω = (S 0 / 2π ) e / jτ − 2πW [ = (S 0 / 2π ) (e j 2πWτ − e − j 2πWτ ) / jτ ] ) 2πW − 2πW (6-48) = (S 0 / πτ )sin 2πWτ = 2WS 0 [sin 2πWτ / 2πWτ ] olur. Bu durum Şekil 6-8(b)’de gösterilmiştir. Limitte W sonsuza yaklaştığında ifadenin δ fonksiyonuna yaklaştığını belirtelim. Şekil 6-8(b)’den, band sınırlı bir işlemeye ait raslantı değişkeni, 1/2W saniyenin katları kadar zaman aralıklarında belirtiliyorsa, ilişkisiz (uncorrelated) olacaktır. Band sınırlı fonksiyonların band genişliklerinin iki katı sınırlarında alınan örnekler dizisi ile tek ve tam olarak ifade edilebileceği bilinmektedir. Bu temel, örnekleme teoremi olarak hatırlanacaktır. Bu nedenle, band sınırlı bir fonksiyon düz bir spektral yoğunluğa sahipse, örneklerle ifade edilebilir ve örneklerin ilişkili 197 olmayacağı görülür. Örnekler arasında ilişkinin olmayışı bundan sonraki analiz çalışmalarında önemli yararlar sağlayabilir. Özel olarak, (5-9) paragrafında tanımlanan ilişki matrisi bu tür örneklenmiş işleme için diyagonal matris olacak, yani ana köşegen dışındaki bütün terimler sıfıra eşit olacaktır. ALIŞTIRMA 6-7 Bir spektral yoğunluk, S X (ω ) = 0,1 ω ≤ 50π =0 ω > 50π olarak verilmiştir. a- Bu işlemenin karesel beklendik değerini, b- Özilişki fonksiyonunu sıfır yapan en küçük τ değerini bulunuz. Cevap: 0,02 - 5 6-8 ÇAPRAZ SPEKTRAL YOĞUNLUK Bir lineer sistemin giriş ve çıkışı gibi, ilişkili iki rasgele işleme ele alındığında, çapraz spektral yoğunluk olarak bilinen bir çift eşitlik tanımlamak mümkündür. Burada inceleme amaçları için yalnızca bunları tanımlamak ve herhangi bir ispata yönelmeden birkaç özelliğini belirtmek yararlı olacaktır. Eğer FX (ω ) , bir işlemenin kırpılmış örnek fonksiyonunun Fourier dönüşümü ve FY (ω ) da bir başka işlemenin benzeri ifadesi olduğunda, bu ikisine ait çapraz spektral yoğunluk, S XY = lim E [FX (−ω ) FY (ω )] / 2T (6-49) S XY = lim E [FY (−ω ) FX (ω )] / 2T (6-50) T →∞ T →∞ olarak tanımlanabilir. Normal spektral yoğunluğa benzemeyen çapraz spektral yoğunluğun pozitif, gerçel ve ω ’nın çift fonksiyonu olması gerekmez. Ancak, aşağıdaki özelliklere sahiptir. 1- S XY (ω ) = S YX (ω ) 2- Gerçel [S XY (ω )] , ω ’nın bir çift fonksiyonudur. Aynı şey S YX (ω ) için de geçerlidir. 198 3 – İmajiner (S XY (ω ) ) , ω ’nın bir tek fonksiyonudur. Aynı şey S YX (ω ) için de geçerlidir. Çapraz spektral yoğunluk, çapraz ilişki fonksiyonu ile gene Fourier dönüşümü aracı ile ilgilidir. Bileşik durağan işleme hali için, ∞ S XY (ω ) = ∫R (τ )e − jωτ dτ XY (6-51) −∞ ∞ R XY (τ ) = (1 / 2π ) ∫ S XY (τ )e jωτ dω (6-52) −∞ ∞ S YX (ω ) = ∫R YX (τ )e − jωτ dτ (6-53) −∞ ∞ RYX (τ ) = (1 / 2π ) ∫ S YX (τ )e jωτ dω (6-54) −∞ Çapraz spektral yoğunluğun diğer özellikleri sırası geldikçe verilecektir. 6-9 SPEKTRAL YOĞUNLUĞUN ÖLÇÜLMESİ Uygulamaya yönelik durumlarda, rasgele olaylarla karşılaşıldığında en iyi işaret işleme sistemini oluşturmak üzere, çoğu zaman bu olayların belirli parametrelerini ölçmek gerekir. Burada incelenecek durum kolayca altından kalkılabilecek durum olan, kurallara uygun olarak, işlemenin ergodik varsayılmasıdır. Bu takdirde, uygun zaman ortalamalarından işlemenin çeşitli parametrelerini kestirmek mümkündür. Beklendik değer ve ilişki fonksiyonu ile ilgili problemler daha önce ele alınmıştı. Şimdi arzu edilen, işaretin yer aldığı frekans bölgesi boyunca güç dağılımının yani spektral yoğunluğun nasıl kestirilebileceğini incelemektir. Bu tür bilgi pek çok mühendislik uygulamasında son derece değerlidir. Örneğin, istenmeyen ya da karışan işaretin spektral yoğunluğunun bilinmesi genellikle işaretin kaynağı hakkında önemli ipuçları verir ve onun ortadan kaldırılmasına yol gösterebilir. Ortadan kaldırılmasına olanak olmadığı hallerde, güç spektrumu hakkındaki bilgiler çoklukla, bu işaretlerin etkilerini azaltmak üzere uygun filtrelerin yapılabilmesine olanak sağlar. 199 Bu türe tipik bir örnek problem olmak üzere, 0 ≤ t ≤ T aralığında x(t) işaretinin sürekli kaydedildiği varsayılsın. x(t) işareti ergodik işlemeye ait bir örnek fonksiyondur. Kaydedilen işaretin gelmesiyle, işlemenin SX( ω ) spektral yoğunluk kestiriminin bulunması istenmektedir. Spektral yoğunluğu bulmak üzere uygun bir yol, gözlenen örnek fonksiyonun Fourier dönüşümünü bulmak ve spektral yoğunluk kestirimi olarak dönüşümün büyüklüğünün karesini almak düşünülebilir. Fakat, bu yol sonuç vermez. Örnek fonksiyonun tamamının Fourier dönüşümünün mevcut olmamasından, örnek fonksiyonun bir bölümünün Fourier dönüşümünün istenen spektral yoğunluğun ancak zayıf bir kestirimi olacağı şaşırtıcı değildir. Bu yol, işlemeye ait bütün (veya pek çok) örnek fonksiyonların Fourier dönüşümlerinin büyüklüklerinin karelerinin ensemble ortalamasının alınması halinde mümkün olabilir. Ancak, değerlendirilen tek bir örnek fonksiyon olduğundan bu tür doğrudan yaklaşım mümkün değildir. Yukarıdaki amaca varmada bir başka seçenek, (6-38) eşitliğinde görüldüğü gibi, spektral yoğunluk ve özilişki fonksiyonu arasındaki matematik bağıntıyı kullanmaktır. (5-4) paragrafında ele alındığı gibi, tek bir örnek fonksiyondan özilişki fonksiyonunu kestirmek mümkün olabileceğinden, bu kestirimin Fourier dönüşümü spektral yoğunluğun kestirimi olacaktır. Burada incelenecek olan yaklaşım budur. (5-14) eşitliğinde görülen ergodik bir işlemenin özilişki fonksiyonu kestirimi, X(t) ensemblenin herhangi bir üyesi olduğunda, T −τ Rˆ X (τ ) = [1 / (T − τ )] ∫ X (t ) X (t + τ )dt 0 ≤ τ << T (5-14) 0 ifadesinden elde edilir. τ , kayıt süresi olan T’nin yanında çok küçüktür ve τ ’nun müsade edilen en büyük değeri τ m ile gösterilecek olursa, RX için yeni bir kestirim, T −τ ˆ W R X (τ ) = [w(τ ) /(T − τ )] ∫ X (t ) X (t + τ ) dt 0 = w(τ ) a Rˆ X (τ ) olarak tanımlanır. Burada, | τ | > τ m için w( τ )=0 ve a Rˆ X (τ ) ’nun bütün τ değerleri için mevcut olduğu kabul edilen τ ’nun bir çift fonksiyonudur. Bu fonksiyon RX( τ ) kestirimini gecikme miktarına bağlı olarak değiştirdiğinden ve 2 τ m ile sınırlı, sonlu banda sahip olduğundan W ( τ ) fonksiyonuna genellikle Pencere adı verilir. 200 W( τ ) ile tanışmanın amacı spektral yoğunluk kestiriminin son derece önemli bir konu olması ve bu tür kestirimlerin mühendisler tarafından sıklıkla başvurulan bir yol olduğundan kaynaklanmıştır. Bununla ilgili aşağıdaki kısa açıklama, konuyu tam anlamıyla anlamak açısından yeterli değildir, fakat anlamlı bir kestirim elde edilmesinde kavramları tanımaya ve önemini göstermeye yardımcı olacaktır. Özilişki fonksiyonunun Fourier dönüşümü spektral yoğunluk olduğundan, spektral yoğunluğun bir kestirimi (6-55) eşitliğinin dönüşümü alınmak suretiyle elde edilebilir. w [ Sˆ X (ω ) = ℑ w(τ ) a Rˆ X (τ ) ] = (1 / 2π )W (ω )*a Sˆ X (ω ) (6-56) Burada, W( ω ), W ( τ )’nun Fourier dönüşümü ve (*) sembolü dönüşümlerin katlamasını (convolution) belirtir. a Sˆ X (ω ) , şimdi bütün τ değerleri için tanımlı fakat bütün τ değerleri için kestirilemeyen a Rˆ X (τ ) ile bağlantılı spektral yoğunluktur. Pencere fonksiyonunun önemini vurgulamak üzere, problem ne olursa olsun bir pencere fonksiyonu olacaktır. (5-14) eşitliği yalnızca | τ |< τ M için mevcut olduğundan bu eşitlik, wr (τ ) = 1 τ ≤τm =0 τ >τm (6-57) olarak tanımlanan, dikdörtgen pencere kullanılmış olması durumu için, (6-55) eşitliğine eşdeğer olacaktır. Gerçekte herhangi bir pencere fonksiyonu (6-57) eşitliğindeki dikdörtgen pencereyi kullanmakla aynı şey değildir. Bir pencereyi kullanmanın önemi, dikdörtgen pencerenin Fourier dönüşümüne dikkat edilerek gösterilebilir, ℑ[wr (τ )] = Wr (ω ) = 2τ m [sin ωτ m / wτ m ] (6-58) ve bu dönüşüm, Şekil 6-9’dan görüleceği gibi zamanın yarısında negatiftir. Bu nedenle, SX( ω ) ile konvolusyon, kendisi negatif değerli olmadığı halde kestirim negatif değerler taşıyacaktır. Gözlenen işaretin sonlu ( τ M<<T) uzunlukta olması Rˆ X (τ ) kendi sınır değerleri içinde hangi duyarlıkta bilinirse bilinsin, spektral yoğunluk kestiriminin tamamen hatalı olmasına sebep olur ve Rˆ X (τ ) yalnızca sınırlı bölgedeki değerleri (τ < τ m ) için kestirilebilir. 201 ŞEKİL 6-9: Dikdörtgen Pencere Fonksiyonu ve Dönüşümü Dikdörtgen pencere için sağlanan kestirim, r Sˆ X (ω ) = (1 / 2π )Wr (ω )*a Sˆ X (ω ) (6-59) ˆ ile gösterilecektir. mevcut sınırlı bilgi ile a S X (τ ) , kestirilemeyeceğinden (6-59) eşitliğinde görülen konvolüsyonun uygulanması ile bulunamaz. Bunun yerine (5-14) eşitliği ile Rˆ X (τ ) ’nun Fourier dönüşümü alınmak suretiyle, Sˆ (ω ) = ℑ Rˆ (τ ) (6-60) r [ X X ] yazılır. Burada T −τ Rˆ X (τ ) = [1 /(T − τ )] ∫ X (t ) X (t + τ )dt 0 ≤τ ≤τm 0 =0 τ >τm Rˆ X (τ ) = Rˆ X (−τ ) τ <0 ve ‘dır. Böylece, yukarıda değinildiği gibi, r Sˆ X (ω ) sınırlı τ değerlerinin hangi mertebede olduğuna bakılmaksızın kestirilebilir. Şimdi karşılaşılacak sorun, en az hata verecek şekilde r Sˆ X (ω ) ’nın nasıl elde edileceğidir. Bu sorun diğer pencere fonksiyonlarının seçimini gündeme getirir. Sˆ X (ω ) ile bağlantılı güçlüğün kaynağı W r( ω )’nın yan gözleridir. Bu güçlükten, dönüşümünün çok küçük yan gözlere sahip olduğu bir pencere seçilmek suretiyle kaçınılabilir. Bu tür bir pencere, yaygınlıkla kullanılan ve çoğu kez önerinin adına "Hamming Penceresi" adıyla bilinen bir pencere olup, r 202 πτ Wh (τ ) = 0.54 + 0.46 cos τ m =0 τ <τm (6-61) τ >τm (6-61) (a) (b) Şekil 6-10 (a) Hamming Penceresi ve (b) Fourier Dönüşümü ile verilmiştir. Bu pencere ve dönüşümü Şekil 6-10’da görülmektedir. h 1 Sˆ x (ω ) = Wh (ω )*a Sˆ x (ω ) 2 π (6-62) ifadesi ile verilir, ancak daha önce değinildiği gibi, olmadığı için bu katlama hesaplanamaz. Fakat eğer, πτ Wh (τ ) = 0.54 + 0.46 cos τ m olduğuna dikkat edilirse, a Ŝ x (ω ) uygun .Wr (τ ) ℑ[Wh (t )] = Wh (ω ) π = 0.54δ (ω ) + 0.23δ ω + τ m π + δ ω − τ m * Wr (ω ) Hamming penceresinin kırpılmamış sabit ve cosinüs terimlerinin Fourier dönüşümlerinde δ fonksiyonları olacaktır. Bu ifade (6-62) eşitliğinde yerine yazılır ve (6-59) eşitliğinden yararlanılırsa, hemen h π Sˆ x (ω ) = 0.54 r Sˆ x (ω ) + 0.23 r Sˆ x ω + τ m ˆ π + r S x ω − τm (6-63) bulunur. Ŝ X (ω ) , (6-60) eşitliği kullanılarak bulunabildiğinden ve (663) eşitliği, r Ŝ X (ω ) ’nın uyarlamasını göstermektedir. Buna sonuç kestirimin daima pozitif olmasından emin olmak için gerek duyulur. 203 Bölüm 5-4’te özilişki fonksiyonlarının kestiriminin incelenmesinde hemen hemen bütün pratik durumlarda gözlenen kayıtların 0, ∆t ,2∆t ,..., N∆t gibi ayrık zamanlarda örneklenmeleri ve sonuç kestirimin toplam biçiminde olduğuna değinilmişti. 1 N −n Rˆ x (n∆t ) = ∑ X k X k +n N − n + 1 k =0 n=0,1,...,M (6-64) Özilişki fonksiyonu yalnızca τ ’nun ayrık değerleri için kestirildiğinden, Fourier dönüşümüne de ayrık bir yaklaşım yapmak zorunludur. Bunu yapmada, bilgisayar zamanından da tasarruf sağlayan yollar vardır (bilinen adıyla, Hızlı Fourier Dönüşümü, FFT).Buradaki incelemede, (6-41) eşitliğinin, özilişki fonksiyonunun yalnızca kosinüs dönüşümü olan ayrık biçimini ele almak yararlı olacaktır. Buna göre dikdörtgen pencere için spektral yoğunluk kestirimi, M −1 ˆ (q∆ω ) = ∆t Rˆ (0 ) + 2 Rˆ (n∆t ) cos qnπ + Rˆ (M∆t ) cos qπ S ∑ r x x x x M n =1 ‘dir. Burada, q = 0,1,2,...,M ∆ω = π M∆t ‘dir. Buna karşı düşen Hamming pencere kestirimi, h { } Sˆ x (q∆ω ) = 0.54 r Sˆ x (q∆ω ) + 0.23 r Sˆ x [(q + 1)∆ω ]+ r Sˆ x [(q − 1)∆ω ] (6-66) olur ve bu ifade kestirimin son biçimini gösterir. Mamafih, spektral yoğunluk kestiriminin kalitesinin yeterli olması sorunu çok önemli ve aynı zamanda oldukça güçtür. Öncelikle Hamming pencere kestirimleri bayaslanmamış değildir, yani kestirimin beklendik değeri, spektral yoğunluğun gerçek değerini yansıtmaz. İkinci olarak kestirimin değişintisini hesaplamak çok zordur. Ancak bu değişinti için bir yaklaşım, 2M ∆ t’nin özilişki fonksiyonunun tamamını içeren yeterli büyüklükte olması durumunda (6-67) eşitliği ile ifade edilebilir. [ ] M 2 Var h Sˆ x (q∆ω ) = S x (q∆ω ) N 204 (6-67) Ölçülen spektral yoğunluk frekans bandı boyunca uniform bir özellik göstermiyorsa, Hamming pencere ile sağlanan kestirim ön düzenleme ile minimuma indirgenebilen, ciddi hatalara neden olabilir.Ön düzenleme, bilinen yollarla spektrumu düzgünleştirmektir. Bu tür hatalar, özellikle spektral yoğunlukta, gözlenen işaretin dc bileşen içermesine karşı düşen δ fonksiyonu olarak karşımıza çıkar. Bu durumda bilgi işaretinden dc bileşeni analizden önce çıkarmak oldukça önemlidir. ALIŞTIRMA 6-9 Özilişki fonksiyonu, R X (τ ) = 100[1 − 1000 τ ] =0 τ ≤ 0.001 τ ≥ 0.001 olan rasgele işlemenin spektral yoğunluk kestirimi istenmektedir. Kestirim ω ‘nın M =10 değeri için yapılacak ve kestirimin effektif hatası (standard sapma) spektral yoğunluğun maksimum değerinin %1’i mertebesinde olacak şekilde, zaman fonksiyonunun kaç örnekten oluşması gerektiği, örnekler arası zaman aralığının ne olması gerektiği ve kestirimin yer aldığı frekans bölgesinin Hz olarak frekans bölgesinin ne olduğunu bulunuz. Cevap: 10-4, 105, 5000 6-10 SPEKTRAL YOĞUNLUĞA AİT ÖRNEK VE UYGULAMALAR Spektral yoğunluğun en önemli uygulaması rasgele girişlere sahip lineer sistemlerin analizi ile ilgilidir. Ancak bu uygulama bir sonraki bölümde ayrıntılı olarak inceleneceğinden burada ele alınmayacaktır. Onun yerine spektral yoğunluğun özelliklerini ve hesaplama yöntemlerini vurgulamak üzere bazı örnekler verilecektir. İncelenecek ilk örnek, binary haberleşme sistemine bir darbe dizisinin polaritesi yardımıyla bilgi gönderilmesine dayalı bir işarete aittir. Bu tür bir sistemde, Şekil 6-11 (a)’da görülen dikdörtgen darbe biçimi kullanılacağı açıktır. Bu darbelerin hepsi aynı genlikli, fakat polariteleri eş olasılıkla pozitif veya negatiftir ve darbeden darbeye bağımsızdır. Ne var ki, darbelerin dik kenarları bu işaretin arzulanandan fazla band işgal etmesine neden olur. Bir başka darbe biçimi Şekil 6-11 (b)’de görülen yükselen kosinüs darbesidir. Cevaplanması gereken soru, dikdörtgen darbe yerine bu tür bir darbenin kullanılması halinde band genişliğindeki azalma miktarıdır. 205 ŞEKİL 6-11 Bir Binary İşaret (a) Dikdörtgen Darbeli (b) Yükselen Kosinüs Darbeli Yukarıda belirtilen her iki rasgele işleme (6-23) eşitliğindeki genel sonuç yardımıyla açıklanabilen spektral yoğunluklara sahiptir. Her iki halde de darbe genliğinin beklendik değeri (polaritelerin eş olasılıklı olması nedeniyle) sıfıra eşittir. Dikdörtgen darbe genliğinin değişintisi A2 ve yükselen kosinüs darbe için ise bu değer B2 dir. (27 paragrafına, delta dağılımına bakınız.) O halde gereken her 2 darbe için F (ω ) ‘yi bulmaktır. Dikdörtgen darbe için f(t) darbe şekli fonksiyonu, t f(t) = 1 t ≤ 1 2 t =0 t > 1 2 ve buna ait Fourier dönüşümü, sin (ω .t1 / 2) dt = t1 ω .t1 / 2 −t 1 / 2 ‘dür. (6-23) eşitliğine göre binary işaretin spektral yoğunluğu, F (ω ) = t1 / 2 ∫ (1)ε − j ωt sin (ω .t1 / 2 ) S X (ω ) = A t1 ω .t1 / 2 2 2 (6-68) olur, bunun maksimum değeri ω =0 için sözkonusudur. Yükselen kosinüs darbe için f(t) darbe şekli, t 1 2πt f (t ) = 1 + cos t ≤ 1 2 t1 2 =0 t > 206 t1 2 dir. Buna ait Fourier dönüşümü, t1 / 2 1 2π .t − jω .t 1 + cos ε F (ω ) = dt ∫ 2 −t 1 / 2 t1 ω .t1 sin t1 π2 2 = 2 ω .t1 2 ω .t1 2 π − 2 2 olur ve spektral yoğunluk ise, 2 2 π2 2 ω .t π 2 − 1 2 olmaktadır. Maksimum değer gene ω = 0 meydana gelir. Bu spektral yoğunlukların band genişliklerinin değerlendirilmesinde uygulanabilir pek çok farklı seçenek vardır. Ancak iki haberleşme sistemi; sındaki girişimin azaltılması istendiğinde, bandgenişliği, işaretin spektral yoğunluğunun belirli bir kesri kadar küçük (örneğin %1) olmasının dışında ele almak uygun olur. Buradan arzu edilen ω 1 değeri, ω .t1 sin 2 B t1 2 S X (ω ) = 4 ω .t1 2 S x (ω ) ω > ω1 ≤ 0.01 S x (0) yazılabilir. sin( ω .t1 / 2 ) hiçbir zaman 1’den büyük olamayacağından, bu koşul (6-68) eşitliğini sağlayacaktır. 2 1 A t1 ω .t1 / 2 ≤ 0.01 A 2 .t1 2 olduğundan, dikdörtgen darbe hali için, ω 1 ≈ 20 / t1 yazılabilir. Yükselen kosinüs darbe kullanılması hali için bu koşul (B t / 4)[1 / (ω .t / 2)] [π / (π − (ω.t / 2) )] 2 2 1 2 2 2 1 1 B 2 t1 / 4 ve ω 1 ≈ 10,68 / t1 olarak bulunur. 207 2 ≤ 0,01 Dikdörtgen darbeler yerine yükselen kosinüs darbeler kullanılması halinde band genişliğinin hemen hemen yarıya indiği açıktır. Bu bölümde incelenen bütün spektral yoğunluk örnekleri, spektral yoğunlukları ω = 0 için maksimum olan alçak geçiren fonksiyonlardı. Ancak çok sayıda pratik uygulamada, spektral yoğunluğun maksimum değerinin herhangi yüksek bir frekansta olduğu durumlarla karşılaşılır, ikinci örnek bu tür bir durumla ilgilidir. Şekil 6-12 tipik bir band geçiren spektral yoğunluğu ve kutup-sıfır düzenlenmesini göstermektedir. ŞEKİL 6-12 (a) Band Geçiren Spektral Yoğunluk (b) Karşı Düşen Kutup Sıfır Gösterilişi. Bu spektral yoğunluğun kompleks frekans gösterilişi kutup-sıfır diyagramından kolayca elde edilir. O halde, S x (s ) = S 0 (s )(− s ) (s + α + j.ω 0 )(s + α − j.ω 0 )(s − α + j.ω 0 )(s − α − j.ω 0 ) yazılır. Burada S0 ölçek faktörüdür. Bu spektral yoğunluk sıfır frekans değeri için sıfıra eşittir. Bu spektral yoğunlukla ilgili karesel beklendik değer 6-5 paragrafında incelenen her iki yöntemle de elde edilebilir. Tablo 6-1’in kullanılması halinde kolayca, 208 c(s) = s c1= 1 2 d(s) = s +2 α s+ α 2 + ω 02 c0 = 0 d2=1 d1=2 α d0= α 2+ ω 02 olduğu görülür. Karesel beklendik değer I2 yardımıyla, [ ] X 2 = S 0 I 2 = S 0 c12 d 0 + c02 d 2 / 2d 0 d 1d 2 = S0 (1)2 (α 2 + ω 02 ) + 0 S 0 = 2(α 2 + ω 02 )(2α )(1) 4α elde edilir. Bu hesaplamanın ilginç sonucu, karesel beklendik değerin yalnızca band genişliği parametresi olan α ’ya bağlı olması ve ω 0 merkez frekansından bağımsız olmasıdır. Üçüncü örnek spektral yoğunluğun aşağıdaki ifadeye bağlı fiziksel anlamını gösterecektir. ∞ 1 X2 = S x (ω )dω 2π −∫∞ Her ne kadar bu ifade, yalnızca spektral yoğunluğun altında kalan toplam alan nedeni ile işlemenin toplam karesel beklendik değeri ise de, daha ileri bir uygulama olarak herhangi frekans sınırları için karesel beklendik değer benzer şekilde spektral yoğunluğun o frekans sınırları için altında kalan kısmi alanla orantılıdır. Bu şekilde, eğer ω1 ve ω 2 gibi herhangi frekans çifti seçilirse, bu iki frekans arasında enerjiye sahip rasgele işlemenin bu kısmına ait karesel beklendik değer, ω1 ω2 1 = ∫ S x (ω )dω + ∫ S x (ω )dω 1X 2π −ω 2 ω1 2 2 = 1 π ω2 ∫ S (ω )dω x (6-71) ω1 olur. (6-71) eşitliğinin ikinci biçimi S x (ω ) ’nın ω ’nın çift fonksiyonu olmasının bir sonucudur. Bu kavramı açıklamak üzere, (6-40) eşitliğinden türetilen spektral yoğunluk yeniden ele alınsın. 209 S x (ω ) = 2 Aβ / (ω 2 + β 2 ) (6-40) Burada, A işleminin toplam karesel beklendik değeridir. Toplam karesel beklendik değerin (veya ortalama güç) yarısı olması için frekans değerinin bulunmasının istendiği varsayılsın. Bunun anlamı ( ω 2 = ∞ için) ω 1 değerini elde etmek olacaktır. Yani, ∞ ∞ 1 2 Aβ 1 1 2 Aβ dω = ∫ 2 2 π 0 ω + β 2 π ω∫1 ω 2 + β 2 = (1/2)A ( ) ( ) dω O halde, ∞ ∫ω (1 / (ω 2 )) + β 2 dω = π / 4 β 1 A’lar kısalacağından, integral (1 / β ) tan −1 (ω / β ) ω∞1 = (1 / β )[(π / 2) − tan −1 (ω1 / β )] = π / 4 β olur, burada tan −1 (ω 1 / β ) = π / 4 dir. O halde bu işlemenin ortalama gücünün yarısı β frekansının üstünde ve yarısı da β frekansının altında oluşur. Bu özel durum için β ’nın aynı zamanda, ω = 0 ’da maksimum değere sahip spektral yoğunluğun yarı frekansına karşı düştüğünü belirtelim. Bu özel durum için bu sonuç alışılmamış bir sonuç olup genel olarak doğru değildir. Örneğin, Şekil 6-8’de gösterilen band sınırlı beyaz gürültü durumu için spektral yoğunluk maksimum değerin yarısına ω = 2πW ’de ulaşır, fakat ortalama gücün yarısı ω = πW değerinden büyük değerler için sözkonusudur. Bu sonuçlar kısa açıklamalardan anlaşılmaktadır. ALIŞTIRMA 6-10 (6-40) eşitliğindeki spektral yoğunluk için, ortalama gücün onda birinin ω 1 ‘in üstünde yer alması için ω 1 değeri ne olmalıdır. Cevap: 6,30 β 210 PROBLEMLER 6-1 Aşağıdaki her bir ω fonksiyonunun, spektral yoğunluk için geçerli bir ifade olup olmadığını belirleyiniz. Geçerli bir ifade olmaması durumunda nedenini açıklayınız. ( b. (ω )( + 10 ) / (ω ) + 4) a. ω 2 + 9 / ω 4 − 3ω 2 + 2 2 ( 2 4 + 5ω ) c. 1 / ω + 2ω + 1 2 ( ) d. ω 4 − 2 / ω 2 + 10ω 4 + 2ω 2 + 1 e. (sin (ω ) / ω ) 2 [ ( )] f. δ (ω ) + ω 2 / ω 2 + 1 6-2 (6-21) eşitliği ile verilen sonucu kullanarak, örnek fonksiyonu aşağıda Fourier serisi açınımı ile verilmiş işlemenin spektral yoğunluğu için bir ifade yazınız. ∞ a X (t ) = 0 + ∑ a n cos nω 0 (t + t 0 ) + bn sin nω 0 (t + t 0 ) 2 n =1 Burada t bir peryod boyunca uniform dağılımlıdır ve a ile b sabitleri göstermektedir. 6-3 Bir rasgele işleme, şekilde görülen peryodik örnek fonksiyona sahiptir. Burada A bir sabiti ve t ise O ile T arasındaki uniform dağılımlı bir raslantı değişkenini göstermektedir. a- Sx(w) spektral yoğunluğunu bularak çiziniz. b- Problemi örnek fonksiyonu, Y(t) = A + X(t) olan işleme için tekrarlayınız. 6-4 Bir polarite örnekleyici yakınlıkla şekilde gösterilmiştir. Örnekleyiciyi, giriş işaretinin polaritesinin ani durumlarını değerlendirerek ve örnek polaritesinin pozitif veya negatif olmasına bağlı olarak, çıkışta pozitif veya negatif birim genlikli darbeler üreten bir düzen olarak düşünelim. 211 Örnekleme frekansına göre dana geniş banda sahip, sıfır beklendik değerli rasgele gürültü, her bir örnek diğerinden bağımsız, bu polarite örnekleyiciye uygulandığında, çıkış rasgele genlikli binary dalga şekli olacaktır. Çıkışın spektral yoğunluğunu, örnekleme peryodu T ve çalışma faktörü t1/T cinsinden hesaplayınız. 6-5 Problem 6-1’deki kabul edilebilir her bir spektral yoğunluğun karşı düşen kompleks frekans domeni ifadesi Sx(s)'yi yazınız. 6-6 Problem 6-1’deki kabul edilebilir her bir spektral yoğunluğa ait karesel beklendik değerleri hesaplayınız. 6-7 Spektral yoğunluğu, Sx(s) = s2 / (s6-1) olarak verilen durağan rasgele işlemenin karesel beklendik değerini bulunuz. 6-8 Durağan bir rasgele işlemeye ait özilişki fonksiyonu, R x (τ ) = A.e cos ω 0τ olarak verilmiştir. Rasgele işlemenin spektral yoğunluğunu bularak, çiziniz. −α τ 212 6-9 Bir rasgele işleme şekilde gösterildiği gibidir. Burada t0, 0 ile T arasında uniform dağılımlı bir raslantı değişkeni ve ak da diğerinden bağımsız, - 1 ile 1 arasında uniform dağılımlı bir raslantı değişkenidir. Bu işlemeye ait spektral yoğunluğu, önce özilişki fonksiyonunu bulup Fourier dönüşümünü hesaplayarak elde ediniz. Sonucu (6-23) eşitliği ile kontrol ediniz. 6-10 X(t) ve Y(t) gibi durağan iki rasgele işleme ele alınsın. SXY( ω ) ve SYX( ω )’nın gerçel ve imajiner kısımlarının ifadelerini yazınız ve Re SXY( ω ) = Re SYX( ω ) Im SXY( ω ) = -Im SYX( ω ) olduğunu gösteriniz. 6-11 Yeni bir Z(t) rasgele işlemesi, iki bileşik durağın X(t) ve Y(t) rasgele işlemelerinin toplamı biçimindedir. a- Yeni işlemeye ait SZ( ω ) spektral yoğunluğunu hesaplayınız. b- X(t) ve Y(t), beklendik değerleri sırasıyla X ve Y olan istatistik bağımsız rasgele işlemeler olduğunda, SXY( ω ) ve SYX( ω ) hakkında ne söylenebilir. c- SXZ( ω ) çapraz spektral yoğunluğunu hesaplayınız. 6-12 Spektrumu düzgünleştirmede kullanılan pencerelerin en önce bilinenlerinden biri, W (τ ) = 0,5 + 0,5 cos(πτ / τ m ) τ <τm =0 τ >τm ifadesi ile verilen ve Hanning penceresi olarak adlandırılan penceredir. Bu pencerenin kullanılmasının nedeni, herhangi bir düzgünleştirme sağlamayan dikdörtgen pencere uygulanması yerine çok basit bağıntısıyla, sonuç vermesinden kaynaklanır. a- (6-63) eşitliğine benzer bir ifadeyi Hanning penceresi için elde ediniz. b- Hamming ve Hanning pencerelerinin yangöz düzeylerini karşılaştırın. 213 6-13 Binary haberleşmesinde kullanılması durumunda, bir üçgen darbenin performansını, bir dikdörtgen ve bir yükselen kosinüs darbeyle karşılaştırınız (6-10 paragrafına bakınız). Bütün darbeler için enerjinin aynı olduğu kabul edilecektir. 6-14 Binary haberleşmede kullanılacak dikdörtgen darbe şekli için (problem 6-13’e bakınız) yüzde 90 güç içerecek şekilde frekans sınır değerini hesaplayınız. Aynı işlemi yüzde 99 güç değeri için tekrarlayınız. (Çözümde nümerik veya grafik integrasyonu kullanınız.) 6-15 Band sınırlı beyaz gürültü işlemesine ait bir örnek fonksiyonun band-genişliği W Hz ve örnekleme aralığı ∆ t = 1/2 W’dir. Eğer işlemenin spektral yoğunluğu S0 ise bu işlemeden alınacak N örnek için kovaryans matrisini hesaplayınız. KAYNAKLAR Bölüm 1’deki kaynaklara bakınız. Özellikle Beckmann, Davenport ve Root, Papoulis ve Thomas. Aşağıdaki ek referans güç spektrumu kestirimi yöntemleri üzerine çok faydalıdır. Blackman, R.B. ve J.W.Tukey, The Measurement of Power Spectra. New York: Dover Publications, 1958. 214 BÖLÜM 7 RASGELE GİRİŞLERE LİNEER SİSTEMLERİN CEVABI 7-1 GİRİŞ Önceki bölümlerdeki incelemeler, rasgele zaman fonksiyonlarının uygun matematik ifadelerini bulmaya yönelikti. İkinci adım, bu matematik ifadelerin, lineer sistem girişleri deterministik olmayan rasgele bir işaret olduğunda, çıkış işaretinin nasıl hesaplanabileceğidir. Bu aşamada, öğrencinin zaman ve frekans domenlerinde lineer sistemlerin analizine ait bilgilere sahip olduğu varsayılmıştır. Bu yöntemlere burada yalnızca kavramları hatırlatmak amacıyla değinilecek, temel kavramları yeniden gözden geçirmek üzere bir girişimde bulunulmayacaktır. Sistem, ya impuls cevabı h(t) veya onun Fourier dönüşümü olan transfer fonksiyonu H( ω ) ile tanımlanır. Pek çok durumda impuls cevabının Laplace dönüşümünü transfer fonksiyonu H(s) olarak kullanmak elverişli olabilir. Genellikle kolaylık açısından başlangıç koşulları sıfır kabul edilecektir. Gerekli olduğu hallerde bilinen yöntemler kullanılarak sıfırdan farklı başlangıç koşulları hesaba katılabilir. Bir lineer sistemin girişi deterministik ise her iki yaklaşım da bizi giriş ve çıkış arasında tek bir bağıntıya götürecektir. Sistem girişi bir rasgele işlemenin örnek fonksiyonu olduğunda giriş ile çıkış arasında gene tek bir bağıntı vardır. Ancak girişin rasgele yapısı nedeniyle, kesin tanımı yapılamaz ve bu yüzden cevap için açık bir ifade elde edilemez. Bu durumda, çıkışın ya olasılık ya da istatistik yaklaşımları kabul edilmelidir. Bu tip tanımlar yalnızca girişler için kullanılmaktadır. Olasılık ve istatistik* yaklaşımlar arasında en uygun olanı istatistik yaklaşımlardır. Oldukça sınırlı sayıdaki problemler için girişe ait olasılık verileri ile çıkışın olasılık tanımlarını elde etmek mümkün olmaktadır. Ancak, istatistik model daha çok kullanılır ve girişin istatistik modeli üzerinde basit matematik işlemler yapılarak çıkışın istatistik modeli kolayca elde edilebilir. * Olasılık yaklaşımıyla belirli olasılık fonksiyonları tanımlanmış işaretleri, istatistik yaklaşım ile de belirli ensemble ortalamaları (beklendik değer, değişimi, özilişki fonksiyonu vs.) tanımlanmış işaretler belirtilmek istenmektedir. 215 İstatistik yöntemlerle çıkışın, beklendik değer, ilişki fonksiyonu, ve spektral yoğunluk gibi büyüklükleri hesaplanabilir. Bundan sonraki çalışmalarda yalnızca istatistik yaklaşım ele alınacaktır. 7-2 ZAMAN DOMENİNDE ANALİZ Lineer bir sistemin herhangi bir giriş işaretine cevabını katlama yardımıyla hesaplamak mümkündür. Zamanla değişen sistemler veya durağan olmayan rasgele işaretler ya da her ikisinin birlikte olması hallerinde, ayrıntılar oldukça karmaşık olacaktır. Bu yüzden burada analizin gerçekçiliğini gösterebilmek üzere fiziksel olarak gerçeklenebilir kararlı sistemler ele alınacaktır. ŞEKİL 7-1 Lineer Bir Sistemin Zaman Domeni Gösterilişi Şekil 7-1’de görüldüğü gibi, giriş zaman fonksiyonu x(t), sistemin impuls cevabı h(t) ve çıkışın zaman ifadesi y(t) olarak gösterilirse, x(t) ve y(t) arasındaki bağıntılar, ∞ y (t ) = ∫ x(t − λ )h(λ )dλ (7-1) 0 ya da t y (t ) = ∫ x(λ )h(t − λ )dλ (7-2) −∞ olmaktadır. Sistemin fiziksel olarak gerçeklenebilmesinde şu kısıtlamaları vurgulamak gerekir. h(t) = 0 t<0 (7-3) ∞ ∫ h(t ) dt < ∞ (7-4) −∞ Bu açıklamalar yardımıyla durağan rasgele işleme ile uyarılan bir sistemin çıkışının birçok önemli karakteristikleri hesaplanabilir. 7-3 SİSTEM ÇIKIŞININ BEKLENDİK DEĞERİ BEKLENDİK VE KARESEL Sistemin girişi X(t), rasgele işlemenin bir örnek fonksiyonu olduğunda, katlama integralinin en uygun biçimi, 216 ∞ Y (t ) = ∫ X (t − λ )h(λ )dλ (7-5) 0 olmaktadır. Bunun nedeni integral sınırları zamana bağlı değildir. Bunu kullanarak, öncelikle y(t) çıkışının beklendik değeri ele alınacaktır. Bu, ∞ Y = E [Y (t )] = E ∫ X (t − λ )h(λ )dλ 0 (7-6) ile verilmiştir. İkinci ana adım, yapılan zaman integrasyonunda, beklendik değer alma işleminin sırasının değiştirilmesi ve bu şekilde integral işaretinin içine alınmasıdır. Bunu yapmadan önce, bu tür sıra değişikliklerinin hangi koşullarda doğru olacağını açıklamak yararlı olacaktır. Çoğu kez karşılaşılan problem, raslantı değişkeninin integral altında bulunması durumunda beklendik değerin hesaplanmasıdır. Benzer durumlarda; hemen hemen daima integrasyonu kolaylaştırmak için beklendik değer alma işleminin integral içine alınabilmesi istenir. Genellikle ilgilenilen pek çok uygulamada bu yer değiştirme mümkün olmaktadır. Bu nedenle, bu metinde herhangi bir yorum yapılmaksızın kullanılmıştır. Ancak, kullanabilme koşullarının tamamen anlaşılamayacağı düşünülse bile bilinmesi yararlıdır. Bu koşullar şöyle özetlenebilir. Eğer Z(t), bir rasgele işlemenin örnek fonksiyonu (veya örnek fonksiyonun karesi gibi herhangi bir fonksiyon) ve f(t) de rasgele yapıda olmayan bir zaman fonksiyonu ise, t 2 t2 E ∫ Z (t ) f (t )dt = ∫ E[Z (t )] f (t )dt t1 t1 yazılabilir. Ancak: t2 1. ∫ E[ Z (t ) ] f (t ) dt < ∞ t1 ve 2. Z(t); t1 ve t2 aralığı ile sınırlı olmalıdır. Burada t1 ve t2 sonsuz olabilir. Ayrıca Z(t)’nin durağan olması için bir zorunluluk yoktur. Bu sonuçların lineer sistemlerin analizinde kullanılmasında f(t)’nin yerini h(t) alacaktır. Geniş anlamda durağan rasgele işleme girişleri için E{|Z(t)|} büyüklüğü sabittir ve zamandan bağımsızdır. Bu nedenle 7-4’teki kararlılık koşulu, 1. koşulu sağlayacaktır. 217 Sınırlı olmayan bazı matematik ifadeler olmasına karşın Z(t) daima sınırlılık koşulunu fiziksel işaret olması nedeni ile sağlayacaktır. Lineer sistemlerin çıkışlarının ortalama değerlerinin bulunması problemine yeniden dönersek, girişe geniş anlamda durağan bir işaret uygulandığında, ∞ ∞ 0 0 Y = ∫ E[ X (t − λ )]h(λ )dλ = X ∫ h(λ )dλ (7-7) olur. Hatırlanacağı gibi, sistemin impuls cevabının altında kalan alan, sistemin de kazancını ifade etmektedir. Bu da ω =0 için sistemin transfer fonksiyonuna karşı düşmektedir. Çıkışın dc bileşeni girişin dc bileşeni ile sistemin dc kazancının çarpımına eşittir. Eğer rasgele işaretin beklendik değeri sıfır ise (dc bileşen) çıkışın da beklendik değeri sıfır olacaktır. Eğer sistem doğru akımı geçirmiyorsa, çıkışın beklendik değeri daima sıfır olur. Çıkışın karesel beklendik değerinin bulunması için iki integralin çarpımının beklendik değerini hesaplayabilmek gerekir. Bu genellikle değişkenleri farklı tutulan, tekrarlanan çift integral olarak yazılır. ∞ ∞ Y = E Y (t ) = E ∫ X (t − λ1 )h(λ1 )dλ1 ∫ X (t − λ 2 )h(λ 2 )dλ 2 0 0 ∞ ∞ = E ∫ dλ1 ∫ X (t − λ1 )X (t − λ 2 )h(λ1 )h(λ 2 )dλ 2 (7-8) 0 0 [ 2 ∞ 2 ] ∞ = ∫ dλ1 ∫ E [X (t − λ1 )X (t − λ 2 )]h(λ1 )h(λ 2 )dλ 2 0 (7-9) 0 λ1 ve λ 2 integrasyon değişkenleri, integralleri ayırabilmek amacı ile kullanılmışlardır. E [ X (t − λ1 )X (t − λ 2 )] = R X (t − λ1 − t + λ 2 ) = R X (λ 2 − λ1 ) olup özilişki fonksiyonu olduğu açıktır. O halde, (7-9) eşitliği, ∞ ∞ 0 0 Y 2 = ∫ dλ1 ∫ R X (λ 2 − λ1 )h(λ1 )h(λ 2 )dλ 2 (7-10) yazılabilir. Her ne kadar, R X (τ ) ve h(t) benzer ve üstel ifadelerle verilmişlerse, (7-10) eşitliğini hesaplamak güçlük yaratmaz. Bununla ilgili ayrıntıya girmeye gerek 218 yoktur. Burada, bu tür özilişki fonksiyonlarının türev değerleri orijinlerinde süreksizlik gösterirler ve integrali kısımlara ayırmak gerekir. Buna daha sonra değinilecektir. Ancak şimdi tanıtıcı nitelikte daha kolay bir durum incelenecektir. Eğer giriş işareti beyaz gürültünün bir örnek fonksiyonu ise R X (λ ) = S 0δ (τ ) olduğu anımsanacaktır. Burada S0 beyaz gürültünün spektral yoğunluğudur. (7-10) eşitliğinde yerine yazılmak suretiyle, ∞ ∞ 0 0 Y 2 = ∫ dλ1 ∫ S 0δ (λ 2 − λ1 )h(λ1 )h(λ 2 )dλ 2 (7-11) ŞEKİL 7-2: RC Devresi ve Ona Ait İmpuls Cevabı bulunur ve λ 2 boyunca integre edilerek, ∞ Y = S 0 ∫ h 2 (λ )dλ 2 (7-12) 0 bulunur. Görüleceği gibi impuls cevabının karesinin altında kalan alan ile orantılıdır.* Bu kavramları gösterebilmek amacıyla basit bir örnek ele alalım. Bir alçak geçiren RC devresi düşünelim. (7-7) eşitliğinden yararlanarak çıkışın beklendik değeri bulunabilir. ∞ Y = X ∫ bε 0 − b .λ dλ = Xb ε −bλ −b ∞ =X (7-13) 9 * Belirtmek gerekir ki bazı fonksiyonlarda, bu integral (7-4) koşulu sağlansa bile Iraksama olabilir. Bu duruma h(t) nin S fonksiyonu içerdiği durumlarda karşılaşılır. Yüksek geçiren RC devresi buna örnektir. 219 Bu sonuç doğrudur çünkü devrenin dc kazancı 1'e eşittir. Bir sonraki aşama, girişin (7-12) eşitliğindeki beyaz gürültü olması durumunda çıkışın karesel beklendik değerini incelemektir. ∞ Y = S0 ∫ b ε 2 2 − 2 bλ 2 dλ = b S 0 0 ε −2bλ − 2b ∞ = bS 0 / 2 (7-14) 0 Zaman sabiti ile ters orantılı olan b parametresi sistemin yarı güç band genişliği ile ilgilidir. Bu durum için bu band genişliği, B, 1 b = Hz 2πRC 2π ‘dir. Buradan, B= Y 2 = π .B.S 0 (7-15) şeklinde yazılabilir. O halde sistem çıkışının karesel beklendik değeri sistemin band genişliği ile lineer olarak artar. Bu duruma rasgele girişin band genişliği, sistemin band genişliğine göre büyük olan durumlarda sıklıkla rastlanır. ALIŞTIRMA 7-3 Bir sistemin impuls cevabı h(t) = 2e1 - e-2t t≥0 =0 t< 0 ‘dır. Eğer (12 volt)2/Hz spektral yoğunluklu beyaz gürültülü sistem girişine uygulandığında, çıkışın, (a)-Beklendik değeri, (b)-karesel beklendik değeri bulunuz. Cevap: 0,11 7-4 SİSTEM ÇIKIŞININ ÖZİLİŞKİ FONKSİYONU Karesel beklendik değerin bulunması ile ilgili olan bir problem de sistemin çıkışında özilişki fonksiyonunun hesaplanmasıdır. Tanım olarak bu özilişki fonksiyonu, RY (τ ) = E [Y (t )Y (t + τ )] ‘dur. (7-9) eşitliğinde t yerine t + τ koyarak, 220 ∞ ∞ 0 0 RY (τ ) = ∫ dλ1 ∫ E [X (t − λ 2 ) X (t + τ − λ 2 )]h(λ1 )h(λ 2 )dλ 2 (7-16) yazılabilir. Bu durumda integral içindeki beklendik değer, E [ X (t − λ1 )X (t + τ − λ 2 )] = R X (t − λ1 − t − τ + λ 2 ) = R x (λ 2 − λ1 − τ ) olur. O halde, çıkışın özilişki fonksiyonu, ∞ ∞ 0 0 RY (τ ) = ∫ dλ1 ∫ R x (λ 2 − λ1 − τ )h(λ1 )h(λ 2 )dλ 2 (7-17) olacaktır. Bu sonuçla karesel beklendik değer arasında bir benzerlik vardır. Özellikle τ =0 için (7-10) eşitliğine eşit olur. Girişin beyaz gürültü olması özel hali için bu ifade daha da basitleşir. R x (τ ) = S 0δ (τ ) idi, (7-17)’de yerine yazılarak, ∞ ∞ RY (τ ) = ∫ dλ1 ∫ S 0δ (λ 2 − λ1 − τ )h(λ1 )h(λ 2 )dλ 2 0 0 ∞ = S 0 ∫ h(λ1 )h(λ1 + τ )dλ1 (7-18) 0 bulunur. Girişin beyaz gürültü olması durumunda çıkışın özilişki fonksiyonu impuls cevabının zamanca özilişki fonksiyonu ile orantılıdır. Bu nokta Şekil 7-2’deki lineer sistem ve beyaz gürültü girişi için gösterilebilir. Böylece, ∞ ( ) RY (τ ) = S 0 ∫ b.e −bλ be −b ( λ +τ ) dλ 0 2 = b S0e − bτ e −2bλ − 2b ∞ = (bS 0 / 2 )e −bτ τ ≥ 0 (7-19) 0 Bu sonuç ancak τ > 0 için geçerlidir. τ < 0 iken impuls cevabı negatif değerler için daima sıfır olacağından integral bölgesi değişmelidir. Şekil 7-3’deki iki diyagram bu duruma açıklık getirecektir. 221 ŞEKİL 7-3 Şekil 7-2’deki RC Devresi Kullanıldığında (7-18)’deki integrasyonun τ ’ya bağlı olarak değerlendirilişi İntegralde çarpanların biri sıfır olunca, integral sıfır olmakta, τ < 0 olduğunda, ∞ ( ) RY (τ ) = S 0 ∫ b.e −bλ b.e −b (λ +τ ) dλ −τ ∞ = b 2 S 0 e −bτ e −2bλ / (− 2b ) −τ = (bS 0 / 2 )e bτ τ ≤0 (7-20) ve (7-19) ile (7-20) eşitlikleri bütünleştirilerek tam özilişki fonksiyonu RY (τ ) = (bS 0 / 2 )e −b τ −∞ <τ < ∞ (7-21) olarak yazılabilir. τ <0 için yapılan işlemlere gerek yoktur. Madem ki RY( τ ), τ ’nun bir çift fonksiyonudur, o halde τ >0 için yapılan hesaplama yeterli olacaktır. Giriş rasgele işlemesinin beyaz gürültü olmadığı durumlarda bazı integral problemlerinin incelenmesi yararlı olacaktır. Bu amaçla Şekil 7-2’deki RC devresine uygulanan ve aşağıda verilen özilişki fonksiyonuna sahip bir rasgele işleme varsayılsın. R X (τ ) = (β .S 0 / 2 )e −β τ −∞ <τ < ∞ (7-22) katsayının β .S 0 / 2 seçilmesi, bu rasgele işlemenin ω = 0 ’da S0 spektral yoğunluğa sahip olmasına karşı gelir. (6-40) eşitliği ve Şekil (7-2)’ye bakınız. Böylece alçak frekanslarda spektral yoğunluk beyaz gürültü spektrumu ile aynı olur. 222 Uygun integrasyon sınırlarını hesaplamak üzere, özilişki fonksiyonu, Rx (λ 2 − λ1 − τ ) ’e τ >0 için λ 2 ’nin bir fonksiyonu olarak bakmak gerekir. Bu durum Şekil 7-4’te gösterilmiştir. (7-17) eşitliğinin sağlanmasında λ 2 daima pozitiftir. Böylece integrasyon bölgesinin 0’dan ( λ1 + τ )‘ya ve ( λ1 + τ )’dan sonsuza kadar uzanacağı açıktır. Bu durumda (7-17) eşitliği aşağıdaki gibi yazılabilir. ŞEKİL 7-4 (7-17)’de Kullanılan Özilişki Fonksiyonu ∞ λ1 +τ 0 0 RY (τ ) = ∫ dλ1 ∫ R (λ X ∞ ∞ 0 λ 1+τ + ∫ dλ1 2 − λ1 − τ )h(λ1 )h(λ 2 )dλ 2 ∫ R (λ X 2 − λ1 − τ )h(λ1 )h(λ 2 )dλ 2 ∞ ( ) = b 2 β .S 0 / 2 ∫ e −(b + β )λ1 0 ( ∫e − bτ e −(b− β )λ2 dλ 2 0 ∞ ) + b β .S 0 / 2 ∫ e 2 λ 1+τ − (b − β )λ1 0 ∞ ∫e λ τ βτ e −(b + β )λ2 dλ 2 (7-23) 1+ [ ∞ ] [ ] = b 2 β .S 0 / − 2(b − β ) e − βτ ∫ e −(b+ β )λ e −(b − β )(λ1+τ ) − 1 .dλ1 0 [ [ ∞ ] ∫e − b β .S 0 / − 2(b + β ) e 2 βτ − b (b − β )λ 1 [e ( − b + β )(λ 1+τ ) ].dλ 1 0 ] = b 2 β .S 0 / 2(b − β ) ((− e −b.τ / 2b ) + (e − βτ / b + β )) [ ] )](e + b 2 β .S 0 / 2(b + β ) (e −bτ / 2b ) [ = b 2 β .S 0 / 2(b 2 − β 2 − βτ − (β / b )e −bτ ) 223 τ >0 Simetri özelliğinden τ < 0 için doğrudan yazılarak, [ )]( ( RY (τ ) = b 2 β .S 0 / 2 b 2 − β 2 e −β τ − β / be −b τ ) (7-24) Bu sonucu daha önce beyaz gürültü girişi için bulduğumuz sonuçla kıyaslamak üzere β ’nın sonsuza gitmesi durumu için limit aramakla sonuçlandırabiliriz. lim RY (τ ) = [b.S 0 / 2]e −b τ (7-25) β →∞ Bu da (7-21) eşitliğinin aynıdır. β , b’ye oranla büyük olduğundan sonlu kalmaktadır. Bu rasgele girişin band genişliğinin, sistem band genişliğine göre geniş olması durumuna karşı gelir. Bu kıyaslamayı yapmak üzere (7-24) eşitliği şu biçimde yazılarak, RY (τ ) = [b.S 0 / 2]e −b τ [1 / 1 − [(b )/ β ]][1 − (b / β )e ( 2 2 − β −b ) τ ] (7-26) bulunur. Bu ifadedeki ilk çarpan giriş beyaz gürültü iken çıkışın özilişkisidir. İkinci çarpan beyaz gürültü yaklaşımının, gerçek özilişki fonksiyonu ile farkı göstermektedir. β >>b olması durumunda bu çarpanların bire yaklaşacağı açıktır. Uygulamada pek çok durum için, girişte gürültü band genişliği, sistem band genişliğinden çok fazladır. Bu durumda da beyaz gürültü yaklaşımını kullanmak mümkündür. Örnek olarak, yüksek güçlü, vakum tüplü bir kuvvetlendirici düşünülsün ve band genişliği 10 MHz olsun. İlk aşamada karşılaşılan en önemli gürültü kaynağı shot noise’dir. Bunun band genişliği 1000 MHz’dir. Böylece (7-26) eşitliğindeki b/ β çarpanı, 0,01 ve beyaz gürültü yaklaşımının kullanılması ile oluşacak hatanın %1’inden büyük olmayacaktır. ALIŞTIRMA 7-4 Spektral yoğunluğu 6 (volt)2/Hz olan beyaz gürültü bir sistemin girişine uygulanmaktadır. h(t) = 1 - t =0 0 ≤ t ≤1 dışında olduğuna göre, (a) τ = 0 için, (b) τ = 1/2 için, (c) τ =1 için sistem çıkışında özilişki fonksiyonunu bulunuz. Cevap: 0,5 / 8,2 224 7-5 GİRİŞ VE ÇIKIŞ ARASINDA ÇAPRAZ İLİŞKİ Rasgele işlemenin bir örnek fonksiyonu lineer bir sistemin girişine uygulandığında, çıkışla giriş arasında bir bağ kurulmalıdır. Buna çapraz ilişki adı verilir. Çapraz ilişki, herhangi bir lineer sistemin impuls cevabının bulunmasında pratik bir yarar sağlandığından önemlidir. Giriş-çıkış için bir çapraz ilişki şöyle tanımlanmaktadır. R XY (τ ) = E [X (t )Y (t + τ )] (7-27) ve ∞ R XY (τ ) = E X (t )∫ X (t + τ − λ )h(λ )dλ (7-28) 0 X(t), λ ’nın fonksiyonu olmadığından, integral içinde beklendik değer alınabilir. ∞ R XY (τ ) = ∫ E[ X (t ) X (t + τ − λ )]h(λ )dλ (7-29) 0 ∞ = ∫ R X (τ − λ )h(λ )dλ 0 Yani çapraz ilişki fonksiyonu, sistemin impuls cevabı ile giriş işaretinin özilişki fonksiyonunun çarpımının integralidir. Diğer çapraz ilişki fonksiyonu ise, ∞ RYX (τ ) = E[ X (t + τ )Y (t )] = E X (t + τ )∫ X (t − λ )h(λ )dλ 0 ∞ = ∫ E [X (t + τ ) X (t − λ )]h(λ )dλ (7-30) 0 ∞ = ∫ R x (τ + λ )h(λ )dλ 0 (7-30) eşitliğindeki özilişki fonksiyonu λ = −τ için simetrik ve impuls cevabı ( ) ∫ () ’nın negatif değerleri için sıfır olduğundan, F (ω) = ∫x(t)e dt çapraz ilişkisi R XY (τ ) ’dan farklı olacaktır. Ancak τ = 0 için aynı değerlere sahip olabilirler. Yukarıdaki sonuçlar girişin beyaz gürültü olması varsayımı ile oldukça basitleşir. Bu durumda, ∞ ∞ −jωt FXω=XTte−ωtdt X −∞ −∞ R X (τ ) = S 0δ (τ ) ve ∞ R XY (τ ) = ∫ S 0δ (τ − λ )h(λ )dλ = S 0 h(τ ) τ ≥0 0 =0 τ <0 225 Benzer şekilde (7-31) ∞ RYX (τ ) = ∫ S 0δ (τ + λ )h(λ ) τ >0 0 = S 0 h(− τ ) (7-32) τ ≤0 (7-31) eşitliği ile elde edilen sonuç sistemin impuls cevabını bulmak üzere yeni bir yol gösterir. Şekil 7-5’teki blok diyagramı dikkate alınırsa, ŞEKİL 7-5 Bir Lineer Sistemin İmpuls Cevabını Ölçme Yöntemi X(t) band genişliği, sistem band genişliğinden büyük olan rasgele işlemenin bir örnek fonksiyonudur. Uygulamada bu oranın 1/10 olması uygun sonuçlar vermektedir. Burada girişin beyaz gürültü olduğu varsayılacaktır. Bu giriş bir devrede τ kadar geciktirilmiştir. Bu zaman gecikmesi doğal olarak (iletişim hattı uzunluğu, bir teypte kaydet ve oku konumları arasındaki zaman farkı gibi) sağlanabilir. Çarpıcı devre ile Y(t) ve X(t- τ ) çarpılarak Z(t) elde edilir ve bir alçak geçiren filtreden geçirilir. Filtrenin band genişliği yeterince küçükse çıkış Z(t)’nin dc bileşeni ve buna ekli küçük bir rasgele bileşenden oluşacaktır. Girişin ergodik işleme olması halinde Z(t) de ergodik olur ve Z(t)’nin dc bileşeni (zaman ortalaması) beklendik değeri ile aynı olacaktır. Böylece, < Z (t ) >≅ E[Z (t )] = E[Y (t )X (t − τ )] = R XY (τ ) (7-33) durağan durum için, E [Y (t )X (t − τ )] = E [X (t )Y (t + τ )] = R XY (τ ) 226 (7-34) olur. (7-31) eşitliğinden, < Z (t ) >≅ S 0 h(τ ) ≅0 τ ≥0 τ <0 Sonuç olarak alçak geçiren filtre çıkışındaki dc bileşen, impuls cevabının, gecikme olarak tanımlanan, τ için aldığı değerle orantılıdır. Eğer τ değiştirilebilirse sistemin tüm impuls cevabı ölçülmüş olacaktır. İlk bakışta bu yöntemle impuls cevabının ölçülmesi basit bir problemin zor yolla çözülmesi gibi düşünülebilir. Örneğin bir darbe işareti uygulanıp çıkış gözlense daha kolay bulunabilirdi denebilir. Ancak, bu doğrudan işlemin yapılamamasının iki nedeni vardır. İlki, gözlenebilecek düzeyde bir çıkış oluşturmak üzere yeterince geniş bir darbe düzeni onun çalışma bölgesinin dışında lineer olmayan bir bölgeye sokabilir. İkincisi ise sistem normal çalışmasını sürdürürken sürekli olarak impuls cevabının gözlenmesi gerekebilir. Bir darbenin tekrarlanarak girişe uygulanması bu normal işlemi etkileyecektir. Kullanılan çapraz ilişki yönteminde, rasgele giriş işareti, normal çalışma için ihmal edilebilecek kadar küçük tutulabilir. Otomatik kontrol sistemleri, kimyasal proses kontrolü, uçuş sırasında uçak gövdesinin karakteristiğinin ölçümü gibi bazı mühendislik problemlerinin çözümünde bu yöntem başarı ile kullanılmıştır. Daha güncel ve etkileyici bir uygulama da nükleer reaktörün kararsızlığa ne kadar yakın olduğunun, impuls cevabının gözlenmesi ile sağlandığıdır. Bu yöntem büyük bir alanda yer sarsıntıları ve rüzgarlara karşı dinamik cevabın bulunmasında kullanılır. 7-6 ZAMAN DOMENİNDE SİSTEM ANALİZİ ÖRNEKLERİ Rasgele giriş işareti için özilişki fonksiyonunun üstel biçimde olmasına karşı düşen basit bir RC devresi 7-4 paragrafında incelenmişti. Gerçekte, konumuzla ilgili sistemler ve girişler için bir sonraki paragrafta değinilecek, frekans domeni yöntemleri çoğu kez çözümde çok kullanışlı ve yararlı olmaktadır. Fakat, zaman domeninde analizin kolay olduğu bazı durumları incelemek yararlı olabilir. Bu da sistemin impuls cevabı ve işaretin özilişki fonksiyonunun sınırlı zaman aralığı için basit olmasından kaynaklanmaktadır. Örnek olarak seçilen sistem, impuls cevabı Şekil 7-6(a) ve girişin özilişki fonksiyonu Şekil 7-6(b)’de görülen sınırlı zaman integratörüdür. 227 ŞEKİL 7-6 (a) Sınırlı Zaman İntegratörünün, İmpuls Cevabı (b) Girişin Özilişki Fonksiyonu Şekil 7-6(b)’de görülen özilişki fonksiyonu, örneğin 5-2 paragrafında değinilen ikili (binary) işlemeden gelmiş olabilir. Tanımlanan bu özel durum için integratör çıkışı, girişin beklendik değeri sıfır olduğundan, sıfır beklendik değerli olacaktır. Genel olarak çıkışın beklendik değeri (7-7) eşitliği uyarınca, T Y = X ∫ (1 / T )dt = X (7-35) 0 yazılabilir. Giriş işlemesinin beyaz gürültü olmadığı durumlarda, (710) eşitliği karesel ortalama değeri hesaplamada kullanılabilir. Böylece T Y 2 = ∫ dλ 0 T ∫ R (λ X − λ1 )[1 / T ] dλ 2 2 2 (7-36) 0 elde edilir. Bu integralin hesaplanmasında, Şekil 7-7’den yararlanmak mümkündür. Burada E{Y2} bu şeklin hacmine eşit olmaktadır. ŞEKİL 7-7 (7-36) eşitliğindeki integrasyonun açıklama yöntemi 228 Bu hacim, tabanları ortak ve yükseklikleri T/2’ye eşit iki piramitin hacimleri toplamıdır. Buna göre toplam hacim, ( Y 2 = 2(1 / 3) A 2 / T 2 )( )( ) 2T T / 2 = (2 / 3)A 2 (7-37) aynı sonuç (7-17) eşitliği kullanılarak çıkışın özilişki fonksiyonunu bulmak sureti ile de hesaplanır. T T RY (τ ) = ∫ dτ 1 ∫ R X (λ 2 − λ 2 − τ )(1 / T ) dλ 2 2 0 (7-38) 0 Bu çalışma okuyucuya bırakılmıştır. Bu özilişki fonksiyonuna ait durum Şekil 7-8’de görülmektedir. -2T -T 0 T 2T ŞEKİL 7-8 Sınırlı Zaman İntegratörünün Çıkışının Özilişki Fonksiyonu Giriş rasgele işlemesinin beyaz gürültü olması halinde bu sonuç basitleşecektir. (7-12) eşitliği kullanılmak suretiyle, T Y 2 = S 0 ∫ (1 / T ) dλ = S 0 / T 2 (7-39) 0 bulunur. Burada S0, girişin beyaz gürültü olması halinde spektral yoğunluğu göstermektedir ve (7-18) eşitliği kullanılarak çıkışın özilişki fonksiyonu Şekil 7-9’da görülmektedir. ŞEKiL 7-9 Beyaz Gürültü Girişine Karşı Çıkışın Özilişki Fonksiyonu 229 İkinci örnek, (7-14) eşitliği sonucundan yararlanarak, geniş bir gürültünün mevcut olması durumunda, küçük bir dc gerilimin iyi bir ölçümünü yapmak üzere filtre özelliklerini belirlemek olacaktır. Bu duruma, aralarında ilişkinin zayıf olduğu iki işaret arasında, çapraz ilişkiyi ölçmeyi gerektiren sistemlerde raslanır. Şekil 7-2’deki RC devresi giriş işaretinin aşağıdaki gibi olduğu varsayılırsa, X(t) = A + N(t) burada N(t) gürültüsünün özilişki fonksiyonu, R N (τ ) = 10.e olsun, A nın 1’ler mertebesinde olması durumunda, %1 effektif hata ile A’nın ölçülmesi istenmektedir. Bu doğruluğa yaklaşan RC devresinin zaman sabitinin hesaplanması gerekir. (7-24) eşitliğinden yararlanarak sonuca varılabilir. Bu oldukça karmaşık bir yaklaşımdır. Eğer filtre çıkışındaki gürültü değişimi giriştekine oranla çok küçükse, filtre band genişliği giriş gürültüsüne göre çok küçüktür. Bu koşullarda giriş için beyaz gürültü yaklaşımı çok uygundur. Bu yaklaşımdaki ilk adım, ω = 0 civarında gürültünün spektral yoğunluğunun bulunmasıdır. (6-39) eşitliği spektral yoğunluğun özilişki ile aşağıdaki şekilde bağlantılı olduğunu göstermiştir. −1000 τ ∞ S N (ω ) = ∫ R N (τ )e − jωτ dτ 0 ω = 0 için bu ifade, S N (0 ) = ∞ ∞ ∫ R (τ )dτ = 2∫ R (τ )dτ N N (7-40) 0 −∞ O halde bu, özilişkinin ifadesine bağlı değildir. SN = SN(0) olduğu görülmektedir. ∞ S N = 2(10) ∫ e −1000τ dτ = 20 / 1000 = 0,02 0 (7-14) eşitliğinden yararlanarak, filtre çıkışının ortalama değeri N0(t), N 02 = bS N / 2 = b(0,02) / 2 = 0,01b olacaktır. %1’lik istenen doğruluk değerine ulaşabilmek için, N 02 ≤ (0,01)(1,0) 230 A = 1,0 için filtre kazancı birim'e eşittir. N 02 = 0,01b ≤ 10 −4 O halde, b ≤ 10 −2 olduğundan b = 1/RC, ve RC ≥ 102 olmalıdır. 7-7 FREKANS DOMENİNDE ANALİZ Lineer sistemlerin frekans domeninde tanımlanmalarında H( ω ) sistem fonksiyonu ve H(s) transfer fonksiyonu kullanılır. Bilindiği gibi bunlar, sistemin impuls cevabının sırasıyla Fourier ve Laplace dönüşümleridir. Sistemin girişi x(t) ve çıkışı da y(t) ise bu değerlerin Fourier dönüşümleri arasında, Y( ω )= X ( ω ) H ( ω ) (7-41) bağıntısı vardır. Laplace dönüşümü için, Y(s) = X(s) H(s) (7-42) yazılabilir. Bu iki biçim de X(t)’nin durağan bir rasgele işlemeye ait bir örnek fonksiyon olması durumu için uygun değildir. 6-1 paragrafında değinildiği gibi bu tür bir örnek fonksiyonun Fourier dönüşümü genel olarak bulunamaz. (7-42) eşitliği için ise t >0 için tanımlanabilir. O halde bu tip bir örnek fonksiyon, durağan işleme için sözkonusu olamaz. Bu sorunun çözümü için spektral yoğunluğun kullanılması gerekir. 6-6 paragrafından yararlanarak durağan işlemenin spektral yoğunluğu işlemenin özilişki fonksiyonunun Fourier dönüşümüdür. Özilişki fonksiyonu lineer ve zamanla değişmez sistemler için bulunmuştu. O halde spektral yoğunluk dönüşümle sağlanacaktır. 7-8 SiSTEM ÇIKIŞINDA SPEKTRAL YOĞUNLUK Bir işlemenin spektral yoğunluğu, işlemenin ortalama gücünün frekansa bağlı olarak nasıl dağılım gösterdiğinin bir ölçüsüdür. Spektral yoğunlukta değişik frekanslı bileşenlerin fazları hakkında bir bilgi bulunmaz. Spektral yoğunlukla özilişki arasındaki bağlantı şöyle açıklanır. 231 S x (ω ) = {R X (τ )} (7-43) Bu eşitlikle, (7-17) eşitliği kullanılarak, RY( τ ) ve R( τ ) arasında h(t)’ye bağlı bir ifade yazılabilir. ∞ ∞ 0 0 RY (τ ) = ∫ dλ1 ∫ R X (λ 2 − λ1 − τ )h(λ1 )h(λ 2 )dλ 2 S Y (ω ) = {RY (τ )} ∞ ∞ − jωτ d λ ∫−∞ ∫0 1 ∫0 R X (λ2 − λ1 − τ )h(λ1 )h(λ1 )h(λ2 )dλ2 e dτ İntegralin sırası değiştirilerek, ∞ = ∞ ∞ ∞ 0 0 −∞ ∞ ∞ 0 0 S Y (ω ) = ∫ dλ1 ∫ h(λ1 )h(λ 2 )dλ 2 ∫ R X (λ 2 − λ1 − τ )e − jωτ dτ = ∫ dλ1 ∫ h(λ1 )h(λ 2 ).S X (ω )e − jω (λ2 −λ1 ) dλ 2 ∞ = S X (ω )∫ h(λ1 )e ∞ jωλ1 dλ 1 ∫ h(λ 2 )e − jωλ 2 dλ 2 0 (7-44) 0 = S X (ω )H (− ω )H (ω ) = S X (ω ) H (ω ) 2 Sonuçta, RX(- τ ) = RX(s) kabul edilmiştir. (7-44) eşitliğinden görüldüğü gibi çıkışın spektral yoğunluğu, girişin spektral yoğunluğuna bağlıdır. Bu sonuç kompleks frekans için de sağlanır. SY(s) = SX(s) H(s) H(-s) (7-45) H(s), H( ω )’da s=j ω koymak suretiyle olduğu gibi, SY(s) ve SX(s) de SY( ω ) ve SX( ω )’da -s2 = ω 2 konularak elde edilir. (7-45) eşitliğinden, H(s)’in giriş ve çıkışın dönüşümleri arasındaki bağıntının varlığı, H(s)H(-s)’in giriş ve çıkışın spektral yoğunlukları arasındaki bağıntıya tamamen benzedikleri görülecektir. Bu benzerlik, sistemin rasyonel transfer fonksiyonuna sahip olması durumunda, girişin örnek fonksiyonunun durağan rasgele işlemeye ait olması halinde mükemmel uygunlukla frekans domeni yöntemlerinin kullanılmasını uygun kılar. Bu durum durağan olmayan rasgele işlemelere her zaman uygun düşmez. Sisteme ait spektral yoğunluk elde edildiğine göre, çıkışın karesel beklendik değeri kolayca yazılabilir. 232 j∞ Y = (1 / 2π . j ) ∫ H ( s ) H (− s ) S X ( s )ds 2 (7-46) − j∞ Şimdi bunu bir örnek üzerinde gösterelim ve Şekil 7-10’daki devreyi, girişinde spektral yoğunluğu S0 olan bir beyaz gürültü ile ele alalım. ŞEKİL 7-10: Basit Bir RC Devresi Çıkışın spektral yoğunluğu, S Y ( s ) = (b /( s + b)).(b /(− s + b)).S 0 = −b 2 s 0 /( s 2 − b 2 ) (7-47) olur. Çıkışın karesel beklendik değerini bulmak üzere, 6-5 paragrafındaki Tablo 6-1’den I1 integralini kullanmak mümkündür. Bu nedenle (7-47) eşitliği aşağıdaki şekilde yazılmalıdır. S Y ( s ) = (b S 0 )(b S 0 ) /( s + b)(− s + b) Burada n= 1 olduğu açıkça görülmektedir. c( s ) = b S 0 = c 0 d ( s) = s + b d0 = b d1 = 1 ve Y 2 = I 1 = c02 / 2d 0 d 1 = b 2 S 0 / 2b = bS 0 / 2 233 (7-48) Biraz daha karmaşık bir örnek olarak, giriş spektral yoğunluğu, S X ( s ) = − β 2 S 0 /( s 2 − β 2 ) (7-49) olan bir işaret ele alındığında, bu spektral yoğunluk 7-4 paragrafında kullanılan özilişki fonksiyonuna uygun seçilmiştir, bu nedenle de ω =0 civarında değeri S0’dır. Bu kez RC devre çıkışında spektral yoğunluk, S Y ( s ) = (b /( s + b)).(b /(− s + b)).(− β 2 S 0 /( s 2 − β 2 )) 2 2 2 2 2 (7-50) 2 = b β S 0 /( s − b )( s − β ) olur. Gene Tablo 6-1’deki I2 integrali kullanılarak, çıkışın karesel beklendik değeri hesaplanabilir. Böylece, S Y ( s ) = c ( s )c ( − s ) / d ( s ) d ( − s ) [ ][ ] = (bβ S 0 )(bβ S 0 ) / s 2 + (b + β ) s + bβ s 2 − (b + β ) s + bβ (7-51) c 0 = bβ S 0 c1 = 0 d0 = d β d1 = b+ β d2 = 1 Buradan Y 2 = I 2 = c02 d 2 + c12 d 0 / 2d 0 d1 d 2 = b 2 β 2 S 0 / 2bβ (b + β ) = bβ .S 0 / 2(b + β ) (7-52) bulunur. Giriş rasgele işlemesinin band genişliğinin sistem band genişliğine göre geniş olduğu durumlarda sonucu yeniden incelemek yararlı olur. (7-50) eşitliği için β >> b olduğunda, S Y ( s ) = −b 2 S 0 /( s 2 − b 2 )(1 − s 2 / β 2 ) (7-53) (7-47) eşitliği ile verildiği gibi beyaz gürültü girişi için, β büyük ise (7-52) eşitliği, Y 2 = bS 0 / 2(1 + b / β ) (7-54) şeklinde yazılabilir. 234 Örneklerin değerlendirilmesiyle, sistemin transfer fonksiyonu ve spektral yoğunluk fonksiyonu rasyonel olduğunda, frekans domeni yöntemlerinin daha basit olduğu görülecektir. Sistemin daha karmaşık olması halinde bile bu yöntemin büyük avantajları vardır. Girişin spektral yoğunluğu veya sistemin transfer fonksiyonu rasyonel değilse, bunlar geçerli olmayabilir. ALIŞTIRMA 7-8 Şekil 7-10 ‘daki RC devresinin girişine, spektral yoğunluğu 1,0 (volt)2/Hz ve ban dgenişliği 50 Hz ile sınırlı beyaz gürültü uygulansa b = 100 π için çıkışın karesel beklendik değerini bulunuz. Cevap: 25 π 7-9 GİRİŞ YOĞUNLUK VE ÇIKIŞ ARASINDA ÇAPRAZ SPEKTRAL Giriş ve çıkış arasındaki çapraz spektral yoğunluk pek kullanılmaz. Bu nedenle işlem akışı yerine yalnızca sonuçlar verilecektir. S XY ( s ) = H ( s ) S X ( s ) (7-55) S YX ( s ) = H (− s ) S X ( s ) (7-56) ve 7-10 FREKANS DOMENİ ÖRNEKLERİ Frekans domeni yöntemleri, rasyonel spektral yoğunluğa sahip rasgele işleme ve gerçeklenebilir filtreler ile birlikte kullanıldığında son derece kullanışlıdır. Ancak filtre karakteristiklerini ideal varsaymak ve giriş işlemesini beyaz gürültü olmak suretiyle, fazla bir hata yapmaksızın, hesaplamaları basite indirgemek mümkündür. Bunu yapmada çok önemli bir kavramın eşdeğer gürültü band genişliği olduğu hatırlanmalıdır. Bir sistemin eşdeğer gürültü band genişliği B, sistem girişi beyaz gürültü olduğunda, çıkışın karesel beklendik değeri, gerçek karesel beklendik değerle aynı ve maksimum kazancı aynı olan ideal bir filtrenin band genişliği olarak tanımlanır. Bu kavram Şekil 7-11’de hem alçak geçiren ve hem de band geçiren durumlar için gösterilmiştir. Aynı beyaz gürültü girişlerine aynı karesel beklendik değeri üreten gerçek sistemin transfer fonksiyonunun karesi altında kalan alanın dikdörtgen şekilli transfer fonksiyonunun karesinin altında kalan alanla aynı olması gerektiği açıktır. 235 ŞEKİL 7-11 Sistemin Eşdeğer Gürültü Band genişliği: (a) Alçak Geçiren Sistem (b) Band Geçiren Sistem Alçak geçirme durumunda, eşdeğer gürültü band genişliği, [ B = 1 / 4π H (0) 2 ∞ ]∫ H (ω ) 2 dω −∞ [ = 1 / 4π . j H (0) 2 j∞ ] ∫ H (s)H (−s)ds Hz (7-57) − j∞ Eğer sistem girişi S0 spektral yoğunluklu beyaz gürültü ise çıkışın karesel beklendik değeri, 2 Y 2 = 2 S 0 B H ( 0) (7-58) olarak bulunur. Band geçiren durum için |H(0)|2 yerine (7-57) ve (7-58) eşitliklerinde |H( ω 0 ) |2 yazılmalıdır. Eşdeğer gürültü band genişliğini hesaplamaya bir örnek olarak Şekil 7-10’daki RC devresi ele alınsın. Y 2 = bS0/2 = 2S0B|H(0)|2 2 |H(0)| =1 olduğundan, B = b/4 = 1/4RC (7-59) olacaktır. Eşdeğer band genişliğinin tanımlanması ile sistem çok karmaşık olsa bile gürültü cevabını yalnızca B ve |H( ω 0 )| ile açıklamak mümkündür. Bu değerler sistem için ölçülebilir. Örneğin bir haberleşme sisteminde alıcının akord edildiği frekansta gerilim kazancının 106’ya ve eşdeğer gürültü band genişliğinin de 10 kHz’e eşit olduğu varsayıldığında, alıcı girişindeki vuru gürültüsü ve termal gürültüden meydana gelecek toplam gürültünün band genişliği bir kaç yüz MHz mertebesindedir ve beyaz gürültü olarak kabul edilebilir. 236 Gürültünün spektral yoğunluğu 2x10-20 (volt)2/Hz olsun (bu değer yüksek kalitede alıcılar için geçerlidir), çıkışta işaret gücü ve güç gücü oranının 100 olması için girişin effektif değeri ne olacaktır? Bu sorunun yanıtı için alıcının her katının analizine geçilirse çok güç olacaktır. Ancak eşdeğer gürültü band genişliğini kullanmak kolaydır. 2 2 (S/N)0 = H (ω 0 ) X 2 / 2 N 0 B H (ω 0 ) = X 2 / 2 N 0 B (7-60) Burada, N0 giriş gürültüsünün spektral yoğunluğudur. X 2 = 2 N 0 B(100) = 2(2 x10 − 20 )(10 4 )(100) = 4 x10 −14 ve buradan, X 2 = 2 x10 −7 V olarak bulunur. Görüleceği gibi alıcının kazancı tanımlanmış olduğu halde kullanılmamıştır, (gerek duyulmamıştır). Eşdeğer gürültü band genişligi, giriş işlemesinin beyaz gürültü olması durumu için kullanılmalıdır. Diğer hallerde kullanılması hatalı olur. Bu konuya ilişkin son bir örnek olmak üzere Şekil 7-12’de görülen geri beslemeli bir sistem ele alınacaktır. ŞEKİL 7-12 Bir Otomatik Kontrol Sistemi Radar antenini yönlendirme sisteminde x(t) giriş kontrol açısı (hedef tam belli olmadığından rasgele varsayılan), y(t) de girişe cevap olarak alınan açısal yöndür. 237 n(t), rüzgarın açısal yön üzerindeki sapmalara neden olan etkisini simgeler. Geri besleme çevrimindeki motor ve amplifikatörün transfer fonksiyonu, H(s) = A/s(s+1) olup, transfer fonksiyonu n(t) = 0 için, X(s) = l[x(t )]Y ( s ) = l[ y (t )] ve Y(s)=H(s)[X(s)-Y(s)] ile hesaplanır. Amplifikatör girişi, giriş kontrol işareti ile çıkış işareti arasındaki fark olduğundan, Hc(s) = Y(s)/X(s) = H(s)/(1 + H(s)) = A / (s2 + s+A) (7-61) Giriş kontrol işaretinin spektral yoğunluğu rasgele işlemenin bir örnek fonksiyonu olup, SX(s)= -2 / (s2-1) ‘dır. O halde çıkışın spektral yoğunluğu, SY(s) = Sx(s)Hc(s)Hc(-s) = -2A2/(s2-1)(s2 + s+A)(s2-s+A) ve çıkışın karesel beklendik değeri, j∞ [ Y 2 = 2 A 2 / 2π . j ] ∫ ds /[s 3 (7-62) ][ ] + 2 s 2 + ( A + 1) s + A − s 3 + 2 s 2 − ( A + 1) s + A − j∞ Burada, =2A2I3 c0=1, d0=A, c1=0, d1=A+1, c2=0, d2=2, d3=1 ve Tablo 6-1 kullanılarak, Y 2 = 2A/(A+2) (7-63) elde edilir. N(s) = l [n(t)] M(s) = l [m(t)] ile ilgili transfer fonksiyonu (7-61) eşitliğinde görüldüğü gibidir. Bozucu etki sisteme farklı noktalardan girmektedir. 238 M(s) = N(s) - H(s) M(s) ‘dir. Hn(s) = M(s)/N(s) = 1/(1+H(s)) = s(s+1)/(s2 + s+A) (7-64) Girişen gürültüye ait spektral yoğunluk S N ( s ) = δ (s ) − 1 / (s 2 − 0,25) [ ] olsaydı, bu rasgele değişim ortalama değeri girişteki bozulmaya karşı düşen bir durum gösterir ve çıkışın bozulmuş spektral yoğunluğu, SM(S) = SN(s)Hn(s)Hn(-s) = [ δ (s)-1/(s2 - 0.25)] [s2(s2-1)/(s2 + s+A)(s2-s+A)] (7-65) Çıkıştaki bozulmadan kaynaklanan karesel beklendik değer, j∞ [ ][ ] M = (1 / 2π . j ) ∫ δ ( s ) − (1 /( s 2 − 0,25)) s 2 ( s 2 − 1) /( s 2 + s + A)( s 2 − s + A) ds 2 − j∞ olur, s = 0 için integral sıfır olacağından δ (s)’in integralinin karesel beklendik değere bir etkisi olmaz. Kalan terimler, j∞ [ ] M 2 = (1 / 2π . j ) ∫ s ( s + 1)(− s )(− s + 1) / s 2 + 1,5s 2 + ( A + 0,5) s + 0,5 A − j∞ [− s 3 ] + 1,5s 2 − ( A + 0,5) s + 0,5 A ds = I3 Tablo 6-1 için gereken sabitler c0 = 0 c1=1 c2 = 1 d0 = 0,5A d1 = (A+0,5) d2 = 1,5 ve karesel beklendik değer, M 2 = (A + 1,5)/(2A + 1,5) olur. d3 = 1 (7-66) (7-63) ve (7-66) eşitliklerinden görüldüğü gibi işaretin karesel ortalama değeri, kazanç arttıkça büyürken, gürültünün bu değeri küçülmektedir. Çıkışta işaret-gürültü oranının önemli olduğu durumlarda kazancın büyük olması istenir. Uygulamada ise sistemin hızlı değişimlerine karşı, dinamik cevabın önemi nedeniyle kazanç sınırlanmaktadır. 239 ALIŞTIRMA 7-10 Şekil 7-10’daki RC devresinde eşdeğer gürültü band genişliği B ile yarı güçteki band genişliği B(1/2) = b/2 π Hz arasındaki bağıntıyı bulunuz. Cevap: B = ( π /2)B(1/2) 240 PROBLEMLER 7-1 abc- Spektral yoğunluğu S0 V 2/Hz olan bir beyaz gürültü işlemesi, şekilde görülen devreye uygulanmaktadır. Devrenin impuls cevabını Devrenin dc kazancını bulunuz. Çıkışın karesel beklendik değerini bulunuz. bulunuz. 7-2 Bir sonlu zaman integratörü, şekilde görülen blok diyagramı ile temsil edilebilir. a- Sistemin impuls cevabını bulunuz. b- Sistemin dc kazancını bulunuz. c- Bu sistem kararlı mıdır? d- Eğer spektral yoğunluğu S V2/Hz olan bir beyaz gürültü girişe uygulandığında, zaman domeni yöntemlerini kullanarak çıkışın karesel beklendik değerini bulunuz. 7-3 Bir rasgele işlemeye ait örnek fonksiyon aşağıdaki gerilim ifadesi ile verilmiştir. X(t) = X0 + cos (2 π t + 9) Burada, X0, 0 ile 1 arasında uniform dağılımlı, θ , X0’dan bağımsız ve 0 ile 2 π arasında uniform dağılımlı raslantı değişkenleridir. Bu işleme Problem 7-2’deki sonlu zaman integratörüne uygulandığında, çıkışın beklendik değer ve değişintisini bulunuz. 7-4 Spektral yoğunluğu S0 V2/Hz olan beyaz gürültü şekilde görülen devreye uygulanmaktadır. 241 Zaman domeni yöntemlerini kullanarak çıkışın özilişki fonksiyonunu bulunuz. 7-5 Giriş işaretinin özilişki fonksiyonunun, −β τ R X (τ ) = ( β .S 0 / 2)e olması durumu için Problem 7-4’ü tekrarlayınız. 7-6 Problem 7-3’te açıklanan rasgele işleme şekilde görülen devreye uygulanmaktadır. Çıkışın özilişki fonksiyonunu bulunuz. 7-7 Problem 7-4’deki sistem ve beyaz gürültü girişi için giriş ve çıkış arasındaki her iki çapraz ilişki fonksiyonunu bulunuz. 7-8.1 Problem 7-4’deki sistem ve Problem 7-5’deki giriş için giriş ve çıkış arasındaki her iki çapraz ilişki fonksiyonunu bulunuz. 7-9 Spektral yoğunluğu S0 V2/Hz olan X(t) durağan beyaz gürültü işlemesi şekilde görülen devreye uygulanmaktadır. Zaman domeni yöntemlerini kullanarak, bütün τ değerleri için RYZ ( τ ), çapraz ilişki fonksiyonunu bulunuz. 242 7-10 Bir rasgele işlemenin örnek fonksiyonu, X(t) = A + N(t) şeklindedir. Burada A işaretin sabit genliği ve N(t) de özilişki fonksiyonu, −τ R N (τ ) = e olan rasgele gürültüdür. X(t), alçak geçiren bir RC filtresinden geçirilmek suretiyle işaret gürültüden ayrılmak istenmektedir. İşaret gürültü güç oranı, 2 2 [S/N]0 = (Y ) /(Y 2 − (Y ) ) olarak tanımlandığına göre, burada Y(t) alçak geçiren filtre çıkışıdır. A’nın gerçek değeri 0,1 V olduğu zaman 30 dB’lik işaret-gürültü oranını sağlayacak filtrenin zaman sabitini bulunuz. 7-11 Problem 7-1’i frekans domeni yöntemleriyle çözünüz. 7-12 Problem 7-2(d)’yi frekans domeni yöntemleriyle çözünüz. 7-13 Problem 7-4’de çıkışın spektral yoğunluğu ve özilişki fonksiyonunu frekans domeni yöntemleriyle bulunuz. 7-14 Bir akordlu amplifikatörün maksimum kazancı 30 MHz’de 30 dB’dir. Cevap eğrisi, paralel RLC devresi şekline eşdeğerdir. Bir beyaz gürültü kaynağı amplifikatör girişine uygulanıyor ve çıkışın effektif değeri 10 V olarak ölçülüyor. Giriş işaretinin spektral yoğunluğunu bulunuz. 7-15 Merkez frekansı f0 ve bandgenişliği W olan ideal band geçiren filtre ile Spektral yoğunluğu N0 olan beyaz gürültü girişine sahip sistem çıkışının özilişki fonksiyonunu bularak çiziniz. 7-16 f0 taşıyıcı frekansında band sınırlı bir beyaz gürültü işareti gönderilmek suretiyle bir objeden yansıyan işaretin sınırının ölçülmesi düşünülmektedir. Alınan işaretle gönderilen işaret toplanarak bu toplamın spektral yoğunluğu ölçülecektir. Spektral yoğunluğun genliğinin peryodik oluşu bu sınır ile ilgilidir. 243 Şekilde görülen modelin kullanılması ve α 2’nin α yanında ihmal edilebileceği varsayılarak, bu yaklaşımın mümkün olup olmadığı araştırılmaktadır. Hangi etki bu sistem modelinde ölçmenin geçersizliğine neden olur? 7-17 Çoğu kez frekansın Gauss fonksiyonu olması halinde, filtre biçiminin Gauss yaklaşımının kullanışlı olduğu bilinmektedir. Maksimum birim kazanç ve W yarıgüç band genişlikli Gauss biçimli bir alçak geçiren filtrenin standard sapmasını hesaplayınız. Bu filtrenin yarıgüç band genişliği ve standard sapması cinsinden eşdeğer gürültü band genişliğini bulunuz. 7-18 Bir direncin ürettiği termal gürültü spektral yoğunluğu, 2kTR V2/Hz olan beyaz gürültüye oldukça yakındır. Burada, k= -23 1,37.10 Ws/°K olan Boltzmann katsayısı, T mutlak sıcaklık ve R de ohm olarak dirençtir. Bir amplifikatörde herhangi fiziksel bir direnç, bir kondansatörle paralel bağlı eşdeğer bir devre olarak değerlendirilir. a- Amplifikatör gürültü girişinin karesel beklendik değerini bulunuz ve R’den bağımsız olduğunu gösteriniz. b- Bu sonucu fiziksel olarak açıklayınız. c- Bu gücün ölçüldüğü bölgenin eşdeğer gürültü band genişliği olduğuna göre uyumlu yükle, dirençten alınabilecek maksimum gürültü gücünün kTB watt olduğunu gösteriniz. 244 7-19 Bir amplifikatörün girişinde, herhangi bir işaret daima gürültü ile bütünleşmiş biçimdedir. Teorik olarak olası minimum gürültü, rezistif elemanlardan kaynaklanan termal gürültüdür. (Problem 7-18). Genel olarak amplifikatörler işareti yükseltme işlemi sırasında ilave gürültü katacaklardır. İşaret amplifikatörden geçerken, işaretin işaret gürültü oranının bozulması ölçülecek gürültü miktarını kötü yönde etkiler. Bir amplifikatörün bu karakteristiklerini belirtmede genel bir yöntem "Gürültü Katsayısı" (Noise Figüre), F; F= Girisin isaret - gürültü gücü oranı Cikis isaret - gürültü gücü oranı oranı olarak tanımlanır. a- Yukarıdaki tanımı kullanarak, kaskad iki amplifikatör için toplam "gürültü katsayısı"nın F = F1 + (F2-1)/G1 olduğunu gösteriniz. (Burada, G1 ve G2 amplifikatörlerin güç kazançlarını ve F1 ile F2 de gürültü katsayılarını göstermektedir). b- Yarıgüç band genişliği 100 MHz ile tek bir zaman sabitli, 100 dB kazançlı, 13 dB gürültü katsayılı bir geniş band video amplifikatörün giriş ve çıkış empedansları 300 ohm’dur. Giriş işareti sıfır olduğunda çıkışta gürültü geriliminin effektif değerini hesaplayınız. c- 10 dB’lik işaret-gürültü güç oranını çıkışında veren, girişteki sinüs işaretinin genliğini bulunuz. KAYNAKLAR Bölüm 1’deki kaynaklara bakınız. Özellikle Davenport ve Root, Lanning ve Battin, Papoulis ve Thomas. 245 BÖLÜM 8 OPTİMUM LİNEER SİSTEMLER 8-1 GİRİŞ Daha önce, pratik sistemlerde arzu edilen çıkış işareti ile birlikte bazı istenmeyen rasgele gürültü işaretlerinin meydana geldiğine değinmiştik, istenmeyen bu rasgele gürültüler sistemin çıkışında daima mevcuttur ve istenen çıkıştan sapmalara neden olur. O halde sistemde bu gürültüden oluşacak sapmaları azaltarak sistemi iyileştirmeye yönelik bir çözüm aramak gerekmektedir. Genellikle, çıkıştaki gürültüyü minimuma indirgemek için sistemin impuls cevabı veya transfer fonksiyonu seçimi ile sağlanmaya çalışılır. İşte bu tür bir sisteme optimum sistem adı verilmektedir. Değişik tipte işaretlerle ve değişik türde bozulmalarla karşılaşılması halinde, optimum sistemlerle ilgili çalışmalar oldukça karmaşıklık gösterirler. Çünkü çok farklı durumlar ve tanımlar sözkonusudur. Gerçekte, bu konu ile ilgili literatür çok geniştir ve optimum sistemi oluşturmaya yarayan yöntemler çok geliştirilmiştir. Burada, yalnızca biraz terminoloji ile bazı temel kavramlar verilmeye çalışılmıştır. Optimum sistemlerle ilgili çalışmanın ilk aşamasında optimallikle neyin anlatılmak istendiği açıklanmıştır. Çok farklı optimumluk ölçütleri olduğundan bu yaklaşımlardan birini seçerken çok dikkatli olmak gerekmektedir. Bu seçim aşağıdaki incelemelerimizde ele alınacaktır. Ölçütün belirlenmesinden sonraki aşamada ise ele alınan sistemin yapısı incelenir. Bunların dışında daha pek çok seçenek vardır. Optimumluğu sağlama bunlar arasından seçilecek uygun yaklaşıma bağlıdır. Bununla ilgili açıklamalar 8-3 paragrafında verilmiştir. Öncelikle, optimum sistem belirlenmeli ve daha sonra sistem iyileştirmeye çalışılmalıdır. Bazı durumlarda iyileştirme, hemen ve açıklıkla görülebilir ve oldukça kolaydır. Ancak bazı durumlarda ise iyileştirme, optimum sistemi belirlemekten daha zordur. İyileştirme sorunu her durum için farklılıklar gösterdiğinden genel bir yol çizmek mümkün olmaz. 246 Güncel mühendislik problemlerinde son aşama ise yaklaşıklıkla ve ekonomik olarak sistemin yapılabileceğine karar verilmesidir. Gerçek optimum sistemi meydana getirmek çoğu kez mümkün değildir. Bu durumda anlamlı yaklaşım optimizasyon tekniklerinin değerlerinin araştırılmasıdır. Optimum sistem oluşturmaya yönelindiğinde bazen sonuçlan olumlu olmasa bile çoğu kez bu denemeler yararlı bilgiler ortaya koyarlar. Bunun nedeni optimumluk özelliklerinin herhangi gerçek bir sistemle kıyaslanabilir bir ölçüt oluşturmasıdır. Optimumluk arttırılmadığı sürece bu karşılaştırma, verilen sistemin geliştirilmesine gerek olup olmadığını veya mükemmel olduğunu ve daha iyi bir optimumluk için sağlanacak çabanın ekonomik olmayacağını açıkça belirtir. Gerçekte bu tür bir karşılaştırma, optimum sistemlerle çalışırken en büyük çabanın sarfedilmesini gerektirir. Burada çok nadir olarak gerçek mükemmelliğe ulaşılabilir. 8-2 OPTİMUMLUK ÖLÇÜTLERİ Seçilebilecek birçok farklı optimumluk ölçütleri olması nedeniyle, anlamlı bir ölçütün dayandırılabileceği bazı temelleri belirlemek gerekir. Öncelikle, belirli özellikler içermelidir. 1. ölçüt, fiziksel bir öneme sahip olmalı ve gereksiz sonuçlara yönelmemelidir. Örneğin, çıkışta gürültü gücü minimumda tutulmak isteniyorsa ve sistem işaret ve gürültü için sıfır gibi bir sonuç sağlıyorsa, bunun anlamlı bir sonuç olmadığı açıkça görülecektir. Öte yandan verilen bir çıkış için yapılan sınırlamalar nedeniyle oluşan çıkıştaki gürültü gücünün azaltılması uygun bir yaklaşım olabilir. 2. ölçüt, tek bir sonuca varmayı sağlamalıdır. Örneğin, çıkış işaretinin ortalama hatasının sıfır olması pek çok sistem tarafından sağlanabilir, ancak hatanın değişintisine bağlı olarak bunların aynı derecede iyi olduğu söylenemez. 3. ölçüt, çözülebilir matematik yapıda olmalıdır. Bu gereksinim pratikte uygulama alanı bulan birkaç ölçüt arasında tercih nedenidir. Diğer bir ölçüt olaya daha uygun düşse bile, sözü edilen biçim değinilen özelliği nedeniyle önceliklidir. Ölçütün seçimini ekseri giriş işaretinin yapısı, yani işaretin deterministik ya da rasgele olması etkilemektedir. Bunun nedeni sistemin amacının bu iki tür işaret için farklı olmasıdır. Örneğin giriş işareti deterministik ise, 247 biçimi bilinir ve gözlenmesindeki neden, mevcut olup olmadığının, mevcut olduğunda da, zaman aralığı, büyüklüğü vs. gibi bilgilerin sağlanmasını içerir. Diğer yandan işaret rasgele yapıda ise biçimi bilinemediğinden, sistemin onun biçim ve özelliklerini mümkün olduğunca yakınlıkla belirlemelidir. Sözü edilen bu iki durumdan herhangi biri için mantıklı olan çok sayıda ölçüt seçilebilir. Buna karşı, burada her bir durum için yalnızca birer ölçüt tanıtılmaya çalışılacaktır. Bunlar, en genel ve en çok kullanılan ve de matematik bazda incelenebilenler olacaktır. Deterministik işaret durumu için optimumluk ölçütü, belirli bir zaman için çıkışın işaret-gürültü oranını maksimum kılmaktır. Bu ölçütle, sistem, bilinen bir şekle sahip bir işaretin varlığını bulup ortaya çıkarmak ya da işaretin var olduğu anı ölçmek olduğunda anlamlıdır. Bu ölçütte, işaret-gürültü oranının maksimum olacağı zamanın bulunması açısından esneklik vardır, ancak uygun seçim işaretin yapısından kaynaklanır. Rasgele işaretler durumunda, optimumluk ölçütü, elde edilmesi istenen gerçek sistemin çıkışı ile gözlenen sistem çıkışı arasındaki farkın karesel beklendik değerinin minimum yapılmasıdır. Bu ölçüt, çoğu kez, sistemin amacı bilinmeyen bir işareti ölçme veya kontrol etme amaçlarıyla gözlenmesi söz konusu olduğunda yararlıdır. Sistemin çıkışı ve işaretin gerçek değeri arasındaki fark iki bileşen içermektedir. Birinci bileşen "işaret hatası"dır ve herhangi bir gürültü girişi mevcut değilken giriş ile çıkış arasındaki farkı simgeler. İkinci bileşen çıkış gürültüsüdür ve aynı zamanda çıkıştaki bir hatayı temsil eder. Toplam hata bu iki bileşenin toplamıdır. Minimuma düşürülmesi gereken büyüklük bu toplam hatanın karesel beklendik değeri olmaktadır. 8-3 OPTİMUM SİSTEMDEKİ KISITLAMALAR Genellikle sistemin tipi konusunda müsade edilebilecek bazı sınırlamaların yapılması gereklidir. Buna ilişkin en genel sınırlama, fiziksel gerçeklenebilirlik için temel koşul olan sistemin "nedensel" olmasıdır. Girişin gelecek değerlerine karşı cevap verebilecek nedensel olmayan bir sistemin, fiziksel olarak gerçeklenebllir bir sistemden seçilen bir ölçüte göre, daha iyi sonuç verebileceği genellikle doğrudur. Fakat nedensel olmayan sistemler fiziksel olarak gerçeklenemez ve aynı zamanda gerçel sistemlerle iyi bir karşılaştırmaya olanak sağlamadığından uygun olmazlar. * Nedensellik; Sistem impuls cevabının h(t)=0, t<0 koşulunu sağlaması anlamına gelir. ((7-3) eşitliğine bakınız). Buna ek olarak (7-4) eşitliğindeki kararlılık durumunun uygulandığı kabul edilmiştir. 248 Bilginin gelecek değerlerinden yararlanılacak biçimde kaydedilmiş şekilde sisteme verilmesi, bu kuralda kabul edilebilir bir ayrıcalık yaratmaktadır. Diğer bir ortak varsayım, sistemin lineer olmasıdır. Bu varsayımın en önemli nedeni, optimum lineer olmayan bir sistem için genel olarak analitik bir çözümün sağlanmasının olanaksızlığıdır. Diğer yandan bir çok halde, özellikle Gauss gürültüsünü içeren durumlarda optimum lineer sistemlerden daha iyi sonuçlanan, lineer olmayan bir sisteme raslanmadığı gösterilebilir. Genel olarak lineer sistemin en iyisi olduğu söylenemez. Ancak, optimum lineer olmayan bir sistemin bulunmasındaki güçlük nedeniyle onun aranması anlamlı olmayacaktır. Bir kez kabul edilebilir bir ölçüt seçilip, sistem "nedensel" ve "lineer" olarak sınırlandırıldığında, ölçütü optimumlaştıran transfer fonksiyonunu veya impuls cevabını bulmak genellikle mümkündür. Bununla birlikte, bazı durumlarda, sistemi belirli bir biçime getirmek için daha başka kısıtlamalar istenebilir. Bu tür sınırlamalar daha genel ve karmaşık bir optimumluğun daha pahalı ve karmaşık olmaması ve istenen sonuca ulaşmayı çabuklaştırması nedeni ile önemlidir. Bununla ilgili örnekler ileride verilecektir. 8-4 PARAMETRE AYARLAMASI İLE OPTİMUMLAŞTIRMA Başlıkta da belirtildiği gibi, bu yöntemle kullanılacak sistemin şekli belirlenerek seçilen ölçüte uygun sistem bileşenlerinin değerleri elde edilir. Bu metodun yararı, karmaşıklığı önceden verilen bir sistemin ele alınmasıdır ve sistemin karmaşıklığı, boyut, ağırlık ve maliyet açısından kritik öneme sahip olması durumunda geniş bir uygulama alanı bulur. Zararı ise, bu tip bir optimum sistem özelliklerinin, şekli belirlenmemiş daha genel bir sistemdeki kadar olumlu olmamasıdır. Bilgisayar çözümlerinin mümkün olmasına rağmen, performansı artırmak için daha karmaşık bir sistem seçerek ve birden fazla parametreli optimum değerleri belirleyen analitik problemlerle başlanabilir. (Çünkü çözülmesi gereken bu benzer sistem ender olarak lineerdir). Pratikte, analitik çözümler tek bir parametre ile sınırlandırılmışlardır. Temel kavramları sunabilmek için burada iki temel örnek ele alınacaktır. Birinci örnek olarak, işaretin Şekil 8-1 (a)’da görüldüğü gibi dikdörtgen bir darbe olduğunu ve spektral yoğunluğu, N olan beyaz gürültü içerdi- 249 ŞEKİL 8-1 İşaret Gürültü oranını Maksimum Yapmak için işaret ve Sistem: (a) Algılanan İşaret (b) Optimum Sistemin Belirlenen Biçimi ğini varsayalım. İşaretin şekli belli olduğuna göre, sistemin amacı işaretin varlığını ortaya çıkarmaktır. Daha önce de belirtildiği gibi, bu amaç için gerekli olan ölçüt, herhangi bir andaki çıkış işaretinin gürültü gücüne oranını maksimum yapan sistemi bulmaktır. Yani, eğer çıkış işareti, s0(t) çıkış gürültüsünün karesel ortalama değeri M 2 ise s 02 (t 0 ) / M 2 oranını maksimum yapan sistemin bulunması gerekir. Burada t0 bu oranı maksimum yapacak şekilde seçilmelidir. Parametre ayarlaması yönteminde, sistem şekli belirlidir, ve Şekil 81(b)’de gösterildiği gibi basit RC devresi kabul edilmiştir. Ayarlanması gereken parametre, filtrenin zaman sabiti veya bu zaman sabitinin tersidir. İlk adımlardan biri işaret-gürültü oranını maksimum yapacak şekilde t0 zamanını seçmektir. t0 için uygun seçim, çıkış işareti bileşeni incelendiğinde ortaya çıkar. Bu çıkış işareti aşağıda verilmiş ve Şekil 8-2’de gösterilmiştir. s0(t) = A [1-e-bt] = A [1-e-bT]e-b(t-T) 0≤t <T T ≤t <∞ (8-1) Bu sonuç sistem analizinin bilinen herhangi bir yöntemi kullanılarak elde edilebilir. Şekilden görüleceği gibi çıkış işareti bileşeni en büyük değerini T anında almaktadır. Burada t0 = T almak en uygun olanıdır. Böylece, s0(t0) = A (1-e-bT) (8-2) 250 olur. Bu tip bir devredeki çıkış gürültüsünün karesel beklendik değeri daha önce de belirtildiği gibi M 2 = bN 0 / 2 (8-3) olarak gösterilebilir. Maksimum tutulacak işaret-gürültü oranı, s 02 (t 0 ) / M 2 = A 2 (1 − e −bT ) 2 /(bN 0 / 2) (8-4) b≥0 olur. Maksimumlukla ilgili çalışmalara başlamadan önce, bu oranın b=0 ve b = ∞ değerlerinde sıfır olduğu ve diğer bütün pozitif b değerlerinde pozitif olduğu belirtilmelidir. Burada oranı maksimum yapan birkaç pozitif b değeri söz konusudur. Oranı maksimum yapan b değerini bulmak için (8-4) eşitliğinin b’ye göre türevi alınıp sıfıra eşitlenir. Böylece, [ [ ] ] d s 02 (t 0 ) / M 2 / db = (2 A 2 / N 0 ) 2b(1 − e −bT )Te −bT − (1 − e −bT ) / b 2 = 0 (8-5) 2 elde edilir. Bu ifade sadeleştirildiğinde, 2bT+1 = ebT bulunur. Bu denklem çözüldüğünde (8-6) sınama-yanılma bT = 1,26 yöntemi ile bT için (8-7) bulunur. Buradan optimum zaman sabiti de, RC = T/1,26 (8-8) olur. Bu değer RC filtresinde T anında, işaret-gürültü oranını maksimum yapan zaman sabiti değeridir. ŞEKİL 8-2 RC Filtre Çıkışında İşaret Bileşeni 251 İşlem sırasındaki bir sonraki adım, filtrenin gerçekte ne kadar iyi olduğunun belirlenmesidir. Bu da, (8-7) eşitliği ile verilen bT’nin optimum değerinin (8-4) eşitliğinde yerine yazılmasıyla kolayca bulunabilir. Bu işlem yapıldığında, [s (t ) / M ] 2 0 2 0 max = 0,814 A 2T / N 0 (8-9) bulunacaktır. Darbenin taşıdığı enerji A2T’dir, böylece, maksimum işaret-gürültü oranı; işaret enerjisinin, gürültünün spektral yoğunluğuna oranı ile orantılıdır. Bu bütün durumlar için beyaz gürültü var olduğundan, işaret-gürültü oranını maksimum yapmada belirgin bir özelliktir. Bir sonraki kısımda, burada olduğu gibi optimum sistem şekli belirlenmemişse, genel olarak orantı sabitinin 0,814 yerine 1,0 olacağı gösterilmiştir. Bu örnekteki işaret gürültü oranındaki azalma basit bir filtre için ödenecek fiyat gibi düşünülebilir. Buradaki kayıp önemli değildir. Ancak kaybın önemli olduğu durumlarla karşılaşılabilir. Çoğu kez ihmal edilen son adımda da b parametresinin seçimine göre işaret-gürültü oranının ne kadar duyarlı olduğudur. Bu genellikle, (8-4) eşitliğinin b’nin fonksiyonu olarak çizilmesi ile sağlanır. Bu katsayı basitçe, K = 2(1-e-bT)2/bT şekilde ifade edilir ve sonuç Şekil 8-3’de görülmektedir. K bT ŞEKİL 8-3 bT Parametresinin Fonksiyonu Olarak Çıkışın İşaret-Gürültü Oranı 252 Şekilden görüleceği gibi işaret-gürültü oranı maksimum civarında hızla değişmez. Bu nedenle optimum filtrede zaman sabitinin kesin değeri çok önemli değildir. Parametre değişimi ile optimumlaştırmada verilecek ikinci örnekte rasgele bir işaret alınıp minimum karesel ortalama hata ölçütü uygulanacaktır. Bu örnek için sistem özel bir devre biçiminden çok ideal alçak geçiren bir filtre gibi davranacaktır. Ayarlanacak parametre ise filtrenin band genişliğidir. X(t) rasgele yoğunluğu, işlemenin bir örnek ( S X (ω ) = A 2 / ω 2 + (2π . f a ) fonksiyonu 2 ) olup spektral (8-11) ile verilmiştir. Bu işarete, spektral yoğunluğu N0 olan N(t) beyaz gürültü eklenmiştir. Bu özellikler ideal alçak geçiren filtrenin güç transfer karakteristiği Şekil 8-4’de gösterilmiştir. ŞEKiL 8-4 İşaret ve Gürültü Spektral Yoğunlukları, Filtre Karakteristiği Çalışılan ideal alçak geçiren filtre olduğundan, çıkış işaret bileşenindeki hata E(t) = X(t) - Y(t)’dir ve filtrenin geçirme bandının dışına düşer ve işaretin spektral yoğunluğu ile orantılıdır. Bunun karesel beklendik değeri; işaretin spektral yoğunluğunun ±2 π B dışındaki kısımlarda integre edilmesiyle bulunur. Simetri nedeniyle yalnızca bir tarafın hesaplanarak 2 katının alınması yeterli olacaktır. ∞ ( ) E 2 = (2 / 2π ) ∫ A 2 / ω 2 + (2π . f a ) dω 2πB [ 2 = (2 A 2 / 4π 2 f a ) (π / 2 ) − tan −1 ( B / f a ) ] (8-12) 253 Filtre dışındaki gürültü M(t), aşağıda verilen karesel ortalama değere sahiptir. 2πB M 2 = (1 / 2π ) ∫π N 0 (8-13) dω = 2 BN 0 −2 B Toplam karesel ortalama hata (işaret ve gürültü istatistik olarak bağımsız olduklarında) bu iki hatanın toplamıdır. Minimumlaştırılacak birim B’ye göre seçilir. Böylece, E 2 + M 2 = (2 A 2 / 4π 2 f a ) (π / 2 ) − tan −1 (B / f a ) + 2 BN 0 (8-14) [ ] yazılabilir. Bu minimumlaştırma (8-14) eşitliğinin diferansiyelinin B’ye göre alınması ve sıfıra eşitlenmesi ile tamamlanır. Bu şekilde [ ] (2 A 2 / 4π 2 f a ) (− 1 / f a ) /(1 + (B / f a ) ) + 2 N 0 = 0 2 ve buradan, [ B = (A 2 / 4π 2 N 0 ) − f a2 ] 1/ 2 (8-15) elde edilir. Bu optimum değere eşittir. Minimum karesel ortalama hatanın gerçek değeri, bulunan değerin (8-14) eşitliğinde yerine yazılmasıyla elde edilir. (8-15) ifadesi kolay bir çözüm değildir. Daha kolay bir çözüm işaretin karesel beklendik değeri, X 2 = A 2 / 4π . f a alınarak elde edilir. İşaretin eşdeğer gürültü band genişliğinde gürültünün karesel beklendik değeri, N X 2 = π. fa N0 İşaretin eşdeğer gürültü band genişliği ( π / 2 )fa’dır. Buradan, (8-15) eşitliği aşağıdaki gibi yazılır. [( ) ] B = fa X 2 / N X 2 −1 1/ 2 , X 2 > NX2 ve şekil 8-5’deki gibi gösterilebilir. (8-16) 254 ŞEKİL 8-5 Optimum Band genişliği İncelenen her iki örnekte de istenilen kriteri optimumlaştırmak için sistemin yalnızca tek bir parametresi ayarlanmıştır. İki veya daha çok parametrenin ayarlanması durumunda da aynı yol izlenir, yani en büyük ya da en küçük tutulması gereken büyüklüğün her bir parametreye göre türevi alınır, sıfıra eşitlenir. Bu da bize çözümü istenen parametre değerini veren eşzamanlı denklem setini verecektir. Fakat uygulamada bu yöntem, denklemlerin genellikle lineer olmayan ve analitik çözümleri bilinmeyen karakterde olması nedeniyle nadiren kullanılırlar. Çözümler çoğu kez bilgisayarlarla yapılabilir, fakat tek olma durumunda bile sorunlar çözümsüz kalabilir. ALIŞTIRMA 8-4 Yukarıdaki örnekte ve (8-16) eşitliği ile Şekil 8-5’de, X 2 < N X 2 olduğunda, optimum band genişliğinin ne olması gerektiği açık olarak belirtilmemiştir. (8-14) eşitliği ile verilen toplam karesel ortalama hatayı B’nin fonksiyonu olarak çiziniz ve optimum band genişliğinin B= 0 olduğunu gösteriniz. 8-5 İŞARET-GÜRÜLTÜ ORANINI MAKSİMUM YAPAN SİSTEMLER Bu paragrafta işaretin şekli bilindiğinde, belirli bir andaki işaretgürültü oranını maksimum yapan sistemler incelenecektir. Sistemin şekli belirlenmemiş yalnızca nedensel ve lineer olması gerektiği bilinmektedir. 255 Şekil 8-6’da notasyonlar gösterilmiştir. s(t)+N(t) ŞEKİL 8-6 Optimum Filtre Notasyonu s(t) işaretinin bilindiği ve deterministik olduğu varsayılmaktadır. N(t) ise spektral yoğunluğu N olan beyaz gürültü olarak kabul edilecektir. Her ne kadar paragrafın sonundaki kısa konu hariç beyaz gürültü dışındaki gürültüler burada incelenmeyecekse de, aynı genel yol onlar için de kullanılabilecektir. Çıkışın işaret gürültü oranı s 02 (t0)/M2 şeklinde tanımlanmıştır. Burada t0 seçilir. Amaç, çıkış işaret-gürültü oranını maksimum yapan h(t)’nin şeklini bulmaktır. İlk olarak, çıkış işareti aşağıdaki gibi verilmiş olsun. ∞ s 0 (t ) = ∫ h(λ ) s (t − λ )dλ (8-17) 0 Çıkış gürültüsünün karesel beklendik değeri de ∞ M = N 0 ∫ h 2 (λ )dλ 2 (8-18) 0 ‘dir. t0 anında tanımlanan işaret gürültü oranı, 2 ∞ ∞ s (t 0 ) / M = ∫ h(λ ) s (t 0 − λ )dλ / N 0 ∫ h 2 (λ )dλ 0 0 2 0 2 (8-19) şeklinde olacaktır. Bu oranı maksimum yapmak üzere "Schwarz Eşitsizliği”ni kullanmak uygun olacaktır. Bu eşitsizlik f(t) ve g(t) gibi herhangi iki fonksiyon olduğunda, 2 b b b 2 f ( t ) g ( t ) dt ≤ f ( t ) dt g 2 (t )dt ∫ ∫ ∫ a a a (8-20) ifadesinin yazılabileceğini ortaya koyar. Eşitlik yalnızca ve yalnızca k, t’den bağımsız bir sabit olmak üzere f(t) = kg(t) olması halinde sağlanır. Schwarz Eşitsizliğini (8-19) eşitliğinde yerine yazarsak 256 ∞ ∞ ∞ 0 0 0 s 02 (t 0 ) / M 2 ≤ ∫ h 2 (λ )dλ ∫ s 2 (t 0 − λ )dλ / N 0 ∫ h 2 (λ )dλ (8-21) olacaktır. Bu bağıntıdan işaret-gürültü oranının maksimum değerinin, eşitliğin sağlanması halinde oluşacağı açıktır. Maksimum değer h2( λ )’ların kısaltılması ile elde edilir. [s (t ) / M ] 2 0 ∞ 2 0 max = (1 / N 0 )∫ s 2 (t 0 − λ )dλ (8-22) 0 eşitlik için gerekli koşulun, h(λ ) = ks (t 0 − λ )u (λ ) (8-23) olacağı açıktır. k’nın bir kazanç katsayısı olması nedeniyle, işaretgürültü oranını etkilemesi mümkün değildir. Buradaki k=1 yapılabildiği gibi herhangi bir sabit değere eşit alınabilir. u( λ )’nın birim basamak fonksiyonu olması, sistemin nedensel olmasını sağlamak içindir. Görüldüğü gibi istenen impuls cevabı giriş işaretinin ters döndürülmüş halinin, zaman cinsinden, t kadar geciktirilmişidir. (8-23) eşitliğinin sağ tarafında t = t0- λ şeklinde değişken dönüşümü yapıldığında, t0 ∞ ∫s 2 (t 0 − λ )dλ = 0 ∫s 2 (t )dt = ε (t 0 ) (8-24) −∞ elde edilir. Görüleceği gibi bu eşitlik, işaret-gürültü oranının maksimum yapılacağı t0 anına kadar depolanan enerjiyi ifade eder. Bu işaret enerjisi ε (t 0 ) ile gösterilir. Özetlersek; 1- t0 anındaki çıkışın işaret-gürültü oranı, impuls cevabı, h(t) = s(t0-t) u(t) (8-25) şeklinde olan bir filtre ile maksimum yapılabilir. 2- Maksimum işaret-gürültü oranının değeri [s (t ) / M ] 2 0 2 0 max = ε (t 0 ) / N 0 257 (8-26) olur. Burada ε (t 0 ) , s(t)’nin t0 anına kadar olan enerjisidir. (8-25) eşitliği ile verilen filtreye uyumlu (matched) filtre adı verilir. Bu konuya ilk örnek olmak üzere Şekil 8-7 (a)’da verilen bir dikdörtgen darbeyi ele alalım ve işaret-gürültü oranını t0 = T anında maksimum yapacak h(t) değerini araştıralım. ŞEKİL 8-7: Dikdörtgen Darbe için Uyumlu Filtre (a) İşaret (b) Çevrilmiş ve Kaydırılmış işaret (c) t0 = T için Optimum Filtre Şekil 8-7(b) ters çevrilmiş ve keyfi bir t0 değeri kadar kaydırılmış işareti göstermektedir. Sonuç olarak impuls cevabı t0 =T için Şekil 8-7 (c)’de gösterilmiştir. Matematik açıdan transfer fonksiyonu H(t)= A 0≤t ≤T =0 dışında (8-27) olarak verilir. Maksimum işaret-gürültü oranı [s (t ) / M ] 2 0 2 0 max = ε (t 0 ) / N 0 = A 2T / N 0 (8-28) olarak bulunur ve (8-9) eşitliği ile karşılaştırılabilir. t0 değerinin değişimine bağlı etkileri göstermek üzere şekiller, Şekil 8-8’de verilmiştir. Bu şekildeki grafikler, Şekil 8-7(a)’da görülen, aynı giriş değeri s(t) için, s(t0-1), h(t), ve s(t)’yi göstermektedir. Bunların incelenmesinden t0 < T yapılmasının maksimum işaretgürültü oranını azaltacağı görülecektir. Çünkü darbe enerjisinin tamamına, t0 anına kadar ulaşılamaz. Diğer yandan t0>T yapılmakla da çıkışın işaret gürültü oranı, t0 -T anındaki değerinden daha fazla artırılamaz. Çünkü enerjinin tamamı T anına kadar tamamlanmış olmaktadır. Ayrıca şekillerin incelenmesinden uyumlu bir filtrenin çıkış işaretinin, giriş işaretinin şekline sahip olamayacağı da açıktır. Buradan, amaç dikdörtgen bir darbeyi bozulmaksızın yeniden filtre çıkışında elde etmek ise bunun uyumlu filtrelerle elde edilmesi uygun olmayacaktır. 258 ŞEKİL 8-8 Optimum Filtreler ve Çeşitli t0 Değerlerine Tepkileri Uyumlu filtrelere ikinci bir örnek olarak, zaman bakımından sınırsız ancak sonlu enerjiye sahip bir işareti incelemek ilginç olacaktır. Bu tür bir işaret, s (t ) = A.e −bt u (t ) (8-29) olabilir. Şekil 8-9’da gösterildiği gibi rasgele seçilmiş bir t0 optimum uyumlu filtre 259 için h(t ) = A.e − b (t 0−t ) u (t ) (8-30) ‘dir. ŞEKiL 8-9 Üstel Bir İşaret İçin Uyumlu Filtre Mevcut enerjinin t0 ile artması nedeniyle, maksimum işaret-gürültü oranı da t0’a bağlıdır. Buna göre [s (t ) / M ] 2 0 2 0 max = ε (t 0 ) / N 0 t0 [ = ∫ A 2 e − 2bt dt / N 0 = A 2 / 2bN 0 1 − e − 2bt 0 ] (8-31) 0 olur. t0 çok büyük yapıldığında bu değerin A2/2bN0 değerinde bir limite yaklaşacağı açıktır. Bu nedenle, t0’ın daha büyük değerleri daha pahalı bir sistemi gerektireceği de dikkate alınarak t0 değeri bu limite ne kadar yaklaşılmak istendiğine bakılarak seçilmelidir. Uyumlu filtrelerle ilgili üçüncü ve son bir örnek olmak üzere, sınırsız enerji ve sınırsız süreye sahip yani güç işaretleri ele alınacaktır. Peryodik olarak tekrarlanan bir dalga şekli bu tip işaretler için bir örnek olabilir. İncelenebilir ilginç bir durum bu darbelerin radar sistemlerinde kullanılan ve peryodik olarak tekrarlanan RF darbeler olduğu düşünülebilir. Şekil 8-10 böyle bir işareti, aynı işaretin ters çevrilmiş ve kaydırılmış biçimini ve uyumlu filtre çıkışını göstermektedir. Bu şekilde t0 toplam darbe sayısına karşı düşen bir süre olarak verilmiştir ve gerekli değildir. Darbe başına enerji, (1/2)A2tp olduğundan, bu tip N darbeli bir uyumlu filtre çıkışının işaret gürültü oranı, 260 [s (t ) / M ] 2 0 2 0 max = NA 2 t P / 2 N 0 (8-32) olacaktır. Buradan işaret gürültü oranının uyumlu filtre darbe ŞEKİL 8-10 N Darbe için Uyumlu Filtre sayısı N ile artacağı açıktır. Ancak, N’in çok büyük değerleri için bu tür uyumlu filtreler üretmek çok güçtür. Bu nedenle genellikle N’in 10’dan küçük değerlerinin seçilmesi sözkonusudur. Her ne kadar beyaz gürültü dışındaki gürültüler incelenmemişse de genel olarak şunları söylemek mümkündür. Uyumlu filtre tanımlarını uygulayabilmek açısından yapılacak şey yalnızca filtre girişinden önce beyaz gürültü olmayan gürültü türlerini beyaz gürültü biçimine dönüştürmektir. Bu tür bir düzen öndüzenleme veya önbeyazlatma filtresi (prewhitening) olarak tanımlanır ve gürültünün spektral yoğunluğunun tersi biçiminde bir güç transfer fonksiyonuna sahiptir. Kuşkusuz bu öndüzenleme filtresi işaretin şeklini değiştirecektir. Bu nedenle, uyumlu filtre, öndüzenleme filtresi çıkışındaki işareti işlemek durumunda kalacaktır. ALIŞTIRMA 8-5 (8-30) eşitliğindeki uyumlu filtre için maksimum işaret-gürültü oranını, limit haldeki durumun 0,9’una eşit yapacak t0 değerini bulunuz. Cevap:(1n10)/2b 261 8-6 KARESEL ORTALAMA HATAYI MİNİMUM YAPAN SİSTEMLER Bu paragrafta, sistem çıkışı ile durağan rasgele işlemeden gelen işaret sözkonusu olduğunda, giriş işareti ile çıkış işareti arasındaki karesel ortalama hatayı minimum yapacak yöntemler anlatılacaktır. Sistemin şekli önceden bilinmeyip lineer ve nedensel olarak varsayılmıştır. Bu analizleri yapabilmek için s domeni notasyonunu kullanmak uygun olacaktır. Zaman domeninde de kullanılabilmesine karşın s domeninde çalışmak daha uygundur. Notasyon aşağıdaki şekilde tanımlanmıştır. ŞEKİL 8-11 Optimum Sistem için Notasyon Burada rasgele giriş işareti X(t)’nin SX(s) spektral yoğunluğunu göstermektedir. Giriş gürültüsü N(t) ve spektral yoğunluğu SN(s), çıkış işaretinin spektral yoğunluk bileşenleri de sırasıyla, SY(s) ve SM(s)’dir. Burada, uyumlu filtrede olduğu gibi beyaz gürültü şeklinde basitleştirme yapmak mümkün değildir. Sistem tarafından üretilen işaret bileşenlerindeki hata daha önce belirtildiği gibi, E(t) = X(t) - Y(t) ‘dir. Bunun Laplace dönüşümü FE(s) = Fx(s) - FY(s) = Fx(s) - H(s)Fx(s) = Fx(s)[1 - H(s)] (8-33) olur. Bu nedenle, 1-H(s); giriş işaretine ait işaret hatası ile ilgili transfer fonksiyonudur. İşaret hatasının karesel beklendik değeri, j∞ E 2 = (1 / 2πj ) ∫ S X ( s )[1 − H ( s )][1 − H (− s )]ds − j∞ (8-34) Sistem çıkışında görülen gürültü M(t)’dir ve karesel beklendik değeri, j∞ M = (1 / 2πj ) ∫ S N ( s ) H ( s ) H (− s )ds 2 − j∞ 262 (8-35) Toplam hatanın karesel beklendik değeri, (işaret ve gürültü istatistik bağımsız olduklarından) E 2 + M 2 ’dir, ve j∞ 2 2 E + M = (1 / 2πj ) ∫ {S X ( s )[1 − H ( s )][1 − H (− s )] + S N ( s ) H ( s ) H (− s )}ds − j∞ (8-36) olarak tanımlanır. Şimdi amaç, bu ifadeyi minimum yapacak olan H(s) değerinin bulunmasıdır. Sistemin nedensel olmamış olması halinde H(s)’in optimum değerini bulmak oldukça kolay olacaktı. Bunu sağlamak üzere (8-36) eşitliği yeniden düzenlenirse, j∞ E + M = (1 / 2πj ) ∫ {[S X ( s ) + S N ( s )]H ( s ) H (− s ) − S X ( s ) H ( s ) 2 2 − j∞ − S X ( s ) H (− s ) + S X ( s )}ds (8-37) (SX(s) + SN(s)) aynı simetri özelliklerine sahip bir spektral yoğunluk olduğundan, biri sol diğeri sağ yarı bölgede sıfır ve kutupları olan iki çarpana ayrılabilirler, o halde, Sx(s) + SN(s) = Fİ(s)Fİ(-s) (8-38) ve bu (8-37)’de yerine yazılarak, j∞ E 2 + M 2 = (1 / 2πj ) ∫ {[Fi ( s ) H ( s ) − ( S X ( s ) / Fi (− s ))] − j∞ [Fi (− s) H (− s) − (S x (s) / Fi (s))] + S X ( s) S N (s ) / Fi (s ) Fi (− s )}ds (8-39) olacaktır. Bu eşitliğin son teriminde H(s)’in olmadığı görülecektir. Bu yüzden, (8-39) eşitliğinin ilk teriminin iki çarpanı sıfır olduğunda, E 2 + M 2 değeri minimum olacaktır. (Bu iki çarpanın çarpımının negatif olamayacağını belirtelim). Buradan, H(s) = Sx(s)/Fi(s)Fi(-s) = (Sx(s)/(Sx(s) + SN(s)) (8-40) yazılabilir. Bu ifade ile verilen H(s) optimum transfer fonksiyonudur ve (8-40) eşitliğinin s domeninde simetrik olduğu durumlar haricinde bu eşitlik doğrudur. Gene bu ifadeye göre s domeninde simetri varsa sistem nedensel bir sistemi belirtmeyecektir. Ö halde ilk olarak bu eşitliğin sol yarı bölgedeki sıfır ve kutuplarını nedensel bir sistemi tanımlamak amacı ile kullanılabileceği düşünülebilir. 263 Önceki paragrafta uyumlu filtrelerdeki s(t0 -t)’nin negatif zaman kısmının elimine edilmesi gibi basit bir sorunla karşı karşıya olmadığımız açıktır. Çünkü sistem girişindeki toplam rasgele işleme X(t) + N(t)’dir, ve gürültü beyaz gürültü değildir. Eğer giriş beyaz gürültü olsaydı, özilişki fonksiyonu δ fonksiyonu içerecekti. Bu nedenle de gelecek giriş değerleri geçmiş değerleri ile ilişkisiz olacaktı. Bu şekilde, gelecek girişlere cevap vermeyecek (nedensel) sistem işaretin daha iyi bir kestirimine bizi götürecektir. Nedensel sistemin elde edilmesinde ilk adım gürültü spektral yoğunluğun beyaz gürültüye dönüştürülmesidir. Bu yüzden öndüzenleme filtresine gereksinim vardır. H1(s) = 1 / Fi(s) (8-41) şeklinde transfer fonksiyonu olan bir filtre olsaydı, çıkış beyaz gürültü olacaktı, çünkü; [S X (s) + S N (s)]H 1 ( s) H 1 (− s ) = (S X ( s) + S N (s) ) / (Fi ( s) Fi (− s) ) = 1 Ayrıca H1(s) nedensel olacaktır. Çünkü Fi(s) yalnızca sol yarı bölgede sıfır ve kutuplara sahiptir. Bu şekilde H1(s) giriş işareti ve gürültü için bir öndüzenleme filtresi olmaktadır. Diğer yandan (8-39) ifadesine bakıldığında, Fi(s)H(s) - SX(s) / Fi(-s) görülecektir. Burada sağ yarı bölgenin kutuplarının kaynağının 2. terim olduğu görülür. Yukarıda bu terim, sadece sol yarı bölgedeki kutuplardan birine sahip iki terime ayrılabilir. Böylelikle, Fi ( s ) H ( s ) − (S X ( s ) / Fi ( s ) ) = Fi ( s ) H ( s ) − [S X ( s ) / Fi (− s )]L − [S X ( s ) / Fi (− s )]R (8-42) olur. Burada L sol yarı bölge kutuplarını, R de sağ yarıbölge kutuplarını göstermektedir. Nedensel H(s) ile bütün çarpanların sıfır yapılması mümkün değildir. Bu (8-42) eşitliğinin sağındaki ilk iki terimin farkını elde etmek suretiyle bulunan en küçük değerdir ve sıfıra eşitlenerek, 264 Fi(s) H(s) – [ SX(s) / Fi(-s) ]L=0 veya H(s)=[1/Fi(s)][SX(s)/Fi(-s)]L (8-43) (8-43) eşitliğindeki birinci çarpan, öndüzenleme filtresi olan H1(s)’tir. Burada ikinci çarpanın nedensel olmayan kısımlarının eliminasyonu toplam hatanın karesel beklendik değerini minimum yapacaktır. ŞEKİL 8-12 Optimum Wiener Filtresi Toplam hatanın karesel beklendik değerini minimum yapan optimum filtre Wiener Filtresi olarak adlandırılır. Bu filtre, Şekil 8-12’de gösterildiği gibi, kaskad iki kısım olarak düşünülebilir. İlk kısım H1(s) öndüzenleme filtresi ve ikinci kısım H2(s) gerçek filtredir. Ekseri, H1(s) ve H2(s), H(s)’i ortadan kaldıran ortak çarpanlara sahiptir ve bu beklenenden daha basit bir olaydır. Wiener Filtresine bir örnek olmak üzere, Sx(s)= -1 / (s2 – 1) spektral yoğunluğuna sahip bir işaret ve SN(s)= -1 / (s2 - 4) spektral yoğunluğuna sahip bir gürültü ele alınsın. Böylece, Fi(s)Fi(-s) = Sx(s)+SN(s) [ ( )] [ ( )] ( )( )( = − 1 / s 2 − 1 + − 1 / s 2 − 4 = − 2s 2 − 5 / s 2 − 1 s 2 − 4 ve buradan, 265 ) ( ) Fi ( s ) = 2 s + 2,5 / (s + 1)(s + 2) (8-44) Bunun için öndüzenleme filtresi, ( H 1 ( s ) = 1 / Fi ( s ) = ( s + 1)( s + 2) / 2 s + 2,5 ) (8-45) yazılır. İkinci filtreye ait ifade hazır olarak aşağıdaki ifade ile tanımlanır. [ ( )] ( S X ( s ) / Fi ( s ) = − 1 / s 2 − 1 [(− s + 1)(− s + 2)] / 2 − s + 2,5 ( = (s − 2) / 2 (s + 1) s − 2,5 ) Bu eşitliğin kısmi kesirlere ayrılması ile, S X ( s ) / Fi (− s ) = [0,822 / (s + 1)] − 0,115 / s − 2,5 ve buradan [ ( ) )] H 2 ( s ) = [S X ( s ) / Fi (− s )]L = 0,822 / (s + 1) (8-46) bulunur. Optimum filtrenin son durumu ise, [ ( )] H ( s ) = H 1 ( s ) H 2 ( s ) = (s + 1)(s + 2) / 2 s + 2,5 [0,822 / (s + 1)] = 0,582(s + 2) /( s + 2,5 ) (8-47) Optimum filtrenin öndüzenleme filtresinden daha basit ve bir RC devresi gibi kurulabileceğini kaydedelim. Bu aşamada, son sorun, optimum filtrenin iyilik derecesinin belirlenmesidir. Bu da minimum tutulması gereken, hatanın karesel beklendik değerinin belirlenmesi demektir. Sistem çıkışı ile hatanın ilişkisiz olması halinde problem büyük ölçüde basitleşir. Bu sağlanmadığı takdirde, çıkışta hatanın küçük kalmasını sağlamak üzere daha ileri düzeyde lineer işlem yapılması gerekecekti. Böylece, minimum hatanın karesel beklendik değeri kolayca, giriş işaret bileşeninin karesel beklendik değeri ile toplam filtre çıkışının karesel beklendik değeri arasındaki farktır. Bu da H(s); (8-43) eşitliğinde verildiği gibi olduğunda, 266 (E 2 +M2 ) j∞ min j∞ = (1 / 2πj ) ∫ S X ( s )ds − (1 / 2πj ) ∫ [S X ( s ) + S N ( s )]H ( s ) H (− s )ds − j∞ − j∞ (8-48) Yukarıdaki sonuçlar, minimum karesel beklendik hatanın (8-47) eşitliği ile tanımlanan Wiener filtresi kullanılarak bulunabileceğini göstermektedir. (8-48) eşitliğindeki integral, tablo 6-1’den veya artıkların (residue) toplamı yardımıyla kolayca bulunabilir. Böylece, j∞ j∞ (1 / 2πj ) ∫ S X ( s )ds = (1 / 2πj ) ∫ − 1 /( s 2 − 1)ds = 0,5 − j∞ − j∞ İkinci integral de benzer şekilde, j∞ (1 / 2πj ) ∫ [S X ( s) + S N ( s)]H (s) H (− s)ds − j∞ j∞ ∫ [− (2s = (1 / 2πj ) 2 )( )( )][ ( )( )] − 5 / s 2 − 1 s 2 − 4 (0,582 ) s 2 − 4 / s 2 − 2,5 ds 2 − j∞ j∞ ∫ [− 2(0,582) / (s 2 = (1 / 2πj ) 2 )] − 1 .ds = 0,339 − j∞ bulunur. Buradan minimum karesel beklendik hata, (E ) + M 2 min = 0,5 − 0,339 = 0,161 olur. Bu değeri filtre kullanılmaksızın elde edilecek değerle karşılaştırmak ilginç olacaktır. Filtre kullanılmaması halinde, işaret hatası olmayacak ve toplam hatanın karesel beldendik değeri gürültünün karesel beklendik değerine eşit olacaktı. Böylece, (E 2 2 ) j∞ + M 2 = N 2 = (1 / 2πj ) ∫ − 1 /( s 2 − 4)ds = 0,25 − j∞ bulunacaktı. Filtrenin kullanılmasının toplam hatayı azalttığı açıktır. Bu azalma giriş gürültüsünün daha geniş bir band genişliğine sahip olması halinde daha belirgin olacaktı. ALIŞTIRMA 8-6 Bu paragrafta çalışılan örnekte, işaret spektral yoğunluğunu aynı ve gürültüyü de spektral yoğunluğu SN(s) =1 olan beyaz gürültü alarak a) Toplam karesel beklendik hatayı minimum kılan Wiener Filtresinin transfer fonksiyonunu bulunuz. b) Elde edilen minimum karesel beklendik hatayı sadeleştiriniz. Cevap: 0.413/(s+ 2 ), 0.0857 267 PROBLEMLER 8-1 Optimum sistem için olası iki ölçüt, A. Belirli bir zaman için çıkışta maksimum işaret-gürültü oranı, B.Toplam çıkış ile çıkışta arzu edilen işaret arasındaki minimum karesel beklendik hatadır. Aşağıda pratik durumların herbiri için hangi ölçütün en uygun olacağını belirleyiniz. a- Bir AM sisteminde konuşma işaretlerinin alınması, b- Sayısal bir haberleşme sisteminde binary darbelerin bulunması c- Bir otomatik kontrol sisteminde rasgele bozulmalar, d- Bir uçağın uçuş kontrol sistemi e- Nükleer radyasyon ölçümünde partikül dedektörü f- Bir radar sisteminde darbe işareti, g- Bir hız kontrol radarı h- Bir radyoastronom iteleskobu i- Bir sismik kayıt sistemi j- Su altı seslerine duyarlı pasif sonar sistemi 8-2 İmpuls cevabı h(t) olan şekilde gösterilen sistem, nedensel ve girişte gürültü işareti sıfır beklendik değerli, Gauss ve beyazdır. N(t), M(t) çıkışının τ > 0 olan bütün değerler için N(t+ τ )’dan bağımsız fakat τ ≤ 0 için N(t+ τ )’dan bağımsız olmadığını ispatlayınız. 8-3 Frekansı ω 0 r/s olan sinüsoidal bir işaret, spektral yoğunluğu N0 olan beyaz gürültü ile birleşmiş haldedir. Alçak geçiren bir RC filtre kullanarak ortalama işaret gücünün ortalama gürültü gücüne oranını maksimum yapmak istiyoruz. Filtrenin zaman sabiti ne olmalıdır? 8-4 Rasgele bir işaret X(t) = Ytu(t) Şeklindedir. Burada Y, -3 ile 3 arasında uniform dağılım gösteren bir raslantı değişkenidir. Bu işaret spektral yoğunluğu 1,5 V2/Hz 268 olan beyaz gürültüye eklenmiştir. Geçici sınır koşullan kaybolduktan sonra, herhangi bir zamanda toplam karesel ortalama hatayı minimum yapan alçak geçiren bir RC filtresi kullanılacaktır. (Y’nin ve zaman sabitinin etkisiyle işaret hatasının bir sabite yaklaşacağını kaydedelim.) Filtrenin zaman sabitini bulunuz. 8-5 s(t) işareti şekilde görüldüğü gibi olup spektral yoğunluğu 0,1 V2/Hz olan beyaz gürültü ile bütünleşmiş haldedir. a- t0=1 anında işaret gürültü oranını maksimum yapacak filtrenin impuls cevabını bulunuz. b- Maksimum işaret-gürültü oranının değerini bulunuz. c- a ve b şıklarını t = 0 için tekrarlayınız. 8-6 Bir işaret, s (t ) = t.e −1u (t ) şeklindedir ve spektral yoğunluğu 0,005 V2/Hz olan beyaz gürültü ile bütünleşmiş biçimdedir. a- Herhangi bir uyumlu filtre ile elde edilebilecek en büyük işaret-gürültü oranı nedir? b- a şıkkında elde edilen oranın 0,9’unu elde etmek üzere kullanılacak uyumlu filtre için t0 gözlem süresi nedir? 8-7 Bir rasgele işaretin spektral yoğunluğu, Sx(s) = -2s2 / (s4 - 13s2 + 36) şeklindedir ve spektral yoğunluğu bire eşit beyaz gürültü ile bütünleşmiştir. Filtre çıkışı ile giriş işareti arasındaki karesel ortalama hatayı minimum kılacak Wiener filtresinin transfer fonksiyonunu bulunuz. KAYNAKLAR Bölüm 1’deki kaynaklara bakınız, Özellikle Davenport, Root ve Lanning, Battin, Papoulis ve Thomas. 269 EK A MATEMATİK TABLOLAR TABLO A-1 TRİGONOMETRİK ÖZDEŞLİKLER sin (A ± B) = sin A cos B ± cos A sin B cos (A ± B) = cos A cos B + sin A sin B 1 cos A cos B = 2 [cos (A + B) + cos (A - B)] 1 sin A sin B = 2 [cos (A - B) - cos (A + B)] 1 sin A cos B = 2 [sin (A + B) + sin (A - B)] 1 1 sin A + sin B = 2 sin 2 (A+B) cos 2 (A - B) 1 1 sin A - sin B = 2 sin 2 (A-B) cos 2 (A +B) 1 1 cos A + cos B = 2 cos 2 (A + B) cos 2 (A - B) 1 1 cos A - cos B = - 2 sin 2 (A + B) sin 2 (A - B) sin 2A = 2 sin A cos A cos 2A = 2 cos2 A - 1 = 1 - 2 sin2 A = cos2A – sin2 A 1 sin 2 A= 1 (1 − cos A) 2 1 cos 2 A= 1 (1 + cos A) 2 1 sin2 A = 2 ( 1 - cos 2A ) 270 TABLO A-l (Devam) 1 (1 + cos 2 A) 2 e jx − e − jx sin x = 2j jx e = cos x + j. sin x cos 2 A = cos x = e jx + e − jx 2 A cos(ω .t + φ1 ) + B cos(ω .t + φ 2 ) = C cos(ω .t + φ 3 ) where C = A 2 + B 2 − 2 AB cos(φ 2 − φ1 ) A sin φ1 + B sin φ 2 A cos φ1 + B cos φ 2 φ 3 = tan −1 sin (ω .t + φ ) = cos(ω .t + φ − 90°) TABLO A-2 BELİRSİZ İNTEGRALLER 1 ∫ sin axdx = − a cos ax 1 ∫ cos axdx = a sin ax x sin 2ax − 2 4a 1 ∫ x sin axdx = a 2 (sin ax − ax. cos ax ) 1 2 2 2 ∫ x sin axdx = a 2 2ax sin ax + 2 cos ax − a x cos ax x sin 2ax 2 ∫ cos axdx = 2 + 4a 1 ∫ x cos axdx = a 2 (cos ax + ax. sin ax ) 1 2 2 2 ∫ x cos axdx = a 3 2ax. cos ax − 2 sin ax + a x sin ax ∫ sin 2 axdx = ( ) ( ) 271 TABLO A-2 (Devam) cos(a − b) x cos(a + b) x ∫ sin ax. cos bx.dx = − 2(a − b) + 2(a + b) sin( a − b) x sin(a + b) x ∫ cos ax. cos bx.dx = 2(a − b) + 2(a + b) a2 ≠ b2 ∫ sin ax. sin bx.dx = ∫e ax dx = sin(a − b) x sin(a + b) − 2( a − b ) 2( a + b ) 1 ax e a ax ∫ x.e dx = 2 ax ∫ x e dx = e ax (ax − 1) a2 e ax 2 2 a x − 2ax + 2 a3 ( ) ax ∫ e sin bxdx = e ax (a sin bx − b cos bx ) a2 + b2 ax ∫ e cos bxdx = e ax (a cos bx + b sin bx ) a2 + b2 TABLO A-3 BELİRLİ İNTEGRALLER ∞ ∫x n e − ax dx = 0 n! Γ(n + 1) = n +1 a a n+1 ∞ Γ(u ) = ∫ z u −1e − z dz 0 ∞ ∫e −r 2 x2 dx = 0 ∞ ∫ xe 0 −r 2 x 2 dx = π 2r 1 2r 2 (Gamma function) 272 TABLO A-3 (Devam) ∞ 0 ∞ ∫x 0 π 2 2 2 −r x ∫ x e dx = n 2 2 e − r x dx = 4r 3 Γ[(n + 1) / 2] 2r n +1 ∞ π π sin ax dx = ,0,− x 2 2 0 ∫ for a>0,a=0,a<0 ∞ sin 2 x π ∫0 x dx = 2 ∞ sin 2 ax π ∫0 x 2 dx = a 2 π π π π 0 0 0 0 2 2 2 2 ∫ sin mxdx = ∫ sin xdx = ∫ cos mxdx = ∫ cos xdx = π π 0 0 ∫ sin mx. sin nx.dx = ∫ cos mx. cos nx.dx = 0 2m ∫0 sin mx. cos nx.dx = m 2 − n 2 0 π m+n tek m+n çift π 2 , m çift m≠n m,n çift 273 TABLO A-4: FOURİER DÖNÜŞÜMÜ 274 275 276 277 EK B SIKLIKLA KARŞILAŞILAN OLASILIK DAĞILIMLARI AYRIK OLASILIK FONKSİYONLARI Bernoulli (Binom'un değişik biçimi) p Pr( x) = q = 1 − p 0 x=1 x=0 dışında 0<p<1 p X ( x) = pδ ( x − 1) + qδ ( x ) X =p σ X 2 = pq φ (u ) = 1 − p + pe ju Binom n x n − x x = 0 , 1 , 2 ,..., n p q Pr( x) = x 0 aksi halde 0 <p <1 q =1- p n = 1 , 2 ,….. n n p X ( x) = ∑ p k q n −k δ ( x − k ) k =0 k X = np σ X 2 = npq φ (u ) = [1 − p + p.e ju ] n Pascal x − 1 n x −n p q Pr( x) = n − 1 0 0 <p <1 q =1- p x = n, n+1,.... aksi halde n = 1, 2, 3,…. X = np −1 σ X = nqp −2 2 φ (u ) = p n e jnu [1 − qe ju ] −n 278 Poisson Pr( x) = a x e −a x! x = 0, 1, 2, … a>0 X =a σX =a 2 φ (u ) = e a ( e ju −1) SÜREKLİ DAĞILIMLAR Beta (a + b − 1)! a −1 b −1 x (1 − x ) p X ( x) = (a − 1)!(b − 1)! 0 a>0 b>0 a X = a+b ab σ X2 = 2 (a + b) (a + b + 1) 0<x<1 dışında Cauchy p X ( x) = 1 a −∞< x < ∞ π a + ( x − b) 2 a>0 −∞<b < ∞ 2 φ (u ) = e jbu − a u Chi-Square n −1 − n / 2 ( n / 2) −1 − x / 2 x e − 1! 2 p X ( x) = 2 0 n = 1, 2, ... X =n σ X 2 = 2n φ (u ) = (1 − 2 ju ) − n / 2 279 x>0 aksi halde Erlang a n x n −1e − ax x>0 p X ( x) = (n − 1)! 0 aksi halde a > 0 n = 1, 2, ... X = na −1 σ X 2 = na −2 φ (u ) = a n (a − ju ) − n Exponential ae − ax p X ( x) = 0 x>0 aksi halde X = a −1 σ X 2 = a −2 φ (u ) = a(a − ju ) −1 Gamma xae−x /b p X ( x) = a!b a +1 0 a > -1 X = (a + 1) / b x>0 aksi halde b>0 σ X = (a + 1)b 2 2 φ (u ) = (1 − jbu ) − a −1 Laplace p X ( x) = a − a x −b e −∞< x < ∞ 2 a>0 −∞<b < ∞ X =b σ X 2 = 2 a −2 φ (u ) = a 2 e jbu (a 2 + u 2 ) −1 280 Log-normal { exp − [ln( x − a ) − b ]2 / 2σ 2 p X ( x) = 2π σ ( x − a ) 0 σ >0 −∞< a < ∞ X = a + e b +.5σ } x≥ a aksi halde −∞<b < ∞ 2 2 2 σ X = e 2b +σ (e σ − 1) 2 Maxwell 2 3 2 −a2 x2 / 2 a x e p X ( x) = π 0 a>0 x>0 aksi halde X = 8 / π a −1 8 σ X 2 = 3 − a −2 π Normal p X ( x) = 1 e 2π σ X − ( x − X ) 2 / 2σ σX >0 φ (u ) = e juX − ( u 2σ X2 −∞ < x < ∞ −∞ < X < ∞ X2 / 2) Normal-bivariate p X ,Y ( x, y ) = 1 2πσ X σ Y −∞< x < ∞ −1 < ρ < 1 − 1 x − X exp 2 ρ 2 ( 1 − ) σ X 1− ρ 2 σX >0 −∞ < y < ∞ φ (u, v) = exp juX + jvY − 2 y −Y + σY σY > 0 1 2 u σ X 2 + 2 ρuvσ X σ Y + v 2σ Y 2 2 ( ) 281 2 2ρ − (x − X )( y − Y ) σ XσY Rayleigh x − x2 / 2a2 e p X ( x) = a 2 0 aksi halde π X =a 2 π σ X = 2 − 2 x>0 a 2 2 Uniform 1 p X ( x) = b − a 0 a<x<b aksi halde −∞ < a <b <∞ a+b 2 (b − a )2 σ X2 = 12 jub e − e jua φ (u ) = ju (b − a) X = Weibull abx b−1e − ax p X ( x) = 0 a>0 b>0 b 1 X = a σX 2 1/ b 1 = a ( a<x<b aksi halde Γ 1 + b −1 2/b ) {Γ(1 + 2b ) − [Γ(1 + b )] } −1 −1 282 2 283 284 285 EK F ÇEVRİMSEL İNTEGRASYON Aşağıdaki tipte olan integrallerle, lineer sistemlerin analizi çalışmalarında sıklıkla karşılaşılır. c + j∞ 1 F ( s )e st ds ∫ 2πj c − j∞ ( F-1 ) ∞ 1 S X ( s )ds 2πj −∫∞ ( F-2 ) (F-1) integrali, Laplace dönüşümünün inversi ve (F-2) de, spektral yoğunluğu Sx(s) olan rasgele işlemenin karesel beklendik değerini belirtir. Bu integraller yalnızca çok özel durumlar için elemanter yöntemlerle çözülebilirler. Buna rağmen integrandların iyi huylu fonksiyonlar olması hallerinde, bu integraller çoğu kez artık (residue) yöntemi ile kolayca hesaplanabilir. Bu yöntem, kompleks değişkenler teorisinin aşağıda verilen teoremine dayanmaktadır. Eğer F(s) fonksiyonu, bir miktar kutup haricinde, C çevrimi üzerinde ve içinde analitik ise F(s)’in C çevrimi boyunca integrali, F(s)'in kutup noktalarındaki artıkların toplamının 2 π j katına eşittir. Bu eşitlik biçiminde, ∫ C F ( s )ds = 2πj ∑ Çevrimde kutuplarin artiklari (F-3) olur. (F-3) eşitliğinin anlamı, C çevrimi üzerindeki her noktada F(s)’in değeri sonsuz küçük diferansiyel yol ile çarpılıp tüm çevrim boyunca bunların toplanması demektir. Çevrim yönü ok ile gösterildiği gibi saat dönüş yönünün aksi yöndedir. Dönüş yönünün değiştirilmesi (F3) eşitliğinin sağ yanına negatif işaret eklenmesini gerektirir. (F-3) eşitliğinin (F-1) ve (F-2) gibi integrallerin hesaplanmasında yararlanabilmek üzere iki adım daha gerekmektedir. Kutuptaki artıkların nasıl bulunacağını öğrenmek ve (F-3)’deki kapalı eğri ile (F1) ve (F-2)’deki açık eğrileri bağdaştırmayı sağlamak gerekmektedir. 286 Öncelikle kutup ve artıklar konusu ele alınsın. Tek değerli bir F(s) fonksiyonu bir s=s0 noktası ve civarında türeve sahipse F(s) bu noktada analitiktir denir. F(s) fonksiyonu s domeninin bir bölgesinde analitik ise bu bölgenin her noktasında analitiktir denir. Eğer fonksiyon, s0 noktası civarında analitik fakat s0 noktasının kendisi analitik değilse s0 noktasına tekil nokta denir. Örneğin, F(s) = 1/(s-2) fonksiyonunun türevi, F'(s) = -1/(s-2)2 olsun. Buradan hemen bu fonksiyonun s = 2 noktası haricinde analitik olduğu görülür. s = 2 noktasında ise analitik değildir. Yani fonksiyon s=2’de tekillik göstermektedir. İzole edilmiş bir tekil nokta, bir bölge içinde bulunan bir noktanın, fonksiyonun bu nokta haricinde analitik olması demektir. Gerçekten de yukarıdaki fonksiyon s = 2 için bir izole edilmiş tekil noktaya sahiptir. En çok karşılaşılan tekillik kutup olma durumudur. Eğer bir fonksiyon s = s0 noktasında sonsuz oluyor ve bu fonksiyon, n pozitif bir tamsayı olmak üzere (s-s0)n çarpanı ile çarpıldığında tekillik ortadan kalkıyor ise, fonksiyon s=s0 noktasında n. mertebeden bir kutup'a sahiptir denir. Örneğin 1/sin(s) fonksiyonunun s0 noktası bir kutup noktasıdır, ve şöyle yazılabilir. 1 1 = 3 sin s s − ( s / 3!) + ( s 5 / 5!) − ... ve s ile çarpıldığında, s 1 φ (s) = = 3 5 2 s − ( s / 3!) + ( s / 5!) + ... 1 − ( s / 3!) + ( s 4 / 5!) + ... elde edilir ve s = 0 civarında iyi huylu bir fonksiyon olduğu görülür. O halde, F(s) =1/sin(s) fonksiyonu, s=0 noktasında birinci mertebeden bir kutup'a sahiptir denir. F ( s) = Analitik fonksiyonların önemli bir özelliği, analitik olduğu bölgede yakınsak bir seri ile ifade edilebilmeleridir. Bu özelliğin basit bir uzantısı olarak, fonksiyonu tekil nokta civarında tanımlamak mümkün olur. s=s0’da n. mertebeden kutbu olan bir F(s) fonksiyonu ele alınsın, ve φ (s ) = (s − s0 ) n F ( s) ( F- 4 ) gibi yeni bir fonksiyon tanımlayalım. Artık φ (s), s0’da analitiktir ve F(s)’in tekilliği ortadan kalkmıştır. Bu nedenle φ (s) aşağıdaki gibi bir Taylor Serisi'ne açındırılabilir. 287 φ (s ) = A−n + A− n +1 (s − s0 ) + A−n + 2 (s − s0 )2 + ... + A−1 (s − s 0 ) n −1 ∞ + ∑ B k (s − s 0 ) n+ k ( F- 5) k =0 (F-5) eşitliği (F-4) eşitliğinde yerine yazılıp F(s) için çözüldüğünde, F (s) = 1 1 = 3 sin s s − ( s / 3 ! ) + ( s 5 / 5 ! ) − ... (F-6 ) bulunur. Bu açınım, s=s0 kutup noktası civarında da geçerlidir. Bu seri s0 civarında en yakın tekil noktaya kadar olan bölgede yakınsaktır. (F-6) eşitliğine, F(s)’in s = s0 tekil noktası civarı için, Laurent Açınımı veya Laurent Serisi adı verilir. Bu seri farklı karakterde iki kısımdan oluşmaktadır. Bunlardan Asal Kısım adı verilen ilk kısım (s-s0)’ın negatif kuvvetlerini içerir. İkinci kısım ise sıfır ve pozitif kuvvetler içeren Taylor kısmıdır. s planının tümünde (sonsuz hariç) Taylor kısmının analitik olduğu ve s = s0 da B gibi bir değere sahip olduğunun kabul edildiği belirtilmelidir. F(s) fonksiyonunun tekilliği olmamış olsaydı, ikinci kısım fonksiyonun tamamını temsil edecek ve yalnızca bir Taylor açınımı olacaktı. (s-s0)-1 katsayısı olan A-1’e, F(s)’in s=s0‘daki artık'ı denir. Kural olarak, Laurent serisinin katsayıları, Φ (s) fonksiyonunun alışılmış Taylor serisine açmak suretiyle ve sonra da (s- s0)n ile bölünerek belirlenir. Pek çok durumda mühendislik amaçlarına yönelik daha basit yöntemler kullanılabilir. Analitik fonksiyonların eşsiz özelliğinden dolayı uygun biçimdeki herhangi bir seri mutlaka Laurent Serisi olmalıdır. F(s), s’in iki polinomunun oranı biçiminde olduğunda, bunun Laurent Serisi kolayca bulunabilir. Φ( s ) = ( s − s 0 ) n .F ( s ) oluşturulur. s-s0=v veya s=v+s0 olsun, Φ(v + s 0 ) , v=0 civarında seriye açılarak ve pay paydaya bölünerek ayrıca v yerine s- s0 yazılarak seri bulunur. Bir örnek olmak üzere F ( s) = 2 s ( s 2 − 1) 2 288 fonksiyonu ele alınsın. s=-1 civarında F(s)’in Laurent serisini bulmak üzere, 2 s ( s − 1) olsun, ve s = v - 1 alarak, φ (s) = φ (v − 1) = 2 2 2 = 3 2 (v − 2v + 1)(v − 2) v − 4v − 3v − 2 2 3v v 2 −1+ − 2 4 2 3 − 2 − 3v − 4v + v )2 2 + 3v + 4v 2 − v 3 − 3v − 4v 2 + v 3 9v 2 3v 4 − 3v − − 6v 3 + 2 2 v2 3v 4 + 7v 3 − 2 2 2 3 v 3v v5 + + v4 − 2 4 4 3 2 1 4 φ (v − 1) = −1 + v − v 2 − ... (v-1), s ile değiştirilerek, φ (s ) = −1 + 3 (s + 1) − 1 (s + 1)2 − ... 2 4 289 F ( s) = − 1 3 1 + − ( s + 1) − ... s +1 2 4 Artık'ın -1 olduğu hemen görülecektir. s=s0 noktasında n. mertebeden kutbun artık'ını bulmak için kullanışlı bir ifade aşağıda verilmiştir. K S0 = φ ( n −1) ( s 0 ) (n − 1)! ( F-7 ) Burada, φ (s) = (s-s0)n.F(s)’tir. Bu eşitlik n=1 için de geçerlidir ve rasyonel fonksiyonlarla sınırlandırılmamıştır. F(s) iki fonksiyonun oranı olmadığında transandant terimler yerine kutup noktası civarındaki açınımı almaya müsade edilir. Örneğin, sin s 1 s 3 s 5 1 s s3 F ( s ) = 2 = 2 s − + − ... = − + − ... 3! 5! s 3! 5! s s Bu örnekte s=0 kutup noktasında artık 1’dir. Bir F(s) fonksiyonunun kısmı kesirlere ayrılması ile Laurent Serisi arasında doğrudan bir bağıntı vardır. Özellikle, Hi(s), Laurent serisinin asal kısmı olması durumunda, F ( s ) = H 1 ( s ) + H 2 ( s )...H k ( s ) + q ( s ) yazılabilir, burada ilk k terim, k tane kutup civarında Laurent serisinin asal kısımları ve q(s) de, s’in büyük değerleri için F(s)’i temsil eden bir polinomdur. (a0 + a1s+ a2s2+ ... +amsm), m’in değeri ise pay ve paydanın derecesi farklıdır. Genel olarak q(s) pay paydaya, payın derecesi paydadan küçük oluncaya kadar bölünerek bulunur. Kalan ifade daha sonra asal kısımlarına ayrılır. İlk soru bu şekilde cevaplandırıldıktan sonra, geriye (F3) eşitliğindeki çevrim ile (F-1) ve (F-2) eşitliklerinin asıl bağdaştırılabileceği sorunu kalmış olacaktır. Bu da s’in büyük değerleri için sıfıra oldukça hızlı yaklaşan integrantlar göz önüne alınarak çözülebilir. Bu şekilde, her ne kadar integral çevrimi c- ∞ dan c+ ∞ ’a kadar ise de kapalı bir çevrim olarak yol Şekil F-1’deki gibi seçilebilir. 290 ŞEKİL F-1 s-Planında İntegrasyon Yolu R0 → ∞ limiti için eksenin sol tarafındaki yarıçember üzerinde integral sıfıra yaklaşır, ve c-j ∞ ’dan c+j ∞ yolu boyunca alınan integrale yaklaşır. ∫ C1 + C 2 F ( s )ds = ∫ F ( s )ds + ∫ F ( s )ds C1 (F-8) C2 Herhangi özel bir durumda, C2 boyunca alınan integralin tüm integrale katkısı araştırılmalıdır. c + j∞ ∫ F (s)ds = lim ∫ R0 →∞ C1 + C 2 c − j∞ F ( s )ds = 2πj ∑ artiklar (F-9) Aşağıdaki iki özel durum, sorun çıkaran pek çok hali kapsamaktadır, 1- F(s), paydasının derecesi payının derecesinden en az iki büyük olacak biçimde rasyonel kesir ise, c + j∞ ∫ F (s)ds = ∫ c − j∞ C1 + C 2 F ( s )ds olduğu kolayca gösterilebilir. 2-F1(s), sonlu sayıdaki kutup noktası hariç, sol yarı planda analitik ve s → ∞ iken düzgün olarak sıfıra yaklaşıyorsa, ( σ < 0), pozitif t değerleri için lim ∫ F1 ( s )e st ds = 0 R0 →∞ C 2 doğrudur. Bu özel durumdan yararlanarak inversiyon integrali, c + j∞ f (t ) = 1 1 F1 ( s )e st ds = F1 ( s )e st ds = ∑ k j ∫ ∫ C + C 2πj c − j∞ 2πj 1 2 j 291 Burada kj’ler, j. kutuptaki mutlak yakınsak residue (artık)lardır. Aşağıdaki iki örnek bu işlemleri açıklamaktadır. ÖRNEK 1 Spektral yoğunluğu aşağıda verilen rasgele işlemenin, 1 S X (ω ) = 2 (ω + 1)(ω 2 + 4) Karesel beklendik değerini bulunuz. Sx(s)’e dönüştürülerek, 1 1 S X (s) = = 2 2 2 (− s + 1)(− s + 4) ( s − 1)( s 2 − 4) ve karesel beklendik değer j∞ 1 ds X = = k −1 + k − 2 ∫ 2 2πj − j∞ ( s − 1)( s 2 − 4) 2 olur. Sx(s), kısmı kesirlerine ayrılarak artıklar. 1 1 k −1 = = (−1 − 1)(1 − 4) 6 1 1 k −2 = =− (4 − 1)(−2 − 2) 12 Bu şekilde, X2 = 1 /6- 1 /12 = 1/12 F(s) = 1 / s(s+2) ‘in ters Laplace dönüşümünü bulunuz. c + j∞ 1 e st f (t ) = ds = k 0 + k − 2 2πj c −∫j∞ s ( s + 2) (F-7) eşitliğinden, k0 = e st s+2 = 1 2 = e −2 t −2 s =0 st k −2 = e s s = −2 ve böylece, f (t ) = 1 (1 − e − 2t ) 2 t>0