Ders Notu 5: Global Optimizasyon Teknikleri

advertisement
BÖLÜM 5
GLOBAL OPTİMUMLUK (GLOBAL OPTIMALITY)
5.1 GİR
RİŞ
Bu böllüme kada
ar anlatıla
an optimiza
asyon yön
ntemleri va
asıtasıyla bir optimizasyon
problem
minin lokal minimum değerlerinin nasıl eld
de edileceğ
ği verilmiştti. Bu bölüm
mde ise
elde edilen
e
loka
al minimu
um noktala
arın globa
al olarak optimum olup olm
madığını
belirleyyecek şartlar incelen
necektir. Bir
B lokal minimum
m
n
noktasının
global ola
arak da
minimu
um olup olm
madığını belirlemede
e aşağıda verilen
v
iki metot
m
kulla
anılabilir:
1.. Eğer hed
def fonksiyyon f(x), boş
b
olmaya
an feasible
e S kümessinde ki bu
u küme
kapalı ve sınırlı (clo
osed and bounded)
b
olmak
o
zoru
undadır, birr sürekli fonksiyon
oremine gö
öre bir glob
bal minimu
um nokta m
mutlaka va
ardır. Bu
ise weierstrass teo
durumda tüm ada
ay noktalar hesapla
anır ve he
edef fonkssiyonu min
nimuma
götüre de
eğer optimu
um değer olarak
o
belirlenir.
2.. Eğer optimizasyon problemi konveks
k
is
se lokal min
nimum nokkta aynı za
amanda
global minimumdur.
5.2 WE
EIERSTRA
ASS TEOR
REMİ
Yukarıd
da da ifad
de edildiğii gibi bu teorem
t
ya
ardımıyla global
g
min
nimum nok
ktasının
varlığı, kapalı ve sınırlı S kümesinin
k
varlığı ile ilişkilidir. Dolayısıyla
D
a, kapalı ve sınırlı
bir sayıı kümesinin
n anlamı belirlenmeli
b
idir.
Bir S sayı
s
kümesinin kapa
alı (closed)) olma şarrtı, bütün sınır nokta
alarını içerrmelidir.
Sınırlı (bounded)
(
olması için
n gereken şart ise:
xT x < c x ∈ S
Burada
a c sonlu bir
b sayıdır. Weierstra
ass teorem
minin şekil üzerinde gösterimi aşağıda
verilmişştir.
Şekil 1: a)Sınırlandırılmamış alan
n ve fonksiyo
on b) sınırlı alan ve fonkssiyonetler
5-1
Örnek 5.1:
S = {x | 0 < x ≤ 1} de
d tanımlanan f ( x) = −1 x fonk
ksiyonu glo
obal minimu
um değeri olabilir
mi?
Weiersstrass teore
eminin şarrtları sağla
andığında, global birr minimum
m değerinin
n varlığı
garanti edilmiş olur.
Global optimumlu
uk için 2. şart
ş
optimizasyon prrobleminin konveksliliğidir ve konveks
k
setler ve
v konvekss fonksiyonlar aracılığıyla bu tanımlama
t
alar yapılır. Dolayısıy
yla takip
eden bölümde bu
u tanımlam
malar yapılm
mıştır.
ONVEKS SETLER
5.3 KO
S konveks set aşağıda verilen özelliğe
e sahip no
oktaların birr toplamıdıır.
Eğer P1 ve P2 S’d
de herhang
gi noktalar ise P1-P2 doğrusunu
d
un tüm parççaları S’ de
e ise bu
sete ko
onveks set denir. Aşa
ağıda verile
en şekilde konveks ve
v konvekss olmayan setlerle
ilgili örn
nekler verillmiştir.
Şekil 2: a)Konvekks ve b)konve
eks olmayan setler
n boyuttlu bir uzayyda, herha
angi bir x (1) ve x ( 2) noktaları
n
arrasındaki h
herhangi bir doğru
parçasının param
metrik ifade
esi aşağıda
aki ifade ya
ardımıyla verilir:
v
x = αx ( 2) + (1 − α )x (1) , 0 ≤ α ≤ 1
(5.1)
Eğer bu
b doğru [a,b] aralığında tan
nımlanırsa bu doğrru üzerindeki tüm noktalar
konvekks seti oluşşturur.
5-2
a
x1
x
x2
b
Şekil 3: bir doğru üzerindeki konveks noktalar
Örnek 5.2:
{
}
S = x | x12 + x 22 − 1 ≤ 0 setinin konveks bir set olup olmadığını gösteriniz
5.4 KONVEKS FONKSİYONLAR
Tek değişkene sahip bir f(x) fonksiyonunu dikkate alalım. Şekil 3’de verilen herhangi
iki nokta; x1 ve x2, arasında bir doğru çizelim. Bu doğru, x1x2 arasında seçilen
herhangi iki noktadan geçen doğrunun üstünde kalıyorsa, f(x) fonksiyonu konvekstir
denir. Daha basit bir ifade ile konveks fonksiyonların şekli su tutabilecek bir kaba
benzetilebilir.
Şekil 4: Konveks fonksiyon.
Tek değişkenli bir fonksiyonda bu durumu belirlemek kolay olmasına rağmen n
değişkenli bir fonksiyonun konveksliği o fonksiyonun Hessian matrisinin S setinin
bütün noktalarında pozitif yarı tanımlı veya pozitif tanımlı olmasına bağlıdır. Bir
fonksiyonun pozitif tam ve yarı tanımlılığı aşağıdaki özelliklere bağlıdır:
•
F(x) fonksiyonu pozitif tanımlıdır, eğer λi > 0
•
F(x) fonksiyonu pozitif yarı tanımlıdır, eğer λi ≥ 0 ( λi lerden en az biri sıfır
olmalıdır)
•
F(x) fonksiyonu negatif tanımlıdır, eğer λi < 0
•
F(x) fonksiyonu negatif yarı tanımlıdır, eğer λi ≤ 0 ( λi lerden en az biri sıfır
olmalıdır)
5-3
Örnek 5.3:
Aşağıda verilen fonksiyonun konveks olup olmadığını kontrol ediniz.
f ( x) = x12 + x 22 − 1
5.5 KONVEKS PROGRAMLAMA PROBLEMİ
Konveks sette tanımlanan hedef fonksiyon f(x) ve kısıtlayıcı fonksiyon gi(x)’in
konveks olduğu ve optimizasyon problemine konveks programlama problemi denir.
Konveks programlama örneği ile ilgili olarak önemli bazı noktalar aşağıda verilmiştir:
1. Eğer bir f(x) fonksiyonun hessian matrisi yarı veya tam pozitif tanımlı ise o
fonksiyon konvekstir.
2. Lineer eşitlik veya eşitliksiz kısıtlayıcıları optimizasyon problemi için daima
konveks feasible alan tanımlar.
3. Nonlineer eşitlik kısıtlayıcıları daima konveks olmayan bir feasible alan
tanımlar
4. Eğer hedef fonksiyon, konveks feasible alanda konveks tanımlı ise bu tür
optimizasyon problemi konveks programlama problemidir.
5. Bir konveks programlama problemi için Kuhn-Tucker 1. derece gerek şartı
aynı zamanda o problem için yeter şartı verir ve lokal minimum aynı
zamanda global minimumdur. Bu aynı zamanda ikinci derece şartı (SecondOrder conditions for constarined optimization problem) olarak da adlandırılır.
Örnek 5.4:
Aşağıda tanımlanan optimizasyon probleminin konveks optimizasyon problemi olup
olmadığını belirleyiniz.
min f ( x1 , x 2 ) = 2 x1 + 3 x 2 − x13 − 2 x 22
s.t.
x1 + 3 x 2 ≤ 6
5 x1 + 2 x 2 ≤ 10
x1, x 2 ≥ 0
5-4
Şekil 5: Hedef fonksiyona ait yüzey ve eş yükselti eğrileri.
Örnek 5.5:
Aşağıda tanımlanan optimizasyon probleminin konveks optimizasyon problemi olup
olmadığını belirleyiniz.
min f ( x) = ( x1 − 1.5) 2 + ( x 2 − 1.5) 2
s.t.
g ( x) = x1 + x 2 − 2 ≤ 0
5.6 KISITLAMALI
ŞARTLARI
OPTİMİZASYON
PROBLEMLERİ
İÇİN
İKİNCİ-DERECE
5.6.1 Konveks problemler için yeter şart
Konveks programlama problemleri için Khun-Tucker gerek şartları aynı zamanda
yeter şartlar olur. Dolayısıyla optimizasyon probleminin konveks olduğu gösterilirse
otomatik olarak yeter şartlar sağlanmış olur.
5.6.2 Genel optimizasyon problemleri için İkinci-derece gerek şartı:
Kısıtlamasız optimizasyon problemlerinde, hedef fonksiyonun ikinci derece bilgilerini
kullanarak aday noktaların gerçekten minimum olup olmadığı belirlenmişti (Denklem
3.12 ve 3.13). Kısıtlamalı optimizasyon problemlerinde ise, aday nokta x * ‘da
kısıtlayıcıları dikkate alarak d feasible yön dikkate alınır.
5-5
Şekil 6: kısıtların yeter şartları için kullanılan d yönleri.
Kısıtlamasız optimizasyon problemlerinde belirtildiği gibi yeter şart durumunda
(d ≠ 0) dikkate alındığında x = x * + d aktif kısıtlayıcı şartını sağlaması için d kısıtlayıcı
teğet düzleminde olmalıdır. Kısıtlayıcı teğet düzlemi ile kısıtlayıcının gradyantı
ortogonal (dik) olduğundan, bu ikisinin skaler çarpımı sıfır olmak zorundadır:
∇hiT d = 0;
i = 1... p
∇g iT d = 0;
i = 1...m
(5.2)
Böylece d yönü, x * civarında bir feasible tanımlamak için belirlenir. Bu şart sadece
aktif eşitsizlik kısıtlayıcı olması durumunda d’yi bulmada kullanılır.
Dolayısıyla, ikinci-derece şartları elde etmek için Lagrange fonkisyonun Taylor
serisine açılımı kullanılır ve Denklem (5.2) şartını sağlayan arama yönü d dikkate
alınır. Kısıtlayıcı teğet düzleminde bütün d yönleri için Taylor serisinin ikinci derece
terimi pozitif ise x * lokal minimum noktadır.
5.6.2.1 GENEL BİR KISITLAMALI OPTİMİZASYON PROBLEMLERİ İÇİN İKİNCİ-DERECE GEREK
ŞART:
x * , genel optimizasyon problemi için K-T şartlarını sağlayan aday nokta olsun. x * ’da
Lagrange fonksiyonun Hessian matrisi aşağıdaki gibi tanımlanır:
p
m
i =1
i =1
∇ 2 L = ∇ 2 f + ∑ν i*∇ 2 hi + ∑ u i*∇ 2 g i
(5.3)
x * ’da aşağıda verilen lineer sistemi sağlayan feasible arama yönü (d ≠ 0) olsun:
∇hiT d = 0;
i = 1... p
∇g iT d = 0;
i = 1...m
(5.4)
Dolayısıyla x * , optimizasyon probleminin lokal minimum noktasıdır ve aşağıdaki şart
sağlanır:
5-6
Q ≥ 0 burada Q = d T ∇ 2 L(x * )d
(5.5)
Denklem (5.5)’de verilen şart, Lagrange fonksiyonun Hessian matrisinin pozitif tanımlı
olması gerekliliğini gösterir.
Bu ikinci-derece gerek şartı sağlamayan noktalar lokal minimum nokta olamaz.
5.6.2.2 GENEL KISITLAMALI OPTİMİZASYON PROBLEMLERİ İÇİN İKİNCİ-DERECE YETER
ŞARTI:
x * , genel optimizasyon problemi için K-T şartlarını sağlayan aday nokta olsun.
Denklem (5.3)’de verildiği gibi Lagrange fonksiyonun Hessianı tanımlanmış olsun.
Feasible yön ( (d ≠ 0) aşağıdaki şartları sağlayacak şekilde tanımlı olsun:
∇hiT d = 0;
i = 1... p
∇g iT d = 0;
i = 1...m
(5.6)
Burada g için u i > 0 olan aktif eşitsizlik kısıtlayıcısıdır. Ayrıca u i = 0 olan eşitsizlik
kısıtlayıcılar için ∇g iT d ≤ 0 olsun. Eğer
Q > 0 burada Q = d T ∇ 2 L(x * )d
(5.7)
ise x * izole edilmiş lokal minimum noktadır. Burada izole edilmişin anlamı; x * ’ın yakın
civarında başka bir lokal minimum nokta yoktur.
Örnek 5.6:
Aşağıda verilen optimizasyon probleminin aday minimum noktaları için yeter şartları
kontrol ediniz.
min f ( x) = x12 + x 22 − 3x1 x 2
s.t
g = x12 + x 22 − 6 ≤ 0
5-7
Download