14.12 Oyun Teorisi Muhamet Yıldız Güz 2005 Ders 16: Eksik Bilgi Statik Durum Yol haritası 1. Bayesyen nash Dengesi 2. Örnekler 3. Cournot Duopolü 4. Ufak sınav 5. Karma stratejiler 1 Bayesyen Oyun (Normal Biçim) Bayesian Game (Normal Form) Bir Bayesyen oyun, A Bayesian game is a list G = {A1,…,An;T1,…,Tn;p1,…,pn;u1,…,un} where action • A şeklinde bir listedir, ki,space of i (ai in Ai) i is the öyle • Ti is the type space of i (ti) pi(teylem beliefaiabout • Ai , i• için kümesi ∈ Ai the other players -i|ti) is i’s • ui(a1,…,an;t1,…,tn) is i’s payoff. • Ti , i için tip kümesi ti • pi (t−i |ti ), i’nin diğer oyuncular hakkındaki inanışları • ui (a1 , .., an ; t1 , ..tn ), i’nin kazancı An Example Firm W Work (1, 2) Hire Shirk High p (0, 1) Do not (0, 0) hire Nature Low 1-p Hire W Work Shirk Do not hire TFirm={tf}; TW = {High,Low} AFirm = {Hire, Don’t} AW = {Work,Shirk} pF(High) = p pF(Low) = 1-p (1, 1) (-1, 2) (0, 0) 2 2 Bir Örnek 1,2 calis I Firma Ise al calisma yuksek p 0,1 Ise alma 0,0 Doga I 1-p calis 1,1 Ise al dusuk calisma -1,2 Ise alma 0,0 Bir oyuncunun özel bilgisine, o oyuncunun ”tip”i deniyor. Mesela, yukarıdaki örnekte, işçinin iki tipi var: =Yüksek Tf irma {tf } ve Düşük. Firmanın özel bilgisi olmadığından, firmanın tek bir tipi vardır. Yukarıdaki örnekte olduğu gibi, eksik bilgli oyunlar, Doğa’nın her bir Tisci =seçtiği {Y uksek, Dusuk}özel olarak bilgilendirdiği kusurlu bilgili oyunlarla oyuncunun tipini ve oyuncuları modellenmiştir. Bu=tip oyunlar eksik bilgili oyunlar ya da Bayezyen oyunlar olarak adAf irma {Iseal, Isealma} landırılırlar. Ai = {Calis, Calisma} Formel olarak, eksik bilgili statik bir oyun şöyledir. Ilk olarak, Doğa bir t = (t1 , t2 , . . . , tn ) ∈ T seçer, öylepFki, her t ∈ T (yuksek) = p(t) p olasıliğıyla seçilir. Burada, ti ∈ Ti oyuncu i’nin, i ∈ N = 1, 2, ..., n, tipidir. Sonra, her oyuncu kendi tipini öğrenir, ama diğer oyuncuların tiplerini p (dusuk) = 1 − p F öğrenmez. Son olarak, oyuncular, sadece kendi tiplerini bilerek, eylemlerini eşzamanlı olarak seçerler. Tüm oyuncuların eylemlerinin herhangi bir listesini a = (a1 , a2 , . . . , a2 ) ∈ A ile ifade ediyoruz, öyle ki, ai ∈ Ai oyuncu i’nin eylemidir. Oyun (N, T, A, p) ile gösterilir. Her zamanki gibi, bir oyuncunun stratejisi her bilgi kümesinde hangi eylemi seçeceğini belirler. Burada, bilgi kümeleri tiplere, ti ∈ Ti , denk gelir. Dolayısıyla, oyuncu i’nin bir stratejisi si : Ti → Ai şeklinde, oyuncunun tiplerini eylemlerine atayan bir fonksiyondur. Mesela, yukarıdaki örnekte, işçinin dört stratejisi vardır: (Çalış,Çalış) - yüksek veya düşük kabiliyetli olmasından bağımsız olarak çalışacağı anlamına gelir, (Çalış, Kaytar) - yüksek kabiliyetli ise çalışacağıve düßük kabiliyetli ise kaytaracağı anlamına gelir, (Kaytar, Çalış) ve(Kaytar, Kaytar). 3 2 Bayesyen Nash Dengesi Bir Bayesyen Nash Dengesi Bayesyen bir oyunun Nash denge- Bayesian Nash equilibrium Bayesian Game (Normal Form) sidir. Verili bir Bayesyen oyun için A Bayesian Nash equilibrium A Bayesian game is a list is a Nash equilibrium of a Bayesian game. G = {A 1,…,An;T1,…,Tn;p1,…,pn;u1,…,un} Given anywhere Bayesian game G = için bir strateji sii):}Ti → Ai fonksiythe action spaceherhangi of i (ai bir in A • Ai nis;T ,…,A {Ai1oyuncusu 1,…,Tn;p1,…,pn;u1,…,u n is a theplayer type space onudur;• Tiof i) function s :T o A ; a strategy i in aofisi (tany i i i ∗ ∗ ∗ • p (t |t ) is i’s belief about the other players * Bayesyen Nash deni profile -i vektörü i Bir strateji ..., sns) bir A strategy s*s==(s(s1*1,,…, 1 ) is a Bayesian Nash ) is i’s payoff. • ui(a1,…,an;t1*,…,t gesidir ancak ve ancak alttaki problemi çözer to s-i* for equilibrium iff si s(t∗i (ti)i)nis a best response each ti, i.e., si*(ti) solves max ¦ u s t ,..., s t , a , s t ,..., s t ; t p t ai Ai ti Ti i * 1 * i1 1 i1 i * i1 * n i1 n i i | ti An Example Work W Firm Hire Shirk High p Low 1-p Firm (0, 1) Hire W Hire Work Work W Shirk Do not hire Shirk (0, 0) (1, 1)2) (1, (-1, 2) (0, 1) Do not (0, 0) hire Nature Low 1-p TFirm={tf}; TW = {High,Low} AFirm = {Hire, Don’t} AW = {Work,Shirk} pF(High) = p pF(Low) = 1-p An Example Do not (0, 0) hire Nature High p (1, 2) Hire W Work Do not hire (1, 1) 4 Shirk (0, 0) TFirm={tf}; TW = {High,Low} AFirm = {Hire, Don’t} AW = {Work,Shirk} pF(High) = p >1/2 pF(Low) = 1-p (-1, 2) sF* = Hire sW* (High) = Work sW* (Low) = Shirk Another equilibrium? 2 Bir Örnek 1,2 calis I Firma Ise al calisma yuksek p 0,1 Ise alma 0,0 Doga I 1-p calis 1,1 Ise al dusuk calisma -1,2 Ise alma 0,0 Bir oyuncunun özel bilgisine, o oyuncunun ”tip”i deniyor. Mesela, yukarıdaki örnekte, işçinin iki tipi var: =Yüksek Tf irma {tf } ve Düşük. Firmanın özel bilgisi olmadığından, firmanın tek bir tipi vardır. Yukarıdaki örnekte olduğu gibi, eksik bilgli oyunlar, Doğa’nın her bir Tisci =seçtiği {Y uksek, Dusuk}özel olarak bilgilendirdiği kusurlu bilgili oyunlarla oyuncunun tipini ve oyuncuları modellenmiştir. Bu=tip oyunlar eksik bilgili oyunlar ya da Bayezyen oyunlar olarak adAf irma {Iseal, Isealma} landırılırlar. Ai = {Calis, Calisma} Formel olarak, eksik bilgili statik bir oyun şöyledir. Ilk olarak, Doğa bir t = (t1 , t2 , . . . , tn ) ∈ T seçer, öylepFki, her t ∈ T seçilir. Burada, ti ∈ Ti oyuncu i’nin, i ∈ N = (yuksek) = p(t) p > olasıliğıyla 1/2 1, 2, ..., n, tipidir. Sonra, her oyuncu kendi tipini öğrenir, ama diğer oyuncuların tiplerini p (dusuk) = 1 − p F öğrenmez. Son olarak, oyuncular, sadece kendi tiplerini bilerek, eylemlerini eşzamanlı olarak seçerler. Tümal oyuncuların eylemlerinin herhangi bir listesini a = (a1 , a2 , . . . , a2 ) ∈ s∗F =Işe A ile ifade ediyoruz, öyle ki, ai ∈ Ai oyuncu i’nin eylemidir. Oyun (N, T, A, p) ile gösterilir. ∗ s (yuksek) =Çalış I Her zamanki gibi, bir oyuncunun stratejisi her bilgi kümesinde hangi eylemi seçeceğini belirler. Burada, bilgi kümeleri tiplere, ti ∈ Ti , denk gelir. Dolayısıyla, oyuncu i’nin bir s∗I (dusuk) =Çalışma stratejisi si : Ti → Ai şeklinde, oyuncunun tiplerini eylemlerine atayan bir fonksiyondur. Başka denge var mı? Mesela, yukarıdaki örnekte, işçinin dört stratejisi vardır: (Çalış,Çalış) - yüksek veya düşük kabiliyetli olmasından bağımsız olarak çalışacağı anlamına gelir, (Çalış, Kaytar) - yüksek kabiliyetli ise çalışacağıve düßük kabiliyetli ise kaytaracağı anlamına gelir, (Kaytar, Çalış) ve(Kaytar, Kaytar). 5 2 Başka bir Another Örnek example • T ^` known by Player 1 • J ^`known by Player 1 X TJ • All values are equally likely Y J T • T1 = {0,2}; T2 = {1,3} • Bayesian Nash Equilibrium: • s1(0) = s1(2) = X • θ ∈ {0, 2}, 1. oyuncu tarafından bilinmektedir • s2(1) = R; s2(3) = L L R • γ ∈ {1, 3}, 2. oyuncu tarafından bilinmektedir • Her değer eşit olasılığa sahip • T1 = {0, 2}, T2 = {1, 3} Cournot • Bayesyen Nash dengesi: • • • s2 (1) = R; s2 (3) = L• • • s1 (0) = s1 (2) = X Duopoly with Incomplete Info N = {1,2} firms; Price: P = 1- (q1+q2) Marginal cost of Firm 1 is c=0. Marginal cost of Firm 2 is – cH with probability T, – cL with probability 1-T. • Firm 2 knows its own marginal cost. • Strategies: q1; (q2(cH),q2(cL)) 4 6 Eksik bilgili Cournot Duopolü • N = {1, 2} firma; • Fiyat: P = 1 − (q1 + q2 ) • Firma 1 için marjinal maliyet c=0, • Firma 2 için marjinal maliyet – cH , θ olasılıkla – cL , 1 − θ olasılıkla • 2. Firma kendi marjinal maliyetini bilmektedir. • Strategies: q1 ; (q2 (cH ), q2 (cL )) 7 Cournot Duopolü - BND Cournot Duopoly - BNE Cournot Duopoly - BNE • • • • • • • q1 = [T(1-q2(cH)) + (1-T)(1-q2(cL))]/2; (cH) =2(c (1-q )/2 q1• =q2[T(1-q + H(1-T)(1-q H))1-c 2(cL))]/2; = (1-q -cL)/2 q2•(cqH2)(c=L)(1-q 1-cH1)/2 q2•(cqL1)*==(1-q (1 +1-c TcL)/2 H + (1-T)cL)/3 = H(1-2c +)/3 (1-T)(cH-cL)/6 q1•* q=2*(c (1 H+)Tc + (1-T)c H)/3 L q2H*(c = (1-2c - T(cH-c ) =L)(1-2c + (1-T)(c q2•*(c L)/6 H)/3L)/3 H-c L)/6 q2*(cL) = (1-2cL)/3 - T(cH-cL)/6 Hunt, MixedStrateji Strategy AvStag oyunu, Karma Stag Hunt, Mixed Strategy (2,2) (2,2) (0,2) (0,2) (2,0) (2,0) (4,4) (4,4) Figures by MIT OCW. Figures by MIT OCW. 5 5 8 Karma Stratejiler Mixed Strategies 2+t,2+v 2+t,0 0,2+v 4,4 U1(R|t) = 2+t U1(S|t) = 4(1-q); U1(R|t) > U1(S|t) Ù t >0 • t and v are iid with uniform on >HH@ • t and v are privately known by 1 and 2, respectively. • Pure strategy: – s1(t) = Rabbit iff t > 0; – s2(v) = Rabbit iff t>0. • p = Prob(s1(t)=Rabbit|v) = Prob(t > 0) = 1/2. • q = Prob(s2(v)=Rabbit|t) = 1/2 Figures by MIT OCW. • t ve v [−, ] üzerine tekdüze dağılıma tabi bağımsız ve aynı dağılımlıdırlar. • t ve v, sırasıyla, 1. ve 2. oyuncu tarafından özel olarak bilinmektedirler. • Saf strateji: – s1 (t) = Tavşan acak ve ancak t > 0; – s2 (v) = Tavşan acak ve ancak t > 0; • p = P rob(s1 (t) = T avsan|v) = P rob(t > 0) = 1/2. • q = P rob(s2 (v) = T avsan|v) = 1/2. 9 6