Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Teoria de Jocs, Apuntes de Historia Económica

Asignatura: Historia Economica d'Espanya, Profesor: Helena Perrone, Carrera: Administració i Direcció d'Empreses, Universidad: UPF

Tipo: Apuntes

2014/2015

Subido el 01/10/2015

20urijimenez
20urijimenez 🇪🇸

4

(1)

1 documento

Vista previa parcial del texto

¡Descarga Teoria de Jocs y más Apuntes en PDF de Historia Económica solo en Docsity! Tema 1 La incertesa, la teoria de la decisió i la interacció estratègica Com succeeix en el cas de la probabilitat, moltes accions tenen conseqüències incertes. És a dir, en molts casos no sabem què passarà si fem quelcom. Per tant, a l'hora de decidir què hem de dur a terme, és útil fer servir la teoria de la decisió, que ens indica com escollir correctament davant diverses accions arriscades o incertes. Ho entendrem millor amb un exemple. Un propietari d'un local cèntric vol muntar una empresa, però té dues opcions: Temps càlid Temps plujós i fred Beneficis Geladeria 6 0 Beneficis Llibreria 2 2 Així doncs, mentre que els guanys de l'empresa de gelats varien molt segons el clima, els de la llibreria són fixos. En altres paraules, com els beneficis de la geladeria depenen de la climatologia, que no podem controlar, són incerts. En conseqüència, es tracta d'un negoci arriscat -depenent del temps obtindràs beneficis o no-, ja que la llibreria, al proporcionar uns guanys fixos, és un negoci segur -sempre guanyaràs el mateix independentment del temps-. No obstant, tot i que no puguem controlar la climatologia, podem estimar les probabilitats de cada mena de temps. Dit d'un altre forma, podem quantificar o mesurar la incertesa, de manera que la incertesa en la presa de decisions sigui menor. Un cop tinguem aquestes probabilitats, podrem decidir a través de la teoria de la decisió. Al seu torn, existeix una versió més complexa del problema anterior, en la qual interactuen dos o més agents econòmics. Seguint l'exemple, suposem que un veí dubta entre posar una geladeria o un estanc, mentre que el propietari anterior pot muntar una llibreria o una geladeria. En aquest cas: Negoci Veí → Estanc Geladeria Beneficis Geladeria 6 0 Beneficis Llibreria 2 2 En aquest tipus de situacions emprarem la teoria de jocs, que ens ajuda a escollir la millor opció quan ens enfrontem a un context on les conseqüències de les decisions -els beneficis en l'exemple- depenent de les accions d'un altre jugador racional. Notació i risc A l'hora de plantejar certes decisions arriscades, convé introduir una certa notació per simplificar la terminologia: • Conjunt d'accions: Les opcions entre les quals pots escollir. En els exemples anteriors, són muntar una geladeria o una llibreria. Per denotar-la, usem el següent: A = (a1, a2, [...], an) Sent N el nombre d'opcions. • Estat de la natura: El que causa el risc i fa els guanys incerts. En el primer exemple seria el temps, i en el segon la decisió del veí. Per denotar-la, usem el següent: Ω = (θ 1, θ 2, [...], θ n) Sent N el nombre d'opcions. Cada una d'aquestes opcions pren una probabilitat concreta. Òbviament, cap probabilitat pot ser negativa - pi⩾0 - i la suma de totes les probabilitats ha de ser igual a 1 - ∑ pi=1 - • Conjunt de conseqüències: El que origina cada decisió. En els exemples anteriors, serien els beneficis. Per denotar-la, usem el següent: C = (c1, c2, [...], cn) Sent N el nombre d'opcions. L'exemple de les plantacions: el criteri del valor esperat Suposem que un pagès ha de decidir entre plantar quatre productes diferents: Com veiem, els guanys per cada plantació depenent del temps -tret del cas dels codonyers- i entre cada plantació hi ha molta diferència en quant als seus guanys . Per tant, com el temps no el podem controlar, ens trobem davant una decisió arriscada, on hi ha incertesa. Si suposem que la probabilitat de fred és del 50% -i, per tant, la de calor del 50%-, podem representar cada alternativa de forma numèrica: Lt = (0.5, 0.5 | 0, 100) La = (0.5, 0.5 | 20, 100) Lp = (0.5, 0.5 | -10, 140) Lc = (0.5, 0.5 | 40, 40) O gràfica: Atès que existeixen diverses alternatives, cal trobar un mètode per decidir entre elles. Una manera senzilla és el valor esperat, és a dir, el guany mig de cada plantació. Aquest sistema és útil ja que, com suposem que el pagès és racional -vol maximitzar els beneficis-, concorda amb la realitat. Recordem que: Valor Esperat = Probabilitat A * Conseqüència A + probabilitat B * cons. B + [...] Si calculem: E (t) = 0,5*0 + 0,5*100 = 50 E (a) = 0,5*20 + 0,5*100 = 60 E (p) = 0,5*(-10) + 0,5*140 = 65 E(c) = 40 Per tant, segons aquest criteri, l'elecció del pagès seria: Pomers > Ametllers > Tarongers > Codonyers No obstant, molts experiments han confirmat que les persones no acostumem a maximitzar el valor esperat, ja que tenim aversió al risc. A més, en casos excepcionals, el valor esperat no es pot calcular, com succeeix amb la paradoxa de Sant Petersburg -on el valor esperat d'un joc que consisteix en que et donen dos euros per cada tirada que facis fins que surti creu és infinit-. En conseqüència, el valor esperat no és l'indicador més adient per decidir entre alternatives arriscades. La teoria de la utilitat esperada Si les preferències o gustos sobre alternatives arriscades són coherents, podem representar-les amb funcions d'utilitat, que mostren el benestar o satisfacció que ens atorga cada opció. En altres paraules, si tenim dues alternatives o loteries qualsevol: L1 = (p1, p2, [...], pn | x1, x2, [...], xn) L2 = (p1, p2, [...], pn | x1', x2', [...], xn) I l'individu prefereix L1 a L2: L1>L2 En conseqüència, podem usar el criteri de la utilitat esperada amb ambdós projectes: U(Supermercats) = 0.021*u(200) + 0.41*u(160) + 0.559*u(130) + 0.01*u(60) U(Supermercats) = 0.021 + 0.41*0,95 + 0.559*0,85 = 0,88 U(Petroli) = 0.83*u(200) + 0.005*u(160) + 0.001*u(130) + 0.164*u(60) U(Petroli) = 0.83+ 0.005*u(160) + 0.001*u(130) = 0,84 Per tant, l'individu hauria de triar la cadena de supermercats al tenir aquesta més utilitat . En conseqüència, a l'hora de prendre decisions amb incertesa, hem de dur a terme les quatre passes següents: 1. Identificar el conjunt d'accions possibles -les diverses alternatives o opcions-, els estats de la natura o món -el que provoca incertesa o risc- i conseqüències -el que succeirà si triem fer A i no B-. 2. Traduir les preferències a utilitats. 3. Estimar les probabilitats de cada estat de la natura. 4. Calcular la utilitat esperada i maximitzar-la. Representació gràfica de la funció d'utilitat esperada Podem representar i trobar la utilitat esperada de loteries o decisions binàries -amb tan sols dues opcions- gràficament. Per fer-ho, suposem que tenim una loteria genèrica amb paràmetres qualsevol: Si calculem el valor esperat, tenim tres punts: E(Lp) = p*b + (1-p)*d Com veiem, la ubicació del valor esperat dependrà de la probabilitat -p-. Si aquesta és molt alta, estarà prop de b. En cas contrari, serà propera a d. Així doncs, podem dibuixar la gràfica: Hem realitzat els següents passos per dur a terme la representació i trobar la utilitat esperada: 1. Dibuixar la funció d'utilitat de l'individu -determinada per una funció normalment- posant els diners a l'eix de les x i el d'utilitat al de les y. 2. Afegim els dos resultats -b i d- i el valor esperat -en aquest cas, la probabilitat és 2/3- 3. Trobem les utilitats de d i b mirant el gràfic i l'eix de les y. 4. Unim els dos punts -A i B- amb una línia recta. 5. Trobem el punt C de la línia, que correspon al valor esperat -el seu valor de X és el valor esperat-. 6. Trobem la utilitat esperada, que és la y del punt C. Entendrem millor tot el procediment anterior amb un exemple. Suposem dos empresaris, A i B, que han de decidir si invertir en un projecte que pot tenir uns guanys de 40 però també hi ha la possibilitat que hi hagin unes pèrdues de 20. El primer empresari, A, té un patrimoni de 30 i el segon un de 60. En primer lloc, cal plantejar el problema: Al primer diagrama hi han reflectits els guants del projecte, i als de la dreta les dues opcions de l'empresari A. Com observem, l'individu ha de decidir tenint en compte l'impacte o efecte final en la seva riquesa. Per tant, té dues opcions: no invertir -es queda igual, amb 30- o invertir -llavors pot guanyar o perdre- . Si fem el procediment anterior, podem apreciar amb facilitat que no és convenient que faci la inversió: Tot i que no es veu amb gaire claredat, la utilitat de 30 -segona línia horitzontal discontinua- és major que la de la loteria -tercera línia-. En conseqüència, no és recomanable entrar al projecte. Per contra, l'empresari més adinerat, amb riquesa de 60, sí hauria de realitzar el projecte, com observem a la segona gràfica. Aversió al risc i equivalent cert Al llarg del tema, hem fet referència en diverses ocasions a l'aversió al risc. Com es tracta d'una característica fonamental per a la nostra anàlisi, cal definir-la correctament per veure en quines circumstàncies podem fer servir el terme. Per fer-ho, cal definir certs conceptes essencials: • Loteries actuarialment equivalents: Dues loteries que tenen el mateix valor esperat. • Loteria degenerada: Loteria que dona amb certesa -amb probabilitat 1- un valor esperat concret d'un altre loteria. Concretament, diem que L i L* són actuarialment equivalents, i L* és degenerada: Podem relacionar l'aversió al risc amb el gràfic de la funció d'utilitat ja que, si un individu prefereix L* a L vol dir que la utilitat de la primera és major i, per tant, la funció serà còncava, com podem observar al gràfic: Per tant, diem que l'individu és: • Avers al risc si sempre prefereix L* a L. En conseqüència, la funció és estrictament còncava -la segona derivada és negativa-. • Neutral al risc si sempre és indiferent entre L i L*. En conseqüència, la funció és còncava -la segona derivada és zero-. • Inclinat al risc si sempre prefereix L a L*. En conseqüència, la funció és estrictament convexa -la segona derivada és positiva-. Un altre concepte rellevant és l'equivalent cert, que indica quina quantitat de diners segurs -amb probabilitat 1- és indiferent a una loteria. O sigui: U[C(L)]= U(L) = p*u(b) + (1-p)*u(d) Diem que una persona té: • Aversió al risc si prefereix triar un equivalent cert inferior al valor esperat de L. • Neutralitat al risc si és indiferent entre triar un equivalent cert igual al valor esperat de L. • Inclinació al risc si prefereix triar un equivalent cert superior al valor esperat de L. Compra i venda d'actius arriscats Un individu, amb riquesa 4 i funció d'utilitat 3√ x , té un bitllet de loteria que atorga un 25% de probabilitats de guanyar 12. En cas contrari no guanya res. Per quin preu estaria disposat a vendre'l? En aquest cas, tenim dues opcions: vendre el bitllet -obtenim 4+x, on x és el preu de venda- o no vendre'l i provar sort. Gràficament: Utilitzant el criteri de la utilitat esperada, l'individu escollirà el que li proporcioni major utilitat. És a dir, vendrà el bitllet si la utilitat de la segona opció és superior o igual a la de la primera. Per tant, senzillament calculem la utilitat esperada de la primera opció: U(L qualsevol) = p1*u1 (x1) +[...]+ pn*un (xn) U(L1) = 0.25*u(16) + 0.75*u(4) = 0.25*2.51 + 1.59*0.75 = 1,82 El preu mínim de venda ha de ser 1,82. òptima, hem de veure què proporciona més utilitat: U(100) = ln(100) = 4,6 U(L) = 0,6 u(140) + 0,4U(50) = 4,53 És millor invertir a H. No obstant, podem repartir la riquesa per tal de trobar el valor òptim de x -la proporció- que hauríem d'invertir a l'arriscat. Per fer-ho, plantegem un problema de maximització basat. Per una banda, invertim en l'actiu no arriscat 1-x, és a dir, allò que NO invertim en l'arriscat: Inversió actiu segur = 100*(1-x) Inversió actiu arriscat = 100*x Inversió total = 100x + 100*(1-x) Un cop tenim això, plantegem les dues opcions: Pèrdua a l'arriscada = 100(1-x) + 100x*0,5 = 100 – 100x + 50x = 100-50x Benefici arriscada = 100(1-x) + 100x *1,4 = 100 -100x + 140x = 100 + 40x Per tant: Funció a maximitzar: U(x) = 0,4*ln(100-50x) + 0,6*ln(100+40x) amb restricció 0⩽x⩽1 Derivem la funció: U'x = 0,4∗(−50) 100−50x + 0,6∗40 100+40x = −20 100−50x + 24 100+40x Igualem a zero i operem: 20 100−50x = 24 100+40x 20∗(100+40x)=24∗(100−50x )→2000+800x=24∗(100−50x)=2400−1200x 2000x=400→ x= 400 2000 = 4 20 = 2 10 =0,2 X ha de ser del 20%. Tanmateix, hem d'avaluar les solucions de cantonada o els límits de la restricció -x=0 i x=1-. En conseqüència: Solució Funció Utilitat Utilitat X=0 U(L) = 0,6 u(140) +0,4U(50) 4,53 X=1 u(x) = ln(x) = ln(100) 4,6 X=0,2 u(L) =0,4* ln(90) + 0,6*u(108) 4,61 És rendible, per tant, diversificar. Tema 2 Jocs en forma extensiva i d'inducció cap enrere Fins ara, hem estat quantificant o mesurant la incertesa per tal de millorar les nostres decisions en un entorn arriscat. És a dir, les conseqüències de les nostres decisions depenien d'un factor, anomenat estat de la natura o del món, que provocava el risc. En aquest tema, però, introduirem la interacció estratègica, en altres paraules, ara les nostres decisions no dependran tan sols de l'atzar o d'un element concret sinó que també es veuran influïdes per les accions d'un altre individu o agent econòmic. Per explicar aquest nou canvi i els tipus de jocs o situacions amb les que ens trobarem, és útil posar un exemple. L'empresa B té el monopoli de venda d'aliments d'una població concreta i obté uns guanys de 20. Tanmateix, la societat A està plantejant-se entrar en el sector alimentari, però també té la opció de dur a terme un projecte independent i aconseguir 5 de benefici. Així doncs, B té dues alternatives: • Projecte independent: Guanys de 5 independentment del que faci B. • Entrar al mercat i competir: En aquest cas, B pot respondre de dues formes. ◦ Pactar preus i repartir-se la quota de mercat: B obté 10 i A 7 de benefici. ◦ Guerra de preus: B obté 0 i A -3. És la opció amb la que B ha amenaçat a A. Si ho posem en forma de taula, tenim que: Empresa A Empresa B Pactar Guerra Pactar Guerra Entrar 7 -3 Entrar 10 0 No entrar 5 5 No entrar 20 20 Si ho posem en forma d'arbre de decisions, l'empresa A juga primer i B decideix després. Dit d'un altre forma, primer la societat A decideix si entrar al mercat o no i, posteriorment, B actua en conseqüència. Com veiem, si A opta pel projecte independent, el monopoli no ha de decidir res al no tenir competència. Cal dir que aquest joc només es juga una vegada, o sigui, un cop A ha entrat al mercat ja no pot fer-se enrere. És a dir: La millor manera de plantejar aquesta mena de jocs és la inducció cap enrere. En altres paraules, anticipar què farà el rival i decidir en conseqüència. Atès que si l'empresa A decideix entrar al mercat, B ha de triar entre 10 -pactar- i zero -guerra-; escollirà tenir 10 de guanys i, per tant, pactarà preus. Així doncs, A ha d'entrar al mercat ja que guanyarà 7 en comptes de 5. O sigui, l'amenaça de B no era creïble. Elements essencials d'un joc Per tal de definir els components bàsics d'un joc, posarem un exemple per aclarir-ho millor. Teresa Amer és l'alcaldessa d'una ciutat i Jordi Brau vol presentar-se a les eleccions municipals. Per evitar tenir competència, l'alcaldessa està considerant dur a terme una campanya electoral poc convencional, que desacrediti el seu candidat. Per tant, Amer ha de decidir si realitzar la campanya o no, mentre que Brau té la opció de presentar-se o retirar-se. Respecte a les preferències, Amer no vol tenir competència i, a més, voldria estalviar- se els costos de la campanya. Al seu torn, Brau preferiria entrar sense la campanya però, en cas que es retirés, preferiria fer-ho amb la campanya que sense per no ser acusat de covard. La seva pitjor opció seria entrar i que s'hagués iniciat la campanya, atès que el seu futur com a polític quedaria destruït. Així doncs, l'arbre de decisions és el següent: Com veiem, Amer mou primer i brau actua després. A la vegada, hem inclòs les utilitats de cada opció. D'aquesta manera, entrar amb la propaganda és la pitjor opció per a ambdós agents, ja que brau no té futur com a polític i Amer té un competidor i ha gastat en la propaganda. Novament, resolem el problema per inducció cap enrere: • Si Amer NO fa la propaganda: Brau ha de decidir entre entrar -4- i retirar-se -2-, com entrar li proporciona més utilitat, entra. • Si Amer fa la propaganda: Brau es retira al ser aquesta la millor opció. Com Amer anticipa tot això, ha de decidir entre una utilitat de 3 -fer la propaganda i que Brau es retiri- i una de 2 -no fer la propaganda i que Brau entri-. Com tria la millor opció per ella, la propaganda, Brau es retirà i, conseqüentment, l'equilibri del joc o el seu resultat serà (3,3). Un cop explicat aquest joc, podem definir els conceptes essencials: • Jugadors: Qui pren les decisions. En el nostre cas, són Amer i Brau. • Accions: Totes les alternatives o opcions que posseeix cada jugador. • Trajectòria: La successió de jugades o opcions que realitzen els jugadors. • Informació: En el nostre cas, la informació és perfecte. És a dir, tots els jugadors poden veure totes les accions. • Supòsits o coneixement comú: A l'hora de plantejar i solucionar jocs, suposem que tots els jugadors entenen de la mateixa forma les regles del joc i tenen criteris comuns pels següents aspectes: ◦ La llista de jugadors: Coneixen tots els individus que juguen. ◦ Accions disponibles: Saben totes les opcions possibles del joc. ◦ Utilitats: Saben totes les utilitats per cada opció. ◦ Els jugadors són racionals. ◦ Cada jugador sap que tots els altres també tenen el mateix coneixement. • Estratègia: És un pla contingent complet. O sigui, el jugador sap què farà en totes les circumstàncies possibles. • Equilibri: Resultat del joc. Té diversos components: ◦ Trajectòria o accions d'equilibri: En aquest cas, és p-r (propaganda i retirar- se). ◦ Les utilitats d'equilibri són (3,3) ◦ El perfil d'equilibri és un vector amb les estratègies de cada individu com a components. O sigui, (p,(e,r)). És a dir, Amer fa propaganda i Brau pot entrar o retirar-se. Amenaces creïbles Per explicar com esbrinar si les amenaces són creïbles o no, és convenient plantejar el problema de la batalla d'Hernán Cortés i les seves tropes contra l'imperi asteca de Moctezuma. Un cop va conquistar les primeres tribus i va agafar el seu or, les tropes de Cortés volien fugir en comptes d'atacar l'imperi per obtenir més or. És a dir, hi havia la situació següent: Cortés va amenaçar a Moctezuma d'atacar si l'imperi l'ataca primer, però, com podem apreciar, l'amenaça no és creïble atès que amb a-a tots dos obtindrien utilitat zero. L'espanyol preferia, doncs, fugir i aconseguir utilitat 1. Tanmateix, si Hernán Cortés té la opció de cremar les naus, la conjuntura canvia: O sigui, Hernán crema les naus tallant qualsevol possibilitat de retirada i Moctezuma fuig per tal d'aconseguir més utilitat. Tema 3 Decisions simultànies i jocs en forma normal Al tema anterior, hem introduït la interacció estratègica. És a dir, jocs en el que el resultat depèn de les accions de dos jugadors. No obstant, tots els jocs eren “per torns”, o sigui, les decisions no es prenien de forma simultània. En aquest tema veurem què succeeix en els casos on ambdós jugadors decideixen alhora. Novament, posarem un joc com a exemple i a partir del mateix desenvoluparem el tema. Imaginem que dos estudiants que han de fer un treball junts, A i B, han de decidir el seu nivell d'esforç al treball. Si s'esforcen molt, trauran bona nota al treball però disposaran de menys temps per estudiar. Per tant, l'opció òptima és que el company treballi molt i ells puguin dedicar-se a preparar l'examen. Per tal de poder apreciar millor les opcions, representarem el joc en forma normal o de taula: A \ B Esforç alt Esforç baix Esforç alt 2; 2 0; 4 Esforç baix 4; 0 1; 1 Explicant la taula anterior, veiem que si un s'esforça molt i l'altre poc, el segon tindrà més temps per estudiar i obtindrà un excel·lent -utilitat 4- mentre que l'altre suspendrà per manca de temps de preparació -utilitat 0-. Si tots dos s'esforcen poc, aprovaran -utilitat 1- i si tots dos col·laboren tindran un notable -utilitat 2-. Així doncs, les utilitats de A estan representades primer i les de B després -A tria fila i B columna-. Explicat això, si comparem les dues estratègies, tenim que: • Si B tria un nivell d'esforç alt: A ha de decidir entre esforçar-se molt -2- o poc -4-. Per tant, s'esforçarà poc al obtenir major utilitat. • Si B tria un nivell d'esforç baix: A ha de decidir entre esforçar-se molt -0- o poc -1-. Per tant, s'esforçarà poc al obtenir major utilitat. En conseqüència, independentment del que faci B, A ha de triar un esforç baix. Al seu torn, B farà el mateix i l'equilibri final serà de (1, 1) amb perfil estratègic (Baix, baix). No obstant, com veiem, es tracta d'un equilibri pareto-ineficient atès que podríem incrementar la utilitat dels dos jugadors situant-nos al punt (2,2). Equilibri d'estratègies dominants i el dilema del pres El joc anterior ens serveix per introduir un concepte fonamental en teoria de jocs: la dominància. Distingim diversos termes: • Estratègia dominant: Una estratègia S1 és dominant si proporciona més utilitat que totes les altres per totes les estratègies dels altres jugadors. Dit d'un altre forma, independentment del que faci l'altre jugador obtindràs més utilitat amb aquesta estratègia. En el cas anterior, l'esforç baix domina a l'esforç alt. • Estratègia dèbilment dominant: Una estratègia S1 és dèbilment dominant si proporciona com a mínim la mateixa utilitat que totes les altres per totes les estratègies dels altres jugadors. Dit d'un altre forma, independentment del que faci l'altre jugador obtindràs com a mínim la mateixa amb aquesta estratègia. En el cas anterior, l'esforç baix domina -i, per tant, també domina dèbilment- a l'esforç alt. • Estratègia dominada: Una estratègia és dominada si un altre proporciona una major utilitat independentment del que faci l'altre jugador. En el cas anterior, l'esforç alt era dominat pel baix. • Estratègia dèbilment dominada: Una estratègia és dominada si un altre proporciona com a mínim la mateixa utilitat independentment del que faci l'altre jugador. En el cas anterior, l'esforç alt era dominat -i, per tant, també dèbilment- pel baix. • Equilibri d'estratègies dominants: Existeix si cada jugador té una estratègia dominant. L'anterior joc, per exemple, el tenia. Al seu torn, podem relacionar el joc de les notes amb el famós dilema del pres, que consisteix amb un joc amb la forma: 1 \ 2 Cooperar Desertar Cooperar B, B D, A Desertar A, D C,C On: A > B > C > D. És a dir, ambdós jugadors estan millor si cooperen atès que l'equilibri és pareto-ineficient. Eliminació iterada d'estratègies dominades En certs casos, no existeix una estratègia dominant pels dos jugadors i, per tant, no podem resoldre'l mitjançant un equilibri d'estratègies dominants. Quan això succeeix, hem d'aplicar la tècnica següent, consistent en eliminar les estratègies dominades. Si suposem el joc següent: 1 \ 2 a b c x 2; 5 2; 0 2; 2 y 5; 0 1; 1 3; 2 z 4; 1 0; 4 1; 3 Primer, observem que no hi ha un equilibri en estratègies dominants: no existeix cap opció superior a totes les altres. El jugador 2 no té cap estratègia dominada, però el jugador 1 sí: y domina z. O sigui, independentment del que faci 2 mai triarà z. Per tant, podem suprimir z: 1 \ 2 a b c x 2; 5 2; 0 2; 2 y 5; 0 1; 1 3; 2 Si ens fixem, com 2 sap que 1 és racional i mai jugarà z, també l'elimina. A més, considerant el nou escenari, c domina b, atès que independentment del que faci 1 és millor triar b que c. En conseqüència: 1 \ 2 a c x 2; 5 2; 2 y 5; 0 3; 2 Ara y domina a x. Així doncs: 1 \ 2 a c y 5; 0 3; 2 Entre 0 i 2, el segon jugador triarà 2, de forma que l'equilibri és (y,c) amb utilitats (3,2). Aquest tipus de jocs que es poden resoldre amb l'eliminació iterada o amb l'equilibri per estratègies dominants són resolubles per dominància, i suposen dos aspectes: • Els jugadors són racionals: Per tant, mai jugaran una estratègia dominada. • Els jugadors saben que els contrincants són racionals: O coneixement de racionalitat. Eliminació iterada d'estratègies dèbilment dominades i localització En cas que no hi hagi cap estratègia dominant ni dominada, podem resoldre un joc amb l'eliminació iterada d'estratègies dèbilment dominades. Com a mostra: Tema 4 L'equilibri de Nash Un cop introduïdes les decisions simultànies, cal definir un concepte elemental en teoria de jocs: l'equilibri de Nash. Per fer-ho, considerarem el joc posterior i explicarem el concepte a partir del mateix: 1 \ 2 E C D S 2; 0 0; 3 0; 4 M 0; 0 1; 1 0; 0 B 0; 4 0; 3 2; 0 Com sempre, el primer nombre representa la utilitat del primer jugador i el segon terme la del contrincant. Es pot apreciar amb facilitat que no existeix cap estratègia dominada ni dèbilment dominada, per la qual cosa el joc NO és resoluble per dominància. Cal mirar, per tant, si hi ha estratègies racionalitzables destriant les alternatives òptimes en cada cas: 1 \ 2 E C D S 2*; 0 0; 3 0; 4* M 0; 0 1*; 1* 0; 0 B 0; 4* 0; 3 2*; 0 Novament, cercar les estratègies racionalitzables no resol el joc atès que com a mínim cada alternativa és una opció òptima a una estratègia de l'altre jugador -per exemple, B és l'opció òptima del jugador 1 si 2 escull D-. En conseqüència, en aquests casos on cap dels conceptes anteriors resol el joc, emprem l'equilibri de Nash. Bàsicament, hi ha un equilibri de Nash quan ambdós jugadors responen òptimament al que farà l'altre. És a dir, en aquest cas el perfil estratègic (M, C) amb utilitats d'equilibri (1, 1) és un equilibri de Nash ja que si el jugador 1 tria M, el contrincant triarà C; mentre que si el contrincant escull C, 1 optarà per M. O sigui, en un joc de dos jugadors, un perfil estratègic amb dos respostes òptimes és un equilibri de Nash. Conseqüentment, en un equilibri d'aquest tipus, cap jugador tindrà incentius a desviar-se. Al seu torn, existeixen certes justificacions per l'equilibri de Nash, que volen provar que és un bon indicador del comportament dels agents: • Prescripció de com jugar: Si una proposta de com jugar és un equilibri de Nash, ningú tindrà incentius per desviar-se. • Comunicació prèvia: Si tots els jugadors es posen d'acord per jugar una opció, aquesta ha de ser necessàriament un equilibri de Nash. • Introspecció racional: Com cada jugador voldrà fer el que més li convé, l'equilibri de Nash serà un equilibri del joc perquè tots els jugadors trien una opció òptima per ells. • Processos de prova i error: Si dos jugadors volen resoldre el joc per un procés aproximatiu o de prova i error, anirien canviant d'equilibri fins a arribar a un equilibri de Nash. Així doncs, podem concloure que un perfil estratègic (s1*, s2*) és un equilibri de Nash si cap jugador pot trobar una resposta millor a s2* o a s1* respectivament . De manera formal: u1(s1 ' , s2 ' )⩾u1(s1 , s2 ' ) per a tota estratègia del jugador 1. u2(s1 ' , s2 ' )⩾u2(s1 ' , s2) per a tota estratègia del jugador 2. Cal dir, no obstant, que no sempre existeix un equilibri de Nash i que moltes vegades hi han múltiples equilibris de Nash. Els jocs de coordinació i els equilibris de Nash estrictes Per entendre millor l'equilibri de Nash, és útil considerar el joc de coordinació següent: 1 \ 2 A B A 1*, 1* 0; 0 B 0; 0 2*; 2* Com veiem, el joc anterior posseeix dos equilibris de Nash. Tanmateix, el perfil estratègic (B, B) amb utilitats (2; 2) pareto-domina a l'altre equilibri, de manera que no resulta molt creïble que (A; A) sigui un equilibri de Nash. Bàsicament, (A;A) és un equilibri de Nash ja que és la resposta òptima a una percepció: si tots dos creuen que l'altre anirà a A, el millor és anar-hi. Per tant, com no tenen incentius per canviar, és un equilibri de Nash. A la vegada, un equilibri de Nash és estricte si l'estratègia òptima és millor que totes les altres. O sigui, si el jugador 1 tria A; no hi ha cap estratègia que proporcioni al menys la mateixa utilitat que la de l'equilibri de Nash. Formalment: u1(s1 ' , s2 ' )>u1(s1 , s2 ' ) per a tota estratègia del jugador 1. u2(s1 ' , s2 ' )>u2(s1 ' , s2) per a tota estratègia del jugador 2. Existència dels equilibris de Nash i eliminació iterada Com hem dit, en certs jocs NO existeix un equilibri de Nash, com en el de parells i senars: 1 \ 2 p s p 1*, -1 -1; 1* s -1; 1* 1*; -1 Al tema posterior aprofundirem en més estratègies i veurem que gairebé tots els jocs tenen un equilibri de Nash. Al seu torn, si considerem el repartiment d'una herència: P \ R acceptar rebutjar equitatiu 2; 2* 0*; 0 desigual 3*; 0* 0*; 0* Hi ha, per tant, dos equilibris de Nash: (desigual, acceptar) i (desigual, rebutjar). A més, veiem que desigual domina dèbilment a equitatiu i acceptar a rebutjar. Així doncs, podem establir diverses regles relatives a l'equilibri de Nash i l'eliminació iterada d'estratègies: • Tot equilibri de Nash del joc reduït per eliminació iterada d'estratègies dèbilment dominades és també un equilibri del joc original. És a dir, si suprimim rebutjar i equitatiu ens queda (desigual, acceptar), que és un equilibri de Nash. • L'eliminació anterior pot eliminar algun equilibri de Nash, com (desigual, rebutjar). Per tant, no és recomanable fer-la servir. • Els equilibris de Nash estrictes sobreviuen a l'eliminació iterada d'estratègies dèbilment dominades. • Els equilibris de Nash sobreviuen a l'eliminació d'estratègies dominades. Càlcul probabilitats En certes ocasions, pot ser útil calcular quina proporció de persones ha de triar una determinada opció perquè triar B atorgui uns pagaments o una utilitat major. Per exemple, si tenim el següent joc: A B A 3; 3 0; 0 B 0; 0 1; 1 I volem mesurar quina proporció de persones ha de triar B perquè triar B reporti uns pagaments majors que A. Per fer-ho, simplement hem de cercar la probabilitat tal que triar A i B proporcioni els mateixos pagaments o utilitat. O sigui: Pagaments A = Pagaments B u(A) = u(B) Si p és la probabilitat que els contrincants escullin B: 3* (1-p) + 0*p = p + 0*(1-p) 3 -3p = p p = 0.75 Com veiem, si triem A podem tenir un pagament de tres per totes les persones que optin per A -equivalents a la proporció dels individus que NO han triat B- o un de zero per tots els jugadors que triïn B. Amb la utilitat de B succeeix quelcom similar. Llavors, si més del 75% de les persones tria B, la opció idònia és triar B ja que reporta més utilitat. És a dir, la probabilitat que maximitza el pagament mínim garantit del jugador 1 és 0,5 . Per tant, p=0.5 és l'estratègia mixta segura d'aquest jugador perquè és la que atorga el major pagament garantit. El mateix succeeix amb el seu contrincant: Utilitat de 2 si 1 juga a = U1(a, p) = 2p + 6*(1-p) = 2p +6 -6p = 6-4p Utilitat de 2 si 1 juga b = U1(b; p) = 4p + 0*(1-p) = 4p Igualem: 4p = 6 -4p → 8p = 6 → p = 3/4 = 0.75 = 75% Tanmateix, cal dir que en els jocs que NO són estrictament competitius aquesta estratègia no té gaire sentit. Com a mostra, si considerem el següent joc: És preferible que el primer jugador opti per l'equilibri de Nash (b,d) a jugar a, que té un pagament mínim garantit de 1. Finalment, cal dir que el matemàtic John von Neumann va provar amb el teorema del minimax que en tot joc de suma zero -i, per tant, de suma constant, ja que podem transformar un joc de suma constant en un de suma zero- existeix un valor de p1 i p2 que permet aconseguir als dos jugadors un pagament mínim garantit de m1=v i m2 = -v. Tema 6 Equilibri de Nash en estratègies mixtes Al tema anterior hem introduït el concepte d'estratègies mixtes, és a dir, el jugador realitza la opció A amb una probabilitat concreta i tria l'alternativa B un altre % dels cops . Aquesta mena d'estratègies no tan sols serveixen pels jocs de suma zero o suma constant sinó per qualsevol tipus de jocs. Així doncs, si considerem el joc següent: Veiem que no hi ha cap equilibri de Nash en estratègies pures. Per tant, en aquest cas hem d'emprar les mixtes per trobar-lo. No obstant, a diferència del tema anterior, no usarem estratègies mixtes segures -que maximitzen el pagament mínim-, sinó que farem servir un mètode lleugerament diferent. Concretament, calcularem les funcions de resposta òptima. En altres paraules, què és el millor que pot escollir cada jugador tenint en compte l'opció que ha triat l'altre. Així doncs, en primer lloc calcularem la funció de resposta òptima del treballador. Si l'empresari l'inspecciona amb probabilitat q -tria c el q% de les vegades-, la seva utilitat és: Utilitat de J1 si tria d i J2 tria c el q% dels cops = U(d,q) = 50q +50-50q = 50 Utilitat de J1 si tria g i J2 tria c el q% dels cops = U(g,q) = 0q +100-100q = 100-100q Un cop tenim això, la millor forma de calcular la funció és trobar la probabilitat q que causa que al jugador 1 li sigui indiferent escollir d o g. És a dir, si J2 tria c un q% dels cops, d i g atorguen la mateixa utilitat a J1. En conseqüència, com proporcionen la mateixa utilitat, igualem: U(d,q) = 50 =100-100q= U(g,q) 50=100q → q=50/100=1/2 O sigui, si el jugador 2 tria C el 50% de les vegades, d i g atorguen la mateixa utilitat al segon jugador. Trobada la probabilitat o punt d'indiferència, convé preguntar-nos què és millor pel primer jugador si, per exemple, J2 tria C menys d'un 50% dels cops. La manera més senzilla de veure-ho és suposar que J2 MAI tria c -per tant, sempre escull n-. Si J2 tria N, el millor per J1 és triar g -que li atorga un pagament de 100, mentre que si tria d obté 50-. De forma idèntica, si J2 SEMPRE tria C -si q és superior al 50%-, el millor pel primer jugador és triar d atès que proporciona un pagament de 50 -en comptes del pagament de 0 de d-. Si ens fixem, un cop hem fet tot això, ja tenim la funció de resposta òptima del J1 per cada cas: Si q<0.5 → p=0 -triar g sempre- B1(q)1= Si q=0.5 → qualsevol p -totes les opcions atorguen la mateixa utilitat- Si q>0.5 → p=1 -triar d sempre- Pel que fa al jugador 2, duem a terme un procés idèntic. Si J1 tria d amb probabilitat p: Utilitat de J2 si tria c i J1 tria d el p% dels cops = U(p,c) = 90p-10+10p=100p-10 Utilitat de J2 si tria n i J1 tria d el p% dels cops = U(p,n) = 100p-100+100p=200p-100 Calculem el punt d'indiferència: U(p,c) = 100p-10 = 200p-100 =U(p,n) 100p=90 → p=0.9 Si p<0.9 → q=1 -triar c sempre- B2(p)= Si p=0.9 → qualsevol q -totes les opcions atorguen la mateixa utilitat- Si p>0.9 → q=0 -triar n sempre- 1 Benefici del jugador 1 en funció de q Per tant, si dibuixem ambdues funcions de resposta òptima, veurem que: L'equilibri de Nash s'assoleix en les probabilitats d'inferència. Aleshores, l'equilibri de Nash en estratègies mixtes en aquest joc és (0.9, 0.5). O sigui, com l'equilibri de Nash indica la resposta òptima a la tria d'un altre jugador, el millor que pot fer J1 és tria d un 90% dels cops i J2 triarà c un 50% de les vegades. Els pagaments d'equilibri són: U1(0.9, 0.5) = 0.9*[50*0.5+50*0.5] + 0.1*[0*0.5+0.5*100] U1(0.9, 0.5) = 0.9*[50] + 0.1*[50] = 50 U2(0.9; 0.5)= 0.5*(90*0.9-10*0.1) + 0.5*(100*0.9-100*0.1) U2(0.9; 0.5)= 0.5*(80) + 0.5*(80) = 80 Són (50, 80). En conseqüència, a l'hora de trobar un equilibri de Nash en estratègies mixtes, hem de seguir els següents passos: • Definir les funcions d'utilitat d'ambdós jugadors tenint en compte que el contrincant fa servir una estratègia mixta -juga una opció amb probabilitat p o q-. • Igualar les funcions per trobar la probabilitat d'indiferència, que atorga la mateixa utilitat per cada opció possible. • Trobar les funcions de resposta òptima. Definició formal i altres propietats Recordem novament que un joc és un equilibri de Nash si cap jugador pot trobar una resposta millor a q* o p* respectivament: A més, la opció òptima en tots els equilibris de Nash en estratègies mixtes és triar la probabilitat d'indiferència, és a dir, la probabilitat que provoca que totes les estratègies proporcionin la mateixa utilitat. A la vegada, la possibilitat de fer servir estratègies mixtes ens permet establir les condicions d'existència de l'equilibri de Nash. O sigui, un joc posseeix com a mínim un equilibri de Nash si: • El nombre de jugadors és finit. • El nombre d'estratègies de cada jugador és finit. També cal dir que en un joc de suma zero l'equilibri de Nash trobat amb el mètode anterior és el mateix que el trobat amb l'estratègia maximin. És a dir, ambdós equilibris maximitzen el pagament mínim. B2(q2) = (140-20-q1-q2)*q2 = 120*q2-q2²-q1*q2 Com hi han infinites estratègies, hem de trobar la resposta òptima maximitzant: B1'q1= 120-2*q1-q2 = 0 → q1=60-q2/2 B2'q2= 120-2*q2-q2 = 0 → q2=60-q1/2 Substituïm q1 a la darrera equació: q2=60- (60− q2 2 ) 2 =60−30+ q2 4 =30+ q2 4 q2*0.75 = 30 → q2=30/0.75=40 q1= 60-40/2=40 Les respostes òptimes són, per tant, (40, 40); mentre que el preu serà 60. Aplicacions: Duopoli de Bertrand Si considerem la funció de demanda següent -la mateixa que abans-: q = 140-p Però ara la variable estratègica -la que s'ha de triar- és el preu, ja que els consumidors compren a qui posi el preu més baix, tenim un problema considerablement diferent a l'anterior. En altres paraules, NO es pot resoldre per optimització ja que la funció de guanys és definida a trossos -discontínua-: En conseqüència, necessitem un raonament diferent de tipus lògic. Com en un equilibri de Nash cap jugador té incentius a escollir quelcom diferent, usarem aquesta propietat per resoldre el joc: • Si un preu fos inferior al cost, l'empresa estaria millor no produint ja que tindria pèrdues. Per tant, pi<c NO és un equilibri de Nash. • Si c<p1<p2, l'empresa 2 voldria rebaixar el preu per obtenir guanys. Aleshores, tampoc és un equilibri. • Si c<p1=p2, ambdues voldrien rebaixar un cèntim el preu per abastar tot el mercat. Aleshores, tampoc és un equilibri. • Si c=p1<p2, l'empresa 1 voldria pujar molt lleugerament el preu per obtenir guanys. Aleshores, tampoc és un equilibri. • Si c=p1=p2, cap empresa té incentius a desviar-se. Aleshores, és un equilibri. Tema 7 Representar un joc extensiu en forma normal Als primers temes del curs, realitzàvem jocs seqüencials o per torns que representàvem en forma extensiva. És a dir, primer jugava un jugador i després l'altre. Aquests jocs també poden plasmar-se en forma normal. Per exemple, si tenim el joc posterior: Podem representar els pagaments per les diverses estratègies de Amer i Brau. Com NO és simultani -ja que els jugadors actuen per torns-, hem de representar totes les estratègies: A \ B (e,e) (e,r) (r,e) (r,r) p 1; 1 1; 1 3; 3 3; 3 n 2; 4 4; 2 2; 4 4; 2 Comprovem que (r,e) domina dèbilment a totes les altres estratègies i, per tant, el perfil estratègic o equilibri de Nash coincideix amb el de la inducció cap enrere. O sigui, l'equilibri és [p,(r,e)] amb utilitats (3; 3). Representar un joc normal en forma normal i conjunt d'informació Podem realitzar el procés invers. Si tenim un joc en forma normal: El més lògic seria representar-lo així en forma extensiva: No obstant, el joc és simultani i, per tant, hem de plasmar que el jugador B no sap què farà A. Per fer-ho, duem a terme una línia discontínua de punts: La línia de punts indica un conjunt d'informació. En altres paraules, un conjunt de nodes de decisió on: • Tots els nodes són del mateix jugador. • Tots els nodes posseeixen les mateixes opcions. • El jugador no pot saber a quin node està per la presència d'accions amagades. El pòquer del mentider Un bon exemple per distingir la funció del conjunt d'informació és el següent. Primer considerarem el cas d'informació perfecte, és a dir, no hi ha accions amagades -els jugadors saben perfectament el que fan els altres-. En aquest cas, si el resolem per inducció cap enrere, els perfils estratègics són (a,b) si és A i (k, a) si és K. Les utilitats d'equilibri són (0,0) atès que la probabilitat de cada perfil és 0.5. Al seu torn, si ningú pot veure res: El joc anterior no es pot resoldre per inducció cap enrere ja que és impossible saber el que farà el contrari. Aleshores, l'hem de representar en forma normal i calcular els equilibris de Nash per solucionar-lo. Com és simultani: 1 \ 2 a b A -10*, 10* 10*; -10 K -10*, 10* -10; 10* Hi ha dos equilibris ressaltats en negreta que atorguen les mateixes utilitats (-10, 10). Finalment, en el cas que el J1 vegi la carta i el J2 no -la opció més lògica-, tenim el joc en forma extensiva següent: Així doncs, com a partir del segon 1 el joc és simultani, considerem el següent subjoc en forma normal -on K és un nombre molt gran-: 1 \ 2 D R D -K*, -K* -K, -K* R -K*, -K -1*; -1* En conseqüència, tenim dos equilibris de Nash en aquest subjoc, de manera que, a diferència de quan tenim un -on hem de substituir el segon 1 per les utilitats del joc-, hem de realitzar el procés dos cops. Pel primer equilibri, tenim que: El joc anterior és fàcilment resoluble per inducció cap enrere: el J2 prefereix -2 a -K i tria B. D'altra banda, J1 prefereix 2 a zero i escull E. Per tant, la trajectòria d'equilibri és E-B amb utilitats (2, -2). Al seu torn, les estratègies de l'equilibri són més difícils de trobar, ja que hem d'especificar tot el que faran els jugadors. En primer lloc, si ens remuntem al joc original -la figura superior a la taula-, J1 juga E i D per arribar a l'equilibri de Nash en el subjoc. J2 fa el mateix amb D. Aleshores, el perfil estratègic per aquest equilibri és ((E, D); (B, D)). Pel que fa a l'altre equilibri, duem a terme un procés similar. Primer, substituïm el subjoc per les utilitats de l'altre equilibri de Nash (-1, -1) i trobem l'equilibri per inducció cap enrere -que correspon amb l'ENPS-. O sigui: En aquest cas, la trajectòria de l'ENPS és I ja que 2 prefereix -1 a -2 i, sabent-ho, J1 triarà I. El perfil estratègic és ((I, R),(A, R)); pel mateix raonament que hem fet abans. Duopoli de Strackelberg Aquest duopoli és molt similar al de Cournot, però és seqüencial. O sigui, l'empresa 1 decideix sabent el que fa la 2. Per tant, sabem que la funció de beneficis de l'empresa 2 és: Si optimitzem -com vam veure al tema 6-: Per la seva banda, l'empresa 1 anticipa tot això i optimitza tenint en compte l'elecció òptima del seu contrincant: Si optimitza: 60-q1=0 → q1=60 Els beneficis de l'empresa 1 són 1800 i els de l'empresa 2 900.
Docsity logo



Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved