1930-luvulla John von Neumannista ja Oscar Morgensternistä tuli uuden ja mielenkiintoisen matematiikan haaran, "peliteorian" perustaja. 1950-luvulla nuori matemaatikko John Nash kiinnostui tästä suunnasta. Tasapainoteoriasta tuli hänen väitöskirjansa aihe, jonka hän kirjoitti 21-vuotiaana. Näin syntyi uusi pelistrategia nimeltä "Nash Equilibrium", joka voitti Nobel-palkinnon monta vuotta myöhemmin - vuonna 1994.
Väitöskirjan kirjoittamisen ja yleisen tunnustuksen välisestä pitkästä erosta on tullut matemaatikolle koe. Nero ilman tunnustusta johti vakaviin mielenterveysongelmiin, mutta John Nash pystyi ratkaisemaan tämän ongelman erinomaisen loogisen mielensä ansiosta. Hänen Nash Equilibrium -teoriansa voitti Nobel-palkinnon ja hänen elämänsä kuvattiin kauniissa mielessä.
Lyhyesti peliteoriasta
Koska Nashin tasapainoteoria selittää ihmisten käyttäytymisen vuorovaikutuksen olosuhteissa, kannattaa pohtia peliteorian peruskäsitteitä.
Peliteoria tutkii osallistujien (agenttien) käyttäytymistä vuorovaikutuksessa toistensa kanssa kuin peliä, kun lopputulos riippuu useiden ihmisten päätöksestä ja käyttäytymisestä. Osallistuja tekee päätöksiä ennusteidensa perusteella muiden käyttäytymisestä, jota kutsutaan pelistrategiaksi.
On myös hallitseva strategia, jossa osallistuja saa parhaan tuloksen muiden osallistujien käyttäytymisestä. Tämä on pelaajan paras win-win-strategia.
Vangin dilemma ja tieteellinen läpimurto
Vangin dilemma on tapaus pelistä, jossa osallistujat pakotetaan tekemään järkeviä päätöksiä ja saavuttamaan yhteinen päämäärä vaihtoehtojen ristiriidassa. Kysymys kuuluu, kumman näistä vaihtoehdoista hän valitsee, ymmärtäen henkilökohtaisen ja yleisen edun sekä mahdotonta saada molempia. Pelaajat näyttävät olevan vangittuna kovassa peliympäristössä, mikä saa heidät toisinaan ajattelemaan erittäin tuottavasti.
Tätä dilemmaa tutki amerikkalainen matemaatikko John Nash. Hänen saavuttamansa tasapaino oli vallankumouksellinen omalla tavallaan. Erityisen kirkkaasti tämä uusi ajatus vaikutti taloustieteilijöiden näkemykseen siitä, kuinka markkinatoimijat tekevät valintoja, muiden edut huomioon ottaen, läheisessä vuorovaikutuksessa ja intressien risteyksessä.
Peliteoriaa on parasta opiskella konkreettisten esimerkkien kautta, sillä tämä matemaattinen tieteenala ei sinänsä ole kuivan teoreettista.
Esimerkki vangin dilemmasta
Esimerkiksi kaksi henkilöä teki ryöstön, joutui poliisin käsiin ja kuulustellaan erillisissä sellissä. Samanaikaisesti poliisit tarjoavat jokaiselle osallistujalle edulliset edellytykset, joilla hänet vapautetaan, jos hän todistaa kumppaniaan vastaan. Jokainenrikollisilla on seuraavat strategiat, joita hän harkitsee:
- Molemmat todistavat samaan aikaan ja saavat 2,5 vuoden vankeusrangaistuksen.
- Molemmat ovat hiljaa samaan aikaan ja saavat kumpikin 1 vuoden, koska tässä tapauksessa heidän syyllisyytensä todisteet ovat vähäiset.
- Yksi todistaa ja vapautuu, toinen on hiljaa ja saa 5 vuoden vankeusrangaistuksen.
Tapauksen lopputulos riippuu tietysti molempien osallistujien päätöksestä, mutta he eivät voi olla samaa mieltä, koska he istuvat eri soluissa. Heidän henkilökohtaisten etujensa ristiriita taistelussa yhteisen edun puolesta näkyy myös selvästi. Jokaisella vangeilla on kaksi vaihtoehtoa toimia ja 4 vaihtoehtoa lopputuloksille.
Loogisten johtopäätösten ketju
Joten, rikoksentekijä A harkitsee seuraavia vaihtoehtoja:
- Olen hiljaa ja kumppanini on hiljaa - saamme molemmat 1 vuoden vankeusrangaistuksen.
- Annan kumppanini ja hän antaa minut - saamme molemmat 2,5 vuotta vankeutta.
- Olen hiljaa, ja kumppanini pettää minut - saan 5 vuotta vankeutta ja hän vapautuu.
- Annan kumppanini, mutta hän on hiljaa - saan vapauden, ja hän saa 5 vuotta vankeutta.
Annetaan selvyyden vuoksi matriisi mahdollisista ratkaisuista ja tuloksista.
Taulukko vangin dilemman mahdollisista seurauksista.
Kysymys kuuluu, mitä kukin kilpailija valitsee?
"Ole hiljaa, et voi puhua" tai "Et voi olla hiljaa, et voi puhua"
Ymmärtääksesi osallistujan valinnan, sinun täytyy käydä läpi hänen ajatusketjunsa. Rikollisen A perustelujen mukaisesti: jos minä vaikenen ja kumppanini vaikenee, saamme vähimmäisajan (1 vuosi), mutta minäEn tiedä kuinka hän käyttäytyy. Jos hän todistaa minua vastaan, niin minun on parempi todistaa, muuten voin istua 5 vuotta. Istun mieluummin 2,5 vuotta kuin 5 vuotta. Jos hän vaikenee, niin sitäkin enemmän minun täytyy todistaa, koska sillä tavalla saan vapauteni. Osallistuja B.
Ei ole vaikea nähdä, että jokaisen tekijän hallitseva strategia on todistaa. Tämän pelin optimaalinen kohta tulee, kun molemmat rikolliset todistavat ja saavat "palkintonsa" - 2,5 vuotta vankeutta. Nash-peliteoria kutsuu tätä tasapainoa.
Ei-optimaalinen optimaalinen Nash-ratkaisu
Nashilaisen näkemyksen vallankumouksellinen luonne on, että tällainen tasapaino ei ole optimaalinen, kun tarkastellaan yksittäistä osallistujaa ja hänen omaa etuaan. Loppujen lopuksi paras vaihtoehto on olla hiljaa ja päästä vapaaksi.
Nash-tasapaino on intressien lähentymispiste, jossa jokainen osallistuja valitsee itselleen optimaalisen vaihtoehdon vain, jos muut osallistujat valitsevat tietyn strategian.
Kun otetaan huomioon vaihtoehto, jolloin molemmat rikolliset ovat hiljaa ja saavat vain 1 vuoden, voimme kutsua sitä Pareto-optimaaliseksi vaihtoehdoksi. Se on kuitenkin mahdollista vain, jos rikolliset sopivat etukäteen. Mutta tämäkään ei takaa tätä tulosta, koska houkutus vetäytyä sopimuksesta ja välttää rangaistus on suuri. Täydellisen luottamuksen puute toisiaan kohtaan ja vaara, että 5 vuotta pakotetaan valitsemaan tunnustus. Mieti, mitä osallistujat noudattavatVaihtoehto hiljaisuudella, yhdessä toimiminen on yksinkertaisesti järjetöntä. Tällainen johtopäätös voidaan tehdä, jos tutkimme Nashin tasapainoa. Esimerkit vain todistavat sinun olevan oikeassa.
itsekäs tai rationaalinen
Nashin tasapainoteoria tuotti hämmästyttäviä johtopäätöksiä, jotka kumosivat aiemmin olemassa olleet periaatteet. Esimerkiksi Adam Smith piti jokaisen osallistujan käyttäytymistä täysin itsekkäänä, mikä toi järjestelmän tasapainoon. Tätä teoriaa kutsuttiin "markkinoiden näkymättömäksi kädeksi".
John Nash näki, että jos kaikki osallistujat toimivat omien etujensa mukaisesti, tämä ei koskaan johda optimaaliseen ryhmätulokseen. Koska rationaalinen ajattelu on luontaista jokaiselle osallistujalle, Nashin tasapainostrategian tarjoama valinta on todennäköisempi.
Puhdas mieskoe
Erinomainen esimerkki on blondi-paradoksipeli, joka, vaikka se näyttää väärältä, on selkeä esimerkki Nash-peliteorian toiminnasta.
Tässä pelissä sinun täytyy kuvitella, että joukko vapaita tyyppejä tuli baariin. Lähistöllä on tyttöjen seura, joista yksi on muita parempi, sano blondi. Miten pojat toimivat saadakseen itselleen parhaan tyttöystävän?
Joten, poikien perustelut: jos kaikki alkavat tutustua blondiin, niin luultavasti kukaan ei saa sitä, niin hänen ystävänsä eivät halua tutustua. Kukaan ei halua olla toinen vaihtoehto. Mutta jos pojat päättävät välttääblondi, niin todennäköisyys, että jokainen kaveri löytää hyvän tyttöystävän tyttöjen joukosta, on korkea.
Nash-tasapainotilanne ei ole optimaalinen pojille, koska vain omia itsekkäitä etujaan ajaessaan jokainen valitsisi blondin. Voidaan nähdä, että vain itsekkäiden etujen tavoittelu merkitsee ryhmäetujen romahtamista. Nash-tasapaino tarkoittaa, että jokainen kaveri toimii omien etujensa mukaisesti, jotka ovat yhteydessä koko ryhmän etuihin. Tämä ei ole paras vaihtoehto kaikille henkilökohtaisesti, mutta paras kaikille menestymisen yleisen strategian perusteella.
Koko elämämme on peliä
Päätöksenteko todellisessa maailmassa on hyvin paljon kuin peliä, jossa odotat myös muilta osallistujilta tiettyä rationaalista käyttäytymistä. Liiketoiminnassa, työssä, tiimissä, yrityksessä ja jopa suhteissa vastakkaiseen sukupuoleen. Isoista kaupoista tavallisiin elämäntilanteisiin kaikki noudattaa yhtä tai toista lakia.
Tietenkin yllä olevat pelitilanteet rikollisten ja baarin kanssa ovat vain erinomaisia esimerkkejä Nashin tasapainosta. Esimerkkejä tällaisista dilemmoista syntyy hyvin usein todellisilla markkinoilla, ja tämä toimii erityisesti tapauksissa, joissa kaksi monopolistia hallitsee markkinoita.
Sekalaiset strategiat
Usein olemme mukana ei yhdessä, vaan useassa pelissä kerralla. Valitset yhden pelin vaihtoehdoista rationaalisen strategian ohjaamana, mutta päädyt toiseen peliin. Muutaman järkevän päätöksen jälkeen saatat huomata, että tuloksesi ei miellytä. Mitäota?
Katsotaanpa kahta strategiatyyppiä:
- Puhdas strategia on osallistujan käyttäytymistä, joka syntyy muiden osallistujien mahdollisen käyttäytymisen ajattelemisesta.
- Sekoitettu strategia tai satunnainen strategia on puhtaiden strategioiden vuorottelu satunnaisesti tai puhtaan strategian valinta tietyllä todennäköisyydellä. Tätä strategiaa kutsutaan myös satunnaistetuksi.
Tämän toiminnan huomioon ottaen saamme uuden kuvan Nashin tasapainosta. Jos aiemmin sanottiin, että pelaaja valitsee strategian kerran, niin toinen käyttäytyminen voidaan kuvitella. Voidaan olettaa, että pelaajat valitsevat strategian satunnaisesti tietyllä todennäköisyydellä. Pelissä, jotka eivät löydä Nashin tasapainoa puhtaissa strategioissa, ne ovat aina sekoitettuja strategioita.
Nash-tasapainoa sekastrategioissa kutsutaan sekatasapainoksi. Tämä on tasapaino, jossa jokainen osallistuja valitsee optimaalisen taajuuden strategioidensa valitsemiselle edellyttäen, että muut osallistujat valitsevat strategiansa tietyllä taajuudella.
Rangaistukset ja sekastrategia
Esimerkki sekastrategiasta löytyy jalkapallopelistä. Paras esimerkki sekavasta strategiasta on kenties rangaistuspotkukilpailu. Meillä on siis maalivahti, joka voi hypätä vain yhteen kulmaan, ja pelaaja, joka suorittaa rangaistuspotkun.
Jos pelaaja ensimmäisen kerran valitsee strategian ampua vasempaan kulmaan, ja maalivahti putoaa myös tähän kulmaan ja ottaa pallon kiinni, miten asiat voivat kehittyä toisella kerralla? Jos pelaajaosuu vastakkaiseen kulmaan, tämä on todennäköisesti liian ilmeistä, mutta samaan nurkkaan osuminen ei ole yhtä ilmeistä. Siksi sekä maalivahtilla että potkaisijalla ei ole muuta vaihtoehtoa kuin luottaa satunnaiseen valintaan.
Siksi vuorotellen satunnaista valintaa tietyn puhtaan strategian kanssa pelaaja ja maalivahti yrittävät saada maksimaalisen tuloksen.