Në vitet 1930, John von Neumann dhe Oscar Morgenstern u bënë themeluesit e një dege të re dhe interesante të matematikës të quajtur "teoria e lojës". Në vitet 1950, matematikani i ri John Nash u interesua për këtë drejtim. Teoria e ekuilibrit u bë objekt i disertacionit të tij, të cilin ai e shkroi në moshën 21 vjeçare. Kështu lindi një strategji e re loje e quajtur "Nash Equilibrium", e cila fitoi çmimin Nobel shumë vite më vonë - në 1994.
Hendeku i gjatë midis shkrimit të një disertacioni dhe njohjes së përgjithshme është bërë një test për një matematikan. Gjeniu pa njohje rezultoi në çrregullime të rënda mendore, por John Nash ishte në gjendje ta zgjidhte këtë problem falë mendjes së tij të shkëlqyer logjike. Teoria e tij e ekuilibrit Nash fitoi një çmim Nobel dhe jeta e tij u filmua në mendjen e bukur.
Shkurtimisht rreth teorisë së lojës
Meqenëse teoria e ekuilibrit Nash shpjegon sjelljen e njerëzve në kushtet e ndërveprimit, ia vlen të merren parasysh konceptet bazë të teorisë së lojës.
Teoria e lojës studion sjelljen e pjesëmarrësve (agjentëve) në aspektin e ndërveprimit me njëri-tjetrin si një lojë, kur rezultati varet nga vendimi dhe sjellja e disa njerëzve. Pjesëmarrësi merr vendime bazuar në parashikimet e tij për sjelljen e të tjerëve, që quhet strategjia e lojës.
Ekziston gjithashtu një strategji dominuese në të cilën pjesëmarrësi merr rezultatin më të mirë për çdo sjellje të pjesëmarrësve të tjerë. Kjo është strategjia më e mirë fitim-fituese e lojtarit.
Dilema e të burgosurve dhe zbulimi shkencor
Dilema e të burgosurit është një rast i një loje ku pjesëmarrësit detyrohen të marrin vendime racionale, duke arritur një qëllim të përbashkët përballë një konflikti alternativash. Çështja është se cilën nga këto opsione do të zgjedhë, duke kuptuar interesin personal dhe të përgjithshëm, si dhe pamundësinë për t'i marrë të dyja. Lojtarët duket se janë të burgosur në një mjedis të vështirë loje, gjë që ndonjëherë i bën ata të mendojnë në mënyrë shumë produktive.
Kjo dilemë u eksplorua nga matematikani amerikan John Nash. Bilanci që ai arriti ishte revolucionar në mënyrën e vet. Veçanërisht ky mendim i ri ndikoi shumë në opinionin e ekonomistëve se si aktorët e tregut bëjnë zgjedhje, duke marrë parasysh interesat e të tjerëve, me ndërveprim të ngushtë dhe kryqëzim interesash.
Është më mirë të studiohet teoria e lojës përmes shembujve konkretë, pasi kjo disiplinë matematikore në vetvete nuk është teorike e thatë.
Shembull i dilemës së të burgosurit
Shembull, dy persona kryen një grabitje, ranë në prangat e policisë dhe po merren në pyetje në qeli të veçanta. Në të njëjtën kohë, oficerët e policisë i ofrojnë secilit pjesëmarrës kushte të favorshme në të cilat ai do të lirohet nëse dëshmon kundër partnerit të tij. Secili prejkriminelët kanë grupin e mëposhtëm të strategjive që ai do të marrë parasysh:
- Të dy dëshmojnë në të njëjtën kohë dhe marrin 2,5 vjet burg.
- Të dy heshtin në të njëjtën kohë dhe marrin 1 vit secili, sepse në këtë rast baza e provave të fajit të tyre do të jetë e vogël.
- Njëri dëshmon dhe lirohet, ndërsa tjetri hesht dhe merr 5 vjet burg.
Natyrisht, rezultati i çështjes varet nga vendimi i të dy pjesëmarrësve, por ata nuk mund të bien dakord, sepse janë ulur në qeli të ndryshme. Konflikti i interesave të tyre personale në luftën për një interes të përbashkët është gjithashtu i dukshëm. Secili prej të burgosurve ka dy opsione për veprim dhe 4 opsione për rezultate.
Zinxhiri i konkluzioneve logjike
Pra, shkelësi A po shqyrton opsionet e mëposhtme:
- Unë hesht dhe partneri im hesht - të dy do të marrim 1 vit burg.
- Unë pranoj partnerin tim dhe ai më kthen mua - ne të dy marrim 2.5 vjet burg.
- Unë hesht dhe partneri më tradhton - Do të marr 5 vjet burg dhe ai do të jetë i lirë.
- I dorëzoj partnerin, por ai hesht - Marr lirinë dhe ai merr 5 vjet burg.
Le të japim një matricë të zgjidhjeve dhe rezultateve të mundshme për qartësi.
Tabela e rezultateve të mundshme të dilemës së të burgosurit.
Pyetja është, çfarë do të zgjedhë secili konkurrent?
"Hesht, nuk mund të flasësh" ose "Nuk mund të heshtësh, nuk mund të flasësh"
Për të kuptuar zgjedhjen e pjesëmarrësit, duhet të kaloni nëpër zinxhirin e mendimeve të tij. Në vijim të arsyetimit të kriminelit A: nëse unë hesht dhe partneri im do të marrim një afat minimal (1 vit), por unë. Nuk e di si do të sillet. Nëse ai dëshmon kundër meje, atëherë më mirë të dëshmoj, përndryshe mund të ulem për 5 vjet. Preferoj të ulem për 2.5 vjet sesa 5 vjet. Nëse hesht, aq më tepër më duhet të dëshmoj, sepse kështu do të marr lirinë. Pjesëmarrësi B.
Nuk është e vështirë të shihet se strategjia dominuese për secilin prej autorëve është të dëshmojë. Pika optimale e kësaj loje vjen kur të dy kriminelët dëshmojnë dhe marrin "çmimin" e tyre - 2.5 vjet burg. Teoria e lojës Nash e quan këtë ekuilibër.
Zgjidhja optimale jo-optimale Nash
Natyra revolucionare e pikëpamjes Nashian është se një ekuilibër i tillë nuk është optimal kur merret parasysh pjesëmarrësi individual dhe interesi i tij vetjak. Në fund të fundit, alternativa më e mirë është të qëndroni të heshtur dhe të dilni të lirë.
Ekuilibri Nash është një pikë konvergjence interesash, ku secili pjesëmarrës zgjedh opsionin që është optimal për të vetëm nëse pjesëmarrësit e tjerë zgjedhin një strategji të caktuar.
Duke marrë parasysh opsionin kur të dy kriminelët heshtin dhe marrin vetëm 1 vit, mund ta quajmë atë një opsion Pareto-optimal. Megjithatë, është e mundur vetëm nëse kriminelët mund të bien dakord paraprakisht. Por edhe kjo nuk do të garantonte këtë rezultat, pasi tundimi për t'u tërhequr nga marrëveshja dhe për të shmangur dënimin është i madh. Mungesa e besimit të plotë tek njëri-tjetri dhe rreziku për të marrë 5 vjet të detyruar të zgjedhin opsionin me njohje. Reflektoni se çfarë do t'i përmbahen pjesëmarrësveopsioni me heshtje, të vepruarit në koncert, është thjesht joracionale. Një përfundim i tillë mund të nxirret nëse studiojmë ekuilibrin Nash. Shembujt vetëm vërtetojnë se keni të drejtë.
Egoist ose racional
Teoria e Ekuilibrit Nash nxori përfundime befasuese që hodhën poshtë parimet që ekzistonin më parë. Për shembull, Adam Smith e konsideroi sjelljen e secilit prej pjesëmarrësve si krejtësisht egoiste, gjë që e solli sistemin në ekuilibër. Kjo teori u quajt "dora e padukshme e tregut".
John Nash pa se nëse të gjithë pjesëmarrësit veprojnë në interesat e tyre, kjo nuk do të çojë kurrë në një rezultat optimal të grupit. Duke pasur parasysh se të menduarit racional është i natyrshëm për secilin pjesëmarrës, zgjedhja e ofruar nga strategjia e ekuilibrit Nash është më e mundshme.
Eksperiment thjesht mashkullor
Një shembull kryesor është loja e paradoksit bjonde, e cila, megjithëse duket e pavend, është një ilustrim i qartë se si funksionon teoria e lojës Nash.
Në këtë lojë ju duhet të imagjinoni se një shoqëri me djem të lirë erdhi në një bar. Aty pranë është një shoqëri vajzash, njëra prej të cilave preferohet nga të tjerat, thotë një bjonde. Si veprojnë djemtë për të fituar të dashurën më të mirë për veten e tyre?
Pra, arsyetimi i djemve: nëse të gjithë fillojnë të njihen me bjonden, atëherë, ka shumë të ngjarë, askush nuk do ta marrë atë, atëherë miqtë e saj nuk do të duan të njihen. Askush nuk dëshiron të jetë kthimi i dytë. Por nëse djemtë zgjedhin të shmanginbjonde, atëherë probabiliteti që secili nga djemtë të gjejë një të dashurën e mirë mes vajzave është i lartë.
Situata e ekuilibrit të Nashit nuk është optimale për djemtë, sepse, duke ndjekur vetëm interesat e tyre egoiste, të gjithë do të zgjidhnin bjondin. Mund të shihet se ndjekja e vetëm interesave egoiste do të jetë e barabartë me kolapsin e interesave të grupit. Ekuilibri Nash do të thotë që çdo djalë vepron në interesat e tij, të cilat janë në kontakt me interesat e të gjithë grupit. Ky nuk është opsioni më i mirë për të gjithë personalisht, por më i miri për të gjithë, bazuar në strategjinë e përgjithshme për sukses.
E gjithë jeta jonë është një lojë
Marrja e vendimeve në botën reale është shumë si një lojë ku prisni sjellje të caktuara racionale edhe nga pjesëmarrësit e tjerë. Në biznes, në punë, në një ekip, në një kompani, madje edhe në marrëdhëniet me seksin e kundërt. Nga marrëveshjet e mëdha deri te situatat e zakonshme të jetës, çdo gjë i bindet një ligji apo tjetrit.
Sigurisht, situatat e mësipërme të lojës me kriminelët dhe një shirit janë vetëm ilustrime të shkëlqyera që demonstrojnë ekuilibrin Nash. Shembuj të këtyre dilemave lindin shumë shpesh në tregun real dhe kjo funksionon veçanërisht në rastet kur dy monopolistë kontrollojnë tregun.
Strategji të përziera
Shpesh ne përfshihemi në jo një, por disa lojëra njëherësh. Zgjedhja e një prej opsioneve në një lojë, e udhëhequr nga një strategji racionale, por përfundon në një lojë tjetër. Pas disa vendimeve racionale, mund të zbuloni se rezultati juaj nuk ju pëlqen. Çfarëmarr?
Le të shqyrtojmë dy lloje strategjish:
- Strategjia e pastër është sjellja e pjesëmarrësit, e cila vjen nga të menduarit për sjelljen e mundshme të pjesëmarrësve të tjerë.
- Strategjia e përzier ose strategjia e rastësishme është alternimi i strategjive të pastra në mënyrë të rastësishme ose zgjedhja e një strategjie të pastër me një probabilitet të caktuar. Kjo strategji quhet gjithashtu e rastësishme.
Duke marrë parasysh këtë sjellje, ne marrim një vështrim të ri në ekuilibrin Nash. Nëse më parë u tha se lojtari zgjedh një strategji një herë, atëherë mund të imagjinohet një sjellje tjetër. Mund të supozohet se lojtarët zgjedhin një strategji rastësisht me një probabilitet të caktuar. Lojërat që nuk mund të gjejnë ekuilibrat Nash në strategji të pastra, i kanë gjithmonë ato në strategji të përziera.
Ekuilibri Nash në strategjitë e përziera quhet ekuilibër i përzier. Ky është një ekuilibër ku secili pjesëmarrës zgjedh frekuencën optimale të zgjedhjes së strategjive të tij, me kusht që pjesëmarrësit e tjerë të zgjedhin strategjitë e tyre me një frekuencë të caktuar.
Penalitete dhe strategji e përzier
Një shembull i një strategjie të përzier mund të gjendet në lojën e futbollit. Ilustrimi më i mirë i një strategjie të përzier është ndoshta gjuajtja e penalltive. Pra, ne kemi një portier që mund të kërcejë vetëm në një kënd, dhe një lojtar që do të ekzekutojë penalltinë.
Pra, nëse herën e parë që lojtari zgjedh strategjinë për të gjuajtur në këndin e majtë, dhe portieri gjithashtu bie në këtë kënd dhe kap topin, si mund të zhvillohen gjërat herën e dytë? Nëse lojtarido të godasë në këndin e kundërt, kjo ka shumë të ngjarë të jetë shumë e dukshme, por goditja në të njëjtin kënd nuk është më pak e dukshme. Prandaj, si portieri ashtu edhe sulmuesi nuk kanë zgjidhje tjetër veçse të mbështeten në përzgjedhjen e rastësishme.
Kështu, duke alternuar përzgjedhjen e rastësishme me një strategji të caktuar të pastër, lojtari dhe portieri përpiqen të marrin rezultatin maksimal.