728 x 90

Na przekór pięknemu umysłowi Nasha: Nie unikniesz Pytii (w decyzjach)

Na przekór pięknemu umysłowi Nasha: Nie unikniesz Pytii (w decyzjach)

Wyobraźmy sobie następującą grę. Jacek i Placek muszą wybrać pomiędzy 0 a 1; każdy głośno oznajmia swój wybór. Jeśli w sumie wyjdzie liczba parzysta, to obaj wygrywają 1 zł. W przeciwnym wypadku dostają 0zł. (Kto jest sponsorem tej gry o sumie niezerowej?)

Bez znajomości teorii gier szybko zauważymy, że aby wygrać jak najwięcej Jacek i Placek powinni wybrać jednocześnie tę samą liczbę. Tym samym pary wyborów (0,0) i (1,1) są optimami Pareto. Ponadto (0,0) i (1,1) są (ścisłymi, czystymi) równowagami Nasha. Chyba nie może być lepiej? Do wyboru, do koloru – którą równowagę sobie życzymy? Żadnej pokusy zdrady, gdy się umówimy na optimum, bo jest ono w równowadze. Żadnego opłakiwania optymalnego porozumienia, gdy boimy się zdrady. Nie występuje więc klasyczne napięcie między wyborem strategii w równowadze, a wyborem optymalnym. W odróżnieniu od dylematu więźnia i wielu innych dylematów społecznych (np. tragedy of the commons), tu wybór jest jasny. Rozwiązanie optymalne jest możliwe do osiągnięcia bez uwarunkowywania społecznych zachowań przez grę powtarzaną. (Zob. np. ,,Konkurencja i współpraca w procesie podejmowania decyzji”; M. Topolewski; Dzień liczby Pi 2015 [slajdy pdf]).

Jeden mały szczegół – mamy do czynienia z klasycznym zagadnieniem koordynacji. Gracze muszą się skomunikować i zgodnie ustalić swoje wybory. Czyż to nie ironia, że gracze, którzy wg oryginalnej motywacji Nasha mogliby się zdradzać, muszą się dogadać? Niczym dwójka braci przy wyborze między konsolą do gry jednej, albo drugiej firmy. Kupimy wam, ale ustalcie którą. (Wiem, można dwie konsole kupić. Co tam sobie żałować. …i zasmażka [OT.TO]).

No dobrze, gracze się po prostu dogadują. Na przekór naiwnemu straszeniu zdradą jako podstawą definicji równowagi Nasha. A co gdy nie ma możności wcześniejszego uzgodnienia wyboru? Wtedy gracze mogą się odwołać do jakiejś konwencji, albo muszą losować. Jeśli idzie o konwencję, to może się ona w naturalny sposób zrodzić z  wzajemnej znajomości upodobań/skłonności. A zatem gra musiałaby być w  istocie bardziej złożona niż prosty wybór między 0 a 1 i odwoływać się do elementów nie widzianych przez funkcje wypłat (f_1(x,y)=f_2(x,y) = x+y+1 mod 2, x,y in {0,1}; f_i(x,y) – wypłata i-tego gracza, gdy pierwszy z nich wybierze x, a drugi y). Gwoli złośliwości losu oryginalne rozwiązanie zagadnienia przetargu (bargaining problem) podane przez Nasha jako przykład zastosowania ogólnego pojęcia równowagi, również ma charakter kulturowy; oparte jest na pewnej nietrudnej do zaakceptowania umowie co do punktu odniesienia. (Nietrudnej do zaakceptowania umowie? ,,Credible Threats in Negotiations: A Game-theoretic Approach” Bolt & Houba chap.4.2). Dodajmy, że kwestia punktu odniesienia jest trudnością w pewnym sensie fundamentalną. Najbardziej teoriogrowe wystąpienie punktu odniesienia/orientacji widać na lotnisku – to tzw. meeting point.

Przy braku punktu odniesienia i możliwości komunikacji między graczami pozostaje losowanie. Jacek i Placek chcąc uwspólnić wybór między 0 a 1 muszą rzucać monetą. Powtarzając rozgrywkę wielokrotnie, z prawdopodobieństwem 1 mogą oczekiwać, że w końcu dojdzie do koordynacji (schemat Bernoulliego). Dodajmy, że w ciągu rozgrywek uda im się skoordynować średnio rzecz biorąc w połowie przypadków. (Wartość oczekiwana. A wariancja?)

Niby sami podejmujemy decyzje, a i tak jesteśmy prowadzeni ku losowości, niczym w prostej grze w marynarza, czy grze w kamień-nożyce-papier (zob. O losowości nie tylko w informatyce. Część 1). W przypadku gry kamień-nożyce-papier, która ma sumę zerową, w definicji minimaksu von Neumanna nie da się uniknąć strategii mieszanych (rozkładów losowych na strategiach czystych). Ale to gra antagonistyczna – jeden traci, drugi zyskuje. Jak na złość, nawet kiedy gracze chcą współpracować, poniekąd są skazani na zastosowanie procesów losowych.

Pytia była wyrocznią. Teoria gier jej potrzebuje. Nie tylko ona. Świat informatyki i kryptografii też jej potrzebuje.  Potrzebują wyroczni losowości algorytmiczne (zob. też post  O losowości nie tylko w informatyce. Część 2). Choć miały uciec od udręki teorii prawdopodobieństwa, zdają się ją naśladować. Niczym krzemowa alternatywa dla białkowej formy życia.

Czy to koniec marzeń? Istnieje wiele gier, w których ludzie walczą ze ślepym losem próbując odnaleźć trendy i wzorce. Choćby giełda. Można też odwrócić pytanie o zgodność wyboru i tak zaprojektować grę, by zgodny wybór prowadził do słabszych wypłat niż wybór niezgodny. Jedną z ciekawszych gier tego typu (w wersji dla wielu graczy) jest problem baru El Farol. Jako że ludzie mają swoje zwyczaje i obserwują innych, uczestnicy tej gry mogą próbować nauczyć się jak grać suboptymalnie. Proste uczenie ukazuje model El Farol przygotowany przez Uriego Wilensky’ego w formie symulacji wieloagentowej [Rand, W., Wilensky, U. (2007). NetLogo El Farol model. http://ccl.northwestern.edu/netlogo/models/ElFarol. Center for Connected Learning and Computer-Based Modeling, Northwestern Institute on Complex Systems, Northwestern University, Evanston, IL.]

Źródło obrazu tytułowego: opracowanie własne autora.

Leave a Comment

Your email address will not be published. Required fields are marked with *

Cancel reply

Inne artykuły