If you're seeing this message, it means we're having trouble loading external resources on our website.

Jeżeli jesteś za filtrem sieci web, prosimy, upewnij się, że domeny *.kastatic.org i *.kasandbox.org są odblokowane.

Główna zawartość

Więcej o równowadze Nasha

In this video we expand our analysis of the prisoners' dilemma to better understand the concept and definition of a Nash Equilibrium. Stworzone przez: Sal Khan.

Chcesz dołączyć do dyskusji?

Na razie brak głosów w dyskusji
Rozumiesz angielski? Kliknij tutaj, aby zobaczyć więcej dyskusji na angielskiej wersji strony Khan Academy.

Transkrypcja filmu video

Pojęcie równowagi Nasha jest tak ważne, że warto poświęcić mu cały odcinek. Może wiecie, że wymyślił je John Nash, którego w „Pięknym umyśle” zagrał Russell Crowe. Pojęcie to pochodzi z teorii gier. „Teoria gier” brzmi mądrze, ale zajmuje się właśnie grami. Bo dylemat więźnia, o którym mówiliśmy poprzednio, to gra. Gracze obierają różne strategie, a efektem ich działań są różne stany gry, czy po prostu wyniki. Oto definicja równowagi Nasha wzięta z Princeton. Ten uniwersytet to dobre źródło, bo John Nash długo tam wykładał. Według definicji, jest to stan stabilny systemu z wpływającymi na siebie graczami (w dylemacie więźnia jest ich dwóch), z którym to stanie żaden gracz nie może zyskać, zmieniając strategię, o ile strategia reszty graczy jest stała. Rozważmy różne stany gry w tym układzie i zastanówmy się, czy któryś spełnia te kryteria. Ponumeruję pola. Niech to będzie stan nr 1, to stan nr 2, to stan nr 3, a to – stan nr 4. Zacznijmy od pierwszego pola. Jeśli jesteśmy w polu nr 1, czy którykolwiek z graczy może zmienić strategię i zyskać na tym, gdy strategia przeciwnika jest stała? Znajdujemy się więc tutaj, w polu 1, czyli Al się wypiera – i Bill też. Al może jednak… Al może polepszyć swoją sytuację, zmieniając strategię. Zamiast nadal zaprzeczać, czyli tkwić tutaj, może się przyznać. Al może więc zyskać zmieniając strategię, przy założeniu, że Bill stale się wypiera. I tak samo jest z drugiej strony. Jeśli tkwimy w polu nr 1… Jeśli Bill tkwi w polu 1 i zakłada, że Al nie zmienia strategii, to może poprawić swoją sytuację. Bo jeśli się przyzna, zamiast dwóch lat dostanie rok. Zatem z obu tych powodów… Już przy jednym tu nie byłoby równowagi Nasha, a zachodzą oba. Stanowczo, równowagi Nasha tu nie ma. Zatem… Brak równowagi Nasha. Podałem dwa przykłady świadczące, że gracz może zyskać na zmianie strategii, o ile drugi uczestnik niczego nie zmieni. Jednym z przykładów była zmiana u Ala, gdy Bill stale się wypierał, a to była zmiana u Billa, gdy stale wypierał się Al. Nie ma tu równowagi Nasha. A teraz pomyślmy o stanie gry nr 2. Jeśli jesteśmy w tym polu… Jeśli jesteśmy w polu nr 2, to, o ile Bill nic nie zmieni, czy Al może poprawić swoją sytuację? Czy Al zechce zmienić strategię? W stanie nr 2 Alowi grozi tylko rok więzienia. Jeśli zamiast się przyznać, wyprze się, dostanie 2 lata. Al nie skorzystałby więc na zmianie strategii. Na razie jest nieźle, ale spójrzmy z perspektywy Billa. W stanie nr 2… W stanie nr 2, tutaj… przy stałej strategii Ala, czy Bill może zmienić sytuację? Jasne: zamiast wypierać się, może się przyznać. Dzięki temu, zamiast dziesięciu lat więzienia dostanie trzy. Mamy przykład na to, że gracz zyskuje na zmianie strategii, jeśli reszta graczy nie zmienia nic. Wystarczy, że udowodni się to dla jednego gracza – i nie ma równowagi Nasha. Ponieważ Bill może zyskać na zmianie strategii, gdy strategia Ala jest stała, czyli gdy Al ciągle się przyznaje, to nie mamy do czynienia z równowagą Nasha. To nie równowaga Nasha. Bo może nastąpić taki ruch, polepszający sytuację Billa przy stałej strategii Ala. Przejdźmy teraz do stanu nr 3. Rozważmy tę sytuację. W polu nr 3… Bill się przyznaje, a Al się wypiera. Spójrzmy z perspektywy Ala. Jeśli założymy, że Bill nadal będzie się przyznawał, czy Al może poprawić swoją sytuację? Pewnie! Zamiast się wypierać, jak robi w 3. polu macierzy, może się przyznać, czyli przeskoczyć na to pole. Już to wystarczy za dowód, że tu nie ma równowagi Nasha. Nie musimy nawet myśleć o Billu. Tu, przy ustalonej strategii Ala, Bill nie poprawi swojej sytuacji. Nie zechce przeskoczyć tutaj. Skoro jednak może zrobić to Al, przy stałej strategii Billa, to równowagi Nasha tu nie ma. Przejdźmy do stanu nr 4. Już wiecie, co tu będzie, z poprzedniego odcinka, ale omówię wszystko nieco bardziej szczegółowo. W polu nr 4 obaj się przyznają. Spójrzmy z perspektywy Ala. Strategia Billa jest stała. Bill niczego nie zmienia. Zostajemy w tej kolumnie, Bill się przyznaje. Pomyślmy o Alu. Czy będąc w polu 1 może zyskać na zmianie strategii? Może tylko odwołać zeznania i wyprzeć się wszystkiego, ale nie zyska, bo zamiast 3 lat dostanie 10. Zatem Al nie może zyskać na zmianie strategii, gdy strategia innych uczestników gry jest stała. Sprawdźmy teraz Billa. Jesteśmy w tym polu i zakładamy, że Al ma stałą strategię. Al niezmiennie się przyznaje. Bill w polu 4 przyznaje się, więc może tylko zacząć się wypierać. Ale wtedy zamiast trzech lat więzienia dostałby 10, więc nie zyska. On też nie może zyskać. Wykryliśmy więc stan gry, w którym żaden gracz nie zyska zmieniając strategię, przy stałej strategii reszty uczestników. To ważne: nie mówimy, że obaj mogą zmieniać strategię jednocześnie. Macierz wypłat nie zezwala na ruchy skośne. Żaden gracz nie może więc zyskać, ani Al, ani Bill, gdy drugi ma stałą strategię. Zatem mamy tu do czynienia z równowagą Nasha. Równowaga. Tutaj. I ten stan jest stabilny.