Функции реакции.
[БЕЗ СЛОВ] В
предыдущей задаче мы видели, в предыдущем сюжете мы видели, как,
как геометрически наглядно увидеть взаимодействие игровое на основе того,
что по одной оси мы откладывали вероятность, с которой
играют одну из своих чистых стратегий все остальные игроки, кроме меня.
И по другой оси откладывали мою ответную реакцию,
то есть тогда, с какой вероятностью буду играть вот эту вот чистую стратегию я.
И получалось, что в начале, значит, я...
При малых значениях этой вероятности я отвечаю значением, равном 1,
а при больших — значением, равным 0.
И как раз в каком‐то месте происходит перескок.
И вот это место есть равновесие.
Давайте ещё один разберём пример, в котором тоже наглядно на графиках видно,
как выглядит взаимодействие.
Пример этот очень интересный, он называется «Аукцион второй цены».
[БЕЗ СЛОВ] Знаменит тем,
что за очень простое наблюдение автор получил Нобелевскую премию.
Сейчас мы разберём аукцион второй цены с полной информацией.
Самое интересное, это аукционы, как игры с неполной информацией,
будут у нас в последующих сюжетах, позже.
Итак, игра: продаётся некоторый объект,
например картина, которую нарисовала нерпа.
В Листвянском нерпинарии нерпы рисуют картины кисточками сами, ртом.
Ртом берут кисточку и рисуют картину.
Ну какая‐то мазня получается.
И потом её продают с аукциона.
Ну вот давайте представим себе...
Это мы ещё разберём, к этому примеру мы ещё вернёмся,
когда будем говорить про аукционы.
А пока представим, что есть какой‐то предмет, это картина или что‐то другое,
которое продаётся, выставлено на продажу.
Есть только два покупателя, ровно два, первый и второй.
На самом деле всё это обобщается на случай многих,
но я хочу вам рассказать про функции реакции.
Проще всего рассказывать на примере двух игроков.
Значит, два игрока, и ценность этого предмета для первого игрока равна v1,
а для второго равна v2.
То есть вот если до v1 я плачу (я первый игрок, я плачу до v1),
то я как бы в плюсе остаюсь, это отлично, значит, я получаю, если я получаю предмет,
за цену, меньшую v1, потому что для меня самого стоимость этого предмета v1.
А если больше, то я как бы в минусе, я переплатил.
То же самое для второго с v2.
И давайте посмотрим, значит, пусть v1 < v2.
Как тогда выгладит равновесие?
И вообще, как в этой игре происходит взаимодействие?
Какой у этой игры стратегический, так сказать, тип,
как происходит взаимодействие игроков?
Ну и давайте посмотрим на график.
Проще всего это увидеть на графике.
Вот стратегия первого игрока, будем называть это b1.
b1 — это та ставка, которую он заявляет.
Предположим, что аукцион происходит одновременно,
то есть два человека одновременно показывают свои ставки,
вот они записывают на бумажку, и по команде судьи они показывают свои ставки.
И дальше, у кого больше ставка, тот и получает картину,
но с одним маленьким нюансом: что он платит не свою ставку, а вторую.
То есть выбирается максимальное из этих двух,
чьё оно, вот это максимальное, тот и получает предмет, но платит он вторую.
Не ту, которую, значит, вот он задал, а ту, которую задал тот, кто меньше сказал.
Если одинаковая заявка оказалась, если b1 = b2, что вполне может быть,
v1 < v2, но b1 в принципе может быть равно b2, тогда просто бросается монетка,
и с равными вероятностями достаётся первому и второму.
Вот.
Ну давайте попробуем решить эту игру с помощью функции реакции.
Давайте посмотрим, скажем, на реакцию первого в
ответ на то, что делает второй.
И здесь важно будет для нас то,
выше или ниже, чем v1, ставка второго?
b2 ниже или выше, чем v1?
Потому что смотрите, предположим, что b2 < v1.
Пусть b2 — это какое‐то очень небольшое число, меньше,
чем наша истинная ценность предмета.
Что тогда надо сделать?
Надо ставку эту перебить, правильно?
То есть если я прочёл бы, подглядел в его записи и увидел вот такое b2,
то моя правильная реакция — это перебить ставку, то есть подставить любое
число сюда, большее, чем b2.
Строго большее, чтобы без всякой лотереи выиграть предмет.
И неважно, сколько я напишу, потому что платить я буду всё‐равно вот это самое b2.
Если я перебью, то по правилам игры буду платить всё‐равно его.
Поэтому для меня совершено всё‐равно, какую точку вот этой полупрямой выбрать.
Вот эта вот функции реакции моя оказалась многозначной.
Это, кстати, довольно часто бывает в теории игр,
что функция реакции оказывается многозначной.
И до того как b2 = b1, до этого момента они,
мои вот эти вот оптимальные ответы,
они строго правее диагонали.
То есть вот график этой многозначной функции.
А что происходит при v1, при b2 = v1?
Ответ: мне абсолютно всё‐равно, кто из нас выиграет аукцион.
Я могу что угодно ставить, если я выиграю, то ровно за ту стоимость, которая для меня
на самом деле этот предмет представляет, поэтому я — по нулям.
Не выиграю — тоже по нулям.
Поэтому мой ответ: любой вообще, я могу написать вообще любую
величину — до v1 или после v1.
Если дальше, так сказать...
Если, если я здесь поставил, я проиграл аукцион, ну и бог с ним.
Если здесь — выиграл,
если здесь — произошла лотерея между двумя равносильными для меня всё‐равно исходами.
Поэтому вот эта вся полупрямая целиком годится.
А что происходит выше?
А выше происходит вот что, выше мне нужно вот при таких ставках второго,
который больше v2, мне аукцион нужно проиграть.
Потому что иначе я получу предмет по большей цене,
чем он для меня ценен реально, по‐настоящему.
Поэтому мне нужно назвать любую цену, меньшую,
чем названная моим оппонентом.
Итак, смотрите внимательно.
До v1 мои оптимальные ответы вот здесь.
После v1 мои оптимальные ответы вот здесь.
Но есть некоторый оптимальный ответ,
который всегда присутствует,
независимо от того, до v1 или после, а именно — v1.
Если b2 < v1,
до v1 годится, как и любое другое значение, больше, чем b2.
Если b2 = v1, v1 годится, как и любое вообще значение.
Если b2 > v1, v1 годится, как и любое, меньшее, чем b2, значение.
Поэтому v1...
Вывод.
Стратегия: b2,
ой, извините, b1 =
v1 является слабо
доминирующей в этой игре.
То есть эта игра решается по доминированию.
У каждого игрока есть слабо доминирующая стратегия, соответственно,
постулат требует того, чтобы мы предсказывали именно такой исход, что
каждый напишет свою собственную оценку, если аукцион был аукционом второй цены.
Но, внимание, для аукциона первой цены это уже неверно.
Для игр с неполной информацией этот вывод остаётся верным и составляет,
в общем‐то, содержание Нобелевской премии по экономике.
Но об этом я расскажу потом, когда мы дойдём до игр с неполной информацией.
А пока вот это, так сказать,
на этом примере мы построили функции реакции и увидели, что одна из стратегий,
оказывается, во всех случаях входит в график оптимальных ответов.
А это и означает, что она является доминирующей,
то есть мы увидели это на функциях реакции.