Що ми маємо на увазі під "прийняття найкращого рішення, виходячи з того, що вирішив зробити інший гравець"
Ваше запитання трохи торкається філософських засад рівноваги Неша. Як відомо, рівновага Неша виникає, коли кожен гравець вибирає найкращу відповідь на обрані іншими стратегіями. Іншими словами, вони діють так, ніби знають, якими будуть стратегії інших гравців, і відповідно грають найкращу відповідь - навіть якщо всі стратегії обираються одночасно.
Чому має сенс моделювати людей, що поводяться так, ніби вони знають стратегію всіх інших? Весь сенс пошуку рівноваги гри полягає в тому, щоб спробувати знайти спосіб «вирішити» гру таким чином, щоб рішення дало правдоподібний прогноз щодо того, як люди можуть грати в цю гру. Припустимо, ми визначили спосіб обчислення рішення. Якщо ми можемо обчислити рішення, то гравці також можуть обчислити рішення (використовуючи той самий метод) і розібратися, якою буде стратегія рівноваги кожного. Якщо гравці обчислюють рішення і виявляють, що їх рівноважна поведінка в рішенні не маємаксимізувати власну виплату, тоді вони відмовляться грати на рішення! Отже, будь-яка концепція рішення, яку (а) гравці можуть використовувати для вирішення гри та (b) одного або декількох гравців, які поводять себе оптимально, буде самовиразною. Перевернувшись на голову, будь-яка концепція рішення, з якою насправді готові грати гравці, обов'язково повинна залучати їх до найкращої реакції - тобто має бути рівновага Неша.
Одним із стислих способів цього є те, що інші гравці можуть точно передбачити стратегію гравця (використовуючи ту саму концепцію рішення, яку ми використовуємо для вирішення гри)! Зауважте, що це трохи відрізняється від того, що ви написали в коментарі ("дії конкурента можна точно передбачити"). Ми можемо використовувати рівновагу для прогнозування стратегій, але, можливо, не зможемо передбачити дії (оскільки стратегія може бути змішаною стратегією, тобто дія є випадковою).
Що таке рівновага Бертрана
Нагадаємо, що для створення статичної гри з повною інформацією нам потрібно знати (1) гравців, (2) дії та (3) окупність. Щоб звернутися до свого запитання, рівновага Бертрана - це лише інша назва рівноваги Неша наступної конкретної статичної гри з повною інформацією:
- Є N фірм (гравців)
- Дія кожної фірми полягає у виборі ціни,pi
- Виплата полягає в тому, що фірма з найнижчою ціною обслуговує всіх споживачів і отримує на споживача (де - граничні витрати). Якщо фірми пов'язані за найнижчою ціною, то кожна з них обслуговує споживачів. фірми, які не обслуговують споживачів, не отримують нульового прибутку.c m 1 / мpi−ccm1/m
Так, у рівновазі Бертран, використовуючи принцип Неша, кожна фірма діє так, ніби вона знає ціну інших і обирає найкращу ціну у відповідь.
Характеризуючи рівновагу Бертранда?
Для того, щоб знайти рівновагу Неша ("Бертран") у цій грі, ми повинні знайти набір стратегій (цін) таких, що кожна фірма відіграє найкращу відповідь (тобто таку, що жодна фірма не могла отримати прибуток, змінивши ціну).
Претензія Не існує рівноваги, в якій ціна найнижчої фірми перевищує .c
Щоб довести цю твердження, припустимо, навпаки, що . Ми покажемо, що принаймні одна фірма може вигідно змінити свою стратегію (і тому не грає найкращої реакції). Упорядкуйте фірми так, щоб . Є дві можливості:minpi>cp1≤p2≤p3≤…≤pn
Усі фірми стягують однакову ціну (тому зв'язки за найнижчою ціною). Тоді прибуток дорівнює . Але припустимо, що знизив ціну на деяку суму . Тоді це було б ціною нижче, ніж будь-хто інший, і отримав би прибуток . Якщо досить мала, це суттєве збільшення прибутку .nn(pn−c)/mnΔpn−Δ−c)Δn′s
pn>p1 тому не залучає споживачів. прибуток «s дорівнює нулю. Але може відхилитися від вибору ціни , приносячи прибуток . За умови досить мала, це позитивно, тому прибуток збільшився.nnnp1−Δ(p1−Δ−c)Δn
Претензія Принаймні дві фірми повинні рівноважно встановлювати . Всі фірми отримують нульовий прибуток.p=c
Щоб довести це твердження, почніть, помічаючи, що якщо якась фірма встановить то принаймні одна фірма отримає негативний прибуток і вважає за краще відхилитися до (таким чином гарантуючи нульовий прибуток).pi<cp=c
Припустимо, що менше двох фірм встановлюють . По попередній претензії нам відомо щонайменше одна фірма безліч . Це означає, що одна фірма встановлює , тоді як всі інші встановлюють . Але тоді фірма, яка встановлює отримує прибуток , але може отримати позитивний прибуток, збільшивши (небагато, щоб це все-таки найдешевша фірма). Оскільки є вигідне відхилення, ми не можемо мати рівновагу з меншою кількістю двох фірм, які встановлюють .p=cp=cp=cp>cp=c(p−c)=0pp=c
Нарешті, ми знаємо, що фірми, які встановлюють отримують нульовий прибуток. Ми також знаємо, що жодна фірма не встановлює тому будь-яка фірма, яка не встановлює повинна встановлювати , тобто це не приваблює споживачів, а також не приносить нульового прибутку.p=cp<cp=cp>c