Введение в игры с неполной информацией 0:05 Обсуждение игр с неполной информацией на примере. Пример с линией метро для двух бизнесменов, которые хотят сэкономить время. Договоренность о встрече в точке посередине между их местоположениями.
Игровой момент и равновесие 2:03 Возможность обмана для каждого бизнесмена. Вопрос о равновесии при вранье. Равновесие зависит от местоположения каждого бизнесмена.
Сигнал и стратегия обмана 4:15 Один бизнесмен знает свое местоположение, другой нет. Выбор сообщения для минимизации времени поездки. Минимизация математического ожидания времени поездки.
Априорные предположения и стратегия обмана 6:26 Априорные предположения о местоположении второго бизнесмена. Минимизация математического ожидания при честном поведении второго бизнесмена. Стратегия обмана как функция от местоположения.
Понятие равновесия 10:24 Определение симметричного равновесия. Стратегия обмана в ответ на стратегию обмана второго бизнесмена. Восстановление оптимальной стратегии обмана на основе стратегии второго бизнесмена.
Равновесие в играх с неполной информацией 14:26 Симметричное равновесие: функция пси тождественно равна себе в любой точке. Несимметричное равновесие: разные стратегии обмана, но знание стратегий друг друга. В теории аукционов используется симметричное равновесие.
Стратегии на аукционах 15:17 Ставки на аукционе рассматриваются как попытка угадать стратегию партнера. Поиск симметричного равновесия в соответствующей игре. Концепция равновесия совпадает с теорией игр, но с другими формулами.
Априорные знания и теория игр 15:59 Для понимания равновесия необходимо априорное знание о распределении. Классическая теория игр не работает без априорного знания. Теория игр не выходит за пределы знания распределения.
Итеративный процесс достижения равновесия 16:55 Стратегия, оптимальная в ответ на честное поведение, сама является ответом на себя. Итеративный процесс: честное поведение, стратегия оптимального ответа, и так далее. Если отображение сжимающее, процесс экспоненциально быстрый.
Сжатие и симметричное равновесие 17:55 В модельной задаче сжатие есть, но в аукционах это не всегда так. Для поиска симметричного равновесия нужно подставить функцию и написать уравнение. Сжатие делает итеративный процесс более математически оправданным.
Оптимальное поведение в игре 19:00 Оптимальное поведение в игре с неполной информацией состоит в том, чтобы врать в два раза до середины, а затем говорить правду. Это поведение является равновесным и может быть доказано для любой нечетной функции. Вранье в этой игре состоит в том, что функция лжи имеет вид "два икс, обрубленный по концам".
Введение в математический анализ аукционов 20:00 Игра с неполной информацией характеризуется тем, что параметры функции выигрыша игроков неизвестны другим. Равновесие в таких играх строится на основе вероятностного распределения параметров. Равновесие в играх с неполной информацией включает набор функций, зависящих от скрытых параметров игроков.
Сложность игр с неполной информацией 20:59 Игры с неполной информацией могут иметь разные формы, включая ситуации, когда информация открыта для некоторых игроков. Формальное определение таких игр сложно и требует анализа конкретных ситуаций. Рекомендуется книга Новикова и компании "Рефлексивные игры" для более глубокого понимания.
Логическая непротиворечивость в равновесии 22:53 В равновесии все представления о действиях игроков должны быть логически непротиворечивыми. Каждый игрок должен уметь объяснить свое поведение, исходя из представлений о поведении других игроков. Это требует прогнозирования поведения других игроков во всех возможных ситуациях.
Философские и математические аспекты 25:42 В играх с неполной информацией может быть много равновесий, но в данной игре других равновесий нет. Философская привязка теории игр к жизни слабая, особенно в социальных науках. Проверка социальных наук на реальных экспериментах затруднена из-за различий в условиях и результатах.
Аналогия с гравитацией 27:31 Проверка социальных наук на реальных экспериментах аналогична проверке теории гравитации на футбольных мячах в ураган. В кризисных условиях проверка социальных наук становится еще более сложной. Науки о кризисах не существует, так как условия для экспериментов крайне неблагоприятны.
Понятие равновесия 29:18 Равновесие не имеет начального пункта, оно должно быть внутренне непротиворечивым. Равновесие возникает, когда игроки верят в поведение друг друга и их стратегии совпадают. Если есть несколько равновесий, модель не может определить, какое из них стабилизировалось.
Социальные науки и равновесия 30:17 Социальные науки, такие как история, философия и социология, изучают, как социальные нормы влияют на равновесия. Равновесия могут быть предпочтительными для разных игроков. Пример: если игрок выше нуля, он говорит "один", если ниже - "минус один".
Стратегии и равновесия 32:12 Если игрок знает, что соперник всегда говорит "минус один", ему все равно, что говорить. В симметричной стратегии, независимо от действий, игрок получает лотерею из "минус единицы" и "единицы". Среднее расстояние, которое игрок проходит, остается одинаковым, что подтверждает наличие равновесия.
Аукционы и равновесия 36:12 В случае аукциона первой цены, задача сводится к нахождению функции с минимальной площадью. Геометрические соображения и дифференциальные уравнения используются для решения задачи. Сравнение аукционов первой и второй цены будет проведено позже.
Формализация аукциона первой цены 38:56 Рассматривается случай, когда несколько человек борются за предмет с индивидуальной стоимостью. Стоимость предмета для каждого участника взята из некоторого распределения на отрезке 0-1. Функция распределения достигает значения 1 в точке 1, что означает, что никто не считает предмет дешевле 0.1.
Симметричное равновесие 41:12 Симметричное равновесие означает, что у всех участников одна и та же стратегия поведения. Равновесная стратегия поведения - это функция б из 0-1 в 0-1.
Стратегия на аукционе 42:33 Определение функции ставки в запечатанном конверте. Стратегия: получение информации, объявление ставки, сравнение ставок. Аукцион первой цены: победитель платит свою ставку.
Выигрыш и проигрыш 43:29 Задача: найти ставку б, чтобы максимизировать выигрыш. Выигрыш: в минус б, если выиграл, и ноль, если проиграл. Ставка б зависит от сигнала в.
Влияние других участников 45:01 Вероятность выигрыша зависит от ставок других участников. Максимизация ожидаемого выигрыша: б умножить на вероятность выигрыша. Максимум достигается на отрезке между 0 и в.
Поведение остальных 46:53 Поведение остальных описывается функцией пси. Максимизация ставки б с учетом поведения остальных. Максимальная ставка равна единице.
Теория игр 48:05 Теория игр завершается, когда задача сводится к математической формуле. Пример: вероятность выигрыша ставки б. Вероятность: б больше или равно всем остальным ставкам.
Равновесие 50:26 Функция пси предполагается возрастающей. Равновесие: все игроки следуют одной и той же стратегии. Вероятность выигрыша: произведение вероятностей, что пси в минус первый от б больше или равно каждой ставке.
Введение в вероятность и производные 52:40 Вероятность случайной величины меньше значения равна функции распределения. Для нахождения максимума выражения нужно приравнять производную к нулю. Производная от обратной функции или композиции функций будет использоваться.
Уравнение для оптимального значения ставки 53:37 Производная по б равна нулю. Уравнение для оптимального б включает производные и функции распределения. Оптимальное б получается из уравнения, которое можно упростить, действуя относительно обратных функций.
Симметричное равновесие и дифференциальное уравнение 56:00 В равновесии стратегия игрока должна быть такой же, как у других. Уравнение превращается в дифференциальное уравнение. В равновесии ставка игрока должна быть равна значению, которое он считает.
Решение дифференциального уравнения 57:33 Уравнение для ставки игрока сводится к дифференциальному уравнению. Производная и функции распределения упрощаются. Задача решается в квадратурах.
Пример с двумя игроками 1:00:38 Для двух игроков с равномерным распределением вероятность выигрыша равна псив минус первой от б. Максимизация вероятности приводит к уравнению, которое решается в явном виде. Стратегия вранья пополам является оптимальной равновесной стратегией.
Стратегия для n игроков 1:03:37 Для n игроков стратегия равна н минус один разделить на н умножить на в. Аукцион первой цены решается в виде интегралов. Переход к аукциону второй цены.
Доминирующая стратегия в аукционе второй цены 1:05:39 В аукционе второй цены доминирующая стратегия состоит в том, чтобы писать свою истинную ценность. В отличие от равновесия Нэша, в аукционе второй цены существует только одно равновесие. Доказательство теоремы о доминирующей стратегии простое.
Доминирующая стратегия обмана 1:07:33 Доминирующая стратегия означает, что независимо от действий других, твоя стратегия обмана не зависит от их действий. В предыдущем случае, если бы ты знал, что все занижают ставки, ты бы тоже занижал. В этом случае твоя ставка не зависит от поведения других.
Влияние ставок на исход аукциона 1:08:30 Если у всех до этого было меньше, ничего не изменилось. Если ты выиграл до этого, то и после будешь выигрывать. Если максимум из остальных выше твоей ставки, ты проиграл.
Влияние на платеж 1:09:59 Твой платеж определяется максимумом ставок остальных, а не их стратегией. Если ты перегнал ставку, ты проиграл. В остальных случаях ничего не изменилось.
Влияние на выигрыш 1:10:57 Если ты опустил ставку, ты мог изменить ситуацию только если раньше выигрывал. Если ты не знаешь свою оценку, такие ситуации не рассматриваются. Теория игр условно формализует действительность.
Доминирующая стратегия в аукционе 1:11:56 В аукционе второй цены доминирующая стратегия — писать чистую правду. Через неделю будут рассмотрены аукционы с позиции продавца. В конце лекции будет рассказано о науке, описывающей яндексовские аукционы.
Различия в стратегиях 1:12:54 В первом случае ты влиял на выигрыш, поднимая или опуская ставку. Во втором случае ты влиял только через вероятность выигрыша. В первом случае вероятность выигрыша зависит от действий других.
Заключение 1:14:41 Во втором аукционе ты выигрываешь столько же, сколько и раньше. В первом аукционе баланс выигрыша зависит от действий других. В следующий раз мы вернемся к этому вопросу.