Найти оптимальные решения игроков в смешанных стратегиях.

Пример 1:

Найти оптимальные решения игроков в смешанных стратегиях.

 

В1

В2

А1

2

7

А2

4

3

Решение от преподавателя:

α = max{min{2,7},min{4,3}} = max{2;3} = 3 – нижняя цена игры,

β = min{max{2,4},max{7,3}} = min{4,7} = 4 – игра не имеет седловой точки.

Игра не имеет решения в чистых стратегиях. Найдем решение в смешанных стратегиях. Для игрока А цена игры v является средним выигрышем, в то время как для игрока В цена игры v является средним проигрышем.

Припишем строкам платежной матрицы неизвестные вероятности p1 и p2 (вероятности выбора стратегий A1 и A2) соответственно: . Умножим этот столбец поэлементно на 1-й столбец платежной матрицы, и, сложив произведения, получим математическое ожидание (среднее значение) выигрыша первого игрока A, при условии, что второй игрок B следует первой стратегии. Получим первое уравнение системы. Теперь умножим этот столбец  поэлементно на 2-й столбец платежной матрицы, и, сложив произведения, получим математическое ожидание (среднее значение) выигрыша первого игрока A, при условии, что второй игрок B следует второй стратегии.

Тогда система уравнений для поиска смешанных стратегий игрока А примет вид:

Это означает, что оптимальная стратегия первого игрока состоит в том, чтобы чередовать свои чистые стратегии случайным образом, выбирая А1 с вероятностью 1/6 и А2 с вероятностью 5/6, при этом средней выигрыш равен 11/3.

Для получения системы уравнений игрока В припишем столбцам платѐжной матрицы неизвестные вероятности q1 и q2 (вероятности выбора стратегий B1 и В2) соответственно: (q1;q2). Умножим эту строку поэлементно на 1-ю строку платежной матрицы, и, сложив произведения, получим математическое ожидание (среднее значение) проигрыша второго игрока В, при условии, что первый игрок А следует первой стратегии. Получим первое уравнение системы. Теперь умножим эту строку (q1;q2) поэлементно на 2-ю строку платежной матрицы, и, сложив произведения, получим математическое ожидание (среднее значение) проигрыша второго игрока В, при условии, что первый игрок А следует второй стратегии

Это означает, что оптимальная стратегия второго игрока состоит в том, чтобы чередовать свои чистые стратегии случайным образом, выбирая В1 с вероятностью 2/3 и В2 с вероятностью 1/3, при этом средней проигрыш равен 11/3.

 

Ответ: Р* = (1/6; 5/6), Q* = (2/3; 1/3), v=11/3.

Не нашли нужного вам решения? Оставьте заявку и наши авторы быстро и качественно помогут вам с решением.
Оставить заявку
Работа вам нужна срочно. Не волнуйтесь, уложимся!

Заполните, пожалуйста, данные для автора:

  • 22423 авторов готовы помочь тебе.
  • 2402 онлайн