Работа вам нужна срочно. Не волнуйтесь, уложимся!
Заполните, пожалуйста, данные для автора:
- 22423 авторов готовы помочь тебе.
- 2402 онлайн
Найти оптимальные решения игроков в смешанных стратегиях.
|
В1 |
В2 |
А1 |
2 |
7 |
А2 |
4 |
3 |
α = max{min{2,7},min{4,3}} = max{2;3} = 3 – нижняя цена игры,
β = min{max{2,4},max{7,3}} = min{4,7} = 4 – игра не имеет седловой точки.
Игра не имеет решения в чистых стратегиях. Найдем решение в смешанных стратегиях. Для игрока А цена игры v является средним выигрышем, в то время как для игрока В цена игры v является средним проигрышем.
Припишем строкам платежной матрицы неизвестные вероятности p1 и p2 (вероятности выбора стратегий A1 и A2) соответственно: . Умножим этот столбец поэлементно на 1-й столбец платежной матрицы, и, сложив произведения, получим математическое ожидание (среднее значение) выигрыша первого игрока A, при условии, что второй игрок B следует первой стратегии. Получим первое уравнение системы. Теперь умножим этот столбец поэлементно на 2-й столбец платежной матрицы, и, сложив произведения, получим математическое ожидание (среднее значение) выигрыша первого игрока A, при условии, что второй игрок B следует второй стратегии.
Тогда система уравнений для поиска смешанных стратегий игрока А примет вид:
Это означает, что оптимальная стратегия первого игрока состоит в том, чтобы чередовать свои чистые стратегии случайным образом, выбирая А1 с вероятностью 1/6 и А2 с вероятностью 5/6, при этом средней выигрыш равен 11/3.
Для получения системы уравнений игрока В припишем столбцам платѐжной матрицы неизвестные вероятности q1 и q2 (вероятности выбора стратегий B1 и В2) соответственно: (q1;q2). Умножим эту строку поэлементно на 1-ю строку платежной матрицы, и, сложив произведения, получим математическое ожидание (среднее значение) проигрыша второго игрока В, при условии, что первый игрок А следует первой стратегии. Получим первое уравнение системы. Теперь умножим эту строку (q1;q2) поэлементно на 2-ю строку платежной матрицы, и, сложив произведения, получим математическое ожидание (среднее значение) проигрыша второго игрока В, при условии, что первый игрок А следует второй стратегии
Это означает, что оптимальная стратегия второго игрока состоит в том, чтобы чередовать свои чистые стратегии случайным образом, выбирая В1 с вероятностью 2/3 и В2 с вероятностью 1/3, при этом средней проигрыш равен 11/3.
Ответ: Р* = (1/6; 5/6), Q* = (2/3; 1/3), v=11/3.