Найти оптимальные решения игроков в смешанных стратегиях.

Главная
Высшая математика
Теория игр
Найти оптимальные решения игроков в смешанных стратегиях.

Пример 1:

	В₁	В₂
А1	2	7
А2	4	3

Решение от преподавателя:

α = max{min{2,7},min{4,3}} = max{2;3} = 3 – нижняя цена игры,

β = min{max{2,4},max{7,3}} = min{4,7} = 4 – игра не имеет седловой точки.

Игра не имеет решения в чистых стратегиях. Найдем решение в смешанных стратегиях. Для игрока А цена игры v является средним выигрышем, в то время как для игрока В цена игры v является средним проигрышем.

Припишем строкам платежной матрицы неизвестные вероятности p₁ и p₂ (вероятности выбора стратегий A1 и A2) соответственно: . Умножим этот столбец поэлементно на 1-й столбец платежной матрицы, и, сложив произведения, получим математическое ожидание (среднее значение) выигрыша первого игрока A, при условии, что второй игрок B следует первой стратегии. Получим первое уравнение системы. Теперь умножим этот столбец поэлементно на 2-й столбец платежной матрицы, и, сложив произведения, получим математическое ожидание (среднее значение) выигрыша первого игрока A, при условии, что второй игрок B следует второй стратегии.

Тогда система уравнений для поиска смешанных стратегий игрока А примет вид:

Это означает, что оптимальная стратегия первого игрока состоит в том, чтобы чередовать свои чистые стратегии случайным образом, выбирая А1 с вероятностью 1/6 и А2 с вероятностью 5/6, при этом средней выигрыш равен 11/3.

Для получения системы уравнений игрока В припишем столбцам платѐжной матрицы неизвестные вероятности q₁ и q₂(вероятности выбора стратегий B1 и В2) соответственно: (q₁;q₂). Умножим эту строку поэлементно на 1-ю строку платежной матрицы, и, сложив произведения, получим математическое ожидание (среднее значение) проигрыша второго игрока В, при условии, что первый игрок А следует первой стратегии. Получим первое уравнение системы. Теперь умножим эту строку (q₁;q₂) поэлементно на 2-ю строку платежной матрицы, и, сложив произведения, получим математическое ожидание (среднее значение) проигрыша второго игрока В, при условии, что первый игрок А следует второй стратегии

Это означает, что оптимальная стратегия второго игрока состоит в том, чтобы чередовать свои чистые стратегии случайным образом, выбирая В1 с вероятностью 2/3 и В2 с вероятностью 1/3, при этом средней проигрыш равен 11/3.

Ответ: Р* = (1/6; 5/6), Q* = (2/3; 1/3), v=11/3.

Работа вам нужна срочно. Не волнуйтесь, уложимся!

22423 авторов готовы помочь тебе.
2402 онлайн

Время — это деньги!

Найти оптимальные решения игроков в смешанных стратегиях.

Пример 1:

Решение от преподавателя:

Работа вам нужна срочно. Не волнуйтесь, уложимся!

Виды работ: