Банк рефератов содержит более 364 тысяч рефератов, курсовых и дипломных работ, шпаргалок и докладов по различным дисциплинам: истории, психологии, экономике, менеджменту, философии, праву, экологии. А также изложения, сочинения по литературе, отчеты по практике, топики по английскому.
Полнотекстовый поиск
Всего работ:
364150
Теги названий
Разделы
Авиация и космонавтика (304)
Административное право (123)
Арбитражный процесс (23)
Архитектура (113)
Астрология (4)
Астрономия (4814)
Банковское дело (5227)
Безопасность жизнедеятельности (2616)
Биографии (3423)
Биология (4214)
Биология и химия (1518)
Биржевое дело (68)
Ботаника и сельское хоз-во (2836)
Бухгалтерский учет и аудит (8269)
Валютные отношения (50)
Ветеринария (50)
Военная кафедра (762)
ГДЗ (2)
География (5275)
Геодезия (30)
Геология (1222)
Геополитика (43)
Государство и право (20403)
Гражданское право и процесс (465)
Делопроизводство (19)
Деньги и кредит (108)
ЕГЭ (173)
Естествознание (96)
Журналистика (899)
ЗНО (54)
Зоология (34)
Издательское дело и полиграфия (476)
Инвестиции (106)
Иностранный язык (62792)
Информатика (3562)
Информатика, программирование (6444)
Исторические личности (2165)
История (21320)
История техники (766)
Кибернетика (64)
Коммуникации и связь (3145)
Компьютерные науки (60)
Косметология (17)
Краеведение и этнография (588)
Краткое содержание произведений (1000)
Криминалистика (106)
Криминология (48)
Криптология (3)
Кулинария (1167)
Культура и искусство (8485)
Культурология (537)
Литература : зарубежная (2044)
Литература и русский язык (11657)
Логика (532)
Логистика (21)
Маркетинг (7985)
Математика (3721)
Медицина, здоровье (10549)
Медицинские науки (88)
Международное публичное право (58)
Международное частное право (36)
Международные отношения (2257)
Менеджмент (12491)
Металлургия (91)
Москвоведение (797)
Музыка (1338)
Муниципальное право (24)
Налоги, налогообложение (214)
Наука и техника (1141)
Начертательная геометрия (3)
Оккультизм и уфология (8)
Остальные рефераты (21697)
Педагогика (7850)
Политология (3801)
Право (682)
Право, юриспруденция (2881)
Предпринимательство (475)
Прикладные науки (1)
Промышленность, производство (7100)
Психология (8694)
психология, педагогика (4121)
Радиоэлектроника (443)
Реклама (952)
Религия и мифология (2967)
Риторика (23)
Сексология (748)
Социология (4876)
Статистика (95)
Страхование (107)
Строительные науки (7)
Строительство (2004)
Схемотехника (15)
Таможенная система (663)
Теория государства и права (240)
Теория организации (39)
Теплотехника (25)
Технология (624)
Товароведение (16)
Транспорт (2652)
Трудовое право (136)
Туризм (90)
Уголовное право и процесс (406)
Управление (95)
Управленческие науки (24)
Физика (3463)
Физкультура и спорт (4482)
Философия (7216)
Финансовые науки (4592)
Финансы (5386)
Фотография (3)
Химия (2244)
Хозяйственное право (23)
Цифровые устройства (29)
Экологическое право (35)
Экология (4517)
Экономика (20645)
Экономико-математическое моделирование (666)
Экономическая география (119)
Экономическая теория (2573)
Этика (889)
Юриспруденция (288)
Языковедение (148)
Языкознание, филология (1140)

Реферат: Методы решения биматричных игр

Название: Методы решения биматричных игр
Раздел: Рефераты по математике
Тип: реферат Добавлен 11:53:15 14 февраля 2011 Похожие работы
Просмотров: 1835 Комментариев: 2 Оценило: 0 человек Средний балл: 0 Оценка: неизвестно     Скачать

МЕТОДЫ РЕШЕНИЯ БИМАТРИЧНЫХ ИГР


1. Основные определения теории биматричных игр

Рассмотрим конфликтную ситуацию, в которой каждый из двух участников имеет следующие возможности для выбора своей линии поведения:

игрок А – может выбрать любую из стратегий А1 , ... , Ат ,

игрок В – любую из стратегий В1 , …, В n

При этом всякий раз их совместный выбор оценивается вполне определенно:

если игрок А выбрал i -ю стратегию , а игрок В – k стратегию , то в итоге выигрыш игрока А будет равен некоторому числу , а выигрыш игрока В некоторому, вообще говоря, другому числу .

Иными словами, всякий раз каждый из игроков получает свой приз.

Последовательно перебирая все стратегии игрока А и все стратегии игрока В, мы сможем заполнить их выигрышами две таблицы (первая из них описывает выигрыши игрока А, а вторая – выигрыши игрока В).

Обычно эти таблицы записывают в виде матриц


Здесь А – платежная матрица игрокаА , а В – платежная матрица игрокаВ .

При выборе игроком А i -й стратегии, а игроком В k -й стратегии их выигрыши находятся в матрицах выплат на пересечении i -х строк и k -x столбцов: в матрице А это элемент , а в матрице В – элемент .

Таким образом, в случае, когда интересы игроков различны (но не обязательно противоположны), получаются две платежные матрицы: одна – матрица выплат игроку А , другая – матрица выплат игроку В . Поэтому совершенно естественно звучит название, которое обычно присваивается подобной игре – биматричная .

Замечание. Рассматриваемые матричные игры, можно рассматривать и как биматричные, где матрица выплат игроку В противоположна матрице выплат А :

В общем случае биматричная игра – это игра с ненулевой суммой .

Класс биматр. игр значительно шире класса матричных (разнообразие новых моделируемых конфликтных ситуаций весьма заметно), а, значит, неизбежно увеличиваются и трудности, встающие на пути их успешного разрешения.

Пример. «Студент — Преподаватель».

Рассмотрим следующую ситуацию. Студент (игрок А ) готовится к зачету, который принимает Преподаватель (игрок В ). Можно считать, что у Студента две стратегии – подготовиться к сдаче зачета (+) и не подготовиться (-). У Преподавателя также две стратегии – поставить зачет [+] и не поставить зачета [-].

В основу значений функций выигрыша игроков положим следующие соображения:

Количественно это можно выразить, например, так

2. Смешанные стратегии в биматричных играх

В приведенных примерах описаны ситуации, в которых интересы игроков не совпадают. Встает вопрос о том, какие рекомендации необходимо дать игрокам для того, чтобы моделируемая конфликтная ситуация разрешилась. Иными словами, что мы будем понимать под решением биматричной игры?

Попробуем ответить на это вопрос так:

вследствие того, что интересы игроков не совпадают, нам нужно построить такое (компромиссное) решение, которое бы в том или ином, но в одинаковом смысле удовлетворяло обоих игроков.

Не пытаясь сразу выражать эту мысль совсем точно, скажем – попробуем найти некую равновесную ситуацию , явное отклонение от которой одного из игроков уменьшало бы его выигрыш.

Подобный вопрос мы ставили и при рассмотрении матричных игр. Напомним, что возникающее при разработке минимаксного подхода понятие равновесной ситуации приводило нас к поиску седловой точки, которая, существует не всегда – конечно, если ограничиваться только чистыми стратегиями игроков А и В , т.е. стратегиями .

Однако при расширении матричной игры путем перехода к смешанным стратегиям, т. е. к такому поведению игроков, при котором они чередуют (чистые) стратегии с определенными частотами:

игрок А стратегии A 1 ,..., Ат с частотами р1 ,..., рт , где

а игрок В стратегии В1 ,...., В n , с частотами q 1 ,..., qn , где

выяснилось, что в смешанных стратегиях равновесная ситуация всегда существует. Иными словами, любая матричная игра в смешанных стратегиях разрешима .

Поэтому, рассматривая здесь биматричные игры, разумно попробовать сразу же перейти к смешанным стратегиям игроков (этим мы предполагаем, что каждая игра может быть многократно повторена в неизменных обстоятельствах).

В матричном случае смешивание стратегий приводило к расширению возможности выплат в том смысле, что расчет строился из вычисления средних выигрышей игроковА иВ , которые определялись по элементам платежной матрицы А и вероятностям и :

,

При смешанных стратегиях в биматричных играх также возникают средние выигрыши игроков А иВ , определяемые по правилам, в которых уже нет никакой дискриминации игрока В :

,

3. 2x2 биматричные игры. Ситуация равновесия

Мы предполагаем уделить основное внимание случаю, когда у каждого из игроков имеется ровно две стратегии, т. е. случаю т = п = 2. Поэтому нам кажется уместным выписать приведенные выше формулы именно для такого случая.

В 2 ´ 2 биматричной игре платежные матрицы игроков имеют следующий вид

, ,

вероятности

биматричная игра решение

а средние выигрыши вычисляются по формулам

где

,

Сформулируем основное определение.

Определение. Будем считать, что пара чисел

, ,

определяет равновесную ситуацию , если для любых р и q , подчиненных условиям одновременно выполнены следующие неравенства

(1)

Пояснение . Выписанные неравенства (1) означают следующее: ситуация, определяемая смешанной стратегией (р*, q *), является равновесной , если отклонение от нее одного из игроков при условии, что другой сохраняет свой выбор, приводит к тому, что выигрыш отклонившегося игрока может только уменьшиться. Тем самым, получается, что если равновесная ситуация существует, то отклонение от нее невыгодно самому игроку.

Теорема 1 (Дж. Нэш). Всякая биматричная игра имеет хотя бы одну равновесную ситуацию (точку равновесия) в смешанных стратегиях.

Итак, равновесная ситуация существует. Но как ее найти?

Если некоторая пара чисел (р*, q *) претендует на то, чтобы определять ситуацию равновесия, то для того, чтобы убедиться в обоснованности этих претензий, или, наоборот, доказать их необоснованность, необходимо проверить справедливость неравенств (1) для любого р в пределах от 0 до 1 и для любого q впределах от 0 до 1. В общем случае число таких проверок бесконечно. И, следовательно, действенный способ определения равновесной ситуации нужно искать где-то в ином месте.

Теорема 2. Выполнение неравенств

(1)

равносильно выполнению неравенств

(2)

Иными словами, для того, чтобы убедиться в обоснованности претензий пары (р*, q *) на то, чтобы определять равновесную ситуацию, нужно проверить справедливость неравенства

только для двух чистых стратегий игрока А (р = 0 и р = 1 ) и неравенства

только для двух чистых стратегий игрока В ( q = 0 иq = 1).

Четыре неравенства (2) позволяют провести поиск точки равновесия вполне конструктивно.

Запишем средние выигрыши игроков А и В в более удобной форме.

Имеем

Обратимся к первой из полученных формул.

Полагая в ней сначала р = 1, а потом р = 0, получаем,

Рассмотрим разности

Полагая

получим для них следующие выражения

В случае, если пара (р , q ) определяет точку равновесия, эти разности неотрицательны


Поэтому окончательно получаем

Из формул для функции нв ( р, q ) при q = 1 и q = 0 соответственно имеем

Разности

и

с учетом обозначений

.

приводятся к виду

совершенно так же, как соответствующие разности для функции НА .

Если пара , q ) определяет точку равновесия, то эти разности неотрицательны

Поэтому

Вывод

Для того, чтобы в биматричной игре

, ,

пара (р, q ) определяла равновесную ситуацию , необходимо и достаточно одновременное выполнение следующих неравенств

, ,

, ,

где

.

Оценить/Добавить комментарий
Имя
Оценка
Комментарии:
Где скачать еще рефератов? Здесь: letsdoit777.blogspot.com
Евгений08:28:17 19 марта 2016
Кто еще хочет зарабатывать от 9000 рублей в день "Чистых Денег"? Узнайте как: business1777.blogspot.com ! Cпециально для студентов!
09:43:05 29 ноября 2015

Работы, похожие на Реферат: Методы решения биматричных игр

Назад
Меню
Главная
Рефераты
Благодарности
Опрос
Станете ли вы заказывать работу за деньги, если не найдете ее в Интернете?

Да, в любом случае.
Да, но только в случае крайней необходимости.
Возможно, в зависимости от цены.
Нет, напишу его сам.
Нет, забью.



Результаты(150520)
Комментарии (1836)
Copyright © 2005-2016 BestReferat.ru bestreferat@mail.ru       реклама на сайте

Рейтинг@Mail.ru