Экономическая кибернетика
Эк. Кибернетика.
Игра матем. Модель конфликтной ситуации.
Стратегия игрока это правила выбора действий в сложившейся ситуации.
Решение игры это нахождение оптимальной стратегии для каждого игрока, т.е. нахождение цены игры.
Оптимальная стратегия игрока это стратегия, которая в среднем (настрив. на длительную игру) дает игроку возможный наибольший выигрыш.
Неонтогонистическая если выигрыш одной из сторон склад. из проигрыша др. стороны, иначе антогонистическая выигрыш одного равен проигрышу др.
Матричные игры.
- самые простые игры. Играют 2 чел. У каж конечное число стратегий. Список стратегий известен каж играющему, т.е. игра с полной инф. Игра одноходовая.
Величина выигрыша известна заранее, опис. В числовых единицах. Оба дейст. Сознательны, никто не поддается. Игра яв-ся антогонистической. Правила определяют победителя.
Игры с седловой точкой обладают св-м устойчивости если один игрок примен оптим стратегию, то др. игроку не выгодно отклон-ся от своей оптим стратегии.
Первонач сведен по т. вероятности.
Случайные событие это событие, которое может произойти или не произойти в данной ситуации.
Вероятность это количественная характеристика, мера появ-я событий.
P(А)=(число благопр. событий)/(общее число событий).
М(х)=i хipi матем. ожидание.
D(x)=i х2ipi (M(x))2 дисперсия.
(x)=D(x) средне квадратичное отклонение показывает степень разбросанности значений случайной величины относительно матем. ожидания.
Правило 3 сигм ():
PM(x)-3(x)0); S*A- оптим стратегия.
Стратегия Вj активная второго игрока если вероятность исполь-я ее в опти стратегии больше нуля (Bi-акт, если q*i>0); S*B - оптим стратегия.
Неактивная стратегия вероятность применения, которой в оптим стратегии равна нулю.
Теорема устойчивости: Если один игрок применяет свою оптим стратегию, то 2 игроку не выгодно выходить за рамки своих активных стратегий.
Теорема: В матр. игре количество активных стратегий у каж игрока одинаковое.
Применение решений в усл. неопределенности.
Рассмотрим игру человек и природа. Человек лицо принимающее решение. Природа экон-я среда в состоянии рынка.
Отличия от матричной игры: Активные решения принимает только чел, он хочет найти наиболее оптим решение. У природы стихийное поведение и она не стремится к выигрышу. Считается, что чел знает список сост природы, но не знает какое из них будет фактическим. В игре с природой чел труднее сделать свой выбор, поэтому сущ несколько подходов нахождения оптимального решения.
Подход определяется склонностью чел к риску.
Риск это может быть упущенная выгода или необход понести дополнит произв-е затраты.
Элементы матрицы это ожидание резуль. Деятельности в завис от сост природы.
1) Подход махмах “оптимистический”: В каж точке мы находим макс элемент и после этого находим макс из полученных чисел. i=maxj aij=maxii=i0 выб Аi0.
Выбираем макс значение. Чел ориентир на самый лучший возмож результат, не обращ внимание на возмож неудачи.
2) Критерий Вальда критерий пессимизма: Находим в каж строчке миним элемент и выбираем ту стратегию, которая дает макс гарантируемый доход.
i=minj aij=maxi i=i выб Аi0.
3)Критерий Гурвица () ур пессимизма: Человек выбирает 01. Находим число i=i+(1-)i maxii=i0 выб Аi0. Если =1 кр Вальда (пессимизма), если =0 кр оптимизма. Конкретная величина опред-ся эк-ой ситуацией.
4) Критерий Сэвиджа кр минимального риска: Состав март риска по формуле rij=j-аij. ij=max aij rij=j-aij.
R=(rij) матр риска; ri=maxj rij mini ri=ri0 выб Аi0.
Если бы мы знали, то мы бы выбрали наиболее эф-е решение. Для самого эф-го решения: rij=0 (если Пj) Аi. Риск = величине упущенной возможности.
У каж критерия есть свои особенности применения. Если мы оценив ситуацию по разным критериям, то мы можем принять более обоснован решение. Трудность обоснования яв-ся, что природа не стремится к выигрышу.
Принятие решения в усл риска.
Рассотрим вариант игры чел и природы в случаи, когда нам известно сост природы. Природа к выигрышу не стремится. Находим стратегию, которая приносит макс средний доход. Средний доход расчитывается по правилу теории вероятности.
Величина среднего дохода равна матем ожиданию при этой стратегии.
1) М(Ai)=nj=1aijpj Находим макс maxi M(Ai)
2) Правило минималь среднего риска. R=(Ai)=nj=1rijpj. Находим наимень mini R(Ai).
Лемма: Указ выше 2 критерия в результате всегда приводят к выбору одной и той же оптим стратегии.
Док-во: Найдем миним сред риска mini R(Ai)= mini jrijpj= mini (j(j-аij)pj)= mini (jj pj-jаijpj)=jj pj не зависит от переменной i, значит это const С= mini (С-jаijpj) минимум разности соот-ет максимуму вычитаемого.
maxi jаijpj=M(Ai).
Номера стратегий, на которых достиг миним среднего риска, равны номерам стратегий обеспеч наиболь средний выигрыш.
Бейссовский подход нахождения оптимального решения.
Бейсовский подход: Если первонач распредел вероятности мы получ доход Q. Если мы можем провести эксперемент дающий новое распред вероятности в завис от первонач Qи нового Q , мы делаем свой выбор стратегии. p'Q.
Некоторые св-ва матричной игры.
Замеч№1 О масштабе игр: Пусть даны 2 игры одинаковой размерности с платежной матрицей р(1) и р(2). При чем при любых i и j выпол (а(2)ij=a(1)ij+), некоторые числа и . Тогда: 1) опт стратегии 1 игрока в 1 и 2 игре одинаковые. Опт стратегии 2 игрока одинаковы в обеих играх.
2) Цена второй игры V2=V1+.
Для некот методов решений все элементы матр должны быть не отрицательными.
Заме№2 О доминировании стратегий: Этот прием применяется для умень размерности игры.
А: Аi доминирует над Ак (Аi>Ак), если для любого j выпол нерав-во аij>akj и хотя бы одно из этих нерав-в строгое.
Ак заведомо невыгодна; сред размер выигрыша меньше; р*к=0, стратегия пассивная.
В: Вj доминирует над Вt (Вj>Вt), если для любого i выпол нерав-во аij>ait и хотя бы одно из этих нерав-в строгое.
Bt невыгодна q*t=0 актив стратегия.
Доминир стратегии вычеркиваются и получ матр меньшей размерностью.
Замеч№3 Сравнение операций по методу Парето: Допустим есть операции Q1, Q2,… Qn. Для каж опер-и расчит 2 параметра: 1) E(Q) эффективность (доход);
2) r(Q) степень риска (-сред квадратич отклон).
Самая лучшая операция это опер с наилуч эф-ю и с наимень риском. F(Q)=E(Q)-r(Q), где - это склонность к риску (не мат проблема). Находим макс из этих критериев maxi F(Qi). Операция Qi>Q, если эф-ть не менее E(Qi)E(Qj), а риск опер r(Qi)r(Qj) и хотя бы одно из нерав-в строгое.
Доминир страт отбрас,
скачать реферат
1 2