Глава 12. Регулятор, управляемый ошибками
Форум
     
Регулятор, управляемый ошибками

Игры и стратегии

12/22. Вопросы регулирования и управления чрезвычайно широки, и сказанное до сих пор лишь слегка обрисовывает их. Еще один большой раздел теории регулирования и управления возникает, когда D и R являются векторами и когда сочетания, вызывающие в конце концов исход в Т или Е, распределены во времени так, что составляющие этих векторов D и R появляются по очереди. Тогда все действующее возмущение есть последовательность подвозмущений, а вся вызываемая им реакция есть последовательность подреакций.

Такой случай может встретиться, например, в жизни диких животных, когда жертва пытается регулировать защиту от нападения хищника, причем вся борьба протекает в виде чередующихся этапов угрозы <и защиты. Здесь нападение хищника в целом состоит из последовательности действий D1, D2, D3  D3   ,..., каждое из которых вызывает ответ, так что весь ответ в целом есть также последовательность, которую можно обозначить через R1, R2, R3, .... Вся борьба состоит, таким образом, из двойной последовательности
D1,R1,D2,R2,D3,R3, :  .

Исход определяется некоторым соотношением между всем нападением хищника <и всем ответом жертвы.

Мы теперь рассматриваем еще более сложную интерпретацию основной формулировки из 11/4. Однако она достаточно обычна в биологическом мире. В своей реальной форме - это Битва Жизни; в математической форме - это теория игр <и стратегий. Так, в шахматах исход зависит от того, какой будет конкретная последовательность ходов черных и белых
Б1,Ч1,Б2,Ч2,Б3,Ч3, ....
(Тому, что в 11/4 называлось <ходом>, здесь, конечно, соответствует целая игра.)

Эта теория, основанная Дж. Нейманом в 30-х годах, хотя еще не полностью развита, но уже настолько обширна, что нам придется ограничиться лишь упоминанием о ней. Однако нам следует отметить ее тесную связь и точное соответствие с предметом нашей книги. Она, несомненно, будет иметь огромное научное значение для биологии; ибо врожденные свойства живых организмов суть просто стратегии, оказавшиеся удовлетворительными в ходе многовековой конкуренции и <вделанные> в молодое животное так, чтобы быть готовыми к употреблению по первому требованию. Как многие шахматисты нашли, что ход <Р - Q4> 1 является хорошим способом начинать игру в шахматы, точно так же многие виды нашли, что <отрастить зубы> является хорошим способом начать Битву Жизни.
1 В <алгебраической> шахматной нотации этот ход запишется как с!2 - с!4. - Прим, -перев.

Можно точно продемонстрировать соответствие между теорией игр и предметами, рассматриваемыми в этой книге.

Во-первых, отметим то обстоятельство, что основное понятие 11/4 - таблица исходов, на которой была основана теория регулирования и управления, - тождественно <матрице выплат>, основной в теории игр. Используя это общее понятие, легко показать точное соответствие этих теорий в частных случаях.

Во-вторых, отметим то обстоятельство, что теория игр, сформулированная Дж. Нейманом и О. Моргенштерном, изоморфна теории некоторых определенных машин со входом. Рассмотрим машину, эквивалентную

Рис. 12/22/1.

<обобщенной игре> Дж. Неймана (рис. 12/22/1). (Буквы на рисунке соответствуют тем, которые использовал Дж. Нейман в гл. 2 своей книги. С этой главой желательно ознакомиться. Однако его буквы Т не соответствуют нашему употреблению.)

Итак, имеется машина М со входом. Ее внутренняя структура (ее преобразования) известна игрокам Г. Машина имеет входы трех типов: Г, V и Т. Параметр Г (скажем, какой-нибудь переключатель) определяет, какую структуру будет иметь машина, т. е. в какую игру придется играть. Входы Vi делают возможным производство случайных ходов (например, ввод воздействий от колеса рулетки или колоды перетасованных карт; ср.  12/15). Каждый игрок есть детерминированная динамическая система, соединенная с М двусторонней связью. Он получает информацию из М по особым каналам Ii и затем действует на М определенным образом. Места присоединений каналов I определяются входом Г. Воздействия от каждого Т, вместе с воздействиями других Т и V, полностью управляют через М циферблатами G. Когда игра, т. е. траектория, окончена, судья K читает показания G и выплачивает соответствующие суммы игрокам T.

Здесь мы, очевидно, имеем случай нескольких регуляторов, каждый из которых стремится достичь цели в G; они действуют одновременно и конкурируют внутри М. (Возможность конкуренции между регуляторами до сих пор еще не рассматривалась явно в этих главах.)

Если система ультраустойчива, то поведение каждого Т будет определяться параметрами, ведущими себя как ступенчатые функции. Если данный игрок <удовлетворен> выплатой, которую производит K, его параметры сохранят свои значения и его стратегия останется неизменной; но если он не удовлетворен (т. е. если выплата падает ниже некоторого критического значения), то ступенчатые функции изменят свое значение и в следующей игре проигравший будет использовать новую стратегию.

Близко примыкает к этому предмету теория военного шифрования и дешифрования. Шеннон в своей работе <Теория связи в системах засекречивания> показал, как тесно связаны эти различные области. Почти всякий успех в одной из них проливает свет на другую.

В настоящее время невозможно сказать больше, ибо рассматриваемые взаимосвязи должны еще изучаться и исследоваться. По-видимому, ясно, что теория регулирования (включающая многие из основных проблем орга-низации в мозгу и обществе) и теория игр могут многому научиться друг от друга. Если читателю покажется, что эти исследования несколько абстрактны и лишены применений, пусть он подумает о том, что теория игр и кибернетика суть просто основания теории того, как проложить Ваш Собственный Путь. Немногие предметы могут быть богаче применениями, чем этот!

 
12/2. Сенсорные и моторные ограничения  
12/4. Регулирование ошибками  
12/8. Марковская машина  
12/11. Устойчивость  
12/12. Марковское регулирование  
12/14. Регулирование посредством вето  
12/15. Гомеостат  
12/17. Детерменированное реулирование  
12/19. Непрерывное изменение  
12/21. Усилитель мощности  
12/22. Игры и стратегии