книги / Системы экстремального управления
..pdfВыражение в скобках означает, что вариация управле
ния U ограничена некоторой определенной областью £2. Дело в том, что в процессе идентификации объектов не все мыслимые эксперименты допустимы. Некоторые из возможных экспериментов могут попросту разрушить объект. Поэтому эксперименты должны быть ограничены
некоторым множеством допустимых экспериментов й, которое целиком и полностью определяется спецификой объекта. Очевидно, чем важнее объект, тем «меньше» это множество. И наоборот. Так, например, при иденти фикации технологического процесса как объекта управле ния зона допустимых экспериментов всегда достаточно узка, так как всякое воздействие на технологический процесс обычно нарушает его нормальный ход. А вероят ность, что это парушение произойдет в благоприятном направлении, крайне мала.
Естественно, что активная идентификация имеет боль ше возможностей, чем пассивная. Однако организация активного эксперимента требует решения специальной задачи, также экстремальной, что дает возможность по строить оптимальный эксперимент. Один из таких ме тодов организации оптимального эксперимента с объектом описан в § 11.5.
Теперь обратимся к другому оператору — оператору принятия решения. Целью этого оператора является син тез управляющего воздействия U, которое переводит объект в состояние, наименьшим образом уклоняющееся от искомого.
Для конкретности представим цель управления в виде вектора У*, т. е. в процессе управления должно реализо ваться выражение
уД-У*. (0.3.5)
(Это лишь частный случай формулировки цели, но он удо бен для представления задачи управления на стадии при нятия решения.) Естественно ввести меру отклонения объекта от цели в виде величины
/ (У — У*), |
(0.3.6) |
где / — функция, минимум которой |
соответствует У = |
= У*, например, квадрат /(•) = (*)2 или модуль аргу мента / (•) = |* |.
Задачу принятия решения теперь можно представить, как задачу отыскания такого U, которое минимизирует (0.3.6) в классе допустимых воздействий Q, т. е.
/ [F' (X, U) - Y*] |
min; |
(0.3.7) |
|
t/en |
|
здесь F' — описание объекта (0.3.1), полученное на пре дыдущей стадии идентификации, Q — множество управ ляющих воздействий, которые допускает объект управле ния.
Таким образом, на стадии принятия решения необхо димо иметь модель объекта, цель и множество возможно стей. Решение — это выбор одной из возможностей, наи лучшим образом (с точки зрения имеющейся модели F') приводящей объект к цели Y*.
В более общей форме функцию / следовало бы пред ставить в виде функционала, дающего возможность оце нить эффективность воздействия U при имеющейся модели. Экстремальность функционала / обязательна и в этом случае:
/ [F' (X , U), Z* (Y, X, Ü)] |
min, |
(0.3.8) |
|
|
и<=а |
|
|
где Z* (У, X , U) — цель управления, |
которая, |
вообще |
|
говоря, может зависеть от всех входов и |
выхода |
объекта |
управления.
Следует отметить, что задача синтеза оптимального управления, как задача принятия решения, является строго замкнутой математической задачей, в процессе решения которой новой информации не поступает. Одна ко ее можно рассматривать как задачу достижения экстре мальной цели.
Подведем некоторые итоги для рассматриваемого про стого случая управления, когда процесс управления мож но разделить на два этапа: идентификации и принятия решения.
Как видно, на обеих стадиях решаются задачи по отыс канию средств достижения экстремальных целей. В слу чае идентификации такой целью является минимизация функционала невязки действительного F и модельного F' описания объекта управления. На стадии принятия решения целью является минимизация невязки между
тем, каков должен быть объект с точки зрения целей управления и каков он может быть с точки зрения имею щейся модели.
Следовательно, даже простейший рассмотренный ал горитм управления включает в себя решение задач с экс тремальными целями.
Рассмотрим более сложную схему управления. Она опирается на следующую очевидную идею. Цель этапа идентификации, рассмотренного выше, сводилась к со ставлению наиболее точного описания объекта с тем, чтобы на следующем этапе это описание дало возможность построить наиболее эффективное управление. Однако всякое управление имеет одну и только одну цель, а цель составления точной модели объекта является промежу точной. Эта цель есть результат декомпозиции основной цели, что и привело к декомпозиции алгоритма на два этапа — идентификацию и принятие решений. Это — наиболее простой путь синтеза оптимального управления. Простота его куплена ценой приближенности решения. Более точное решение получится, если рассмотреть про цесс управления как дуальный (двойственный) процесс анализа объекта и синтеза управления, направленный на
выполнение |
одной цели — цели, |
которая должна быть |
||||||
реализована |
в |
объекте управления. |
|
|
||||
Для этого следует указать, во что, с точки зрения ко |
||||||||
нечной цели, |
обойдется неточность |
анализа |
объекта, |
|||||
т. е. |
неточность |
его |
модели. Эту функцию |
выполняет |
||||
так |
называемый |
риск |
изучения |
R '. |
Потери, |
связанные |
с неточностью управления, вызванной неточностью за данных (к данному моменту) свойств объекта, естественно назвать риском действия R. Сумма таких рисков дает суммарные средние потери управления в настоящем и бу дущем
R* = R + Я'. |
(0.3.9) |
Управления, минимизирующие эти потери и следует счи тать оптимальными
R* [F' (X , IT), Y*] min. |
(0.3.10) |
и е о |
|
Это и есть задача дуального управления [0.1].
Здесь, очевидно, уже |
нет экспериментов U' — они |
совмещены с управлением |
U. |
В процессе дуального |
управления одновременно ре |
шаются две задачи: эффективно приближать объект к цели и оптимально получать дополнительную информацию об объекте с тем, чтобы на следующем шаге управление было столь же эффективным.
Таким образом, решение задачи дуального управления сводится к управлению с экстремальной целью (миними зация суммарного риска).
Следовательно, структура iвсякого управления вклю чает в себя управлениечс экстремальной целью. В этом и состоит чуниверсальность экстремального управления.
Г Л A B A f
ТИПЫ УПРАВЛЕНИЯ
Удобно различать три типа управления [1.1]: 1) жест кое управление, 2) регулирование, 3) настройка (экс тремальное управление). Рассмотрим каждый из них в от дельности.
§ 1.1. Ж есткое управление
Жесткое или программное управление является наи более простой и наиболее распространенной формой управ ления. Жесткое управление опирается на принцип: «оди наковые причины вызывают одинаковые следствия». Там,
Рис. 1.1.1. Блок-схема жесткого управления.
где этот принцип выполняется, можно реализовать жест кое управление.
Блок-схема жесткого управления показана на рис. 1.1.1. Здесь буквой Y* обозначена цель управления, т. е. состояние, в которое должен быть приведен объект управления. Это состояние сообщается управляющему устройству, которое строит управление X. Управление X воздействует на объект и переводит его в состояние Y
Если требуемое состояние Y* и полученное Y |
достаточно |
близки друг другу, т. е. |
|
Y* ж У, |
(1.1.1) |
то система жесткого управления работает удовлетвори тельно.
Проанализируем работу этой простой схемы. Объект производит преобразование управления X в состояние Y ,
т. е. является преобразователем (для простоты будем рассматривать безынерционные объекты, т. е. такие объ екты, передаточная функция которых описывается функ цией, а не дифференциальным оператором, свойственным инерционному объекту):
У = F (X, А), |
(1.1.2) |
где F — оператор (функция) объекта, а буквой А обозна чены параметры объекта, которые определяют конкретный вид связи между входом и выходом данного объекта. Управляющее устройство реализует преобразование:
X = Ф (Y *), |
(1.1.3) |
которое определяет закон управления. Очевидно, что для выполнения условия (1.1.1) необходимо удовлетворение равенства
Y = F [Ф (У), А] |
(1.1.4) |
при любых У. Из этого уравнения для заданных значений параметров объекта А и вида функции F можно опреде лить закон управления Ф, т. е. зависимость (1.1.3), ко торая должна быть реализована управляющим уст ройством с тем, чтобы система жесткого управления выполняла бы свои функции, т. е. соблюдалось бы усло вие (1.1.1).
Очевидно, что эффективность функционирования такой системы управления существенно зависит от стабильно сти объекта, т. е. от постоянства F жА. Достаточно изме нения одного из параметров объекта и условие (1.1.1) нарушается. Именно в этом состоит слабость жесткого управления, что и определяет ограниченность его при менения.
Как видно, равенство (1.1.4)] выполняется при усло
вии |
|
Ф = F2, |
(1.1.5) |
т. е. в случае, когда функция управления Ф равна обрат ной функции объекта.
Таким образом, для синтеза алгоритма регулятора жесткого управления необходимо точно знать оператор управляемого объекта FA .
Примером одной из наиболее распространенных си стем жесткого управления является система связи (радио, телевидение), показанная на рис. 1.1.2. Здесь У* — аку стические колебания. Они поступают в j управляющее
Рис. 1.1.2. Блок-схема системы связи.
устройство, состоящее из кодирующего устройства (ми крофонного блока) и передатчика, на выходе которого образуется управление X в виде радиоволн. Радиоволны, пройдя канал связи, управляют напряжением антенного контура в приемнике и
|
Л |
|
|
далее |
после детектиро |
|
|
|
вания |
(декодирования) |
|
|
•Z |
Объект |
|
и усиления эти сигналы |
|
& |
|
преобразуются в акусти |
|||
|
|
||||
|
Р |
- |
ческие колебания У при |
||
|
|
||||
Рис. 1.1.3. Блок-схема системы ком |
помощи громкоговори |
||||
теля. |
Очевидно, каче |
||||
|
|
пенсации. |
|
ство принимаемой пере |
|
|
|
|
|
дачи существенно зави сит от помех е, накладывающихся в канале связи на управление, и от стабильности параметров приемника. Изменение параметров приемника (например, при его не исправности) нарушает выполнение условия (1.1.1) и прерывает связь.
Другим примером жесткого управления может1 слу жить регулирование методом компенсации (компаунди рования). Этот метод имеет своей целью защитить объект от действия возмущения Е. Для этого возмущение Е долж но быть измерено и при помощи преобразователя П ор ганизовано целенаправленное воздействие на вход объек та X (рис. 1Д.З). Пусть объект описывается оператором F:
а цепь компенсации — оператором Ф:
Z — Ф (Е).
Задала синтеза системы компенсации состоит в определе нии такого оператора Ф, который делал бы выход объекта независимым (или почти независимым) от возмущения Е. Условие полной компенсации имеет вид
Y = F [X + Ф (Е), Е] = const, |
(1.1.7) |
Е |
|
т. е. выход Y не зависит от Е (У является константой при вариации Е). Условия полной компенсации редко выполняются. Поэтому часто ограничиваются условием частичной компенсации, которое можно записать, например, в виде
DE {F [X + Ф (Е), Е]} min, |
(1.1.8) |
Ф |
|
где DE — знак дисперсии по возмущению Е. Это озна чает, что оператор Ф должен быть выбран таким, чтобы минимизировать дисперсию выхода объекта при X — const и Е = var.
Как нетрудно заметить, оператор компенсации Ф за висит от оператора объекта F. Поэтому для синтеза Ф необходимо знать точное выражение оператора F, который не должен изменяться в процессе эксплуатации объекта. В противном случае эта система не будет компенсировать возмущения Е.
Система компенсации является типичным примером жесткого управления со всеми вытекающими отсюда последствиями как преимуществ, так и недостатков жест кого управления.
Для жесткого управления характерно отсутствие об ратной связи, при помощи которой можно было бы кор ректировать управление в зависимости от состояния объ екта. Управление X строится независимо от действитель ного состояния объекта. Управляющее устройство как бы «не интересуется» тем, что происходит в объекте в процес се управления. Такой принцип оправдывает себя в двух случаях: когда параметры объекта не изменяются и когда одно управляющее устройство должно управлять большим количеством объектов (напрцмер, в случае
радиовещания). Очевидно, что этот класс управляемых объектов достаточно узок. Во всех других случаях необходимо обращаться к более гибкому способу управ ления — к регулированию.
§ 1.2. Регулирование
Задачей регулирования также является выведение объекта в требуемое состояние У*. Однако регулирование как способ управления опирается на информацию о со-
Рис. 1.2.1. Блок-схема регулирования по отклонению.
стоянии объекта, получаемую по каналу обратной связи, причем этой информации достаточно для синтеза управле ния.
" Блок-схема регулирования показана на рис. 1.2.1. Здесь управляющее устройство синтезирует управление X , располагая информацией о состоянии объекта. Это дает возможность определить невязку У* — У, т. е. знать, насколько состояние объекта отличается от требуемого, что позволяет образовать управление как функцию не вязки:
X = Ф (У* - У). |
(1.2.1) |
Рассмотрим сначала одномерную систему регулиро вания статическим объектом, выходная величина которо го должна поддерживаться на заданном уровне у*. На рис. 1.2.2 показана простейшая схема регулирования одномерного объекта, характеристика которого является
монотонно возрастающей функцией |
]> oj и имеет вид |
|||
У = |
F (х, А ), |
|
|
(1.2.2) |
где х — вход объекта, у — его выход, а А = |
(аг, |
. ., ак) |
||
— параметры объекта. |
На схеме |
интегралом |
обозна |
|
чен идеализированный |
исполнительный |
механизм. |
Управление в этом случае образуется по формуле
f |
|
х = S(î/* — у) dt. |
(1.2.3) |
о |
|
Динамика процесса регулирования определяется следую щим дифференциальным уравнением, которое получается из последних двух выражений:
-^ r + F(x, 4) = |
(1.2.4) |
Стационарное решение этого уравнения у* = F (х, ^4) соответствует выполнению требуемых условий у = у*,
причем решение в в и д у ]> 0 устойчиво независимо от А .
Рис. 1.2.2. Простейшая схема одномерного регулирования.
Таким образом, конечный результат процесса регули рования не зависит от параметров объекта ах, а2,
. . ., ак. Единственным условием, накладываемым на F (ж, А), является постоянство знака производной ^
при всех возможных отклонениях параметров объекта А . Это означает, что выходная величина объекта у будет иметь тенденцию стремиться к заданному уровню у*, независимо от указанных изменений параметров объекта А.
Как видно, возможности регулирования значительно шире, чем жесткого управления. Наличие обратной связи обеспечивает как бы приспособляемость к изменениям в объекте путем корректировки управления. Проще говоря, алгоритм управления сводится к сопоставлению выхода у и задания у* и решению: если оказывается, что У^>У*, то следует уменьшить у , а при у «< у* необхо димо увеличивать у. В этом и заключается простой и про зрачный смысл алгоритма регулирования.