Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Системы экстремального управления

..pdf
Скачиваний:
8
Добавлен:
19.11.2023
Размер:
33.28 Mб
Скачать

Выражение в скобках означает, что вариация управле­

ния U ограничена некоторой определенной областью £2. Дело в том, что в процессе идентификации объектов не все мыслимые эксперименты допустимы. Некоторые из возможных экспериментов могут попросту разрушить объект. Поэтому эксперименты должны быть ограничены

некоторым множеством допустимых экспериментов й, которое целиком и полностью определяется спецификой объекта. Очевидно, чем важнее объект, тем «меньше» это множество. И наоборот. Так, например, при иденти­ фикации технологического процесса как объекта управле­ ния зона допустимых экспериментов всегда достаточно узка, так как всякое воздействие на технологический процесс обычно нарушает его нормальный ход. А вероят­ ность, что это парушение произойдет в благоприятном направлении, крайне мала.

Естественно, что активная идентификация имеет боль­ ше возможностей, чем пассивная. Однако организация активного эксперимента требует решения специальной задачи, также экстремальной, что дает возможность по­ строить оптимальный эксперимент. Один из таких ме­ тодов организации оптимального эксперимента с объектом описан в § 11.5.

Теперь обратимся к другому оператору — оператору принятия решения. Целью этого оператора является син­ тез управляющего воздействия U, которое переводит объект в состояние, наименьшим образом уклоняющееся от искомого.

Для конкретности представим цель управления в виде вектора У*, т. е. в процессе управления должно реализо­ ваться выражение

уД-У*. (0.3.5)

(Это лишь частный случай формулировки цели, но он удо­ бен для представления задачи управления на стадии при­ нятия решения.) Естественно ввести меру отклонения объекта от цели в виде величины

/ (У — У*),

(0.3.6)

где / — функция, минимум которой

соответствует У =

= У*, например, квадрат /(•) = (*)2 или модуль аргу­ мента / (•) = |* |.

Задачу принятия решения теперь можно представить, как задачу отыскания такого U, которое минимизирует (0.3.6) в классе допустимых воздействий Q, т. е.

/ [F' (X, U) - Y*]

min;

(0.3.7)

 

t/en

 

здесь F' — описание объекта (0.3.1), полученное на пре­ дыдущей стадии идентификации, Q — множество управ­ ляющих воздействий, которые допускает объект управле­ ния.

Таким образом, на стадии принятия решения необхо­ димо иметь модель объекта, цель и множество возможно­ стей. Решение — это выбор одной из возможностей, наи­ лучшим образом (с точки зрения имеющейся модели F') приводящей объект к цели Y*.

В более общей форме функцию / следовало бы пред­ ставить в виде функционала, дающего возможность оце­ нить эффективность воздействия U при имеющейся модели. Экстремальность функционала / обязательна и в этом случае:

/ [F' (X , U), Z* (Y, X, Ü)]

min,

(0.3.8)

 

и<=а

 

где Z* (У, X , U) — цель управления,

которая,

вообще

говоря, может зависеть от всех входов и

выхода

объекта

управления.

Следует отметить, что задача синтеза оптимального управления, как задача принятия решения, является строго замкнутой математической задачей, в процессе решения которой новой информации не поступает. Одна­ ко ее можно рассматривать как задачу достижения экстре­ мальной цели.

Подведем некоторые итоги для рассматриваемого про­ стого случая управления, когда процесс управления мож­ но разделить на два этапа: идентификации и принятия решения.

Как видно, на обеих стадиях решаются задачи по отыс­ канию средств достижения экстремальных целей. В слу­ чае идентификации такой целью является минимизация функционала невязки действительного F и модельного F' описания объекта управления. На стадии принятия решения целью является минимизация невязки между

тем, каков должен быть объект с точки зрения целей управления и каков он может быть с точки зрения имею­ щейся модели.

Следовательно, даже простейший рассмотренный ал­ горитм управления включает в себя решение задач с экс­ тремальными целями.

Рассмотрим более сложную схему управления. Она опирается на следующую очевидную идею. Цель этапа идентификации, рассмотренного выше, сводилась к со­ ставлению наиболее точного описания объекта с тем, чтобы на следующем этапе это описание дало возможность построить наиболее эффективное управление. Однако всякое управление имеет одну и только одну цель, а цель составления точной модели объекта является промежу­ точной. Эта цель есть результат декомпозиции основной цели, что и привело к декомпозиции алгоритма на два этапа — идентификацию и принятие решений. Это — наиболее простой путь синтеза оптимального управления. Простота его куплена ценой приближенности решения. Более точное решение получится, если рассмотреть про­ цесс управления как дуальный (двойственный) процесс анализа объекта и синтеза управления, направленный на

выполнение

одной цели — цели,

которая должна быть

реализована

в

объекте управления.

 

 

Для этого следует указать, во что, с точки зрения ко­

нечной цели,

обойдется неточность

анализа

объекта,

т. е.

неточность

его

модели. Эту функцию

выполняет

так

называемый

риск

изучения

R '.

Потери,

связанные

с неточностью управления, вызванной неточностью за­ данных (к данному моменту) свойств объекта, естественно назвать риском действия R. Сумма таких рисков дает суммарные средние потери управления в настоящем и бу­ дущем

R* = R + Я'.

(0.3.9)

Управления, минимизирующие эти потери и следует счи­ тать оптимальными

R* [F' (X , IT), Y*] min.

(0.3.10)

и е о

 

Это и есть задача дуального управления [0.1].

Здесь, очевидно, уже

нет экспериментов U' — они

совмещены с управлением

U.

В процессе дуального

управления одновременно ре­

шаются две задачи: эффективно приближать объект к цели и оптимально получать дополнительную информацию об объекте с тем, чтобы на следующем шаге управление было столь же эффективным.

Таким образом, решение задачи дуального управления сводится к управлению с экстремальной целью (миними­ зация суммарного риска).

Следовательно, структура iвсякого управления вклю­ чает в себя управлениечс экстремальной целью. В этом и состоит чуниверсальность экстремального управления.

Г Л A B A f

ТИПЫ УПРАВЛЕНИЯ

Удобно различать три типа управления [1.1]: 1) жест­ кое управление, 2) регулирование, 3) настройка (экс­ тремальное управление). Рассмотрим каждый из них в от­ дельности.

§ 1.1. Ж есткое управление

Жесткое или программное управление является наи­ более простой и наиболее распространенной формой управ­ ления. Жесткое управление опирается на принцип: «оди­ наковые причины вызывают одинаковые следствия». Там,

Рис. 1.1.1. Блок-схема жесткого управления.

где этот принцип выполняется, можно реализовать жест­ кое управление.

Блок-схема жесткого управления показана на рис. 1.1.1. Здесь буквой Y* обозначена цель управления, т. е. состояние, в которое должен быть приведен объект управления. Это состояние сообщается управляющему устройству, которое строит управление X. Управление X воздействует на объект и переводит его в состояние Y

Если требуемое состояние Y* и полученное Y

достаточно

близки друг другу, т. е.

 

Y* ж У,

(1.1.1)

то система жесткого управления работает удовлетвори­ тельно.

Проанализируем работу этой простой схемы. Объект производит преобразование управления X в состояние Y ,

т. е. является преобразователем (для простоты будем рассматривать безынерционные объекты, т. е. такие объ­ екты, передаточная функция которых описывается функ­ цией, а не дифференциальным оператором, свойственным инерционному объекту):

У = F (X, А),

(1.1.2)

где F — оператор (функция) объекта, а буквой А обозна­ чены параметры объекта, которые определяют конкретный вид связи между входом и выходом данного объекта. Управляющее устройство реализует преобразование:

X = Ф (Y *),

(1.1.3)

которое определяет закон управления. Очевидно, что для выполнения условия (1.1.1) необходимо удовлетворение равенства

Y = F [Ф (У), А]

(1.1.4)

при любых У. Из этого уравнения для заданных значений параметров объекта А и вида функции F можно опреде­ лить закон управления Ф, т. е. зависимость (1.1.3), ко­ торая должна быть реализована управляющим уст­ ройством с тем, чтобы система жесткого управления выполняла бы свои функции, т. е. соблюдалось бы усло­ вие (1.1.1).

Очевидно, что эффективность функционирования такой системы управления существенно зависит от стабильно­ сти объекта, т. е. от постоянства F жА. Достаточно изме­ нения одного из параметров объекта и условие (1.1.1) нарушается. Именно в этом состоит слабость жесткого управления, что и определяет ограниченность его при­ менения.

Как видно, равенство (1.1.4)] выполняется при усло­

вии

 

Ф = F2,

(1.1.5)

т. е. в случае, когда функция управления Ф равна обрат­ ной функции объекта.

Таким образом, для синтеза алгоритма регулятора жесткого управления необходимо точно знать оператор управляемого объекта FA .

Примером одной из наиболее распространенных си­ стем жесткого управления является система связи (радио, телевидение), показанная на рис. 1.1.2. Здесь У* — аку­ стические колебания. Они поступают в j управляющее

Рис. 1.1.2. Блок-схема системы связи.

устройство, состоящее из кодирующего устройства (ми­ крофонного блока) и передатчика, на выходе которого образуется управление X в виде радиоволн. Радиоволны, пройдя канал связи, управляют напряжением антенного контура в приемнике и

 

Л

 

 

далее

после детектиро­

 

 

 

вания

(декодирования)

 

•Z

Объект

 

и усиления эти сигналы

&

 

преобразуются в акусти­

 

 

 

Р

-

ческие колебания У при

 

 

Рис. 1.1.3. Блок-схема системы ком­

помощи громкоговори­

теля.

Очевидно, каче­

 

 

пенсации.

 

ство принимаемой пере­

 

 

 

 

дачи существенно зави­ сит от помех е, накладывающихся в канале связи на управление, и от стабильности параметров приемника. Изменение параметров приемника (например, при его не­ исправности) нарушает выполнение условия (1.1.1) и прерывает связь.

Другим примером жесткого управления может1 слу­ жить регулирование методом компенсации (компаунди­ рования). Этот метод имеет своей целью защитить объект от действия возмущения Е. Для этого возмущение Е долж­ но быть измерено и при помощи преобразователя П ор­ ганизовано целенаправленное воздействие на вход объек­ та X (рис. 1Д.З). Пусть объект описывается оператором F:

а цепь компенсации — оператором Ф:

Z — Ф (Е).

Задала синтеза системы компенсации состоит в определе­ нии такого оператора Ф, который делал бы выход объекта независимым (или почти независимым) от возмущения Е. Условие полной компенсации имеет вид

Y = F [X + Ф (Е), Е] = const,

(1.1.7)

Е

 

т. е. выход Y не зависит от Е (У является константой при вариации Е). Условия полной компенсации редко выполняются. Поэтому часто ограничиваются условием частичной компенсации, которое можно записать, например, в виде

DE {F [X + Ф (Е), Е]} min,

(1.1.8)

Ф

 

где DE — знак дисперсии по возмущению Е. Это озна­ чает, что оператор Ф должен быть выбран таким, чтобы минимизировать дисперсию выхода объекта при X — const и Е = var.

Как нетрудно заметить, оператор компенсации Ф за­ висит от оператора объекта F. Поэтому для синтеза Ф необходимо знать точное выражение оператора F, который не должен изменяться в процессе эксплуатации объекта. В противном случае эта система не будет компенсировать возмущения Е.

Система компенсации является типичным примером жесткого управления со всеми вытекающими отсюда последствиями как преимуществ, так и недостатков жест­ кого управления.

Для жесткого управления характерно отсутствие об­ ратной связи, при помощи которой можно было бы кор­ ректировать управление в зависимости от состояния объ­ екта. Управление X строится независимо от действитель­ ного состояния объекта. Управляющее устройство как бы «не интересуется» тем, что происходит в объекте в процес­ се управления. Такой принцип оправдывает себя в двух случаях: когда параметры объекта не изменяются и когда одно управляющее устройство должно управлять большим количеством объектов (напрцмер, в случае

радиовещания). Очевидно, что этот класс управляемых объектов достаточно узок. Во всех других случаях необходимо обращаться к более гибкому способу управ­ ления — к регулированию.

§ 1.2. Регулирование

Задачей регулирования также является выведение объекта в требуемое состояние У*. Однако регулирование как способ управления опирается на информацию о со-

Рис. 1.2.1. Блок-схема регулирования по отклонению.

стоянии объекта, получаемую по каналу обратной связи, причем этой информации достаточно для синтеза управле­ ния.

" Блок-схема регулирования показана на рис. 1.2.1. Здесь управляющее устройство синтезирует управление X , располагая информацией о состоянии объекта. Это дает возможность определить невязку У* — У, т. е. знать, насколько состояние объекта отличается от требуемого, что позволяет образовать управление как функцию не­ вязки:

X = Ф (У* - У).

(1.2.1)

Рассмотрим сначала одномерную систему регулиро­ вания статическим объектом, выходная величина которо­ го должна поддерживаться на заданном уровне у*. На рис. 1.2.2 показана простейшая схема регулирования одномерного объекта, характеристика которого является

монотонно возрастающей функцией

]> oj и имеет вид

У =

F (х, А ),

 

 

(1.2.2)

где х — вход объекта, у — его выход, а А =

(аг,

. ., ак)

— параметры объекта.

На схеме

интегралом

обозна­

чен идеализированный

исполнительный

механизм.

Управление в этом случае образуется по формуле

f

 

х = S(î/* — у) dt.

(1.2.3)

о

 

Динамика процесса регулирования определяется следую­ щим дифференциальным уравнением, которое получается из последних двух выражений:

-^ r + F(x, 4) =

(1.2.4)

Стационарное решение этого уравнения у* = F (х, ^4) соответствует выполнению требуемых условий у = у*,

причем решение в в и д у ]> 0 устойчиво независимо от А .

Рис. 1.2.2. Простейшая схема одномерного регулирования.

Таким образом, конечный результат процесса регули­ рования не зависит от параметров объекта ах, а2,

. . ., ак. Единственным условием, накладываемым на F (ж, А), является постоянство знака производной ^

при всех возможных отклонениях параметров объекта А . Это означает, что выходная величина объекта у будет иметь тенденцию стремиться к заданному уровню у*, независимо от указанных изменений параметров объекта А.

Как видно, возможности регулирования значительно шире, чем жесткого управления. Наличие обратной связи обеспечивает как бы приспособляемость к изменениям в объекте путем корректировки управления. Проще говоря, алгоритм управления сводится к сопоставлению выхода у и задания у* и решению: если оказывается, что У^>У*, то следует уменьшить у , а при у «< у* необхо­ димо увеличивать у. В этом и заключается простой и про­ зрачный смысл алгоритма регулирования.