книги / Системы экстремального управления
..pdfпоиска имеет вид
X* = X* (t). |
(2.4.4) |
Тогдаэффективность полученного решения ииспользо ванногоалгоритма можно оценить при помощи функции невязки
«i(0 = |X » ( i) - X ,( < ) | |
(2.4.5) |
или разностью
е2 (0 = Q [X* (01 - Q [Х*о (t)l |
(2.4.6) |
Введем числовую характеристику (а не функцию) эффек тивности алгоритма поиска. Она, например, может иметь одну из следующих форм:
l\ = max &i(t), |
(2.4.7) |
h |
(2.4.8) |
(i = 1,2), |
|
*0 |
|
где t0и — моменты начала и конца наблюдения за про цессом экстремального управления, причем возможно, что
=оо.
Впервом случае (2.4.7) — это максимальное отклоне ние в пространстве параметров экстремума в процессе его отслеживания (i = 1) или максимальное значение не вязки текущего показателя качества и его минимального значения (г = 2). Во втором случае это — среднее отк лонение от экстремума в процессе экстремального регу лирования (i = 1) или среднее отклонение показателя ка чества от экстремального (г — 2).
Задача синтеза оптимального алгоритма отслеживания экстремума сводится к решению экстремальной задачи
/- » min, |
(2.4.9) |
Феп |
|
где Ф — оператор алгоритма поиска, Q — пространство допустимых алгоритмов.
Таким образом, задача эффективного экстремального регулирования заключается в организации такого режима отслеживания блуждающего экстремума объекта, чтобы
минимизировать некоторый заданный показатель эффек тивности процесса слежения.
Выбор алгоритма экстремального регулирования яв ляется поэтому более тонкой и ответственной операцией, чем синтез алгоритма оптимизации. Эта задача усложняет ся еще и потому, что алгоритм экстремального управле ния должен быть реализован в специализированном уст ройстве — экстремальном регуляторе, что, естественно, сужает класс возможных алгоритмов.
Поэтому процессы экстремального регулирования нуждаются в особо тщательном анализе и учете всей ап риорной информации об объекте. Учет апостериорной ин формации требует адаптивности алгоритма экстремаль ного регулирования.
§ 2.5. Замена экстремального управления регулированием по отклонению
Как показано выше, задача экстремального управле ния возникает тогда, когда информация на выходе объекта не позволяет построить управление и приходится обра щаться к поиску, который обеспечивает получение необ ходимой для синтеза управления информации. Однако часто объект представляется как экстремальный не потому, что недостаточно информации на выходе объекта (ее впол не хватает), а из-за того, что не известно (или пока не из вестно) как распорядиться этой информацией при синтезе управления. Чаще всего это бывает, когда объект слабо изучен. При более тщательном рассмотрении удается вос пользоваться всей имеющейся информацией и построить систему регулирования по отклонению, которую есте ственно считать более совершенной системой управления, чем система экстремального управления, требующая вве дения процедуры поиска. Поэтому при организации уп равления следует стремиться построить его в виде регу лирования по отклонению и лишь в случае невозможно сти сделать это обращаются к экстремальному управ лению.
Рассмотрим в качестве иллюстрации к сказанному за мену экстремального управления регулированием по отк лонению на примере настройки,; в резонанс колеба тельного контура, который рассматривался в § 2.2
(см. рис. 2.2.8). В этом параграфе колебательный контур был представлен как экстремальный объект, который дол жен быть настроен в резонанс, т. е. па максимум ампли туды тока в контуре.
Уравнение контура, изображенного на рис. 2.2.8,
как известно, имеет вид |
|
+ Ri + -± -^idt= U {t). |
(2.5.1) |
Дифференцируя, это уравнение можно привести к виду
|
|
~ш г + 2к ~ г г + ш°‘ = — — ■ |
(2-5-2> |
где к = |
R |
— коэффициент затухания, со0 = |
1 |
|
-у — — соб |
ственная частота контура, которая может изменяться при помощи емкости С.
Пусть возбуждение U (t) имеет вид U (t) = a cos (ùt, где со — частота возбуждения. Тогда окончательно урав нение контура приобретает форму
~W + 2JcЧГ + “°1 = — ~L ~ sm |
(2.5.3) |
Для решения этого уравнения представим ток i (t) в виде
i(t) = A sin ( oat — <р), |
(2.5.4) |
где А и <р — неизвестные амплитуда и фаза тока, которые нужно определить. Теперь подставим это выражение в
JT
(2.5.3) и, задавая t = 0 и t = ^ , получаем систему из двух уравнений относительно неизвестных
А (со®— со2) sin ср -1- 2 /сЛсоcos <р = О,
А (соц — со2) cos ф — 2кАт sin ф = ---- . |
(2.5.5) |
Решая эту систему уравпепий, получаем
А = |
ДО)2 |
(2.5.6) |
|
L Ÿ (со2 —Cù2)2 + 4/,-2ш2 |
|||
|
|||
|
|
||
|
2к(о |
|
со2—а»2
На рис. 2.5.1 показана зависимость амплитуды А от соот ношения частот а/а0. Отчетливо виден экстремальный характер этой зависимости, которая и была положена в основу экстремальной настройки контура, рассмотрен ной в § 2.2.
В данном случае измерение только амплитуды не поз воляет определить, в каком режиме работает контур (за резонансом или до пего). Это и заставляет обращаться к
экстремальному |
управлению |
|
|||
при настройке контура, |
т. е. |
|
|||
к поиску. |
резонансной |
на |
|
||
Но |
для |
|
|||
стройки |
контура |
можно |
вос |
|
|
пользоваться измерением |
фазы |
|
|||
Ф, точнее совф. Из (2.5.7) полу |
|
||||
чаем |
|
|
|
|
|
cos ф = |
|
(ÛQ—(ù2 |
|
|
|
V (©Q—Cù2)2 -t- |
|
Рис. 2.5.1. Амплитудно-ча |
|||
|
|
||||
|
|
|
(2.5.8) |
стотная характеристика |
|
|
|
|
контура. |
||
откуда видно |
(рис. 2.5.2), |
что |
при резонансе (ы0 = <о) |
cos ф меняет знак, что может быть использовано для соз дания автоматической системы регулирования собствен ной частоты контура по отклонению.
Для этого достаточно получить сигнал, пропорциональ ный cos ф. На рис. 2.5.3 показана блок-схема устройства для автоматической настройки контура в резонанс с час тотой возбуждения со. Устройство состоит из блока произ ведения и интегратора (исполнительного механизма ИМ). На выходе блока произведения получаем сигнал, равный
a sin оit х A sin (at — ф) = -^у- [cos ф — cos (2at — ф)].
(2.5.9)
Этот сигнал можно послать на исполнительный механизм И М (пусть для простоты — интегратор), изменяющий соб ственную частоту контура <и0 (например, путем воздей ствия на емкость):
-ур- = — |
1созф — cos (2cof — ф)], |
(2.5.10) |
где [х — величина обратной связи. Теперь, пренебрегая колебательной составляющей правой части этого уравне ния (исполнительный механизм отфильтрует ее), получаем, подставляя (2.5.8):
ционироваиие рассматриваемой системы регулирования, независимо от значения частоты возбуждения со.
Рис. 2.5.2. Фазово-час |
Рис. 2.5.3. Блок-схема авто |
тотная характеристика |
матического регулирования |
контура. |
частоты. |
Таким образом, использование информации о фазе <р вместо измерения амплитуды А позволило избавиться от экстремальности объекта и создать более совершенную систему регулирования по отклонению.
Каким образом это удалось? Это удалось за счет хоро шего знания объекта управления, за счет его тщательно го изучения и специальной организации замеров. Это обстоятельство следует всегда иметь в виду, прежде чем строить систему экстремального управления.
Таким образом, иногда объект является экстремаль ным не за счет своих внутренних специфических свойств, а ввиду его плохой изученности. Более тщательное изу чение объекта часто позволяет превратить экстремальный объект в объект регулирования по отклонению, управле ние которым производится хорошо разработанными и
изученными средствами теорий автоматического регули рования.
Однако чаще такое превращение экстремального объ екта связано со слишком большими исследованиями, которые требуют значительного времени, что заставляет обратиться к экстремальному управлению. С другой сто роны, реализация системы автоматического регулирова ния по отклонению часто связана с серьезными аппара турными и измерительными трудностями. Создать систе му экстремального управления часто оказывается проще, чем систему автоматического регулирования, которая требует особо тщательной организации сбора информа ции о состоянии объекта и соответствующей обработки этой информации. Совершенство системы автоматическо го регулирования получено за счет ее высокой организа ции, которая неизбежно имеет пониженную надежность и всегда таит опасность возникновения неустойчивости.
Все эти факторы следует тщательно взвешивать при синтезе системы автоматического управления. И экстре мальная система управления и система автоматического регулирования по отклонению имеют свои достоинства и недостатки. Выбор той или иной схемы управления нужно производить исходя из конкретных условий и требований.
Г Л А В А 3
МАТЕМАТИЧЕСКИЕ АСПЕКТЫ ОТЫСКАНИЯ
ЭКСТРЕМУМА (я — 1)
§ 3.1. Модели функций качества объектов
Зависимость значения показателя качества Q от уп равляемого параметра х для объектов экстремального управления является неизвестной функцией
Q = Q (*), |
(3.1.1) |
которую будем называть функцией качества объекта. В литературе эту функцию называют по-разному: функция качества, функция отклика и т. д., а управляемый пара метр х часто называют фактором, координатой, перемен ной и т. д.
Прежде всего функция качества Q (х) экстремальных объектов в допустимой области S должна обладать свой ством экстремальности, т. е. иметь экстремум. В данной книге будет рассматриваться минимум, если, разумеется, не будет оговорено обратное. Существование экстремума Q* необходимо хотя бы в одной допустимой точке х*, положение которой определяется в процессе экстремаль ного управления:
<?* = <?(**)<<?(*), |
(3.1.2) |
где х и х* — допустимые значения управляемого пара метра (х, х* е S, где S — область допустимых парамет ров). Следует различать локальный и глобальный экстре мумы. Для локального экстремума х* выражение (3.1.2) имеет место в некоторой малой области х*, т. е. для х*
\х — х*\ < е< ^ S |
(рис. 3.1.1, где х* = х*, i = 1, 2). |
Функция качества |
может иметь много локальных экстре |
мумов, но лишь один из них является глобальным (хг на рисунке). Глобальный минимум (аналогично макси мум) х ** определяется как наименьший из N локальных:
Q (х ") = min Q (xi).
Сформулированное выше требование, накладываемое на функцию Q (х) — иметь экстремум — относится, естест венно, к глобальному экстремуму.
Заметим, что указанное требование не является празд ной данью математической строгости, а имеет глубокий физический смысл. Действительно, очень часто решение задачи оказывается па границе строгого ограничения ти
па S |
а <С. х < |
b. В этом случае экстремальная точка х* |
|||
попадает |
на границу х* |
= а, которая не относится к до |
|||
пустимой |
области S |
|
|||
(см. рис. |
3.1.1). |
|
|
||
Если |
ограничиться |
|
|||
только |
одним |
требова |
|
||
нием о наличии экстре- |
|
||||
мума, то процесс поиска |
|
||||
этого экстремума может |
|
||||
оказаться |
очень |
дли |
|
||
тельным. Априорная ин |
|
||||
формация |
о |
наличии |
|
||
экстремума |
функции |
Рис. 3.1.1. Примеры локальных |
|||
Q{х) крайне мала, чтобы |
экстремумов. |
||||
строить разумный |
про |
|
цесс поиска экстремума. Единственным разумным спосо бом поведения в такой обстановке является последова тельное определение показателя качества при всех до пустимых значениях управляемого параметра. Рассмот рим эту стратегию поиска.
Прежде всего, введем понятие точности определения оптимального значения параметра х*. С практической точки зрения два достаточно близких значения параметра можно не различать. Поэтому перед решением всякой практической задачи необходимо задать точность опре деления параметра х. Пусть е — заданная точность в оп ределении оптимального значения управляемого пара метра х*, а «S = b — а — допустимый интервал изме нения этого параметра. Тогда для реализации указанной
стратегии следует |
определить |
показатель |
качества в |
||
|
|
N = |
|
+ 1 |
(3.1.3) |
точках а = |
хг, |
, |
— Ь, равномерно отстоящих |
||
друг от друга |
на |
расстоянии |
е : xj = а + |
(/ — 1) е. Из |
полученных значений показателя качества
Qi = Q (#1)1 Qi ~ Q |
QN = Q Ы ) |
(3.1.4) |
выбирается наименьшее значение: |
|
|
Qi = |
min {Çj}, |
(3.1.5) |
|
J=I....я |
|
номер которого и определяет оценку положения экстре мума с точностью не меньшей, чем е:
х* = Xt. |
(3.1.6) |
Такой метод поиска называется сканированием, или про сто перебором. Его следует, если возмояшо, применять только при отсутствии каких-либо дополнительных све дений об объекте, кроме его экстремальности.
Однако, как видно, этот метод крайне невыгоден, так как требует слишком большого числа измерений показа теля качества. Так, для определения положения экстре мума с точностью в 1% от всего интервала S , т. е. при
е = , нужно делать 101 измерение показателя качест
ва. Подобный метод отыскания экстремума трудно даже называть поиском, настолько он примитивен. Его обычно применяют в случае отсутствия каких-либо априорных сведений об объекте. Однако подобная ситуация очень
редко |
встречается. |
Обычно мы что-то знаем |
об объек |
|
те. И это является |
крайне ценной |
априорной |
информа |
|
цией, |
которая используется при |
организации процесса |
||
поиска положения |
экстремума. |
|
|
При наличии таких дополнительных, хотя и незначи тельных сведений о проведении функции качества Q (х) управляемого объекта удается построить более эффектив ные процессы поиска экстремума, которые требуют при той же точности е значительно меньшего числа измере ний, чем при переборе. Указанная дополнительная ин формация может быть представлена в виде определен ных априорных предпосылок о характере этой функции. Например, может быть известно, что эта функция имеет один экстремум или что она монотонна, или ее вторая производная всюду сохраняет свой знак и т. д.
Среди всех возможных дополнительных сведений об объекте наиболее цепным и наименее обременительным
является сведение об унимодальности (одноэкстремаль ности) функции качества. Унимодальной функцией назы вается функция, имеющая один локальный экстремум. Математически для минимизируемой функции унимодаль ность требует выполнения следующих неравенств:
Q (*i) < |
Q (х2), |
если х* < хх < я2,1 |
|
Q 0*i) > |
Q {х2), |
если х1 < х 2 < х * , ) |
(0.1.7) |
где хх и х2 — два |
произвольно выбранных состояния, а |
х* — положение локального (и в данном случае глобаль ного) минимума функции качества. Это означает, что
Рнс. 3.1.2. Примеры унимодальных функций.
справа и слева от минимума унимодальная функция только возрастает. На рис. 3.1.2 показаны примеры уни модальных функций, для которых условие (3.1.7), как легко видеть, выполняется.
Если известно, что функция качества объекта унимо дальная (а это, как видпо, не является очень жестким ог раничением, так как большое число объектов имеет унимо дальную характеристику), то при помощи любой пары на блюдений Q (хх) и Q (х2) можно при отсутствии помех значи тельно сузить зону поиска и указать интервал, в котором находится экстремум. На рис. 3.1.3 показаны два возмож ных варианта результатов замеров и намечен возможный характер поведения унимодальной функции. Здесь зашт рихована зона, где экстремума заведомо быть не может. Это, как легко видеть, следует непосредственно из опре деления унимодальности (3.1.7).