Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Системы экстремального управления

..pdf
Скачиваний:
8
Добавлен:
19.11.2023
Размер:
33.28 Mб
Скачать

поиска имеет вид

X* = X* (t).

(2.4.4)

Тогдаэффективность полученного решения ииспользо­ ванногоалгоритма можно оценить при помощи функции невязки

«i(0 = |X » ( i) - X ,( < ) |

(2.4.5)

или разностью

е2 (0 = Q [X* (01 - Q [Х*о (t)l

(2.4.6)

Введем числовую характеристику (а не функцию) эффек­ тивности алгоритма поиска. Она, например, может иметь одну из следующих форм:

l\ = max &i(t),

(2.4.7)

h

(2.4.8)

(i = 1,2),

*0

 

где t0и — моменты начала и конца наблюдения за про­ цессом экстремального управления, причем возможно, что

=оо.

Впервом случае (2.4.7) — это максимальное отклоне­ ние в пространстве параметров экстремума в процессе его отслеживания (i = 1) или максимальное значение не­ вязки текущего показателя качества и его минимального значения (г = 2). Во втором случае это — среднее отк­ лонение от экстремума в процессе экстремального регу­ лирования (i = 1) или среднее отклонение показателя ка­ чества от экстремального (г — 2).

Задача синтеза оптимального алгоритма отслеживания экстремума сводится к решению экстремальной задачи

/- » min,

(2.4.9)

Феп

 

где Ф — оператор алгоритма поиска, Q — пространство допустимых алгоритмов.

Таким образом, задача эффективного экстремального регулирования заключается в организации такого режима отслеживания блуждающего экстремума объекта, чтобы

минимизировать некоторый заданный показатель эффек­ тивности процесса слежения.

Выбор алгоритма экстремального регулирования яв­ ляется поэтому более тонкой и ответственной операцией, чем синтез алгоритма оптимизации. Эта задача усложняет­ ся еще и потому, что алгоритм экстремального управле­ ния должен быть реализован в специализированном уст­ ройстве — экстремальном регуляторе, что, естественно, сужает класс возможных алгоритмов.

Поэтому процессы экстремального регулирования нуждаются в особо тщательном анализе и учете всей ап­ риорной информации об объекте. Учет апостериорной ин­ формации требует адаптивности алгоритма экстремаль­ ного регулирования.

§ 2.5. Замена экстремального управления регулированием по отклонению

Как показано выше, задача экстремального управле­ ния возникает тогда, когда информация на выходе объекта не позволяет построить управление и приходится обра­ щаться к поиску, который обеспечивает получение необ­ ходимой для синтеза управления информации. Однако часто объект представляется как экстремальный не потому, что недостаточно информации на выходе объекта (ее впол­ не хватает), а из-за того, что не известно (или пока не из­ вестно) как распорядиться этой информацией при синтезе управления. Чаще всего это бывает, когда объект слабо изучен. При более тщательном рассмотрении удается вос­ пользоваться всей имеющейся информацией и построить систему регулирования по отклонению, которую есте­ ственно считать более совершенной системой управления, чем система экстремального управления, требующая вве­ дения процедуры поиска. Поэтому при организации уп­ равления следует стремиться построить его в виде регу­ лирования по отклонению и лишь в случае невозможно­ сти сделать это обращаются к экстремальному управ­ лению.

Рассмотрим в качестве иллюстрации к сказанному за­ мену экстремального управления регулированием по отк­ лонению на примере настройки,; в резонанс колеба­ тельного контура, который рассматривался в § 2.2

(см. рис. 2.2.8). В этом параграфе колебательный контур был представлен как экстремальный объект, который дол­ жен быть настроен в резонанс, т. е. па максимум ампли­ туды тока в контуре.

Уравнение контура, изображенного на рис. 2.2.8,

как известно, имеет вид

 

+ Ri + -± -^idt= U {t).

(2.5.1)

Дифференцируя, это уравнение можно привести к виду

 

 

~ш г + 2к ~ г г + ш°‘ = — —

(2-5-2>

где к =

R

— коэффициент затухания, со0 =

1

 

-у — — соб­

ственная частота контура, которая может изменяться при помощи емкости С.

Пусть возбуждение U (t) имеет вид U (t) = a cos (ùt, где со — частота возбуждения. Тогда окончательно урав­ нение контура приобретает форму

~W + 2JcЧГ + “°1 = — ~L ~ sm

(2.5.3)

Для решения этого уравнения представим ток i (t) в виде

i(t) = A sin ( oat — <р),

(2.5.4)

где А и — неизвестные амплитуда и фаза тока, которые нужно определить. Теперь подставим это выражение в

JT

(2.5.3) и, задавая t = 0 и t = ^ , получаем систему из двух уравнений относительно неизвестных

А (со®— со2) sin ср -1- 2 /сЛсоcos <р = О,

А (соц — со2) cos ф — 2кАт sin ф = ---- .

(2.5.5)

Решая эту систему уравпепий, получаем

А =

ДО)2

(2.5.6)

L Ÿ (со2 —Cù2)2 + 4/,-2ш2

 

 

 

 

2к(о

 

со2—а»2

На рис. 2.5.1 показана зависимость амплитуды А от соот­ ношения частот а/а0. Отчетливо виден экстремальный характер этой зависимости, которая и была положена в основу экстремальной настройки контура, рассмотрен­ ной в § 2.2.

В данном случае измерение только амплитуды не поз­ воляет определить, в каком режиме работает контур (за резонансом или до пего). Это и заставляет обращаться к

экстремальному

управлению

 

при настройке контура,

т. е.

 

к поиску.

резонансной

на­

 

Но

для

 

стройки

контура

можно

вос­

 

пользоваться измерением

фазы

 

Ф, точнее совф. Из (2.5.7) полу­

 

чаем

 

 

 

 

 

cos ф =

 

Q—(ù2

 

 

V (©Q—Cù2)2 -t-

 

Рис. 2.5.1. Амплитудно-ча­

 

 

 

 

 

(2.5.8)

стотная характеристика

 

 

 

контура.

откуда видно

(рис. 2.5.2),

что

при резонансе (ы0 = <о)

cos ф меняет знак, что может быть использовано для соз­ дания автоматической системы регулирования собствен­ ной частоты контура по отклонению.

Для этого достаточно получить сигнал, пропорциональ­ ный cos ф. На рис. 2.5.3 показана блок-схема устройства для автоматической настройки контура в резонанс с час­ тотой возбуждения со. Устройство состоит из блока произ­ ведения и интегратора (исполнительного механизма ИМ). На выходе блока произведения получаем сигнал, равный

a sin оit х A sin (at — ф) = -^у- [cos ф — cos (2at — ф)].

(2.5.9)

Этот сигнал можно послать на исполнительный механизм И М (пусть для простоты — интегратор), изменяющий соб­ ственную частоту контура <и0 (например, путем воздей­ ствия на емкость):

-ур- = —

1созф — cos (2cof — ф)],

(2.5.10)

где [х — величина обратной связи. Теперь, пренебрегая колебательной составляющей правой части этого уравне­ ния (исполнительный механизм отфильтрует ее), получаем, подставляя (2.5.8):

ционироваиие рассматриваемой системы регулирования, независимо от значения частоты возбуждения со.

Рис. 2.5.2. Фазово-час­

Рис. 2.5.3. Блок-схема авто­

тотная характеристика

матического регулирования

контура.

частоты.

Таким образом, использование информации о фазе <р вместо измерения амплитуды А позволило избавиться от экстремальности объекта и создать более совершенную систему регулирования по отклонению.

Каким образом это удалось? Это удалось за счет хоро­ шего знания объекта управления, за счет его тщательно­ го изучения и специальной организации замеров. Это обстоятельство следует всегда иметь в виду, прежде чем строить систему экстремального управления.

Таким образом, иногда объект является экстремаль­ ным не за счет своих внутренних специфических свойств, а ввиду его плохой изученности. Более тщательное изу­ чение объекта часто позволяет превратить экстремальный объект в объект регулирования по отклонению, управле­ ние которым производится хорошо разработанными и

изученными средствами теорий автоматического регули­ рования.

Однако чаще такое превращение экстремального объ­ екта связано со слишком большими исследованиями, которые требуют значительного времени, что заставляет обратиться к экстремальному управлению. С другой сто­ роны, реализация системы автоматического регулирова­ ния по отклонению часто связана с серьезными аппара­ турными и измерительными трудностями. Создать систе­ му экстремального управления часто оказывается проще, чем систему автоматического регулирования, которая требует особо тщательной организации сбора информа­ ции о состоянии объекта и соответствующей обработки этой информации. Совершенство системы автоматическо­ го регулирования получено за счет ее высокой организа­ ции, которая неизбежно имеет пониженную надежность и всегда таит опасность возникновения неустойчивости.

Все эти факторы следует тщательно взвешивать при синтезе системы автоматического управления. И экстре­ мальная система управления и система автоматического регулирования по отклонению имеют свои достоинства и недостатки. Выбор той или иной схемы управления нужно производить исходя из конкретных условий и требований.

Г Л А В А 3

МАТЕМАТИЧЕСКИЕ АСПЕКТЫ ОТЫСКАНИЯ

ЭКСТРЕМУМА (я — 1)

§ 3.1. Модели функций качества объектов

Зависимость значения показателя качества Q от уп­ равляемого параметра х для объектов экстремального управления является неизвестной функцией

Q = Q (*),

(3.1.1)

которую будем называть функцией качества объекта. В литературе эту функцию называют по-разному: функция качества, функция отклика и т. д., а управляемый пара­ метр х часто называют фактором, координатой, перемен­ ной и т. д.

Прежде всего функция качества Q (х) экстремальных объектов в допустимой области S должна обладать свой­ ством экстремальности, т. е. иметь экстремум. В данной книге будет рассматриваться минимум, если, разумеется, не будет оговорено обратное. Существование экстремума Q* необходимо хотя бы в одной допустимой точке х*, положение которой определяется в процессе экстремаль­ ного управления:

<?* = <?(**)<<?(*),

(3.1.2)

где х и х* — допустимые значения управляемого пара­ метра (х, х* е S, где S — область допустимых парамет­ ров). Следует различать локальный и глобальный экстре­ мумы. Для локального экстремума х* выражение (3.1.2) имеет место в некоторой малой области х*, т. е. для х*

х*\ < е< ^ S

(рис. 3.1.1, где х* = х*, i = 1, 2).

Функция качества

может иметь много локальных экстре­

мумов, но лишь один из них является глобальным (хг на рисунке). Глобальный минимум (аналогично макси­ мум) х ** определяется как наименьший из N локальных:

Q (х ") = min Q (xi).

Сформулированное выше требование, накладываемое на функцию Q (х) — иметь экстремум — относится, естест­ венно, к глобальному экстремуму.

Заметим, что указанное требование не является празд­ ной данью математической строгости, а имеет глубокий физический смысл. Действительно, очень часто решение задачи оказывается па границе строгого ограничения ти­

па S

а <С. х <

b. В этом случае экстремальная точка х*

попадает

на границу х*

= а, которая не относится к до­

пустимой

области S

 

(см. рис.

3.1.1).

 

 

Если

ограничиться

 

только

одним

требова­

 

нием о наличии экстре-

 

мума, то процесс поиска

 

этого экстремума может

 

оказаться

очень

дли­

 

тельным. Априорная ин­

 

формация

о

наличии

 

экстремума

функции

Рис. 3.1.1. Примеры локальных

Q{х) крайне мала, чтобы

экстремумов.

строить разумный

про­

 

цесс поиска экстремума. Единственным разумным спосо­ бом поведения в такой обстановке является последова­ тельное определение показателя качества при всех до­ пустимых значениях управляемого параметра. Рассмот­ рим эту стратегию поиска.

Прежде всего, введем понятие точности определения оптимального значения параметра х*. С практической точки зрения два достаточно близких значения параметра можно не различать. Поэтому перед решением всякой практической задачи необходимо задать точность опре­ деления параметра х. Пусть е — заданная точность в оп­ ределении оптимального значения управляемого пара­ метра х*, а «S = b а — допустимый интервал изме­ нения этого параметра. Тогда для реализации указанной

стратегии следует

определить

показатель

качества в

 

 

N =

 

+ 1

(3.1.3)

точках а =

хг,

,

Ь, равномерно отстоящих

друг от друга

на

расстоянии

е : xj = а +

(/ — 1) е. Из

полученных значений показателя качества

Qi = Q (#1)1 Qi ~ Q

QN = Q Ы )

(3.1.4)

выбирается наименьшее значение:

 

Qi =

min {Çj},

(3.1.5)

 

J=I....я

 

номер которого и определяет оценку положения экстре­ мума с точностью не меньшей, чем е:

х* = Xt.

(3.1.6)

Такой метод поиска называется сканированием, или про­ сто перебором. Его следует, если возмояшо, применять только при отсутствии каких-либо дополнительных све­ дений об объекте, кроме его экстремальности.

Однако, как видно, этот метод крайне невыгоден, так как требует слишком большого числа измерений показа­ теля качества. Так, для определения положения экстре­ мума с точностью в 1% от всего интервала S , т. е. при

е = , нужно делать 101 измерение показателя качест­

ва. Подобный метод отыскания экстремума трудно даже называть поиском, настолько он примитивен. Его обычно применяют в случае отсутствия каких-либо априорных сведений об объекте. Однако подобная ситуация очень

редко

встречается.

Обычно мы что-то знаем

об объек­

те. И это является

крайне ценной

априорной

информа­

цией,

которая используется при

организации процесса

поиска положения

экстремума.

 

 

При наличии таких дополнительных, хотя и незначи­ тельных сведений о проведении функции качества Q (х) управляемого объекта удается построить более эффектив­ ные процессы поиска экстремума, которые требуют при той же точности е значительно меньшего числа измере­ ний, чем при переборе. Указанная дополнительная ин­ формация может быть представлена в виде определен­ ных априорных предпосылок о характере этой функции. Например, может быть известно, что эта функция имеет один экстремум или что она монотонна, или ее вторая производная всюду сохраняет свой знак и т. д.

Среди всех возможных дополнительных сведений об объекте наиболее цепным и наименее обременительным

является сведение об унимодальности (одноэкстремаль­ ности) функции качества. Унимодальной функцией назы­ вается функция, имеющая один локальный экстремум. Математически для минимизируемой функции унимодаль­ ность требует выполнения следующих неравенств:

Q (*i) <

Q (х2),

если х* < хх < я2,1

 

Q 0*i) >

Q {х2),

если х1 < х 2 < х * , )

(0.1.7)

где хх и х2 — два

произвольно выбранных состояния, а

х* — положение локального (и в данном случае глобаль­ ного) минимума функции качества. Это означает, что

Рнс. 3.1.2. Примеры унимодальных функций.

справа и слева от минимума унимодальная функция только возрастает. На рис. 3.1.2 показаны примеры уни­ модальных функций, для которых условие (3.1.7), как легко видеть, выполняется.

Если известно, что функция качества объекта унимо­ дальная (а это, как видпо, не является очень жестким ог­ раничением, так как большое число объектов имеет унимо­ дальную характеристику), то при помощи любой пары на­ блюдений Q (хх) и Q (х2) можно при отсутствии помех значи­ тельно сузить зону поиска и указать интервал, в котором находится экстремум. На рис. 3.1.3 показаны два возмож­ ных варианта результатов замеров и намечен возможный характер поведения унимодальной функции. Здесь зашт­ рихована зона, где экстремума заведомо быть не может. Это, как легко видеть, следует непосредственно из опре­ деления унимодальности (3.1.7).