книги / Моделирование систем управления
..pdfЧисло степеней свободы п - 2 \
- разброс линии регрессии |
вокруг среднего значения данных |
(рис. 4.1, в) |
|
s s . = ] £ ( F , - F ) 2 . |
|
Число степеней свободы (п - |
1) - (п - 2) = 1. |
Рис. 4.1
Математическое ожидание квадрата отклонения (дисперсии):
MSa =SSa,
wn SSб
J® . А .
вл -1
Методика проверки была разработана Фишером. Это тест, позволяю щий отличать эффекты, которые могут быть объяснены случайными факто рами, от эффектов, вызванных изменением переменных управления в ходе эксперимента.
Методика Фишера содержит правило сопоставления данной гипотезы с выборкой экспериментальных данных, что позволяет отвергнуть гипотезу (в случае ее малой вероятности) либо принять.
Введем обозначение: Fy>5a - квантиль распределения Фишера с у и с Ô степенями свободы при определенной вероятности a. F находим в статисти ческих таблицах.
В данном случае у = 1 ,а 0 = л - А:-1, где п - число точек эксперимен тальных данных, количество переменных уравнения (к = 1 для одного ко эффициента Л |), (1 - а ) - доверительный уровень (уровень значимости).
Применяя методику Фишера, проверим гипотезу о том, что коэффици ент регрессии А\ = 0. При этом с помощью таблиц проверяем условие
R > F {i ( п - к - 1), 1 - а ,
MS,
где
MS.
Если указанное соотношение удовлетворяется, то гипотезу о том, что Ai = 0, можно отвергнуть на доверительном уровне, равном ( 1 - а ) , т.е. сде лать вывод, что наилучшая прямая существует.
4.2. Модели множественной линейной регрессии
Модель множественной линейной регрессии представлена уравнением
Y t ' A o + Z A j X j .
Необходимо получить значения коэффициентов А 0,Ах,...,Ак, при ко торых сумма квадратов ошибок (модель и выборка) является минимальной.
F = (Л о + А\Хл + А 2Х 2 1 + — + AkYkj - Fj ) 2 +
+ (Л0 + АхХ \2 + А2Х 22 + —+ AkYk2 - Y2Ÿ +
+(À0+А,Х1П+A2x 2n+...+4Л. - r„)2.
âF = â F = |
ж ЗР |
&40 |
dAk |
Из полученной системы уравнений определить параметры Л?, Л/, ...Л**
Преобразование модели множественной линейной регрессии путем привязки к средней точке координат
Этот метод снижает вероятность разрушения плохо обусловленной матрицы в ходе ее обращения при вычислениях на ЭВМ. Приводит к исклю чению первой строки и первого столбца матрицы. В результате п исключает ся из главной диагонали, что обычно улучшает обусловленность матрицы.
Привязка идет по формулам:
x ^ X i - X , |
Л = Г , - ? . |
Модель имеет вид |
|
к |
|
^ = 2 |
A f t ] . |
Аналогично рассмотренному выше составляется функция ошибок, бе |
|
рутся производные и определяются А |
А к |
А0 = ? - ( А 1Х \ + А 2 Х 2 +... + АкХк).
4.3. Модели множественной регрессии более высокого порядка
Выбор типа регрессионных моделей для практического применения должен производиться с учетом физических законов, определяющих течение процесса.
Если анализ физических законов показывает, что соответствующие пе ременные связаны линейной зависимостью, то применение полиномов более высокого порядка приведет лишь к искажению модели, особенно вблизи гра ниц диапазонов экспериментальных данных и за границами. Если же физиче ские законы указывают, например, на кубическую зависимость, то модели регрессии третьего порядка являются более подходящими, чем линейные. Вообще необходимо воздерживаться от использования полиномов высоких степеней в качестве регрессионных моделей (особенно четвертой и более вы
соких степеней). На практике полиномы выше второй степени рекомендуется использовать только тогда, когда это продиктовано физическими законами.
Преобразование в линейную модель показано на примерах ниже пере численных моделей.
Полиномиальные модели второго порядка
Путь модель представлена следующим образом:
Y = h j X j + i h Jmx j x m.
1 Чтобы модель преобразовать в линейную, введем обозначения:
X J = Z J , |
X j X m =Z]m. |
В результате получим модель множественной линейной регрессии
r = b j Z j + i i p JmZja .
1 j=\m=l
Например, пусть имеются две переменные уравнения Х\ и Х2 и уравне ние связи выглядит следующим образом:
Y = Э 1АГ| + Р г ^ 2 + ^ 1 2 ^ 1 ^ 2 + P ll ^ Г + ? 2 2 ^ 2 •
Используя замену переменных, получим
7 = P l Z l + P 2 Z 2 + 2 Р |2 ^ 12 + P n Z n + P 22Z 2 2 .
Мультипликативная регрессионная модель
Для к переменных управления мультипликативная регрессионная мо дель имеет вид:
l'- P o ( * i) ft -{X2 t - . . , { X kt ,
И Л И
г = Ш ( х / ‘ .
М
Мультипликативную модель можно превратить в линейную, пролога рифмировав обе части и обозначив ln У= W; lnAJ = Z/, lnpo = B0:
lnK = lnp0+ I P J.lnX yi
fV =B0+ b j Z j .
Экспоненциальная модель
Для п переменных экспоненциальная модель имеет вид:
У = схр(ро+Р,Л'1+ $2Х2 + - + Р*-Х*)>
1пУ = р0 +р1^ ,+ ... + р Л >
W =V o + b j X j .
Обратимая модель
Для к переменных управления обратимая модель имеет вид
г = (ро+ 1 р л ) .
^= P o + Z P J X J .
4.4.Гармонический анализ
Решение некоторых типов дифференциальных уравнений и аппрокси мация большинства периодических откликов могут быть описаны эмпириче ской моделью, которая линейна по коэффициентам, но нелинейна по незави симым переменным:
у = а0 +a, cos х + Ъхsin JC+ а2 cos 2х + b2 sin 2 х +... + амcos тх + bmsin т х .
Масштаб по оси х следует выбрать так, чтобы основной период по оси |
||
сравнялся 2л. В этом случае |
параметры а} и |
приу = 1 ,2 ,..., m зависят |
от выбора начала отсчета на |
оси х. Однако |
амплитуда у-й гармоники |
\jaj + bjj инвариантна относительно сдвига по оси.
Член, соответствующийу-й гармонике, можно записать в виде
ÜJ cosjx + bj sin jx = pj sin{jx + ©y), |
|
|
p j = ^ a f + b f ; |
Qj= arctg^ -. |
(4.1) |
|
bj |
|
Очевидно, что py не зависит от выбора начала отсчета (не зависит от 0 ). |
||
Однако фазовый угол 0у существует, |
т.е. зависит от положения |
начала |
отсчета. |
|
|
В гармоническом анализе обычно получают оценки и (или) проверяют гипотезы относительно амплитуд различных гармоник.
Допустим, что рассматривается специальный тип гармонического ана лиза, когда проводятся п наблюдений при значениях х, равномерно распреде ленных по одному периоду периодической функции. В этом важном случае расчеты особенно просты вследствие ортогональности данных для всех па раметров.
Выберем значения независимой переменной, при которых получаются
2л
наборы данных,равныеx(=tr, где t = 0 , 1 , 2 , 1 , а г - — (беремг,т.к.
п
в подавляющем числе измерений независимой переменной является время). Итак, для каждого наблюдения
Уcos jtr + bj sin jtr)+ e ,.
Считаем, что е, распределена по нормальному закону, / = 0 ,1 ,...,я -1 . Для полной определенности число наблюдений п = 2т + 1 (столько коэффи циентов-параметров). Используя метод наименьших квадратов, составим функцию квадрата ошибки и возьмем производные по каждому параметру.
|
|
F = Ё (а 0 + Х (ауcosy'fr+bj siny'fr)- Y,f |
, |
|
||||
|
|
Qp |
|
n—1m / |
|
v |
n—1 |
|
|
|
— = 0;... |
w-a0 + Z Z ltf/C o sy> + 6siny7r) = £7,, |
|
||||
Ç* |
|
oa0 |
|
t=0j=i |
|
\ j |
t~o |
|
n—1 |
n—\f m/ |
|
|
|
||||
dF |
= 0; |
• cos jtr + S |
Z \aj *cos№ + bj sin jtr) cosjtr = |
cos |
||||
- |
||||||||
да■j |
t=0 |
r=0\j«l |
|
J |
|
|
||
f? |
я - l |
|
n-lf m / |
|
Л |
|
|
|
dF |
|
a0 • sin jtr + £ |
Z 1° / *cos № + £7 sin y/r ) sin jtr = £ |
7, sin j tr • |
||||
— = 0; £ |
||||||||
dbV |
i-o |
|
*«oV>i |
|
J |
|
|
|
В силу ортогональности обращаются в нуль следующие суммы: |
|
|||||||
|
|
|
|
л-1 |
|
|
|
|
|
|
|
|
£ co s jtr sin jtr = 0, |
|
|
|
|
|
w-l |
|
л-1 |
l»0 |
|
|
|
|
|
|
|
j, к = 1 ,2 ,..., m; у * |
|
||||
|
£ c o s jtrcosktr = £ sin jtr sinktr = 0, |
|
||||||
|
/■0 |
|
/=0 |
|
|
|
|
|
Далее суммы: |
|
|
|
|
|
|
||
|
|
|
Ê cos2 jtr = 2 sin2j t r - — , |
|
|
|
||
Покажем это: |
о |
о |
2 |
|
|
|
||
|
12л |
i l |
„ |
|
|
|||
|
|
2я |
|
|
|
|||
|
|
fcos2 г/dr = - fcos2 rtdrt --------2 n ~ —, |
|
|
||||
|
|
о |
|
r i |
r 2 |
2 |
|
|
Кроме того, |
Н ш / |
|
\ |
|
|
|
||
|
|
|
|
|
|
|
||
|
|
|
Z Z \aj cos i*r + bj sin y/r)= 0, |
|
|
|||
|
|
|
/=0y=l |
|
|
|
|
|
так как суммирование производится за один оборот, каждому положитель ному члену будет соответствовать такой же отрицательный член.
Следовательно, уравнения принимают вид:
пай |
«о = г о = - £ У | = У. |
|||
n |
о |
|
п |
о |
n- 1 |
|
2 |
cos jtr , |
|
- а , |
= ХУ, cosy/r, |
aj = я,- = - |
||
2 J |
о |
|
w 0 |
|
и |
л-i |
~ |
2 'îz1 |
|
-Й , |
= I y, sin y /r, |
bj = bj = - |
£ |
r, sin y /r. |
2 |
о |
|
n о |
|
При обычных предположениях об ошибке е, дисперсии оценок опреде ляются выражениями:
,. щ
где а * - дисперсия е,. Считается, что Е/ распределена по нормальному
закону.
Несмещенная оценка ст^ дается величиной S*, которая может быть
вычислена следующим образом:
2 |
/*0 |
2 Я |
Ч |
- |
п - 2 т - \ |
При предположении, что ошибка г, распределена по нормальному за
кону, в табл. 4.1 представлены результаты дисперсионного анализа, позво ляющего проверить, что амплитуда дайной гармоники отлична от нуля.
Проверка этой гипотезы может быть проведена с использованием F-критерия, использующего отношение
где Sf'=S*.
|
|
|
|
Таблица 4.1 |
Гармоники |
Число степеней |
|
Сумма |
Дисперсия по гармоникам |
|
(деленнаяь на число сте |
|||
свободы |
|
квадратов |
||
|
|
пеней свободы) |
||
|
|
|
|
|
Первая |
2 |
^ и (а р + 6,2 ) |
|
|
Вторая |
2 |
\ |
п Й + ь ? ) |
|
т-я |
2 |
|
|
|
Остаток |
п - 2 т - \ |
1 |
_ |
S r, |
|
|
|
|
Например, если отношение дисперсий является значимым лишь для первой гармоники, то эмпирические данные описываются одной синусои дальной волной.
В свою очередь, можно проверить гипотезу, что амплитуда кавдой из гармоник равна нулю. Кроме того, по оценкам коэффициентов можно вычис лить ру И 0 у .
Пример. Осуществим подгонку модели сш = 4 к следующим экспери ментальным данным о периодическом выходном сигнале для некоторого ус тановившегося процесса:
X |
0 |
я |
я |
я |
2я |
5я |
Я |
7я |
4л |
3я |
5я |
Ия |
2я |
|
0,972 |
6 |
3 |
2 |
3 |
6 |
|
6 |
3 |
2 |
3 |
6 |
|
У |
-0,653 -0,353 |
2,063 |
3,803 |
2,798 -0,977 -4,391 -4,709 -2,165 2,324 |
1,048 |
0,814 |
и = 12 (2л открывает новый цикл).
Из соотношений 1 и-1
ао ~ -пT . y t . “ о
определяем до - -0,0153,
ai = 0,9334, д2 = 0,0391, дз = 0,0625, ац = 0,0030,
S* =0,2516.
2 Л_1 |
2 Л-1 |
= - I F , cos угг, |
=-'L V , sin jtr |
и О |
п о |
6, = 2,0768, i 2=-2,8978, 63 = 0,0027, 64= -0,0377.
Результаты дисперсионного анализа представлены в виде таблицы (табл. 4.2).
|
Средний квадрат |
Таблица 4.2 |
Гармоники |
Отношение дисперсий |
|
|
дисперсии |
|
Первая |
15,552 |
Значимо |
Вторая |
25,197 |
Значимо |
Третья |
11,73 |
Значимо |
Четвертая |
4,29-Ю"3 |
Незначимо |
F o ^ ,7), (2,7) - |
степень свободы каждой гармоники, 1 2 -2 -2 -1 = 7 . |
|
В модель можно было бы включить |
дополнительные гармоники, |
и, возможно, некоторые из них могли бы оказаться значимыми.
4.5. Нелинейные модели
По сравнению с линейными моделями в случае нелинейных моделей усложняется не только оценивание параметров, но и в значительной мере за трудняются проверки гипотез, вычисление и интерпретация доверительных интервалов.
4.5.1. Обзор методов нелинейного оценивания
Пусть дана некоторая случайная наблюдаемая зависимая переменная или отклик У}, или У/, I = 1, 2 ,..., л, в соответствии с тем, проводились или нет повторные наблюдения (У) - среднее значение для i-го момента в случае повторных наблюдений). Чаще всего используется У„ а не Y{, т.к. при работе с нелинейными моделями весьма редко проводятся повторные наблюдения.
Также имеются несколько неслучайных независимых (контролируе мых) переменных Хк, к = 1, 2, q. Предполагается, что как Yh так и Хк не прерывны, т.е. принимают действительные значения из некоторого конечно го интервала.
Пусть ру 7 = 1,2,.... ли будут параметрами модели
Л = Xi, ...,Xq\рь Рг» •••» Рт)>
или, в матричном виде,
Л - Ч « Р ) .
- -1 - - |
Х\2 |
• |
- |
|
|
: |
|
|
- |
i*»2 |
|
/ „ |
■ |
V
IIс |
р 2 |
. о |
|
|
J » . . |
п - число экспериментов, и п>т.
Каждое наблюдаемое значение У/, соответствующее данному набору переменных^ = {ХП)Ха, ...,Л у , связано с математическим ожиданием вели чины Yj Е (У/1Xt) = г|,-соотношением
У —*4/ б»
где 6i- ненаблюдаемая ошибка какого-либо типа.
Можно различать ошибки двух типов: ошибку в измерении экспери ментальной зависимой переменной У и ошибку модели.
Хотя всегда целесообразно исследование поведения ошибки 6/, но на практике часто предполагают, что справедливы следующие основные предпосылки (независимо от того, выполняются они или нет в реальном экс перименте):
-ошибка £j имеет нормальное распределение;
-дисперсия У, при данном Xi постоянна (или, возможно, является неко торой функцией^).
Для определения параметров модели будем использовать метод наи меньших квадратов. Минимизируется функция суммы квадратов откло нений F:
F * Z a / f c - n / W ) ] 2 . 1=1
где со,- - соответствующий вес /-го измерения, возможно, равный 1; У, - еди ничное наблюдение в точке Л}.
Задача нелинейного оценивания, выраженная в форме условия мини мума функции ошибок, является просто задачей оптимизации.
Согласно общепринятой классификации методы оптимизации делятся на два класса:
-методы без производных;
-методы с производными.
Основные методы классифицируются так:
-без производных:
1)метод прямого поиска;
2)симплексный метод.
-с производными:
1)метод Гаусса-Зайделя;
2)градиентные методы.
Все эффе1сгивные методы нелинейного оценивания являются итераци онными.
4.5.2. Метод прямого поиска
Преимущество: метод не требует вычисления производных; процедура хорошо укладывается в логическую схему.
Недостаток: не так быстро приводит к результату, особенно когда чис ло параметров велико.
Алгоритм прямого поиска. Нужно выбрать для всех параметров на
чальные |
значения |
вместе |
с |
некоторыми |
начальными приращениями |
|
6(0) + ДЬ(0). Функция F сначала вычисляется в начальной точке Ь{0). Затем |
||||||
каждое |
значение |
6j0) |
из |
набора Ь(0) последовательно заменяется на |
||
+ Abj0), и если |
при этом значение F улучшается, то в качестве новой |
|||||
оценки |
b f1 = £>у0) + Дb f \ |
Если |
значение F |
не улучшается, то испытанию |
подвергается величина Ь*р - à b f *. Если для каждого из значений Ь*р ± Дbf*
никакого улучшения не наблюдается, то Ь ^ = Ь^ . Этот процесс повторяется
для всех параметров bj.
Новые оценки параметров образуют некий вектор в пространстве пара метров, который задает направление, ведущее к уменьшению F. Вдоль этого направления осуществляется ряд рабочих шагов до тех пор, пока значение F не перестает уменьшаться.
Если пробные шаги не уменьшают F (не выявляют новое направление), приращения Abj постепенно уменьшаются до тех пор, пока не будет найдено новое направление или пока каждое из приращений не станет меньше неко торого предварительно выбранного допустимого отклонения. Невозможность улучшить значение F при очень малых Abj указывает на то, что достигнуто локальное оптимальное значение.
Валгоритм вводятся две основные проверки:
-размер шага АЬ/,
-изменение значения F сравнивается с заданным.
Вычисления прекращают, когда на заданном числе циклов обе провер ки дают положительный результат.
4.5.3. Симплексный метод
Симплексный метод эффективен при большом числе параметров. Для случая двух параметров правильным симплексом является равносторонний треугольник (рис. 4.2, а), для трех параметров - правильный тетраэдр (4 вер шины) (рис. 4.2, б).
При поиске мини мума суммы квадратов отклонений (целевой
функции) F = 2 W -Л ,)2 (У, - экспериментальные значения, ц, - модельные значения) в качестве пробных значений пара метров модели можно выбрать точки в про
странстве параметров, расположенные в вершинах симплекса.
В каждой вершине симплекса подсчитывается значение функции F и строится прямая, проходящая через центр тяжести симплекса и вершину с наибольшим значением функции F (пусть точка А, рис. 4.2, а). Затем точ ка Л отбрасывается и образуется новый симплекс, называемый отражением, который составляют оставшиеся точки и новая точка В,
Повторение этой процедуры, в которой всегда отбрасывается вершина, соответствующая наибольшему значению функции F, и составляет суть сим плексного метода.
Итак, требуется минимизировать величину целевой функции F. Функ ция F зависит от параметров, которые необходимо определить:
F =F(b), b=[bub2, .. . , b j .
Обозначим через Ь{=[би,б2/,...,бш]г вектор, определяемый в простран стве параметров т координатами Ь\, Ьь ..., Ьтвершины с номером /. Сим плекс имеет (т+ 1) вершины, каждой из которых соответствует некоторый вектор б/. F/ - значение целевой функции в вершине с номером i.
Исходный симплекс - правильный симплекс (не обязательно), верши на 1 которого принята за начало координат. Предлагается координаты других вершин определять в соответствии с табл. 4.3.