Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

QalOGUGtk0

.pdf
Скачиваний:
2
Добавлен:
15.04.2023
Размер:
4.97 Mб
Скачать

yi ˆ0 ˆ1xi1 ... ˆ j xij ... ˆk xik

для всех i 1, n , или в матричной форме:

Y X

3. Выбор адекватного уравнения регрессии.

Ввиду четкой интерпретации параметров наиболее широко исполь-

зуются линейная и степенная функции.

 

В

линейной

множественной

регрессии

yi 0 1xi1

... j xij ... k xik i

параметры при X; называются ко-

эффициентами «чистой» регрессии. Они характеризуют среднее изменение результата с изменением соответствующего фактора на единицу при неизмененном значении других факторов, закрепленных на среднем уровне.

При изучении вопросов потребления коэффициенты регрессии рассматриваются как характеристики предельной склонности к потреблению.

В степенной функции yi 0 * xi11 *...* xij j *...* xikk * i коэффициенты

bjявляются коэффициентами эластичности. Они показывают, на сколько процентов в среднем изменяется результат с изменением соответствующего фактора на 1 % при неизменности действия других факторов. Этот вид уравнения регрессии получил наибольшее распространение в производственных функциях, в исследованиях спроса и потребления.

Возможны и другие линеаризуемые функции для построения уравнения множественной регрессии (рис.1):

y e 0 1xi1 ... j xij ... k xik i

- экспонента

i

 

 

 

 

 

yi

 

 

1

 

- гипербола, которая исполь-

 

 

 

 

 

 

 

 

0

1xi1 ... j xij ... k xik i

зуется при обратных связях признаков.

Стандартные компьютерные программы обработки регрессионного анализа позволяют перебирать различные функции и выбрать ту из них, для которой остаточная дисперсия и ошибка аппроксимации минимальны, а коэффициент детерминации максимален.

Если исследователя не устраивает предлагаемый стандартной программой набор функций регрессии, то можно использовать любые другие функции, приводимые путем соответствующих преобразований к линейному виду, например

y

 

x

 

 

1

 

x1/ 2

 

 

ln x

 

 

 

2 x

 

 

i

0

1 i1

 

3

i3

 

4

i 4

 

i

 

 

 

 

 

i 2

 

 

 

 

 

 

 

Однако чем сложнее функция, тем менее интерпретируемы ее параметры.

81

4.Условия Гаусса-Маркова.

Для того чтобы регрессионный анализ, основанный на МНК, давал наилучшие из всех возможных результаты, должны выполняться определенные условия (условия Гаусса — Маркова).

1. Математическое ожидание случайного члена в любом наблюдении должно быть равно нулю, т.е. M ( i ) 0, i 1,n .

Это означает, что случайный член не должен иметь систематического смещения. Если постоянный член включен в уравнение регрессии, то это условие выполняется автоматически.

2. Дисперсия случайного члена должна быть постоянной для всех наблюдений, т.е.

D( i ) M ( i2 ) 2 , i 1, n.

Это означает, что дисперсия случайного члена в каждом наблюдении имеет только одно значение. Под дисперсией 2 имеется в виду возможное поведение случайного члена до того, как сделана выборка. Величина 2 неизвестна, и одна из задач регрессионного анализа состоит в ее оценке.

Опр.Условие независимости дисперсии случайного члена от номера наблюдения называется гомоскедастичностью (что означает одинаковый разброс).

Опр.Зависимость дисперсии случайного члена от номера наблюдения называется гетероскедастичностью.

Таким образом:

D( i ) 2 , i 1,n — гомоскедастичность;

D( i ) i2 , i 1, n гетероскедастичность.

Характерные диаграммы рассеяния для случаев гомоскедастичности и гетероскедастичности показаны на рис. 1, а и б, соответственно.

Рис. 1 а) гомоскедастичность; б) гетероскедастичность

Если условие гомоскедастичности не выполняется, то оценки коэффициентов регрессии будут неэффективными, хотя и несмещенными.

3. Случайные члены должны быть статистически независимы (некоррелированы) между собой, т.е. M ( i j ) 0, i j

82

Условие указывает на некоррелированность случайных членов для разных наблюдений. Это условие часто нарушается, когда данные являются временными рядами. В случае когда третье условие не выполняется, говорят об автокорреляции остатков. Если условие независимости случайных членов не выполняется, то оценки коэффициентов регрессии, полученные по МНК, оказываются неэффективными, хотя и несмещенными.

4. Объясняющая переменная xi есть величина неслучайная.

Четвертое условие является особенно важным. Если условие о неслучайности объясняющей переменной не выполняется, то оценки коэффициентов регрессии оказываются смещенными и несостоятельными.

Нарушение этого условия может быть связано с ошибками измерения объясняющих переменных или с использованием лаговых переменных.

В регрессионном анализе часто вместо условия о неслучайности объясняющей переменной используется более слабое условие о независимости (некоррелированности) распределений объясняющей переменной и случайного члена. Получаемые при этом оценки коэффициентов регрессии обладают теми же основными свойствами, что и оценки, полученные при использовании условия о неслучайности объясняющей переменной.

При выполнении условий Гаусса — Маркова модель называется

классической нормальной линейной регрессионной моделью.

Наряду с условиями Гаусса — Маркова обычно предполагается, что

случайный член распределен нормально, т.е.

i

N (0; 2 )

 

 

3амечание. Если случайный член имеет нормальное распределение, то требование некоррелированности случайных членов эквивалентно их независимости.

5. Оценка вектора

Для оценки вектора наиболее часто используют метод наименьших квадратов (МНК), согласно которому в качестве оценки принимают вектор b , который минимизирует сумму квадратов отклонения наблюдаемых значений yi , от модельных значений yˆi , т. е. квадратичную форму:

n

k

Q (Y X )T (Y X ) ( yi 0 xij j )2

i 1

j 1

Условием обращения Q в минимум является система уравнений

Q 0 , где j 0, k .j

Дифференцируя, получим

2 X T (Y X ) 0 , где X T – транспонированная матрица X .

83

Заменяя вектор оценкой метода наименьших квадратов b , полу-

чим

X TY X T Xb ,

где b - вектор-столбец.

Решая матричное уравнение, найдем b ( X T X ) 1 X TY

Математическое

ожидание

M (b) M ( X T X ) 1 X T Y M

( X T X ) 1 X T ( X )

M ( X T X ) 1 X T X ( X T X ) 1 X T ) M ( X T X ) 1 X T M

 

 

6. Теорема Гаусса-Маркова

Если выполнены условия Гаусса-Маркова, то оценка метода наименьших квадратов b является наилучшей линейной несмещенной оценкой, т.е. обладает свойствами:

1)

несмещенности, т.е. M (b)

 

2)

эффективности: оценка имеет наименьшую дисперсию в классе

всех линейных несмещенных оценок

 

3) состоятельности: lim D(b) 0

 

 

n

 

Доказательство.

 

1)

 

 

M (b) M (( X T X ) 1 X TY ) ( X T X ) 1 X T M (Y ) ( X T X ) 1 X T M ( X )

( X T X ) 1 X T X ( X T X ) 1 X T M ( )

2)

Обозначим A ( X T X ) 1 X T ;

b AY . Для любой другой несме-

щенной оценки b2 = (A + C)Y, где С – некоторая k n матрица. Из условия несмещенности

M (b2 ) M (( A C)Y ) ( A C)M (Y ) ( A C)M ( X ) ,( A C) X (E CX )

откуда СХ = 0.

Вычислим теперь матрицу ковариаций:

cov(b2 ) (b2 ) M[(b2 )(b2 )T ] M[(( A C) )(( A C) )T ]

( A C)M ( T )( A C)T ( A C) 2 ( A C)T 2 ( AAT CAT ACT CCT )

2 (( X T X ) 1 X T X ( X T X ) 1 CX ( X T X ) 1 ( X T X ) 1 X T CT CCT )

2 ( X T X ) 1 2CCT

Таким образом, cov(b2 ) cov(b) , (матрица CCT неотрицательно определена (свойство симметричных матриц), cov(b) D(b) )

84

3) lim D(b)

n

 

1

 

T

 

 

1

 

T

 

lim

 

 

(Y Xb)

(Y Xb)

 

 

(Y Xb)

 

(Y Xb) 0

 

 

 

 

n n k 1

 

 

 

 

 

 

 

7. Проверка значимости уравнения регрессии

Значимость уравнения регрессии, т. е.

гипотеза Н0: =0

( 0 1 ... k 0 ), проверяется по F-критерию,

наблюдаемое значение

которого определяется по формуле:

 

QR

Fí àáë.

 

 

k 1

 

 

 

Qî ñò .

 

 

 

n k 1

, где

 

 

 

 

 

 

 

 

 

 

 

n

QR ( Xb)T ( Xb) yˆi2 - сумма квадратов отклонений нуля, обуслов-

 

 

 

 

 

 

i 1

ленных регрессией;

 

 

 

 

 

 

n

Qî ñò . (Y Xb)T (Y Xb) ei2 - сумма квадратов отклонений ре-

 

 

 

 

 

 

i 1

зультатов наблюдений от регрессии.

Величина Fнабл. при выполнении гипотезы Н0имеет F- распределение

(распределение Фишера) с (k+1) и (n-k-1) степенями свободы

По таблице F-распределения для заданных , v1=k+1, v2=n-k-

1находятFкр

Гипотеза Н0 отклоняется с вероятностью , если Fнабл>Fкр. Из этого следует, что уравнение является значимым, т. е. хотя бы один из коэффициентов регрессии отличен от нуля.

Если уравнение регрессии незначимо, т.е. все коэффициенты уравнения регрессии для генеральной совокупности равны нулю, то на этом анализ уравнения регрессии заканчивается.

Если же нулевая гипотеза Н0 отвергается, то представляет интерес проверка значимости отдельных коэффициентов регрессии и построение интервальных оценок для значимых коэффициентов.

Для проверки значимости отдельных коэффициентов регрессии, т. е. гипотез Н0:

j =0, где j=0,l,2,...k, используют t-критерий и вычисляют величину

t j

 

 

bj

 

 

, которая при выполнении гипотезы Н0имеет t-

 

 

 

 

1 2

 

 

T

X )

1

 

 

sˆ ( X

 

 

j 1 j 1

распределение с числом степеней свободы n-k-1

85

По таблице t-распределения для заданного и v= n-k-1, находят tкp . Гипотеза Но отвергается с вероятностью , если |tнабл|>tкр- Из этого

следует, что соответствующий коэффициент регрессии j значим, т. е.j 0 . В противном случае коэффициент регрессии незначим и соответ-

ствующая переменная в модель не включается. Тогда реализуется алгоритм пошагового регрессионного анализа, состоящий в том, что исключается одна из незначимых переменных, которой соответствует минимальное по абсолютной величине значение tнабл. После этого вновь проводят регрессионный анализ с числом факторов, уменьшенным на единицу. Алгоритм заканчивается получением уравнения регрессии со значимыми коэффициентами.

Существуют и другие алгоритмы пошагового регрессионного анализа, например, с последовательным включением факторов.

8. Интервальное оценивание коэффициентов регрессии

Наряду с точечными оценками b j генеральных коэффициентов регрессии j регрессионный анализ позволяет получать интервальные оценки последних с доверительной вероятностью .

Интервальная оценка с надежностью определяется по формуле:

 

T

 

1 1 2

 

j {bj t sˆ ( X

 

X )

jj

} ,

где t находят по таблице t-распределения с числом степеней свобо-

ды n-k-1

Теперь определим интервальную оценку y надежностью в точке,

определяемой вектором X 0 начальных условий, размерности (k+1):

X 0 (1, x10 , x20 ,..., xk0 )

y [ yˆ t sˆX 0 ( X T X ) 1( X 0 )T ]

где t определяется по таблице t-распределения Стьюдента для

уровня значимости = 1 - и числа степеней свободы (п-k-1). Доверительная оценка для интервала предсказания yˆn 1 с надежно-

стью определяется как:

yn 1 [ X 0b t sˆX 0 ( X T X ) 1( X 0 )T 1]

По мере удаления вектора начальных условий X 0 от вектора средних X ширина доверительного интервала при заданном будет увеличиваться (рис. 2.), где X (1, x1,..., xk )

86

Рис. 2. Точечная y и интервальная оценки уравнения регрессии y 0 1x

9. Коэффициент детерминации

Значимость уравнения регрессии можно проверить с помощью коэффициента детерминации:

 

n

 

n

 

ei2

 

yˆi2

R2 1

i 1

 

i 1

n

n

 

yi2

 

yi2

 

i 1

 

i 1

Чем ближе коэффициент детерминациик 1, тем лучше подобрано уравнение регрессии, и тем в большей степени уравнение пригодно для прогнозирования.

87

Давидюк Е.С.

Решение задач по теме «Матричные игры»

1. Решение матричных игр в чистых стратегиях.

Матричная антагонистическая игра двух игроков с нулевой суммой может рассматриваться как следующая абстрактная игра двух игроков.

Первый игрок имеет m стратегий i= 1,2,...,m, второй имеет n стратегий j = 1,2,...,n. Каждой паре стратегий (i,j) поставлено в соответствие число аij, выражающее выигрыш игрока 1 за счёт игрока 2, если первый игрок примет свою i-ую стратегию, а 2 – свою j-ую стратегию. Все выигрыши игрока 1 (проигрыши игрока 2) записываются в платежную матрицу А.

a11

a12

a1 j

a1n

 

 

 

 

 

 

 

 

 

А = ai1

ai 2

aij

ain

 

 

 

 

 

 

 

 

am2

amj

 

 

am1

amn

Процесс игры: каждый из игроков делает один ход: игрок 1 выбирает свою i-ю стратегию (i=1, m ), 2 – свою j-ю стратегию (j=1, n ), после чего игрок 1 получает выигрыш аij за счёт игрока 2 (если аij<0, то это значит, что игрок 1 платит второму сумму |аij|). На этом игра заканчивается.

Каждая стратегия игрока i=1, m ; j = 1, n часто называется чистой стратегией.

Опр. стратегия игрока является оптимальной, если применение этой стратегии обеспечивает ему наибольший гарантированный выигрыш при всевозможных стратегиях другого игрока.

Тогда, для игрока 1 для каждого значенияi(i =1, m ) определяется минимальное значение выигрыша в зависимости от применяемых стратегий игрока 2

min aij (i = 1, m )

1 j n

т.е. определяется минимальный выигрыш для игрока 1 при условии, что он примет свою i-ю чистую стратегию, затем из этих минимальных выигрышей отыскивается такая стратегия i = iо, при которой этот минимальный выигрыш будет максимальным, т.е. находится

max min aij ai j vн (1).

1 i m 1 j n

o o

 

Опр. Число vн, определённое по формуле (1) называется нижней чистой ценой игры и показывает, какой минимальный выигрыш может гарантировать себе игрок 1, применяя свои чистые стратегии при всевозможных действиях игрока 2.

88

Для игрока 2 при оптимальном своём поведении должен стремится по возможности за счёт своих стратегий максимально уменьшить выигрыш игрока 1. Поэтому для игрока 2 отыскивается

max aij

1 i m

т.е. определяется max выигрыш игрока 1, при условии, что игрок 2 применит свою j-ю чистую стратегию, затем игрок 2 отыскивает такую свою j = j1 стратегию, при которой игрок 1 получит min выигрыш, т.е. находит

min max aij ai j

vв

(2).

1 j n 1 i m

1 1

 

 

 

 

 

Опр. Число vв, определяемое по формуле (2), называется чистой верхней ценой игры и показывает, какой максимальный выигрыш за счёт своих стратегий может себе гарантировать игрок 1.

Другими словами, применяя свои чистые стратегии игрок 1 может обеспечить себе выигрыш не меньше vн, а игрок 2 за счёт применения своих чистых стратегий может не допустить выигрыш игрока 1 больше, чем vв.

Теорема 1. Для любой конечной игры выполнено соотношение

max min aij min max aij

1 i m 1 j n

1 j n 1 i m

Доказательство: Очевидно, что

min aij aij

1 j n

отсюда получаем

max min aij max aij

1 i m 1 j n

1 i m

Так как в этом неравенстве слева стоит конкретное число, а справа выражение, зависящее отj то справедливо следующее неравенство

max min aij min max aij

1 i m 1 j n

1 j n 1 i m

что и требовалось доказать.■

Опр. Если в игре с матрицей Аvн =vв, то говорят, что эта игра имеет седловую точку в чистых стратегиях и чистую цену игры

= vн =vв.

Опр. Седловая точка – это пара чистых стратегий (iо,jо) соответственно игроков 1 и 2, при которых достигается равенство vн =vв. В это понятие вложен следующий смысл: если один из игроков придерживается стратегии, соответствующей седловой точке, то другой игрок не сможет поступить лучше, чем придерживаться стратегии, соответствующей седловой точке.

Математически это можно записать:

aij

ai j

ai j

(3)

o

o o

o

 

где i, j– любые чистые стратегии соответственно игроков 1 и 2; (iо,jо) – стратегии, образующие седловую точку.

89

ai0 j

Таким образом, исходя из (3), седловой элемент a io jo является минималь-

ным в iо-й строке и максимальным в jо-м столбце в матрице А. Отыскание седловой точки матрицы А происходит следующим образом: в матрице А последовательно в каждой строке находят минимальный элемент и проверяют, является ли этот элемент максимальным в своём столбце. Если да, то он и есть седловой элемент, а пара стратегий, ему соответствующая, образует седловую точку.

Опр.Пара чистых стратегий (iо,jо) игроков 1 и 2, образующая седловую точку и седловой элемент aio jo , называется решением игры. При этом iо и jо

называются оптимальными чистыми стратегиями соответственно игроков

1 и 2.

Теорема 2. Конечная игра имеет седловую точку тогда и только тогда, когда существуют такие чистые стратегии (io,jo), при которых aij0 ai0 j0

Доказательство.

Необходимость: Пусть игра имеет седловую точку, т.е. выполнено соотношение

max min aij min max aij

1 i m 1 j n

1 j n 1 i m

Тогда если i0— максиминная стратегия первого игрока, то

max min aij min ai

j ai j

1 i m 1 j n

1 j n

0

0

 

 

Если j0

 

 

минимаксная

стратегия второго игрока, то

aij

max aij

min max aij

 

0

1 i m

0

 

1 j n 1 i m

 

 

 

 

 

 

Поскольку

 

 

 

 

 

max min aij

min max aij

 

1 i m 1 j n

 

1 j n 1 i m

 

То справедливо соотношение

 

aij

min max aij ai

j

(4)

0

1 j n 1 i m

0

 

 

 

 

 

 

 

Это неравенство справедливо при любых значениях i и j, и в частности при i= io,j= j0, а следовательно,

ai

j

min max aij ai

j

0

0

1 j n 1 i m

0

0

 

Откуда очевидно следует, что

max min aij min max aij ai

j

1 i m 1 j n

1 j n 1 i m

0

0

 

 

Из данных равенства и неравенства (4) следует неравенство (3) Достаточность. Если выполняется неравенство (3), то справедлива следующая последовательность неравенств

min max aij max aij

ai

j

min ai

j max min aij

1 j n 1 i m

1 i m

0

0

0

1 j n

0

1 i m 1 j n

 

 

 

 

Откуда следует, что

90

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]