Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Эконометрика. Начальный курс

.pdf
Скачиваний:
15
Добавлен:
20.11.2023
Размер:
21.93 Mб
Скачать

4.4. Спецификация модели

131

будет вопрос: «Верна ли гипотеза Но: |0| > 1?», так как именно это условие различает, какое из двух чисел больше: MSE(/3r) или

MSE(3„).

Аспект выбора модели и аспект оценки параметров модели должны быть, строго говоря, совмещены.

Предыдущая оценка, основанная на предварительном тесте, может быть записана в виде

3 = А(?)3. + (1 -А (8 ))3 ,, где А(?) = |® ’ j ^ j '

Такую оценку естественно назвать «крайней». Можно ее улуч­ шать, выбирая Л(0), например, в виде

л02

л(0) = -z— , 0 ^ с ^ оо.

с2 + в2

Выбор оценки также может быть основан на байесовском под­ ходе, но эти аспекты выходят за пределы нашей книги.

Более подробно свойства оценок, полученных в результате предварительного тестирования, будут рассмотрены в главе 14.

Выводы:

1)при исключении существенных переменных МНК-оценка, получаемая в короткой регрессии, в общем случае смещена и обладает меньшей ковариационной матрицей, чем оценка, полученная в длинной регрессии (в истинной модели);

2 ) если 7 = 0 , то смещение отсутствует;

3)если исключаемые независимые переменные ортогональны оставшимся (X 'Z = О), то оценки, полученные в длинной и короткой регрессиях, совпадают, но остатки регрессий раз­ ные и оценка дисперсии смещена;

4)оценка дисперсии в короткой регрессии имеет неотрицатель­ ное смещение;

5)при включении несущественных переменных оценка пара­ метров /3 является несмещенной;

132

Гл. 4. Различные аспекты множественной регрессии

6 ) ее ковариационная матрица больше, чем у оценки, получае­ мой в истинной модели;

7) оценка дисперсии также является несмещенной.

Сравнение не вложенных моделей

Рассмотрим простой случай, когда надо выбрать между двумя не вложенными друг в друга линейными моделями. Пусть есть две модели:

модель А :

Vt =

+ £t

(4.21)

модель В :

Vt =

 

(4.22)

В работе (Davidson and MacKinnon, 1981) предложена следующая процедура, названная J -тестом. Построим модель, включающую как частный случай модели А и В:

2/t = (1 - 6)x'tP + 8z\7 + щ.

(4.23)

При 6 = 0 модель (4.23) совпадает с моделью А, а при 6 = 1

— с моделью В. Однако уравнение (4.23) невозможно оценить, поскольку параметры /3,7 ,6 не могут быть идентифицированы

одновременно. Оценим из уравнения (4.22)

параметр 7

и заменим

в уравнении (4.23) 7 на полученную оценку 7 :

 

Vt = (1 - 6)®'t/3 + 6«'t7 + щ = X j/3* +

8 y t B + Щ -

(4 .24)

Здесь ytB — прогнозные значения, полученные по модели В, а /3* = (1 —6)/3. Из уравнения (4.24) можно получить оценку 6. Как показали Davidson и MacKinnon, если верна нулевая гипотеза (модель А), то plim 6 = 0 и обычная f-статистика коэф­ фициента 6 имеет асимптотически стандартное нормальное рас­ пределение. Если полученное значение t-статистики больше кри­ тического, то нулевая гипотеза отвергается. Аналогичную про­ цедуру можно проделать, взяв за нулевую гипотезу модель В. В двух из четырех возможных исходов теста, когда обе модели отвергаются или обе модели не отвергаются, ситуация остается неопределенной.

4.4. Спецификация модели

133

Другая ситуация необходимости сравнения двух не вложенных моделей возникает, когда, скажем, надо сделать выбор между ли­ нейной и лог-линейной моделями. Поскольку в этих моделях раз­ ные зависимые переменные (у« и In у*), то критерии качества под­ гонки модели, такие как коэффициент детерминации R 2 или кри­ терии Акаике или Шварца (см. главу 11, (11.97), (11.98)), непри­ менимы. В работе (MacKinnon et al., 1983) предложен РЕ-тест, который состоит в следующем. Оценим обе модели, линейную и лог-линейную, методом наименьших квадратов и получим соот­ ветствующие прогнозные значения yt и 1пу«. Тогда мы можем те­ стировать гипотезу Но: линейная модель против альтернативной гипотезы Hi: лог-линейная модель, проверяя гипотезу SU N = О (с помощью обычной t-статистики, которая имеет при нулевой ги­ потезе приблизительно стандартное нормальное распределение) в уравнении

yt = ®'t/3 + SLI N (In yt - In yt) + et.

(4.25)

Аналогично, проверяя гипотезу SLOG = 0 в уравнении

yt = (Inx t)’(3 + SuDGiVt ~ exp(lnyt) + et,

(4.26)

можно тестировать лог-линейную модель относительно линейной модели. Как и ранее, возможны четыре исхода теста.

Заметим, что РЕ-тесгг может применяться в значительно бо­ лее общей ситуации, подробнее см. (MacKinnon et al., 1983) или (Greene, 1997, п. 10.2.4).

Тест на функциональную форму

Самый простой способ тестировать справедливость линейной спе­ цификации модели (4.27)

yt = x't(3 + et

(4.27)

— это добавить в правую часть нелинейные члены и тестировать их значимость с помощью обычного F -теста. Недостаток этого метода состоит в том, что мы должны задавать альтернативную гипотезу. В работе (Ramsey, 1969) предложен R E SE T -тест (Re­ gression Equation Specification Error Test), основанный на следу­ ющей идее. Бели модель (4.27) верна, то добавление нелинейных

134

Гл. 4. Различные аспекты множественной регрессии

функций yt = x't(3 не должно помогать объяснять у*. В частности, можно добавлять степени:

yt = ж|/3 + агу? + <*зУ? Н----- •" атУГ + £«•

(4.28)

Гипотезу Но: с*2 = ... = <*т можно тестировать с помощью обыч­ ного F -теста или теста Вальда (см. главу 10, п. 10.6). Обычно тест применяется при небольших значениях т = 2,3,4. Заметим, что тест может отвергать нулевую гипотезу не потому, что в истин­ ной модели есть нелинейные члены, а в силу того, что в уравнении (4.27) пропущена переменная, влияние которой частично учтено нелинейными членами в (4.28).

Пример. Зарплата в Нидерландах (Arthur van Soest). Данные содержатся в файле wages.vf 1. Имеется 150 наблюдений, 75 муж­ чин и 75 женщин, работавших на полную ставку (не менее 4 дней в неделю в 1987 г.). Переменные: W — зарплата (гульденов/час) до вычета налогов; A G E — возраст (лет); S E X — 1 (мужчины), 2 (женщины); ED U —уровень образования: 1 (начальная школа или менее), 2 (низшее ремесленное), 3 (среднее), 4 (высшее реме­ сленное), 5 (университет).

Рассмотрим две простейшие модели для зависимости зарпла­ ты от образования, пола и возраста: линейную и полулогариф­ мическую. Получаем следующие оценки (в скобках указаны Р-

значения):

 

 

 

 

W = 3.515 -

3.551S E X + 3.245ED U + 0.441AGE,

(4.29)

(О 258)

(0 004)

(0 000)

(0.000)

 

In W = 2.816 -

0.167SEX + 0.142ЕШ + 0.020AGE.

(4.30)

(0 000)

(0 001)

(0 000)

(0 .000)

 

Коэффициенты детерминшщи равны соответственно 0.516 и 0.580, однако, поскольку зависимые переменные в уравнениях разные, мы не можем использовать их для выбора модели.

Применим описанную выше процедуру Р Е -теста:

W = 3.151 - 3.831SEX + 3.545ED U + 0.453A G E

(0 307) (0 002) (0 000) (0.000)

- 13.96(In и 7 - ь и ? ),

(4.31)

(0 045)

 

 

InIV « 2.173 -

0.164SEX + 0.139ED U + 0 Ш A G E

(0 000)

(0 001)

(0 000)

(0.000)

- 0.0l7(tv - exp(hfiv)).

(4.32)

Упражнения

135

Получаем, что на 5%-ном уровне значимости нулевая гипотеза ли­ нейной модели отвергается (Р-значение 0.045 в уравнении (4.31)), а нулевая гипотеза полулогарифмической модели не отвергается (Р-значение 0.234 в уравнении (4.32)).

RESET-тест для уравнения (4.30) при т = 3 дает следующий результат:

InW ш 41.94 -

5.898SE X + 5.001Я Ш

+ 0.705AGE

(0.001)

(0 001)

(0 001)

(0 001)

- li.o i(СПу )2 +

i.i64 (ы у )3.

( 0. 001)

( 0.0 002)

 

Величина F-статистики для тестирования гипотезы о равенстве двух последних коэффициентов во вспомогательном уравнении равна 6.81 (соответствующее Р-значение равно 0.0015), поэтому тест показывает на ошибочную спецификацию уравнения (4.30). В уравнение надо попробовать включить нелинейные члены (на­ пример, AGE2) или другие переменные.

Упражнения

4.1.С помощью бинарных переменных напишите уравнение, соответ­ ствующее наличию двух структурных изменений в моменты времени to и ti (предполагается, что to < ti).

4.2.Докажите равенство (4.8).

4.3.Докажите эквивалентность (4.19) и (4.20).

(Указание. Первое выражение получается из блочного представления матриц; второе получается после замены X и у на их остатки при ре­ грессии на Z.)

4.4. Предположим, что вы оцениваете линейную функцию потребле­ ния Ct = а + 0yt + et среди п индивидуумов. Как учесть возможный сдвиг этой функции при переходе от городского к сельскому потреби­ телю, если вы считаете, что маргинальная склонность к потреблению постоянна, в то время как средняя склонность к потреблению может меняться? Как проверить гипотезу о том, что маргинальные склонно­ сти к потреблению индивидуумов с доходом выше и ниже уровня у* отличаются?

136

Гл. 4. Различные аспекты множественной регрессии

4.5. Рассмотрим регрессию

У(

+ Ihdt +£t> t =

где d.—некоторая фиктивная переменная. Пусть у0 — среднее значение переменной у по по наблюдениям, для которых d = 0 и уг —среднее значение переменной у по щ наблюдениям, для которых d = 1 (по + щ = п). Найдите V(/?,), V(&).

4.6. На основе квартальных данных с 1971 по 1976г. с помощью метода наименьших квадратов получено следующее уравнение:

yt = 1.12 - 0.0098xti - 5.62х(2 + 0.044x0,

(2

14)

(0 0034)

(3.42)

(0.009)

вскобках указаны стандартные ошибки, RSS = 110.32, ESS = 21.43. а) Проверьте значимость каждого из коэффициентов.

б) Найдите коэффициент детерминации.

п) Протестируйте значимость регрессии в целом.

г) Когда в уравнение были добавлены три фиктивные переменные, соответствующие трем первым кварталам года, величина RSS вы­ росла до 118.20. Проверьте гипотезу о наличии сезонности, сфор­ мулировав необходимые предположения о виде этой сезонности.

д) Для той же исходной модели были раздельно проведены две ре­ грессии на основе данных: 1-й квартал 1971 г. - 1-й квартал 1975 г. и 2-й квартал 1975 г. - 4-й квартал 1976 г., соответствен­ но, и получены следующие значения сумм квадратов остатков: ESS] = 12.25, ESS2 = 2.32. Проверьте гипотезу о том, что между 1-м и 2-м кварталами 1975 г. произошло структурное изменение.

4.7. Процесс, порождающий данные (истинная модель), описывается соотношениями

У( = Р\Хц +

/?2Х(2 + £ (,

E(et) = 0,

Е(е?) = <т2, E(ete«)=0, t ф s, t = l,...,n.

Обозначим через (3\ МНК-оценку параметра /?i в этой регрессии, а через (3\ — МНК-оценку параметра /?i в регрессии у только на xj.

Упражнения

137

а)

Покажите, что

 

 

MSE(fl)

 

 

MSECS,) —1 + rj2(*2 ~ 1)»

 

где

2 _ 0 2

 

2 _ (Е * ! 3* ) 2

 

12~Е*?Е*Г

*2 v55)’

б)

Рассмотрим смесь оценок /?, = А/?,+(1—Х)0\-При каком значении

Лвеличина MSE(/?,) минимальна?

4.8.Процесс, порождающий данные (истинная модель), описывается соотношениями:

у, = 0xt + yzt + et,

E(et) = 0, E(e?) = <r2, E(etee) = 0, t ф s, t = 1,..., n.

Переменная x наблюдается с ошибками, т. e. в регрессии могут быть использованы лишь величины wt = xt+ut, при этом предполагается, что ошибки и удовлетворяют условиям E(ut) = 0, E(u2) = or2, E(ufu„) = 0, t Ф s, E(ute,) = 0, Vs, t. Проводятся две регрессии: первая - у на z; вторая —у на z и w.

Покажите, что смещение оценки параметра у во второй регрессии меньше, чем в первой.

4.9. Процесс, порождающий данные (истинная модель), описывается соотношениями:

Vt = 0 \ X t \ + 0 2 X t 2 + £ t ,

E(et) = 0, E(e2) = <r2, E(ete,) = 0, t Ф s, t = l,...,n.

Проводится регрессия у на х, и стандартным образом через остатки этой регрессии оценивается дисперсия а1. Покажите, что полученная оценка смещена вверх.

4.10. Предположим, что некоторые ежегодные данные удовлетворяют соотношениям:

Vt = а + Pixt +02t + £t (истинная модель),

причем выполнены все условия классической регрессии. Однако оцени­ вается «неправильная» модель без временного тренда

yt * о + bixt + vt.

138

Гл. 4. Различные аспекты множественной регрессии

а) Какие из условий классической регрессии не выполнены для мо­ дели без временного тренда?

б) Будет ли равна нулю сумма остатков для этой регрессии? Как это связано с ошибочным предположением, что E(i/t) = О?

в) Предположим, что коэффициент & положителен и нарисован график остатков регрессии yt = a+i>iit +vt как функция времени. Как должен выглядеть этот график?

4.11. Дана стандартная модель парной регрессии yt = a + /?xt + et, t = l,...,u.

а) Чему равна МНК-оцснка коэффициента 0 при ограничении a =0?

б) Чему равна дисперсия оценки в а)? Покажите, что она меньше, чем a2/ X!"-i(x«- х )2 — дисперсия МНК-оценки 0 в регрессии без ограничения. Противоречит ли это теореме Гаусса-Маркова?

4.12. Рассмотрим регрессионную модель

yt = 0 ixt\ + 0ix t2 + et, t = l , . . . , n ,

в которой переменные представлены в виде отклонений от выборочных средних (т.е. у = 0, х\ = 0, х2 = 0).

а) Покажите, что дисперсии и ковариация оценок метода наимень­ ших квадратов и 02 равны:

V(0,) =

V ( A ) -

Et=l Xtl(l —г?г)

ЕГ»|Х?2(1-Г?2)’

Cov(0,,&) =

.2

2

~ а г 12

 

(1-Г?2) х / Г

е т Ё ^ ’

где

 

 

_ _

E L l xtlxt2

—выборочный коэффициент корреляции между xi и х2.

6)Чему равны дисперсии и ковариация в случае п 2 = 0? Как это связано с проблемой мультнколлинеарности?

Упражнения

139

в) Постройте график отношения V(/?i) к значению V(/?i), получен­ ному в б), в диапазоне 0 < Г12 < 1. Как этот график связан с проблемой мультиколлинеарности?

г) Что происходит с 95%-ными доверительными интервалами для (3i

и02 и ковариацией Со\{(3\,Ръ) при возрастании Г12 в диапазоне

О< г12 < 1 ?

4.13.Некоторая фирма занимается продажей молока. В таблице 4.3 представлены объемы ежемесячных продаж Q (тыс. литров) по раз­

личным ценам Р (руб. за литр). Во время пятого, шестого и седьмого месяцев на одном из предприятий фирмы происходила забастовка.

Месяцы

 

P

Месяцы

 

 

 

Таблица 4.3

Q

Q

P

Месяцы

0

P

1

98

10.0

6

87

14.6

11

121

14.2

2

100

11.0

7

94

14.9

12

123

14.4

3

103

12.5

8

113

13.0

13

126

15.0

4

105

12.5

9

116

13.0

14

128

16.1

5

80

14.6

10

118

13.8

 

 

 

С помощью регрессий Q на Р определите:

а) произошел ли сдвиг свободного члена (константы) во время заба­ стовки по сравнению с обычным режимом;

б) произошел ли сдвиг как константы, так и коэффициента наклона при Р.

4.14. В таблице 4.4 представлены совокупный объем внутренних инве­ стиций у и валовой внутренний продукт США (млрд, долл.) за период с 1939 по 1954 г.

 

 

Таблица 4.4. Инвестиции и ВВП СШ А

Годы

У

X

Годы

У

X

1939

9.3

90.8

1947

34.0

232.8

1940

13.1

100.0

1948

45.9

259.1

1941

17.9

124.9

1949

35.3

258.0

1942

9.9

158.3

1950

53.8

286.2

1943

5.8

192.0

1951

59.2

330.2

1944

7.2

210.5

1952

52.1

347.2

1945

10.6

212.3

1953

53.3

366.1

1946

30.7

209.3

1954

52.7

366.3

Источник: D .S a lv a to r e . S t a t is ti c s a n d E c o n o m e tr ic s , McGraw-Hill, 1982.

140

Гл. 4. Различные аспекты множественной регрессии

Напишите и оцените уравнения, позволяющие ответить на вопрос, изменилась ли зависимость инвестиций от валового внутреннего про­ дукта во время войны (1942-1945 гг.) по сравнению с мирным временем.

4.15. В таблице 4.5 представлены квартальные данные об объемах продаж и доходах текстильных корпораций США с первого квартала 1974 г. по третий квартал 1979 г. Введите сезонные фиктивные пере­ менные и с помощью регрессии дохода на объем продаж исследуйте наличие или отсутствие сезонных колебаний.

 

 

 

Таблица 4.5

Годы

Кварталы

Объем продаж

Доход

 

I

242.0

13.5

1974

II

269.4

16.3

 

III

272.1

15.5

 

IV

277.0

13.4

 

I

247.1

9.3

1975

II

265.8

12.4

 

III

271.0

13.2

 

IV

281.3

14.2

 

I

284.2

14.8

1976

II

307.6

18.1

 

III

301.6

16.0

 

IV

309.8

15.6

 

I

311.5

15.6

1977

II

338.6

19.7

 

III

331.7

16.7

 

IV

346.2

18.4

 

I

340.2

16.0

1978

II

377.5

22.1

 

III

376.9

20.4

 

IV

401.8

22.6

 

I

406.2

22.6

1979

II

436.4

26.8

 

III

437.5

24.8

Источник- D.Salvatore. Statistics and Econometrics, McGraw-Hill, 1982.

4.16. Таблица 4.6 содержит данные об объеме импорта у (млрд, долл.), валовом национальном продукте х\ (млрд, долл.) и индексе потреби­ тельских цен Х2 в США за период с 1964 по 1979 г.