Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Эконометрика. Начальный курс

.pdf
Скачиваний:
15
Добавлен:
20.11.2023
Размер:
21.93 Mб
Скачать

6.1. Гетероскедастичыость

171

коэффициенты), сделанные в начале и продолжении 1 этого при­ мера.

Для учета гетероскедастичности использовалась так назы­ ваемая двухшаговая процедура оценки (two-step estimation (см. Greene, 1997), не путать с двухшаговым методом наименьших квад­ ратов, two stage least squares, п. 8.2), которая является обобщением описанной выше ситуации, когда дисперсия пропорциональна од­ ному из регрессоров. Такая двухшаговая процедура дает асимпто­ тически несмещенные оценки стандартных ошибок коэффициентов регрессии.

Предполагается, что дисперсия ошибки есть линейная функция от нескольких регрессоров, в данном случае

<т? = 0о + ALOGLIVSPi + /ЗгВМСК*.

(*)

На первом шаге процедуры мы оцениваем регрессионное уравнение нашей модели:

LOGPRICE = /?0 + ftLOGLIVSP + ftLOGPLAN + &LOGKITSP + ftLOGDIST + /JsFLOOR + /?сВМСК + jfrBAL

+ /JeLIFT + /3gRl + /JJOR2 + /?nR3 + j3uR4 + e, (**)

и из регрессии (*) (подставив вместо <7jостатки е, регрессии (**)) находим состоятельную оценку вектора дисперсий <7?.

На втором шаге полученные оценки Oi используются в каче­ стве весовых коэффициентов для взвешенного метода наимень­ ших квадратов (t-е уравнение делится на а*) (см. стр. 168).

В таблице 6.1 приведены результаты описанной выше двухша­ говой процедуры.

Из сравнения таблиц 3.1 и 6.1 видно, что существенных изме­ нений в оценках не произошло.

Наибольшему изменению подверглись оценки коэффициентов при фиктивных переменных, отражающих количество комнат в квартире. Коэффициенты при R1 и R2 оказались значимыми в противоположность ранее полученному результату.

Большедругих изменилась также оценкаэластичности цены по жилой площади. Новая оценка эластичности равна 0.76 по сравне­ нию с 0.67 ранее.

Пользуясь полученными результатами, мы сможем провести статистически осмысленную проверку гипотезы о равенстве коэф­ фициентов при R2, R3 и R4 и неравенстве коэффициентов при R1

172

Гл. 6. Гетероскедастичность и корреляция по времени

и R2 (см. п. 3.5, пример Рынок квартир в Москве, начало). Как и ранее, применяем F-тест для проверки гипотез:

1. Но: /?ю = 0 ц \ 0 \\ А г ;

F-статистика 1.548415 Р-значение 0.213713.

2.Но: = 010',

Р-статистика 10-41677 Р-значение 0.001340.

Таблица 6.1 Переменная Коэффициент Стандартная t-статистика P-значение

 

 

ошибка

26.69

 

CONST

6.693

0.251

0.0000

LOGLIVSP

0.756

0.0536

14.11

0.0000

LOGPLAN

0 438

0.0468

9.36

0.0000

LOGKITSP

0.129

0.0479

2.69

0.0073

LOGDIST

-0.110

0.0135

-8.08

0.0000

BRICK

0.130

0.0198

6.58

0.0000

FLOOR

-0.0658

0.0170

-3.87

0.0001

LIFT

0.131

0.0187

7.01

0.0000

BAL

0.0350

0.0170

2.05

0.0400

R1

0.365

0.0892

4.08

0.0001

R2

0.249

0.0639

3.90

0.0001

R3

0.257

0.0473

5.43

0.0000

R4

0.205

0.0376

5.44

0.0000

Статистика R2 (невзвешенная): 0.891.

Таким образом, как и ранее, гипотеза о равенстве коэффициен­ тов при R2, R3 и R4 не может быть отвергнута; гипотеза о равен­ стве коэффициентов при R1 и R2 отвергается еще более уверенно — на 0.5%-ном уровне значимости.

2. Дисперсия ошибки принимает только два значения. Пусть

известно, что о* =

для t = l , ...,n i

и о* =

для t =

7ii +1, • • •, rci+П2 (ni + гаг = п), но числа

и ы\ неизвестны. Ины­

ми словами, в первых TII наблюдениях дисперсия ошибки имеет одно значение, в последующих 712 — другое. В этом случае есте­ ственным является следующий вариант доступного обобщенного метода наименьших квадратов:

1)провести обычную регрессию (6.1), получить вектор остат­ ков е и разбить его на два подвектора ei, e-i размерности п\ и Ti2 соответственно;

6.1. Гетероскедастичиость

173

2) построить оценки ш2 = e^ej/ni и cD| = в^ег/пг дисперсий

о7

UJ[ И U f a

3)преобразовать переменные, разделив первые пх уравнений на ых, а последующие n<i — на

4)провести обычную регрессию для преобразованной модели.

Хотя, как было установлено ранее (п. 5.2), оценки и явля­ ются смещенными, можно показать (Goldberger, 1990, глава 30.5) их состоятельность.

Ясно, что эта модель допускает обобщение на случай, когда дисперсия принимает не два, а несколько значений.

3. Состоятельное оценивание дисперсий. Предположим теперь, что в модели (6.1) с гетероскедастичностью для оценки вектора параметра /3 используется обычный метод наименьших квадра­ тов. Как установлено в главе 5, эта оценка является состоятель­ ной и несмещенной, однако^стандартная оценка ее матрицы ко­ вариаций ((3.8), (ЗД9)) V"(/30LS) = д2( Х ' Х ) ~ 1 смещена и несо­ стоятельна. Отметим, что компьютерные пакеты при оценивании коэффициентов регрессии вычисляют стандартные ошибки коэф­ фициентов регрессии именно по этой формуле. Можно ли сделать поправку на гетероскедастичность и «улучшить» оценку матрицы ковариаций? Положительный ответ дают приводимые ниже два способа оценивания.

Стандартные ош ибки в форме Уайта. Предположим, что П, матрица ковариаций вектора ошибокj , диагональна, V(et) = о%, t = 1,..., п. Тогда поскольку 3 OLS = Р = Р + (Х 'Х )~1Х'е, то

V(3) = Е {(Х,Х ) ~ 1Х ,е€’Х { X ' X ) - l) = ( X ' X ) - lX ' S l X { X ' X ) - 1

= n (X 'X )-1 X'Cl x ) ( X ' X ) - 1.

 

Рассмотрим матрицу X 'flX . Имеем (Х 'О Х )у =

xSiffsx*j-

 

is 1

Обозначим через x ', s = 1 ,... ,n, 1 x k векторы-строкн матрицы

174

Гл. 6. Гегероскедастичность и корреляция по времени

регрессоров X . Тогда

п

X ' f l X = ^а % х,х'а.

Уайт (White, 1980) показал, что

уф) = п р г 'х г 1 (1 Х >5*.*'.)

(6-3)

является состоятельной оценкой матрицы ковариаций оценок ко­ эффициентов регрессии.

Стандартные отклонения, рассчитанные по формуле (6.3), называются стандартными ошибками в форме Уайта ( White standard errors) или состоятельными стандартными ошибками при наличии гетероскедастинности (Heteroscedasticity Consistent standard errors, НС s. e.).

Стандартные ошибки в форме Ньюи-Веста. Для более сложного случая, когда в матрице ковариаций ошибок V(e) = П = (oJij) ненулевые элементы стоят не только на главной диа­ гонали, но и на соседних диагоналях, отстоящих от главной не более чем на L (т.е: = 0, |* j \ > L), Ньюи и Вест (Ncwey, West, 1987) показали, что оценка

является состоятельной оценкой матрицы ковариаций оценок ко­ эффициентов регрессии.

Существует несколько способов выбора весовых коэффициен­ тов Wj.

1.Наиболее простым кажется взять Wj = 1. Однако при таком выборе матрица (6.4) может оказаться не неотрицательно определенной.

6.1. Гетероскедастичность

175

2

(Бартлетт).

 

 

 

(Парзен).

В большинстве случаев использование весов Парзена предпо­

чтительнее.

 

 

Стандартные

отклонения, рассчитанные

по формуле (6.4),

называются стандартными ошибками в форме Нъюи-Веста (Newey-West standard errors) или стандартными ошибками с уче­ том гетероскедастичности и автокорреляции (Heteroscedasticity and Autocorrelation Consistent standard errors, НАС s. e.).

Рассмотрим пример регрессии, в котором матрица ковариаций ошибок заведомо недиагональная.

Пример. Премия за риск (см. Peresetsky, de Roon, 1997). Пусть St — спот-курс доллара (руб./долл.) в день t. i^ n) —

цена фьючерсного контракта в день t на поставку доллара через я

дней (в день t + я).

 

Представляет интерес вопрос: является ли

несмещенной

оценкой будущего спот-курса 5t+„? А именно, верно ли равенство:

Е (St+n | It) = Ft(n),

где It — информационное множество, содержащее всю информа­ цию, доступную в момент t, Е (St+n \ It) —условное математиче­ ское ожидание. На самом деле, в присутствии на рынке агентов, избегающих риска, это равенство не обязано выполняться и цена фьючерса отличается от ожидаемого спот-курса на величину пре­ мии sa риск

Е (S,+n| Л) = Ft(n)( l+ *<">).

Удобно перейти к модели, в которой используются логарифмы пе­ ременных:

Е (3t+„ | Л) = Л(П)+ *<">,

здесь /<п) = In Ft(n); *<n) = ln5t(n) и я<п>= ln(l + *<">) - переопре­ деление премии за риск (тг[п) « $г|п) при малых Srjn)).

176

Гл. 6. Гетероскедастичность и корреляция по времени

Для тестирования гипотезы о несмещенности оценки рассмот­ рим следующую регрессию:

St+n - л(п) = (А + A n ) + (А + &п)Л(п)

+ (A + A»)(/*(n,-**) + 4& .

(*)

Бели в результате оценивания этого уравнения мы получим, чю хотя бы один коэффициент А статистически достоверно отли­ чается от 0, это будет означать наличие отличной от нуля премии за риск. (Отметим, что все регрессоры в уравнении (*) принадле­ жат информационному множеству /*.) Более того, (*) предлагает определенную временную структуру премии за риск:

»,(и) - (А + An) + (А + An)/t(n) + 034 + A«)(/t(n> - st).

(**)

Рассматривается период с ноября 1992 г. по октябрь 1995 г. Данные о спот-курсе взяты с ММВБ (Московская межбанковская валютная биржа), а данные о котировках фьючерсных контрак­ тов — с МТБ (Московская товарная биржа), на которой в этот период были самые значительные (по сравнению с другими бир­ жами) объемы торговли валютными фьючерсами.

Упорядочим наблюдения по возрастанию п, а для одинако­ вых п - по возрастанию t. Отметим, что для уравнения (*) усло­ вия юмоскедастичности, безусловно, нарушены по двум причинам: 1) ошибки е[^„, е^т коррелированы (цены контрактов с разными

сроками поставок в один и тот же день) и 2) е|"7+п» et+n также коррелированы (цены контракта со сроком поставки i + пв после­ довательные дни).

Однако для наблюдений, отстоящих достаточно далеко друг от друга в нашем упорядочении, ошибки можно считать независи­ мыми. Таким образом, для оценивания уравнения (*) нельзя ис­ пользовать МНК-оценки стандартных отклонений коэффициентов и поэтому мы используем стандартные ошибки в форме НьюиВеста

В статье (Яковлев, Бессонов, 19956) рассматриваемый период развития фьючерсного рынка разбивается на три подпериода по институциональным признакам (состав участников рынка, объем торговли и т. п.). Следуя этой разбивке, мы оценивали уравнение

(*) отдельно для каждого из подпериодов.

6.1. Гетероскедастичность

177

В таблице 6.2 приведены результаты оценивания. В квадрат­ ных скобках указаны стандартные ошибки в форме Ньюи-Веста с лагом 150.

 

 

 

n

 

 

Таблица 6.2

Период

const

Uin)~st)

iftn) ~ st)n

ftn)

/.|n>n

11.92 -

1.54*

0.016*

-0.99"

0.0056

-0.22*

-0.0023*

10.93

 

[0.641

[0.00761

[0.35]

[0.00311

[0.0911

10.00111

10.93 -

-1.08

0.041"

-1.33"

0.0080**

0.15

-0.0056"

03.94

 

|0.94]

10.0035]

10.251

[0.000541

[0.13}

[0.000471

03.94

-

-0.53

0.035"

-0.69

0.0015

0.060

-0.0041**

10.95

 

M L

[0.00161

[0.38]

[0.000881

[0.052|

[0.00023]

*Отличается от нуля па 5%-ном уровне значимости.

**Отличается от нуля на 1%-ном уровне значимости.

Из таблицы 6.2 мы видим, что:

1) во всех трех периодах премия за риск моделируемая урав­ нением (**), статистически достоверно отличается от нуля;

2)премия за риск статистически достоверно различается от пе­ риода к периоду.

Таким образом, подтверждается разбиение истории разви­ тия рынка валютных фьючерсов на три периода, полученное А. Яковлевым и В. Бессоновым на основе анализа институциональ­ ных признаков.

Тесты на гетероскедастичность

Опишем несколько общеупотребительных статистических тестов на гетероскедастичность, не проводя их детального исследова­ ния. Как правило, из определения тестов будет ясно, какова их значимость. Проблему мощности тестов мы рассматривать не будем. Во всех этих тестах проверяется основная гипотеза Но: а\ = а\ = ‘' ‘ = ап против альтернативной гипотезы Hi: не Но-

Большинство тестов ориентированы на те или иные ситуации, когда относительно характера гетероскедастичности есть апри­ орные структурные ограничения. Исключение составляет тест Уайта.

Тест Уайта ( White). Содержательный смысл этого теста со­ стоит в следующем. Если в модели присутствует гетероскедастич­ ность, то очень часто это связано с тем, что дисперсии ошибок

178

Гл. 6. Гетсроскедастичность и корреляция по времени

некоторым образом (возможно, довольно сложно) зависят от ре­ грессоров, а гетероскедастичность должна как-то отражаться в остатках обычной регрессии исходной модели. Реализуя эти идеи, Уайт (White, 1980) предложил метод тестирования гипотезы Но без каких-либо предположений относительно структуры гетероскедастичности. Сначала к исходной модели (6.1) применяется обычный метод наименьших квадратов и находятся остатки ре­ грессии et, t = 1, ...,га. Затем осуществляется регрессия квадратов этих остатков е? на все регрессоры X , их квадраты, попарные произведения и константу, если ее не было в составе исходных ре­ грессоров. Тогда при гипотезе Но величина гаД2 асимптотически имеет распределение x 2{N 1), где R2 — коэффициент детерми­ нации, а N —число регрессоров второй регрессии.

Привлекательной чертой теста Уайта является его универсаль­ ность. Однако если гипотеза Но отвергается, этот тест не дает ука­ зания на функциональную форму гетероскедастичности, и един­ ственным способом коррекции на гетероскедастичность является применение стандартных ошибок в форме Уайта.

Г е ст Голдфелда-Куандта (Goldfeld-Quandt). Этот тест применяется, как правило, когда есть предположение о прямой за­ висимости дисперсии ошибки от величины некоторой независимой переменной (ср. коррекция на гетероскедастичность, стр. 169,

п.1). Кратко тест можно описать следующим образом:

1)упорядочить данные по убыванию той независимой перемен­ ной, относительно которой есть подозрение на гетероскедастичность;

2)исключить d средних (в этом упорядочении) наблюдений (d должно быть примерно равно четверти общего количе­ ства наблюдений);

3)провести две независимые регрессии первых п / 2 —d/2 наг блюдений и последних n/2 —d/2 наблюдений и построить соответствующие остатки е\ и е%\

4)составить статистику F = e^ei/e^e^. Если верна гипотеза Но, то F имеет распределение Фишера с (га/2 —d/2 - к, га/2 -

6.1. Гетероскедастичность

179

df2 к) степенями свободы (числитель и знаменатель в вы­ ражении для F следует разделить на соответствующее число степеней свободы, но в данном случае они одинаковы).

Большая величина этой статистики означает, что гипотезу Но следует отвергнуть. Количество исключаемых наблюдений не должно быть ни слишком мало, ни слишком велико. Формально тест работает и без исключения наблюдений, но, как показывает опыт, при этом его мощность уменьшается.

Аналогично этот тест используется, если есть предположение о межгрупповой гетероскедастичности, когда дисперсия ошибки принимает, например, только два возможных значения.

Тест Бреуш а-П агана (Breusch-Pagan). Этот тест приме­ няется в тех случаях, когда априорно предполагается, что диспер­ сии af зависят от некоторых дополнительных переменных:

0t = 7o + *'t7> * = l , ... ,n ,

где z t = .. ,ztpy — вектор (наблюдаемых) независимых пе­ ременных, 7о» 7 = (7 ь • • ■>7рУ ~ неизвестные параметры. В соот­ ветствии с тестом Бреуша-Пагана следует действовать так:

1) провести обычную регрессию (6.1) и получить вектор остат­

 

ков е = (е ь ... .еп)';

 

2)

построить оценку <?2 = (1/n) et ;

3)

провести регрессию

е2

= 7о + z 't7 + ut n найти для нее объ-

ясненную часть вариации RSS;

4)построить статистику RSS/2. В работе (Breusch, Pagan, 1979) установлено, что если верна гипотеза Но (отсутствие гетероскедастичности), то величина RSS/2 асимптотически имеет распределение х 2(р)-

При выявлении гетероскедастичности с помощью этого теста можно попытаться осуществить коррекцию с помощью метода взвешенных наименьших квадратов, выбирая в качестве весов ве­ личины (тЬ + z\ 7 )-1/2, где %, 7 — оценки, полученные в п. 3).

180

Гл. 6. Гетероскедастичность и корреляция по времени

При этом может оказаться, что 7о 4 - z't 7 < 0 для некоторых t. Если число таких наблюдений невелико, то их можно просто вы­ бросить. В противном случае можно попытаться использовать мультипликативную форму гетероскедастичности:

=t = 1, ... , п.

Процедура теста Бреуша-Пагана тогда выглядит совершенно ана­ логично изложенной выше в п.З). Точно так же можно дей­ ствовать для произвольной формы гетероскедастичности а\ = /(70 + 2^7 ).

Выводы:

1) применение обобщенного метода наименьших квадратов при наличии гетероскедастичности сводится к минимизации суммы взвешенных квадратов отклонений;

2) использование доступного обобщенного метода наименьших квадратов в общем случае требует оценивания п параметров по п наблюдениям, что не позволяет получать состоятель­ ные оценки;

3)в некоторых ситуациях (ошибка пропорциональна одной из независимых переменных, дисперсии ошибок принимают два значения) можно применять доступный обобщенный ме­ тод наименьших квадратов и получать состоятельные оцен­ ки коэффициентов регрессии;

4)если в модели с гетероскедастичностью использовать обыч­ ный метод наименьших квадратов, то для получения состоя­ тельной оценки соответствующей матрицы ковариаций мож­ но применять оценки ошибок в форме Уайта (6.3) или НьюиВеста (6.4).

Пример. Рынок квартир в Москве (см. Каргин, Онацкий, 1996). Продолжение 3 (см. начало — п.3.5, продолжение 1 — п. 4.2, продолжение 2 —п. 6.1).

Дли тестирования ошибок модели (*) примера о ценах на квартиры в Москве на гетероскедастичность применяем тест Голдфелда-Куандта (см. выше) по переменной LOGLIVSP. Дан­ ные (464 наблюдения) делятся на три группы, примерно равные по