Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Статистический анализ временных рядов

..pdf
Скачиваний:
2
Добавлен:
19.11.2023
Размер:
47.02 Mб
Скачать

3,4.

 

 

 

 

МЕТОД ПЕРЕМЕННЫХ РАЗНОСТЕЙ

83

(40)

g (

2

йцЩЩ) =

2

 

 

ацаы%щщикщ

 

 

 

W=i

 

/

t,f,k,i=i

 

 

 

 

 

 

 

 

 

 

 

 

 

х4 ^] 4 + ^ ( 2

а«

+20* 2

 

 

 

 

 

 

1=1

 

 

 

\/=1

/

 

/,/=1

Л емма

3.4.4.

В

условиях

 

леммы

3.4.3

дисперсия величины

п

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 ацЩЩ

выражается

соотношением

 

 

 

 

 

i,j=\

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(41)

 

Var ( 2J

fli/И/И/) =

х4 2J

4

+

2о4

2

4 *

 

 

 

 

W = 1

/

 

 

/=1

 

 

 

i,j—\

 

 

 

 

 

 

 

=

х4 2

4

+

2о4 tr А2.

 

 

 

 

 

 

 

 

 

i=i

 

 

 

 

 

 

Если щ нормально распределены, то х4 = 0 и первый член в

правой части (41) равен 0.

 

 

 

 

 

 

 

 

 

Положим

 

 

 

 

 

 

 

 

 

 

 

 

 

(42)

 

 

 

S ,= 2 r ( A V =

2J

4 г)а д ,

 

 

 

 

 

 

t= 1

 

 

f,s=l

 

 

 

 

и пусть А, =

(4*). Тогда А„ =

I,

 

 

 

 

 

 

 

 

 

 

 

1

 

— 1

0

. . .

 

О~

 

 

 

 

 

 

 

— 1

 

 

2 — 1

. . .

О

 

 

(43)4

 

 

 

А4 =

0

 

— 1

2

. . .

 

О

 

 

 

 

 

 

 

 

0

 

 

0

0

. ..

1

0

 

 

 

 

 

~

1 — 2

1

 

0

•••

 

 

 

 

 

— 2

5

— 4

 

1 . ..

0

 

(44)

 

 

А2 —

 

1 — 4

6

-

4

. . . 0

»

 

 

 

0

 

1

— 4

 

6 . . .

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

0

0

 

0

•••

1

 

 

 

 

-

1 ■- 3

 

3 — 1

0 • 0

 

 

 

— 3

10 — 12

6 -- 1 • 0

 

 

 

 

3 ■- 1 2

 

19 — 15

6 • 0

(45)

А3 =

— 1

6

— 15

20 --1 5

 

0

 

 

 

 

0

•- 1

 

 

6

— 15

20

••

 

0

 

 

 

 

0

0

 

 

0

 

0

0

 

••. .

1

84

 

 

ТРЕНДЫ И СГЛАЖИВАНИЕ

 

Гл. 3.

 

 

1 4

6 — 4

1

 

0 • •• 0 "

 

 

— 4

17 — 28

22

— 8

 

1

... 0

 

 

6

— 28

53

— 52

28

--

8

... о

(46)

А4

4

22

52

69

56

 

28

... 0

1 — 8

28 — 56

70

-- 5 6

• • 0

 

 

 

 

0

1 — 8

28

56

 

70 ... о

 

 

 

 

 

 

 

 

 

6

II

$

0

Ь

о

0

0 ... 1_

При Дг / (t)

=

0 вычисления дают:

 

 

: ф { х 4 + 2а4},

 

 

 

(48)

Var Vx =

1

II 1

1

1

Г 3

1

2 (Т— 1) j«4 + 2 2

2 (Г - Г

 

 

Г - 1 (|

 

 

1

/ 1

5

1х4 + 2

35

2

 

 

Г — 2

I

9(7-2) J

18

2(7- 2 ) ] 04}*

,50)

 

 

 

69

 

 

 

VarVJ = Y ± 3 - j [ l - 100(r_ ?) Щ+

 

 

 

 

+ 2 [ТИ —

f i f W

] » * } -

 

 

(51)

Vai-V. -

т _ 4

 

246(Г— 4) ]*а ^

 

 

 

 

7

 

 

 

 

 

 

 

+ 2

1287

4

 

 

 

 

 

490

2 (Т — 4)] ° 4} •

 

 

 

 

 

 

 

Здесь х4 — четвертый семиинвариант.

Общее выражение для дисперсий величин F, найти трудно из-за того, что элементы в обоих концах каждой диагонали А, отличают­ ся от элементов, расположенных ближе к середине. Запишем Sr в виде

(52)

<=1

 

 

Ъ 1 г - 1)а+*(г ) ( Гс\у<+«У<+э =

 

 

 

<=1 <х,Э=0

 

\ а1 VР/

 

-

Т

-

.

min(s,M,7’—г)

/

г \ t

Г \

 

s (

1),+“

S

(

,

,

УА-

 

s ,u = l

 

*= m ax(s—г,и—г,1)

 

 

* /

 

Элемент

равен коэффициенту при yl в (52), так что

 

(53)

д

С

Н

2: ) '

 

 

 

 

=

/#• \ 2

 

 

 

 

 

 

S—1

a(/Ls+it7_ s+i,

 

s = 1,

. . . ,

г.

 

V

[

] =

 

a=oW

3 .4 . МЕТОД ПЕРЕМЕННЫХ РАЗНОСТЕЙ 85

Первая сумма здесь вычислена с использованием тождества

 

(54)

| ( -

1)'-* Q

*

' -

( -

1)' ( x

- l f

=

 

 

 

 

 

= (X- i Y ( i ~ x ) r =

2

( - i ) “W r V rftV ~ a+fi

 

 

 

 

 

 

 

 

a,p- о

 

 

\ a / \ p /

 

и равна коэффициенту при /

в последнем выражении. Остальные

отличные от нуля элементы суть

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2г

 

 

 

ЛГ)

^

к

х

+

^

ь

-

ч

. + k

 

(55)

 

 

 

 

 

s = r - k +

1,

т

 

 

C L S ,S -{-k

 

 

 

 

 

 

 

 

 

 

 

 

 

(— l)ft

2

(

Г

\

 

(г)

 

 

 

 

 

II .

.) — ar-s-ft+i.r-s+i,

 

 

 

 

 

 

a= o'aj \a + k)

 

 

 

 

 

 

 

 

 

 

 

 

S =

 

1,

. . . , r k,

 

для k

=

1,

r.

 

 

 

 

 

 

 

 

 

Теперь можно подсчитать и указанные дисперсии, однако вычис­

ления утомительны. Для четных г,г — 2п,

 

 

 

 

(56)

2

l ^ ’i2 = s

 

+

l a

T - s + i , r - s - f i ] 2}

+

 

 

 

S=1

 

S=1

 

 

 

 

 

 

 

 

 

 

 

 

2n

 

 

Jr)

 

 

l ] 2 } + (T — 2r)

2r

 

 

 

+ 2

{ l a ss*l2 +

 

 

 

 

 

l a r - s + l , r - s +

 

 

 

 

s= n -}-l

 

 

 

 

 

 

 

 

 

 

 

 

 

2r

 

 

 

 

 

 

 

 

 

= (T — r) ^ rj + 4 2

 

 

Х

 

 

 

 

 

 

 

 

 

И

 

 

 

поскольку crij+i.r-s+i = a£? и

 

 

 

 

 

 

(57)

 

a^+i-s,r+i-s = Q

-

<£'\

s = l ,

. . . . r.

 

Подобным же образом, если г

 

2п +

1, то

 

 

 

 

(58)

2

Ia“ l2 = (Т ~

2г) П

 

+ 2 £

(«Ч 2 +

2 [a ^ ,.n++ +

S=*l

\

2П+ 1

Г /

S=1

t r \

 

+ 2

2 [ ^ ] 2 =

 

 

s = n -\-2

 

{ T ~

r ) ( 2rr ) 2 + i S 0- ’

r a i - + ( *

 

 

86

 

 

ТРЕНДЫ И СГЛАЖИВАНИЕ

 

Гл. 3.

ввиду

того

что

 

 

 

 

 

 

 

 

 

(59)

 

 

4 „ +l=

i Q

,

 

г =

2п +

1.

 

 

 

 

 

 

 

 

 

 

/2гУ2

В обоих случаях главный член равен — г) I

1

Для ft =

1,

г можно найти, что

 

 

 

 

(60)

"

 

(T ~ 2 r + k)(

У +

2 21«й+*1:^-'2

 

 

 

 

 

V +

ft/

 

S=1

 

 

 

/ 2 Г \2

 

<r—fe)/

 

г

 

 

 

,т-Ч+*)+42аЧ

 

если г — ft четное,

 

 

 

 

 

 

 

 

 

 

 

г + k)

 

<г- г)(г+ *)+4 2

 

^+*[^+*-(г + ^

 

 

 

 

 

___1_/ 2г

\ 2

 

 

 

 

 

 

 

2

V + ftJ

 

 

 

 

 

 

 

 

 

 

т

если г — ft нечетное,

 

 

 

 

 

 

 

 

 

 

запишется в виде

(см. упр. 55), так что главный член

в

2

[я^!2

 

 

 

/2г\2

' /

\ 21

S ,t= l

 

.

S. / 2г ' 2

(61)

( Г - г )

(Г -

 

 

 

+ 1 2

J

r + k

-

г), 2 v + s

 

 

 

*!=1

 

 

 

 

 

 

 

 

 

 

 

 

= {Т — г)

 

При г = 2п

второе слагаемое равно

 

 

 

 

 

(62)

I,°”1“•-(!)]+8i> И-Чti)]~C

+ 1

- м | < Ц а а + ! - ( г * 2) ] + -

... + 8aB_, [с',:’- 1— ( 2г^ 1 2) ] —

Кендалл и Стьюарт [(1966, стр. 389)1 приводят его к виду

(2г\2

------- Ч

).

Таким образом, при Arf (t) — 0

(63) Var S r =

^(Г — r)

a r

"b 2 ( 7 - r ) fir - p r]«

2 r

3 .4 .

МЕТОД ПЕРЕМЕННЫХ РАЗНОСТЕЙ

87

(64) Var Vr =

l

9

~ Т — г

где х4 — четвертый семиинвариант, а а, определяется из (56) или (58). [Кендалл и Стьюарт (1966, стр. 389) приводят выражение и для

аг.\

Если Т велико, то дисперсия V, приблизительно равна

При нормально распределенных щ семиинвариант х4 равен 0. Поскольку дисперсия при Т -*■ оо стремится к нулю, то яв­

ляется состоятельной оценкой для а2. Можно показать, что, когда х4 существует, a ut независимы и одинаково распределены, величина

(66)

У Т — т

- а2

 

имеет в пределе стандартное нормальное распределение со средним

0 и дисперсией 1. (См. разд. 3.4.5.) Если

х4 =

0, то дисперсия

V Т г V, асимптотически эквивалентна 2а4

и послед­

няя

величина служит

мерой эффективности

Vr как оценки для а2.

Как

и следовало ожидать, дисперсия Vr с ростом г возрастает.

Лемма

3.4.5. Ковариация двух

(симметричных) квадратичных

 

п

 

п

 

 

 

форм 2 ацЩЩ = u'Аи и 2 bkiukut ~ и'Ви

в условиях леммы

 

*,/=»1

 

k,l=1

 

 

 

3.4.3

выражается соотношением

 

 

 

(67)

Cov (

ацщиь

J] Ьыикщ

 

 

 

 

\ i,!=i

к,ш

 

 

 

 

 

= х4 2

аиЬи + 2°4 2

а«-А/ =

*4 2

аиьи + 2о* tr АВ.

//_ ,+ 1

88

ТРЕНДЫ И СГЛАЖИВАНИЕ

Гл. 3.

Можно показать, что ковариация V, и V приближенно равна

Точная формула для ковариации отличается от (68) слагаемыми, возникающими из-за того, что коэффициенты членов, близких к концам ряда, отличаются от коэффициентов членов, близких к его середине. Кендалл и Стьюарт (1966, стр. 389) приводят точное вы­ ражение для этой ковариации в случае q = г + 1.

Кенуй (1953) указал, что линейная комбинация срУр+ ...+ cqVq, где

с„ + ... + с„ = 1, также является несмещенной оценкой для а2 (если

т

Д7 (0 = 0). Если р — 0, то К0 = 2 у\ IT — наилучшая несме- f«=i

щенная оценка для о2, поскольку в этом случае f (f) == 0. В предпо­ ложении нормальности она является достаточной статистикой для о2. (Если р = 1 и, следовательно, f (/) = const, то в предположении

нормальности достаточное множество статистик образуют статисти-

т

ки у и 2 (У<У)2-) Для р > 1 Кенуй поставил вопрос о том, <=1

какая линейная комбинация имеет минимальную дисперсию для и4 = 0 и различных значений р и q. Если р = 1, a q = 4, то «наи­ лучшими» коэффициентами будут сг — 7.5, с2 = —20.25, с8 = 22.50, с4 = —8.75. Соответствующая дисперсия равна 3/4 дисперсии W Оказывается, что знаки коэффициентов этих линейных комбинаций чередуются. Таким образом, нет уверенности в том, что оценка по­ лучится положительной. Поскольку эти коэффициенты существен­ но больше единицы, то можно ожидать, что вероятность получения отрицательного значения оценки вовсе не мала.

Постановка этой задачи приводит к вопросу о причинах ограни­ чений на числа V, и, что более важно, о причинах, по которьм ста­ тистик ограничивается только суммой квадратов переменных раз­ ностей. Что следует считать наилучшей оценкой а2, когда тренд «гладкий»? Трудность состоит здесь в необходимости такого доста­ точно строгого определения «гладкости», при котором задача наи­ лучшего оценивания была бы математически определена. Если глад­ ким считать тренд, являющийся полиномом степени q, то наилуч­ шей оценкой а2 будет оценка, приведенная в § 3.2. Любые другие определения гладкости являются либо недостаточно четкими, либо слишком сложными.

Кендалл (1946а, задача 30.8) предложил модифицировать ме­ тод переменных разностей путем введения фиктивных переменных = У—г+2 = ... = Уо = 0 и ит+ 1 =? ... = ут+г = 0 и под­

3.4.

МЕТОД ПЕРЕМЕННЫХ РАЗНОСТЕЙ

89

счета сумм квадратов hfyt для значений t от —г + 1 до Т. В таком случае существуют простые соотношения, связывающие эти суммы

T - j

квадратов с суммами попарных произведений 2 %#+/• Кенуй

(1953) предложил другую модификацию, связанную с изменением крайних членов. Так, например, у него m-я модифицированная сум­ ма равна среднему двух — 1)-х модифицированных сумм

(69)

т

г г — 1

 

т

 

 

(m)

= 4 - У

wt +

У

wt

,

 

2

1

^d(m—1)

*

 

t = 1

y = \

 

t— 2

 

 

где

TT

(70)2<o>“v = 2 wt- t=i t=i

Далее, можно использовать модифицированные суммы .(Дryt)2 и ytt/t+i и связать их. Иная модификация, приводящая к некоторым упрощениям, состоит в использовании А] вместо Аг. (См. гл. 6.)

3.4.5. Определение степени гладкости тренда

Можно интересоваться также вопросом о том, обладает ли тренд определенной степенью гладкости. От этого, например, зависит выбор сглаживающей формулы. Таким образом, может возникнуть необходимость выяснить, является ли тренд гладким в том смысле, что он в каждом интервале времени может быть адекватно представ­ лен полиномом вполне определенной степени q. Это соответствует задаче проверки гипотезы о том, что данная степень является прием­ лемой для описания тренда, против альтернативы, состоящей в том, что данная степень недостаточна для его описания. Кроме того, мож­ но рассмотреть задачу со многими решениями об определении прием­ лемой степени (в пределах между двумя заданными значениями m и q) полинома, аппроксимирующего тренд.

Если под точным соответствием понимать совпадение выравни­ вающей функции с единственным адекватным представлением трен­ да, то перечисленные задачи полностью равносильны изученным в § 3.2 для полиномиального тренда. Если допустить более широкое, но нечеткое толкование адекватности представления, то задачи те­ ряют математическую определенность. Вполне возможно особое внимание уделить максимально допускаемому расхождению между действительным трендом и его полиномиальной аппроксимацией. Однако получаемые при этом математические задачи трудны для решения. Следует отметить, что общая теория задач со многими ре­ шениями, являющаяся обобщением теории § 3.2, здесь неприменима.

90 ТРЕНДЫ И СГЛАЖИВАНИЕ Гл. 3.

Рассмотрим указанные задачи, ограничиваясь

использова­

нием

сумм квадратов переменных разностей. Из

(37)

видно,

что

математическое ожидание величины V, зависит

от

суммы

Т—т

 

 

 

2 [А? (/)12Эта сумма равна нулю, если полином имеет степень, (=i

меньшую г, и близка к нулю, если функция / (0 близка к полиному степени, меньшей г, для каждого набора + 1) последовательных значений t. Отсюда следует, что V, можно использовать в упомяну­

тых статистических задачах. Принимать решение о том, что Д7 (/) близка к нулю для всех значений t (т. е. что полиномы (г — 1)-й степени дают адекватное представление), против альтернативы бли­

зости к нулю только разности Дг+1/ (/) для всех t, можно, например, убедившись в том, что ненамного больше Vr+i-

Сглаживающие формулы, рассмотренные в § 3.3 и 3.4, были основаны на предположении о том, что полином степени 2k или 2k + 1 дает адекватное представление тренда в интервале 2m + 1 последовательных моментов времени. В частности, мы отмечали, что для т — k + 1 смещение при оценивании тренда равно C'A2k+2f (i). Таким образом, вопросы, которые мы сейчас изучаем, соответствуют задачам о выборе подходящих сглаживающих фор­ мул.

Рассмотрим проверку гипотезы Arf (t) = 0 в предположении, что

А (/) = 0 (q > г). Мы отвергнем эту гипотезу, если V, будет на­ много больше Vq. Такая процедура может быть основана на стати­ стике

(71) l / T ^ - ^ 2 . = K ^ = ? ( ^ - - l ) .

Из (68) видно, что дисперсия числителя У Т q (Vr Vq) приб­ лизительно равна

Если указанная гипотеза верна, то математическое ожидание чис­ лителя (71) равно нулю; в противном случае оно положительно.

3.4.

МЕТОД ПЕРЕМЕННЫХ РАЗНОСТЕЙ

91

Разность V, — Vq можно записать в виде

Каждое из последних двух слагаемых, умноженное на У Т q, сходится по вероятности к нулю. (Отметим, что множитель, стоя­ щий первым во втором слагаемом, имеет порядок 1IT2.) Первое слагаемое является средним для Т — q величин. Если щ независи­ мы и одинаково распределены, то рассматриваемые величины рас­ пределены также одинаково, но уже не являются независимыми. Тем не менее их последовательность образует стационарный слу­ чайный процесс (см. гл. 7), прйчем члены, отстоящие друг от друга более чем на q, являются независимыми. Это так называемый ста­ ционарный случайный процесс с конечной зависимостью. Теорема

7.7.5 утверждает, что V Т q {V, Vq) имеет в пределе нормаль­ ное распределение. Поскольку Vq является состоятельной оценкой для а2 (вне зависимости от того, является ли нулевая гипотеза истинной или ложной), то и (71) имеет в пределе нормальное рас­ пределение, дисперсия которого получается из (72) опусканием <т4.

Теорема 3.4.1. Если Д7 (/) = 0, t — 1, .... Т г, а иъ иг, ..., Uj

независимы и одинаково распределены с %щ — 0

и 8и* < оо, то

статистика

2q+ 2r\ -1—1

 

(74)

О 4 + r I

 

 

 

( X

)

имеет в пределе нормальное распределение с нулевым средним и еди­ ничной дисперсией.

Поэтому в случае больших выборок мы отвергаем нулевую ги­ потезу с уровнем значимости е, если вычисленное по выборке зна­ чение (74) превышает t (2е), где

(75)

(

— Х - е - “,/2 du=B.

 

J

УаГ

/<2е)

В теории больших выборок мы не использовали точную диспер­ сию, поскольку разность между ней и (72) стремится к нулю при

92

ТРЕНДЫ И СГЛАЖИВАНИЕ

Гл. 3.

Т оо, а центральная предельная теорема, на основании которой строится указанная процедура, не чувствительна к подобным раз­ ностям. Возможно, что учет дополнительных слагаемых может привести к тому, что асимптотическое распределение будет лучше приближать точное распределение для данного Т. Однако это не­ известно. Тинтнер (1940) брал более точные значения моментов (включая состоятельную оценку семиинварианта х4) и привел таб­ лицы, облегчающие вычисление Vr и использование предельного распределения.

Если щ распределены нормально, то в случае истинности нуле­ вой гипотезы статистика (74) имеет распределение, не зависящее от мешающих параметров. Распределения квадратичных форм от нормально распределенных переменных и отношений таких квадра­ тичных форм будут детально изучены в гл. 6 в связи с рассмотре­ нием сериальной корреляции. Там будет показано, что распределе­ ние величины (Vq)!Vq, или, эквивалентно, VJVq, является весьма сложным и не может быть приведено к простой канонической форме. С целью упрощения отыскания этого распределения был пред­ ложен ряд модификаций. Тинтнер (1940, гл. 8) предложил заменить

Vr и Vqсоответственно суммами слагаемых (Агу()2и (A<’yt)2, отбирае­ мых таким образом, чтобы у( не появлялось дважды. При этом и числитель, и знаменатель являются суммами квадратов независи­ мых нормально распределенных величин и их нормированное отно­ шение имеет F-распределение. Этот метод, однако, крайне неэф­ фективен, поскольку число членов в каждой сумме составляет лишь 1/ (q + г) от максимально возможного. Другая модификация, пред­ ложенная Тинтнером (1955), состоит в использовании циклического определения (см. гл. 6). Это упрощает задачу отыскания распределе­ ния, но может привести к значительному смещению, поскольку тренд в начале ряда часто бывает совершенно отличным от тренда в его конце. (Фактически смещение может возрастать с ростом Т.) Камат (1955) и Гейссер (1956) предложили опускать одно или два средних слагаемых в выражении для Vr (или F?) с целью упрощения распределения последних. Другая возможность состоит в замене

Аг на Аь Мы обсудим эти задачи в дальнейшем в гл. 6 (где обозна­ чение Aj используется для других матриц).

Рассмотрим задачу со многими решениями о выборе одной из следующих гипотез:

Н ч:

А?/( 0 ^ 0 ,

 

Я*_,:

Д 7 (0 = 0 .

A"”1/ (0 ^ 0 ,

(76)

Am+2f(t) —0,

Am+1f (t) Ф 0,

Яот+1:

# т :

Дт+|/ (t) = 0.