Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Прикладной статистический анализ в горном деле (Многомерная математическая статистика)

..pdf
Скачиваний:
9
Добавлен:
12.11.2023
Размер:
11.62 Mб
Скачать

 

 

 

 

n

 

yt 2 y4

 

r2

 

 

yt y3

 

 

t 3

 

 

 

 

, где

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

y3 2

n

 

 

 

 

 

 

yt

yt 2 y4 2

 

 

 

t 3

 

 

t 3

 

 

 

 

 

 

 

 

1

n

 

1

n

 

 

y3

 

 

yt

; y4

yt 2 .

(6.5)

 

n

2

n 2

 

 

 

t 3

 

t 3

 

Если размер одного периода (или длина одного интервала) одинаков, то удобно его представлять в виде произведения единичного интервала на коэффициенты 1, 2, 3 ... . Этот коэффициент называют лагом. Например, длина единичного интервала профильной линии 50 м. Тогда четвёртый репер от первого будет находиться на расстоянии 50·(4 – 1) = 150 м. Или, говорят, на третьем лаге (4 – 1 = 3). Второй репер находится на первом лаге, третий – на втором лаге. С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается. Считается целесообразным для обеспечения статистической достоверности коэффициентов автокорреляции использовать правило – максимальный лаг должен быть не больше n / 4, где n – число наблюдений.

Коэффициент автокорреляции характеризует тесноту только линейной связи текущего и анализируемого уровней ряда. Следовательно, по коэффициенту автокорреляции можно судить о наличии только линейной (или близкой к линейной) тенденции. Последовательность коэффициентов автокорреляции уровней первого, второго и т.д. порядков называют автокорре-

ляционной функцией временного ряда.

Вместе с тем следует помнить, что автокорреляции последовательных лагов формально зависимы между собой. На рис. 6.5, а выберем вторую реализацию (сверху). Она представляет собой наклонную линию с небольшими изломами. Для выделенной реализации значение в первом сечении ряда тесно связано со значением второго сечения, второе с третьим, следовательно, и первое значение будет зависеть от третьего и т.д. Такая взаимосвязь приводит к тому, что периодическая зависимость может

171

существенно измениться после удаления автокорреляций первого порядка, т.е. после взятия разности между каждым последующим значением с каждым предыдущим (говорят, с лагом 1). Взятие разности также позволит удалить и тренд, линейный характер которого в приведенном примере прослеживается, он подавляет другие автокорреляции. Коррелограмму (АКФ), в которой устраняется зависимость между промежуточными наблюдениями (наблюдениями внутри лага) именуют частной АКФ (ЧАКФ). Другими словами, частная автокорреляция на данном лаге аналогична обычной автокорреляции, за исключением того, что при вычислении из нее удаляется влияние автокорреляций с меньшими лагами. Таким образом, частная автокорреляция дает более чистую картину периодических зависимостей.

Примеры графиков автокорреляционной функции и частной АКФ приведены на рис. 6.5.

а

б

Рис. 6.5. Автокорреляционная (а) и частная (б) АКФ, где – доверительный интервал

Анализ автокорреляционной функции позволяет выявить структуру ряда. При анализе структуры ряда можно придерживаться следующих рекомендаций:

– если наиболее высоким оказался коэффициент автокорреляции первого порядка, а остальные малозначимы – исследуемый ряд, скорее всего, содержит только тенденцию. Такие ряды ещё

172

именуют динамическими, в отличие от более общего понятия «временные ряды», включающего как динамические, так и статические последовательности уровней какого-либо показателя;

– если наиболее высоким оказался коэффициент автокорреляции порядка k, ряд содержит циклические колебания с периодичностью в k моментов времени.

Если ни один из коэффициентов автокорреляции не является значимым, можно сделать одно из предположений относительно структуры ряда – ряд не содержит тенденции и циклических колебаний, а включает только случайную компоненту или ряд содержит сильную нелинейную тенденцию. В анализе СФ и АКФ чаще всего используется методология Бокса – Дженкинса [10; 19].

6.1.6. Сведения о спектральной теории случайных процессов

В некоторых примерах графики случайных функций могут представлять периодические колебания относительно прямой линии. В процессе исследования периодических функций в математическом анализе часто используют разложение в тригонометрические ряды – ряды Фурье. Сезонная компонента временного ряда также может быть разложена в ряд Фурье. Теоретически стационарный временной ряд с характерными периодическими колебаниями может быть представлен в виде суммы среднего значения и ряда синусоид и косинусоид. Такой график и именуется рядом Фурье.

Рис. 6.6. Периодический стационарный ряд:

P – период; А – амплитуда; F – значение функции

173

Уровни ряда на рис. 6.6 варьируют вокруг среднего значения у, а их колебания (волны) повторяются. Интервал времени, необходимый, чтобы динамический ряд начал повторяться, называется периодом и обозначен на графике как Р. Его величина (расстояние между пиками или впадинами) составляет на графике 12 месяцев (18 – 6). Если ряд имеет период P, то он, как правило, имеет также период 2Р, 3Р и т.д. Величина, обратная периоду, называется частотой динамического ряда и обозначается греческой буквой «ню» ν = 1 / Р. Частота указывает на число повторений цикла в единицу времени, например ν = 1 / 12 (по графику).

Разложение функций, выполненное с помощью представления их в виде рядов, или интегралов, Фурье именуется гармоническим анализом, исследование амплитуд и фаз получившихся гармоник – спектральным анализом. Количественное определение состава объекта, набор частот его разложения по гармоникам именуют спектром функции. Для более общих функций используется интеграл Фурье. Спектр представлен непрерывной периодической функцией и задается спектральной функцией. Разложение в ряд Фурье используется для функций, заданных на ограниченном промежутке, или для периодических функций, и здесь будет дискретным. Задаётся он уже не спектральной функцией, а набором частот.

В процессе анализа случайных функций применяются методы обработки спектрального анализа. Эта возможность основана на теореме, именуемой теоремой о спектральном разложе-

нии [64].

Говорят, что случайный процесс X(t) допускает спектральное разложение, если его можно представить в виде суммы (вообще говоря, бесконечной, т.е. в виде бесконечного функционального ряда) элементарных гармонических случайных процессов. Такое представление иногда называют полигармонической моделью временного ряда.

174

Периодические флуктуации, разложенные рядом Фурье, представляют собой сумму нескольких синусоидальных и косинусоидальных гармоник с различными периодами:

xi a0 / 2 ak cos 2 k t 1 bk sin 2 k t 1 , (6.6)

k

где a0 – свободный член (или среднее значение); k частота,

определяется как количество циклов на одно наблюдение; k = 1, n; n – число наблюдений ряда; ak, bk коэффициенты регрессии, вычисляются методом наименьших квадратов.

Если на рис. 6.6 в году четыре наблюдения, раз в квартал, то на одно наблюдение приходится 1 / 4 цикла. Годовой цикл включает четыре наблюдения, по одному в каждом квартале.

В уравнении (6.6) произведение 2·p· k = ωn – это круговая частота, выраженная в радианах в единицу времени, где p = 3,1416 и k = k / n. Набор неслучайных частот ωn, фигури-

рующих в этом разложении, называется спектром случайного процесса X(t).

При этом в анализе применяют только гармоники с частотами ωk, кратными одной основной частоте ω, т.е. берут ωk = ω·k, где k = 1, 2, 3... . Общее разложение в сумму гармоник с произвольными частотами используется реже, поскольку при этом получаются не обычные периодические функции, а так называемые почти периодические функции, которые еще не нашли широкого применения в инженерной практике.

Преимуществом такого подхода является то, что возможность подгонки функций синусов и косинусов разных длин к данным допускается с использованием множественной линейной регрессии. В уравнении (6.6) коэффициенты ak при косинусах и коэффициенты bk при синусах – это коэффициенты регрессии, показывающие меру, с которой соответствующие функции коррелируют с данными. Если N – количество данных, то будет

175

N / 2 + 1 функций косинусов и N / 2–1 функций синусов. Другими словами, различных волн ряда Фурье будет столько же, сколько данных, и пользователь сможет полностью воспроизвести ряд по основным функциям. Если количество данных в ряде нечетно, то последнее наблюдение обычно опускается. В некоторых случаях требуемое в этой теореме разложение функции KX можно найти с помощью ряда Фурье. А именно, если KX периодична, то она может быть разложена (при некоторых, довольно несущественных на практике, ограничениях на KX) на отрезке [– T, T] в ряд Фурье, причем только по косинусам (так как KX – четная функция) [64; 66].

6.1.7.Периодограмма и ее использование

Впредыдущем разделе указывалось, что спектром функции называется совокупность частот ее разложения по гармоникам. Периодограмма в графическом виде показывает оценку (а точнее, одну из нескольких возможных оценок) модуля преобразования Фурье автокорреляционной функции стационарного временного ряда (или случайного процесса). Другими словами, это ещё одна графическая форма одной из оценок спектра функции автокорреляции. Ее еще можно рассматривать как график зависимости мощности процесса (или квадрата амплитуды) от частоты. В процессе анализа этого графика особое внимание обращают на её пики. Большой по размеру пик в области неко-

торой частоты ωk указывает на то, что в спектральном разложении автокорреляционной функции присутствует соответствующая гармоническая компонента. Чем выше и резче выделен пик,

тем большая часть мощности сосредоточена около частоты ωk и тем большую роль играет эта частота в описании соответствующего случайного процесса или временного ряда [19]. Фундаментом спектрального анализа (СА) временных рядов является теорема Винера – Хинчина, которая устанавливает связь между двумя характеристиками случайного процесса. Теорема утверждает, что прямое и обратное преобразование Фурье свя-

176

зывает автокорреляционную функцию стационарного случайного процесса и его спектральную плотность (или спектр мощно-

сти) [64].

На практике из-за неполноты имеющейся информации приходится иметь дело не со строгими характеристиками (спектральной плотностью, АКФ), а только с их оценками – периодограммой и коррелограммой соответственно.

СА позволяет оценить наличие циклических (сезонных) компонентов в имеющихся данных. По полученной периодограмме (графическому изображению спектральной плотности) временного ряда в частотной области можно выявить наличие или отсутствие резко выделяющихся частот, а по ним судить о присутствии периодической компоненты в исследуемом сигнале. Такая возможность появляется вследствие того, что находящаяся под знаком интеграла показательная функция представляет собой так называемую базисную функцию, состоящую из набора гармонических составляющих [56].

Спектральная плотность определяет распределение энергии сигнала по частоте. Например, при исходном сигнале, представляющем собой гармонический сигнал (синусоиду определенной частоты), его спектральная плотность показывает только одну вертикальную составляющую: вся энергия сосредоточена на одной частоте. Если сигнал – белый шум, то и плотность такого сигнала представляет собой горизонтальную линию – равномерное распределение энергии [64; 80].

В табл. 6.3 представлены результаты спектрального анализа. Видно, что наибольшую плотность имеет частота 0,25 (период 4), что находит своё отображение на периодограмме (рис. 6.7) – самый большой пик находится на частоте, равной 0,25.

Спектральный анализ необходим, и причиной тому несколько фактов: во-первых, оценки спектра на соседних частотах независимы, поэтому его легче интерпретировать, чем АКФ; во многих задачах спектр представляет непосредственный интерес.

177

Таблица 6.3

Результат спектрального анализа

Рис. 6.7. Периодограмма

178

6.1.8. Стационарность случайной функции

Наиболее простым для использования в работе с природными явлениями и объектами является особый класс случайных функций – стационарные случайные функции, статистические свойства которых практически не изменяются с изменением аргумента.

Термин «стационарность» возник при изучении случайных функций времени и характеризует постоянство их свойств во времени. Для случайных процессов, аргументом которых является другая переменная, например, расстояние или пространственная координата, используется термин «однородность». Обычно термин «однородность» применяют к случайным полям, характеризуя их однородность в пространстве, а под стационарностью поля понимают постоянство его статистических свойств во времени, хотя иногда вместо стационарности говорят об однородности по времени. Поскольку терминология ещё не устоялась, в дальнейшем «стационарность» и «однородность» будем считать одинаковыми понятиями. Стационарные процессы должны быть прогнозируемы, поскольку они меняются предсказуемо, их проще моделировать и исследовать. Если вероятностная структура ряда со временем будет непредсказуемо изменяться, тогда и закономерности, действующие в будущем, будут отличаться от действовавших в прошлом. В таком случае невозможно точно прогнозировать будущее, основываясь на прошлом. Если мы хотим строить прогнозы значений временного ряда, мы как минимум желаем, чтобы его математическое ожидание и ковариация (т.е. ковариация между текущими и прошлыми значениями) были постоянны во времени.

Случайный процесс называют стационарным в узком смысле (говорят, строго стационарным или сильно стационарным), если все конечномерные функции распределения вероятностей любого порядка инвариантны относительно сдвига по времени, т. е. при любых n и t0 справедливо равенство:

Fn (x1, …, xn; t1 t0, …, tn t0) = Fn (x1, …, xn; t1, …, tn). (6.7)

179

У стационарной случайной функции все её характеристики не изменяются при любом сдвиге аргументов по оси X:

её математическое ожидание постоянно, mp(x) = const;

дисперсия СФ постоянная, Dp(x) = const;

корреляционная функция зависит только от разности dx

на оси X, но не от его положения на этой оси: Kp(t, t ) = Kp(dt), где разность dt = ( t – t).

Это означает, что распределение ограниченной последовательности случайных величин случайного процесса остается таким же, когда мы смещаем функцию вдоль оси времени. Функции распределения вероятностей любого порядка не меняются при сдвиге во времени. Поэтому, чтобы дискретный процесс был строго стационарным, функции распределения вероятностей любой совокупности наблюдений не должны изменяться при сдвиге всех времен наблюдений вперед или назад на любое целое число k.

Другими словами, свойства строго стационарного временного ряда не меняются при изменении начала отсчета времени.

Случайная функция стационарна в широком смысле, если из перечисленных условий её n-мерный закон распределения меняется на разных её участках.

Мы видим, что n-мерные плотности распределения вероятностей зависят не от абсолютного положения значений t1, t2,

... , tn на оси t, а от их относительного расположения, а именно от разностей t2 − t1, ..., tn − t1. Это значит, что всякое перемещение начала отсчета по оси времени преобразует совокупность реализаций случайной функции в саму себя таким образом, что ее статистические характеристики не изменяются. Данное определение стационарности налагает слишком много ограничительных условий на случайные процессы, и на практике их нередко невозможно даже проверить. Если хотя бы одно из приведённых условий не выполняется, случайную функцию относят к классу нестационарных [8].

Случайный процесс называется стационарным порядка k, если равенство (6.7) выполняется не для любых n, а только при n ≤ k. Несмотря на то что стационарность требует, чтобы сред-

180

Соседние файлы в папке книги