Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Статистические и интеллектуальные методы прогнозирования

..pdf
Скачиваний:
6
Добавлен:
12.11.2023
Размер:
8.94 Mб
Скачать

терминации, критериальную статистику для проверки значимости регрессии, значения функции регрессии и остатки (таблица

Вывод остатка).

Первоначально исходные данные вводятся в поле MS Excel (рис. 4.7) (исходные данные примера 4.1).

Рис. 4.7. Исходные данные

При вызове Регрессия (Данные > Анализ данных > Регрес-

сия) запускается диалоговое окно (рис. 4.8). Основные опции функции:

поле Входной интервал Y – для ввода адреса диапазона, который содержит значения выходной (зависимой) переменной Y (столбец y(t) исходных данных). В данном поле может отражать-

ся только один столбец;

71

Рис. 4.8. Диалоговое окно Регрессия

поле Входной интервал Х – для ввода адреса диапазона, содержащего значения переменной Х. В данном поле могут отображаться до 16 столбцов. По исходным данным (см. рис. 4.7) строится модель 3-го порядка, поэтому будут отражены адреса диапазонов столбцов y(t 1), y(t 2), y(t 3);

в поле Метки устанавливается флажок, если первая строка во входном диапазоне содержит заголовок. При отсутствии флажка для входных данных будут созданы стандартные названия;

опция Уровень надежности устанавливает доверитель-

ный уровень для построения доверительных интервалов для коэффициентов регрессии;

флажок в поле Константа-ноль устанавливается в том случае, когда требуется, чтобы линия регрессии прошла через начало координат;

результаты расчета могут быть выведены на том же листе MS Excel (флажок в поле Выходной интервал), на новом листе (флажок в поле Новый рабочий лист) или в новом файле MS Excel (флажок в поле Новая рабочая книга);

72

в области Остатки имеются четыре опции: Остатки,

Стандартизованные остатки, График остатков и График подбора. При установке флажка будут осуществляться следующие действия: Остатки – помимо выходных данных будут выведены остатки; Стандартизованные остатки – будут выведены стандартизованные остатки (остатки, деленные на отклонение); График остатков вывод графиков зависимости остатков от входных данных; График подбора – для вывода графиков зависимости выходного параметра Y от входных параметров X .

Результаты вычислений авторегрессионной модели представлены в виде вывода итогов (регрессионная статистка, дисперсионный анализ, коэффициенты модели) и вывода остатков.

Результаты регрессионной статистики (рис. 4.9) включают в себя: расчеты коэффициента детерминации (R-квадрат) R2, множественного коэффициента (множественный R), который равен квадратному корню коэффициента детерминации, количество наблюдений и нормированный коэффициент детерминации R2.

Рис. 4.9. Результаты расчета регрессионной статистики

В таблице Дисперсионный анализ (рис. 4.10) представлены результаты расчета характеристик дисперсионного анализа: суммы квадратов (столбец SS ); чисел степеней свободы (столбец df ) и

дисперсий (столбец MS ), а также расчет значения критерия Фишера (Fp), расчет значимости F (уровень значимости, соответствующее вычисленному критерию Fp).

73

Рис. 4.10. Результаты расчета дисперсионного анализа

В следующей таблице (рис. 4.11) приведены коэффициенты авторегресионной модели и их статистические оценки (Y-пересече- ние – это значение свободного члена авторегрессионной модели).

Рис. 4.11. Результаты расчета коэффициентов модели

Встолбце Стандартная ошибка вычислены среднеквадратические отклонения коэффициентов. В столбце t -статистика представлены расчеты значимости соответствующих коэффициентов модели по критерию Стьюдента. Нижние 95% и верхние 95% – это границыдоверительныхинтерваловдля коэффициентовмодели.

Втаблице Вывод остатка (рис. 4.12) представлены выход модели (Предсказанное Y ) и ошибки модели (Остатки и Стандартные остатки).

Таким образом, авторегрессионная модель AP(3) имеет вид

y(t) 0.0158 0.7200y(t 1) 0.1014y(t 2) 0.2190y(t 3) .

Коэффициент детерминации R2 0.9315 показывает, что 93.15 % разброса выходной переменной Y объясняется построенной авторегрессионной моделью (входные переменные выбраны верно, именно они вносят существенный вклад в формирование модели авторегрессионной модели). Значимость F 2.15 10 8 подтверждает статистическую значимость коэффициента детерминации R2, соответствующую заданному уровню значимости

74

0.05 (2.15 10 8 0.05 ). Уровень значимости определяется по заданному уровню надежности ( 1 1 0.95).

Рис. 4.12. Результаты работы авторегрессионной модели

Результаты моделирования рассчитанной авторегрессионной модели представлены на рис. 4.13.

Рис. 4.13. Графики исходных данных и авторегрессионной моделиAR (3)

75

ВОПРОСЫ И ЗАДАНИЯ ДЛЯ САМОКОНТРОЛЯ

1.Почему авторегрессионные модели так называются?

2.Какое свойство временного ряда должно выполняться

для возможности использования авторегрессионных моделей

вкачестве модели прогноза?

3.Что такое глубина погружения и как она влияет на качество авторегрессионной модели?

4.Параметры AR-модели и как они выбираются?

5.В чем заключается суть модели скользящего среднего?

6.Когда применяются модели скользящего среднего?

7.Достоинства модели интегрирования.

8.Основные метрики качества авторегрессионных моделей.

9.Построить модели AR (3), MA (3) и WMA (3) для временного ряда и оценить адекватность моделей.

Исходные данные и значения регрессионных моделей

x

y

x

y

0.1

–0.50

0.6

4.69

0.2

1.11

0.7

5.02

0.3

2.24

0.8

5.55

0.4

3.16

0.9

6.24

0.5

3.48

1.0

7.15

76

5. МОДЕЛИ ЭКСПОНЕНЦИАЛЬНОГО СГЛАЖИВАНИЯ

Для выявления долговременных тенденций, характеризующих изменения данных, кроме скользящих средних, применяется метод экспоненциального сглаживания [24, 25]. Этот метод позволяет также делать краткосрочные прогнозы (в рамках одного периода), когда наличие долговременных тенденций является сомнительным. Благодаря этому метод экспоненциального сглаживания обладает значительным преимуществом над методом скользящих средних.

Метод экспоненциального сглаживания получил свое название от последовательности экспоненциально взвешенных скользящих средних. Каждое значение в этой последовательности зависит от всех предыдущих наблюдаемых значений. Еще одно преимущество метода экспоненциального сглаживания над методом скользящего среднего заключается в том, что при использовании последнего некоторые значения отбрасываются. При экспоненциальном сглаживании веса, присвоенные наблюдаемым значениям, убывают со временем, поэтому после выполнения вычислений наиболее часто встречающиеся значения получат наибольший вес, а редкие величины – наименьший.

Среди моделей экспоненциального сглаживания можно выделить следующие [26, 27]:

модели простого сглаживания;

модели двойного сглаживания Хольта;

модели тройного сглаживания Хольта – Уинтерса. Рассмотрим особенности данных моделей.

77

5.1.МОДЕЛЬ ПРОСТОГО ЭКСПОНЕНЦИАЛЬНОГО СГЛАЖИВАНИЯ

Модель простого экспоненциального сглаживания имеет вид

s(i)

 

y(i)

i 1,

(5.1)

 

 

 

y(i) (1 )s(i 1)

i 1,

 

где y(i) – значение временного ряда в момент i;

s(i) – сглаженное значение (экспоненциальное среднее) –

прогноз на момент i 1;

– коэффициент сглаживания.

Простое экспоненциальное сглаживание дает возможность спрогнозировать значение временного ряда на один шаг вперед:

 

s(k),

(5.2)

y(k 1)

где y(k 1) – прогнозируемое значение временного ряда.

Выбор сглаживающего коэффициента, или веса, присвоенного членам ряда, является принципиально важным, поскольку он непосредственно влияет на результат. К сожалению, этот выбор до некоторой степени субъективен. Если исследователь хочет просто исключить из временного ряда нежелательные циклические или случайные колебания, следует выбирать небольшие величины (близкие к нулю). С другой стороны, если временной ряд используется для прогнозирования, необходимо выбрать большой вес (близкий к единице). В первом случае четко проявляются долговременные тенденции временного ряда. Во втором случае повышается точность краткосрочного прогнозирования.

Очевидно, что коэффициент сглаживания выбирается в диапазоне от 0 до 1. Выбор близким к 1 повышает вес ближайшего предшествующего значения. Если выбирается близким к 0, то в сглаживании в большей мере учитываются начальные значения временного ряда. Другими словами, от величины зависит, как быстро снижается вес предшествующих значений.

78

y(i)

Несмотря на то, что коэффициент выбирают субъективно, но есть некоторые рекомендации к выбору сглаживающего коэффициента. Например, автор метода Браун предложил формулу

 

2

 

,

(5.3)

n 1

 

 

 

где n – число наблюдений, входящих в интервал сглаживания. Другой исследователь Гарднер (1985) считает, что на

практике обычно следует брать 0.3.

По опубликованным данным аналитического отдела Kodak, данная фирма обычно использует 0.38 , а фирма Ford Motors –

0.28 или 0.3.

Существует аналитический метод расчет сглаживающего коэффициента по известным данным, который обеспечивает минимум ошибки.

5.1.1. Расчет коэффициента сглаживания при минимуме ошибки

Расчет коэффициента сглаживания осуществляется по следующему алгоритму:

1.Выбирается шаг изменения коэффициента сглажива-

ния 0.1.

2.Задается шаг i 2.

3.Задается значение коэффициента сглаживания:

i 0.1 0.1(i 1).

4.Выполняется расчет сглаживания на известном интервале по формуле (5.1).

5.Осуществляется расчет относительной ошибки между реальным значением временного ряда и его сглаживанием:

e(i)

 

 

y(i) s(i)

 

 

.

(5.4)

 

 

 

 

 

 

 

 

 

79

100% .

6. Расчет ошибки MAPE (Mean Absolute Percentage Error):

k1

e(i)

E i 1

k 1

7. Изменяется шаг i i 1.

8. Проводятся расчеты 3–6 для данного i .

9. Расчет заканчивается при i k .

10. Осуществляется выбор сглаживающего коэффициента i , при котором ошибка MAPE минимальна.

11. Рассчитывается прогнозируемое значение y(k 1) (5.2).

При выборе сглаживающего коэффициента для «запуска» алгоритма прогнозирования методом простого экспоненциального сглаживания необходимо определить начальное значение

прогноза y(1).

5.1.2. Выбор начального значения прогноза

Для решения задачи прогнозирования методом экспоненциального сглаживания с заданным коэффициентом сглаживания формула (5.1) определяет значение начального прогноза – предыдущее значение временного ряда. Однако если выбирать сглаживающий коэффициент по минимуму MAPE, то необходимо выбрать s(1) .

Для решения данной задачи существуют рекомендации: выбрать начальное значение прогноза как начальное значение реального временного ряда:

s(1) y(1).

(5.5)

Такое простое решение предлагал и автор метода Браун. Однако существует и другое мнение: чтобы снизить зависимость от первого значения ряда, надо выбрать значение начального прогноза как усреднение по первым m значениям:

80

Соседние файлы в папке книги