Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

9290

.pdf
Скачиваний:
0
Добавлен:
25.11.2023
Размер:
2.48 Mб
Скачать

валов на основе имеющейся информации о дате и времени.

Квантирование (дискретизация) предназначено для преобразования не-

прерывных данных в дискретные. Преобразование может происходить как по интервалам, так и по квантилям (данные разбиваются на интервалы разной длины, но с одинаковым количеством записей).

Настройка набора данных применяется для изменения имени, метки, ти-

па, размера, вида и назначения полей текущей таблицы данных.

Замена значений используется для замены по таблице подстановок, кото-

рая содержит пары, состоящие из исходного и внесенного значения. Например, «кр» – «красный».

Группировка данных позволяет объединять записи по полям-измерениям и агрегировать данные в полях-факторах для дальнейшего анализа.

Преобразование данных к скользящему окну используется тогда, когда при прогнозировании динамического ряда наблюдается его периодичность.

Учитываются значения факторов не только в данный момент времени, но и за прошлый период.

Слияние предназначено для объединения двух наборов данных по не-

скольким одинаковым полям. К исходной таблице добавляются новые поля и/или строки, значения которых берутся из присоединяемой таблицы.

Пример 1. Изначально загружаемая информация может быть предоставле-

на в базе данных Microsoft Office Access или Microsoft Office Excel.

31

Рис. 4. Данные таблиц Microsoft Office Access.

Для перевода полученной информации в Deductor Studio Academic 5.3.

необходимо представить данные в текстовом формате (.txt) с разделителями та-

буляции.

32

Рис. 5. Данные в текстовом формате

Импорт полученных данных в программу Deductor Studio Academic произ-

водится Мастером импорта. В диалоговых окнах Мастера импорта простав-

ляются соответствующие параметры (рис.6).

33

Рис. 6. Ввод данных в Deductor Studio Academic

Результат импорта данных продемонстрирован на рисунке 7.

Рис. 7. Результат импорта данных Для создания единой таблицы со всеми имеющимися данными имеющиеся

таблицы объединяются в одну при помощи функции слияние с узлом. Тип сли-

34

яния данных - полный внешний, который включает все строки из входящего и связанного наборов данных.

Рис. 8. Слияние с узлом.

Полученная в результате таблица включает в себя все данные (рисунок 9).

Рис. 9. Полное внешнее соединение.

Для визуализации и последующего анализа данных иногда их нужно пред-

варительно подготовить, например, сгруппировав по тем или иным признакам.

35

Произведем группировку исходных данных по году, коду предприятия и

потреблению с помощью Мастера обработки данных (рисунок 10) и на их ос-

нове смоделируем многомерную диаграмму с помощью Мастера визуализа-

ции (рисунок 11).

Рис. 10. Группировка (Измерения: год, код предприятия; Факты: потр.)

Рис.11. Визуализатор «Многомерная диаграмма»

36

Создадим аналогичную группировку, на этот раз содержащую информа-

цию ещё и о помесячных потреблениях (рисунок 12) и построим диаграмму размещения (рисунок 13).

Рис. 12. Группировка (Измерения: год, месяц, код предприятия; Факты:

потр.)

Рис. 13. Визуализатор «Диаграмма размещения» Создадим группировку (рисунок 14) и диаграмму (рисунок 15) по кодам

предприятия и суммарному потреблению энергии.

37

Рис. 14. Группировка (Измерения: код предприятия; Факты: потр.)

Рис. 15. Визуализатор «Диаграмма»

Пример 2. Другой вариант представления исходных данных – текстовый файл, содержащий, например, временной ряд (Время + Показатель).

Для визуализации и последующего анализа данных проделаем следующую работу. Для выделения из поля Дата месяца, воспользуемся обработчиком «Да-

та и время». В таблице появится новый столбец Дата (Год+Месяц).

38

Кривую продаж можно посмотреть с помощью визуализатора «Диаграм-

ма».

Рис. 16. Кривая продаж

Кривая продаж может содержать шумы и выбросы, которые необходимо удалить для получения более качественного прогноза. Эта процедура называет-

ся очисткой данных.

Для очистки данных нужно воспользоваться «Парциальной обработкой» Вызовем мастер парциальной обработки. В настройках укажем для поля Коли-

чество вычитание шума с большой степенью вычитания. Результат такого пре-

образования можно увидеть на диаграмме.

Рис. 17. Кривая продаж. Результат парциальной обработки.

39

Теперь есть достаточно хорошо подготовленные для построения модели данные. Но необходимо определить сезонность продаж продукции. Для этого служит обработчик «Автокорреляция». Применим ее к узлу с парциальной пре-

добработкой. Будем искать зависимости в поле Количество. Такую зависимость следует искать, например, в течение одного года. Для этого укажем количество отсчетов равное 12.

Полученную автокорреляционную функцию можно посмотреть на диа-

грамме.

Рис. 18. Автокорреляционная функция

На ней видна обратная зависимость в течение примерно половины года и прямая зависимость в течение года, что соответствует половине года. Для по-

строения модели будем использовать годовую зависимость объемов продаж.

При построении модели будем основываться на продажах за предыдущий год для того, чтобы учесть общее развитие рынка. Для этого произведем

Трансформацию данных. Преобразуем столбец «Количество» в обработчике

«Скользящее окно», вызвав его к узлу с парциальной обработкой. Укажем столбец Количество используемым и установим для него глубину равной 12.

40

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]