Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Васильев Ю. - Python для data science (Библиотека программиста) - 2023.pdf
Скачиваний:
7
Добавлен:
07.04.2024
Размер:
7.21 Mб
Скачать

224      Глава 10. Анализ данных временных рядов

Создаем колонку nextVolume, сдвигая Volumeна -1, то есть сдвигаем объем продаж за следующий день назад так, чтобы он совпал с текущим. Получим вывод:

 

 

Price

Volume

priceRise

volumeRise

volumeSum

nextVolume

Date

 

 

 

 

 

 

 

2021-12-22 1008.86 31211400

0.072271

0.269448

42666000

30904400

2021-12-23 1067.00 30904400

0.056020

-0.009885

55050700

23715300

2022-01-03

1199.78

34643800

0.126912

0.940305

29209000

33416100

2022-01-05

1088.11

26706600 -0.054954

-0.224127

68059900

30112200

2022-01-13

1031.56

32403300

-0.069876

0.149168

49934100

24246600

 

 

 

 

 

 

 

 

 

Как видите, предположение верно для 2022-01-03: nextVolumeменьше, чем Volume. Однако для точного анализа может понадобиться больше показателей. Попробуйте добавить еще одну метрику, которая суммирует значения priceRise за два предыдущих дня. Если значение положительное, это означает, что цены в целом находились в восходящем тренде в течение последних двух дней. Отрицательное же значение указывает на падение цен. Используйте эту новую метрику вместе с уже существующими метриками priceRise и volumeSum, чтобы выяснить, как они совместно влияют на значения в колонке volumeRise.

Выводы

Как вы узнали из этой главы, временной ряд — это набор данных, организованный в хронологическом порядке, в котором одна или несколько переменных изменяются во времени. На примере данных фондового рынка мы рассмотрели несколько методов применения pandas для анализа временных рядов с целью получения из них полезной статистики. Вы научились смещать точки данных во временном ряду, чтобы рассчитать изменения с течением времени, а также узнали, как выполнять вычисления в скользящем окне, то есть как агрегировать данные в пределах перемещающегося по всей серии временного интервала фиксированного размера. В совокупности эти методы помогают делать выводы о тенденциях в данных. Наконец, мы рассмотрели методы выявления зависимостей между различными переменными в многомерном временном ряду.