Добавил:

dipro Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

МИРЭА - Российский технологический университет

Предмет:

Программирование на Python

Файл:

Васильев Ю. - Python для data science (Библиотека программиста) - 2023.pdf

Скачиваний:

Добавлен:

07.04.2024

Размер:

7.21 Mб

Скачать

☆

<<< < Предыдущая 26 27 28 29 30 31 32 33 34 35 36 3738 / 7638 39 40 41 42 43 44 45 46 47 48 49 50 > Следующая >>>

146 Глава 6. Агрегирование данных

УПРАЖНЕНИЕ № 10: ИСКЛЮЧЕНИЕ ИЗ ДАТАФРЕЙМА СТРОК

С ИТОГОВОЙ СУММОЙ

Наличие в DataFrame строк с суммарными значениями позволяет использовать его в качестве отчета без необходимости совершать с ним дополнительные действия. Однако если вы собираетесь использовать датафрейм в дальнейших операциях агрегирования, такие строки лучше исключить.

Попробуйте отфильтровать датафрейм df_totals, созданный в предыдущем разделе, исключив строки с общим и промежуточным итогом. Используйте методы срезов, рассмотренные в этой главе.

Выбор всех строк в группе

Помимо помощи в агрегировании, функция groupby() позволяет выбрать все строки, принадлежащие определенной группе. Для этого к объекту, возвращаемому groupby(), применяется метод get_group(). Вот как это работает:

group = df_result.groupby(['Date','Region']) group.get_group(('2022-02-04','West'))

Мы группируем датафрейм df_result по Date и Region, передавая имена столбцов в groupby() в виде списка, как уже делали это ранее. Затем применяем метод get_group() к полученному объекту GroupBy, передавая кортеж с нужным индексом. В результате получаем следующий датафрейм:

	Date	Region	Total
0	2022-02-04	West	87.0
1	2022-02-04	West	112.0
2	2022-02-04	West	20.0
3	2022-02-04	West	24.0

Как видите, результирующие значения не являются агрегированными. Мы получили все строки с заказами, относящиеся к указанной дате и региону.

Выводы 147

Выводы

В этой главе вы узнали, что агрегирование — это процесс сбора данных и их представления в обобщенном виде. Как правило, он включает разделение данных по группам и вычисление итоговых показателей по каждой группе. На примерах этой главы мы показали, как агрегировать данные, содержащиеся в pandas DataFrame, используя методы и свойства данной структуры, такие как merge(), groupby(), sum(), index и loc. Вы научились использовать преимущества иерархического индекса (или MultiIndex) датафрейма для моделирования многоуровневых отношений в агрегируемых данных. Вы также научились выборочно просматривать агрегированные данные и получать их срезы с помощью MultiIndex.

<<< < Предыдущая 26 27 28 29 30 31 32 33 34 35 36 3738 / 7638 39 40 41 42 43 44 45 46 47 48 49 50 > Следующая >>>

Соседние файлы в предмете Программирование на Python

#
07.04.20247.83 Mб2Elementary Mechanics Using Python- 2015.pdf
#
07.04.20246.11 Mб2Parvez Ahmed - The Ultimate Python Quiz Book - 2024.pdf
#
07.04.202411.31 Mб2primer_on_scientific_programming_with_python.pdf
#
07.04.202414.71 Mб6Python. Полное руководство [2022] Кольцов Д.М..pdf
#
07.04.202420.51 Mб3Бэрри П. - Изучаем программирование на Python (Мировой компьютерный бестселлер) - 2022.pdf
#
07.04.20247.21 Mб7Васильев Ю. - Python для data science (Библиотека программиста) - 2023.pdf
#
07.04.20248.59 Mб4Внутри CPython гид по интерпретатору Python.pdf
#
07.04.202414.76 Mб4Воган Ли - Python для хакеров (Библиотека программиста) - 2023.pdf
#
07.04.202412.74 Mб4Марченко А. Л. - Python, большая книга примеров - 2023.pdf
#
07.04.20242.73 Mб5Мокеев В.В. - WEB-аналитика на Python - 2020.pdf
#
07.04.20246.73 Mб5Практическое введение в основные библиотеки и фреймворки Python 2023.pdf