Статья Автор: Деникина Н.В., Деникин А.В.

Группировка данных

Группировка позволяет объединить данные по определенному признаку или набору признаков, а агрегация позволяет вычислить статистические показатели для каждой группы данных.

Для группировки данных в Pandas используется метод groupby(). Этот метод позволяет разделить данные на группы на основе значений определенного столбца или набора столбцов. Например, если у нас есть DataFrame с данными о цветках ириса, мы можем сгруппировать данные по видам ириса с помощью следующего кода:
 


Но этот код не выводит его содержимое. Чтобы увидеть результаты группировки, надо выполнить операции агрегации или другие операции, используя этот объект groupby. Можно использовать встроенные функции агрегации, такие как sum(), mean(), count(), min(), max() и другие, напрямую на объекте DataFrame после группировки:

Прикрепленные файлы
iris.csv
Пропустить Навигационные Ссылки.
Чтобы оставить комментарий нужна авторизация
Печать