Курсы

Основы анализа данных

Фильтрация и группировка. Охотники за данными

Модуль: Фильтрация и группировка. Охотники за данными

Метод filter()

Метод filter() в библиотеке Pandas позволяет фильтровать столбцы (признаки) DataFrame на основе их имени или метаданных. Этот метод обеспечивает гибкую возможность выбора подмножества столбцов, что особенно полезно при работе с большими наборами данных.

Синтаксис метода filter() выглядит следующим образом:
DataFrame.filter(items=None, like=None, regex=None, axis=None)

Параметры метода:

items: Список или набор строк, содержащих имена столбцов, которые нужно включить в результат. Если None, то все столбцы будут включены.
like: Строка или список строк, содержащих подстроки, которые должны встречаться в именах столбцов. Только столбцы, имена которых содержат хотя бы одну из указанных подстрок, будут включены в результат.
regex: Строка, содержащая регулярное выражение, которому должны соответствовать имена столбцов. Только столбцы, имена которых соответствуют указанному регулярному выражению, будут включены в результат.
axis: Определяет направление фильтрации. По умолчанию равен None, что означает фильтрацию по столбцам (ось 1). Может принимать значение 0 для фильтрации по индексам строк (ось 0).

Примеры использования метода filter():

Выбор столбцов по имени:

import pandas as pd

# Создаём DataFrame для примера
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Emily'],
        'Age': [25, 30, 35, 40, 45],
        'Score': [85, 90, 75, 80, 95]}
df = pd.DataFrame(data)

result = df.filter(items=['Name', 'Age'])
print(result)

Выбор столбцов, имена которых содержат определенную подстроку:

import pandas as pd

# Создаём DataFrame для примера
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Emily'],
        'Age': [25, 30, 35, 40, 45],
        'Score': [85, 90, 75, 80, 95]}
df = pd.DataFrame(data)

filtered_df = df.filter(like='Sco')
print(filtered_df)

3) Параметр axis в библиотеке Pandas определяет направление операции, которая выполняется по осям DataFrame или Series. Он может принимать значения 0 или 1, где:

axis=0 соответствует операциям, выполняемым по индексам строк (например, применение функции к строкам или фильтрация строк);
axis=1 соответствует операциям, выполняемым по столбцам (например, применение функции к столбцам или фильтрация столбцов).

Важно понимать, что параметр axis влияет на то, какие измерения будут выбраны для выполнения операции: строки (axis=0) или столбцы (axis=1).

Примеры использования параметра axis:

Вычисление суммы элементов по строкам (axis=1):

import pandas as pd

# Создание DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})

# Вычисление суммы элементов по строкам
row_sum = df.sum(axis=1)
print(row_sum)

В этом примере axis=1 указывает, что сумма должна быть вычислена для каждой строки.

Вычисление максимального значения в каждом столбце (axis=0):

import pandas as pd

# Создание DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})

# Вычисление максимального значения в каждом столбце
column_max = df.max(axis=0)
print(column_max)

Обсуждения (0)

Загрузка...

Чтобы оставить комментарий, необходимо авторизоваться

💬

Пока нет комментариев. Будьте первым!

Решения (0)

Решения:

Нет доступных решений

Курсы Основы анализа данных Фильтрация и группировка. Охотники за данными

Модуль: Фильтрация и группировка. Охотники за данными

Метод filter()

Обсуждения (0)

Решения (0)

Курсы

Основы анализа данных

Фильтрация и группировка. Охотники за данными