Статья Автор: Деникина Н.В., Деникин А.В.

Метод filter()

Метод filter() в библиотеке Pandas позволяет фильтровать столбцы (признаки) DataFrame на основе их имени или метаданных. Этот метод обеспечивает гибкую возможность выбора подмножества столбцов, что особенно полезно при работе с большими наборами данных.

Синтаксис метода filter() выглядит следующим образом:
DataFrame.filter(items=None, like=None, regex=None, axis=None)
 

Параметры метода:

  • items: Список или набор строк, содержащих имена столбцов, которые нужно включить в результат. Если None, то все столбцы будут включены.
  • like: Строка или список строк, содержащих подстроки, которые должны встречаться в именах столбцов. Только столбцы, имена которых содержат хотя бы одну из указанных подстрок, будут включены в результат.
  • regex: Строка, содержащая регулярное выражение, которому должны соответствовать имена столбцов. Только столбцы, имена которых соответствуют указанному регулярному выражению, будут включены в результат.
  • axis: Определяет направление фильтрации. По умолчанию равен None, что означает фильтрацию по столбцам (ось 1). Может принимать значение 0 для фильтрации по индексам строк (ось 0).

Примеры использования метода filter():

  1. Выбор столбцов по имени:


  1. Выбор столбцов, имена которых содержат определенную подстроку:


3) Параметр axis в библиотеке Pandas определяет направление операции, которая выполняется по осям DataFrame или Series. Он может принимать значения 0 или 1, где:

  • axis=0 соответствует операциям, выполняемым по индексам строк (например, применение функции к строкам или фильтрация строк);
  • axis=1 соответствует операциям, выполняемым по столбцам (например, применение функции к столбцам или фильтрация столбцов).

Важно понимать, что параметр axis влияет на то, какие измерения будут выбраны для выполнения операции: строки (axis=0) или столбцы (axis=1).

Примеры использования параметра axis:

  1. Вычисление суммы элементов по строкам (axis=1):


В этом примере axis=1 указывает, что сумма должна быть вычислена для каждой строки.

  1. Вычисление максимального значения в каждом столбце (axis=0):

Пропустить Навигационные Ссылки.
Чтобы оставить комментарий нужна авторизация
Печать