Метод filter()
в библиотеке Pandas позволяет фильтровать столбцы (признаки) DataFrame на основе их имени или метаданных. Этот метод обеспечивает гибкую возможность выбора подмножества столбцов, что особенно полезно при работе с большими наборами данных.
Синтаксис метода filter()
выглядит следующим образом:
DataFrame.filter(items=None, like=None, regex=None, axis=None)
Параметры метода:
items
: Список или набор строк, содержащих имена столбцов, которые нужно включить в результат. Если None
, то все столбцы будут включены.
like
: Строка или список строк, содержащих подстроки, которые должны встречаться в именах столбцов. Только столбцы, имена которых содержат хотя бы одну из указанных подстрок, будут включены в результат.
regex
: Строка, содержащая регулярное выражение, которому должны соответствовать имена столбцов. Только столбцы, имена которых соответствуют указанному регулярному выражению, будут включены в результат.
axis
: Определяет направление фильтрации. По умолчанию равен None
, что означает фильтрацию по столбцам (ось 1). Может принимать значение 0 для фильтрации по индексам строк (ось 0).
Примеры использования метода filter()
:
- Выбор столбцов по имени: