Обработка пропусков
df.dropna() - удаляет строки с пропусками
df.fillna(value, inplace=True) - заполняет пропуски значением value
df.fillna(df.mean(), inplace=True) - заполняет средним значением
Параметр
inplace:
inplace=False (по умолчанию) - создает копию с изменениями
inplace=True- изменяет исходный DataFrame напрямую
Метод
fillna() с словарем позволяет заполнить пропуски в разных столбцах различными значениями за одну операцию. Синтаксис:
df.fillna({'column1': value1, 'column2': value2, ...})
Пример
df = ...
# Заполнение разными значениями
fill_dict = {
'age': df['age'].mean(), # Средним значением
'salary': df['salary'].median(), # Медианой
'city': 'Unknown' # Константой
}
df_filled = df.fillna(fill_dict)
print(df_filled)
Задание
Проанализируйте датасет супергероев, считав его из прикрепленного файла
Напишите программу, который ищет и обрабатывает пропуски.
- Заполните пропуски в
power и intelligence средними значениями
- Заполните пропуски в
costume_cost медианным значением
- Заполните пропуски в
first_appearance значением 1950
- Для текстовых полей (
name, alias, universe) заполните пропуски строкой Unknown
Выведите обработанный датасет на экран, используя
print(df)