Раздел 1: Знакомство с данными (Basics)
Уровень: Легко. Учимся просто смотреть на таблицу.
-
Загрузка: Импортируйте pandas и прочитайте файл StudentsPerformance.csv.
-
Первый взгляд: Выведите на экран первые 10 строк таблицы.
-
Размер: Узнайте, сколько всего учеников (строк) и параметров (столбцов).
-
Типы данных: Проверьте типы данных каждого столбца.
-
Названия: Выведите список названий всех столбцов.
Раздел 2: Очистка и подготовка (Data Cleaning)
Уровень: Ниже среднего. Учимся приводить данные в порядок.
-
Пропуски: Посчитайте количество пустых ячеек для каждого столбца.
-
Дубликаты: Найдите количество полных дубликатов в таблице.
-
Переименование: Замените пробелы в названиях столбцов на нижнее подчеркивание.
-
Регистр: Сделайте значения в столбце gender строчными (маленькими буквами).
-
Замена: В столбце test preparation course замените none на not completed.
Раздел 3: Фильтрация и выборка (Filtering)
Уровень: Средний. Учимся доставать нужные куски данных.
-
Выбор столбцов: Создайте DataFrame только со столбцами gender и math_score.
-
Математики: Выведите всех учеников, набравших по математике 100 баллов.
-
Этнические группы: Покажите учеников из group A или group E.
-
Сложное условие: Найдите девушек (female), у которых балл по чтению > 90.
-
Образование родителей: Выведите учеников, чьи родители имеют степень магистра (master's degree).
Раздел 4: Расчеты и создание признаков (Feature Engineering)
Уровень: Средний+. Учимся создавать новые данные.
-
Средний балл: Найдите средний балл по школе для предмета "Writing".
-
Общий балл: Создайте столбец total_score (сумма трех предметов).
-
Среднее арифметическое: Создайте столбец average_score для каждого ученика.
-
Результат (Pass/Fail): Если балл по математике > 50, запишите True, иначе False.
-
Размах: Найдите разницу между самым высоким и низким баллом по чтению.
Раздел 5: Группировка и статистика (Aggregation)
Уровень: Выше среднего. Учимся делать выводы.
-
Счетчик: Посчитайте количество мальчиков и девочек.
-
Сравнение: Найдите средний балл по математике отдельно для мальчиков и девочек.
-
Влияние еды: Как тип обеда (lunch) влияет на средний total_score?
-
Подготовка: Найдите максимальный балл по письму среди тех, кто прошел курс и нет.
-
Образование: Сколько учеников приходится на каждый уровень образования родителей?
Раздел 6: Продвинутый анализ (Deep Dive)
Уровень: Сложно. Почти реальный проект.
-
Топ-5: Выведите данные 5 учеников с самым высоким total_score.
-
Отличники: Сколько учеников набрали > 90 по ВСЕМ предметам одновременно?
-
Зависимость: Выведите средние баллы, сгруппированные по образованию родителей.
-
Аномалии: Найдите учеников с математикой < 20, но чтением > 60.
-
Сводная таблица: Создайте таблицу: строки — "Пол", столбцы — "Курс", значения — средний average_score.