Откройте Jupyter Notebook. Загрузите датасет.
Пройдите весь пайплайн от загрузки данных до обученной модели.
- Загрузите датасет из файла
dataset-of-10s.csv
- Выведите общее количество строк в датасете
- Выведите количество популярных треков (target=1)
- Выведите количество непопулярных треков (target=0)
- Удалите текстовые колонки: 'track', 'artist', 'uri'
- Создайте матрицу признаков X (все колонки кроме 'target') и вектор y (колонка 'target')
- Разделите данные на train/test с параметрами: test_size=0.2, random_state=42
- Создайте модель LogisticRegression с параметрами: max_iter=1000, random_state=42
- Обучите модель на обучающей выборке
- Сделайте предсказания на тестовой выборке
В следующих шагах вам нужно будет ответить на несколько вопросов. Для нахождения ответа на каждый вопрос необходимо написать код в ноутбуке и ввести свой ответ в задание.