Логистическая регрессия предсказывает не просто класс (0 или 1), а вероятность принадлежности к классу 1 с помощью метода predict_proba(). По умолчанию порог принятия решения = 0.5: если вероятность ≥ 0.5, то класс 1, иначе класс 0. Но мы можем изменить этот порог!
Например, если важно найти как можно больше популярных треков (высокий recall), можно снизить порог до 0.3. Тогда модель будет чаще предсказывать класс 1.
Задание
Работайте в новом ноутбуке! Для упрощения работы сделайте копию уже созданного.
Немного изменим параметры модели и попробуем определить вероятность принадлежности к классу 1.
-
Выделите признаки и целевой столбец.
-
Выполните масштабирование признаков с помощью StandardScaler.
-
Разделите данные на обучение и тест (25% тест).
-
Обучите модель логистической регрессии с параметрами:
solver='saga', penalty='l2', max_iter=10000, random_state=42.
-
Используйте модель для получения вероятностей класса 1 на тестовой выборке с помощью predict_proba().
-
Создайте CSV-файл с двумя столбцами:
-
Загрузите файл для проверки.
Формат CSV файла (пример)
| id |
probability |
| 0 |
0.8723 |
| 1 |
0.0567 |
| 2 |
0.4312 |
| .. |
... |