Олимпиадный тренинг

Задача . Предсказание вероятностей


Задача

Темы:

Логистическая регрессия предсказывает не просто класс (0 или 1), а вероятность принадлежности к классу 1 с помощью метода predict_proba(). По умолчанию порог принятия решения = 0.5: если вероятность ≥ 0.5, то класс 1, иначе класс 0. Но мы можем изменить этот порог!

Например, если важно найти как можно больше популярных треков (высокий recall), можно снизить порог до 0.3. Тогда модель будет чаще предсказывать класс 1.


Задание 

Работайте в новом ноутбуке! Для упрощения работы сделайте копию уже созданного.
Немного изменим параметры модели и попробуем определить вероятность принадлежности к классу 1.
  1. Выделите признаки и целевой столбец.

  2. Выполните масштабирование признаков с помощью StandardScaler.

  3. Разделите данные на обучение и тест (25% тест).

  4. Обучите модель логистической регрессии с параметрами:
    solver='saga', penalty='l2', max_iter=10000, random_state=42.

  5. Используйте модель для получения вероятностей класса 1 на тестовой выборке с помощью predict_proba().

  6. Создайте CSV-файл с двумя столбцами:

    • id — индекс тестового объекта (начиная с 0)

    • probability — вероятность класса 1

  7. Загрузите файл для проверки.


Формат CSV файла (пример)

id probability
0 0.8723
1 0.0567
2 0.4312
.. ...

time 1000 ms
memory 256 Mb
Правила оформления программ и список ошибок при автоматической проверке задач

Статистика успешных решений по компиляторам
Комментарий учителя