Статья Автор: Деникина Н.В., Деникин А.В.

Логистическая регрессия. Предсказание популярности музыкальных треков

Вы — data scientist в музыкальной компании! Ваша задача — понять, станет ли новая песня хитом, ещё до её релиза. У вас есть реальный датасет из Spotify с характеристиками тысяч песен.

Сможете ли вы создать модель, которая предскажет, попадёт ли трек в топ? 🔥

Описание датасета

В датасете есть интересные музыкальные характеристики:

  • danceability — танцевальность (0.0-1.0) — насколько под это можно двигаться
  • energy — энергичность (0.0-1.0) — насколько трек агрессивный и быстрый
  • loudness — громкость (в децибелах, обычно от -60 до 0)
  • speechiness — разговорность (0.0-1.0) — сколько в треке слов (рэп будет высоким)
  • acousticness — акустичность (0.0-1.0) — есть ли живые инструменты
  • instrumentalness — инструментальность (0.0-1.0) — есть ли вокал (чем выше, тем меньше слов)
  • liveness — живость (0.0-1.0) — записано ли вживую с публикой
  • valence — позитивность (0.0-1.0) — насколько трек весёлый (грустный vs радостный)
  • tempo — темп (удары в минуту, обычно 50-200)
  • duration_ms — длительность в миллисекундах
  • target — хит (1) или нет (0)



Все упражнения данного модуля работают с одним и тем же датасетом, который вы можете скачать здесь.

Печать