Статья Автор: Деникина Н.В., Деникин А.В.

Три главных метода работы с моделью. Метод 1: .fit() - Обучение модели

Метод 1: .fit() - Обучение модели

model.fit(X, y) - "обучи модель на этих данных"

Что происходит внутри .fit():

ШАГ 1: Получает данные X (признаки) и y (целевые значения)
ШАГ 2: Ищет ЛУЧШИЕ коэффициенты k и b чтобы линия максимально близко проходила к точкам
ШАГ 3: Сохраняет найденные k и b внутри модели
ШАГ 4: Возвращает саму себя (model)
Результат: Модель теперь "знает", как предсказывать!

Пример


Важные детали про .fit():

#  Почему X в двойных квадратных скобках?
X = [[1], [2], [3]]  # Правильно ✅
X = [1, 2, 3]        # Неправильно ❌

# Объяснение:
X должен быть 2D-массивом (таблицей):
Каждая строка = один объект (день)
Каждый столбец = один признак (температура, влажность и т.д.)

Даже если признак один, нужна 'таблица' с одним столбцом:
[[1]
 [2]
 [3]]

  ↑
  Один столбец,
  но это 2D-массив!

После обучения модели доступны:

1. model.coef_ - коэффициенты (k)

# Для одного признака:
print(model.coef_[0])  # → 2.5

# Для нескольких признаков:
print(model.coef_)     # → [2.5, 1.3, -0.8]

Что это:

  • Наклон прямой для каждого признака

  • Показывает, насколько сильно Y меняется при изменении X

  • Положительный = при росте X растёт Y

  • Отрицательный = при росте X уменьшается Y

Пример:

# продажи = 2.5 × температура + 1.3 × выходной - 0.8 × дождь + 10
# coef_ = [2.5, 1.3, -0.8]

2. model.intercept_ - свободный член (b)

print(model.intercept_)  # → 10.0

Что это:

  • "Стартовая точка" на графике

  • Значение Y когда все X = 0

  • Сдвиг линии по вертикали


3. Пример полного уравнения

print(f"Уравнение: y = {model.coef_[0]:.2f}x + {model.intercept_:.2f}")
# → y = 2.50x + 10.00

Пример
# После model.fit():

print("Коэффициент k:", model.coef_[0])    # → 2.17
print("Свободный член b:", model.intercept_) # → 15.83

# Уравнение: продажи = 2.17 × температура + 15.83

Интерпретация:

  • При повышении температуры на 1°C продажи растут на 2.17 штук

  • При температуре 0°C продали бы 15.83 мороженых


  • coef_ - всегда массив (даже для одного признака)

  • intercept_ - всегда одно число

  • Порядок коэффициентов соответствует порядку признаков в X


Формула (для множественной регрессии) :
y = coef_[0]×x₁ + coef_[1]×x₂ + ... + intercept_

Подробнее об этом расскажем немного позже

Печать