Статья Автор: Деникина Н.В., Деникин А.В.

Три главных метода работы с моделью. Метод 1: .fit() - Обучение модели

Метод 1: `.fit()` - Обучение модели

model.fit(X, y) - "обучи модель на этих данных"

Что происходит внутри .fit():

ШАГ 1: Получает данные X (признаки) и y (целевые значения)
ШАГ 2: Ищет ЛУЧШИЕ коэффициенты k и b чтобы линия максимально близко проходила к точкам
ШАГ 3: Сохраняет найденные k и b внутри модели
ШАГ 4: Возвращает саму себя (model)
Результат: Модель теперь "знает", как предсказывать!

Пример

import numpy as np
from sklearn.linear_model import LinearRegression

# Наши данные
X = np.array([[1], [2], [3], [4], [5]])  # Признаки (дни)
y = np.array([2, 4, 5, 4, 6])            # Целевая переменная (температура)

print("=" * 60)
print("ОБУЧЕНИЕ МОДЕЛИ")
print("=" * 60)

# Создаём модель
model = LinearRegression()
print("\n1. Модель создана")
print(f"Обучена? {hasattr(model, 'coef_') and model.coef_ is not None}")
print("Нет! Коэффициентов ещё нет")

# ОБУЧАЕМ модель
print("\n2. Вызываем model.fit(X, y)...")
print("Модель ищет лучшие k и b...")

model.fit(X, y)  # ← ВОТ ТУТ ПРОИСХОДИТ МАГИЯ!

print("Готово!")

# Смотрим, что модель нашла
print("\n3. Модель нашла параметры:")
print(f"k (наклон) = {model.coef_[0]:.3f}")
print(f"b (сдвиг)  = {model.intercept_:.3f}")
print(f"\n   Уравнение: y = {model.coef_[0]:.3f} × x + {model.intercept_:.3f}")

print("\n4. Теперь модель обучена и готова к предсказаниям!")

Важные детали про `.fit()`:

#  Почему X в двойных квадратных скобках?
X = [[1], [2], [3]]  # Правильно ✅
X = [1, 2, 3]        # Неправильно ❌

# Объяснение:
X должен быть 2D-массивом (таблицей):
Каждая строка = один объект (день)
Каждый столбец = один признак (температура, влажность и т.д.)

Даже если признак один, нужна 'таблица' с одним столбцом:
[[1]
 [2]
 [3]]

  ↑
  Один столбец,
  но это 2D-массив!

После обучения модели доступны:

1. `model.coef_` - коэффициенты (k)

# Для одного признака:
print(model.coef_[0])  # → 2.5

# Для нескольких признаков:
print(model.coef_)     # → [2.5, 1.3, -0.8]

Что это:

Наклон прямой для каждого признака
Показывает, насколько сильно Y меняется при изменении X
Положительный = при росте X растёт Y
Отрицательный = при росте X уменьшается Y

Пример:

# продажи = 2.5 × температура + 1.3 × выходной - 0.8 × дождь + 10
# coef_ = [2.5, 1.3, -0.8]

2. `model.intercept_` - свободный член (b)

print(model.intercept_)  # → 10.0

Что это:

"Стартовая точка" на графике
Значение Y когда все X = 0
Сдвиг линии по вертикали

3. Пример полного уравнения

print(f"Уравнение: y = {model.coef_[0]:.2f}x + {model.intercept_:.2f}")
# → y = 2.50x + 10.00

Пример

# После model.fit():

print("Коэффициент k:", model.coef_[0])    # → 2.17
print("Свободный член b:", model.intercept_) # → 15.83

# Уравнение: продажи = 2.17 × температура + 15.83

Интерпретация:

При повышении температуры на 1°C продажи растут на 2.17 штук
При температуре 0°C продали бы 15.83 мороженых

coef_ - всегда массив (даже для одного признака)
intercept_ - всегда одно число
Порядок коэффициентов соответствует порядку признаков в X

Формула (для множественной регрессии) :
y = coef_[0]×x₁ + coef_[1]×x₂ + ... + intercept_

Подробнее об этом расскажем немного позже

Печать

Три главных метода работы с моделью. Метод 1: .fit() - Обучение модели

Метод 1: .fit() - Обучение модели

Пример

Важные детали про .fit():

После обучения модели доступны:

1. model.coef_ - коэффициенты (k)

2. model.intercept_ - свободный член (b)

3. Пример полного уравнения

Пример

Метод 1: `.fit()` - Обучение модели

Важные детали про `.fit()`:

1. `model.coef_` - коэффициенты (k)

2. `model.intercept_` - свободный член (b)