Статья Автор: Деникина Н.В., Деникин А.В.

Библиотека sklearn и линейная регрессия

scikit-learn - это библиотека готовых ML-моделей. Нам не нужно программировать всю математику с нуля!"


Основные компоненты: Модель как объект



LinearRegression() — это класс из библиотеки Scikit-learn, который реализует линейную регрессию.
 

Как создать модель?

# Простейший способ
model = LinearRegression()

# Или с настройками параметров
model = LinearRegression(
    fit_intercept=True,    # Вычислять ли свободный член b
    copy_X=True,           # Копировать ли данные
    n_jobs=None,           # Использовать ли несколько ядер процессора
    positive=False         # Заставлять ли коэффициенты быть положительными
)

Основные параметры:

Параметр Что делает По умолчанию Зачем менять
fit_intercept Вычислять коэффициент b True Если знаете, что линия проходит через 0 → False
copy_X Копировать входные данные True Для экономии памяти → False
n_jobs Количество ядер None Для ускорения на больших данных → -1
positive Положительные коэффициенты False Если знаете, что связь только положительная → True

Универсальный шаблон работы:

# 1. ИМПОРТ
from sklearn.linear_model import LinearRegression

# 2. СОЗДАНИЕ МОДЕЛИ
model = LinearRegression()

# 3. ОБУЧЕНИЕ (тренировка)
model.fit(X_train, y_train)

# 4. ПРЕДСКАЗАНИЕ
predictions = model.predict(X_test)

# 5. ОЦЕНКА КАЧЕСТВА
score = model.score(X_test, y_test)

Основные методы LinearRegression

Метод Что делает Пример
.fit(X, y) Обучает модель model.fit(X_train, y_train)
.predict(X) Делает предсказания y_pred = model.predict(X_test)
.score(X, y) Оценивает качество (R²) accuracy = model.score(X_test, y_test)
Печать