У нас есть точки. Как понять, какая линия лучше всего подходит?
Вопрос: Как измерить, насколько линия "хорошая"?
Понятие ошибки
Для каждой точки мы можем измерить расстояние от точки до линии. Это расстояние называется ошибкой.
Ключевая идея:
- Для каждой точки:
ошибка = |реальное значение - предсказание|
- Чтобы ошибки взаимно не уничтожались, возводим в квадрат
- Лучшая линия - линия, у которой сумма квадратов ошибок минимальна
Формула ошибки (MSE - Mean Squared Error):
MSE = (ошибка₁² + ошибка₂² + ... + ошибкаₙ²) / n
где ошибка = реальное_y - предсказанное_y
Далее мы визуализируем данную идею, используя библиотеку matplotlib.