Модель оценивает качество прямой по ошибкам — то есть насколько сильно ее предсказания отличаются от реальных значений.
Что такое ошибка?
-
Для каждой реальной точки мы проводим вертикальную линию до предсказания на прямой
-
Длина этой линии — и есть ошибка модели для данной точки
-
Чем короче эти линии — тем лучше наша модель!
Как найти 'лучшую' прямую?
Модель не просто смотрит на ошибки, а суммирует квадраты всех ошибок. Почему квадраты? Так мы:
-
Учитываем все ошибки (и положительные, и отрицательные)
-
Сильнее 'наказываем' модель за большие ошибки
Посмотрим на примере: как выглядит 'плохая' прямая с большими ошибками и 'хорошая' прямая с маленькими ошибками.