Концепция: Вспоминание - Формулирование - Прогнозирование
Луис Серрано, автор книги "Грокаем машинное обучение", предлагает представить, что компьютер — это очень старательный, но немного туповатый стажёр. Его нельзя просто попросить "принять решение". Ему нужно дать чёткий план действий.
Вот этот план из трёх шагов:
1. Вспоминание (The Remembering Step)
-
Что это? Компьютер смотрит на данные, с которыми он уже сталкивался (так называемая "обучающая выборка").
-
Что он делает? Он просто запоминает все эти примеры.
-
Проще говоря: Это как если бы вы готовились к экзамену, просто прочитав и запомнив все билеты с ответами, не пытаясь понять закономерности.
Пример:
Допустим, мы учим компьютер определять, вкусный ли рецепт. Мы даём ему 5 примеров:
-
Пицца: много сыра -> ВКУСНО
-
Суп: пересолен -> НЕВКУСНО
-
Торт: много сахара -> ВКУСНО
-
Салат: свежие овощи -> ВКУСНО
-
Каша: без соли -> НЕВКУСНО
На этапе "Вспоминания" компьютер просто заучивает эту табличку.
2. Формулирование (The Formulating Step)
-
Что это? Это самый важный и "умный" этап. Компьютер анализирует запомненные данные и пытается найти в них общую закономерность или правило.
-
Что он делает? Он "придумывает" формулу, которая лучше всего объясняет данные.
-
Проще говоря: Вместо тупого заучивания вы начинаете искать логику: "Ага, я заметил, что во всех вкусных блюдах есть либо сыр, либо сахар, либо свежие овощи. А невкусные — либо солёные, либо пресные".
Пример (продолжение):
Компьютер анализирует наши 5 рецептов и "формулирует" простое правило:
-
ПРАВИЛО: Если в блюде есть "много сыра" ИЛИ "много сахара" ИЛИ "свежие овощи", то оно, скорее всего, ВКУСНОЕ. В противном случае — НЕВКУСНОЕ.
Эта формула — и есть наша "модель".
3. Прогнозирование (The Predicting Step)
-
Что это? Применение найденного правила к новым, незнакомым данным.
-
Что он делает? Компьютер использует сформулированную формулу, чтобы сделать прогноз или принять решение.
-
Проще говоря: Вы используете выведенное правило на экзамене, чтобы ответить на новый вопрос, которого не было в билетах.
Пример (продолжение):
Нам попадается новый рецепт: "Жареная картошка с солью".
Компьютер применяет своё правило:
-
Проверяем: есть ли "много сыра"? -> НЕТ.
-
Есть ли "много сахара"? -> НЕТ.
-
Есть ли "свежие овощи"? -> Картошка — это овощ, но он жареный, а не свежий. Значит, тоже НЕТ.
ПРОГНОЗ: Поскольку ни одно из условий "вкусности" не выполняется, компьютер предсказывает: "НЕВКУСНО".
Подведем итоги
Концепция:
Вспоминание - Формулирование - Прогнозирование
-
Это каркас для ЛЮБОГО алгоритма ML. От самых простых до сложнейших нейросетей — все они, по сути, следуют этой трёхшаговой схеме.
-
Показывает разницу между зубрёжкой и пониманием. "Вспоминание" — это тупая память, а "Формулирование" — это настоящее обучение и обобщение.
-
Объясняет, почему важны данные. Без хороших данных на этапе "Вспоминания" компьютер не сможет сформулировать хорошее правило на этапе "Формулирования".