Вы работаете ботаником и помогаете своему научному сообществу классифицировать виды цветов ирисов на основе их морфологических характеристик. Вам даны данные о длине и ширине чашелистиков и лепестков для нескольких цветов. Необходимо определить вид каждого цветка.
Ваша задача — написать программу, которая принимает данные о цветке и классифицирует его как один из трёх видов:
- Iris-setosa
- Iris-versicolor
- Iris-virginica
Входные данные
На вход подаётся CSV-файл с характеристиками цветов. Структура файла следующая:
- Колонка
Id — уникальный идентификатор цветка.
- Колонка
SepalLengthCm — длина чашелистика (в сантиметрах).
- Колонка
SepalWidthCm — ширина чашелистика (в сантиметрах).
- Колонка
PetalLengthCm — длина лепестка (в сантиметрах).
- Колонка
PetalWidthCm — ширина лепестка (в сантиметрах).
Выходные данные
Программа должна записать результат классификации в файл output.csv. Формат выходного файла:
- Колонка
Id — уникальный идентификатор цветка.
- Колонка
Species— предсказанный вид цветка (Iris-setosa, Iris-versicolor, Iris-virginica).
Пример содержимого файла output.csv:
Id,Prediction
1,Iris-setosa
2,Iris-versicolor
3,Iris-virginica
Ограничения
- Длина и ширина чашелистиков и лепестков всегда положительные числа.
- Уникальные идентификаторы
Id гарантированно не повторяются.
- Ваш алгоритм должен быть обучен заранее (например, использовать модель, сохранённую из Scikit-learn).
Примечание
Для тестирования используется фиксированный набор входных данных, и результаты проверяются на точность классификации. Ваша задача — создать предсказания для всех примеров из входного файла с минимальной ошибкой.
Последовательность действий
- Загрузите данные из файла
train.csv.
- Обработайте данные и примените обученную модель.
- Сохраните предсказания в файл с расширением
.csv.
- Загрузите файл и нажмите "Прикрепить файл".