Вы работаете ботаником и помогаете своему научному сообществу классифицировать виды цветов ирисов на основе их морфологических характеристик. Вам даны данные о длине и ширине чашелистиков и лепестков для нескольких цветов. Необходимо определить вид каждого цветка.
Ваша задача — написать программу, которая принимает данные о цветке и классифицирует его как один из трёх видов:
- Iris-setosa
- Iris-versicolor
- Iris-virginica
Входные данные
На вход подаётся CSV-файл с характеристиками цветов. Структура файла следующая:
- Колонка
Id
— уникальный идентификатор цветка.
- Колонка
SepalLengthCm
— длина чашелистика (в сантиметрах).
- Колонка
SepalWidthCm
— ширина чашелистика (в сантиметрах).
- Колонка
PetalLengthCm
— длина лепестка (в сантиметрах).
- Колонка
PetalWidthCm
— ширина лепестка (в сантиметрах).
Выходные данные
Программа должна записать результат классификации в файл output.csv
. Формат выходного файла:
- Колонка
Id
— уникальный идентификатор цветка.
- Колонка
Species
— предсказанный вид цветка (Iris-setosa
, Iris-versicolor
, Iris-virginica
).
Пример содержимого файла output.csv
:
Id,Prediction
1,Iris-setosa
2,Iris-versicolor
3,Iris-virginica
Ограничения
- Длина и ширина чашелистиков и лепестков всегда положительные числа.
- Уникальные идентификаторы
Id
гарантированно не повторяются.
- Ваш алгоритм должен быть обучен заранее (например, использовать модель, сохранённую из Scikit-learn).
Примечание
Для тестирования используется фиксированный набор входных данных, и результаты проверяются на точность классификации. Ваша задача — создать предсказания для всех примеров из входного файла с минимальной ошибкой.
Последовательность действий
- Загрузите данные из файла
train.csv
.
- Обработайте данные и примените обученную модель.
- Сохраните предсказания в файл с расширением
.csv
.
- Загрузите файл и нажмите "Прикрепить файл".