Олимпиадный тренинг

Задача . *Кластеризация звёзд: энтропия распределения цветов и размеров


Задача

Темы:

Фрагмент звёздного неба спроецирован на плоскость. Учёный решил провести кластеризацию точек: разбить их на \(N\) непересекающихся непустых подмножеств так, чтобы точки каждого подмножества лежали внутри прямоугольника со сторонами длиной \(H\) и \(W\), причём прямоугольники между собой не пересекаются. Стороны прямоугольников не обязательно параллельны координатным осям.

Гарантируется, что такое разбиение существует и единственно для заданных размеров прямоугольников.

Для каждой планеты дана характеристика: тип цвета, тип светимости и её размер в соответствии с таблицей.

Обозначение Цвет
G белый
J зелёный
L синий
N оранжевый
Y красный
S голубой
Z жёлтый
Обозначение Размер
I бланкет
II карлик
III гигант
IV сверхгигант
V мега-гигант
VI супер-гигант
VII пухляк

Полученные значения записаны в характеристике слитно: обозначение цвета, светимость (обозначается арабской цифрой) и размер планеты.

Будем называть центром кластера точку этого кластера, сумма расстояний от которой до всех остальных точек кластера минимальна. Для каждого кластера гарантируется единственность его центра. Расстояние между двумя точками на плоскости \(A(x_1,y_1)\) и \(B(x_2,y_2)\) вычисляется по формуле \(d=\sqrt{(x_2-x_1)^2+(y_2-y_1)^2}\).

В файле А хранятся данные о звёздах двух кластеров, где \(H=6{,}5\) и \(W=4{,}5\) для каждого кластера. В каждой строке записана информация о расположении на карте одной звезды: сначала координата \(x\), затем координата \(y\), а затем характеристика звезды. Значения даны в условных единицах. Известно, что количество точек не превышает 1100.

В файле Б хранятся данные о звёздах трёх кластеров, где \(H=6{,}5\) и \(W=5\) для каждого кластера. Известно, что количество точек не превышает 10 000. Структура хранения информации о звёздах в файле Б аналогична файлу А.

Для файла А определите координаты центра каждого кластера, затем найдите два числа: \(A_1\) — энтропию (в битах, \(\log_2\)) распределения звёзд по цветам в кластере с наибольшим числом точек; и \(A_2\) — энтропию распределения звёзд по размерам в том же кластере. Формула энтропии: \(H = -\sum_{i} p_i \log_2 p_i\), где \(p_i\) — доля звёзд \(i\)-го типа.

Для файла Б определите координаты центра каждого кластера, затем найдите два числа: \(B_1\) — максимальную энтропию распределения звёзд по цветам среди трёх кластеров; и \(B_2\) — расстояние между центрами двух кластеров, имеющих соответственно максимальную и минимальную энтропию распределения звёзд по размерам.

В ответе запишите четыре числа: в первой строке целую часть абсолютного значения произведения \(A_1 \times 10\,000\), затем через пробел целую часть абсолютного значения произведения \(A_2 \times 10\,000\), во второй строке — аналогично — для \(B_1\) и \(B_2\).


time 3000 ms
memory 256 Mb
Правила оформления программ и список ошибок при автоматической проверке задач

Статистика успешных решений по компиляторам
Комментарий учителя