Я выбрал датасет по потреблению алкогольных напиток в россии по областям и по годам. Колонками являются разные алкогольные напитки(ром, вино, пиво и.т.д.) тип данных-float
"Year" - год (2017-2023)
"Region" - название субъекта федерации России
"Wine" - потребление вина в литрах в год на душу населения
"Beer" - потребление пива в литрах в год на душу населения
"Vodka" - потребление водки в литрах в год на душу населения
"Sparkling wine" - потребление игристого вина в литрах в год на душу населения
"Brandy" - потребление бренди в литрах в год на душу населения
"Сider" - потребление сидра в литрах в год на душу населения
"Liqueurs" - потребление ликеров в литрах по годам на душу населения
"Total alcohol consumption (in liters of pure alcohol per capita)" -
Общее потребление алкоголя в литрах чистого спирта по годам на душу населения
Среднее значение — это сумма всех элементов, разделенная на их количество.
- Дисперсия — это сумма квадратов разностей между каждым значением и средним значением, деленная на количество значений.
- Медиана — необходимо отсортировать массив элементов и выбрать значение, находящееся в середине, при этом округляя вниз, если длина массива нечетная.
- Мода — необходимо создать словарь, где ключами будут уникальные значения из набора данных, а значениями — количество их повторений; затем следует выбрать ключ с наибольшим значением.
- Стандартное отклонение — это квадратный корень из дисперсии.