Статья Автор: Шахова Соня

критерий С


Я выбрала датасет Student Depression, который анализирует ответы учеников на различные наводящие вопросы и выдает диагноз, а именно есть у них депрессия или нет. В файле 7 числовых столбиков, которые будут анализироваться.
В датасете программа будет анализировать такие числовые поля, как: age(возраст), academic pressure(академическое давление), CGPA(совокупный средний балл), study satisfaction(удовлетворенность учебой), study hours(часы учебы), financial stress(финансовый стресс), depression(депрессия). Формулы для нахождения минимального min(stress), максимального max(stress), среднего sum(stress) / n, медианы sorted_dep[n // 2] if n % 2 != 0 else (sorted_dep[n // 2 - 1] + sorted_dep[n // 2]) / 2, мода max(set(stress), дисперсия key=stress.count), стандартное отклонение variance_dep  0.5.

Медиана — это значение, которое находится в середине набора данных, упорядоченного по возрастанию. При нечётном количестве данных медиана является одним из значений набора. При чётном количестве данных медиана является средним арифметическим двух значений, расположенных в середине набора.
Мода — это значение в наборе данных, которое встречается чаще всего.
Дисперсия — это сумма квадратов разностей между всеми числами и средними значениями. 
Стандартное отклонение — это квадратный корень из дисперсии. Это показатель степени, в которой данные отличаются от среднего. 

Прикрепленные файлы
Student_Depression_Dataset[1].csv
Пропустить Навигационные Ссылки.
Чтобы оставить комментарий нужна авторизация
Печать