Статья Автор: Логинова Софья

summative

Задание по использованию Hepatitis C Prediction Dataset
Курилина Софья
Контекст:
Набор данных содержит лабораторные показатели доноров крови и пациентов с гепатитом С, а также демографические показатели, такие как возраст. Данные были получены из хранилища машинного обучения UCI: https://archive.ics.uci.edu/ml/datasets/HCV+data
Содержание:
Все атрибуты, за исключением категории и пола, являются числовыми.
Атрибуты с 1 по 4 относятся к данным пациента:
1) X (Идентификатор пациента/номер).
2) Категория (диагноз) (значения: "0=Донор крови", "0s=подозреваемый донор крови", "1= Гепатит", "2= Фиброз", "3=цирроз печени")
3) Возраст (в годах)
4) Пол (f,m)
Признаки с 5 по 14 относятся к лабораторным данным:
5) ALB (Albumin Blood Test)
6) ALP (Alkaline phosphatase)
7) ALT (Alanine Transaminase)
8) AST (Aspartate Transaminase)
9) BIL (Bilirubin)
10) CHE (Acetylcholinesterase)
11) CHOL (Cholesterol)
12) CREA (Creatinine)
13) GGT (Gamma-glutamyltransferase)
14) PROT (Prothrombin)
Целевой признак для классификации - категория (2): доноры крови по сравнению с пациентами с гепатитом С, включая его прогрессирование ("просто" гепатит С, фиброз, цирроз печени).
Задача: Проанализируйте файл «Hepatitis C Prediction Dataset» с использованием библиотеки Pandas и Matplotlib:
  1. Создайте диаграмму категории пациентов среди женщин и отдельно среди мужчин. Данная диаграмма поможет вывести статистику, какой диагноз встречается чаще у женщин, а какой – у мужчин.
  2. Создайте диаграмму с лабораторными данными для каждого диагноза, а именно:
  • Статистика лабораторных данных у пациентов индекса 0 (доноры)
  • Статистика лабораторных данных у пациентов индекса 1 (гепатит)
  • Статистика лабораторных данных у пациентов индекса 2 (фиброз)
  • Статистика лабораторных данных у пациентов индекса 3 (цирроз печени)
Это поможет выявить зависимость наличия определенных веществ в крови и диагноза пациента.
  1. Выявите наиболее частый встречаемый возраст в исследовании, построив график в виде столбцов, где каждый столбец соответствует возрасту пациентов и количеству пациентов с этим возрастом.


 






Прикрепленные файлы
HepatitisCdataFixed.csv
Пропустить Навигационные Ссылки.
Чтобы оставить комментарий нужна авторизация
Печать