Далее будет приведено решение ТЗ от Матвея Черненко, в комментариях кратко описаны шаги решения и номера заданий
Для начала, Матвей сделал огромную ошибку при создании документа - он делал .xlsx, а не .csv.
Встала проблема форматирования, но с помощью replace получилось переделать в .csv.
Далее появились проблемы с интерпретацией заданий - непонятные зависимости у графиков. Договорились с Матвеем о интерпретации, которую я представил в заданиях 4.1, 4.2, 4.3.
(не наказывайте его так как всё норм получилось)
Текст задания:
Привет! Если вкратце: тебе не повезло
Предоставленный .csv файл содержит в себе файлы продокированных молекул (они пронумерованы для удобства), результаты этого докинга (численные), а также данные о группах присоединенных к карбазолу (так называется исходная молекула).
Задание:
-
С помощью read из библиотеки Pandas считайте данные из файла
-
Сделайте выборку молекул с энергией связывания выше 9,5
-
Очистите данные:
a) Разделите на три разные секции вещества с 5-, 6- и 7- членными циклами
b) В каждой из секций отметите вещества находящиеся ниже 50% процентной перцентили по энергии связывания
-
Для оставшихся данных постройте два графика:
4.1) Зависимости энергии связывания от количества NH2-групп
4.2) Зависимости влияния Met-групп на энергию связывания от и расположения
4.3) Зависимости энергии связывания от расположения NH2-групп