В процессе трансляции последовательность ДНК сначала транскрибируется в РНК, а затем транслируется в белок. Белки кодируются участками между старт-кодоном (
ATG
) и ближайшим стоп-кодоном (
TAA
,
TAG
,
TGA
). Длина белка измеряется количеством аминокислотных остатков, где каждые три нуклеотида (триплет) кодируют одну аминокислоту.
Надо написать программу, которая:
- Найти все белковые последовательности в заданной цепочке ДНК.
- Подсчитать длину каждой белковой последовательности (в аминокислотах).
- Вывести все найденные белки и их длины.
Длина белка в аминокислотах - это количество триплетов между старт- и стоп-кодонами.
Примеры
№ | Входные данные | Выходные данные |
1
|
ATGAAATGACCTAAATGCCCTAGATGTAA
|
AAA CCC
1 1
|