Score
(оценка, балл) — это числовой показатель качества выравнивания двух биологических последовательностей (например, ДНК, РНК или белков). Он показывает, насколько хорошо одна последовательность соответствует другой после выполнения алгоритма выравнивания.
Как вычисляется score
:
Score
зависит от параметров алгоритма, задающих баллы за следующие действия:
-
Совпадения (matches):
При совпадении двух символов добавляется положительный балл.
Например: A
vs A
→ +1.
-
Несовпадения (mismatches):
При несовпадении двух символов вычитается определённое количество баллов.
Например: A
vs G
→ −1.
-
Гэпы (gaps):
Если добавляются пропуски (вставки или удаления), за это начисляется штраф.
- Штраф за открытие гэпа (gap opening): больший штраф за начало гэпа.
- Штраф за продолжение гэпа (gap extension): меньший штраф за продолжение гэпа.
Пример расчёта score
:
Входные последовательности:
Seq1: GATTACA
Seq2: GCATGCU
Выравнивание:
G-ATTACA
| || | |
GCAT-GCU
Параметры:
- Совпадение: +1
- Несовпадение: −1
- Гэп (открытие): −2
- Гэп (продолжение): −1
Расчёт:
- Совпадения: G,T,C,A= +4×+1=+4
- Несовпадения: A≠C,T≠A, A≠G, A≠U → 4×−1=−4
- Гэпы: Один гэп длиной 1 → −2
Общий score
:
+4 - 4 - 2 = -2
Почему score
важен?
-
Показатель качества выравнивания:
Чем выше значение score
, тем лучше одна последовательность совпадает с другой.
-
Сравнение нескольких выравниваний:
Алгоритм может найти несколько возможных вариантов выравнивания, и score
помогает выбрать оптимальный.
-
Оценка биологической значимости:
Высокий score
указывает на более вероятное биологическое сходство между последовательностями (например, гомологию или функциональное сходство).