Статья Автор: Деникина Н.В., Деникин А.В.

Баллы сравнения в алгоритмах выравнивания последовательностей

Score (оценка, балл) — это числовой показатель качества выравнивания двух биологических последовательностей (например, ДНК, РНК или белков). Он показывает, насколько хорошо одна последовательность соответствует другой после выполнения алгоритма выравнивания.


Как вычисляется score:

Score зависит от параметров алгоритма, задающих баллы за следующие действия:

  1. Совпадения (matches):
    При совпадении двух символов добавляется положительный балл.
    Например: A vs A → +1.

  2. Несовпадения (mismatches):
    При несовпадении двух символов вычитается определённое количество баллов.
    Например: A vs G → −1.

  3. Гэпы (gaps):
    Если добавляются пропуски (вставки или удаления), за это начисляется штраф.

    • Штраф за открытие гэпа (gap opening): больший штраф за начало гэпа.
    • Штраф за продолжение гэпа (gap extension): меньший штраф за продолжение гэпа.

Пример расчёта score:

Входные последовательности:

Seq1: GATTACA 
Seq2: GCATGCU 

Выравнивание:

G-ATTACA
| || | |
GCAT-GCU

Параметры:

  • Совпадение: +1
  • Несовпадение: −1
  • Гэп (открытие): −2
  • Гэп (продолжение): −1

Расчёт:

  • Совпадения: G,T,C,A= +4×+1=+4
  • Несовпадения: A≠C,T≠A, A≠G, A≠U → 4×−1=−4
  • Гэпы: Один гэп длиной 1 → −2

Общий score:

+4 - 4 - 2 = -2

Почему score важен?

  1. Показатель качества выравнивания:
    Чем выше значение score, тем лучше одна последовательность совпадает с другой.

  2. Сравнение нескольких выравниваний:
    Алгоритм может найти несколько возможных вариантов выравнивания, и score помогает выбрать оптимальный.

  3. Оценка биологической значимости:
    Высокий score указывает на более вероятное биологическое сходство между последовательностями (например, гомологию или функциональное сходство).

Пропустить Навигационные Ссылки.
Чтобы оставить комментарий нужна авторизация
Печать