Alinhamento de sequências
De Wikipedia, a enciclopédia encyclopedia
Na bioinformática, alinhamento de sequência é uma técnica de organizar as sequências de DNA, RNA ou proteína para identificar regiões de similaridade que podem ser consequência de relações funcionais, estruturais ou evolutivas entre as sequências.[1] Esses alinhamentos são feitos por softwares cujo objetivo é maximizar o número de coincidências entre nucleotídeos ou aminoácidos nas diferentes sequências. Nucleotídeos ou aminoácidos são normalmente representadas como linhas em uma matriz.[2]
Essencialmente alinhar duas sequencias consiste na inserção de espaços (gaps) nas sequências de modo que elas fiquem do mesmo tamanho, e seja possível sobrepor-las para a comparação das bases. A partir de um alinhamento, é possível quantificar a similaridade entre duas sequências e usando um sistema de pontuação qualificar um alinhamento ótimo. Um alinhamento ótimo é aquele que melhor representa o cenário de evolução das sequências.
Abordagens computacionais para o alinhamento de sequências dividem-se, em geral, em duas categorias: alinhamentos globais e alinhamentos locais.