AULA 04 - Alinhamento de pares de sequências

  1. Obter as sequências das cadeias de globina alfa (HBA) e beta (HBB) humanas. Realize um alinhamento de pares no site do BLAST do NCBI (pairwise). Em seguida, use uma ferramenta de comparação no site do EBI (pairwise). Varie a matriz de pontuação (por exemplo, experimente diferentes matrizes PAM e BLOSUM) e registre os efeitos na pontuação, o número de “gaps”, a porcentagem de identidade e o comprimento da região alinhada. Para o programa NCBI BLASTP, observe que a saída de um alinhamento por pares inclui uma visualização em matriz de pontos.

  2. Realize um alinhamento de pares no site da UCSC.
    1. Vá até http://genome.ucsc.edu. Siga o “link” para o navegador de genoma, selecione a versão (build) hg19 do genoma humano e entre um query de hbb. Isso deve direcioná-lo para chr11: 5.246.696–5.248.301 (uma região de 1606 pares de bases abrangendo o gene da globina beta, HBB.
    2. Clique na caixa para definir a visualização para as trilhas padrão (default tracks).
    3. Em “Comparative Genomics”, selecione Placental Chain/Net e defina a exibição completa.Clicando no cabeçalho Placental Chain/Net você pode ver uma série de opções. Configure Chains para visão completa e Nets para visão completa. Defina as espécies para cavalo (desmarque outras espécies) .Clique enviar. O mostrador agora mostra alinhamentos humano/cavalo e redes de alinhamento.

  3. Realize o alinhamento de pares usando ferramentas do EMBOSS. Neste exercício, realizaremos o alinhamento global com o needle do pacote EMBOSS e o alinhamento local com o water do pacote EMBOSS. Ambos estão disponíveis no servidor web público do Galaxy (junto com mais de 100 outras ferramentas EMBOSS). O Box abaixo apresenta o EMBOSS e explica como importar as proteínas beta globina (HBB) e alfa-globina (HBA2) do Navegador de Tabelas usando o Galaxy e depois alinhá-las. Observe que o Galaxy é uma plataforma baseada na Web para o uso de centenas de ferramentas de bioinformática, incluindo software de análise de dados de sequência de próxima geração. Para usá-lo, acesse http://usegalaxy.org e acesse o servidor público. Certifique-se de criar um nome de usuário e fazer login. Isso permitirá que você continue seu trabalho ao longo do tempo e em diferentes estações de trabalho.

  4. Muitos programas estão disponíveis para manipular seqüências. Visite o Sequence Manipulation Suite (http://www.bioinformatics.org/sms2/index.html) para acessar um grande número de programas. (Compare seus programas com os do EMBOSS). Qual é o reverso complementar da sequência GGAATTCC?

  5. EMBOSS

    EMBOSS (European Molecular Biology Open Software Suite) é uma coleção de programas disponíveis gratuitamente para análise de sequencias de DNA, RNA ou proteína (Rice et al., 2000). Existem mais de 200 programas disponíveis em três dúzias de categorias. A home page do EMBOSS (http://emboss.sourceforge.net/) descreve os vários pacotes. Uma variedade de servidores web oferece EMBOSS, incluindo Galaxy. Você também pode visitar o site http://emboss.bioinformatics.nl/.

    Para realizar um alinhamento de sequência de pares usando o EMBOSS no Galaxy, tente as seguintes etapas:

    1. Visite o Galaxy em http://usegalaxy.org.
    2. Na barra lateral esquerda (menu Ferramentas), selecione Get data e escolha UCSC Main. Do genoma humano selecione a tabela de NCBI RefSeq, insira hbb em lookup, defina o output format para sequence e marque send output to Galaxy. Clique em get output e siga em frente para obter a sequência.
    3. Repita o passo (2) para importar a proteína HBA2. Para ambas as proteínas no Galaxy, use Edit Attributes (o ícone de lápis no painel de histórico) para renomear as sequências hbb e hba2.
    4. No painel de ferramentas, escolha EMBOSS e role para encontrar a ferramenta water para alinhamento local Smith-Waterman. Alternativamente, digite water na caixa de pesquisa Tools. Selecione as duas proteínas, use as configurações padrão e clique em Executar. O alinhamento por pares é retornado.

      Depois de inserir uma ou mais sequências no Galaxy, explore algumas das mais de 100 outras ferramentas EMBOSS!

      Rice, P., Longden, I., Bleasby, A. 2000. EMBOSS: The European molecular biology open software suite. Trends in Genetics 16:b>276–277.

      Existe uma versão do EMBOSS para Windows; veja aqui
      Introdução ao EMBOSS [PDF de 160KB]

    LINKS

    Algoritmos de alinhamento por pares

    Fonte

    Descrição

    URL

    Needle

    Do EMBL-EBI; implementa o alinhamento Global de Needleman-Wunsch (via EMBOSS)

    http://www.ebi.ac.uk/Tools/psa/emboss_needle/nucleotide.html

    Pairwise alignment (vários)

    Da Universidade de Virginia (Bill Pearson)

    http://fasta.bioch.virginia.edu/fasta_www2/fasta_list2.shtml

    Pairwise

    Instrumento de alinhamento de duas sequências (opções global e local) (necessita  JAVA)

    http://informagen.com/Applets/Pairwise/

    Stretcher

    Do Instituto Pasteur; alinhamento global (EMBOSS)

    http://www.bioinformatics.nl/cgi-bin/emboss/stretcher

     Algoritmos de alinhamento local de pares

    Fonte

    Descrição

    URL

    BLAST 2 Sequences

    No NCBI

    BLAST 2 sequences

    est 2 genome

    Do Instituto Pasteur; alinha etiquetas de sequências expressas com DNA genômico (EMBOSS)

    http://bioinfo.nhri.org.tw/cgi-bin/emboss/est2genome

    LALIGN

    Descobre sub-segmentos com “matches” múltiplos em duas sequências

    http://www.ch.embnet.org/software/LALIGN_form.html

    PRSS

     Da Universidade de Virginia (B. Pearson)

    http://fasta.bioch.virginia.edu/fasta_www2/

    SIM

    Instrumento para alinhamento de sequências de proteínas do ExPASy

    http://www.expasy.ch/tools/sim-prot.html

     

    SSEARCH

    No Protein Informaiton Resource

    http://pir.georgetown.edu/pirwww/