AULA 05 - Instrumento de busca por alinhamento local (BLAST)

  1. Neste problema, exploramos o efeito de uma consulta com uma proteína curta nos parâmetros BLASTP. Realizar uma pesquisa no BLASTP no NCBI usando a seguinte consulta de apenas 12 aminoácidos: PNLHGLFGRKTG. Os parâmetros do BLAST são ajustados automaticamente para consultas curtas. Inspecione a saída. Qual é o cutoff do valor de E? Qual é o tamanho da palavra? Qual é a matriz de pontuação? Como Essas configurações se comparam aos parâmetros padrão para proteínas maiores?

  2. As pesquisas de proteínas são geralmente mais informativas do que pesquisas de DNA. Realize uma pesquisa BLASTP usando RBP4 (NP_006735), restringindo a saída para Arthropoda. Em seguida, realize uma pesquisa BLASTN usando a sequência de nucleotídeos de RBP4 (NM_006744). Para esta consulta, selecione apenas nucleotídeos correspondentes à região codificadora do DNA. (Para isso visite a página do nucleotídeo do NCBI, siga o link para a sequência de codificação (CDS), em seguida, escolha o formato FASTA). Qual pesquisa é mais informativa? Quantos matches no banco de dados têm um valor de E menor que 1,0 em cada pesquisa?

  3. Esse problema introduz consultas em lote. É possível para fazer muitas consultas simultaneamente, usando o BLAST. Os musgos são plantas do filo Bryophyta, incluindo Physcomitrella patens que teve seu genoma sequenciado (Rensing et al., 2008; Science 319(5859), 64–69. PMID: 18079367). Os musgos têm alguma globina e, em caso afirmativo, a qual/quais da(s) globina(s) humanas(s) elas estão mais relacionadas?
    1. Primeiro obtenha os números de acesso de todas as globinas humanas. Existem várias abordagens para fazer isso, incluindo BLASTP usando β-globina e neuroglobina como queries.
    2. Realizar uma pesquisa BLASTP usando todos os números de acesso como consultas, inserindo-os na caixa de consulta. Restringir a saída às proteínas RefSeq dos musgos.
    3. Os resultados de cada consulta são mostrados (um de cada vez) através de um menu pull-down. Atualmente existem matches significativos com proteínas de musgo, embora distantes, para todas as globinas humanas com exceção da subunidade μ de hemoglobina. (Veja por exemplo a correspondência entre globina ε humana e a proteína predita de musgo XP_024366256.1 com um valor E de 0,01. Uma pesquisa de BLASTP com essa proteína de musgo confirma que ela é relacionada a muitas globinas anotadas de plantas.). Notavelmente, somente uma proteína humana (neuroglobina, NP_067080.1) tem matches fortes com proteínas do musgo como a proteína predita de P. patens XP_001764902.1 (valor E 2 × 10−10, 27% de identidade através de 138 resíduos de aminoácidos).

  4. A proteína Pol do HIV-1 está mais relacionada com a proteína Pol de HIV-2 ou com a proteína Pol do vírus da imunodeficiência de macacos (SIV)? Use o programa BLASTP para decidir. Dica: em Choose Search Set escolhas exclude hiv-1 para focalizar a busca longe das correspondências do HIV-1.