AULA 05 - Instrumento de busca por alinhamento local (BLAST)
- Neste problema, exploramos o efeito de uma consulta com uma proteína curta nos parâmetros BLASTP. Realizar uma pesquisa no BLASTP no NCBI usando a seguinte consulta de apenas 12 aminoácidos: PNLHGLFGRKTG. Os parâmetros do BLAST são ajustados automaticamente para consultas curtas. Inspecione a saída. Qual é o cutoff do valor de E? Qual é o tamanho da palavra? Qual é a matriz de pontuação? Como Essas configurações se comparam aos parâmetros padrão para proteínas maiores?
- As pesquisas de proteínas são geralmente mais informativas do que pesquisas de DNA. Realize uma pesquisa BLASTP usando RBP4 (NP_006735), restringindo a saída para Arthropoda. Em seguida, realize uma pesquisa BLASTN usando a sequência de nucleotídeos de RBP4 (NM_006744). Para esta consulta, selecione apenas nucleotídeos correspondentes à região codificadora do DNA. (Para isso visite a página do nucleotídeo do NCBI, siga o link para a sequência de codificação (CDS), em seguida, escolha o formato FASTA). Qual pesquisa é mais informativa? Quantos matches no banco de dados têm um valor de E menor que 1,0 em cada pesquisa?
- Esse problema introduz consultas em lote. É possível para fazer muitas consultas simultaneamente, usando o BLAST. Os musgos são plantas do filo Bryophyta, incluindo Physcomitrella patens que teve seu genoma sequenciado (Rensing et al., 2008; Science 319(5859), 64–69. PMID: 18079367). Os musgos têm alguma globina e, em caso afirmativo, a qual/quais da(s) globina(s) humanas(s) elas estão mais relacionadas?
- Primeiro obtenha os números de acesso de todas as globinas humanas. Existem várias abordagens para fazer isso, incluindo BLASTP usando β-globina e neuroglobina como queries.
- Realizar uma pesquisa BLASTP usando todos os números de acesso como consultas, inserindo-os na caixa de consulta. Restringir a saída às proteínas RefSeq dos musgos.
- Os resultados de cada consulta são mostrados (um de cada vez) através de um menu pull-down. Atualmente existem matches significativos com proteínas de musgo, embora distantes, para todas as globinas humanas com exceção da subunidade μ de hemoglobina. (Veja por exemplo a correspondência entre globina ε humana e a proteína predita de musgo XP_024366256.1 com um valor E de 0,01. Uma pesquisa de BLASTP com essa proteína de musgo confirma que ela é relacionada a muitas globinas anotadas de plantas.). Notavelmente, somente uma proteína humana (neuroglobina, NP_067080.1) tem matches fortes com proteínas do musgo como a proteína predita de P. patens XP_001764902.1 (valor E 2 × 10−10, 27% de identidade através de 138 resíduos de aminoácidos).
- A proteína Pol do HIV-1 está mais relacionada com a proteína Pol de HIV-2 ou com a proteína Pol do vírus da imunodeficiência de macacos (SIV)? Use o programa BLASTP para decidir. Dica: em Choose Search Set escolhas exclude hiv-1 para focalizar a busca longe das correspondências do HIV-1.