AULA 06 - Busca avançada com BLAST

  1. Criar uma sequência de proteína artificial que consista em RBP4 humana seguida pelo domínio C2 da proteína humana quinase Cα. Digite esta sequência combinada em um PSI-BLAST ou Pesquisa DELTA-BLAST. Em geral, vários domínios são sempre detectados por esses programas? Há alguma proteína que possui esses dois domínios naturalmente?

  2. O objetivo deste problema é comparar o BLASTP com DELTA-BLAST. O parasita causador da malária Plasmodium vivax tem uma família multigênica chamada vir que é específica deste organismo (del Portillo et al., 2001 | Nature 410:839–842. PMID: 11298455). Existem 600–1000 cópias desses genes, e eles podem ter um papel na infecção crônica por variação antigênica. Selecione vir 1 e execute uma pesquisa BLASTP do banco de dados não redundante de proteínas (restringindo a espécie ao Plasmodium vivax). Em seguida, execute uma pesquisa DELTA-BLAST com o mesmo query. Para cada pesquisa, aproximadamente quantas proteínas têm um valor de E menor que 1 × 10-10?

  3. Existem globinas em fungos? Execute uma pesquisa no PSI-BLAST usando β-globina humana (NP_000509) como query, restringindo a saída a sequências de fungos (taxid: 4751) no banco de dados nr. Qual é o intervalo aproximado de comprimentos de proteínas de fungos com domínios de globina? Quais domínios não globina estão frequentemente presentes nas globinas de fungos? A presença desses domínios não relacionados leva à corrupção? Por que sim ou por que não? Na primeira iteração existem vários hits (com valores de E abaixo do limite de 0,005). Depois de mais diversas iterações existem muitas dezenas de hits, incluindo flavohemoproteínas que incluem um domínio de globina. Essas proteínas de fungos têm domínios da globina que estão mais relacionados a ortólogos bacterianos do que de vertebrados. A maioria das flavohemoproteínas de fungos são bastante longas (mais de 400 aminoácidos e às vezes cerca de 1000 aminoácidos de comprimento), tendo múltiplos domínios. No entanto, apenas o domínio de globina é usado para continuar as iterações do PSI-BLAST.

  4. Realize buscas no HMMER. Primeiro faça dois diferentes HMMs. Você pode obter conjuntos de globina de vertebrados e bactérias/fungos/vertebrados de documentos A e B. Os vários alinhamentos que usamos como entrada para HMMER estão nesses documentos.

    Quando o perfil HMM é construído a partir de um alinhamento de múltiplas sequências de globinas α e β de vertebrados e usado para pesquisar o banco de dados RefSeq humano existem muitos matches no banco de dados, incluindo mioglobina (que não conseguimos detectar com BLASTP). Em contraste, quando um alinhamento de globinas de bactérias e de fungos são usadas para gerar um perfil HMM, o output consiste em um resultado com um valor esperado não significativo. Combinando várias globinas humanas com globinas de bactérias e globinas de fungos em um alinhamento de múltiplas sequências resulta na criação de um HMM que detecta prontamente as globinas humanas. O perfil HMM é, portanto, um modelo que é sensível para a escolha de sequências que são usadas como input para o alinhamento de múltiplas sequências.

    Os resultados completos de pesquisas no HMMER para globinas são: (1) vertebrados, (2) bactérias e fungos, e (3) bactérias, fungos e vertebrados. O match com mioglobina humana teve uma pontuação (score) mais alta e menor valor de E na pesquisa (3) do que na pesquisa (1). Estas buscas foram executadas localmente contra todas as proteínas RefSeq humanas.

  5. Anteriormente executamos uma série de pesquisas por BLAST usando HIV-1 Pol (NP_057849) como query. Execute uma pesquisa BLASTP usando esse mesmo query. Olhe para o taxonomy report para ver quais vírus correspondem a essa consulta. Em seguida, repita a pesquisa usando DELTA-BLAST. Compare este taxonomy report ao da pesquisa com BLASTP. O que você pode observar? Existe alguma sequência não viral detectada na Pesquisa com DELTA-BLAST? Você esperava encontrar alguma?

  6. Explore o PHI-BLAST usando RBP4 humana (NP_006735) como query, restringindo a saída a bactérias e o banco de dados RefSeq. Use o padrão PHI GXW[YF]X[VILMAFY]A[RKH]. Realize esta pesquisa e salve os resultados. Em seguida, repita a pesquisa usando o padrão PHI GXW[YF][EA][IVLM]. Como os resultados diferem? Selecione uma proteína que aparece como proteína bacteriana em um alinhamento de pares com a RBP4 humana usada como query; Quais são os valores de E e por que eles diferem?

LINKS:

Servidor que oferece PSI-BLAST além do NCBI

Fonte

URL

EBI-EMBL

http://www.ebi.ac.uk/Tools/sss/psiblast/


Sítios de BLAST e FASTA para organismos determinados

Estes sítios fornecem acesso a bancos de dados com sequências que não estão disponíveis para pesquisas padrão no BLAST do NCBI. Alguns usam o algoritmo  WU BLAST 2.0

Organismo


Descrição

URL

Bactérias


Cyanobase (Cyanobacteria)

http://bacteria.kazusa.or.jp/cyano/

Streptomyces coelicolor


Instituto Sanger do Wellcome Trust

http://www.sanger.ac.uk/Projects/S_coelicolor/

Dictyostelium discoideum


Dicty blast

http://dictybase.org/tools/blast

 


Projeto Genoma de D. discoideum

http://dictybase.org

Fungos


 

 

Schizosaccharomyces pombe


Instituto Sanger do Wellcome Trust

http://www.sanger.ac.uk/Projects/S_pombe/

Aspergillus fumigatus


Instituto Sanger do Wellcome Trust

http://www.sanger.ac.uk/Projects/A_fumigatus/

Candida albicans


Instituto Sanger do Wellcome Trust

http://www.sanger.ac.uk/cgi-bin/blast/submitblast/c_albicans

Neurospora crassa


Instituto Whitehead

http://www.broad.mit.edu/annotation/genome/neurospora/Blast.html

Pneumocystis carinii


Instituto Sanger do Wellcome Trust

http://www.sanger.ac.uk/Projects/P_carinii/

Saccharomyces cerevisiae


MIPS

http://www.yeastgenome.org/help/analyze/blast

Phanerochaete chrysosporium


MycoCosm

http://genome.jgi-psf.org/cgi-bin/runAlignment?db=Phchr1&advanced=1

Insetos


 

 

Drosophila melanogaster


FlyBLAST

http://flybase.net/blast/

Mosquito


BLAST do VectorBase (https://www.vectorbase.org/blast)

http://www.broad.mit.edu/cgi-bin/annotation/disease_vector/aedes_aegypti/blast_page.cgi

Genomas de micróbios


 

 

Vários


Permite BLAST de genomas completos e incompletos

http://www.ncbi.nlm.nih.gov/sutils/genom_table.cgi

 


Permite BLAST de genomas completos e incompletos

http://www.jcvi.org/cms/home/

 


Dúzias de procuras organismo-específicas por BLAST

http://www.sanger.ac.uk/Projects/Microbes/

Parasitas


 

 

 


No Instituto Oswaldo Cruz

http://www.dbbm.fiocruz.br/genome/parasite-genome/parasite_blast_server.html

Phytophthora


Um patógeno de planta estudado em ENSEMBL Protists

http://protists.ensembl.org/Phytophthora_infestans/Tools/Blast?db=core

Plantas: Arabidopsis thaliana


‘Thale cress’

http://www.arabidopsis.org/wublast/index2.jsp

Protozoários


 

 

Babesia bovis


Instituto Sanger no Wellcome Trust

http://www.sanger.ac.uk/cgi-bin/blast/submitblast/b_bovis

Giardia lamblia


GiardiaDB

http://giardiadb.org/giardiadb/showQuestion.do?questionFullName=UniversalQuestions.UnifiedBlast

Plasmodium chabaudi


Instituto Sanger no Wellcome Trust

http://www.sanger.ac.uk/cgi-bin/blast/submitblast/p_chabaudi

Plasmodium falciparum


Este é o organismo que causa a malária

http://plasmodb.org/plasmo/showQuestion.do?questionFullName=UniversalQuestions.UnifiedBlast

 


Plasmodium genome resource

http://www.plasmodb.org/plasmo/home.jsp

 


Instituto Sanger no Wellcome Trust

http://www.sanger.ac.uk/cgi-bin/blast/submitblast/p_falciparum

Strongylocentrotus     purpuratus


BLAST de ouriço-do-mar (NãO é  UM PROTOZOáRIO!!!) é um Equinodermo

http://sugp.caltech.edu/blast/blast.php

Vários organismos


BLAST do J. Craig Venter Institute

http://www.jcvi.org/cms/home/

 


Servidor de BLAST do Instituto Sanger no Wellcome Trust

http://www.sanger.ac.uk/DataSearch/blast.shtml

 


Servidor de BLAST oral

http://brop.org/

Cordados


 

 

Ciona intestinalis


Ascídia

http://genome.jgi-psf.org/cgi-bin/runAlignment?db=Cioin2&advanced=1

Danio rerio


Paulistinha (zebra-fish) no Instituto Sanger do Wellcome Trust

http://www.sanger.ac.uk/Projects/D_rerio/

Fugu rubripes


Baiacu japonês genoma ENSEMBL

http://www.ensembl.org/Takifugu_rubripes/Tools/Blast?db=core

Gallus gallus


No NCBI

http://www.ncbi.nlm.nih.gov/genome/seq/BlastGen/BlastGen.cgi?taxid=9031

Homo sapiens


BLAST genoma Humano ENSEMBL

http://www.ensembl.org/Homo_sapiens/Tools/Blast?db=core

 


Sítio inicial do genoma humano

http://www.ensembl.org/Homo_sapiens/Info/Index

Mus musculus


BLAST no NCBI

http://www.ncbi.nlm.nih.gov/genome/seq/BlastGen/BlastGen.cgi?taxid=10090

 


Ensembl

http://www.ensembl.org/Mus_musculus/Info/Index

 


Ensembl BLAST

http://www.ensembl.org/Mus_musculus/Tools/Blast?db=core

Xenopus


Contem dados tanto de X. laevis como X. tropicalis

http://www.sanger.ac.uk/cgi-bin/blast/submitblast/x_tropicalis

Nematóides


 

 

Brugia malayi


Genoma WormBase

http://www.wormbase.org/tools/blast_b lat - escolher o organismo

Caenorhabditis elegans


BLAT/BLAST no WormBase

http://www.wormbase.org/tools/blast_blat

 

Sítios para BLAST e BLAST-like de moléculas específicas 

Molécula

Descrição

URL

Imunoglobulinas

IgBLAST

http://www.ncbi.nlm.nih.gov/projects/igblast/

MS BLAST

BLAST movido por espectrometria de massas

http://genetics.bwh.harvard.edu/msblast/

proteínas

Rede de análise de proteína no Polo bioinformático de Lyon

http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_blast.html

 

Serviço de BLAST em rede do EMBnet-CH

http://kr.expasy.org/cgi-bin/BLASTEMBnet-CH.pl

 

BLAST ProDom com saída gráfica (Toulouse)

http://prodom.prabi.fr/prodom/current/html/form.php

Polimorfismos de um nucleotídeo (SNPs)

No NCBI

clique aqui

Vetores (VecScreen)

útil para detectar contaminação de vetor em sequências

http://www.ncbi.nlm.nih.gov/VecScreen/VecScreen.html

 

Algoritmos especializados de BLAST e algoritmos relacionados a BLAST disponíveis na W3

Algoritmo

Descrição

URL

PSI-BLAST

Position-specific iterated BLAST

NCBI

PHI-BLAST

Pattern-hit-initiated BLAST

NCBI

MegaBLAST

Para queries grandes

NCBI

RPS-BLAST

Ver aula 6

NCBI

NCBI BLAST2

EMBL/European Bioinformatics Institute

http://www.ebi.ac.uk/blastall/index.html

FASTA3

EMBL/European Bioinformatics Institute

http://www.ebi.ac.uk/fasta33/index.html

WU BLAST 2.0

Grupo Mendel de Bioinformática

http://brassica.bbsrc.ac.uk/BrassicaDB/blast_form.html

MSPcrunch

Usado para análise dos resultados de BLAST

http://nebc.nox.ac.uk/bioinformatics/docs/mspcrunch.html

Sim4

Programa para alinhar cDNA e DNA genômico

http://pbil.univ-lyon1.fr/members/duret/cours/inserm210604/exercise4/sim4.html

Sim4

Programa para ser baixado do grupo de Bioinformática Penn State

http://bio.cse.psu.edu/

BLAT

Instrumento tipo BLAST para alinhar cDNA e DNA genômico e outros

http://genome.ucsc.edu/cgi-bin/hgBlat