Uma metodologia para determinação do organismo de origem de sequencias de DNA com aplicação em projetos EST
AUTOR(ES)
João Paulo Piazza
DATA DE PUBLICAÇÃO
2004
RESUMO
Este trabalho apresenta uma nova metodologia para a determinação computacional do organismo de origem de seqüência de DNA, implementada na forma de um programa chamado QUEST. O QUEST é baseado em dois princípios: a extração de informações intrínsecas a cada seqüência, chamadas de características, e a extração de diferentes tipos de características e sua combinação para se chegar a melhores resultados. São utilizados 7 diferentes programas como extratores de características, alguns desenvolvidos por terceiros (Glimmer e ESTScan) e outros desenvolvidos pelo autor. As características foram combinadas utilizando vários classificadores diferentes, variando desde uma soma simples até os baseados em vetores de suporte. O QUEST requer seqüências para treinamento. Em comparação com as abordagens baseadas em similaridade, as vantagens principais da QUEST estão no fornecimento de previsões para as taxas de erro e na capacidade de lidar com seqüências sem similaridades significativas em bancos de seqüência. O QUEST foi aplicado ao problema de determinar automaticamente contaminantes em projetos EST. São apresentados resultados de experimentos simulados e de um projeto EST real (o projeto EST de Schistosoma mansoni). Nos experimentos simulados foram atingidas taxas de falsos positivos mais falsos negativos de aproximadamente 10%. No projeto de S.mansoni o QUEST sugere que a contaminação em seqüências supostamente legítimas poderia ser de pelo menos 6%. No teste com S.mansoni, o QUEST foi 10 vezes mais rápido que o tempo necessário para executar o BLASTX em todas as seqüências testadas. O QUEST tem outras aplicações, incluindo a determinação do organismo de origem na nova abordagem genômica chamada de genômica ambiental (também chamada de metagenômica).
ASSUNTO(S)
sequencia de nucleotideos - processamento de dados sistemas de recuperação da informação - sequencia de nucleotideos biologia molecular acido desoxirribonucleico
ACESSO AO ARTIGO
http://libdigi.unicamp.br/document/?code=000465190Documentos Relacionados
- Uma metodologia para determinação do organismo de origem de sequencias de DNA com aplicação em projetos EST
- Metodologia para gerenciar projetos de pesquisa e desenvolvimento com foco em produtos: uma proposta
- Desenvolvimento de uma metodologia espectrofotométrica para determinação de chumbo em sangue.
- Desenvolvimento de uma metodologia analítica com microextração líquido-líquido para determinação de agroquímicos organofosforados em água
- Metodologia para definição de sequencias de estimulação eletrica neuromuscular : aplicação a superação de pequenos obstaculos