Qualificador Lattes : uma ferramenta para a padronização de dados utilizando junção por similaridade textual / Lattes Qualifier: a tool for data standardization using textual similarity join
AUTOR(ES)
Munaretti, Rafael Barni
DATA DE PUBLICAÇÃO
2009
RESUMO
Este trabalho apresenta um estudo e uma aplicação de técnicas de integração de dados textuais utilizando junção por similaridade no escopo de currículos acadêmicos da Plataforma Lattes. Duas técnicas são analisadas: junção por similaridade aproximada baseada em amostragem, executada em um SGBDR; e junção por similaridade exata, executada em memória. A superioridade da segunda técnica para o domínio considerado, demonstrada através de experimentos, leva à sua utilização no sistema Qualificador Lattes. Essa aplicação, apresentada em detalhes, consiste em uma ferramenta com interface web para realizar a padronização da documentação de produção científica de pesquisadores de forma tão automática quanto possível. Os resultados obtidos com a associação de participações em eventos e periódicos científicos contidas em currículos Lattes com as bases de dados oficiais da CAPES são discutidos e avaliados como satisfatórios.
ASSUNTO(S)
information integration informática similarity join similarity metrics
ACESSO AO ARTIGO
http://hdl.handle.net/10183/17242Documentos Relacionados
- Avaliação experimental de uma técnica de padronização de escores de similaridade
- Uma ferramenta para monitoramento do sistema JoiN de processamento maciçamente paralelo virtual
- Visualization of join operations in DBMS for data mining.
- Uso da CIF em fisioterapia: uma ferramenta para a obtenção de dados sobre funcionalidade
- Tratamento de condições especiais para busca por similaridade em bancos de dados complexos