Desambiguação do item lexical corretp através de etiquetadores semânticos: uma abordagem baseada em corpus

AUTOR(ES)
DATA DE PUBLICAÇÃO

2007

RESUMO

Esta pesquisa tem como objetivo investigar os possíveis sentidos do item lexical correto em um corpus de português escrito. Espera-se utilizar os resultados como subsídio para fundamentar lingüisticamente um sistema capacitado a realizar a desambiguação deste item lexical. A análise do contexto imediato das ocorrências do item lexical no corpus é vista como a fonte fundamental de informações lingüísticas tendo em vista a mencionada desambiguação. O material utilizado no presente trabalho foi coletado do corpus NILC (Núcleo Institucional de Lingüística Computacional), e a análise foi feita através do programa WordSmith (Scott, 1995), um software para a análise de corpora. O estudo deve ser visto como uma contribuição inicial para a definição de uma metodologia de análise de itens lexicais de polissemia complexa que venha a servir de base para investigações semelhantes, uma vez que os diferentes sentidos encontrados podem ser transformados em um conjunto de etiquetas para uso em um etiquetador semântico dentro de um sistema que utiliza tecnologia de análise lingüística.

ASSUNTO(S)

semântica linguistica polissemia linguística

Documentos Relacionados