Statistical Natural Language Processing
Mostrando 1-12 de 19 artigos, teses e dissertações.
-
1. Tradução automática estatística baseada em sintaxe e linguagens de árvores
A Tradução Automática (Machine Translation - MT) é uma das aplicações clássicas dentro do Processamento da Língua Natural (Natural Language Processing - NLP). O estado-da-arte em MT é representado por métodos estatísticos, que buscam aprender o conhecimento linguístico necessário de forma automática por meio de grandes coleções de textos (os
IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia. Publicado em: 19/06/2012
-
2. A generic and open framework for multiword expressions treatment : from acquisition to applications
The treatment of multiword expressions (MWEs), like take off, bus stop and big deal, is a challenge for NLP applications. This kind of linguistic construction is not only arbitrary but also much more frequent than one would initially guess. This thesis investigates the behaviour of MWEs across different languages, domains and construction types, proposing an
IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia. Publicado em: 2012
-
3. Leitura, tradução e medidas de complexidade textual em contos da literatura para leitores com letramento básico
This work analyzes textual complexity and readability patterns from a computational perspective, situating the problem through the description of original and translated texts, based on Translation Studies, Corpus Linguistics and Natural Language Processing theoretical postulates. We investigated the hypothesis that there are English literature translations
IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia. Publicado em: 2012
-
4. Extração de expressões multipalavra em corpora técnicos / Extraction of multiword expressions in technical domains
Expressões multipalavra (EMPs) são um dos obstáculos para a obtenção de sistemas de PLN mais precisos. Particularmente, a falta de cobertura de EMPs em recursos lexicais pode impactar negativamente na performance de tarefas e aplicações, levando a perda de informação ou erros de comunicação. Isso é especialmente problemático em domínios técnic
Publicado em: 2010
-
5. Extração de conhecimento de laudos de radiologia torácica utilizando técnicas de processamento estatístico de linguagem natural. / Knowledge extraction from reports of radiology thoracic using techniques of statistical processing of natural language.
Este trabalho promove um estudo em informática em saúde no qual se analisam laudos de radiologia torácica através de métodos de processamento estatístico de linguagem natural com o intuito de subsidiar a interoperabilidade entre sistemas de saúde. Foram utilizados 2000 laudos de radiologia do tórax para a extração de conhecimento identificando-se a
Publicado em: 2010
-
6. Um estudo sobre a Teoria da Predição aplicada à análise semântica de Linguagens Naturais. / A study on the Theory of Prediction applied to the semantical analysis of Natural Languages.
In this work, computer learning is studied as a problem of induction. Starting with the proposal of an architecture for a system of semantic analisys of Natural Languages, the two modules necessary for its construction were built and tested independently: a pre-processor, capable of mapping the contents of texts to a representation in which the semantics of
Publicado em: 2010
-
7. A methodology for mapping non-structured medical findings to the attribute-value table format / Metodologia para mapeamento de informações não estruturadas descritas em laudos médicos para uma representação atributo-valor
The information retrieval from text stored in computer-based patient records is an important open-ended research problem, as the ease in which biomedical information recorded and stored in digital form grows. Thus, means to extract structured information (for example, in the so-called attribute-value format) from free-text records is an important research en
Publicado em: 2008
-
8. Linguistically motivated filter induction in information retrieval / Indução de filtros lingüisticamente motivados na recuperação de informação
Although Information Retrieval and Filtering tasks have always used basic Natural Language Processing (NLP) techniques for supporting document structuring, there is still space for more sophisticated NLP techniques which justify their cost when compared to the traditional approaches. This research aims to investigate some evidences that justify the hypothesi
Publicado em: 2007
-
9. PrediÃÃo de palavras baseada em modelos ocultos de Markov / Word prediction based on hidden Markov models
Social inclusion search has been promoting the technology development extending people with special needs computerâs use. Amongst the innumerable auxiliary tools, words prediction is an important accelerator that diminishes the number of actions to be executed and, consequently, time and effort to do it. Word anticipation in a text being typed, called word
Publicado em: 2007
-
10. Um processo para a geração de recursos lingüísticos aplicáveis em ferramentas de auxílio à escrita científica.
Within the context of academic research, English is the lingua franca for various scientific disciplines. It is also widely acknowledged that producing an acceptable academic text is anything but a simple and easy task. This is particularly more acute if the author is a novice researcher and English is not his/her first language. One possible solution to min
Publicado em: 2007
-
11. Geração automática de metadados: uma contribuição para a Web semântica. / Automatic metadata generation: a contribution to the semantic Web.
This Thesis offers a contribution to the Semantic Web area, in the scope of the representation and indexing of documents, defining an Automatic metadata generation model based on context, starting from textual documents not structured in the Portuguese language. A wide theoretical set of subjects related to the creation of semantic digital environments is al
Publicado em: 2006
-
12. Methods for Automatic Discourse Analysis / "Métodos para análise discursiva automática"
Researches in Linguistics and Computational Linguistics have shown that a text is more than a simple sequence of juxtaposed sentences. Every text contains a highly elaborated underlying structure that relates its content, attributing coherence to the text. This structure is called discourse structure and is the object of study in the research area known as D
Publicado em: 2005