EstratÃgias para melhoria do desempenho de ferramentas comerciais de reconhecimento Ãptico de caracteres

AUTOR(ES)
DATA DE PUBLICAÇÃO

2003

RESUMO

Para avaliar a qualidade do desempenho de ferramentas comerciais de Reconhecimento Ãptico de Caracteres (OCR) à necessÃrio adquirir mÃtricas para avaliar o quanto um texto transcrito està prÃximo do texto original, uma vez que quando uma imagem sofre alteraÃÃes, por menores que sejam, estas influenciam nas transcriÃÃes dos OCRâs. Neste trabalho serà apresentada uma nova mÃtrica para avaliar transcriÃÃes de OCRâs: atravÃs da aplicaÃÃo de tÃcnicas de filtragem (brilho, contraste, resoluÃÃo, rotaÃÃo, etc.) na imagem original, para que as mudanÃas mÃnimas gerem inÃmeras imagens, as quais serÃo submetidas ao OCR e resultarÃo em textos distintos. Um algoritmo foi desenvolvido para comparar os textos gerados, analisando desde a quantidade de linhas atà a igualdade entre os caracteres. AtravÃs da anÃlise de maior freqÃÃncia entre os caracteres, este algoritmo gera um novo arquivo-texto. Com o uso desta metodologia, o arquivo gerado ficou muito prÃximo do original com um Ãndice de acerto maior que os arquivos transcritos sem o processo de filtragem

ASSUNTO(S)

ocr imagem engenharia eletrica

Documentos Relacionados