As desvantagens de ocr

software OCR converte uma imagem de um documento ao texto eletrônico.

O Serviço Postal dos EUA usa a tecnologia de reconhecimento óptico de caracteres (OCR) para ler os endereços em pedaços de correio. Para o e-mail pode ser lido por um classificador de correio OCR, no entanto, os endereços e fontes precisam ser formatados de uma certa maneira. software OCR é útil para converter imagens digitalizadas de documentos digitados ou manuscritas em texto eletrônico pesquisável, mas tem desvantagens que limitam suas aplicações.

Documentos limitadas

  • OCR funciona melhor com qualidade digitado documentos boas. documentos manuscritos não podem ser facilmente lido pelo software OCR. Da mesma forma, digitado fontes que se assemelham a escrita manual - bem como fontes não-latinos - criam muitos erros durante o processo de OCR. Se o documento tiver baixo contraste, é dobrado ou sujo, ou o texto eo fundo são semelhantes na escuridão, então OCR pode não funcionar bem. OCR tem dificuldade com documentos que tenham imagens e texto. Planilhas também irá produzir mais erros.

Precisão



  • Nenhum software de OCR é 100 por cento preciso. O número de erros depende da qualidade e do tipo de documento, incluindo o tipo de letra utilizado. Os erros que ocorrem durante o OCR incluir letras leitura errada, pulando letras ilegíveis, ou misturando texto de colunas adjacentes ou legendas de imagem. Se a alta precisão é necessária - como com a conversão de livros digitais para o formato eletrônico - em seguida, uma limpeza do texto eletrônico será necessário.

Work-Arounds

  • OCR tem dificuldade em diferenciar entre os personagens, tais como o número zero e um capital "O." Para contornar isso, uma fonte especial OCR pode ser usado, como escrever a zero. No entanto, isso só funciona para os documentos criados com OCR em mente, tais como questionários. Ao criar questionários que serão escritas à mão, os pesquisadores também usar caixas para cada letra.

Trabalho adicional

  • Mesmo se a imagem digitalizada do documento original é de alta qualidade, medidas adicionais devem ocorrer para limpar o texto OCR. É muito trabalhoso para corrigir os erros criados pelo OCR. Uma pessoa tem de comparar manualmente o documento original eo texto eletrônico. As pessoas também cometem erros ao digitar texto de um documento, mas às vezes é mais rápido para pular a etapa de OCR.

De esta maneira? Compartilhar em redes sociais:

LiveInternet