O Serviço Postal dos EUA usa a tecnologia de reconhecimento óptico de caracteres (OCR) para ler os endereços em pedaços de correio. Para o e-mail pode ser lido por um classificador de correio OCR, no entanto, os endereços e fontes precisam ser formatados de uma certa maneira. software OCR é útil para converter imagens digitalizadas de documentos digitados ou manuscritas em texto eletrônico pesquisável, mas tem desvantagens que limitam suas aplicações.
Documentos limitadas
OCR funciona melhor com qualidade digitado documentos boas. documentos manuscritos não podem ser facilmente lido pelo software OCR. Da mesma forma, digitado fontes que se assemelham a escrita manual - bem como fontes não-latinos - criam muitos erros durante o processo de OCR. Se o documento tiver baixo contraste, é dobrado ou sujo, ou o texto eo fundo são semelhantes na escuridão, então OCR pode não funcionar bem. OCR tem dificuldade com documentos que tenham imagens e texto. Planilhas também irá produzir mais erros.
Precisão
Nenhum software de OCR é 100 por cento preciso. O número de erros depende da qualidade e do tipo de documento, incluindo o tipo de letra utilizado. Os erros que ocorrem durante o OCR incluir letras leitura errada, pulando letras ilegíveis, ou misturando texto de colunas adjacentes ou legendas de imagem. Se a alta precisão é necessária - como com a conversão de livros digitais para o formato eletrônico - em seguida, uma limpeza do texto eletrônico será necessário.
Work-Arounds
OCR tem dificuldade em diferenciar entre os personagens, tais como o número zero e um capital "O." Para contornar isso, uma fonte especial OCR pode ser usado, como escrever a zero. No entanto, isso só funciona para os documentos criados com OCR em mente, tais como questionários. Ao criar questionários que serão escritas à mão, os pesquisadores também usar caixas para cada letra.
Trabalho adicional
Mesmo se a imagem digitalizada do documento original é de alta qualidade, medidas adicionais devem ocorrer para limpar o texto OCR. É muito trabalhoso para corrigir os erros criados pelo OCR. Uma pessoa tem de comparar manualmente o documento original eo texto eletrônico. As pessoas também cometem erros ao digitar texto de um documento, mas às vezes é mais rápido para pular a etapa de OCR.