O que é um software de reconhecimento óptico de caracteres?

A capacidade de digitalizar um documento em forma legível por máquina é um poupador de tempo incomparável. Em vez de digitar novamente o documento e, possivelmente, a inserção de erros de sua preferência, digitalizá-lo e passar a imagem digitalizada através de um leitor de software pode resultar em um documento editável com um alto grau de precisão quando comparado com o original. Este processo é chamado de software de reconhecimento óptico de caracteres.

Reconhecimento Óptico de Caracteres

  • reconhecimento óptico de caracteres (OCR) é um processo no qual o texto impresso ou manuscrito é mecanicamente ou electronicamente lido e convertido numa forma reconhecida por um computador. O processo sofisticado vê as formas das letras e compara-os com uma biblioteca de formas semelhantes. Quando uma correspondência é feita, um personagem que representa o padrão é exibido na tela, ou inserido em um arquivo de computador. OCR torna possível para um documento a ser digitalizado e lido por um computador, criando um arquivo que pode ser editado ou postas em prática de outras formas.

Software OCR



  • O software de computador é utilizado para aplicação OCR moderno. O software tem avançado desde seus primeiros dias, em que os programas tiveram que ser calibrado para cada fonte única esperava-se a reconhecer. Ele está disponível em forma autônoma como um programa criado especificamente para a tarefa, e como um componente no software de digitalização. O advento da Internet e computação em nuvem tem levado ao desenvolvimento de programas de OCR com base na Web, eliminando a necessidade de instalações de desktop ou de servidor individuais.

O processo de reconhecimento

  • funções de software OCR por primeiro reconhecer a distinção entre as áreas claras e escuras da imagem digitalizada. Como se descobre uma distinção clara-escura, o software de procura padrões reconhecíveis, como linhas horizontais e verticais, bem como as curvas ligadas ou parciais. Se ele pode reconhecer um padrão como uma letra ou outro caractere, ele procura seu banco de dados para o personagem correspondente no conjunto de idioma do computador. Em seguida, passa este personagem para o documento ou exibi-lo está montando. Se o software não é capaz de reconhecer um personagem, ele pode fazer o seu melhor palpite ou substituir um carácter alternativo, a fim de manter o processo em andamento.

Possíveis problemas com Software OCR

  • Uma vez que o software de OCR se baseia no reconhecimento de padrões, qualquer artefacto na página que poderia, potencialmente, afectar este processo é uma fonte de problemas. OCR funciona melhor quando há uma distinção clara entre os caracteres eo fundo do documento, de preferência preto no branco. Colorida ou fundos ocupados que tornam os padrões menos distinta pode causar problemas. Manchas, rugas e outros danos ao documento pode resultar em reconhecimento de caracteres incorreto também.

De esta maneira? Compartilhar em redes sociais:

LiveInternet