Como pesquisar palavras em arquivos PDF

arquivos PDF oferecer uma maneira confiável de distribuir documentos. Eles têm um pequeno tamanho de arquivo e são relativamente livre de vírus. Mais importante, eles bloquear em formatação. Com um PDF, você não precisa se preocupar com suas fontes, margens ou contagem de página mudança de computador para computador. O documento será exatamente a maneira que você pretende para que olhe para todos. Esta portabilidade vem com um trade-documentos PDF são mais difíceis de editar e busca de documentos de processador de texto. Para procurar texto, o melhor método depende do tipo de PDF que você tem.

PDFs são imagens e não em texto Renderable

  • Para entender como funciona o texto em um arquivo PDF, pense no formato PDF como um arquivo de imagem em vez de um documento de processador de texto. Isto é como arquivos PDF preservar a sua formatação. documentos de processador de texto pode mudar a aparência de computador para computador, dependendo do software utilizado para vê-los, mas as imagens sempre a mesma aparência. Embora as imagens podem ter representações de texto, esse texto não é legível por computador, e você não pode editar ou procurá-la do jeito que você poderia, em um documento de processador de texto. Muitos arquivos PDF resolver este problema através da inclusão de uma camada invisível de texto legível por computador - às vezes chamado de texto renderable ou codificado-máquina - que corresponde ao texto que você vê na tela. Outros arquivos PDF não tem essa camada de texto extra.

Pesquisando Renderable PDF Text



  • Para PDFs com texto legível em computador, você pode procurar texto diretamente usando a ferramenta de busca de texto embutido que vem com o Adobe Acrobat ou o Reader ou com o software PDF de sua escolha. Em software Adobe Reader, clique "Editar" na barra de menu e escolha "Encontrar" ou pressione "Ctrl-F" no teclado. Digite o texto que deseja encontrar na caixa de pesquisa. Você também pode realizar uma pesquisa avançada clicando "Editar" e "Busca Avançada" ou premindo "Shift-Ctrl-F" no teclado. A busca avançada lhe dá mais opções, tais como a pesquisa com maiúsculas e minúsculas, procurando apenas palavras inteiras e pesquisando vários arquivos PDF em um momento. Observe que, se o documento inclui imagens embutidas, as legendas e etiquetas sobre essas imagens podem não aparecer em uma pesquisa de texto se o computador não pode ler aqueles pedaços de texto.

Por que alguns PDFs não tenho Texto Renderable

  • Outros arquivos PDF não tem texto renderable. Neste caso, mesmo que você pode abrir esses documentos e veja o texto para si mesmo, o software não o reconhece como tal. Isto acontece quando alguém cria um documento digitalizando texto, em vez de digitá-lo, e não usar qualquer software de caracteres de reconhecimento para codificar o PDF com uma camada de texto legível por computador. Também pode acontecer quando alguém cria um arquivo PDF a partir de um formato de imagem que usa gráficos vetoriais.

Pesquisando Non-Renderable PDF Text

  • Para procurar um arquivo PDF que não tem texto renderable, você terá que completar a etapa que o criador PDF original ignorado. Isso significa usar software de caracteres de reconhecimento óptico para digitalizar o arquivo PDF e criar uma camada de texto legível por computador. -se Adobe Acrobat pode fazer isso, e muitos programas de software livre fazê-lo tão bem, incluindo PDF OCR X, FreeOCR e OCR Online. Note que o software de caracteres de reconhecimento é imperfeito e comete erros em uma taxa que depende de como ilegível o texto está no arquivo PDF original.

De esta maneira? Compartilhar em redes sociais:

LiveInternet