Um arquivo HyperText Markup Language (HTML) contém uma série de elementos, incluindo marcas, roteiro e texto. Em alguns casos, você vai precisar para isolar o texto do seu documento HTML para que você possa usá-lo em outras aplicações, como um artigo ou publicação. Extrair o texto de um arquivo HTML é uma tarefa que você pode completar em uma das várias maneiras em seu computador.
A partir do browser
Carregar o arquivo HTML em seu navegador Web de escolha. O texto disponível aparece na tela por padrão.
Clique "CTRL + A" para selecionar todo o texto na tela e, em seguida, "CTRL + C" para copiar o texto para a área de transferência do computador.
pressione "CTRL + V" para colar o texto do seu arquivo HTML para outro aplicativo, como um documento do Microsoft Word.
Do seu editor HTML
Carregar o HTML no bloco de notas ou o editor de HTML de escolha. Bloco de notas é uma escolha comum disponível na maioria dos sistemas de computador gratuitamente.
Navegue até a
seção do arquivo HTML. Clique na linha diretamente após a abertura tag e selecione tudo até o direito de linha antes do fechamento tag.Clique "CTRL + C" para copiar o texto e, em seguida, carregar um novo documento Bloco de notas em branco. pressione "CTRL + V" para colar o texto HTML para o novo documento.
Vá até o novo documento do bloco de notas e excluir todas as tags (como ou tags) para que o arquivo contém apenas texto básico.
usando Software
Download de um programa extrator para o seu sistema. HTML Texto Extractor, por exemplo, é compatível com os sistemas Windows.
Carregar o programa extrator e digite o endereço da Web da página da Web que contém o texto que você precisa para extrair.
Clique "Texto extraído" na barra de ferramentas para acessar o texto somente. Clique "Cópia" para adicionar o texto para a área de transferência e, em seguida, "CTRL + V" colá-lo em outro aplicativo.