Exportando HTML ao texto é um processo tedioso, se simples. arquivos HTML são arquivos de texto com um .html ou .htm extensão. Existem várias maneiras para remover HTML e reter o texto da página da Web. As etiquetas HTML devem ser removidos a partir do ficheiro. software de terceiros pode tira o arquivo de HTML Tag-um usuário pode apagar as etiquetas em um editor de texto ou copiar o texto a partir de um navegador e colá-lo sem formatação em um editor de texto.
Coisas que você precisa
- Editor de texto
- arquivo HTML
- navegador
- software descascar HTML
Copiar e colar o texto
Abra o arquivo .html no navegador, clicando em "Arquivo" e "Abrir arquivo."
Selecione o texto, clicando na página e arrastando o cursor sobre o texto para realçar o texto. pressione "Ctrl-C" ("Cmd-C" em um Mac) para copiar o texto.
Abra o editor de texto, como o bloco de notas no Windows ou o TextEdit no Mac OS X. Clique na "Editar" e escolha "Colar." Um editor de texto simples, como o Bloco de Notas irá retirar automaticamente os tags HTML do texto. No entanto, se você estiver usando um processador de texto mais poderoso como seu editor de texto como o Word, então você terá que escolher "Colar especial" e cole como texto simples ou "Somente texto" para remover a formatação.
Software Use Third-Party
Faça o download do software de terceiros de sua escolha que retira as tags HTML do texto. Veja os links de recursos para algumas sugestões.
Abra o arquivo no software de terceiros. Dependendo do software, você pode precisar abrir o arquivo usando "Arquivo" e "Aberto" para abrir o arquivo. Alguns softwares podem ter de clicar em "procurar" para carregar o arquivo para exportação.
Clique "Está bem" ou "Salvar" ou "Converter," dependendo do software, para iniciar o processo de conversão.
Remover as Marcas de um editor de texto
Abra o arquivo em um editor de texto, clicando em "Arquivo" e "Aberto."
Localize o
marca no arquivo. Apagar tudo, desde o tag-se. Esta informação é para o navegador para analisar o arquivo para visualização e não faz parte do texto.Localizar a etiqueta perto da parte inferior do documento. Apagar esta e todas as tags abaixo dela.
Remover todas as palavras e código entre inferior a (lt;) e maior que (gt;) símbolos e os próprios símbolos. Estas são as tags HTML. Se o seu editor de texto tem uma pesquisa e substituição na "Editar" Menu, procure "lt; * gt;" e substituir com um campo em branco. O asterisco é um curinga que irá cobrir qualquer texto entre os dois símbolos.