Como arquivar páginas web velhos

isto`s good to have some familiarity with how Web content is stored to archive it.

Se você tem um site pessoal, negócios ou simplesmente querem preservar o conteúdo da Web que podem ser removidos da World Wide Web há opções para sites de arquivamento. Existem dois métodos principais para o arquivo da web: software que permite que você puxa todo o conteúdo de um site fora da Web para um diretório local no seu computador ou subscrição de serviços que hospedam os dados a partir de um site remotamente.

Coisas que você precisa

  • Computador
  • Conexão de internet

Páginas da Web arquivamento

  • Determinar que tipo de arquivo da web ferramenta iria funcionar melhor para você. Se você tem o conhecimento técnico para manter as páginas da Web, ter acesso a uma equipe de TI e um servidor seguro que você pode querer ter software independente para que você possa manter as páginas da Web internamente. Se você não tem essas coisas que você pode querer contar com um serviço online que vai agarrar e armazenar páginas Web remotamente.

  • Identificar as páginas da Web que você espera para arquivar e determinar quais os tipos de necessidade conteúdo a ser capturado. Diferentes ferramentas de arquivamento são capazes de capturar diversos níveis de uma página Web. Se você precisar que os elementos Mulitmedia precisam ser arquivados que vai mudar o que tipos de ferramenta de arquivo que você deseja usar.

  • Escolha a ferramenta de arquivamento Web que se adapte às suas necessidades com base nas etapas acima. Existem várias opções de código aberto, o que significa que você não está contando com um fornecedor comercial para armazenar seus dados. Algumas opções disponíveis incluem (links para todas as opções estão disponíveis em Recursos):

    Arquivo-It é um serviço de assinatura disponível através do Internet Archive, a maior arquivo da web no mundo, que agarra, catálogos, lojas e torna o conteúdo digital disponível que um usuário seleciona. Todo o conteúdo é também acessível ao público.



    HTTrack é um programa off-line independente de software livre que permite ao usuário para agarrar o conteúdo da Web fora da World Wide Web e armazená-lo em um diretório local.

    Grab-a-Site é um programa de software off-line independente de baixo custo que pega o conteúdo da Web e armazena-o em um diretório local.

    Heritrix, também criado pelo Internet Archive, é um programa webcrawler autônomo livre que armazena dados da Web em um diretório local.

  • Entre em contato com o editor da permissão site e pedido para arquivar o site. conteúdo da Web é protegido por direitos autorais para ter certeza que você quer ter os direitos sobre o conteúdo do site.

  • A manutenção da ferramenta de arquivamento da Web que você selecionar é um imperativo. Você vai querer verificar que as páginas da Web que você está arquivando estão agarrando a todo o conteúdo que você deseja.

  • Configurar um bom sistema de acesso de modo que se você tem mais do que algumas páginas da Web que você está arquivando você será capaz de encontrar o conteúdo. A maioria dos programas que você pode usar para arquivamento Web irá incluir a capacidade de adicionar títulos, descrições, palavras-chave e datas para páginas Web.

De esta maneira? Compartilhar em redes sociais:

LiveInternet