Como construir um motor de busca

Os motores de busca são a espinha dorsal da internet moderna. Eles têm várias partes, é claro, e são muito mais do que apenas a caixa de entrada que você vê na primeira página de um site de busca.

Coisas que você precisa

  • Grande disco rígido (s)
  • conexão de internet de alta velocidade

instruções

  1. Antes de resultados da pesquisa podem ser apresentadas ao usuário, você deve primeiro criar um banco de dados de todas as páginas na Internet. linguagens de banco de dados comuns incluem MySQL ou MS SQL. Desde novos sites estão constantemente a ser criado, este passo do processo será sempre incompleta. O programa que localiza todos os sites e índices seu conteúdo é chamado um rastreador. Vários desses rastreadores serão executados simultaneamente, pegando endereços da web aleatórios e seguir todos os links nessas páginas. Com cada link, o rastreador deve primeiro consultar o banco de dados para ver se o link já está presente, e se não, adicioná-lo à lista.



  2. Atribuir palavras-chave para cada local uma vez que um número suficiente de sites estão indexados. Palavras-chave são palavras que aparecem frequentemente em um site e sugerir tópico provável de uma página ou idéia principal. Criar um sistema de ranking para decidir quais páginas são mostradas primeiro a utilizadores que pesquisam palavras-chave específicas. algoritmos de classificação comuns usam vários fatores, incluindo a densidade de palavras-chave, palavra-chave posição, ou o número de links em uma página para determinar a relevância.

  3. Decida quais os factores que terão impacto ponderação dos resultados da pesquisa. Google, por exemplo, coloca mais peso sobre as palavras que aparecem dentro de links ou tags de cabeçalho HTML. Considere incluir fatores como comprimento da página, a frequência de atualizações e singularidade de conteúdo.

dicas & avisos

  • Para garantir que usuários mal-intencionados não tente jogo o seu motor de busca, mantenha o seu algoritmo de classificação um segredo bem guardado.
  • Use vários indexadores para indexar a Internet mais rapidamente.

recursos

De esta maneira? Compartilhar em redes sociais:

LiveInternet