Dúvida, tentei pesquisar sobre como é realizado um codigo para fazer varreduras na web e indexar sites.
Tipo, google, yahoo, antigo cadê, bing… Como eh feito esses algoritmos? Como eles funcionam? Que linguagem são realizados?
Como eles entram nos diretorios dos sites e fazem a leitura?
Não consigo achar nada sob o assumto, acho que estou usando termos de pesquisa errado… Alguem pode ajudar?..
Dúvida, tentei pesquisar sobre como é realizado um codigo para fazer varreduras na web e indexar sites.
Tipo, google, yahoo, antigo cadê, bing… Como eh feito esses algoritmos? Como eles funcionam? Que linguagem são realizados?
Como eles entram nos diretorios dos sites e fazem a leitura?
Não consigo achar nada sob o assumto, acho que estou usando termos de pesquisa errado… Alguem pode ajudar?..
Obrigado.[/quote]
Eles funciona por combinação linear matricial. É simples conceptualmente, mas dificil de impelementar.
Procure por “How google search works” e verá que tem muito material. Procure tambem pelo Lucene que é a implementação de um algoritmo semelhante para vc poder usar no seu sistema e o Nutch que faz a mesma coisa que o google mas vc pode ter em casa ( se tivr máquina e espaço para isso )