Apache Lucene + Nutch instalação

2 respostas
Corcioli

Ola pessoal,

Gostaria de saber se alguém ja utilizou o Apache Lucene e o Nutch para fazer Crawler.

Estou tentando instalar o Nutch porém não estou tendo sucesso. Estou usando SO Windows Vista, jdk 1.6.x, cygdrive, ant e TomCat 6.x (Eu vi que eh melhor utilizar o 4.0, mas não estou achando os arquivos necessarios pra instalar ele).

Por favor, me dêem uma luz pra eu fazer o Nutch funcionar com o Lucene.

PS: Eu sou novo por aqui e eu não sei ao certo se o post está no lugar correto, se não estiver por favor mudem ou me avisem pra eu postar em outro lugar.

2 Respostas

MauNunes

Olá Corcioli, tudo bem?
Cara o que esse Nutch faz? Dei uma rápida olhada no site, e pelo que entendi ele é um framework para crawler?
Eu estou muito interessado nisso, se tiver algum exemplo em como utiliza-lo eu agradeço.

Corcioli

Na verdade é uma API. :smiley:

Vc passa a URL e ele faz o crawler sozinho, pelo q eu entendi. Eu não sei mto bem o funcionamento, pq eu não to conseguindo fazer funcionar. Ele tem uns esquemas de gerar indices de Intranet e é isso q está me interessando. Porém estou com dificuldades em rodar ele.

To buscando tudo quanto é coisa pelo google, mas tá dificil.

Criado 26 de novembro de 2009
Ultima resposta 26 de nov. de 2009
Respostas 2
Participantes 2