Google em Java

Andei brincando com o Lucene e achei a ferramenta excepcional. Fiz até um mini-google para as notícias do jornal O Globo.

http://saoj.eatj.com/globo.jsp

Alguém aqui já brincou com o Lucene ???

Sergio Oliveira
http://www.smartjava.com.br

[quote=“saoj”]Andei brincando com o Lucene e achei a ferramenta excepcional. Fiz até um mini-google para as notícias do jornal O Globo.

http://saoj.eatj.com/globo.jsp

Alguém aqui já brincou com o Lucene ???

Sergio Oliveira
http://www.smartjava.com.br[/quote]
Eu havia brincado com ele faz algum tempo, mas muito pouco por falta de tempo e necessidade de estudar outras coisas. Agora voltei a mexer no bixinho. Li alguns artigos interessantes e tambem um bocado do codigo no cvs. É provavel que eu precise implementar um analyzer para remover as stop words em português.

ps.: Se lembro bem, vc havia perguntado como atualizar um index nesse post, certo? Fica a dica tirada do proprio codigo:

[code] /**

  • Constructs an IndexWriter for the index in path.
  • Text will be analyzed with a. If create
  • is true, then a new, empty index will be created in
  • path, replacing the index already there, if any.
  • @param path the path to the index directory
  • @param a the analyzer to use
  • @param create true to create the index or overwrite
  • the existing one; false to append to the existing
  • index
  • @throws IOException if the directory cannot be read/written to, or
  • if it does not exist, and create is
  • false
    */
    public IndexWriter(String path, Analyzer a, boolean create)
    throws IOException {
    this(FSDirectory.getDirectory(path, create), a, create, true);
    }[/code]
    :wink:

valeuz…

Na verdade para reindexar vc precisar apagar e readicionar o documento. Para apagar vc usa um IndexReader e para adicionar vc usa um IndexWriter. É meio contra-intuitivo, mas não dá para reclamar do Lucene. Não existe nada que chegue perto dele…

Fica uma dica aqui: A galera aqui já conhecia o www.eatj.com ?

O único problema é o item 2) do FAQ:

http://www.eatj.com/index.jsp?url=http://localhost:9000/faq.html

Sergio Oliveira
http://www.smartjava.com.br

Certeza que é só esse?

Retirado de http://www.eatj.com/index.jsp?url=http://localhost:9000/rule.html. :roll:

[]'s

Verdade !!! Viajei !!! De graça não rola em lugar nenhum eu acho.

Pagando apenas 4 dólares por mês vc tem 30Gb de transferência por mes. Bem barato né. Será que vale ?