Google em Java

4 respostas
saoj

Andei brincando com o Lucene e achei a ferramenta excepcional. Fiz até um mini-google para as notícias do jornal O Globo.

http://saoj.eatj.com/globo.jsp

Alguém aqui já brincou com o Lucene ???

Sergio Oliveira
http://www.smartjava.com.br

4 Respostas

jack_ganzha
"saoj":
Andei brincando com o Lucene e achei a ferramenta excepcional. Fiz até um mini-google para as notícias do jornal O Globo.

[url]http://saoj.eatj.com/globo.jsp[/url]

Alguém aqui já brincou com o Lucene ???

Sergio Oliveira
http://www.smartjava.com.br


Eu havia brincado com ele faz algum tempo, mas muito pouco por falta de tempo e necessidade de estudar outras coisas. Agora voltei a mexer no bixinho. Li alguns artigos interessantes e tambem um bocado do codigo no cvs. É provavel que eu precise implementar um analyzer para remover as stop words em português.

ps.: Se lembro bem, vc havia perguntado como atualizar um index nesse post, certo? Fica a dica tirada do proprio codigo:
/**
   * Constructs an IndexWriter for the index in <code>path</code>.
   * Text will be analyzed with <code>a</code>.  If <code>create</code>
   * is true, then a new, empty index will be created in
   * <code>path</code>, replacing the index already there, if any.
   *
   * @param path the path to the index directory
   * @param a the analyzer to use
   * @param create <code>true</code> to create the index or overwrite
   *  the existing one; <code>false</code> to append to the existing
   *  index
   * @throws IOException if the directory cannot be read/written to, or
   *  if it does not exist, and <code>create</code> is
   *  <code>false</code>
   */
  public IndexWriter(String path, Analyzer a, boolean create)
       throws IOException {
    this(FSDirectory.getDirectory(path, create), a, create, true);
  }
:wink:

valeuz...

saoj

Na verdade para reindexar vc precisar apagar e readicionar o documento. Para apagar vc usa um IndexReader e para adicionar vc usa um IndexWriter. É meio contra-intuitivo, mas não dá para reclamar do Lucene. Não existe nada que chegue perto dele…

Fica uma dica aqui: A galera aqui já conhecia o www.eatj.com ?

O único problema é o item 2) do FAQ:

http://www.eatj.com/index.jsp?url=http://localhost:9000/faq.html

Sergio Oliveira
http://www.smartjava.com.br

caiofilipini

Certeza que é só esse?

Retirado de http://www.eatj.com/index.jsp?url=http://localhost:9000/rule.html. :roll:

[]'s

saoj

Verdade !!! Viajei !!! De graça não rola em lugar nenhum eu acho.

Pagando apenas 4 dólares por mês vc tem 30Gb de transferência por mes. Bem barato né. Será que vale ?

Criado 14 de setembro de 2004
Ultima resposta 15 de set. de 2004
Respostas 4
Participantes 3