Apache Lucene

Colegas preciso urgentemente trabalhar com o Lucene!
Com Apache Lucene dá para fazer consultas em documentos de texto…
Como se faz isso? Eu sei que tem que criar um índice, indexar documentos, e consultar…
Qual código e procediementos usar com o Lucene para simplismente eu pesquisar uma palavra (termo) em um documento qualquer?

Agradeço toda a ajuda que me derem!

Olá

Depende do tipo do documento. Para cada tipo se usa um conversor diferente. Ou seja se for PDF se pode usar o PDFBox, se for epub se usa o epubparser, se for o formato do Office se usa o Apache POI e assim por diante. Para usar uma interface única para os diversos tipos a gente usa o Apache Tika.

Sobre o Tika veja o site em http://tika.apache.org/ e também http://www.lucene-eurocon.org/slides/Text-and-Metadata-Extraction_Jukka-Zitting.pdf

Para usar o Lucene compre o livro Lucene in Action 2a edição que é o meio mais fácil e rápido de aprender a usar o Lucene.

[]s
Luca