Boa tarde galera, estou tentando usar o lucene (versão mais recente 4.0.0). Estou seguindo o tutorial “Lucene em 5 minutos”, só que é uma versão mais antiga do lucene, então, estou tendo alguns problemas.
Link do tutorial
http://vitorpamplona.com/wiki/Introdu%C3%A7%C3%A3o%20ao%20Apache%20Lucene
Quando ele tenta criar:
StandardAnalyzer analizador = new StandardAnalyzer(Version.LUCENE_40);
Directory indiceDiretorio = new RAMDirectory();
IndexWriter arquivo = new IndexWriter(indiceDiretorio, analizador, true, IndexWriter.MaxFieldLength.UNLIMITED);
Pelo que vi, na versão 4.0.0 isso mudou um pouco, a passagem de parâmetros do indexWriter mudou, se não entendi errado, temos que fazer da seguinte forma:
StandardAnalyzer analizador = new StandardAnalyzer(Version.LUCENE_40);
Directory indiceDiretorio = new RAMDirectory();
IndexWriterConfig indiceConfig = new IndexWriterConfig(Version.LUCENE_40, analizador);
IndexWriter arquivo = new IndexWriter(indiceDiretorio, indiceConfig);
Só que na última linha ainda continua dando erro:
unreported exception java.io.IOException; must be caught or declared to be thrown
Agora uma dúvida, estou tentando usar o lucene para o seguinte propósito: Ler um arquivo pdf (entre 350 a 400 páginas), realizar buscas nesse arquivo e me retornar uma parte do texto do que vem antes e depois da string pesquisada.
Aceito outras sugestões para o objetivo
Abraços e obrigado pela atenção.