| Autor |
Mensagem |
![[Post New]](/templates/default/images/icon_minipost_new.gif) 30/06/2005 11:46:35
|
Claire
JavaChild
![[Avatar]](/images/avatar/e7e23670481ac78b3c4122a99ba60573.png)
Membro desde: 17/11/2003 15:16:20
Mensagens: 110
Localização: Sumaré-SP
Offline
|
Olá,
Tenho que fazer uma página simples em jsp, para busca em arquivos (pdf,html,doc). Estou manipulando os exemplos que eles disponibilizam, até para entender melhor.
Tenho várias questões básicas uma delas seria:
Lucene lê arquivos desses tipos?
|
"Se não puder convencê-los, confunda-os" |
|
|
 |
|
|
![[Post New]](/templates/default/images/icon_minipost_new.gif) 30/06/2005 11:50:20
|
Mauricio Linhares
Moderador
![[Avatar]](/images/avatar/97af07a14cacba681feacf3012730892.jpg)
Membro desde: 09/01/2005 23:28:22
Mensagens: 3717
Localização: João Pessoa, Paraíba - Brasil
Offline
|
Não tem que transformar esses arquivos em texto pra ele poder indexar não?
|
Meu blog sobre desenvolvimento | My Last.fm | @mauriciojr
Screencast de Introdução a linguagem Objective-C |
|
|
 |
![[Post New]](/templates/default/images/icon_minipost_new.gif) 30/06/2005 12:01:49
|
Claire
JavaChild
![[Avatar]](/images/avatar/e7e23670481ac78b3c4122a99ba60573.png)
Membro desde: 17/11/2003 15:16:20
Mensagens: 110
Localização: Sumaré-SP
Offline
|
Tem?
|
"Se não puder convencê-los, confunda-os" |
|
|
 |
![[Post New]](/templates/default/images/icon_minipost_new.gif) 30/06/2005 12:03:28
|
Mauricio Linhares
Moderador
![[Avatar]](/images/avatar/97af07a14cacba681feacf3012730892.jpg)
Membro desde: 09/01/2005 23:28:22
Mensagens: 3717
Localização: João Pessoa, Paraíba - Brasil
Offline
|
Sei lá, pelo que um amigo meu disse, primeiro transformava em arquivo de texto e depois que o lucene indexava.
Mas eu não sei não, tem gente aqui que sabe trabalhar com Lucene, cadê o Luca?
|
Meu blog sobre desenvolvimento | My Last.fm | @mauriciojr
Screencast de Introdução a linguagem Objective-C |
|
|
 |
![[Post New]](/templates/default/images/icon_minipost_new.gif) 30/06/2005 13:27:26
|
smota
Moderador
![[Avatar]](/images/avatar/ca9c267dad0305d1a6308d2a0cf1c39c.jpg)
Membro desde: 21/02/2003 16:19:19
Mensagens: 1647
Offline
|
Claire wrote:...(pdf,html,doc)...
Lucene lê arquivos desses tipos?
O Lucene é apenas o engine de indexação, quem passa o que indexar é você, então em teoria você indexa o que quiser.
Você não precisa transformar em texto, precisa extrair o texto desses documentos e criar um objeto Document para o Lucene indexar.
Na página Contributions tem alguns mas se não me engano já vi algum para doc em algum lugar.
|
"Perfection is reached not when there's nothing more to add but when there's no more to take out" |
|
|
 |
![[Post New]](/templates/default/images/icon_minipost_new.gif) 04/07/2005 08:55:04
|
Claire
JavaChild
![[Avatar]](/images/avatar/e7e23670481ac78b3c4122a99ba60573.png)
Membro desde: 17/11/2003 15:16:20
Mensagens: 110
Localização: Sumaré-SP
Offline
|
Oi,
Mais algumas dúvidas...
O Lucene sozinho faz leituras de arquivos tipo txt? ou algum outro tipo de arquivo?
Copiei o .jar pro meu common, a aplicação de exemplo que vem com ele esta lendo as classes normalmente, porém retorna que nenhum que o sistema não encontra o arquivo indicado, passando o diretório que eu especifiquei mais um \segments (Ao menos está tratado assim na jsp com o cath). Vou colocar aquia parte da aplicação onde este erro esta sendo tratado.
Alguém sabe porque está dando este erro?
Já alterei o diretório de teste, mas mesmo assim não funciona
Está retornando o seguinte html:
Grata,
Claire
|
"Se não puder convencê-los, confunda-os" |
|
|
 |
![[Post New]](/templates/default/images/icon_minipost_new.gif) 21/12/2006 13:52:47
|
sfohart
Thread.start()
![[Avatar]](/images/avatar/c490f96bbae13d62132dda54ef1ec86e.png)
Membro desde: 21/12/2006 13:50:04
Mensagens: 39
Localização: Salvador, Bahia
Offline
|
Existe uma biblioteca chamada PDFBox, a qual consegue extrair conteúdo e metadados de arquivos PDF. Ela possui uma classe de integração com o Lucene, de nome LucenePDFDocument (procurem na api da biblioteca).
Agora eu preciso integrar a minha busca por pds (que já funciona em modo texto) com um site de busca em jsp (eu não sei jsp), como eu faço isso?
Tô usando o Netbeans, ele tem plugin pra edição visual de páginas JSP, mas eu não sei necas de jsp...
Se alguém puder me ajudar...
|
Leandro Soriano Ferreira
Analista de SIstemas
Bacharel em Ciência da Computação da UFBA
Sun Certified Programmer for Java 2 Platform 1.6
sfohart at gmail dot com
|
|
|
 |
![[Post New]](/templates/default/images/icon_minipost_new.gif) 27/12/2006 16:03:29
|
sfohart
Thread.start()
![[Avatar]](/images/avatar/c490f96bbae13d62132dda54ef1ec86e.png)
Membro desde: 21/12/2006 13:50:04
Mensagens: 39
Localização: Salvador, Bahia
Offline
|
Claire wrote:
Tem que colocar os arquivos de índice em /opt/lucene/index. Se vc usa windows, coloca em c:\...
Se vc tá usando o NetBeans, coloca na raíz da partição em que o projeto NetBeans está.
|
Leandro Soriano Ferreira
Analista de SIstemas
Bacharel em Ciência da Computação da UFBA
Sun Certified Programmer for Java 2 Platform 1.6
sfohart at gmail dot com
|
|
|
 |
|
|