Arquivos html - pesquisar texto  XML
Índice dos Fóruns » Java Básico
Autor Mensagem
marciob7@yahoo.com.br
Debugger

Membro desde: 06/12/2006 11:42:27
Mensagens: 52
Offline

Bom dia,

Descrição do problema:
- Cerca de 2 a 3 mil aquivos html praticamente só com texto;
- Cada texto tem em média 3 páginas;
- Cada arquivo pode ou não, ter um ou mais link's com outros arquivos;


Pergunto... qual a forma mais simples de implementar uma pesquisa pelo texto?

valeu
abraço
Marcio
sodrope
JavaChild
[Avatar]

Membro desde: 18/02/2007 17:21:46
Mensagens: 143
Offline

Bom você vai ter que dar uma estudada no package .io que são as classes que trabalham com arquivos.


Java IO
http://www.ticket.t5.com.br/fernandoans/cartoes/FAnsJavaIO.pdf.

Além disso te aconselho a dar uma estudada em expressões regulares

Expressões Regulares.
http://guia-er.sourceforge.net/sobre.html

Juliano Pedroso
thingol
Moderador

Membro desde: 29/07/2004 16:10:13
Mensagens: 17572
Offline

marciob7@yahoo.com.br wrote:Bom dia,

Descrição do problema:
- Cerca de 2 a 3 mil aquivos html praticamente só com texto;
- Cada texto tem em média 3 páginas;
- Cada arquivo pode ou não, ter um ou mais link's com outros arquivos;


Pergunto... qual a forma mais simples de implementar uma pesquisa pelo texto?

valeu
abraço
Marcio


Se essa sua aplicação for Web, você pode tentar o Nutch. http://lucene.apache.org/nutch/


[WWW]
marciob7@yahoo.com.br
Debugger

Membro desde: 06/12/2006 11:42:27
Mensagens: 52
Offline

Valeu galera... vou dar uma estudada.

Abraço
 
Índice dos Fóruns » Java Básico
Ir para:   
Powered by JForum 2.1.8 © JForum Team