GUJ Discussões   :   últimos tópicos   |   categorias   |   GUJ Respostas

Arquivos html - pesquisar texto


#1

Bom dia,

Descrição do problema:
- Cerca de 2 a 3 mil aquivos html praticamente só com texto;
- Cada texto tem em média 3 páginas;
- Cada arquivo pode ou não, ter um ou mais link's com outros arquivos;

Pergunto... qual a forma mais simples de implementar uma pesquisa pelo texto?

valeu
abraço
Marcio


#2

Bom você vai ter que dar uma estudada no package .io que são as classes que trabalham com arquivos.

Java IO
http://www.ticket.t5.com.br/fernandoans/cartoes/FAnsJavaIO.pdf.

Além disso te aconselho a dar uma estudada em expressões regulares

Expressões Regulares.
http://guia-er.sourceforge.net/sobre.html


#3

Se essa sua aplicação for Web, você pode tentar o Nutch. http://lucene.apache.org/nutch/


#4

Valeu galera... vou dar uma estudada.

Abraço


#5