Ler conteudo de uma pagina http

1 resposta
atayde

Gostaria de saber se tem alguma classe java que consigo pegar os texto, tabelas, conteudo de uma pagina http.
Já me falaram no httpunit, será que é o melhor caminho?

Grato,

Luiz Atayde

1 Resposta

smota

Acho que te indicaram certo … o httpUnit é excelente neste quesito, acho que é a opção mais fácil.

Mas você pode testar o JTidy que é capaz de fornecer uma árvore DOM do html processado, o Xerces se não me engano também pode fazer isso (mesmo o HTML não sendo um XML bem formado).

Criado 16 de março de 2004
Ultima resposta 16 de mar. de 2004
Respostas 1
Participantes 2