Estrutura em árvore em java

1 resposta
M

Oi,

Preciso de fazer um programa em Java para criar uma estrutura em árvore de elementos HTML de qualquer documento, Sugeriram-me o o JDOM, mas antes de mais penso que teria de converter os documentos HTML em XML e seguidamente a grande questão. É que o JDOM exige que eu já conheça previamente a estrutura do XML para poder ir buscar os elementos. Ora, eu pretendo poder utilizar qualquer documento HTML, desconhecendo a sua estrutura.
Aconselham-me outra ferramenta/API, ou outra abordagem para a partir de um documento HTML, guardar a sua estrutura em árvore e poder aceder a qualquer elemento?

Agradeço muito a vossa ajuda.

MP

1 Resposta

_fs

Pelo que entendi o seu software deve prever XML mal-formado. Aqui tem uma lista interessante:
http://java-source.net/open-source/html-parsers

Criado 12 de fevereiro de 2008
Ultima resposta 12 de fev. de 2008
Respostas 1
Participantes 2