Framework/API para parse de HTML

3 respostas
Christian_Borges

Alguém conhece alguma framework/api para parse de HTML?

Valeu!

3 Respostas

bruno.fantin

Já usei esse, serviu para o que eu queria.

http://htmlparser.sourceforge.net/

Falou.

icarocd

O HTMLParser é um dos mais robustos. Tem varias opcoes de filtro de tags: manter tais, remover tais, navegar pelo DOM…
PS: recomendo tambem considerar o uso de um “corretor” de tags pois muitos sites tem problemas de mal formacao. Ha api’s exclusivamente pra isso.
No mesmo assuntos, ha decodificadores e decodificadores tags html <-> texto padrao, tambem, que sao interessantes.

Christian_Borges

Obrigado Senhores!

Criado 14 de dezembro de 2009
Ultima resposta 16 de dez. de 2009
Respostas 3
Participantes 3