Corrigindo HTMLs mal formadas

1 resposta
N

Senhores do fórum,

será que alguém poderia me dizer se existe alguma lib java que corrija htmls mal formadas? Ou seja, que transforme o código em um XHTML que possa sofrer um parsing.

A situação é a seguinte:
o usuário edita um text area com um editor wysiwyg (javascript), e submete o formulário. O campo text área é um clob que guardo no banco. Eventualmente quero recuperar esse conteúdo clob e jogar em um pdf (utilizando fop), no entanto, o parser do xml não dá certo porque o html gerado por esse editor javascript é porco (desculpem a expressão), gerando um código Internet Explorer friendly (ehehehe!).

Agradeço a atenção.

1 Resposta

N

“NotANumber”:
Senhores do fórum,

será que alguém poderia me dizer se existe alguma lib java que corrija htmls mal formadas? Ou seja, que transforme o código em um XHTML que possa sofrer um parsing.

A situação é a seguinte:
o usuário edita um text area com um editor wysiwyg (javascript), e submete o formulário. O campo text área é um clob que guardo no banco. Eventualmente quero recuperar esse conteúdo clob e jogar em um pdf (utilizando fop), no entanto, o parser do xml não dá certo porque o html gerado por esse editor javascript é porco (desculpem a expressão), gerando um código Internet Explorer friendly (ehehehe!).

Agradeço a atenção.

Found it!

JTidy (port java para o Tidy) resolve tudo!

http://jtidy.sourceforge.net/

Espero ter ajudado alguém aí.

Paz!

Criado 12 de junho de 2006
Ultima resposta 13 de jun. de 2006
Respostas 1
Participantes 1