Senhores do fórum,
será que alguém poderia me dizer se existe alguma lib java que corrija htmls mal formadas? Ou seja, que transforme o código em um XHTML que possa sofrer um parsing.
A situação é a seguinte:
o usuário edita um text area com um editor wysiwyg (javascript), e submete o formulário. O campo text área é um clob que guardo no banco. Eventualmente quero recuperar esse conteúdo clob e jogar em um pdf (utilizando fop), no entanto, o parser do xml não dá certo porque o html gerado por esse editor javascript é porco (desculpem a expressão), gerando um código Internet Explorer friendly (ehehehe!).
Agradeço a atenção.