Olá pessoal,
Gostaria da ajuda de vocês para chegar a uma solução que estou tentando dar para o seguinte problema:
Bom, quero usar um Regex para limpar as formatações em um código html. Como exemplo, abaixo estão os fragmentos do código da a ser analisada página. O que está em negrito e em vermelho é o padrão que deve ser retirado do código da página.
Fragmento:
<table[color=brown] width=“100%” class=“corpo”[/color]>
Estou usando o Regex abaixo, mesmo assim não obtive o resultado esperado. Alguém poderia me ajudar?
a.toString().replaceAll("(\S*.=[^>]).<em>?[>]", “”);
a.toString().replaceAll(""(\d</em>\w*.)|(\d*\W*.)"", “”);
a.toString().replaceAll(“nowrap|<b>|</b>”, “”);
Obrigado,