Tava precisando pegar um documento HTML, descobrir todos href dele e da um replace por uma nova para url. O motivo é que estava querendo fazer o controle do numero de clicks nos links do documento para um modulo de newsletter. Entao eu substuiria o link anteriormente criado pelo meu. Se alguem souber como posso fazer isso sem ser na mao grande por favor poste aqui.
Tem essa api do xerces, so que eu queria passar por exemplo um arquivo
e ele ja me retornava o documento html, do jeito que eu vi nos foruns eu tenho que ir criando no por no para criar um documento. Vcs conhecem alguma api?
Eu nao posso da o replace all pois preciso substituir cada url por uma nova diferente. Por exemplo url1 por url2?cod=algumGeradorDeCodigo e tambem precisaria retorna a lista destas urls para salvar no banco. Por isso preciso de um parser, esse que eu mostrei realmente resolve mas ao minimo erro de html ele da exception. Tentei o HTMLParser mas nao tive sucesso ainda