API htmlparser - http://htmlparser.sourceforge.net/

Olá a todos,

Gostaria de ajuda pois estou enfrentando a seguinte dificuldade, estou desenvolvendo uma app onde tenho um metodo responsavel por ler linha a linha o codigo fonte de uma pagina e quando ele encontra uma determinada palavra chave(no caso access_novaura.log) ele guarda em uma String o valor de toda a linha Exemplo abaixo:

<img src="/icons/text.gif" alt="[   ]"> <a href="access_novaura.log.2010-07-27-18_25_41">access_novaura.log.2..&gt;</a> 28-Jul-2010 07:27   10M

Agora preciso desenvolver um metodo onde eu consiga manipular esta String para que eu armazene em uma Colection somente o seguinte valor:

access_novaura.log.2010-07-27-18_25_41

pois depois vou concatenar com o endereço do servidor para baixar este arquivo log, o detalhe é que a palavra chave que uso em alguns casos tem numeros de caracteres diferentes impossibilitando selecionar por substring uma posicao especifica. Alguem que ja tenha usado esta API http://htmlparser.sourceforge.net/ tem algum exemplo para me mostrar? ou se existe outra solução sem o uso de API externa é bem vinda.

Obrigado a todos

  1. Tudo que você está dentro de tags ???
  2. O que você quer é somente o conteudo do atributo href???

Exatamente … preciso somente do conteudo da tag href, pois vou pegar o valor access_novaura.log.2010-07-27-18_25_41 e vou concatenar com o endereco do servidor

caminho do servidor + valor do href
http://199.199.199.22/logs/access_novaura.log.2010-07-27-18_25_41

Usando a API HtmlParser:

//Pega todas as tags "A"
NodeList links = Parser.createParser(html, null).parse(new TagNameFilter("A")); 

//Pega o primeiro elemento e da um cast
LinkTag tag = (LinkTag) links.elementAt(0);

//pega o link
String url = tag.extractLink();

Falou.

Perfeito funcionou exatamente da forma que eu precisava.]
Muito obrigado