Acessar página html para pegar links

Eu tenho uma página html…nela há diversos links…
há como eu pegar estes links, e salvar em uma pasta, de forma que nesta pasta tenha vários arquivos html, sendo 1 para cada link???

se sim, como?
valeu

  • Utilize a classe HttpURLConnection para obter o código da página html;
  • Faça uma varredura na string pela tag <href;
  • Obtenha o código de cada página dos links via a classe HttpURLConnection;
  • Vá salvando o código das páginas como arquivos html.
  • Procure no google exemplos do uso da classe, eu já utilizei a classe mas o código está na antiga empresa que trabalhava.

[]s.>

Quando vc fizer o parser do html tome cuidado apenas ao diferenciar links relativos dos absolutos.

Outra coisa são referencias ao proprio documento, com links para âncoras em outros pontos e lembre-se que alguns links podem apontar para outros ‘protocolos’ como mailto, news, ftp, etc.