Acessar página html para pegar links

2 respostas
hcbelias

Eu tenho uma página html…nela há diversos links…
há como eu pegar estes links, e salvar em uma pasta, de forma que nesta pasta tenha vários arquivos html, sendo 1 para cada link???

se sim, como?
valeu

2 Respostas

C
  • Utilize a classe HttpURLConnection para obter o código da página html;
  • Faça uma varredura na string pela tag <href;
  • Obtenha o código de cada página dos links via a classe HttpURLConnection;
  • Vá salvando o código das páginas como arquivos html.
  • Procure no google exemplos do uso da classe, eu já utilizei a classe mas o código está na antiga empresa que trabalhava.

[]s.>

peczenyj

Quando vc fizer o parser do html tome cuidado apenas ao diferenciar links relativos dos absolutos.

Outra coisa são referencias ao proprio documento, com links para âncoras em outros pontos e lembre-se que alguns links podem apontar para outros ‘protocolos’ como mailto, news, ftp, etc.

Criado 19 de outubro de 2007
Ultima resposta 19 de out. de 2007
Respostas 2
Participantes 3