Pegar pagina externa e tratar o texto

4 respostas
F

Ola, sou novo no java e estou fazendo um site como primeira experiencia.

estou querendo pegar informações de outro site e jogar num banco de dados para fazer algumas estatisticas com os dados. Eles se atualizao todos os dias entao gostaria de fazer algo automatico em vez de todo dia eu terque salvar o html.

salvando o html tenho feito assim.

<% FileReader arquivoFile = new FileReader(“arquivo.html”);
BufferedReader arquivoReader = new BufferedReader(arquivoFile); %>

mais gostaria de ler o html direto do endereço.

Obrigado.

4 Respostas

M

Sugestão, não seria melhor ler o RSS deste site não?

Uma dica: use a classe URL para ler esta página a leitura seria mais ou menos isto:

String url = &quot;http&#58;//localhost&#58;8080/site2/index.html&quot;;
url = new URLCodec&#40;&#41;.decode&#40;url&#41;;

URL               u   = new URL&#40;url&#41;;

InputStream       in  = u.openStream&#40;&#41;;

InputStreamReader isr = new InputStreamReader&#40;in&#41;;

BufferedReader    br  = new BufferedReader&#40;isr&#41;;

String theLine;

int cont = 1;

while &#40;&#40;theLine = br.readLine&#40;&#41;&#41; != null&#41; &#123;
System.out.println&#40;theLine&#41;;
&#125;

:joia:

F

o site n tem RSS. tenho q cata dentro do html mesmo =/

Vlw vo tenta aqui.

Abraço

F

Não to conseguindo, não acho o q tenho q coloka no import.

tem algum jeito d acha facil isso? o google n conseguiu me ajuda =/

F

O erro eh esse. soh falta isso praticamente pra mim. o resto consegui tudo no google e alguns livros.

symbol : class URLCodec
location: class tibia
url = new URLCodec().decode(url);
1 error

Criado 23 de setembro de 2007
Ultima resposta 24 de set. de 2007
Respostas 4
Participantes 2