Pegar pagina externa e tratar o texto

23 de setembro de 2007 4 respostas

FlocosPJ 23 de setembro de 2007

Ola, sou novo no java e estou fazendo um site como primeira experiencia.

estou querendo pegar informações de outro site e jogar num banco de dados para fazer algumas estatisticas com os dados. Eles se atualizao todos os dias entao gostaria de fazer algo automatico em vez de todo dia eu terque salvar o html.

salvando o html tenho feito assim.

<% FileReader arquivoFile = new FileReader(“arquivo.html”);
BufferedReader arquivoReader = new BufferedReader(arquivoFile); %>

mais gostaria de ler o html direto do endereço.

Obrigado.

4 Respostas

marcossousaPJ 23 de set. de 2007

Sugestão, não seria melhor ler o RSS deste site não?

Uma dica: use a classe URL para ler esta página a leitura seria mais ou menos isto:

String url = &quot;http&#58;//localhost&#58;8080/site2/index.html&quot;;
url = new URLCodec&#40;&#41;.decode&#40;url&#41;;

URL               u   = new URL&#40;url&#41;;

InputStream       in  = u.openStream&#40;&#41;;

InputStreamReader isr = new InputStreamReader&#40;in&#41;;

BufferedReader    br  = new BufferedReader&#40;isr&#41;;

String theLine;

int cont = 1;

while &#40;&#40;theLine = br.readLine&#40;&#41;&#41; != null&#41; &#123;
System.out.println&#40;theLine&#41;;
&#125;

:joia:

FlocosPJ 23 de set. de 2007

o site n tem RSS. tenho q cata dentro do html mesmo =/

Vlw vo tenta aqui.

Abraço

FlocosPJ 23 de set. de 2007

Não to conseguindo, não acho o q tenho q coloka no import.

tem algum jeito d acha facil isso? o google n conseguiu me ajuda =/

FlocosPJ 24 de set. de 2007

O erro eh esse. soh falta isso praticamente pra mim. o resto consegui tudo no google e alguns livros.

symbol : class URLCodec
location: class tibia
url = new URLCodec().decode(url);
1 error

Criado 23 de setembro de 2007

Ultima resposta 24 de set. de 2007

Respostas 4

Participantes 2

4 Respostas

Topicos relacionados