Como retirar informações de um site

7 respostas
A

Bom pessoal em plenas ferias sem nada pra fazer… estou eu “brincando no eclipse” e me veio a ideia de fazer um programa onde ele acessa varios sites e retira informações que eu setar pra ele retirar

isso é possivel de se fazer?? se sim como?

desde já mto obrigado

7 Respostas

rvcabral

é possível e o java tem uma biblioteca para isoo, só não lembro o nome… :smiley:

S

Eu estou tentando a mesma coisa, se o toda a informcao que vc quer puder ser vista pelo codigo fonte eh bem facil, trabalhoso mais facil, o meu problema que eh descrito em outro topico do forum eh que o site que eu quero tirars as informacos puxa tudo de um xml que eu nao to conseguinto acessar… Mas entao usa a commons http client do apache, eh beeem facinho com ela se for so pegar o codigo fonte

Rafael_Carneiro

Procure na API por URL, URLConnect ou utilize o pacote HttpClient da Apache.

S

Vai no topico que eu criei, no meu penultimo post eh como eu estou fazendo para logar em um site e pegar o source do site seguinte (o que voce eh encaminhado depois de logar)

O topico eh esse: http://www.guj.com.br/posts/list/114050.java

Nao esquece que as informacoes que eu coloque no NameValuePair varia de site para site.

A

mas ao retirar essas informações eu não quero salva-las e sim deixar na memoria pra ser descartada posteriormente

S

Mas em enhum momento eu estou salvando as informacoes… no codigo que ta la… eu so imprimo na tela o codigo fonte so que no seu caso vc usaria regex para pegar o que vc quer… isso se tudo que vc quiser estiver no codigo fonte neh…

A

com certeza o negocio todo seria conseguir acessar o codigo-fonte… pra tirar as info vai ser regex é o jeito neh

Criado 7 de janeiro de 2009
Ultima resposta 7 de jan. de 2009
Respostas 7
Participantes 4