[URGENTE!] - Acessar sites via Java

1 resposta
J

Pessoal, preciso acessar sites na internet através do Java, para analisar conteúdo, criar estatísticas, entre outras funcionalidades que serão desenvolvidas. Tentei de algumas maneiras.

  1. Usando o objeto URL + InputStream
  2. Usando a biblioteca Prowser (simula browser)
  3. Usando a biblioteca HtmlUnit (simula browser)

No entanto, em todas elas, quando chega em páginas que fazem a verificação se o javascript está ativado, com a tag , não consigo acessar o conteúdo da página e o retorno que tenho para uma determinada URL, é de que o Javascript do “browser” deve estar ativado para visualizar o conteúdo da página. No caso das bibliotecas Prowser e HtmlUnit, ambas retornam um erro dizendo que era esperado text/javascript ou ecma/javascript, e que o conteúdo que vem através da URL é text/x-javascript. Não sei como contornar esse tipo de coisas, por favor me ajudem!

Como devo proceder para evitar esse tipo de erro? Como posso visualizar a página inteira, mesmo tendo verificação por Javascript?

Preciso disso urgente para um cliente!

1 Resposta

ViniGodoy

Urgente ou não, não duplique tópicos. Seu tópico duplicado:
http://www.guj.com.br/posts/list/200083.java#1007217

Esse aqui será trancado. Duplicar tópicos gera uma série de inconvenientes para você e para a comunidade.
Tenha em mente que dúvidas são resolvidas mais devagar com o tópico duplicado, não mais rápido, já que respostas de um tópico não contribuem para a solução no outro tópico.

Esse tópico será trancado.

Criado 5 de março de 2010
Ultima resposta 5 de mar. de 2010
Respostas 1
Participantes 2