Problema ao pegar cod. html com java.net.URL  XML
Índice dos Fóruns » Java Básico
Autor Mensagem
avsouza
Virtual Machine Man
[Avatar]

Membro desde: 03/08/2007 13:04:42
Mensagens: 660
Localização: Florianópolis/SC
Offline

Estou usando o codigo abaixo para trabalhar no html da pagina.
Ocorre que algumas paginas (pelo que percebi são asp) ele mostra um codigigo q não é o esperado.
O código que ele mostra é igual quando clica com direito do mouse e vai em "codigo fonte" do firefox, mas o firefox tem outra opção que é "este frama > codigo fonte" ai sim mostra o que eu quero ver.
Tem como fazer isso com o java?


Espero ter sido claro.

Alexandre Vieira de Souza
entanglement
GUJ Hacker

Membro desde: 26/09/2009 09:18:56
Mensagens: 5750
Offline

Basta você passar a URL correta (no seu caso, a URL do frame).
furutani
JWizard
[Avatar]

Membro desde: 11/10/2003 23:58:51
Mensagens: 2995
Localização: Iacri-SP e São Paulo-SP
Offline

Tente isso
http://download.oracle.com/javase/tutorial/networking/urls/readingURL.html

Até mais,
Roberto Jundi Furutani


Sun Certified Business Component Developer 1.3
Sun Certified Web Component Developer
Sun Certified Java Programmer
SAP Certified Development Associate - ABAP with SAP NetWeaver 7.0

[WWW]
dyeison
What is classpath?
[Avatar]

Membro desde: 15/07/2010 14:04:18
Mensagens: 6
Localização: Amparo/SP
Offline

Acho que entendi o que o avsouza está querendo fazer. Ele não quer simplesmente o html da página. Ele quer o html do frame que foi carregado pela página principal. Para fazer isso você vai precisar primeiro pegar o html da página principal e procurar, dentro desse código, a URL do frame que você quer. Por exemplo, o site www.caixa.gov.br, lá no código fonte, lá pela linha 900, tem um iframe que aponta para http://www1.caixa.gov.br/imprensa/index.asp. Se você quiser pegar o código html desse iframe, se fosse um iframe com url dinâmica, seria preciso primeiro buscar, no html da página principal, alguma coisa que só esse iframe possui. Por exemplo, localize a string title="Todas as notícias", então, some 32 à posição dessa string dentro do html todo, e terá a posição inicial do link, depois do href=". A partir dessa posição das aspas iniciais, localize as aspas finais e guarde numa segunda variavel. Agora, pegue a string compreendida entre a posição inicial e final e terá o link, mesmo que este mude a cada visita à página.



Isso tá mais pra POS (programação orientada à strings), mas é a única saída quando um site não oferece uma api para se coletar programaticamante os dados que se deseja.
Não sei se minha sintaxe tá certa, ainda estou migrando do .Net
[Email]
avsouza
Virtual Machine Man
[Avatar]

Membro desde: 03/08/2007 13:04:42
Mensagens: 660
Localização: Florianópolis/SC
Offline

furutani usando o codigo do link q vc passou, mostra o mesmo resultado do codigo que eu postei


dyeison o problema vc entendeu sim, vou ver se consigo implementar sua dica.

Alexandre Vieira de Souza
dyeison
What is classpath?
[Avatar]

Membro desde: 15/07/2010 14:04:18
Mensagens: 6
Localização: Amparo/SP
Offline

Isso. Aplica a dica buscando os frames menuPrincipal.asp e inicio.asp, adaptando pro seu caso.
[Email]
 
Índice dos Fóruns » Java Básico
Ir para:   
Powered by JForum 2.1.8 © JForum Team