Ler Código Fonte de uma pagina

Bom dia Pessoal, sou novo por aqui, sou novo em programação web tambem.
Porém estou precisando fazer a leitura de um código fonte de uma pagina web qualquer.
Gostaria da ajuda de você para saber como posso fazer isso, tem como salvar esse código em txt na maquina? para que depois eu faça a leitura?
Encontrei o código abaixo mas não está dando certo, o que estou fazendo de errado?

seu html aqui.
Exibindo código da Pagina

Agradeço a ajuda desde ja.
Leandro Santos

[quote=leandrosantos]Bom dia Pessoal, sou novo por aqui, sou novo em programação web tambem.
Porém estou precisando fazer a leitura de um código fonte de uma pagina web qualquer.
Gostaria da ajuda de você para saber como posso fazer isso, tem como salvar esse código em txt na maquina? para que depois eu faça a leitura?
Encontrei o código abaixo mas não está dando certo, o que estou fazendo de errado?

seu html aqui.
Exibindo código da Pagina

Agradeço a ajuda desde ja.
Leandro Santos[/quote]
o que você quer fazer no código HTML ?
você está mostrando um inner ?
sabe pra que serve o alert e o innerHTML ?

[quote=RenanRosa][quote=leandrosantos]Bom dia Pessoal, sou novo por aqui, sou novo em programação web tambem.
Porém estou precisando fazer a leitura de um código fonte de uma pagina web qualquer.
Gostaria da ajuda de você para saber como posso fazer isso, tem como salvar esse código em txt na maquina? para que depois eu faça a leitura?
Encontrei o código abaixo mas não está dando certo, o que estou fazendo de errado?

seu html aqui.
Exibindo código da Pagina

Agradeço a ajuda desde ja.
Leandro Santos[/quote]
o que você quer fazer no código HTML ?
você está mostrando um inner ?
sabe pra que serve o alert e o innerHTML ?[/quote]

Renan desculpe se montei algo errado, na verdade o que eu quero é fazer a leitura de algumas informações que se encontram no código da pagina HTML e grava-las em banco de dados ou em txt
Quando ao alert se eu não me engano ele exibe uma mensagem correto?
O innerHMTL que se eu não me engano não tem nada a ver, ele é usado para escrever dinamicamente na pagina correto?

[quote=leandrosantos][quote=RenanRosa][quote=leandrosantos]Bom dia Pessoal, sou novo por aqui, sou novo em programação web tambem.
Porém estou precisando fazer a leitura de um código fonte de uma pagina web qualquer.
Gostaria da ajuda de você para saber como posso fazer isso, tem como salvar esse código em txt na maquina? para que depois eu faça a leitura?
Encontrei o código abaixo mas não está dando certo, o que estou fazendo de errado?

seu html aqui.
Exibindo código da Pagina

Agradeço a ajuda desde ja.
Leandro Santos[/quote]
o que você quer fazer no código HTML ?
você está mostrando um inner ?
sabe pra que serve o alert e o innerHTML ?[/quote]

Renan desculpe se montei algo errado, na verdade o que eu quero é fazer a leitura de algumas informações que se encontram no código da pagina HTML e grava-las em banco de dados ou em txt
Quando ao alert se eu não me engano ele exibe uma mensagem correto?
O innerHMTL que se eu não me engano não tem nada a ver, ele é usado para escrever dinamicamente na pagina correto?[/quote]

isso mesmo que disse, mas em vez de usar HTML por que não usa XML ?
tem muitas ferramentas que fazem isso, no caso do html você terá que ficar procurando tudo, não tem um padrão, a não ser que queira desenvolver um editor html :smiley:

[quote=RenanRosa][quote=leandrosantos][quote=RenanRosa][quote=leandrosantos]Bom dia Pessoal, sou novo por aqui, sou novo em programação web tambem.
Porém estou precisando fazer a leitura de um código fonte de uma pagina web qualquer.
Gostaria da ajuda de você para saber como posso fazer isso, tem como salvar esse código em txt na maquina? para que depois eu faça a leitura?
Encontrei o código abaixo mas não está dando certo, o que estou fazendo de errado?

seu html aqui.
Exibindo código da Pagina

Agradeço a ajuda desde ja.
Leandro Santos[/quote]
o que você quer fazer no código HTML ?
você está mostrando um inner ?
sabe pra que serve o alert e o innerHTML ?[/quote]

Renan desculpe se montei algo errado, na verdade o que eu quero é fazer a leitura de algumas informações que se encontram no código da pagina HTML e grava-las em banco de dados ou em txt
Quando ao alert se eu não me engano ele exibe uma mensagem correto?
O innerHMTL que se eu não me engano não tem nada a ver, ele é usado para escrever dinamicamente na pagina correto?[/quote]

isso mesmo que disse, mas em vez de usar HTML por que não usa XML ?
tem muitas ferramentas que fazem isso, no caso do html você terá que ficar procurando tudo, não tem um padrão, a não ser que queira desenvolver um editor html :D[/quote]

É que na verdade eu não tenho um xml disponivel para que eu faça isso, o que preciso pegar está escrito em uma pagina html entre as tags html, preciso fazer a leitura desse código e gravar em algum arquivo.
É uma pagina webcomum e preciso capturar as informações desta pagina.

Então pra isso você vai ter que andar todo o arquivo atraz da tag html, assim pegando o que vem em seguida, use os metodos da String:
indexOf(String str) ;
use :

int posHTML = minhaStringComConteudoDaPagina.indexOf("<html>") ;

essa variavel posHTML vai receber o valor da primeira posição onde está o , assim, some mais 5 (considere que o valor foi 132)
agora pegue onde está o

int posFechaHTML = minhaStringComConteudoDaPagina.indexOf("</html>") ;

então pegue o conteudo que está entre a tag com o metodo substring(int beginIndex, int endIndex) assim:

String conteudoEntreHTML = minhaStringComConteudoDaPagina.substring(posHTML+5, posFechaHTML );