Como acessar conteudo dentro de uma pagina

2 respostas
T

Ola pessoal, seguinte.

Alguem sabe como fazer para acessar o conteudo dentro de uma pagina html?

Por exemplo, vamos supor que entro em um site (www.google.com) e quero procurar por tal codigo dentro dele ().

Alguem saberia qual classe faz isto?

Abraços

2 Respostas

Eder_Peixoto

A classe abaixo captura o código-fonte de uma página, conforme a URL especificada. Pelo que entendi, é isso que você quer.

package org.epm.utilitarios;

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.ArrayList;
import java.util.List;
import javax.swing.JOptionPane;

/**
 * Realiza a leitura do codigo-fonte de determinada URL.
 * <p><u><b>Observação:</b></u>
 * <p>Código retirado da página: "http://www.guj.com.br/posts/list/31440.java", sendo realizadas algumas modificações.
 * @author cicero (original) e Éder (modificações e adaptações).
 * @version 1.02 - 28/07/2009.
 */
public class GetSourceURL{
    private final String path;              //Endereço

    /**
     * Construtor.
     * @param url URL a ser obtida o código.
     */
    public GetSourceURL(String url){
        path = url;
    }//Fecha construtor

    /**
     * Obtém o código-fonte de determinada URL.
     */
    public List< String > getSource( ) throws MalformedURLException, IOException{
        List< String > source = new ArrayList< String >();

        URL url = new URL( path );
        BufferedReader reader = new BufferedReader( new InputStreamReader( url.openStream() ) );
        String linha = "";

        while( ( linha = reader.readLine() ) != null )
            source.add( linha );

        reader.close();

        return source;
    }//Fecha método.
}//Fecha classe
T

Obrigado cara, é isto mesmo que queria.

Vou estar testando esta aplicação mais tarde. Obrigado pela ajuda.

Abraços

Criado 28 de julho de 2009
Ultima resposta 28 de jul. de 2009
Respostas 2
Participantes 2