Parsing duvida

Opa galera, blz?

Seguinte, estou criando um parsing e tenho q ir no site do buscape e buscar os produtos, no caso no meu codigo estou pesquisando por “iphone”.

Segue o codigo do meu sistema:

public static void main(String[] args) throws Exception {

DefaultHttpClient httpclient = new DefaultHttpClient();
String busca = "iphone";//aqui sera o txtproduto
HttpGet httpGet = new HttpGet("http://www.buscape.com.br/cprocura/"+busca+".html");

    try {
ResponseHandler<String> manipulador = new BasicResponseHandler();
String resposta = httpclient.execute(httpGet,manipulador);

int inicio = resposta.indexOf("<a data-position=");
        while(inicio != -1){
        	resposta = resposta.substring(inicio);
        	String produto = resposta.substring(resposta.indexOf("title"), resposta.indexOf("class"));
        	//produto = produto.substring(produto.indexOf("href"),produto.indexOf(",/href"));
        	//produto = produto.substring(produto.indexOf(">")+1);
        	System.out.println("Produto: "+produto);
        	resposta = resposta.substring(resposta.indexOf("string")+1);
        	//resposta = resposta.replaceAll("\\&quot;", "");
        	inicio = resposta.indexOf("title");
        }
        
    } finally {
        httpGet.releaseConnection();
    }
}

Segue o codigo do buscape:

R$ 3.249,00

  • em 89 lojas
  • Compare 122 preços
  • Smartphone Apple iPhone 4S 16GB Desbloqueado
    • Funções Extras: Agenda, Alarme, Calculadora, Calendário, Comando de Voz, Gravador de Voz, MP3 Player, Reproduz Vídeo, Videoconferência, Viva Voz
    • Resolução da Câmera: 8.0 MP
    • Conexões: Bluetooth, Fone de Ouvido, Wi-Fi
    • De: R$ 1.299,99
    • Minha duvida eh como capturar o titulo do produto, utilizando o meu codigo.
      Grato Pessoal!

  • Podia marcar em uma cor diferente o que você está procurando dentro dessa string gigante?

    Amigo, use um parser específico. Da forma que você está fazendo, vai deixar seu código frágil.

    Você pode plugar um SAX Reader customizado no dom4j e ler seus htmls de forma mais intuitiva.

    http://www.mail-archive.com/dom4j-user@lists.sourceforge.net/msg00733.html