Java.URL - Problemas com Acentuação

0 respostas
F

Pessoal,

Criei um programinha que captura o conteúdo de páginas Web, mas estou tento problemas para capturar textos com acentuação:

public Coletor(String surl) {
    vecstream = new Vector();
    try{
        URL url = new URL(surl);
        BufferedReader in = new BufferedReader(
                                new InputStreamReader(
                                url.openStream()));

        String inputLine;
        while ((inputLine = in.readLine()) != null)
            vecstream.add(inputLine);
            //System.out.println(inputLine);

        in.close();
    }catch(Exception e){}
    
}

Tenho duas coleções que contém o valor que é capturado e o que ele corresponde:
Ex: À = À / ã = ã / É = É

Até aí tudo bem. É só fazer a troca.

Agora vamos ao problema:

“Á” e “Í” simplesmente corresponde ao mesmo valor que vem da URL capturada ou o openStream não consegue capturar esses valores corretamente.
Com isso não tem como descobrir se o valor é Á ou Í.

Pergunta: Existe alguma outra alternativa para capturar textos acentuados da Web?
Existe algum tipo de Decoder para traduzir automaticamente esses valores capturados para textos corretamente acentuados?

Obrigado

Criado 19 de dezembro de 2006
Respostas 0
Participantes 1