Problemas com conversão de arquivo HTML para .txt - Acentuação

0 respostas
edu_fernandes

Boa tarde a todos.

Estou enfrentando um problema em uma aplicação que estou desenvolvendo.

Quando converto um arquivo html para .txt, os acentos não são mostrados, sendo substituidos por pequenos quadrados.

Segue abaixo meu método para converter.

Espero que possam me ajudar.

...
        FileReader in = new FileReader("C:/Teste.html");
        HtmlToText parser = new HtmlToText();
        parser.parse(in);
        in.close();



public class HtmlToText extends HTMLEditorKit.ParserCallback {
 StringBuffer s;

 public HtmlToText() {}

 public void parse(Reader in) throws IOException {
   s = new StringBuffer();
   ParserDelegator delegator = new ParserDelegator();
   // the third parameter is TRUE to ignore charset directive
   delegator.parse(in, this, Boolean.TRUE);
 }

 @Override
 public void handleText(char[] text, int pos) {
   s.append(text);
   s.append("\r\n");
 }

 public String getText() {
   return s.toString();
 }
 
}

Sem mais.

Obrigado.

Criado 14 de novembro de 2011
Respostas 0
Participantes 1