Olá!
Estou tentando fazer o download dessa página:
http://agencia.tse.gov.br/sadAdmAgencia/noticiaSearch.do?acao=get&id=1019433
que contém o seguinte texto:
RE-AC: Programa ?Eleitor mais Cidadão? faz 441 atendimentos no Colégio Meta
29 de abril de 2008 - 16h23 [Existe documentos relacionados a esta notícia] Ver Arquivos
O Programa ?Eleitor mais Cidadão?, do Tribunal Regional Eleitoral…
No cabeçalho da página indica o charset ISO-8859-1:
Mas quando faço o download da página pelo Java, ao final tenho um array de bytes.
Pra converter em String, uso a codificação q veio da página (iso) e as aspas seguinte: ?Eleitor mais Cidadão?
n aparecem no console do java. Ateh ai blz. Se eu salvo o file como ISO fica OK. Mas se converto pra UTF-8 dah pau.
Quando leio com o charset do windows (windows-1252, acho) as aspas aparecem no console blz!
Queria uma ajuda pra converter esse catarectes especiais, pois minha aplicação usa UTF-8, tudo UTF! e esse caracter e o tração (segue abaixo, deram pau):
PROCESSUAL CIVIL ? AGRAVO REGIMENTAL ? AGRAVO DE INSTRUMENTO ?
LITISPENDÊNCIA ? DIVERSIDADE DE CAUSAS DE PEDIR ? ANÁLISE DE
ELEMENTOS FÁTICO-PROBATÓRIOS NA VIA RECURSAL ELEITA ?
IMPOSSIBILIDADE ? OBSTÁCULO DA SÚMULA N. 7/STJ.
Alguem sabe como resolver? O UTF-8 n estes caracters? Os caracters resultantes sao loucões (ver abaixo).
TRE-AC: Programa �Eleitor mais Cidadão� faz 441 atendimentos no Colégio Meta
SOCCOOORRROOOOO!!