Problemas com SAX e codifição do documento

1 resposta
T

Pessoal estou tentando analisar um documento XML utlizando o SAX, mas apresenta o seguinte erro:

java.io.UTFDataFormatException: Invalid byte 2 of 3-byte UTF-8 sequence.

Acredito que seja porque o meu documento XML esteja na codificação ISO… O problema é que quem gera este XML não pode alterar o padrão.

Alguém tem alguma alternativa?

1 Resposta

T

Uai, se o documento XML está na verdade codificado em ISO-8859-1 e não apresenta a instrução <?xml version='1.0' encoding='ISO-8859-1' ?> é um documento XML inválido :wink: O problema não é o SAX e sim o cara que produz o arquivo XML (que deveria especificar o encoding desde o começo).
Você pode (gambiarra) alterar o documento XML inválido para um válido, simplesmente lendo esse XML em uma String (talvez com FileReader) e convertendo para a codificação UTF-8 (aí é com você).

Criado 4 de agosto de 2005
Ultima resposta 4 de ago. de 2005
Respostas 1
Participantes 2