Exceptions com SAX :(

2 respostas
andre_a_s

Bom dia :slight_smile:

Estou fazendo uma rotina usando SAX para ler os XMLs (segui o exemplo aqui do GUJ) mas estou tendo alguns problemas:

A rotina funciona bonitinha e tal… mas alguns XMLs, dependendo do tamanho ele dá a seguinte exception:

org.xml.sax.SAXParseException: Character conversion error: "Unconvertible UTF-8 character beginning with 0xb4" (line number may be too low). Erro: org.xml.sax.SAXParseException: Character conversion error: "Unconvertible UTF-8 character beginning with 0xb4" (line number may be too low). at org.apache.crimson.parser.InputEntity.fatal(Unknown Source) at org.apache.crimson.parser.InputEntity.fillbuf(Unknown Source) at org.apache.crimson.parser.InputEntity.getNameChar(Unknown Source) at org.apache.crimson.parser.Parser2.nameCharString(Unknown Source) at org.apache.crimson.parser.Parser2.maybeGetNameCacheEntry(Unknown Source) at org.apache.crimson.parser.Parser2.maybeElement(Unknown Source) at org.apache.crimson.parser.Parser2.content(Unknown Source) at org.apache.crimson.parser.Parser2.maybeElement(Unknown Source) at org.apache.crimson.parser.Parser2.content(Unknown Source) at org.apache.crimson.parser.Parser2.maybeElement(Unknown Source) at org.apache.crimson.parser.Parser2.parseInternal(Unknown Source) at org.apache.crimson.parser.Parser2.parse(Unknown Source) at org.apache.crimson.parser.XMLReaderImpl.parse(Unknown Source) at javax.xml.parsers.SAXParser.parse(Unknown Source) at consa.carga.ExemploSax.main(ExemploSax.java:25)

Meu parser está assim:

SAXParser parser = SAXParserFactory.newInstance().newSAXParser(); InputSource input = new InputSource(arquivo); parser.parse(input, new ProfessorTurma());

Mas não existe problem algum com o XML pq ele está validado com o DTD e se eu diminuir o tamanho dele (tirar os 100 primeiros registros, por exemplo) ele funciona!
Ou seja… só ta dando esse problema quando o XML é mto grande.
Alguem tem uma luz ae??? :roll:

2 Respostas

aborges

Existe algum caracter fora do padrao UTF-8 ( provavelmente um acento ou um “ç”)

andre_a_s

Obrigado por ter respondido!
Era esse mesmo o problema
Como no XML não tinha o encoding definido então ele interpretava sempre com UTF-8
Eu mudei para ISO-8859-1 e funcionou!
Mesmo assim, obrigado!
Abraço!
:smiley:

Criado 30 de setembro de 2004
Ultima resposta 30 de set. de 2004
Respostas 2
Participantes 2