Saber/determinar o encoding de um arquivo.  XML
Índice dos Fóruns » Java Avançado
Autor Mensagem
Diabo Loiro
GUJ Master
[Avatar]
Membro desde: 24/03/2009 07:46:14
Mensagens: 1040
Localização: Praia Grande - SP
Offline

Ola pessoal estou tenho que ler um arquivo texto.. e gostaria de saber de da pra detectar.. o encoding dele.

algo como File.gerCurrentEncoding ou se isso é imposivel pois dependendo da onde vem o arquivo texto grava errado no banco de dados.

Obrigado.

Sun Certified Java Associate
Sun Certified Java Programer 6.0
Sun Certified Web Component Developer
Oracle Certified Professional, Java EE 5 Business Component Developer

Blog
http://brunodanielmarinho.wordpress.com

Fals - Osum Leader
http://osum.sun.com/group/fals


Schuenemann
GUJ Ranger

Membro desde: 13/01/2005 12:31:27
Mensagens: 854
Offline

Essa informação não vem no arquivo, então não tem como saber de forma precisa.
Mas dá pra tentar adivinhar a codificação; os navegadores fazem isso o tempo todo.

Sei dessa biblioteca, mas nunca usei: http://code.google.com/p/juniversalchardet/
roger_rf
GUJ Master

Membro desde: 29/04/2009 07:40:19
Mensagens: 1091
Localização: Natal/RN
Offline

Segue um link que pode ser útil:

http://blog.publicobject.com/2010/08/handling-byte-order-mark-in-java.html

Diabo Loiro
GUJ Master
[Avatar]
Membro desde: 24/03/2009 07:46:14
Mensagens: 1040
Localização: Praia Grande - SP
Offline

na verdade necessito ler o arquivo txt nestes 2 formatos..

UTF-8
ISO-8859-1

Alguem tem algum codigo de exemplo por que o objeto file não aceita eu setar o encoding.


Sun Certified Java Associate
Sun Certified Java Programer 6.0
Sun Certified Web Component Developer
Oracle Certified Professional, Java EE 5 Business Component Developer

Blog
http://brunodanielmarinho.wordpress.com

Fals - Osum Leader
http://osum.sun.com/group/fals


Diabo Loiro
GUJ Master
[Avatar]
Membro desde: 24/03/2009 07:46:14
Mensagens: 1040
Localização: Praia Grande - SP
Offline

Ele da exception quando vai ter UTF- 8 e ISO-8859-1

por que ele pega o default do SO que no caso é CP1252 dai quando vai ler UTF - 8 da pau.


Sun Certified Java Associate
Sun Certified Java Programer 6.0
Sun Certified Web Component Developer
Oracle Certified Professional, Java EE 5 Business Component Developer

Blog
http://brunodanielmarinho.wordpress.com

Fals - Osum Leader
http://osum.sun.com/group/fals


kfazolin
Entusiasta Java

Membro desde: 23/11/2009 17:05:22
Mensagens: 21
Offline

Tenta ler assim:


"e conhecereis a verdade, e a verdade vos libertará."
João 8:32
www.biblia.com.br
 
Índice dos Fóruns » Java Avançado
Ir para:   
Powered by JForum 2.1.8 © JForum Team