Forma fácil de transformar ó em o, á em a, ç em c etc  XML
Índice dos Fóruns » Assuntos gerais (Off-topic)
Autor Mensagem
dsiviotti
Virtual Machine Man
[Avatar]

Membro desde: 19/01/2004 01:35:23
Mensagens: 541
Localização: Rio de Janeiro
Offline

Pessoal,

Vou precisar comparar textos ignorando acentos e caracteres como "ç". A idéia inicial é aplicar uma regex e trocar os caracteres acentuados e similares por seus respectivos na tabela ASC básica. O problema é que a regex teria que tratar cada um deles isoladamente e acho que a forma como fiz vai gerar muito processamento desnecessário.


Alguma idéia pra fazer isso mais rápido e mais fácil?

Douglas Siviotti
[Email] [WWW] [Yahoo!] [ICQ]
leonardootto
Debugger
[Avatar]

Membro desde: 26/03/2006 12:34:30
Mensagens: 57
Offline

O que vc pode fazer é verificar se esta fora da tabela ASCII padrão.
Assim.


Acho que é mais rapido mas não sei se é mais facil.

bandrade
GUJ Ranger

Membro desde: 20/01/2003 15:45:15
Mensagens: 782
Offline

Achei isso aki uma vez e achei interessante, pode ser que resolva seu problema...

http://java.sun.com/j2se/1.4.2/docs/api/java/lang/String.html#getBytes(java.lang.String) .

De lá vc vai na classe CharsetEncoder...

Transforma sua string em um array de bytes, + usando o charset apropriado, deve ter suporte à sua necessidade.

**editado
Procurando + um bocado , achei isso:
http://www-128.ibm.com/developerworks/java/library/j-text-searching.html
louds
Moderador
[Avatar]

Membro desde: 29/04/2003 23:09:15
Mensagens: 4061
Localização: São Paulo
Offline

Sim! A API do ICU4J faz isso para você da maneira correta. Ela usa as regras de collation do unicode.

http://www.kumpera.net/blog/
http://www.mono-project.com/
"Each individual should work for himself. People will not sacrifice themselves for the company. They come to work at the company to enjoy themselves."
Soichiro Honda
[ICQ]
rodrigo_gomes
GUJ Master
[Avatar]

Membro desde: 25/11/2003 15:45:21
Mensagens: 1088
Localização: São Paulo
Offline

dê uma olhada aqui
Unaccent letters

[]´s
Rodrigo

rodrigo de paiva gomes




http://twitter.com/rod_gomes
[WWW] [MSN] [ICQ]
Mauricio Linhares
Moderador
[Avatar]

Membro desde: 09/01/2005 23:28:22
Mensagens: 3717
Localização: João Pessoa, Paraíba - Brasil
Offline

Eu acho que o LIPE tinha indicado um plugin do Eclipse que fazia isso, ele inclusive transformava das letras acentuadas pra entities XML. Mas eu tireo o eclipse velho daqui e esqueci de olhar esse plugin...

Meu blog sobre desenvolvimento | My Last.fm | @mauriciojr

Screencast de Introdução a linguagem Objective-C
[WWW]
 
Índice dos Fóruns » Assuntos gerais (Off-topic)
Ir para:   
Powered by JForum 2.1.8 © JForum Team