Membro desde: 19/01/2004 01:35:23
Mensagens: 541
Localização: Rio de Janeiro
Offline
Pessoal,
Vou precisar comparar textos ignorando acentos e caracteres como "ç". A idéia inicial é aplicar uma regex e trocar os caracteres acentuados e similares por seus respectivos na tabela ASC básica. O problema é que a regex teria que tratar cada um deles isoladamente e acho que a forma como fiz vai gerar muito processamento desnecessário.
Alguma idéia pra fazer isso mais rápido e mais fácil?
Membro desde: 29/04/2003 23:09:15
Mensagens: 4061
Localização: São Paulo
Offline
Sim! A API do ICU4J faz isso para você da maneira correta. Ela usa as regras de collation do unicode.
http://www.kumpera.net/blog/ http://www.mono-project.com/
"Each individual should work for himself. People will not sacrifice themselves for the company. They come to work at the company to enjoy themselves."
Soichiro Honda
Membro desde: 09/01/2005 23:28:22
Mensagens: 3717
Localização: João Pessoa, Paraíba - Brasil
Offline
Eu acho que o LIPE tinha indicado um plugin do Eclipse que fazia isso, ele inclusive transformava das letras acentuadas pra entities XML. Mas eu tireo o eclipse velho daqui e esqueci de olhar esse plugin...