Forma fácil de transformar ó em o, á em a, ç em c etc

Question

Pessoal, Vou precisar comparar textos ignorando acentos e caracteres como "ç". A idéia inicial é aplicar uma regex e trocar os caracteres acentuados e similares por seus respectivos na tabela ASC básica. O problema é q&hellip;

leonardootto · Answer

O que vc pode fazer é verificar se esta fora da tabela ASCII padrão. Assim. public class Test{ public static void main(String[] args) { System.out.println(normalizar("ááã")); } public static String normalizar(String valor) { StringBuffer sb = new StringBuffer(valor); for (int i = 0; i <

bandrade · Answer

Achei isso aki uma vez e achei interessante, pode ser que resolva seu problema…

http://java.sun.com/j2se/1.4.2/docs/api/java/lang/String.html#getBytes(java.lang.String) .

De lá vc vai na classe CharsetEncoder…

Transforma sua string em um array de bytes, + usando o charset apropriado, deve ter suporte à sua necessidade.

**editado
Procurando + um bocado , achei isso:
http://www-128.ibm.com/developerworks/java/library/j-text-searching.html

louds · Answer

Sim! A API do ICU4J faz isso para você da maneira correta. Ela usa as regras de collation do unicode.

5 Respostas

Topicos relacionados