tirar tags HTML de texto antes de salvar em banco  XML
Índice dos Fóruns » Java Básico
Autor Mensagem
khichfy
Debugger

Membro desde: 01/02/2008 15:46:33
Mensagens: 62
Offline

Senhores
estou com uma duvida...
È o seguinte:

1 - Atraves de uma url obtive um arquivo XML
2 - Transformei o xml em Objeto (mandei um unmarshal)
3 - tal objeto tem varios campos, entre eles um chamado "noticia".
4 - dou um get em noticia e mando salvar em banco atraves do hibernate.

o problema é que o texto vai com tags html (td, table, br, etc...) e quando mando um find da noticia, a mesma me aparece toda zuada...
sem falar na acentuação que vai zuada tb...

alguem indica um caminho para retirar essas tags antes de envia-la para o banco ?

valeu!!!

This message was edited 1 time. Last update was at 16/09/2008 14:34:41

Marcos Vieira
What is classpath?

Membro desde: 13/08/2008 13:44:00
Mensagens: 8
Offline

Num pedaço de código HTML, para retirar todas as tags HTML, mantendo apenas o texto presente, veja estas funções abaixo.
A base é o médoto replaceAll da classe String.

Marcos Vieira - Tec. Informação
"Sucesso é ser feliz"
[Email]
khichfy
Debugger

Membro desde: 01/02/2008 15:46:33
Mensagens: 62
Offline

legal cara!!
funcionou para um dado contexto do meu código...

Mas no meu texto aparece uns caracteres muito estranhos, como :
& aacute
& acirc;
& agrave;
& atilde;
& ccedil;
& eacute;
& ecirc;
& iacute;
& oacute;
& ocirc;
& otilde;
& uacute;
& uuml;

obs: coloquei um espaço entre "&" "uuml" senão o navegador converte para o acento correto... (fiz com todos)

eu tava vendo uma tabela na url :http://www.icmc.usp.br/ensino/material/html/especiais.html
que identifica cada um desses caracteres especiais...

seu código funcionou para tirar as tags classicas do html valeu!
agora to tentando olhar internamente do JEditorPane para entender como ele consegue converter tudo relacionado a html em texto "normal"

mas ta sinistro... se souber de outra solução eu agradeço

ate mais!

This message was edited 2 times. Last update was at 19/09/2008 11:14:11

renzonuccitelli
GUJ Master

Membro desde: 17/09/2008 12:58:32
Mensagens: 1133
Offline

Se você estiver recebendo um XML, só precisa ler o mesmo. Recomendo para leitura o http://sourceforge.net/projects/jcoltrane/
Espero ter ajudado

This message was edited 1 time. Last update was at 19/09/2008 11:51:39


Renzo Nuccitelli

Engenheiro de Computação - ITA

http://nuccitec.com.br/
http://blog.nuccitec.com.br/
http://jcoltrane.sf.net
http://jfera.nuccitec.com.br/
http://code.google.com/p/webapp-ce/
renzonuccitelli
GUJ Master

Membro desde: 17/09/2008 12:58:32
Mensagens: 1133
Offline

Agora que vi que você só quer o campo notícia. Pelo que entendi, seria somente o corpo desse elemento. Se for isso, usa o JColtrane com essa classe:


Depois só colocar essa classe no construtor do JColtraneXMLHander e mandar parsear usando o parser do SAX (API padrão já presente na biblioteca do sistema).

This message was edited 4 times. Last update was at 19/09/2008 12:28:43


Renzo Nuccitelli

Engenheiro de Computação - ITA

http://nuccitec.com.br/
http://blog.nuccitec.com.br/
http://jcoltrane.sf.net
http://jfera.nuccitec.com.br/
http://code.google.com/p/webapp-ce/
 
Índice dos Fóruns » Java Básico
Ir para:   
Powered by JForum 2.1.8 © JForum Team