Algum filtro HTML?

2 respostas
C

Eu gostaria de saber se alguem conhece uma classe que receba um HTML e retorne uma string ou qualquer outra coisa contendo todas as palavras do HTML menos as sintaxes da linguagem, ou seja, soh as informações propriamente ditas no arquvio HTML. :???:

2 Respostas

L

Vc pode ler o HTML como fosse um txt e retirar vc mesmo as palavras reservadas dali, vc pode ainda usar um Tokenizer para fazer isso;

Qualquer outra duvida poste ai.

C

Isso eu sei, mas tem problema para alguns casos de palavras acentuadas pois a palavra árvore estará escrita a00045(alguma coisa)rvore. Entendeu? Eu quero saber se na API ou alguém conhece uma classe que já me retorne todas as palavras menos as das sintaxes

Criado 8 de novembro de 2004
Ultima resposta 8 de nov. de 2004
Respostas 2
Participantes 2