Eu gostaria de saber se alguem conhece uma classe que receba um HTML e retorne uma string ou qualquer outra coisa contendo todas as palavras do HTML menos as sintaxes da linguagem, ou seja, soh as informações propriamente ditas no arquvio HTML. :???:
Algum filtro HTML?
C
2 Respostas
L
Vc pode ler o HTML como fosse um txt e retirar vc mesmo as palavras reservadas dali, vc pode ainda usar um Tokenizer para fazer isso;
Qualquer outra duvida poste ai.
C
Isso eu sei, mas tem problema para alguns casos de palavras acentuadas pois a palavra árvore estará escrita a00045(alguma coisa)rvore. Entendeu? Eu quero saber se na API ou alguém conhece uma classe que já me retorne todas as palavras menos as das sintaxes
Criado 8 de novembro de 2004
Ultima resposta 8 de nov. de 2004
Respostas 2
Participantes 2
Alura O que é Python? — um guia completo para iniciar nessa linguagem de programação Acesse agora o guia sobre Python e inicie sua jornada nessa linguagem de programação: o que é e para que serve, sua sintaxe e como iniciar nela!
Casa do Codigo Engenharia de Prompt para Devs: Um guia para aprender a... Por Ricardo Pupo Larguesa — Casa do Codigo