Analisador de Texto

5 respostas
Psycopata

Gente, eu gostaria de saber se existe pronta, alguma ferramenta que serve para analisar um texto.
Na verdade, é um analisador lexico.
O que eu preciso é de um analizador que eu possa configurá-lo com as determinadas regras (via XML, por exemplo) e quando for usar, jogar um texto ou um arquivo texto e o analisador me retornasse se tem erros ou não nesse texto, e em caso de erros, quais são e aonde estão.

Bom, o que eu vou validar não é se o usuário digitou certo ou errado. É se ele produziu um documento de acordo com regras pré-definidas (é que o arquivo é executado em main frame e precisa está num determinado padrão), por isso eu tenho que entrar com as regras.

Caso, não exista, terei que desenvolver a ferramenta. Porém isso não é muito interessante porque existe um urgência nessa solução.

Então, alguém conhece alguma ferramenta para isso que eu preciso?

5 Respostas

E

Muito vago. Que tipo de texto você precisa entrar e que tipos de erros você quer detectar?

Psycopata

O texto é uma documentação de rotonas Cobol para main frame.
Essa documentação é estruturada segundo varias regras. Caso o texto não esteja dentro dessas regras, ele não pode ser submetido ao main frame.

Então, eu o que quero detectar é se o texto está coerente às regras. Se não, deve ser informado qual regra foi quebra e aonde está o erro no arquivo.

Essas regras, eu preciso impostá-la, pq caso haja alguma mudança, eu posso reconfigurar a ferramenta sem a necessidade de recompilação.

fabiomazzo

Existe sim: http://jflex.de/manual.html

E

Hum… você pode postar um exemplo dessa tal documentação e de algumas dessas regras?

Psycopata

Vou dar uma olhada, valeu.

entanglement, olha, acredito que eu não posso publicar porque é coisa interna da empresa, mas é coisa do tipo:

O arquivo não pode ter acentos ou Ç
O arquivo é separado nos seguintes tótipos:
- Tópico 1;
- Tópico 2;
- Tópico 3;
...
- Tópico n;

O nome dos tópicos devem ser em maíscula
Um texto deve começar numa determinda coluna e ir até a coluna X;
As siglas deve ser em 2 dígitos seguido de dois pontos e espaço
Nomes devem ser separados por hífen.

Sabe, coisas desse tipo.

Criado 8 de abril de 2010
Ultima resposta 8 de abr. de 2010
Respostas 5
Participantes 3