Pessoal, boa tarde.
Estou desenvolvendo um programa para automatizar a importação de arquivos pdm (Power Designer) para documentação
O objetivo e retirar apenas as tabelas e sua descrições.
O que temos como exemplo é:
<a:Code>TBP_EMPRESA</a:Code<name />
<a:Comment>Table responsável por armazenar valores de empresa
</a:Comment>
lixo
lixo
lixo
<a:Code>TBP_PESSOA</a:Code<name />
<a:Comment>Table responsável por
armazenar
valores de pessoa
</a:Comment>
O que preciso fazer e capturar, através de expressão regular, todos os conjunto de começam com <a:Code> e em seguida termine no primeiro </a:Comment>
Onde consegui chegar foi no código:
^<a:Code>TBP_((.|\s)*)</a:Comment>
Só que desta forma ele pega tudo que está entre <a:Code> e o </a:Comment>, inclusive o lixo
Procuro um código onde me se uma seleção:
1 - <a:Code>TBP_EMPRESA</a:Code
<a:Comment>Table responsável por armazenar valores de empresa
</a:Comment>
2 - <a:Code>TBP_PESSOA</a:Code
<a:Comment>Table responsável por
armazenar
valores de pessoa
</a:Comment>
Alguém poderia me ajudar e falar qual é a burrada que estou fazendo?