Boa tarde galera.
Então, estou com um probleminha que é o seguinte, eu tenho um sistema que faz a leitura de um arquivo pdf, porém preciso separar partes desse arquivo através de seus títulos, ou seja, crio uma expressão regular para reconhecer o título e separo até achar outro título igual.
Tentei criar uma expressão regular, porém não estou conseguindo.
Segue abaixo como é o texto e como eu fiz para separá-las.
E como fiz para separar o texto:
private Pattern PAT_RECIN = Pattern.compile("(([0-9\\.\\s])++)TEXTO INDICADOR(\\s)*(([\\S])+)(\\s)+");
String artText = "001. TEXTO INDICADOR 0000000-00.2014.0.00.0001 bla bla bla bla bla bla bla bl bla
bla bla bla bla bla bla bla bl bla bla bla bla bla bla bla bla bl bla
bla bla bla bla bla bla bla bl bla bla bla bla bla bla bla bla bl bla
bla bla bla bla bla bla bla bl bla bla bla bla bla bla bla bla bl bla
002. TEXTO INDICADOR 0000000-00.2014.0.00.0002 bla bla bla bla bla bla bla bl bla
bla bla bla bla bla bla bla bl bla bla bla bla bla bla bla bla bl bla
bla bla bla bla bla bla bla bl bla bla bla bla bla bla bla bla bl bla
bla bla bla bla bla bla bla bl bla bla bla bla bla bla bla bla bl bla "
// Quebra por expressao
Matcher m2 = PAT_RECIN.matcher(artText);
while (m2.find())
{
...
}
Porém não está quebrando o texto corretamente, alguém que poderia me ajudar?