Estou recebendo documento .pdf do jsp, faço a leitura desse documento extraindo texto dele.
Estou percorrendo esse texto para buscar uma informação que seria: nome: douglas. Não estou conseguindo.
// Recebendo arquivo do jsp
arquivo = request.getParameter("arquivo");
// passando arquivo para File
imageFile = new File(arquivo);
Tesseract instance = new Tesseract();
// Caminho do tesseract
instance.setDatapath("C:\\Tess4J");
// Linguagem leitura do texto
instance.setLanguage("por");
// Extraindo texto da imagem
result = instance.doOCR(imageFile).toLowerCase();
texto = result;
System.out.println(texto);
percorrerTexto(texto);
protected void percorrerTexto(String texto) {
String nf[] = texto.split("\n");
// Percorrendo toda a String
for( int i = 0; i < nf.length; i++ ) {
String result = nf[i].toString();
// Verificando se tem nf na String
if(nf[i].contains("nome")) {
System.out.println("Resultado = " + result);
}
}**texto em negrito**
extrair texto eu consigo normalmente. Estou percorrendo todo o texto. o que não estou conseguindo é pegar determinada palavra desse texto que foi extraído.