E ae pessoal, eu estou em um projeto Spring que tem como intenção automatizar a conversão de pdf para texto de um arquivo especifico que será baixado diariamente de um webcrawler e estou tendo uma certa dor de cabeça utilizando o PDFBox porque ele não tem muita documentação de como salvo um arquivo convertido do PDF ou como devo realizar/declarar a inicialização no SpringBootApplication. Queria uma ajuda para implementar melhor o código que estou utilizando como exemplo para esse tópico:
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.text.PDFTextStripper;
import java.io.File;
import java.io.IOException;
public class Reading_Text {
public static void main(String[] args) throws IOException{
//Busca o documento a ser convertido
File file = new File("/home/felipe/Downloads/my_document.pdf");
PDDocument doc = PDDocument.load(file);
//Instancia a classe PDFTextStripper
PDFTextStripper pdfTextStripper = new PDFTextStripper();
//Recupera informação convertida e lança no terminal
String text = pdfTextStripper.getText(doc);
System.out.println(text);
//Fecha o Documento
doc.close();
}
}