Lendo arquivo pdf

1 resposta
spranta

Alguem sabe se é possivel abrir um arquivo pdf e ler linha por linha o conteudo dele?

1 Resposta

_fs

Sim, é possível, e há algumas bibliotecas que fazem isso.

Aqui um exemplo simples - não coloque isso em produção -, sem tratamento de erros, de como extrair o texto de um arquivo .pdf utilizando PDFBox:

File file = new File( "file.pdf" );
FileInputStream is = new FileInputStream( file );

PDFParser parser = new PDFParser( is );
parser.parse();
COSDocument cosDoc = parser.getDocument();

PDFTextStripper stripper = new PDFTextStripper();
String docText = stripper.getText( new PDDocument( cosDoc ) );
Criado 29 de janeiro de 2007
Ultima resposta 29 de jan. de 2007
Respostas 1
Participantes 2