Pdf — GUJ

Estou começando uma aplicação que basicamente, monta um banco de dados a partir de artigos escritos, em formato pdf.

É o seguinte, o principal problema que tenho pela é: como eu farei para abrir o pdf e pegar as strings de dentro dele, por exemplo:

Tenho no pdf o nome do autor do artigo, gostaria de retirar de lá apenas o nome dele, sem instituição sem nada mais, alguém por aí sabe da existência de alguma api que consiga abrir o pdf, e por onde eu consiga pelo menos retirar fragmentos de texto de dentro dele?

Qualquer ajuda é bem vinda, obrigado. 8)

4 Respostas

quikkoo 20 de set. de 2010

itext

Balena 20 de set. de 2010

OK mas o IText até onde eu cheguei não me deixa procurar os dados dentro do pdf, algum tutorial de como usar o IText?

quikkoo 20 de set. de 2010

olhe os códigos do capitulo 6 do livro itext in action, infelizmente o povo do itext removeu as explicações detalhadas de cada código, deve ser pra vender mais o livro hehe, mas somente o código já é uma boa a ajuda

flw, t+

Balena 20 de set. de 2010

Obrigado

4 Respostas

Topicos relacionados