Estou começando uma aplicação que basicamente, monta um banco de dados a partir de artigos escritos, em formato pdf.
É o seguinte, o principal problema que tenho pela é: como eu farei para abrir o pdf e pegar as strings de dentro dele, por exemplo:
Tenho no pdf o nome do autor do artigo, gostaria de retirar de lá apenas o nome dele, sem instituição sem nada mais, alguém por aí sabe da existência de alguma api que consiga abrir o pdf, e por onde eu consiga pelo menos retirar fragmentos de texto de dentro dele?
Qualquer ajuda é bem vinda, obrigado. 8)