Análise de Texto Estruturada (Parsing) - *.pdf | Retirar dados estruturados de arquivos PDF

16 de outubro de 2018 1 resposta

guilhermevmeyer 16 de outubro de 2018

Boa tarde pessoal,

Preciso de uma ajuda.

Tenho um projeto que preciso transformar diversos (mais de 30.000) arquivos PDF em um banco de dados estruturado, onde preciso extrair as informações. Já tentei alguns serviços, como por exemplo docparser.com, mas não tive o resultado desejado, não pela complexidade dos dados, mas sim pela grande quantidade de exceções.

Vocês conhecem alguma ferramente para este tipo de extração?

Obrigado e abraços a todos!

Guilherme

1 Resposta

javaflex 16 de out. de 2018 1 like

Se tiver conhecimento em programação, usando por exemplo C# com a lib iTextSharp poderá ter controle de tudo.

Criado 16 de outubro de 2018

Ultima resposta 16 de out. de 2018

Respostas 1

Participantes 2

1 Resposta

Topicos relacionados