Ler conteúdo de um pdf

Alguém conhece uma api, que faça leitura de um pdf ou imagem (jpg, jpge, bpm) e possa fazer distinção de figuras baseado em alguns critérios que possa por, como um quadrado um circulo, etc…?

Para ler e manipular PDF, você pode usar a API iText.
Para fazer reconhecimento de padrões e imagens, recomendo algo pronto, como o OpenCV por exemplo.

1 curtida

Obrigado, vou verificar.

Bom, iText se você for usar em um projeto free e open source e’ de graça, mas se for usar comercialmente tem que pagar.

Já o pdfbox da apache e’ free independente se for comercial ou não.

Ambos estão ainda bastante vinculados ao Swing, embora da pra usa-los dentro do JavaFX.

Existem outros pagos que já tem na base o javaFX.

1 curtida