Manipulação de arquivo PDF

Olá,

alguém sabe como eu posso pegar um arquivo PDF e gerar um HTML dele?

mais especificamente: eu preciso saber onde estão as figuras nas paginas do PDF, para mim isso basta… uma solução seria a geração do HTML…

o que eu já olhei mas não consegui achar nada era com a biblioteca pdfbox

alguma sugestão?

Obrigado.