Pessoal,
Alguém conhece uma boa ferramenta de extração/conversão de PDF’s? Quero uma que seja capaz de reconhecer figuras dentro de documento, extraindo-as, por exemplo, como JPG quando forem desenho ou quando o OCR não reconhecer os caracteres. As melhores que encontrei foram Tika (do projeto Lucene da Apache), Aspose e Adobe Acrobat (operaçãp “salvar como texto”), mas não são capazes de reconhecer figuras. Em resumo, gostaria de uma ferramenta que convertesse, por exemplo, PDF’s em arquivos HTML ou RTF.
Obrigado,