Extração de conteúdo de PDF's

0 respostas
C

Pessoal,

Alguém conhece uma boa ferramenta de extração/conversão de PDF’s? Quero uma que seja capaz de reconhecer figuras dentro de documento, extraindo-as, por exemplo, como JPG quando forem desenho ou quando o OCR não reconhecer os caracteres. As melhores que encontrei foram Tika (do projeto Lucene da Apache), Aspose e Adobe Acrobat (operaçãp “salvar como texto”), mas não são capazes de reconhecer figuras. Em resumo, gostaria de uma ferramenta que convertesse, por exemplo, PDF’s em arquivos HTML ou RTF.

Obrigado,

Criado 27 de dezembro de 2008
Respostas 0
Participantes 1