Pessoal, boa tarde!
Consegui fazer a leitura de um arquivo .doc e .docx com a biblioteca APACHE POI.
O meu problema é o seguinte:
Preciso ler o arquivo, mas também preciso ler a formatação da mesma (essas informações de formatação somente: Plano, Sublinhado, Itálico ou Negrito - o restante é desnecessário). Após fazer a leitura do texto e sua formatação, converto o mesmo para uma String em linguagem HTML, que seria a escolha mais indicada e simples.
Preciso salvar imagens que estejam no documento em uma pasta e depois colocar uma tag <img> no meu HTML convertido, na posição onde a imagem estava no arquivo original.
Alguém sabe como posso fazer isso?
Verifiquei o site da biblioteca POI e as informações são muito vagas quando é preciso fazer extração de texto com formatação. Parece ser um pouco difícil fazê-lo, pois não encontro informações detalhadas em minhas pesquisas.
This message was edited 1 time. Last update was at 11/11/2011 15:05:23
|