Ler arquivo do WORD (.doc) com sua formatação e convertê-lo para HTML  XML
Índice dos Fóruns » Java Avançado
Autor Mensagem
diego_qmota
JavaEvangelist
[Avatar]

Membro desde: 28/09/2008 15:44:35
Mensagens: 346
Localização: Paulínia
Offline

Pessoal, boa tarde!

Consegui fazer a leitura de um arquivo .doc e .docx com a biblioteca APACHE POI.
O meu problema é o seguinte:
  • Preciso ler o arquivo, mas também preciso ler a formatação da mesma (essas informações de formatação somente: Plano, Sublinhado, Itálico ou Negrito - o restante é desnecessário). Após fazer a leitura do texto e sua formatação, converto o mesmo para uma String em linguagem HTML, que seria a escolha mais indicada e simples.
  • Preciso salvar imagens que estejam no documento em uma pasta e depois colocar uma tag <img> no meu HTML convertido, na posição onde a imagem estava no arquivo original.


  • Alguém sabe como posso fazer isso?
    Verifiquei o site da biblioteca POI e as informações são muito vagas quando é preciso fazer extração de texto com formatação. Parece ser um pouco difícil fazê-lo, pois não encontro informações detalhadas em minhas pesquisas.

    This message was edited 1 time. Last update was at 11/11/2011 15:05:23


    "Go ahead, make my day!"
     
    Índice dos Fóruns » Java Avançado
    Ir para:   
    Powered by JForum 2.1.8 © JForum Team