Ler arquivo do WORD (.doc) com sua formatação e convertê-lo para HTML

Pessoal, boa tarde!

Consegui fazer a leitura de um arquivo .doc e .docx com a biblioteca APACHE POI.
O meu problema é o seguinte:
[list]Preciso ler o arquivo, mas também preciso ler a formatação da mesma (essas informações de formatação somente: Plano, Sublinhado, Itálico ou Negrito - o restante é desnecessário). Após fazer a leitura do texto e sua formatação, converto o mesmo para uma String em linguagem HTML, que seria a escolha mais indicada e simples.
[/list][list]Preciso salvar imagens que estejam no documento em uma pasta e depois colocar uma tag no meu HTML convertido, na posição onde a imagem estava no arquivo original. [/list]

Alguém sabe como posso fazer isso?
Verifiquei o site da biblioteca POI e as informações são muito vagas quando é preciso fazer extração de texto com formatação. Parece ser um pouco difícil fazê-lo, pois não encontro informações detalhadas em minhas pesquisas.