Estou utilizando o Apache POI para pegar o texto de um arquivo *.doc, e funciona perfeitamente.
Exceto por um detalhe: o arquivo possui caixas de texto, cujos textos não são lidos.
Eis o código:
try {
File sourceFile = new File("C:/arquivo.doc");
FileInputStream is = new FileInputStream(sourceFile);
HWPFDocument document = new HWPFDocument(is);
WordExtractor we = new WordExtractor(document);
System.out.println();
} catch (IOException e) {
e.printStackTrace();
}
Alguém sabe como extrair o texto das caixas também?