Leitura de documento ".doc"

Olá pessoal, boa tarde a todos,

to estudando uma forma de ler um arquivo .doc e até encontrei, mas o resultado é ilegível.

A leitura de uma arquivo com o seguinte texto:

Marcos Cardoso Martins
Marcos Cardoso Martins

e o resultado seria o seguinte:

Lido: ffffffffffffffffffffffffffffffff52006f006f007400200045006e00740072007900000000000000000000000000000000000000000000000000000000000000000000000000000000000000000016000500ffffffffffffffffffffffffec69d9888b8b3d4c859eaf6cd158be0f0000000000000000000000009030
Lido: f6ecab80c901feffffff00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000ffffffffffffffffffffffff00000000000000000000000000000000000000000000000000000000
Lido: 00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000ffffffffffffffffffffffff0000000000000000000000000000000000000000000000000000
Lido: 000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000ffffffffffffffffffffffff000000000000000000000000000000000000000000000000
Lido: 0000000000000000000000000000000000000000000000000105000000000000}}

gostaria de saber como ler esse arquivo para que o texto saia de forma normal.

o código é o seguinte:

[code]File arq = new File(“c:\”,“Marcos.rtf”);

    try {
        // Cria o BufferedReader para ler cada linha de um arquivo
        BufferedReader br = new BufferedReader(new FileReader(arq));

        String s;

        // Lê cada linha do arquivo e apresenta na tela

        s = br.readLine();
        while(s != null){
            System.out.println("Lido: " + s);
            s = br.readLine();
        }
        // Fecha o BufferedReader, que também fecha o FileReader
        br.close();
    } catch(FileNotFoundException e1){
        // se o arquivo não existir
        System.out.println("Arquivo " + arq.getName() + " não encontrado.");
    } catch(IOException e2){
        // trata outras excessões
        e2.printStackTrace();
    }[/code]

Aguardo resposta…

obrigado

[google]apache poi[/google]

Blz palmadias?

então eu encontrei la, mas só tem as classes, será que não tem um .jar do poi pra word?
encontrei um la mas ele so da suporte a arquivos do excel, acho, num contém as classes:
HWPFDocument e WordExtractor que poderia usar pra fazer isso.

Se souber…

obrigado

tem varios mirrors no site.

http://www.apache.org/dyn/closer.cgi/poi/

abraços.

e ai blz?

então, eu entrei lá e baixei, só que o jar não tem o pacote hwpf que é pra word.
Só tem um monte de classes referentes a ele. Ai eu tentei colocar esses classes no meu projeto mas da um monte de erros nelas.

q q eu faço? Tem que ter algo melhor pra fazer do que resolver todos os erros de todas as classes (devem ser umas 200).

Amigos… Estou com um problema parecido,
Estou implementando um sistema que armazena documentos de diversos diversos tipos.
um cliente quer que ao pesquisar um documento, ele possa abri-lo apenas para visualização.
sendo que ao clicar no documento:
1- ele não pode abrir a tela de download, apenas abrir o documento para visualização.
2- para uma melhor implementação e também que seja independente de browser e SO, se haveria possibilidade de abri-lo no servidor e apenas exibir no browser!
ex: um documento .doc no firefox em um linux, por exemplo.

sempre usei a api excel. nao conheco os detalhes da implementacao word.

desculpe.

abracos.

mas vc consegue visualizar as planilhas no browser… mesmo que não tenha o Excel instalado na maquina cliente?
abç