Leitura de documento ".doc"

7 respostas
M

Olá pessoal, boa tarde a todos,

to estudando uma forma de ler um arquivo .doc e até encontrei, mas o resultado é ilegível.

A leitura de uma arquivo com o seguinte texto:

Marcos Cardoso Martins
Marcos Cardoso Martins

e o resultado seria o seguinte:

Lido: ffffffffffffffffffffffffffffffff52006f006f007400200045006e00740072007900000000000000000000000000000000000000000000000000000000000000000000000000000000000000000016000500ffffffffffffffffffffffffec69d9888b8b3d4c859eaf6cd158be0f0000000000000000000000009030
Lido: f6ecab80c901feffffff00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000ffffffffffffffffffffffff00000000000000000000000000000000000000000000000000000000
Lido: 00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000ffffffffffffffffffffffff0000000000000000000000000000000000000000000000000000
Lido: 000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000ffffffffffffffffffffffff000000000000000000000000000000000000000000000000
Lido: 0000000000000000000000000000000000000000000000000105000000000000}}

gostaria de saber como ler esse arquivo para que o texto saia de forma normal.

o código é o seguinte:

File arq = new File("c:\\","Marcos.rtf");

        try {
            // Cria o BufferedReader para ler cada linha de um arquivo
            BufferedReader br = new BufferedReader(new FileReader(arq));

            String s;

            // Lê cada linha do arquivo e apresenta na tela

            s = br.readLine();
            while(s != null){
                System.out.println("Lido: " + s);
                s = br.readLine();
            }
            // Fecha o BufferedReader, que também fecha o FileReader
            br.close();
        } catch(FileNotFoundException e1){
            // se o arquivo não existir
            System.out.println("Arquivo " + arq.getName() + " não encontrado.");
        } catch(IOException e2){
            // trata outras excessões
            e2.printStackTrace();
        }

Aguardo resposta...

obrigado

7 Respostas

P

[google]apache poi[/google]

M

Blz palmadias?

então eu encontrei la, mas só tem as classes, será que não tem um .jar do poi pra word?
encontrei um la mas ele so da suporte a arquivos do excel, acho, num contém as classes:
HWPFDocument e WordExtractor que poderia usar pra fazer isso.

Se souber…

obrigado

P

tem varios mirrors no site.

http://www.apache.org/dyn/closer.cgi/poi/

abraços.

M

e ai blz?

então, eu entrei lá e baixei, só que o jar não tem o pacote hwpf que é pra word.
Só tem um monte de classes referentes a ele. Ai eu tentei colocar esses classes no meu projeto mas da um monte de erros nelas.

q q eu faço? Tem que ter algo melhor pra fazer do que resolver todos os erros de todas as classes (devem ser umas 200).

P

Amigos… Estou com um problema parecido,
Estou implementando um sistema que armazena documentos de diversos diversos tipos.
um cliente quer que ao pesquisar um documento, ele possa abri-lo apenas para visualização.
sendo que ao clicar no documento:
1- ele não pode abrir a tela de download, apenas abrir o documento para visualização.
2- para uma melhor implementação e também que seja independente de browser e SO, se haveria possibilidade de abri-lo no servidor e apenas exibir no browser!
ex: um documento .doc no firefox em um linux, por exemplo.

P

sempre usei a api excel. nao conheco os detalhes da implementacao word.

desculpe.

abracos.

P

mas vc consegue visualizar as planilhas no browser… mesmo que não tenha o Excel instalado na maquina cliente?
abç

Criado 27 de janeiro de 2009
Ultima resposta 29 de jan. de 2009
Respostas 7
Participantes 3