Galera,
Estou passando por um problema que é o seguinte. Recebo um arquivo .DOC atraves de upload e preciso converter para HTML ou para texto. Algume já passou por isso e pode me ajudar
Agradeço desde sempre
Galera,
Estou passando por um problema que é o seguinte. Recebo um arquivo .DOC atraves de upload e preciso converter para HTML ou para texto. Algume já passou por isso e pode me ajudar
Agradeço desde sempre
Marcelo,
Não passei por este problema ainda, mas dá uma pesquisada no site do Apache Jakarta; existe o projeto POI, no qual se trabalhar com APIs para acessar documentos M$. Talvés lá tenha algum esquema de conversão.
Link:
http://jakarta.apache.org/poi/index.html
ASOBrasil
puts, vai ser uma dor de cabeça …
qdo vc converte doc pra html (usando o próprio word) vc mela quase toda a formatação do documento e se teu usário chiar vc vai ter de buscar alguma outra alternativo (pdf?).
O POI não está implementado para word ainda!
Não mesmo!!! O poi é pra excel, pro word vc tem outra API - que é a HWPF.
EDIT: por favor, ignorem esta mensagem
O POI é um projeto da jakarta para manipular documentos da MS, o HWPF seria um sub-projeto. Em seu site, no primeiro parágrafo na primeira linha está o seguinte: “HWPF is still in early development.” Ou seja, ainda não há nada para manipular documentos do Word. Recentemente eu passei por isso. A solução que eu encontrei (mas não muito sofisticada) foi fazer uma rotina em VB que passasse de .doc para .txt, a partir daí eu consegui manipular os arquivos!
puts, tem um ano e meio que fui lá e estava da mesma forma.
desculpe, foi mal.
Não dá nada, o engraçado é que se você vai no fórum da sun e pesquisa “Read a doc file” (ou qualquer outro texto que mencione a manipulação de documentos MS) a cada 10 registros 12 indicam o POI.
Não mesmo, segundo a definição do site
Daí vem os sub-projetos (ou seria APIs) para manipulação dos documentos do Word, Excel etc…
okay, thiago, vc fez seu ponto.
quer que eu peça desculpas de novo?
desculpe, please

eu é que assumi o POI só pra excel (usei ele muito, mas só pra excel) tinha conhecimento da tal HWPF mas não havia visto esse pequeno “detalhe” (e isso foi há um ano e meio atrás)
a observação que fiz sobre formatação continua valendo (mesmo que o HWPF tivesse sido implementado)
Não estou disputando ponto, só quis passar a informação correta.