pessoal eu preciso desenvolver uma aplicação para um jornal, eu estava pensando em um sistema que o autor do artigo manda um .doc, o sistema le esse .doc e puplica o html dele, no jornal… porem nao tenho ideias de como fazer isso!!
Como eu vou trasnformar o .doc em html sem perder as formatações e tabulações?
Como eu vou gerar um html dinamico para esse doc?
E as materias antigas teriam que ficar arquivadas entao eu tenho que ter esse html gerado dinamicamente com nomes diferentes.
Se alguem souber algo que posso ler para começar, alguma ferramenta que iria me ajudar, qualquer coisa!!!
Converter um DOC em HTML, sem ter um template que o autor do artigo tem de seguir obrigatoriamente, e ainda por cima tentar manter a formatação, é pedir para ter dor de cabeça. Brinque um pouco com algum desses programas que estão na Internet (doc2html, doctohtml) e veja que a conversão normalmente é ruim.
T
thingol
É melhor usar um esquema parecido com um wiki, onde o formato de entrada não é DOC e sim texto puro. Veja como isso funciona acessando a Wikipedia de sua preferência. http://pt.wikipedia.org
A
arthurnn
sim sem problemas o .doc doi uma sugestão minha mais como estava lendo no forum nem a POI consegue ler .doc entao só vai dar dor de cabeça! entao alguem teria alguma ideia.?
O autor irá escrever um arquivo(formato qualquer) e publicar porem esse arquivo deve possuir fotose tudu mais!
sim sem problemas o .doc doi uma sugestão minha mais como estava lendo no forum nem a POI consegue ler .doc entao só vai dar dor de cabeça! entao alguem teria alguma ideia.?
O autor irá escrever um arquivo(formato qualquer) e publicar porem esse arquivo deve possuir fotose tudu mais!
Seja simples. Deixe o autor criar o seu texto com html , depois leia o html com fose fosse xml , processe o xml com uma transformação xslt que o trasnformará para o padrão final.
Deixar o autor escrever em html é bom porque ele pode usar qq editor por ai, mas é ruim se o auto começa a tentar formatar o texto (coisa que não lhe compete)
Então, em alternativa vc pode usar um formato xml que vc mesmo inventa que use os tags mais comuns do html , mas sem os atributos de formação. O Maven usa um esquema como este para que a documentação do projeto seja escrita e é muito simples de criar uma linguagem xml e uma transformação xslt para ela. Eis um exemplo
Titulo do Artigo
Este é um texto corrido normal que pode conter certas formatações de itálico
ou bold para que o autor possa dar ênfase nas palavras e idéias e possa
ligar o artigo com outra página na web. O bom é que
podem ser acionados tags para funcionalidades especificas como linkar com a wikipedia xml
ou usar tag mais tradicionais como para incluir imagem
Claro que a imagem tem que acompanhar este documento.
T
thingol
Eu sei que no site da StockCar o esquema é igualzinho ao que o Taborda mencionou.
Hoje em dia, com os editores HTML Ajax que há por aí, você pode formatar o texto sem precisar de pôr manualmente as tags.