Transformar html em xml

Pessoal to pesquisando sobre transformar uma string html em xml a fim de contornar o problema da serialização do objeto, pois a serialização cria um arquivo com tamanho bem maior… e o banco de dados vai ficando gigantesco… alguma solução prática?

Hehehe como vc quer fazer um xml ficar menor que um html?
Outra coisa. Pq armazenar arquivos no banco? Guarde no sistema de arquivos do servidor, e na base de dados guarde apenas o caminho para cada arquivo.
Se mesmo assim você precisar MESMO fazer isso, como html é texto puro, compacte os dados do arquivo e armazene esses dados compactados. Quando precisar deles, faça o inverso.

[]´s

Bom é obvio que com a pouca informação da questão não é possível dar uma resposta satisfatória… a questão é a seguinte:

  • O aplicativo possui uma base local
  • O aplicativo envia para o servidor conteúdo
  • Outros aplicativos podem baixar o conteúdo e utilizá-los localmente

O uso da serialização permite que os dados sejam usufruidos por qualquer cliente, por isso usei a serialização, entretando, o tamanho do banco
de dados fica absurdamente enorme, sem a serialização, não era possível salvar um conteúdo e restaurá-lo e continuar usando. A serialização
não foi opção, o projeto requer que assim seja, entretanto to estudando a possibilidade de formatar os dados para xml para compactar o banco
de dados, e por consequencia também, facilitar o download e upload… entendido.

Tudo bem, mas ainda não entendi pq vc quer transformar HTML em XML. Ou melhor, não entendi a vantagem que você está vendo em fazer assim.

Jesus! seria mais fácil responder à dúvida incial do nosso coléga, o cara pergunta A e nego fica respondendo X,Y,Z…

Suspiro, recentemente tentei fazer isso que vc tava querendo, mas depos percebi que não percisava… mas pelo pouco que li vi que bastava alterar o conteúda da String HTML colocando em seu cabeçalho <?xml version="1.0" encoding="UTF-8"?>. talvez esse seja o caminho pro seu problema!
Mande PM ou posta a solução aqui caso vc encontre(a gente sempre encontra, é só buscar!)

Qualquer “nego” que pense um pouquinho, normalmente tenta entender o que está acontecendo e tenta resolver alguma coisa da melhor forma possível. Será mesmo que é necessário armazenar um conteúdo em HTML no banco de dados? Não seria isso uma burrice enorme? E mesmo que seja necessário armazenar os dados do arquivo, pq usar XML? Pq não armazenar o arquivo no sistema de arquivos e então apenas referencia-lo no banco? As vezes tenho a impressão que querem sempre resolver o problema, mas normalmente não dão a mínima ou não pensam em uma solução melhor, ou até nem sabem o que estão falando. O suspiro quer servir arquivos não é mesmo? Enfim, não falo mais nada. Ficar dando murro em ponta de faca é burrice não é mesmo?

[]´s

Pessoal por favor… vamos manerar… todos são livres para opinar… e todas as opiniões são bem vindas… se encontrar a resposta…
posto no forum… para todos que um dia possam precisar… entretanto ainda não encontrei…

A questão de armazenar html, ou xml… bom, não encontrei outra forma… Por que escolhi o html? Porque é necessário estilizar textos…então cada
cliente pode estilizar seus textos, aplicar fonte… tamanho… negrito… enfim… porque o conteúdo é editado em um JTextPane… para facilitar…
uso o HtmlEditorKit… e este gera um html… é possível salvar o html em um arquivo ou bd, mas ao ler… não é possível editá-lo… pelo que pude
perceber, todos os atributos que possuem aspas dupla (") não podem ser alterados, as vezes funciona e as vezes não… ou seja se tiver um texto
com uma fonte azul… pode não ser possível alterar a cor…

Então para salvar… optei por salvar um objeto serializado… e ai funciona perfeito… mas o tamanho do banco de dados… fica gigantesco…
porque uma string com 7 caracteres por exemplo… ao serializar… vira… um objeto serializado com 29 kb… imagina então o tamanho que
vai ficando o banco de dados…

A opinião de todos é importante…

[quote=davidbuzatto]Hehehe como vc quer fazer um xml ficar menor que um html?
Outra coisa. Pq armazenar arquivos no banco? Guarde no sistema de arquivos do servidor, e na base de dados guarde apenas o caminho para cada arquivo.
Se mesmo assim você precisar MESMO fazer isso, como html é texto puro, compacte os dados do arquivo e armazene esses dados compactados. Quando precisar deles, faça o inverso.

[]´s[/quote]

Não é questão de fazer um xml ficar menor que um html, e sim uma armazenar e recuparar string contento html, porque serializar uma string…
já viu o tamanho que fica…

Quanto a questão da compactação… bom, talvez para enviar para o servidor… seja até interessante, mas para uso geral do cliente… melhor
manter descompactado… essa operação de compactar e descompactar… pode causar demora…

A questão de usar o sistema de arquivo… possivelmente no futuro até quem sabe… mas já ta tudo funcionando certinho… teria que alterar
praticamente tudo… daria um trabalhão…

Entretanto… essa questão do tamanho do banco de dados pode ser insignificante… se não causar demora no acesso aos dados…
porque cada conteúdo fica armazenado em um campo blob… ou até podia ser um arquivo .html (no futuro), e cada cliente pode
manipular por exemplo 2000… 3000 mil ou mais conteúdo… para uso… não vi muita demora… até mesmo em computadores com 512
gb de ram… usando o windows…