Preciso fazer o parse de um ou mais arquivos xml de mais de 100mb porém se eu tentar fazer isso com o sax ou jdom levo um estouro de heap na cara.
Não possuo o xsd desse xml mas sei exatamente quais tags e atributos pegar, logo imagino que assim seja mais fácil.
Podem me ajudar?
SAX é o mais indicado se o tamanho do XML ( por alguma razão ) é grande e vc pode processar de forma serializada ( ou seja, vai processando elemento por elemento, talvez descartando algumas coisas, etc ).
contudo só usar SAX não ajuda. vc precisa identificar possiveis causas de estouro de memoria. por exemplo se vc pega todas as tags xxx e mete em um arraylist, se tiver muita coisa isso vai explodir.
aqui tem um exemplo bobo:
agora se isso nao te atende o que vc pode fazer:
dar uma ideia das primeiras linhas ou da cada desse xml