XML != HTML.
Você precisa de um parser HTML (a menos que você tenha certeza absoluta que o arquivo HTML está em XHTML, o que normalmente não é verdade.)
Pessoal,
Estou precisando pegar um arquivo XML lido através do jakarta Commons HTTPClient e gravado no hd e pegar o valor de um campo que está em uma tag tipo hidden de nome teste.
O processo dele conectar ao servidor e baixar, salvando num caminho específico já está funcionando e verifiquei que o arquivo baixado é a tag do campo hidden está presente e seu nome é teste.
Agora preciso capturar esse valor e não conheço muito de tratamento de XML em java. Alguem pode me ajudar com isso? Existem parses DOM e SAX. Tentando utilizar o DOM tive o seguinte erro:
Primiero o código:
try {
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = dbf.newDocumentBuilder();
Document doc = db.parse(“c://teste.htm”);
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
Agora o erro:
[Fatal Error] teste.htm:6:17: Open quote is expected for attribute “LANGUAGE” associated with an element type “script”.
org.xml.sax.SAXParseException: Open quote is expected for attribute “LANGUAGE” associated with an element type “script”.
at com.sun.org.apache.xerces.internal.parsers.DOMParser.parse(Unknown Source)
at com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderImpl.parse(Unknown Source)
at javax.xml.parsers.DocumentBuilder.parse(Unknown Source)
at br.com.apinfo.GetFileExample.main(GetFileExample.java:73)
Antecipadamente agradeço!!
Rodrigo