Pessoal estou tentado usar essa biblioteca pra pegar os dados de uma tabela que esta em um arquivo html. Acontece que ja tentei de tudo que é jeito mas nao entendi como funciona a biblioteca e os exemplos sao muito limitados ate mesmo no site do projeto. Alguem que tenha usado a biblioteca poderia dar um exemplo simples de como pegar o conteudo de uma tag? Ou me passar um link com exemplo ou alguma documentacao. Ja estou pra partir para as expressoes regulares…so nao fiz isso ainda pq acredito que vou usar esse recurso outras vezes entao pode ser muito util aprender.
ps: O objeto que eu tenho tentado pegar o conteudo é o Node mas nele nao tem nenhum metodo pra pegar conteudo. Pelo menos eu nao vi, so vi metodos pra pegar Atributos…enfim, acho que nao entendi mesmo como funciona a API.
Desde ja agradeço!
Bem, aqui uso o jsoup para isso num aplicativo que usa grails. Você precisa saber alguma característica única dessa tabela que você quer, como o atributo class ou id dela.
Document doc = Jsoup.connect(url).timeout(20*1000).get();
Elements elements = doc.select(".classe_da_tabela");
// aqui o elements tem a lista de elementos que você procura
if (!elements.isEmpty()) {
Element tabela = elements.first();
System.out.println(tabela.text());
}
as vezes eu brinco com html, adorei essa lib, vlw dudaskank.
[quote=dudaskank]Bem, aqui uso o jsoup para isso num aplicativo que usa grails. Você precisa saber alguma característica única dessa tabela que você quer, como o atributo class ou id dela.
Document doc = Jsoup.connect(url).timeout(20*1000).get();
Elements elements = doc.select(".classe_da_tabela");
// aqui o elements tem a lista de elementos que você procura
if (!elements.isEmpty()) {
Element tabela = elements.first();
System.out.println(tabela.text());
}
[/quote]
Pois é, a parte chata é que nao colocaram nem id nem class. Mas ela é a unica tabela e eu sei onde começa e onde termina. Na verdade a pagina é praticamente so essa tabela, apenas com uns dados a mais. Vou dar uma olhada nessa lib. Apesar de eu ainda querer aprender o html parser por questao de honra xD. Mas como por enquanto to com um pouco de pressa vou olhar essa.
Valeu!