Olá pessoal,
Gostaria de saber algum framework que eu pudesse capturar alguns conteudos de determinado site pelo HTML do mesmo.
Por exemplo, existe algum framework que eu possa escrever o passo a passo (entrando em cada componente html) dessa forma abaixo ?
no framework java colocar o percurso via string fácil interpretação como:
("content > img ")
("content > title ")
página html
Qualquer sugestão melhor será bem vinda!
Obrigado
Abrs!
Não sei se entendi bem sua dúvida, mas existe o JSoup, apartir de uma string ou de uma URL você consegue capturar os elementos do html, usando a sintaxe de seletores Jquery.
Dá uma olhada: http://jsoup.org/, por exemplo com ele seria algo do tipo select("#content img").