cara eu vi um eskema que fazia isso
que era o seguinte
utilizando as classes de acesso web como vc fosse fazer um browser
( realizar uma requisição da pagina ), ele recebe o html da pagina
que se vc analisar é um formato que vc consegue trabalhar com API´s
de manipulação de xml…
ai vc pode fazer o seguinte
apos receber o html -> armazenar em uma string
contruir método de busca utilizando alguma API de manipulação
de xml ( principalmente o parser da API ) e gerar um método de busca
que liste todos os nós onde <a…> … </a>
com isso vc retira do html a lista de todos os links existentes
[]´s
W
WollokowPJ
ixi cara…olha soh, to começando a mexe com java para web agora, que API de manipulaçao de XML seria essa? O que eu deveria pesquisar para entender melhor o que voce me respondeu?
valew mesmo cara…ateh mais…
E
ErkoPJ
essas API´s são conjunto de funcionalidades para manipulação de arquivos
xml, arquivos XML são textos estruturados
jah viu os codigo html?
seria esse tipo de padrão de codigo estruturado +ou-