achei um software chamado, xenu. Porém ele nao resolve, pois descobri que… se o link para a imagem não existe, aparece uma pagina. logo, nao da 404… e ele acha que esta tudo certo.
como identificar então?
wagnerfrancisco
Vc pode estabelecer uma conexão com HttpUrlConnection e ver o status do retorno.
denisspitfire
preciso saber do conteudo…
nessa httpurlconnection da pra ver se existe um conteudo que contenha uma imagem?
denisspitfire
aff mesmo assim… mesmo que ele veja o conteudo que retornou… la no site tem um tratamento para 404, e tem um banner…
denisspitfire
ja sei… oque voltar, da pra eu salvar todas as imagens da pagina???
porque quando não conter a pagina, vai voltar um banner e mais algumas coisinhas tipo, botao etc etc.
dai como vai salvar na mesma pasta, posso colocar para dar um replace no arquivo.
tem como salvar todo o conteudo de uma pagina?
denisspitfire
pesquisando a respeito achei um tutorial com este codigo.
packagebr.mb.tutorialCapturaPaginaWeb;importjava.io.*;importjava.net.MalformedURLException;importjava.net.URL;publicclassLoadPage{publicvoidgetPage(URLurl,Filefile)throwsIOException{BufferedReaderin=newBufferedReader(newInputStreamReader(url.openStream()));BufferedWriterout=newBufferedWriter(newFileWriter(file));StringinputLine;while((inputLine=in.readLine())!=null){// Imprime página no consoleSystem.out.println(inputLine);// Grava pagina no arquivoout.write(inputLine);out.newLine();}in.close();out.flush();out.close();}publicstaticvoidmain(String[]args){URLurl=null;Filefile=newFile("C:\\TutorialArquivos\\page.html");try{url=newURL("http://ondetrabalhar.com/vagas/1399/arquiteto-java");newLoadPage().getPage(url,file);}catch(MalformedURLExceptione){e.printStackTrace();}catch(Exceptione){e.printStackTrace();}}}
mas este código só captura o html, eu quero a imagem que trará dentro do html