Leitura de conteúdo de URL em Java

2 respostas Resolvido
programaçãojsonjava
B

Estou realizando uma aplicação Java que deve ler uma URL que contém dados JSON e devo printar esses dados lidos da URL, porém, ao executar a aplicação, está sendo feita a leitura do código fonte da URL.

Por exemplo, se tenho uma página

<!DOCTYPE HTML>
<html>
    <head><title>Teste</title></head>
<body>
Isso é um teste.
</body>
</html>`

Quero que a aplicação Java leia a URL e printe somente “Isso é um teste.”, porém, está sendo printado

<!DOCTYPE HTML>
<html>
    <head><title>Teste</title></head>
<body>
Isso é um teste.
</body>
</html>

Ou seja, todo o código da fonte é printado, mas preciso apenas do conteúdo exibido.

Alguém poderia, por favor, me ajudar?

Grato!

2 Respostas

peczenyj
Solucao aceita

Seu problema é parsear o html e encontrar o body.

Pesquise sobre HTML PARSER que vc vai encontrar a resposta.

Html não é xml ok? Eu nao lembro se tem um html parser built in em java- pode ser que sim. Pesquise por DOM

B

Muito obrigado, peczenyj! Li sobre o assunto e encontrei uma biblioteca para trabalhar com isso. Obrigado!

Criado 2 de novembro de 2016
Ultima resposta 2 de nov. de 2016
Respostas 2
Participantes 2