Ja procurei mas não encontrei nada que fosse claro.
Preciso ler um arquivo html e pegar conteudo entre tags html
Achei o jtidy, mas não consegui fazer rodar.
Achei tb sobre o url, mas ele atende.
o que me interessa são os dados entre as tags <td></td>
exemplo[code]
1 |
29/09/2003 |
18 |
20 |
25 |
23 |
10 |
11 |
24 |
14 |
06 |
02 |
13 |
09 |
05 |
16 |
03 |
0,00 |
5 |
154 |
4645 |
48807 |
257593 |
49.765,82 |
689,84 |
10,00 |
4,00 |
2,00 |
0,00 |
0,00 |
2 |
06/10/2003 |
23 |
15 |
05 |
04 |
12 |
16 |
20 |
06 |
11 |
19 |
24 |
01 |
09 |
13 |
07 |
0,00 |
1 |
184 |
6232 |
81252 |
478188 |
596.323,70 |
1.388,95 |
10,00 |
4,00 |
2,00 |
0,00 |
0,00 |
[/code]
olha a gambi, rsrs
[code]public class Teste {
public static void main(String[] args) throws IOException {
File html = new File(“c:\teste.html”);
FileReader reader = new FileReader(html);
BufferedReader leitor = new BufferedReader(reader);
String linha = "";
while ((linha = leitor.readLine()) != null) {
if (linha.contains("<td>") && linha.contains("</td>")) {
linha = linha.replaceAll("<td>", "");
linha = linha.replaceAll("</td>", "");
System.out.println(linha);
}
}
}
}[/code]
att,
Galera eu fiz esse esquema de ler um html só que os acentos da página ficaram errados.
Tentei mudar o encoding e não funcionou.
Alguém já passou por isso ?
Abs
Cara da uma estudada nesse Framework JSOUP
Ele é um parser para HTML bem simples de usar
JSOUP