Ler conteudo entre tags html

Ja procurei mas não encontrei nada que fosse claro.
Preciso ler um arquivo html e pegar conteudo entre tags html
Achei o jtidy, mas não consegui fazer rodar.
Achei tb sobre o url, mas ele atende.

o que me interessa são os dados entre as tags <td></td>

exemplo[code]

1 29/09/2003 18 20 25 23 10 11 24 14 06 02 13 09 05 16 03 0,00 5 154 4645 48807 257593 49.765,82 689,84 10,00 4,00 2,00 0,00 0,00 2 06/10/2003 23 15 05 04 12 16 20 06 11 19 24 01 09 13 07 0,00 1 184 6232 81252 478188 596.323,70 1.388,95 10,00 4,00 2,00 0,00 0,00 [/code]

olha a gambi, rsrs

[code]public class Teste {
public static void main(String[] args) throws IOException {
File html = new File(“c:\teste.html”);

	FileReader reader = new FileReader(html);

	BufferedReader leitor = new BufferedReader(reader);

	String linha = "";

	while ((linha = leitor.readLine()) != null) {
		if (linha.contains("<td>") && linha.contains("</td>")) {
			linha = linha.replaceAll("<td>", "");
			linha = linha.replaceAll("</td>", "");
			System.out.println(linha);

		}
	}
}

}[/code]

att,

Ja ajuda bastante. vlw

Galera eu fiz esse esquema de ler um html só que os acentos da página ficaram errados.
Tentei mudar o encoding e não funcionou.

Alguém já passou por isso ?

Abs

Cara da uma estudada nesse Framework JSOUP

Ele é um parser para HTML bem simples de usar

JSOUP