Framework/API para parse de HTML

Alguém conhece alguma framework/api para parse de HTML?

Valeu!

Já usei esse, serviu para o que eu queria.

http://htmlparser.sourceforge.net/

Falou.

O HTMLParser é um dos mais robustos. Tem varias opcoes de filtro de tags: manter tais, remover tais, navegar pelo DOM…
PS: recomendo tambem considerar o uso de um “corretor” de tags pois muitos sites tem problemas de mal formacao. Ha api’s exclusivamente pra isso.
No mesmo assuntos, ha decodificadores e decodificadores tags html <-> texto padrao, tambem, que sao interessantes.

Obrigado Senhores!