Comparação de Tabelas Hash

Fala galera, blz?
Meu problema eh o seguinte, gostaria de saber qual a melhor forma de comparar blocos de texto, tipo comparar paragrafos, para saberem se eles sao iguais!!
Pesquisei um pouco e vi q tabelas hash sao um boa maneira de comparacao, visando performace!
Gostaria de saber se eh verdade mermo isso e se teriam alguma referencia bibliografica pra eu dar uma estudada maior sobre o assunto pois pretendo desenvolver uma aplicação de detecçao de plagio!!!
Vlw

Olha, não sei muito a respeito dessa sua área, mas vou arriscar um palpite: resolveria o seu caso se você indexasse 2 textos usando o mesmo algoritmo e depois comparar a sua estrutura? Se for uma solução, por que você não dá uma pesquisada sobre índice invertido? Acho que com isso seu problema estaria resolvido…

[]'s.

isso! use tabela de hash que a comparacao de texto voa!

use a classe HashSet, adicione um objeto String dentro dele, e depois busque-o atraves do metodo contains.

aqui tem um material legal sobre algoritmos em java, e em especial o funcionamento interno de um HashSet mais simples:
http://www.caelum.com.br/caelum/treinamento-cs-14-algoritmos-estruturas-de-dados-com-java.jsp

A classe TreeSet é ainda mais rápida. Strings são comparáveis e, como ele faz isso letra a letra, é muito mais rápido que calcular o hash.
O funcionamento é igual ao do HashSet.