Yahoo! Coloca Sistema gigante em Hadoop no Ar

E o GUJ? Alguma experiência com hadoop ou outro sistema distribuído para hardware COTS? Alguma experiência com BigTable, Map/Reduce, GoogleFS-like systems?

A um tempo fiz um experimento com o nutch fazendo crawling de todo conteúdo .br. Depois de duas semanas e uns 80 gigas de dados comprimidos parei pois me faltou disco.
Apesar disso o negocio funcionava super rápido e o tempo de reindexar era bem rápido.