Substituição de palavras num arquivo HTML

Olá pessoal,

 Eu tenho um documento no formato html e queria fazer substituir palavras neste documento. Por exemplo, a palavra "body" da frase "The body of the document", queria trocar por "<B>body</B>". Mas no documento HTML temos a tag "<body>", que não deve ser alterada de forma alguma. Tentei fazer algumas negações em torno da expressão regular "<.*?>", mas não deu muito certo.
Peço por idéias ou sugestões de vocês.

porque você não tenta algo assim?

texto.replace("<B>body</B>"," body ");

se você colocar espaços antes e depois da palavra, ele não vai pegar a tag

Isso funciona, entretanto teria os casos em que a palavra “body” poderia estar entre parenteses, ou no começo da frase, ou no fim da frase, ou com pontução e ainda tem o caso da diferença das letras maiusculas e minusculas. Se fossem poucas palavras que tivesse marcar em um texto pequeno, não teriam problema. Mas eu tenho muitas palavras para marcar, que estão dipostas de varias formas num texto muito grande e um tempo muito pequeno para devolver a resposta. Eu tinha feito um teste aqui e o tratamento do texto html tinha demorado mais de 5 minutos. Veja só um exemplo de texto: http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0100-879X2004000400003&lng=en&nrm=iso&tlng=en
Se vc clicar lá “Conceptual Links” vc vai ver as palavras marcadas, mas para este recurso funcionar eles estão tendo que manter duas páginas com o mesmo conteúdo.
Muito obrigado pela ajuda, quando eu conseguir uma resposta ou uma conclusão eu retorno aqui neste tópico.

Olá

Não sei se entendi mas desconfio que o que você quer são tag clouds. Google por este termo.

Dê uma sapeada no blog Joe Lamantia.com

[]s
Luca