Estrutura de dados

Oi,
Pretendo fazer a tokenização de documentos, guardando as tokens como strings numa estrutura de dados. à partida não sei como é óbvio quantas tokens vou armazenar (depende do tamanho do documento). Que estrutura é que me aconselham?

Obrigado

MP

Collection
http://www.dsc.ufcg.edu.br/~jacques/cursos/p2/html/ed/colecoes.htm