Oi!
Estou lendo um arquivo que contém milhões de palavras. Então, estou lendo os arquivos utilizando:
URL words = new URL("http://site.com/arquivo.txt");
URLConnection connect = words.openConnection();
BufferedReader read = new BufferedReader(new InputStreamReader(connect.getInputStream()));
String line;
while((line = read.readLine()) != null ) {
}
Eu tenho um array que contém algumas palavras que podem ou não ter nesse arquivo. Eu preciso saber como eu faço para separar cada palavra separadamente.
Como será seu arquivo? Existe um padrão de layout? Se sim, seria melhor usar uma lib do tipo http://www.jrimum.org/texgit/. Usamos aqui no trabalho para fazer arquivos de lote bancários. Funciona muito bem e os desenvolvedores são muito atenciosos.
Porem creio que para isto seja melhor usar regex.[/quote]
pq acha regex melhor?!
A única característica que diferencia uma palavra da outra, em termos CRUs, é a utilização do espaço!
O único problema que poderia encontrar, seria o da pontuação (Ficar colada em uma palavra), mas isto também
não é tão relevante!