1;614848344;6196371509;20030202120121000395
2;614848344;6196371509;20030202200121000114
3;614848344;6196371509;20030202120321000495
4;614848344;6196371509;20030203112300400102
5;614848344;6196371509;20030200123123000343
1;614848344;6196371509;20030202120121;000395
2;624848344;6196371509;20030202200121;000114
3;614848344;6296371509;20030202120321;000495
4;614848344;6196371529;20030203112300;400102
5;614848344;6196371509;20030200123123;000343
Caros desenvolvedores JAVA,
tenho dois arquivos com o formato semelhante aos exemplificados acima ( naturalmente em um volume de dados muito superior - cerca de 1GB cada)
Preciso fazer um script para comparar esses dois arquivos e gravar em um terceiro, os identificadores ( primeiro campo de cada arquivo)
O principio e simples :
Na primeira comparacao eu so descarto o primeiro campo e tento encontrar os coicidentes.
Despois de encontrado todos os que sao exatamente iguais, o restante
eu devo comparar com dois criterios:
1 ) O primeiro e o segundo campo serem iguais sem considerar os dois primeiros caracteres
2) Se a subtracao entre os campos 4 dos dois arquivos for menor que x
Tenho duvida da performance deste processamento e me indicara JAVA como a melhor opcao, ainda que eu precisasse particionar o arquivo de 1 GB em 4 de 250Mb.
Java e uma boa opcao?
Alguem tem alguma coisa pronta nesta linha
Lluz
Eu acredito que se você realmente estiver muitíssimo preocupado com a performance, a melhor opção neste caso é utilizar alguma linguagem que permita manipulação direta de ponteiros, como C ou C++.
Java também serve para fazer isso, vai funcionar bem e não vai ficar muito lento, mas por ser algo com uma lógica e processamento relativamente simples acho que não justifica usar Java.
Thanks