Arquitetura complexa para testar, qual abordagem e ferramentas utilizar

Olá

Diante do cenário abaixo:

  1. Tem-se uma aplicação que executa outras aplicações java em máquinas remotas (via ssh/shell) de um servidor (X)
  2. As aplicações executadas remotamente em servidores distintos (pela aplicação do server X) enviam mensagens no formato soap para outra aplicação java em um outro servidor (Y) utilizando bibliotecas como javax.xml.soap, javax.net.ssl e java.net.URL

É preciso:

A) coletar dados sobre a duração (início/fim) de execução de cada comando executado remotamente pela aplicação do item 1
B) coletar os tempos de envio das mensagens soap enviados pelas aplicações (em servidores distintos) e de recebimento pela aplicação no servidor (Y)

Tem-se:

a - logs de tudo, todas as aplicações registram logs com os registros relevantes aos eventos apresentados
b - as ferramentas básicas de monitoramento de rede do ambiente linux mais o ambiente shell, off course :stuck_out_tongue:
c - jvm para poder desenvolver uma solução power :-))

Linha de projeto/desenvolvimento a seguir:

1- usar software de monitormaneto de rede mais sofisticados para daí monitorar tanto a execução de aplicações remotas como os registros de envio das mensagens?

2- usar ferramentas de monitoramento de eventos em logs de tempo real e desenvolver uma aplicação java para coletar o que é necessário dos logs, armazenando em sgbd, por exemplo, para depois sumarizar estes dados para uma outra aplicação client?

3- usar solr ou lucene para trabalhar com os dados dos logs em conjunto com a proposta do item anterior?

De qualquer forma será necessário desenvolver uma solução específica, pois o ambiente é tão heterogêneo que não deve haver ferramenta que faça todo este trabalho.

Minhas dúvidas residem entre a opção de trabalhar mais com os dados dos logs (vai dar trabalho) ou de trabalhar com os dados de rede.

O pool de votação está aberto!

Por favor, dêem as suas sugestões de ferramentas, indicações de referências, artigos ou abordagem a seguir neste caso onde preciso coletar dados de diversas aplicações distintas em locais descentralizados e correlacionar estes dados de forma integrada.

Eu fico grato desde já!