Oi AUser, boa noite!
A resposta é Sim; O cliente pode especificar este tipo de detalhe. Imagine um sistema crítico que não pode ter atraso na operação… seria um desastre se o sistema demorasse muito para responder (ou se não respondesse), então, isto já fica acordado entre as partes.
Isto se torna um requisito funcional, mas diretamente relacionado aos não funcionais, por que será necessário estudar várias formas de tornar este requisito possível, por exemplo: clusterização, redundância, load balancer, connection pool, tunning, estratégias em caso de falhas de serviços, entre outros…
A terceira fase do SCEA 5 cobra exatamente este tipo de pergunta… e como a sua arquitetura poderia lidar com isso… então, já serve de dica… E no mundo real, para sistemas corporativos, a preocupação com tempos (consumo de CPU, memória, rede, IO, resposta etc) é muito comum.
Sistemas que exigem tempos de resposta garantidos geralmente precisam ter uma infra-estrutura mais bem pensada e muito mais cara em relação a um sistema sem este requisito explícito.
Espero ter solucionado a sua dúvida.
Abraço,