Se realmente você precisa muita GPU o mais indicado é comprar algumas placas Tesla:
Se você, entretanto, acha que seu problema é melhor resolvido com uma CPU de múltiplos cores, pode tentar a nova solução da Intel:
que também é uma placa contendo multiplos cores, e é mais bem fácil de programar que uma GPU.
(Na empresa em que trabalho, há uma solução que está usando placas Tesla. Mas se fôssemos começar agora provavelmente iríamos tentar a solução da Intel, que promete ser mais fácil de manter a longo prazo).
A spec dessa placa que você listou parece com a da Tesla K10.
Entretanto, pode ser que seu problema exija melhor desempenho em contas de precisão dupla (por exemplo, no caso de cálculo de risco financeiro, as fórmulas de Black & Scholes exigem que se use precisão dupla).
Portanto, nesse caso é necessário usar uma outra placa (nesse caso, uma M2090) que tem menos CUDA cores mas que tem throughput de precisão dupla bem maior (665 GFlops contra 190Gflops).
Não se esqueça que você também precisa trabalhar bem seu problema (é bom ter um matemático na equipe, viu?).
Pode ser que ele não seja muito fácil de se resolver só com GPUs e você acabe precisando é da solução da Intel, não da NVidia.
De qualquer maneira, normalmente se seu problema realmente pode ser resolvido usando-se uma pancada de CUDA cores, você pode ter um computador com 2 dessas placas Tesla. (Não sei se dá para pör mais ainda). Não sei se dá para pôr 2 ou mais placas gráficas para jogos em um mesmo servidor.
Obviamente uma placa Tesla é muito mais cara que a placa gráfica equivalente da NVidia (acho que é o dobro do preço, ou talvez três vezes mais), mas é porque ele tem especificações diferentes.
Se uma placa gráfica trava durante um jogo, não é problema porque você pode rebootar a sua máquina sem muitos problemas.
Mas uma placa para servidores usa specs bem diferentes e deveria ser feita para rodar 24x7.
A TESLA VCORE Express Next I/O 2090 proporciona o rendimento de um cluster em uma estão de trabalho, que resulta mais eficiente desde o ponto de vista energético.
Fator de Forma 1U 19" Chasis
4 x GPUs Tesla M2090
Streaming Processor Cores 512 x 4
Frequência 1.85 GHz
Rendimento 2,06 TeraFlops DP / 1,3 TeraFlops SP
Memória 24GB, Interface 384-bit GDDR5
Largura de bus de memória 177 GB/sec
900W TDP
HBA PCI Express x16 Gen 2.0
Hum… dá para comprar um carro com uma placa dessas. Bom, agora você precisa arranjar o matemático que vai fazer essa placa funcionar - antes de mais nada, vocês precisam analisar o problema e ver se ele pode ser resolvido com GPU.
Você vai precisar de uma SLI de 2 placas dessas se quiser rodar a simulação de guerra entre alienígenas e soldados americanos de nanosuits em ilhas de alta densidade vegetal