По первой ссылке есть ТТХ карты: FP16 - 112 TF (125 TF NVLink вариант)
FP32 - 14 TF (15.7 TF NVLink вариант)
FP64 - 7.0 TF (7.8 TF NVLink вариант)
В Мегафлопсах считая МАС как одну операцию:
FP16 - 56 000 000 MFLOPS (62 500 000 MFLOPS NVLink вариант)
FP32 - 7 000 000 MFLOPS ( 7 850 000 MFLOPS NVLink вариант)
FP64 - 3 500 000 MFLOPS ( 3 900 000 MFLOPS NVLink вариант)
Обычный (PCIe) вариант без налогов там стоит $9к, серверный вариант не нашел.
Получается:
FP16 - 6 222 MFLOPS/$
FP32 - 777,8 MFLOPS/$
FP64 - 388,9 MFLOPS/$
обычный вариант выглядит так:
https://www.nvidia …100-pcie-625-ud@2x.jpg
NVLink вариант:
https://www.nvidia …0-nvlink-625-ud@2x.jpg
И надо учитывать, что процессор универсален, а GPU специфичен, эффективен только при сильном распараллеливании (алгоритм должен это допускать).
Интересен ещё DGX-2
https://www.nvidia …-us/data-center/dgx-2/
Фактически это коробка с 16-ю (!) видеокартами GV100, объем памяти у каждой 32ГБ при полосе 900 ГБ/с. Особенность это коммутаторы, они соединяют все эти чипы виртуализируя ресурсы их всех в единую сущность. Например вся память в едином адресном пространстве, это 512 ГБ быстрой памяти, плюс у двух Зеонов в той же коробке ещё 1.5ТБ DDR4. В общем, если этого зверя уметь раскрывать, знатная штука выходит. Стоит $400к, там.