Похоже, я знаю, куда прет Интел -> Они читали мои посты --> AI в объеме одной стойки. http://caxapa.ru/692681.html
http://caxapa.ru/694931.html
Не знаю, насколько это верно, но есть оценка, что башка человека = 1PFLOP в виде операций нейронов.
-> 10TFLOP. 100 чипов надо, однако. 128 для кратности.
Вложен чудесный чип-коммутатор, которые держит конфигурации вплоть до 1 восходящий порт PCIE 3.0 x 16, 5 нисходящих PCIE 3.0 x 16
Ставим 4 штуки Stratix 10 на плату + коммутатор. Водяное охлаждение. Всего нам надо 32 платы.
Берем супер-мамку, ставим нужное число коммутаторов. 8 плат расширения по 4 чипа с одного торца верхней части "мамки", 8 плат с другого торца. 16 плат.
А теперь еще 16 палат снизу. 32платы, на мой взгляд все влезет в 6U. Да, еще стойка с питанием и СВО рядом, но это несущественные мелочи.
Получем 1Пфлоп в виде двух стоек. В принципе, даже 1 стойки.
Фишка в том, чтобы оптимизировать обученную нейросеть и закодить ее железно в стратиксе.
GPU и вычислялки на их основе выжимают 10TFLOP с одной карты, но это монстры 2 слота 300W жручессти. А тут 4 чипа предлагается на карте разместить :)
Фокус в адаптимном клокинге. Не все 100500 FPU ALU будут одновременно делать полезное дело. Нет для них данных (в коммутаторе бредут к точке назначеня) - не тактируем, или тактируем 1/20 от основно тактовой. Жрачка упадат кардинально.
HBM и HMC память будет очень в тему, особенно на одной подложке с FPGA. А в описаниия стратикса на это особый упор сделан.
Стоимость "искусственной башки" по моим оценка получится 2.5..3М$, но при хорошей эффективности допустимо.
Это, конечно, долгий путь, но даже сейчас видно, что реальный.