ВходНаше всё Теги codebook 无线电组件 Поиск Опросы Закон Суббота
20 июля
695002
Evgeny_CD, Архитектор (23.08.2016 00:25, просмотров: 2681)
Похоже, я знаю, куда прет Интел -> Они читали мои посты --> AI в объеме одной стойки. http://caxapa.ru/692681.html
http://caxapa.ru/694931.html
Не знаю, насколько это верно, но есть оценка, что башка человека = 1PFLOP в виде операций нейронов. -> 10TFLOP. 100 чипов надо, однако. 128 для кратности. Вложен чудесный чип-коммутатор, которые держит конфигурации вплоть до 1 восходящий порт PCIE 3.0 x 16, 5 нисходящих PCIE 3.0 x 16 Ставим 4 штуки Stratix 10 на плату + коммутатор. Водяное охлаждение. Всего нам надо 32 платы. Берем супер-мамку, ставим нужное число коммутаторов. 8 плат расширения по 4 чипа с одного торца верхней части "мамки", 8 плат с другого торца. 16 плат. А теперь еще 16 палат снизу. 32платы, на мой взгляд все влезет в 6U. Да, еще стойка с питанием и СВО рядом, но это несущественные мелочи. Получем 1Пфлоп в виде двух стоек. В принципе, даже 1 стойки. Фишка в том, чтобы оптимизировать обученную нейросеть и закодить ее железно в стратиксе. GPU и вычислялки на их основе выжимают 10TFLOP с одной карты, но это монстры 2 слота 300W жручессти. А тут 4 чипа предлагается на карте разместить :) Фокус в адаптимном клокинге. Не все 100500 FPU ALU будут одновременно делать полезное дело. Нет для них данных (в коммутаторе бредут к точке назначеня) - не тактируем, или тактируем 1/20 от основно тактовой. Жрачка упадат кардинально. HBM и HMC память будет очень в тему, особенно на одной подложке с FPGA. А в описаниия стратикса на это особый упор сделан. Стоимость "искусственной башки" по моим оценка получится 2.5..3М$, но при хорошей эффективности допустимо. Это, конечно, долгий путь, но даже сейчас видно, что реальный.