caxapa.ru :: SkyNet теперь называется NVIDIA DGX-1 ->

Evgeny_CD^{Архитектор} (06.04.2016 19:54, просмотров: 2363)

SkyNet теперь называется NVIDIA DGX-1 -> http://caxapa.ru/665420.html
http://fcenter.ru/online/hardnews/2016/04/06#material_id=38942
Собираем факты в кучку. Производительность GPU GP100 достигает 21,2 терафлопс для FP16, 10,6 терафлопс для FP32 и 5,3 терафлопс для FP64. Предыдущая "самая быстрая карта в мире для " Tesla® M40 http://www.nvidia. …/object/tesla-m40.html Up to 7 Teraflops of single-precision performance with NVIDIA GPU Boost™ 3072 NVIDIA CUDA® cores Т.е. новый чип заметно круче, раза в полтора-два по скорости. А старый чип ускорял Deep Learning в 13 раз (в какой-то там конфигурации, вероятно, случайно попал, но, судя по отзывам, действительно ускоряет в несколько раз). Теперь вернемся DGX-1. Штучка с 8 GPU внутре, высотой 3U, жрет 3,2 КВт, стоит 129k$, скорость на FP16 будет достигать 170 терафлопс (169.6 , если считать честно). (спасибо, что не FP8). 7 таких короЁбочек будут стоить 903k$, займут ровно 21U, или половину стандартного шкафа 42U и дадут перфоманс 1187.2 терафлопа. Или чуть более производительности 1 содержимого башки человека, которая как раз в 1 петафлопс оценивается. Хорошо. Ускорившись в 100500 раз, мы обучили нашу нейросеть. Предположим, автовождению авто. Дальше что? Как эту стойку в машину засунуть, и где взять столько КВт мощи для нее? Отставить КВт. Вот жеж готовая аппаратная платформа --> После обучения, как я понимаю, для обычной работы перфоманс нужен сильно меньше. Вот и получается, что эффективная разработка алгоритмов автовождения становится доступной для команды с бюджетом на оборудование от 1 M$, и делать такую разработку можно достаточно быстро. Важные замечания. 1. У аффтара этой заметки, т.е. меня, отсутствуют познания по нейросетям. Что такое этот Deep Learning, я пока не осознал. Какие именно нужны выч. ресурсы для обучения "автоводителя", мне тоже непонятно. 2. Производительность, конечно, дана "от лукавого". Насколько хорошо нейросетевые задачи ложатся на CUDA - для меня загадка.

- Но название камня кагбэ намекает... - Крок(16.04.2016 07:24)
- Про Stratix 10 USSR(541 знак., 06.04.2016 20:13, )
  - Да блин, Stratix® 10 -> сильная штука. Что называется, "в зобу дыханье сперло"... - Evgeny_CD(06.04.2016 20:26, ссылка)
  - Тут важна сила инерции! Программеры пойдут программить на CUDA, а не на Verilog|VHDL|SystmC. Бабло побеждает зло - при 10 нм технологии CUDA станет еще мощнее, библиотеки - еще удобнее, а то, что они стали еще толще - кто это заметит? - Evgeny_CD(06.04.2016 20:17)
- О том же -> - Evgeny_CD(06.04.2016 20:08, ссылка)
  - Про чип -> - Evgeny_CD(06.04.2016 20:09, ссылка)

Средства и методы разработки