ВходНаше всё Теги codebook 无线电组件 Поиск Опросы Закон Четверг
25 апреля
769992 Топик полностью
Evgeny_CD, Архитектор (21.07.2017 02:20, просмотров: 97) ответил Evgeny_CD на Volta GV100 от Nvidia -> тоже под эти тензоры заточены. Да что ж их так всех прорвало-то?!
Подробно расписано, что там за тензоры. -> "Каждое тензорное ядро осуществляет 64 операции умножения-сложения с однократным округлением (fused multiply-add — FMA) с плавающей запятой смешанной точности за один такт. Точность вычислений в этой http://caxapa.ru/769991.html
операции смешанная, многократное перемножение двух FP16-матриц осуществляется с FP32-точностью, накопление также совершается с FP32-точностью, и результат выдается в FP32-формате. Восемь тензорных ядер в каждом мультипроцессоре SM выполняют в общем 1024 операции с плавающей запятой за такт, что в восемь раз быстрее, чем может обеспечить мультипроцессор архитектуры Pascal с использованием стандартных FP32-операций."