ВходНаше всё Теги codebook 无线电组件 Поиск Опросы Закон Суббота
4 мая
1168789 Топик полностью
=AlexD= (28.01.2022 13:48, просмотров: 259) ответил Mahagam на чот мне кажется, что минимум 4 умножения за раз можно стартовать (SSE), а если ещё и учесть количество ядер процессора. и все равно, программа не состоит из одних только умножений. умножители в плис пока только целочисленные. в седьмой серии их увеличили по разрядности до 25*18 и на выходе давно есть аккумулятор (48 бит)
В этом смысл параллельности ALU - "другая часть программы" исполняется на других ALU, как-то операции загрузки аргументов, сохранения результатов, счётчики циклов и всякая прочая сопутствующая мелочь. Если вспомнить про AVX , гипертрейдинг и многопроцессорность, то любая числомолотилка упирается исключительно в память, которая у CPU ну очень широкая и быстрая. Единственным узким моментом может быть перекидывание контекста на ОСь. 
надо придумать объяснение этому мудизму, иначе рехнуться можно