-
- Я-ж обо што и пишу. Если задача ложится на ФПГА, какой гиговый ДСП сосед у какого Цыклона-2 на 140МГц, не говоря обо што более жырное. Но стоит написать корку какого АВР, то выясняецца, что МК с 0,35мкм нормами уделывает 50-60нм аналога на равных частотах. Я уж не говорю о потреблении. Потомушто АВР специализированная схема, а ФПГА, универсальная. - mse homjak(28.01.2022 16:09)
- Если нужно много умножений, то их процент в соответствующей
программе будет немалым, если считать исполняемые команды, а
учитывая наличие параллельных ALU и конвейеризацию, то одновременно
может исполняться пара умножений каждый такт на частоте ~3ГГц с
предельной загрузкой 256битной шины DDR4 памяти, и это только одно
ядро и без SIMD. А, ктати, умножители в спартане плавучие или
целочисленные? - =AlexD=(28.01.2022 10:55)
- чот мне кажется, что минимум 4 умножения за раз можно стартовать
(SSE), а если ещё и учесть количество ядер процессора. и все равно,
программа не состоит из одних только умножений. умножители в плис
пока только целочисленные. в седьмой серии их увеличили по
разрядности до 25*18 и на выходе давно есть аккумулятор (48 бит) - Mahagam(28.01.2022 11:19)
- В этом смысл параллельности ALU - "другая часть программы" исполняется на других ALU, как-то операции загрузки аргументов, сохранения результатов, счётчики циклов и всякая прочая сопутствующая мелочь. Если вспомнить про AVX , гипертрейдинг и многопроцессорность, то любая числомолотилка упирается исключительно в память, которая у CPU ну очень широкая и быстрая. Единственным узким моментом может быть перекидывание контекста на ОСь. - =AlexD=(28.01.2022 13:48)
- чот мне кажется, что минимум 4 умножения за раз можно стартовать
(SSE), а если ещё и учесть количество ядер процессора. и все равно,
программа не состоит из одних только умножений. умножители в плис
пока только целочисленные. в седьмой серии их увеличили по
разрядности до 25*18 и на выходе давно есть аккумулятор (48 бит) - Mahagam(28.01.2022 11:19)