ыыыы (29.03.2012 19:47, просмотров: 1) ответил Mahagam на блекфин, конечно, шустрый. но наверное не настолько )
тут вроде бы даже были бенчмарки и сам я достаточно много для BF и старых ARM-ов (7хх) писал. у BF шина к памятям L1 хитрая, то есть он может за один такт достать два 32х битных операнда, положить один результат и операцию выполнить (причем там upto четыре сложения). возможно NEON в АРМах что-то такое же умеет, не програмил. BF компилер, что gcc, что adi-шный этим пользоваться не умел(ет) - надо было ручками по правильным памятям раскладывать и на "параллельном" асемблере писать. то есть раз в 6 мне казалось вполне достижимо, но спорить не могу - не уверен