caxapa.ru :: Так не годится, т.к. исходные массивы должны быть типа double. Т.е. каждый элемент в них - число, а вовсе не пакет из 4-х чисел. Правильно - копировать числа четверками из double-массивов в регистры ymm, а потом использовать параллельную пакетную

Ксения (18.10.2016 00:42, просмотров: 298) ответил fk0 на Смотри:

Так не годится, т.к. исходные массивы должны быть типа double. Т.е. каждый элемент в них - число, а вовсе не пакет из 4-х чисел. Правильно - копировать числа четверками из double-массивов в регистры ymm, а потом использовать параллельную пакетную арифметику на этих регистрах. Недостаток у вашего предыдущего кода был только один - он использовал вместо AVX-регистров ymm (в которые помещается 4 штуки double) SSE2-регистры xmm (в которые помещается только 2 штуки double). Из-за этого производительность упала почти вдвое. В будущей системе AVX512 появятся регистры zmm, еще более длинные - в них помещаются сразу 8 штук чисел типа double. Тогда будет нужно паковать эти регистры из массивов по 8 штук подряд, чтобы арифметику считать сразу над восьмерками чисел. Переопределение типа double на __m256 в принципе может работать, но это нечестно :), т.к. компилятор обязан был сам догадаться про упаковку, как он догадался в предыдущем случае, когда решил использовать xmm. Странно лишь то, что он не догадался использовать ymm.

Ответить

- Ну у тебя-то на входе пакеты! vmovupd и vfmadd231pd работают с пакетами. А иначе есть vmovusd и vfmadd231sd. - fk0(18.10.2016 00:48)
  - vmovusd и vmovapd грузят в длинный регистр данные с указанного им адреса, с ними как раз всё правильно. Проблема в ином - компилятор должен был сам догадаться о том, что double-массив можно обрабатывать четверками. При этом число элементов в Ксения(625 знак., 18.10.2016 01:04 - 01:11)
    - Блин, только открыл ответ сказать, что происходит фактическое использование компилятора как туго управляемого ассемблера с попытками ему вталдычить, как именно он должен поступить — а всё уже сказано :-D - Николай Коровин(18.10.2016 01:11)

Средства и методы разработки