Это моё личное предвзятое мнение. Любое совпадение с реальностью является случайным и непреднамеренным.
-
- А что, там нет команды клонировать один 32 битный операнд (как часть 128 битного слова) в 4 ячейки 128 битного операнда? Маски константны, один раз загрузил в стек и все. Результаты выгрузил, процессор видит это как массив, делает переход по Evgeny_CD(60 знак., 01.12.2011 11:47)
- Не, ну если нужно наложить разные маски на одно слово, то это можно устроить. Нельзя к примеру одновременно сдвиг и AND в одном 128битном слове. =AlexD=(286 знак., 01.12.2011 12:57)
- +1. Книжки по SSE и асму поставлны на скачивание. Разные маски на одно слово сильно ускорят. Т.е. по первой маске мы определяем команду и переходим на ее обработчик. Обработчик берет результат второй маски (а не тратит время на накладываение своей Evgeny_CD(279 знак., 01.12.2011 13:21)
- Какие ещё книжки? Лично мне хватало интеловского описания набора инструкция и поддержки интринсиков в MS VC. - =AlexD=(01.12.2011 19:20)
- +1. Книжки по SSE и асму поставлны на скачивание. Разные маски на одно слово сильно ускорят. Т.е. по первой маске мы определяем команду и переходим на ее обработчик. Обработчик берет результат второй маски (а не тратит время на накладываение своей Evgeny_CD(279 знак., 01.12.2011 13:21)
- Не, ну если нужно наложить разные маски на одно слово, то это можно устроить. Нельзя к примеру одновременно сдвиг и AND в одном 128битном слове. =AlexD=(286 знак., 01.12.2011 12:57)
- А что, там нет команды клонировать один 32 битный операнд (как часть 128 битного слова) в 4 ячейки 128 битного операнда? Маски константны, один раз загрузил в стек и все. Результаты выгрузил, процессор видит это как массив, делает переход по Evgeny_CD(60 знак., 01.12.2011 11:47)