ВходНаше всё Теги codebook 无线电组件 Поиск Опросы Закон Пятница
26 апреля
737753 Топик полностью
Ксения (19.02.2017 13:23, просмотров: 332) ответил Хаос на Ну, тогда я не понял, к чему все эти разговоры про недостаточное быстродействие современных процессоров.. :)
Вы не спросили у меня, сколько раз повторяется эта операция, тогда как она повторяется в задаче около миллиона раз. Из-за этого одна лишь эта операция занимает около минуты. Но есть и другие задачи, которые в полном объеме требуют уже часов. Я это сингулярное разложение раньше на ассемблере целиком писала, чтобы свести время выполнения к минимуму, но тогда это был код для FPU87. Так вот мой вариант работает в 10 раз медленнее, чем библиотечная функция, использующая AVX. А 70 мкс - скорость работы функции LAPACKE_dsyevr из интеловской библиотеки MKL. Кстати, совсем недавно мне удалось победить MKL в скорости вычисления скалярного произведения, хотя лишь на 10% и только на 64-разрядном коде (на нем прочему-то плавающая арифметика быстрее работает).