-
- Код с SSE работает примерно в 1000 раз быстрее LuaJIT - lloyd(10.02.2021 21:46, ссылка)
- Я не понимаю. Напишите сколько ПК тратит на 1млн значений в массиве
в ms ну или us. 0.644775ms? Спасибо - Tpoeшник(10.02.2021 23:03)
- С SSE4.1 он потратил на это 0.6 мкс. Суть в использовании SIMD
инструкций, которые находят 16 максимумов за раз. - lloyd(11.02.2021 06:29)
- Там сразу вынимает 16 байт, и 16 компараторов сравнивают их с 16
опорами? - Kpoк(11.02.2021 10:24)
- ага. SIMD давно умеет в 128 бит. очень давно - Mahagam(11.02.2021 14:57)
- 0,6 мкс на 1000000 значений? Это 0,6 пс на одно значение? У меня 2
вопроса: как я проспал терагерцы и какая там скорость памяти? - SciFi(11.02.2021 07:31)
- +1 - Tpoeшник(11.02.2021 09:20)
- Вообще может я и накосячил в коде, надо внимательнее глянуть. Но
вообще весь мегабайт строки прекрасно помещается в кеш процессора
(запускалось на intel xeon) - lloyd(11.02.2021 08:10)
- для работы из кеша вообще какой-то нереальный тормоз :( - Adept(11.02.2021 15:41)
- запускалось в виртуалке, вот - lloyd(11.02.2021 17:35)
- для работы из кеша вообще какой-то нереальный тормоз :( - Adept(11.02.2021 15:41)
- Там сразу вынимает 16 байт, и 16 компараторов сравнивают их с 16
опорами? - Kpoк(11.02.2021 10:24)
- С SSE4.1 он потратил на это 0.6 мкс. Суть в использовании SIMD
инструкций, которые находят 16 максимумов за раз. - lloyd(11.02.2021 06:29)
- Я не понимаю. Напишите сколько ПК тратит на 1млн значений в массиве
в ms ну или us. 0.644775ms? Спасибо - Tpoeшник(10.02.2021 23:03)
- Код с SSE работает примерно в 1000 раз быстрее LuaJIT - lloyd(10.02.2021 21:46, ссылка)