16+
Воскресенье
17 декабря
Вход |Карта сайта | |Upload |codebook | PARTS

 О смысле всего сущего 0xFF

 Средства и методы разработки

 Мобильная и беспроводная связь

 Блошиный рынок Объявления

caxapa

Микроконтроллеры ARM 

AVR PIC MSP PLD,FPGA,DSP 

Кибернетика Технологии 

Схемы, платы, компоненты 

Средства и методы разработки

 
   Новая тема Правила Регистрация Поиск »» Архив
Вернуться в конференциюТопик полностью
Ксения  (10.08.2017 01:53 - 10.08.2017 02:02) , в ответ на и как? сей мазохизм героизм оправдан ?? Есть ли выйгрыш по скорости счёта?? А то бытует мнение, что на современных архитектурах компилятор делает всё гораздо оптимальнее обычного программиста (нисколько не сомневаюсь, что на ассемблере автор: Adept
Оцените сами: 
Нахождение максимального элемента в массиве (время исполнения) float-массив: max_f0: 1296 ms // компилятор C/C++ max_f1: 1625 ms // ассемблер для FPU max_f4: 109 ms // ассемблер для SSE2 (сравнивает 4 элемента одновременно) max_f8: 62 ms // ассемблер для AVX (сравнивает 8 элементов одновременно) double-массив: max_d0: 1281 ms // компилятор C/C++ max_d1: 1812 ms // ассемблер для FPU max_d2: 203 ms // ассемблер для SSE2 (сравнивает 2 элемента одновременно) max_d4: 125 ms // ассемблер для AVX (сравнивает 4 элемента одновременно) Ускорение происходит за счет того, что компилятор не использует "упакованную арифметику", а на ассемблере я ее использую. Выигрыш в скорости (если у процессора есть AVX) для double - в 10 раз, для float - в 20 раз.
Главная | Карта сайта | О проекте | Проекты | Файлообменник | Регистрация | Вебмастер | RSS
Лето 7526 от сотворения мира. При использовании материалов сайта ссылка на caxapу обязательна.
MMI © MMXVII