[ARMv8-A AArch64, даже в самом простом варианте Cortex-A53 - архитектура всего в embedded?] Попытка осознать текущее положение вещей. Есть приложение для iOS и Android для тестирования производительности FPU VFP Benchmark
http://dench.flatlib.jp/app/vfpbench
Вот результаты тестирования
http://wlog.flatlib.jp/item/1793
Поможет с японским
https://translate.google.ru
Что бросается в глаза.
1. Cortex-A53 на DP плавучке в режиме AArch32 проигрывает самому себе в 2 раза в режиме AArch64
Вот здесь обсуждение
Why does FPU performance differ in AArch64 and AArch32 with Cortex-A53?
https://community. …arch32-with-cortex-a53
В приложенной презе это описано как то, что в ARMv8 SIMD - 128 битный, и соответственно, две DP операции за такт. 32 битный режим просто не имеет соответствующих команд.
2. Cortex-A53 примерно в 4 раза быстрее и на SP и на DP, чем Cortex-A7. При одинаковой тактовой.
3. Последняя табличка в результатах теста - это типа чувак сравнивал время компиляции на разных платформах. Cortex-A53 (4 ядра 4 потока 1.2GHz) проиграл в 1.8 раза Celeron N3150 (4 ядра 4 потока 1.6GHz). Или 1.3 раза при приведении к одинаковой тактовой. Это, конечно, слабый тест, но он отчасти показывает, что ARMv8 вполне сопоставимы по скорости с маломощными x86.
4. Linpack Benchmark Results на x86 и ARM - и снова нет отставания ARMv8 на порядок от ARM.
http://www.roylong …/linpack%20results.htm
5. Следовательно, эксперименты с запуском 32 битного кода на 64 битной Raspberry Pi 3, бессмысленны.
http://caxapa.ru/819613.html
6. i.MX 8M Arm® Cortex®-A53 (1.5 ГГц) + Cortex-M4 нам уже доступны
http://caxapa.ru/819612.html
Причем жрет он не больше 3W на при самом-самом максимуме (без графики). Небольшой радиатор.
И недорогие платочки с именно 4-х ядерным вариантом
http://caxapa.ru/819785.html
7. mAbassi SMP RTOS for Cortex-A53 - это чтобы Линух не портил RT
http://caxapa.ru/819619.html
Линух хорош для многих задач, но не для всех.
8. Вишенка на торте - ECP5-5G. Самые дешевые FPGA с 5G трансиверами - под PCIe 2.0, коих в i.MX 8M есть 2 линии (даже вроде как 2 контроллера)
http://caxapa.ru/820076.html
9. Считаем бабки
MIMX8MQ5DVAJZAA I.MX 8M QUADLITE, ARM CORTEX-A53 ARM® Cortex®-A53 Microprocessor IC - 4 Core, 32-Bit 1.5GHz 621-FCPBGA (17x17) - это комерческие, без GPU
100 - $43.0511
LFE5UM5G-25F-8BG381C 24000 LUT 197 IO
100 - $14.2986
MT41K64M16TW-107 AIT:J TR SDRAM - DDR3L Memory IC 1Gb (64M x 16) Parallel 933MHz 20ns 96-FBGA (8x14) -40°C ~ 95°C
2,000 $5.82
Итого $69 (2 чипа памяти - 32 битная шина) за модулек, который порвет все современные DSP. И да, за счет FPGA он сможет подключить почти любой интерфейс, и в самой FPGA куча умножителей и памяти есть
Осталось сделать самую малость - освоить этот чем без Линуха. Чтобы управлять железом напрямую и четко управлять временем исполнения, чтобы кеши, DMA и программы работали в нужной синхронизации.