Подборка по [Sitara Processor AM5728 и AM5718] -> Опенсорцная борда под них BeagleBoard-X15 --> http://beagleboard.org/x15
http://www.ti.com/product/am5728/description
official BeagleBoard-X15 Support Page
http://www.elinux. …eboard:BeagleBoard-X15
Борда официально запущена 14 октября 2015 года
http://beagleboard …10-14-beagleboard-x15/
Вот как бордоделы говорят о скорости:
With dual ARM® Cortex®-A15 cores clocked at 1.5GHz, the BeagleBoard-X15 provides nearly three times the performance per core of a typical ARM Cortex-A9 processor.
Сравнение скорости современных Cortex-A* на FP DP.
http://caxapa.ru/651650.html
http://caxapa.ru/651565.html - здесь про дешевые 64 битные 4-х ядерники и платы на них
Cortex A9 не поддерживает DP в NEON. Mul (fp64) и MAC (fp64) - 2 такта на операцию. Cortex A15 не поддерживает DP в NEON, но на те же операции по 1 такту. ARM v8 (Cortex-A5*) при даблах отстает от Sandy Bridge в 2.4 раза (при использовани в обоих случаях одного ядра). ARM Cortex-A53 MPCores. Single and double precision floating point: 4 SP/2 DP FLOPS/MHz o NEON Advanced SIMD support with single and double precision floating point instructions. Cortex-A57 supports dual FMAC unit with SIMD offering up to 4 DP FLOPS
Важный момент в понимании странностей Cortex-A9. Суть их в том, что при работе с 1 ядром и не очень большими объемами данных (влазит в L2) сокрость получается близкой к теоретической, а при запуске нескольких потоков с работой со внешней памятью скорость падает просто драматически
http://caxapa.ru/651655.html
https://community. …cale.com/thread/305349
MX6Q has four Cortex A9 cores running at 1.2G. В однопоточном режиме The result is 3.98G/s (32bit float). This is the computing power of one core. See, Cortex-A9 is rather a powerful core.
We tested the program for two 1000x1000 matrix multiplication algorithm, the total computing load is 2GFLOPS, and the result is:
1 thread (using one core) 190MFLOPS
2 threads (using two cores) 380MFLOPS
4 threads (using four cores) 740MFLOPS
Скорее всего, тонкость в следующем.
http://caxapa.ru/651806.html
"для ам4х (техасовый кортекс а9) копирование памяти - порядка 250 мегабайт в секунду для ам5х (кортекс а15) оно же - порядка 3 гигабайт в секунду" Как-то все плохо у Cortex-A9 (в типовом окружении) в части работы с внешней памятью.
Вот откуда взяты данные:
Processor SDK Linux Kernel Performance Guide - ценнейшая информация о скорости разных ядер и камней на разных ральных тестах
http://processors. …rnel_Performance_Guide
Есть поддержка взаимодействия ARM с DSP на уровне ядра:
Will I be able to program the C66x DSPs?
Yes, there is a free C/C++ compiler from Texas Instruments and support in the mainline of the open source GCC C/C++ compiler. Support for interprocessor communication is also included in the mainline Linux kernel via RPMSG
dsptop, similar to the Linux top utility, provides visibility to usage data for TI multicore DSP-ARM SoC devices
http://processors. …i.com/index.php/Dsptop
В целом, 2 ядра Cortex-A15 - это уже недалеко по производительности к двухядерным Атомам (современным, Silvermont
https://en.wikipedia.org/wiki/Silvermont ) при меньшем в разы энергопотреблении. Но по плавучке, особенно дабловой, боюсь, Silvermont надерет задницу высочке ARM :)
Есть открытая борда, AM5728 и AM5718 уже продаются на digikey.com - в целом, препятствий для создания независимых дизайнов нет.
Однако, дока на AM5728 и AM5718 - это 7600 страниц, и курить ее можно долго :( Errata тоже довольно забористая.
AM5728 и AM5718 - хорошая основа для серьеных embedded систем следующего поколения (если кому надо такой перфоманс). С учетом всей якобы открытости я бы оценил минимальный срок осовения этой платформы небольшой командой из нескольких человек в год (думаю, это оптимистично), что, в целом, далет эту платформу доступной для небольших компаний.
Большое спасибо Serg_D, он же Lazy, загадочному L, и всем остальным, кто помогал хоть немного разобраться в теме.