-
- Про М3 и М4 по ссылкам. Не забываем, что у М4 есть DSP, можно попробовать ускорить. - SciFi(14.06.2019 19:05, ссылка, ссылка)
- Спасибо! Показалось, что у M4 нет аппаратного умножения без DSP. В первом приближении у M4 большинство команды выполняется за один цикл. - De_User(14.06.2019 19:10 - 19:15)
- Предусмотрено. И там нет вариантов без DSP, ЕМНИП. - SciFi(14.06.2019 19:13)
- Спасибо! - De_User(14.06.2019 19:15)
- Предусмотрено. И там нет вариантов без DSP, ЕМНИП. - SciFi(14.06.2019 19:13)
- Спасибо! Показалось, что у M4 нет аппаратного умножения без DSP. В первом приближении у M4 большинство команды выполняется за один цикл. - De_User(14.06.2019 19:10 - 19:15)
- Гы гы. Только для Cortex-M0, M0+ ARM публикует растактовку исполнения команд. Еще для Cortex-A9 официально опубликовано. Для всех остальных это типа секретная информация. - Evgeny_CD(14.06.2019 19:03)
- Растактовку бессмысленно публиковать для процессоров с длинными кэшами и out of order execution. - lloyd(14.06.2019 19:40)
- По п.1, при питании от 3,3В и тактовой частоте 120 МГц STM32F4 будет работать синхронно с Flash (30 МГц) за счёт шины 4*32 = 128 бит. Так что можно будет оценить максимальное время выполнения кода, пусть даже с погрешностью 25%. - De_User(14.06.2019 19:45)
- Максимальное-то можно оценить, но с реальным оно может и не биться. А что, если шину заспамил DMA? Растактовку хорошо считать на простых ядрах типа pru-icss или cla, у которых все прозрачно, а на этих монстрах только статистика - lloyd(14.06.2019 21:53)
- А разве память программ на одной шине с данными? - De_User(14.06.2019 23:08)
- Максимальное-то можно оценить, но с реальным оно может и не биться. А что, если шину заспамил DMA? Растактовку хорошо считать на простых ядрах типа pru-icss или cla, у которых все прозрачно, а на этих монстрах только статистика - lloyd(14.06.2019 21:53)
- ST хвалится, что у них ускоритель делает так, будто zero-cycle memory. Ежели не врут, нужно ориентироваться именно на эти таблицы (для длинных циклов, конечно). - SciFi(14.06.2019 19:41)
- По п.1, при питании от 3,3В и тактовой частоте 120 МГц STM32F4 будет работать синхронно с Flash (30 МГц) за счёт шины 4*32 = 128 бит. Так что можно будет оценить максимальное время выполнения кода, пусть даже с погрешностью 25%. - De_User(14.06.2019 19:45)
- Однако у меня ошибочные сведения в части Cortex-M3 как минимум -> - Evgeny_CD(14.06.2019 19:06, ссылка)
- Значит, у меня глюки. Но всё равно ознакомьтесь --> - SciFi(14.06.2019 19:06, ссылка)
- Спасибо! - Evgeny_CD(14.06.2019 19:11)
- Растактовку бессмысленно публиковать для процессоров с длинными кэшами и out of order execution. - lloyd(14.06.2019 19:40)
- Про М3 и М4 по ссылкам. Не забываем, что у М4 есть DSP, можно попробовать ускорить. - SciFi(14.06.2019 19:05, ссылка, ссылка)