-
- Текущий взгляд на производительность. Evgeny_CD(822 знак., 02.05.2023 23:22, ссылка)
- Любопытное мнение о сравнительной производительности Cortex-A7 и
Cortex-M7. Only looking at Coremark, Cortex-A7 is less powerful
than Cortex-M7 (in STM32H7). Cortex-A7 exhibit around 3 or 4
Coremark per MHz per core (depend on ARM/Thumb code execution and
used compiler). Cortex-M7 is reaching 5 per MHz. Evgeny_CD(1 знак., 02.05.2023 21:34, ссылка)
- A7 никогда 4 CoreMark / MHz не покажет. И даже 3 только в очень специальных случаях. 2.6 реально. Но! Если работать с большим объемом данных, M7 без L2 утухнет. - Evgeny_CD(02.05.2023 23:26)
- Где-то что-то такое я видел... =AlexD=(1 знак., 02.05.2023 22:08, ссылка)
- Спасибо! - Evgeny_CD(02.05.2023 23:26)
- Ха, кажеццо я понял где найопка. Если исполнять одновременно MAC и
SIMD инструкции то получится 5коремарков на этой паре. - =AlexD=(02.05.2023 22:22)
- Там есть такая опция? - Kpoк(02.05.2023 23:24)
- Любопытное мнение о сравнительной производительности Cortex-A7 и
Cortex-M7. Only looking at Coremark, Cortex-A7 is less powerful
than Cortex-M7 (in STM32H7). Cortex-A7 exhibit around 3 or 4
Coremark per MHz per core (depend on ARM/Thumb code execution and
used compiler). Cortex-M7 is reaching 5 per MHz. Evgeny_CD(1 знак., 02.05.2023 21:34, ссылка)
- Теоретическая тактовая производительность на плавучке для Cortex-A7, Cortex-A9 и Cortex-A15. Подборка ссылок -> - Evgeny_CD(15.05.2018 01:23, ссылка)
- Cortex-A9 <-> Cortex-R4 <-> Cortex-M7 Evgeny_CD(566 знак., 08.05.2018 02:57)
- Сравнение производительности int и SP TI C66x DSPs, C674x DSPs и Cortex-A15. Жаль, в DP не сравнили.... Evgeny_CD(12.03.2018 23:24)
- CoreMark Scores -> Нормального поиска по чипам и архитектурам нет, но крайне интересный источник информации. Курить вдумчиво - Evgeny_CD(03.03.2018 00:59, ссылка)
- ARM Cortex-A9 or Cortex-A7 обсуждение тонкостей кешей -> - Evgeny_CD(03.03.2018 00:53, ссылка)
- DMIPS сравнение производительности Cortex-A на основе декларативных данных, но есть интересные подробности -> - Evgeny_CD(03.03.2018 00:48, ссылка)
- Япы изучили Cortex-A5, Cortex-A7, Cortex-A9 и Cortex-A53 в тестах Dhrystone(DMIPS/MHz), CoreMark(CoreMark/MHz), SPECInt 2000 base -> - Evgeny_CD(03.03.2018 00:45, ссылка)
- Измерение скорости мелких недорогих платочек стандартными методами -> - Evgeny_CD(03.03.2018 00:42, ссылка)
- Relative Performance of ARM Cortex-A 32-bit and 64-bit Cores -> DMIPS, декларативные данные из презентаций ARM (Cortex-A9 в жизни показывает куда меньшую производительность) - Evgeny_CD(03.03.2018 00:38, ссылка)
- Любопытно. Сравнение скорости Cortex-M7 <-> Cortex-A9 по данным IAR -> Evgeny_CD(403 знак., 02.03.2018 02:27, ссылка)
- А где сравнение с A8, A7, A53? - lloyd(02.03.2018 07:37)
- По ссылке сравнение. По второй ссылке тоже много интересного. - Ruslan(02.03.2018 19:13 - 19:24, ссылка, ссылка)
- Ссылка не открывается, похоже битая - AlexG(02.03.2018 06:55)
- А почему M7 сравнивают с A9, а не с A15? Вроде бы он побыстрее будет и более распространен. - Ксения(02.03.2018 02:40 - 02:43)
- IAR сравнивает, а он А15 не поддерживает. - Evgeny_CD(02.03.2018 02:43)
- И A-15 тоже? Интересно почему. С A-53 оно ясно - тот 64-разрядный, а с A-15 непонятно. - Ксения(02.03.2018 02:49)
- IAR сравнивает, а он А15 не поддерживает. - Evgeny_CD(02.03.2018 02:43)
- А где сравнение с A8, A7, A53? - lloyd(02.03.2018 07:37)
- Сравнение ядер Cortex при помощи CoreMark benchmark. Вывод - Cortex-m7 -> со своими 5 CoreMark/Мгц и 300 МГц (1500 CoreMark) оказался гораздо быстрее многих предыдущих чемпионов. Evgeny_CD(1137 знак., 09.06.2015 12:07, ссылка)
- Вчера искал, но не нашел сколько CoreMark/МГц у Cortex-А7. А7 сравним с М7 ? - Ruslan(31.03.2018 16:10)
- все эти попугаи - фуфло, вон народ с Cortex A9 уже лоханулся, у которого заявленные попугаи только когда работаешь с L2 cache, при работе с ОЗУ он превращается в слоупока. - lloyd(31.03.2018 17:18)
- "Чисто ради энтомологического интереса" - Ruslan(31.03.2018 18:08)
- все эти попугаи - фуфло, вон народ с Cortex A9 уже лоханулся, у которого заявленные попугаи только когда работаешь с L2 cache, при работе с ОЗУ он превращается в слоупока. - lloyd(31.03.2018 17:18)
- Cortex-M7 - подробности ядра -> + вложено. Конвейр 2 операции параллельно, в порядке исполнения. Можно параллельно 1 плавучку и 1 целочисленный. В целом, если научиться на асме писать код для этого чуда - зачь оно может нипадеццки. Evgeny_CD(09.06.2015 12:55)
- Шикарная презентация по ядру M7 ->. Коллеги, кто может помочь выкачать? - Evgeny_CD(09.06.2015 13:13, ссылка)
- вложено Д.ARMоед(09.06.2015 15:41)
- А что скажете по существу по ядру? Как они так сильно перфоманс подкрутили? Как сложно для него будет код оптимизировать? - Evgeny_CD(09.06.2015 15:44)
- они что? Cortex-R хоронят? - Mahagam(09.06.2015 16:01)
- По разным сегментам разводить будут. Со временем будет R7 какой-нибудь. - Evgeny_CD(09.06.2015 16:04)
- по мелким ядрам - ничего умного сказать не могу. у меня был интерес в старших модельках, которые вдруг резко опустили биглиттлом. - Д.ARMоед(09.06.2015 15:56)
- они что? Cortex-R хоронят? - Mahagam(09.06.2015 16:01)
- Спасибо! Ты наш спаситель! - Evgeny_CD(09.06.2015 15:43)
- А что скажете по существу по ядру? Как они так сильно перфоманс подкрутили? Как сложно для него будет код оптимизировать? - Evgeny_CD(09.06.2015 15:44)
- вложено Д.ARMоед(09.06.2015 15:41)
- асм это не подход. Не для того я покупаю эти мегагерцы и навороченные ядра чтобы еще в асме ковыряться. Должно быть дешевое железо и быстрые средства программирования аля МЭК131 или жаба на худой конец - lexxx-lexxx(09.06.2015 13:02)
- Блин, ну зачем сразу убиваться ап стенку? Нет противоречия ASM <-> C. Уж сто раз обсуждали. Evgeny_CD(292 знак., 09.06.2015 13:16)
- Сравнивали тут пару недель назад ручную оптимизационную писанину с использованием SIMD на ассемблере определенной циклической обработки (не фильтр, ближе к корреляции), так компилятор Шарка с оптимизацие по скорости данной функции и разрешенным sav6622(65 знак., 09.06.2015 15:52)
- Ок, не буду спорить. Не будет асма - я буду только счастлив :) - Evgeny_CD(09.06.2015 15:54)
- Да там оптимизация то плёвая, думаю компилятор допилят до поддержки группирования инструкций. - =AlexD=(09.06.2015 15:36)
- Сравнивали тут пару недель назад ручную оптимизационную писанину с использованием SIMD на ассемблере определенной циклической обработки (не фильтр, ближе к корреляции), так компилятор Шарка с оптимизацие по скорости данной функции и разрешенным sav6622(65 знак., 09.06.2015 15:52)
- Блин, ну зачем сразу убиваться ап стенку? Нет противоречия ASM <-> C. Уж сто раз обсуждали. Evgeny_CD(292 знак., 09.06.2015 13:16)
- Шикарная презентация по ядру M7 ->. Коллеги, кто может помочь выкачать? - Evgeny_CD(09.06.2015 13:13, ссылка)
- Интересно девки пляшут, а за счёт чего у него столько марков? - =AlexD=(09.06.2015 12:13)
- Суперскалярность! Две операции за такт. Конечно, надо смотреть сколько получится при комбинации FLASH + CACHE - Evgeny_CD(09.06.2015 12:16)
- Так и у A5/A7/A9 какая-то суперскалярность быть должна. К примеру в атоме 2 путный инордер на 2х потоках даёт 2,8 коремарков. А здесь откуда? - =AlexD=(09.06.2015 12:21)
- A5/A7 - точно нет суперскалярности. А9 какая-то есть. Atom получил внеочередное исполнение, начиная с Silvermont. До этого они были УГ по производительности. Evgeny_CD(44 знак., 09.06.2015 12:27)
- Внеочередное - да, а двухпутность у него была изначально, как и у M7 го. Откуда вдруг такой перевес в более простом ядре? - =AlexD=(09.06.2015 12:31)
- не нужно путать удельные и абсолютные показатели. Атом за счет гигагерцовой тактовой всех рвет по Абсолюту - M7 имеет 300 МГц. Тут надо говорить про узкий диапазон оптимальности. Evgeny_CD(126 знак., 09.06.2015 12:34)
- У Атома тоже широкий декодер. И я привожу марк на МГц, так что частота идёт лесом. Всё равно непонятно. - =AlexD=(09.06.2015 12:40)
- В части частоты я имел в виду, что может быть Интель тоже умеет делать 5 марков/МГц, но тогда при гиговой тактовой это жрало бы 100500 Вт, вот они так и не делают. - Evgeny_CD(09.06.2015 12:43)
- Это понятно, но на вопрос не отвечает :-) - =AlexD=(09.06.2015 15:35)
- Презу можете выкачать -> ? Там есть ответы. - Evgeny_CD(09.06.2015 15:37, ссылка)
- Нету у меня фейкбукового аккаунта - =AlexD=(09.06.2015 15:39)
- Коллега! - Evgeny_CD(09.06.2015 15:40)
- Нету у меня фейкбукового аккаунта - =AlexD=(09.06.2015 15:39)
- Презу можете выкачать -> ? Там есть ответы. - Evgeny_CD(09.06.2015 15:37, ссылка)
- Это понятно, но на вопрос не отвечает :-) - =AlexD=(09.06.2015 15:35)
- Я тоже чую, что где-то нас наипали, но не могу понять где :) - Evgeny_CD(09.06.2015 12:41)
- В части частоты я имел в виду, что может быть Интель тоже умеет делать 5 марков/МГц, но тогда при гиговой тактовой это жрало бы 100500 Вт, вот они так и не делают. - Evgeny_CD(09.06.2015 12:43)
- У Атома тоже широкий декодер. И я привожу марк на МГц, так что частота идёт лесом. Всё равно непонятно. - =AlexD=(09.06.2015 12:40)
- не нужно путать удельные и абсолютные показатели. Атом за счет гигагерцовой тактовой всех рвет по Абсолюту - M7 имеет 300 МГц. Тут надо говорить про узкий диапазон оптимальности. Evgeny_CD(126 знак., 09.06.2015 12:34)
- Внеочередное - да, а двухпутность у него была изначально, как и у M7 го. Откуда вдруг такой перевес в более простом ядре? - =AlexD=(09.06.2015 12:31)
- A5/A7 - точно нет суперскалярности. А9 какая-то есть. Atom получил внеочередное исполнение, начиная с Silvermont. До этого они были УГ по производительности. Evgeny_CD(44 знак., 09.06.2015 12:27)
- Так и у A5/A7/A9 какая-то суперскалярность быть должна. К примеру в атоме 2 путный инордер на 2х потоках даёт 2,8 коремарков. А здесь откуда? - =AlexD=(09.06.2015 12:21)
- Суперскалярность! Две операции за такт. Конечно, надо смотреть сколько получится при комбинации FLASH + CACHE - Evgeny_CD(09.06.2015 12:16)
- Вчера искал, но не нашел сколько CoreMark/МГц у Cortex-А7. А7 сравним с М7 ? - Ruslan(31.03.2018 16:10)
- Текущий взгляд на производительность. Evgeny_CD(822 знак., 02.05.2023 23:22, ссылка)