-
- Очень показательная бумага. Cortex-A7 2 ядра, Cortex-A9 4 ядра, Cortex-A15 4 ядра на одинаковой тактовой. Очень хорошо все видно - кто чего стоит. Evgeny_CD(24.02.2016 13:42)
- По FFT график прикольный, конечно. - Evgeny_CD(24.02.2016 13:44)
- Сравнение Cortex с DSP ->. Вот и ответ на все вопросы. Страницы 36 и 37. Вне всякого сомнения, тактовая эффективность у DSP на недосягаемой для универсальных CPU высоте. Но только вот тактовая у китайских $5 Cortex в 3 раза выше, и ядер целых 4 Evgeny_CD(7 знак., 21.02.2016 03:08, ссылка)
- В Cortex'ах нету аппаратной поддержки бит-реверсной адресации. Без неё сравнивать скорости FFT бессмысленно. USSR(351 знак., 21.02.2016 08:16,
)
- Да, спасибо! - Evgeny_CD(24.02.2016 13:48)
- В Cortex'ах нету аппаратной поддержки бит-реверсной адресации. Без неё сравнивать скорости FFT бессмысленно. USSR(351 знак., 21.02.2016 08:16,
- а с GPU ? - zeleny(09.02.2016 18:26)
- ГПУ - это к товарищу Менжинсокму - Крок(09.02.2016 21:02)
- Это подраздел специальной олимпиады. Evgeny_CD(397 знак., 09.02.2016 18:30)
- Интересно что еще в 75том году был сопроцессор intel 8231. Можно было их использовать десятками в параллель с 8080 для параллельных алгоритмов на плавучке, но не сложилось почему-то. Хотя тогда в основном и писали на асме. - michas(10.02.2016 08:34)
- это понятно. а какие алгоритмы на мобильных ЦП требуют такой скорости ? видео и так неплохо обрабатывается на встроенных GPU - zeleny(09.02.2016 22:48)
- Мобильные ЦП стоят не только в мабилах. Evgeny_CD(637 знак., 09.02.2016 22:57)
- стоп. этот ваш LPC32xx - он с каким ядром? и частота какая? - Mahagam(10.02.2016 09:16)
- LPC3230 266 МГц VFP9 дабловый MAC за 2 такта в конвейере. Камень, мягко говоря, не новье, но только сейчас ему едва-едва появляется замена в виде Cortex-M7 с дабловой плавучкой (и то эту "замену" еще тестировать надо). Краткое описание FPU -> Evgeny_CD(12 знак., 16.02.2016 12:40, ссылка)
- Покажите мне Cortex-M7 с дабловой плавучкой ! - Ruslan(16.02.2016 18:02)
- Зырьте --> - SciFi(16.02.2016 18:10, ссылка)
- Там действительно дабл? Ruslan(277 знак., 16.02.2016 18:20, ссылка)
- Зырьте --> - SciFi(16.02.2016 18:10, ссылка)
- Покажите мне Cortex-M7 с дабловой плавучкой ! - Ruslan(16.02.2016 18:02)
- LPC3230 266 МГц VFP9 дабловый MAC за 2 такта в конвейере. Камень, мягко говоря, не новье, но только сейчас ему едва-едва появляется замена в виде Cortex-M7 с дабловой плавучкой (и то эту "замену" еще тестировать надо). Краткое описание FPU -> Evgeny_CD(12 знак., 16.02.2016 12:40, ссылка)
- Евгений Serg_D(517 знак., 09.02.2016 23:38)
- Да, спасибо! Я вот снова принялся перечитывать доки по L138, которые в свое время неплохо выкурил. Но тогда вопросы плавучки меня мало интересовали :) И насчет компилера Вы, скорее всего, правы. - Evgeny_CD(10.02.2016 00:01)
- Главное, дока на L138 вполне осознаваема. 7600 страниц доки на AM5728 и AM5718 курить можно долго :( - Evgeny_CD(10.02.2016 00:04)
- L138 мне уже как родной. был. ))) Mahagam(150 знак., 10.02.2016 09:13)
- Главное, дока на L138 вполне осознаваема. 7600 страниц доки на AM5728 и AM5718 курить можно долго :( - Evgeny_CD(10.02.2016 00:04)
- Да, спасибо! Я вот снова принялся перечитывать доки по L138, которые в свое время неплохо выкурил. Но тогда вопросы плавучки меня мало интересовали :) И насчет компилера Вы, скорее всего, правы. - Evgeny_CD(10.02.2016 00:01)
- стоп. этот ваш LPC32xx - он с каким ядром? и частота какая? - Mahagam(10.02.2016 09:16)
- Мобильные ЦП стоят не только в мабилах. Evgeny_CD(637 знак., 09.02.2016 22:57)
- и всю эту братию порвёт один TMS320C6678. не напрягаясь. если вам что-то считать - берите процы заточенные для этого (читай - DSP). а если ещё нужен линукс рядом, или другая какая ОС, то берите OMAP, там есть всё. - Mahagam(09.02.2016 09:21)
- Не умничай.Нам авр подавай шоб аврбасик работал и непременно в дип корпусе шоп паять.А то иш удумал чего. - PlainUser(10.02.2016 09:27)
- ну, уж нет, пулемёта я В.... поячьте фарфоровый q376 эм3! - Ациль Шифер(16.02.2016 12:06)
- Выкинь каку. Each C66x .M unit also includes IEEE floating-point multiplication operations from the C674x DSP, which includes one single-precision multiply each cycle and one double-precision multiply every 4 cycles. - Evgeny_CD(09.02.2016 15:14)
- только таких модулей в ядре 2, это раз. ядер - 8, это два. кроме этого, у каждого ядра кроме двух .M модулей, есть два .D модуля для параллельного load-store, есть ещё 4 модуля для параллельных простых вычислений (сложение, вычитание, ветвления). Mahagam(81 знак., 09.02.2016 17:15)
- Камень крутой, но срок разработки под него и цена... 160.00 | 1ku самый дешевый коммерческий, 200.00 | 1ku - самый дешевый индустриальный. У меня готовое изделие в опте стоит всего в 2.5 раза больше :) - Evgeny_CD(09.02.2016 17:22)
- так и одно ядро - тоже будет жечь. в DSP хорошо продуман вопрос как кормить ядра данными, чтобы процесс числодробления не прерывался ни на наносекунду. - Mahagam(09.02.2016 17:26)
- Да, TMS320C6671 - 79.00 | 1ku - это уже теплее, но все равно несколько тоскливо. - Evgeny_CD(09.02.2016 17:45)
- я глаз положил на sitara am5718 Lazy(195 знак., 09.02.2016 18:29,
)
- Не могу понять, что у него с даблами. в DSP части. Evgeny_CD(1369 знак., 09.02.2016 20:03)
- я повторюсь - я там ниже уже писал что А9 фрискейловый выдает пару гигамак когда данные не надо подтягивать из памяти и 200 мегамак когда данные надо тянуть из памяти (и тянуть между прочим линейно а не по байту через килобайт так сказать) Serg_D(407 знак., 09.02.2016 20:57)
- Спасибо! И за Lazy пост, и за этот!!! - Evgeny_CD(09.02.2016 21:17)
- я повторюсь - я там ниже уже писал что А9 фрискейловый выдает пару гигамак когда данные не надо подтягивать из памяти и 200 мегамак когда данные надо тянуть из памяти (и тянуть между прочим линейно а не по байту через килобайт так сказать) Serg_D(407 знак., 09.02.2016 20:57)
- Не могу понять, что у него с даблами. в DSP части. Evgeny_CD(1369 знак., 09.02.2016 20:03)
- эта цена потому что там 2х32к кэша первого уровня (и к кэшу данных - 8 шин по 32 бита, то есть 8 выборок в параллель!) 512к кэша второго уровня, и аж 4 метра кэша 2/3 уровня. Mahagam(69 знак., 09.02.2016 18:13)
- Вот и я про то же - как его эффективно кодить, чтобы все это работало с пользой..... - Evgeny_CD(09.02.2016 18:23)
- у TI достаточно гайдов. а на стандартные FFT/IDCT/DCT и прочую математику есть вылизанные либы. - Mahagam(09.02.2016 18:29)
- Операции с матрицами - это чуть другое, чем "DCT". Это я к тому, что обычно в число стандартных DSP либ оно не входит. - Evgeny_CD(09.02.2016 20:10)
- у TI достаточно гайдов. а на стандартные FFT/IDCT/DCT и прочую математику есть вылизанные либы. - Mahagam(09.02.2016 18:29)
- Вот и я про то же - как его эффективно кодить, чтобы все это работало с пользой..... - Evgeny_CD(09.02.2016 18:23)
- я глаз положил на sitara am5718 Lazy(195 знак., 09.02.2016 18:29,
- С этим согласен. Иначе красивые "100500 MAC за 1 такт" будут бамбук курить, пока в них данные не засунут | высунут. - Evgeny_CD(09.02.2016 17:35)
- Да, TMS320C6671 - 79.00 | 1ku - это уже теплее, но все равно несколько тоскливо. - Evgeny_CD(09.02.2016 17:45)
- так и одно ядро - тоже будет жечь. в DSP хорошо продуман вопрос как кормить ядра данными, чтобы процесс числодробления не прерывался ни на наносекунду. - Mahagam(09.02.2016 17:26)
- Камень крутой, но срок разработки под него и цена... 160.00 | 1ku самый дешевый коммерческий, 200.00 | 1ku - самый дешевый индустриальный. У меня готовое изделие в опте стоит всего в 2.5 раза больше :) - Evgeny_CD(09.02.2016 17:22)
- только таких модулей в ядре 2, это раз. ядер - 8, это два. кроме этого, у каждого ядра кроме двух .M модулей, есть два .D модуля для параллельного load-store, есть ещё 4 модуля для параллельных простых вычислений (сложение, вычитание, ветвления). Mahagam(81 знак., 09.02.2016 17:15)
- Не умничай.Нам авр подавай шоб аврбасик работал и непременно в дип корпусе шоп паять.А то иш удумал чего. - PlainUser(10.02.2016 09:27)
- на моем опыте с imx6 - проивзодительность уприрается в подсистему памяти L(107 знак., 09.02.2016 01:43,
)
- вот у меня примерно так же получалось (под 200 мегафлоп на реальной задаче с ассемблерной оптимизацией ручками) Lazy(382 знак., 09.02.2016 01:50,
)
- вот у меня примерно так же получалось (под 200 мегафлоп на реальной задаче с ассемблерной оптимизацией ручками) Lazy(382 знак., 09.02.2016 01:50,
- Cortex-A57 ускорил бы еще в 2 раза, но они пока только в топовых сотика есть. - Evgeny_CD(09.02.2016 01:03)
- А ядро Cortex-A57 по тактовой эффективности в DP, наконец, сравняется с Sandy Bridge. И когдаЮ наконец, Cortex-A57 станет массовым, Intel сделает AVX-512 (8 DP операций за такт, если не ошибаюсь) во всех декстопах планеты :) - Evgeny_CD(09.02.2016 01:02)
- "Intel сделает AVX-512" и потребеление энергии, как в сотовом 😁 - max(09.02.2016 07:53)
- Очень показательная бумага. Cortex-A7 2 ядра, Cortex-A9 4 ядра, Cortex-A15 4 ядра на одинаковой тактовой. Очень хорошо все видно - кто чего стоит. Evgeny_CD(24.02.2016 13:42)