-
- Мне тыща лет, я вылез из тьмы -> Тут уже второй день идет мегащоу "Evgeny_CD против фанатов целочисленной арифметики" Конкретно в этой задаче далась, и точка. Только аппаратная поддержка даблов, все что хуже ARM926 250 МГц с VFP3 точно не успевает. - Evgeny_CD(27.07.2016 21:26, ссылка)
- "0" информации. Операций с матрицами - много и разных. Диапазон значений - неизвестен. Выходная точность - неизвестна. Итд. Мегатроллизм вместо "мегащоу" - argus98(27.07.2016 21:46)
- Угу. А еще я забыл сюда исходники выложить. Для полноты, так сказать. - Evgeny_CD(27.07.2016 21:57)
- Исходники точно не нужны. Похоже Вы просто с матрицами не дружите. И с математикой тоже - argus98(27.07.2016 22:06)
- Угу. А еще я забыл сюда исходники выложить. Для полноты, так сказать. - Evgeny_CD(27.07.2016 21:57)
- А какой процессор на сегодняшний день считает в даблах быстрее всех? (чур производительность разных ядер не складывать!) - Ксения(27.07.2016 21:33)
- Уже обсасывали. -> Из того, что реально купить. NXP QorIQ LS1012A - два 53 ядра по 800 Мгц каждое. TI AM5K2E0x - до четырез 15х ядер по 1.4 ГГц каждое, но там еще немереные сетевые навороты, поэтому дорого. Evgeny_CD(27.07.2016 22:02, ссылка)
- А почему бы вам не взять обычный Core-i3 в мобильном исполнении и миниатюрную плату к нему? Мне кажется, что i3x2400MHz обгонит NXPx800MHz. Или это не так? - Ксения(27.07.2016 22:20)
- Не просто обгонит, он его порвет на тысячу мелких кусочков. Проблема? Кратко: яр ничего не знает про i3x2400MHz. Это будет дизайн совсем другого класса. Evgeny_CD(237 знак., 27.07.2016 22:41, ссылка, ссылка)
- А яр тут причем? Для x86 очень много разных компиляторов. - Ксения(27.07.2016 22:50)
- Это как пример. Это выработка новых навыков у разработчиков. Новый инструментарий - в общем, это другая жизнь. Пока не стали туда ходить. - Evgeny_CD(27.07.2016 22:53)
- фигня это. к новым средам привыкаешь быстро. это не язык менять. - Mahagam(27.07.2016 23:06)
- Это не фигня. Это настоящий менеджмент. Evgeny_CD(2013 знак., 27.07.2016 23:58)
- а чего не DSP от TI ? - Mahagam(28.07.2016 00:34)
- Если инструментарий x86 Евгения испугал, то DSP от TI и подавно. Опять же TI слишком уж секретничает в отношении своих DSP, особливо серии C66x. - Ксения(28.07.2016 00:43)
- ничего он не секретничает. все даташиты на месте. берите OMAP-L138, или версию без арма - C6747. кстати, под это ядро любители уже портировали фриртос, что значит что можно по образу и подобию портировать любую переключалку задач. а быстродействия Mahagam(21 знак., 28.07.2016 09:09)
- Конечно, рассматривали. Тот же C6747. Кратко - не наш выбор. На первой же странице дата шыта – 2 DP x DP -> DP Every Four Clocks. Т.е. операция с DP - 4 такта. Юнитов 2 штуки, поэтому, если компилер удачно разложит по регистрам и по блокам, то 1 Evgeny_CD(712 знак., 29.07.2016 01:02)
- Получается, как у LPC3250 не получается. у C6747 в параллель с умножителями работают ещё и load-store юниты, и сумматоры. код LPC3250 не будет состоять из одних умножений - там ещё данные надо подтаскивать и выгружать. и делать не Mahagam(162 знак., 29.07.2016 01:19)
- Я согласен, что не только умножения. Но и Cortex-A9 - крепкий орешек. Он суперскалярный, до 2х операций за такт. Так что с подтаскиванием данных он тоже довольно неплохо может справляться. В DSP еще пугает вот что - масштабируемость дизайна. Evgeny_CD(420 знак., 29.07.2016 01:48)
- надо отмасштабироваться? покурили маны, повтыкали в код #pragma побольше, и вуаля, подняли производительность в два раза без заноса денег поставщику )))) Mahagam(279 знак., 29.07.2016 22:56)
- Главное - не перевтыкать :) И дозировку грибочков соблюдать. По сути согласен. - Evgeny_CD(29.07.2016 23:04)
- надо отмасштабироваться? покурили маны, повтыкали в код #pragma побольше, и вуаля, подняли производительность в два раза без заноса денег поставщику )))) Mahagam(279 знак., 29.07.2016 22:56)
- Я согласен, что не только умножения. Но и Cortex-A9 - крепкий орешек. Он суперскалярный, до 2х операций за такт. Так что с подтаскиванием данных он тоже довольно неплохо может справляться. В DSP еще пугает вот что - масштабируемость дизайна. Evgeny_CD(420 знак., 29.07.2016 01:48)
- Получается, как у LPC3250 не получается. у C6747 в параллель с умножителями работают ещё и load-store юниты, и сумматоры. код LPC3250 не будет состоять из одних умножений - там ещё данные надо подтаскивать и выгружать. и делать не Mahagam(162 знак., 29.07.2016 01:19)
- Конечно, рассматривали. Тот же C6747. Кратко - не наш выбор. На первой же странице дата шыта – 2 DP x DP -> DP Every Four Clocks. Т.е. операция с DP - 4 такта. Юнитов 2 штуки, поэтому, если компилер удачно разложит по регистрам и по блокам, то 1 Evgeny_CD(712 знак., 29.07.2016 01:02)
- ничего он не секретничает. все даташиты на месте. берите OMAP-L138, или версию без арма - C6747. кстати, под это ядро любители уже портировали фриртос, что значит что можно по образу и подобию портировать любую переключалку задач. а быстродействия Mahagam(21 знак., 28.07.2016 09:09)
- Если инструментарий x86 Евгения испугал, то DSP от TI и подавно. Опять же TI слишком уж секретничает в отношении своих DSP, особливо серии C66x. - Ксения(28.07.2016 00:43)
- а чего не DSP от TI ? - Mahagam(28.07.2016 00:34)
- Это не фигня. Это настоящий менеджмент. Evgeny_CD(2013 знак., 27.07.2016 23:58)
- фигня это. к новым средам привыкаешь быстро. это не язык менять. - Mahagam(27.07.2016 23:06)
- Это как пример. Это выработка новых навыков у разработчиков. Новый инструментарий - в общем, это другая жизнь. Пока не стали туда ходить. - Evgeny_CD(27.07.2016 22:53)
- А яр тут причем? Для x86 очень много разных компиляторов. - Ксения(27.07.2016 22:50)
- Не просто обгонит, он его порвет на тысячу мелких кусочков. Проблема? Кратко: яр ничего не знает про i3x2400MHz. Это будет дизайн совсем другого класса. Evgeny_CD(237 знак., 27.07.2016 22:41, ссылка, ссылка)
- А почему бы вам не взять обычный Core-i3 в мобильном исполнении и миниатюрную плату к нему? Мне кажется, что i3x2400MHz обгонит NXPx800MHz. Или это не так? - Ксения(27.07.2016 22:20)
- Уже обсасывали. -> Из того, что реально купить. NXP QorIQ LS1012A - два 53 ядра по 800 Мгц каждое. TI AM5K2E0x - до четырез 15х ядер по 1.4 ГГц каждое, но там еще немереные сетевые навороты, поэтому дорого. Evgeny_CD(27.07.2016 22:02, ссылка)
- "0" информации. Операций с матрицами - много и разных. Диапазон значений - неизвестен. Выходная точность - неизвестна. Итд. Мегатроллизм вместо "мегащоу" - argus98(27.07.2016 21:46)
- Я больше скажу: достаточно тренированный школьник проделает всё то же самое, имея лишь лист бумаги и карандаш. Фтопку эти бесовские процессоры! - SciFi(27.07.2016 21:25)
- Бля.. еще один... - Evgeny_CD(27.07.2016 21:27)
- Мне тыща лет, я вылез из тьмы -> Тут уже второй день идет мегащоу "Evgeny_CD против фанатов целочисленной арифметики" Конкретно в этой задаче далась, и точка. Только аппаратная поддержка даблов, все что хуже ARM926 250 МГц с VFP3 точно не успевает. - Evgeny_CD(27.07.2016 21:26, ссылка)