-
- Фигово у него все с DP. стр 83 - Double-Precision Floating-Point Computation Data Hazards (звучит!) Manual на ядро SHARС+ вложен. Там по 7 циклов на DP сложение и умножение (MAC вообще не нашел). + задержки конвейера, если есть зависимость от Evgeny_CDАрхитектор(48 знак., 01.08.2016 17:05)
- Смотрите страницу 3-25 документа, если верить то вот интересующая операция (правда не совсем MAC, точнее совсем не МАС), но зато сразу и умножение и сложение...и всего за 7 циклов обе что ли ?! sav6622(124 знак., 01.08.2016 17:22 - 17:26)
- Multiply and Add in parallel? Выглядит заманчиво, но надо смотреть, что там с зависимостями по данным. No. of Stalls - вот это меня пугает... - Evgeny_CDАрхитектор(01.08.2016 17:26)
- Multiply and Add in parallel и DSP - это разве не синонимы? - Kpoк(01.08.2016 19:50)
- =)) это не МАС...это над разными ОПЕРАНДАМИ операции... - sav6622(01.08.2016 21:48)
- Multiply and Add in parallel и DSP - это разве не синонимы? - Kpoк(01.08.2016 19:50)
- Multiply and Add in parallel? Выглядит заманчиво, но надо смотреть, что там с зависимостями по данным. No. of Stalls - вот это меня пугает... - Evgeny_CDАрхитектор(01.08.2016 17:26)
- Хм... конвеер они переделали с 5 до 11... спасибо за документ, надо будет "покурить" его... а то аналсайт выбешивает =(( - sav6622(01.08.2016 17:14)
- Я только гуглем нашел... Когда разделе сайта с описанием камня нет ссылки на описание ядра, так и хочется завопить в стиле Красного Циника ЛОГИКА!!! - Evgeny_CDАрхитектор(01.08.2016 17:19)
- Смотрите страницу 3-25 документа, если верить то вот интересующая операция (правда не совсем MAC, точнее совсем не МАС), но зато сразу и умножение и сложение...и всего за 7 циклов обе что ли ?! sav6622(124 знак., 01.08.2016 17:22 - 17:26)
- А вот акселераторы шарков для дабла не годятся... только заточка только под флоат... так что только на самих Шарках дабл считать.. - sav6622(01.08.2016 16:18)
- Боюсь, что с DP там будет вообше плохо. - Evgeny_CDАрхитектор(01.08.2016 16:26)
- Ниже же дал документ... - sav6622(01.08.2016 16:30)
- Боюсь, что с DP там будет вообше плохо. - Evgeny_CDАрхитектор(01.08.2016 16:26)
- может это поможет, правда для целочисленной это, но у Шарка не отличалось целочиесленная от плавучки, поэтому можно думаю использовать для прикидки... - sav6622(01.08.2016 16:14, ссылка)
- Сейчас не знаю, но под зарегестрированный проект на 363 шарках при обьеме потребления порядка пары тысяч штук в год, цены тута были чуть ли не ниже чем указаны для ориентира в аналогодевайсовых табличках на сайте... - sav6622(01.08.2016 16:05)
- Фигово у него все с DP. стр 83 - Double-Precision Floating-Point Computation Data Hazards (звучит!) Manual на ядро SHARС+ вложен. Там по 7 циклов на DP сложение и умножение (MAC вообще не нашел). + задержки конвейера, если есть зависимость от Evgeny_CDАрхитектор(48 знак., 01.08.2016 17:05)