-
- Заметим, в некоторых случаях достаточно сильное преимущество архитектуры. - Evgeny_CD(29.01.2020 18:14)
- Не просто сильное, а очень сильное. По сути 8КБ оперативной памяти, включая регистры периферии, доступны в АЛУ напрямую. Правда математика только с WREG0, но все равно сильно увеличивает плотность кода. К тому же у 100 МИПСовых есть 5 полных my504(131 знак., 29.01.2020 22:06)
- Чота я не вьехал про "только WREG0". Какие-то радикальные обрезания произошли по сравнению с рабоче-крестьянскими ДСПИКами? - Крок(29.01.2020 22:29)
- Никаких абсолютно. Инструкции типа add <RAM> означают <RAM>=<RAM>+WREG0, а инструкция add <RAM>, WREG будет исполнена как WREG0=<RAM>+WREG0 my504(69 знак., 29.01.2020 22:55 - 22:57)
- Ну это можно стерпеть. Я уж думал их друг с другом складывать-премножать запретили. - Крок(29.01.2020 23:01)
- Я с этого начал - найти архитектуру, чтобы скорость работы с ОЗУ была как скорость работы с регистрами. RISC пролетают на уровне идеологии. Пусть даже не со всем ОЗУ, а с его частью. - Evgeny_CD(29.01.2020 23:12)
- Была какая-то К18ХХВЕYY. там было окно, которое двигалось по памяти и это был регистровый файл. Очень неплохая архитектура. Единственный косяк, как у млачших ПИКов, там не было операций с переносом. - mse homjak(30.01.2020 10:44)
- У семейства МК TMS9900 была аналогичная придумка - адрес окна регистрового файла задавался в каждом векторе прерывания. Удивительно, что это не распространилось на другие семейства, как must have - MBedder(30.01.2020 12:30)
- Вот тут -> хороший цикл статей по архитектурам, их истории и сравнению возможностей и ограничений, но много букв. - Dingo(12.02.2020 05:24 - 05:45, ссылка)
- Не увидел ничего, кроме статьи "Суперскалярный стековый процессор: скрещиваем ужа и ежа". Не там смотрел, или ты ссылку не ту дал? - MBedder(12.02.2020 12:52)
- Спасибо! - Evgeny_CD(12.02.2020 10:00)
- Вот тут -> хороший цикл статей по архитектурам, их истории и сравнению возможностей и ограничений, но много букв. - Dingo(12.02.2020 05:24 - 05:45, ссылка)
- Кажется, у восемьнадцатых уже были? - Крок(30.01.2020 10:49)
- У семейства МК TMS9900 была аналогичная придумка - адрес окна регистрового файла задавался в каждом векторе прерывания. Удивительно, что это не распространилось на другие семейства, как must have - MBedder(30.01.2020 12:30)
- Была какая-то К18ХХВЕYY. там было окно, которое двигалось по памяти и это был регистровый файл. Очень неплохая архитектура. Единственный косяк, как у млачших ПИКов, там не было операций с переносом. - mse homjak(30.01.2020 10:44)
- Я с этого начал - найти архитектуру, чтобы скорость работы с ОЗУ была как скорость работы с регистрами. RISC пролетают на уровне идеологии. Пусть даже не со всем ОЗУ, а с его частью. - Evgeny_CD(29.01.2020 23:12)
- Ну это можно стерпеть. Я уж думал их друг с другом складывать-премножать запретили. - Крок(29.01.2020 23:01)
- Никаких абсолютно. Инструкции типа add <RAM> означают <RAM>=<RAM>+WREG0, а инструкция add <RAM>, WREG будет исполнена как WREG0=<RAM>+WREG0 my504(69 знак., 29.01.2020 22:55 - 22:57)
- Да, 4 дополнительных набора РОН я оценил. Несколько килобайт регистров при экономном программизме многое позволят сделать :) - Evgeny_CD(29.01.2020 22:11)
- Да... ДСПИчье ядро, это сказка. Дебилам из Атмела во чем заниматься надо было, а не убогой ХМегой и АВР32. - mse homjak(29.01.2020 22:23)
- История пролета с AVR32 еще ждет своего историка. Но там система команд, заметим, была тоже сильно и сильно продвинутая, проблема в том, что она в другом направлении двигалась. - Evgeny_CD(29.01.2020 22:42)
- Я тут поупражнялся с DSP ядром в симуляторе ))) - написал "бабочку" для FFT: my504(1397 знак., 29.01.2020 22:33)
- Гуд. Вери гуд! :)) - MBedder(30.01.2020 00:01)
- 23 строки без return. Офигеть! - Evgeny_CD(29.01.2020 22:51)
- Это много или мало? - Крок(29.01.2020 23:12)
- Быстрее только с SIMD, а это уже другой уровень. Вот толковая преза по Cortex -> - Evgeny_CD(29.01.2020 23:27, ссылка)
- Ша! Поставим вопрос так. При какой длине выборки это "быстрое" преобразование станет работать быстрее "медленного", если здесь одна "бабочка" занимает 23 операции? - Крок(06.02.2020 00:37)
- Конкретно в dsPIC33 граница, на которой производительность FFT и DFT примерно одинаковы - 256 отсчетов. Это связано с тем, что комплексный бин для DFT выполняется строго за 2*N+1 машинных циклов, а отрицательные частоты считать нет никакой my504(265 знак., 06.02.2020 06:48 - 06:57)
- Не готов сказать. Это тонкий момент - потери на загрузку и выгрузку SIMD регистров. В отношении каждой архитектуры надо выкурить толстенные мануалы. - Evgeny_CD(06.02.2020 02:38)
- Ша! Поставим вопрос так. При какой длине выборки это "быстрое" преобразование станет работать быстрее "медленного", если здесь одна "бабочка" занимает 23 операции? - Крок(06.02.2020 00:37)
- Быстрее только с SIMD, а это уже другой уровень. Вот толковая преза по Cortex -> - Evgeny_CD(29.01.2020 23:27, ссылка)
- Это много или мало? - Крок(29.01.2020 23:12)
- Это сколько тактов? - Evgeny_CD(29.01.2020 22:39)
- Да... ДСПИчье ядро, это сказка. Дебилам из Атмела во чем заниматься надо было, а не убогой ХМегой и АВР32. - mse homjak(29.01.2020 22:23)
- Чота я не вьехал про "только WREG0". Какие-то радикальные обрезания произошли по сравнению с рабоче-крестьянскими ДСПИКами? - Крок(29.01.2020 22:29)
- Не просто сильное, а очень сильное. По сути 8КБ оперативной памяти, включая регистры периферии, доступны в АЛУ напрямую. Правда математика только с WREG0, но все равно сильно увеличивает плотность кода. К тому же у 100 МИПСовых есть 5 полных my504(131 знак., 29.01.2020 22:06)
- Спасибо! - Evgeny_CD(29.01.2020 18:05)
- Заметим, в некоторых случаях достаточно сильное преимущество архитектуры. - Evgeny_CD(29.01.2020 18:14)