Для Cортех-M3 16-бит 1024точки будет примерно 2мс на 50МГц. А вообще многие производители Кортексов специально создают DSP-библиотеки, которые оптимизируют на асме.
STM32:
http://www.st.com/ …iterature/um/14988.pdf
LPC1300/LPC1700:
http://www.nxp.com …ation_note/AN10913.pdf
PS.
А вообще-то с прицелом на обработку сигналов целесообразнее, наверное, LPC использовать. Вроде бы Cortex-M4 от NXP будет совместим по выводам с LPC1700. Т.е. без переразводки плат можно будет получить увеличение на порядок производительности DSP-операций.