Радикальное решение задачи. XMEGA128A3 - 4 канала DMA 3 и SPI.
2 DMA и 1 SPI, и берешь Cortex-M0+ как спроцессор :)
ATSAMD09C13A-SSUT
http://caxapa.ru/801897.html
http://caxapa.ru/746227.htmlLPC822
Cortex-M0 кодишь именно свои вычисоительные алгоритмы.
Заодно С и Cortex-M0 освоишь.
У LPC вроде уще подограмма деления жутко оптимальная зашита в ROM