в двух словах microAptive vs CM4 совмещение в коде 32бит и 16бит команд vs Thumb2 only
Кэш/MMU vs none
до 32 наборов из 32-х РОН vs 1 x 16
10 циклов interrupt latency vs 12
трассировка кода vs none
независимый конвейер DSP/MDU
аккумулятор 64бит (четыре) для MAC/DSP vs 0
команды сдвига, сравнения, CLZ, CL0 vs none
в 2 раза больше DSP, SIMD, MAC команд
итого DSP алгоритмы в 2 раза быстрее против Cortex-M4
на плавучке M4K (PIC32) в разы быстрее Cortex M3 (независимые данные можно взять из этого источника:
http://www.smxrtos.com) в некоторых случаях в 10-12 раз быстрее (правда есть 3 алгоритма, где медленнее, зато на оставшихся 30 - быстрее в разы)