Хорошо поработал, если только в 2 раза тормознее... А теперь, если не устраивает результат, все на асме ручками ;) Точного соответствия, конечно, нет, но DSP либы STM32 (Thumb-2) выполняют 1024-точечное FFT за ~2мс на частоте 48МГц. Правда, с 16-разрядными данными. Т.е. 2048-точечное FFT они обсчитали бы (если бы такие либы были) за ~4мс.
http://www.st.com/ …iterature/um/14988.pdf