Как ни странно из "зеро-вайт" флеша идет выборка сразу 128 бит (или
более) и конвейер команд не тормозит. Из "не зеро-вайт" флеш идет
выборка по узкой шине и ядро простаивает в ожидании выборки. При работе из ОЗУ тоже могут быть "странности", так как шина тоже узкая.
Давно экспериментировал по скорости обработки данных фильтром.
Лучший результат при расположении данных в ОЗУ, а коэффициентов фильтров во флеш.
При работе чисто из ОЗУ, нужно обрабатываемые данные + коэффициенты фильтра + собственно код команды взять по одной шине.