Bonfire-CPU - очень эффективная реализация RISC-V FPGA. VHDL, между прочим
Port luajit to RISC-V. Luajit весьма быстра. Здесь оно недоделано, но многое сделано.
FPGA - Xilinx - если быстро результат, GOWIN, Efinix - если цена (будет немного медленее, но может и не сильно, если пооптимизировать)
Синхронная SRAM, LDSDRAM - много писал об этом. 8-16 МБайт стоит несмертельно дорого, зато контроллер памяти упрощается просто на порядок. Кеши внутри могут быть очень маленькие. При наличии Hamming (64, 72) вероятность сбоя в одном порядке с вероятностью отказа чипа SRAM.
По скорости. Реалистичная скорость для рассматриваемого софткора - 100МГц. Вроде бы не быстро, но!
Если приделать хотя бы ускоритель GC LUA, и TLSF к нашему кастомному RISC-V (а у него там способы расширения системы команд стандартизованы!), и с учетом JIT (если его довести до ума) это будет весьма солидная скорость.
Да, кому не хватит скорости - в такой FPGA обычно срань умножителей, можно сделать блок аппаратной фильтрации или FFT - против него почти любое процессорное ядро нервно курит.