>отображение одного и того куска физической памяти по разным адресам Это умеет делать каждый первый MMU в любом Application-class микропроцессоре.
Тут скорее дело в софтовой поддержке этого добра. Ну и железо (типа умного DMA-контроллера) тоже может сыграть роль.
А еще заточенность железки под одну задачу - если кроме сетевого обмена девайс на ядре не делает ну вообще ничего, то проще крутится в спинлоке, нежели сохранять контекст. У меня в девайсине помимо "типа реалтаймового DSP" надо еще и морду рисовать, поэтому и пришлось спускаться на PREEMPT_RT