В общем, это именно косяк модуля SPI. Сделал передачу на
прерываниях. И вот что (сиреневым к нулю - время нахождения в
прерывании TXE - буфер передачи пуст): 
Видно, что нештатный рывок данных MOSI, происходит раньше, чем произойдёт вход в прерывание, в котором выполняется запись следующего байта на передачу.
Крупнее:

И ещё крупнее:

По моей оценке, латентность прерывания относительно запроса (если предположить, что момент запроса совпадает с моментом перехода тактового сигнала SPI), составляет ровно 16 тактов. Это прерывание с параметром WCH-fast.