да. причин было много. команда была с префиксом, считывала себя каждый раз повторно, тратила такты на внутренние вычисления, работала с одним байтом за раз. реализации со стеком вида
pop bc
pop de
pop hl
exx
pop bc
pop de
pop hl
тут грузим новый стек
push bc
push de
push hl
exx
push bc
push de
push hl
тут опять прогружаем стек
была заметно шустрее.