По ссылке некая выжимка про выравнивание. Там 8 байт необходимо для
LDRD, STRD только у "ARMv5 and earlier". Но я ещё сталкивался с
тем, что компилятор использовал знание о том, что младшие три бита
адреса нули, в адресной арифметике. Соответственно, если это
нарушалось, код ломался.