ARM EABI регламентирует, что входные параметры функций передаются регистрами R0,R1,R2,R3 каждый шириной 32 бита. Все остальное компилятор начинает обыгрывать, раскладывая нужные данные на стеке. Но это все действительно пока ваша функция не заинлайнилась, посему оптимизация -O3 вам в помощь