Бабочка была на ASM-FPU, все операции в стеке, компилятор ASM код вроде не оптимизирует.
Измерения показали, что 21 комманда ASM-FPU выполнялась за 18 тактов.
У Интела и АМД уже давно плавающее умножение однотактовое а деление
четырехтактовое. Деления у меня не было.