Потому, что использование FPU требует кучу тактов для подготовки,
загрузки и выгрузки данных. А программное вычисление с высокой
оптимизацией, выполняется прямо в регистрах и не требует накладных
расходов. Видимо так. Не проверял лично, но когда рассматривал
выгоду от использования аппаратного вычислителя, эти моменты
разочаровывали. Но имейте ввиду, что fast math может приводить к падению точности вычислений.