В смысле не выбрасывает лишние функции? ЕМНИП, у gcc похожая история, нужен ключик "каждую функцию в свою секцию", а это немного раздувает код. Хотите вот прямо совсем оптимизацию - в яре включайте "multi-file compilation". У gcc аналогичная функция зовётся LTO.