продвигается какое-то недопонимание. 1. сниженная разрядность используется прежде всего в инференсе, где вычислительная ошибка некритична, поскольку обученная сетка все-равно сойдётся.
2. лёрнятся сейчас, преимущественно, в BF16. все хотели бы точнее, но "локоток не укусишь". даже интель в AMX её заложил.