Угу. Но это еще не все. Второй вопрос: каков "теоретический" объем размеченных данных необходим для тренировки нейросети такого размера? Замечу, 100 триллионов коэффициентов, сами по себе, просто бесполезная куча случайных чисел(наиболее распространенный метод начальной инициализации, серьёзно), им еще только предстоит стать коеффициентами, в ходе обучения.
Кол-во итераций, хотябы внутри одной эпохи (гуглить)... я даже не берусь угадать сколько десятичных разрядов в этом числе.
Без улыбки.