допустим можно 600м модельку с 16к контекстом на 2х3090 поставить в претрен в ds zero 3 + cpu offload на 8гб данных fineweb2 (ну это супермало, но для примеру) будет всего 300 часов, по сути 10 дней