Для сравнения с моделями, размер которых известен — вот документация Cerebras. 1000 токенов в секунду они выдают у GLM-4.7, общий размер которой 355 миллиардов параметров, 32 из которых активны. Для Codex Spark могли выбрать другой трейдофф скорости/цены, и общее количество параметров слабо влияет на скорость, но всё же упирается в ограничения платформы — триллионых моделей на Cerebras мы пока не видели. +- это позволяет прикинуть размер модели. 👀 так что ждём чипы следующего поколения, которые затачивают под форм-фактор GPT-6 🥳