Для сравнения с моделями, размер которых известен — вот документация Cerebras. 1000 токенов в секунду они выдают у GLM-4.7, общий размер которой 355 миллиардов параметров, 32 из которых активны. Для Codex Spark могли выбрать другой трейдофф скорости/цены, и общее количество параметров слабо влияет на скорость, но всё же упирается в ограничения платформы — триллионых моделей на Cerebras мы пока не видели. +- это позволяет прикинуть размер модели. 👀 так что ждём чипы следующего поколения, которые затачивают под форм-фактор GPT-6 🥳
Для сравнения с моделями, размер которых известен — вот документация Cerebras.…
Из этого канала
- #3378"Ребята из Nebius наконец-то обновили RE-Bench и добавили кучу новых моделей +…
"Ребята из Nebius наконец-то обновили RE-Bench и добавили кучу новых моделей + свежие задачи за январь.
- #3381⚡️FAA одобрили возврат второй ступени Starship в место старта (В документах это…
⚡️FAA одобрили возврат второй ступени Starship в место старта (В документах это называется RTLS - Return To Launch Site) Теперь SpaceX имеет право делать это…
- #3382https://www.youtube.com/watch?v=n1E9IZfvGMA 00:00:00 - What exactly are we…
https://www.youtube.com/watch?v=n1E9IZfvGMA 00:00:00 - What exactly are we scaling? 00:12:36 - Is diffusion cope? 00:29:42 - Is continual learning necessary?…
- #3375https://openai.com/index/introducing-gpt-5-3-codex-spark/ GPT-5.3 в чипы…
https://openai.com/index/introducing-gpt-5-3-codex-spark/ GPT-5.3 в чипы Cerebras не влезла, поэтому вместо неё маленькая версия GPT‑5.3-Codex-Spark.
- #3374Расчехляйте подписки на $200 — сегодня Codex начёт генерировать со скоростью…
Расчехляйте подписки на $200 — сегодня Codex начёт генерировать со скоростью 300-500 токенов в секунду 🚀🚀🚀