"Grok 3 (пока что) бесплатен xAI открыли доступ всем желающим, ""пока сервера не расплавятся"". А ещё наконец-то опубликовали блогпост с более детальными бенчами - стало понятно, что голубые полосы обозначают консенсус 64 прогонов одной и той же задачи. Реально доступный Grok 3 Beta Thinking отстаёт от o3-mini-high по бенчам, но она, в свою очередь, отстаёт от, пока не релизнутой, Grok 3 Mini Beta Thinking. Но тренировка Grok 3 Thinking ещё не завершена и, в итоге, он должен тягаться с полноценной o3 по качеству. Тем не менее, нам нужны методы бенчмаркать test time compute получше. Ещё из блогпоста мы узнали что у Grok 3 длина контекста - миллион токенов. Но в задеплоенном Grok 3, длина контекста всего 128к, по словам сотрудников xAI. Блогпост grok.com @ai_newz"
"Grok 3 (пока что) бесплатен xAI открыли доступ всем желающим, ""пока сервера…
Из этого канала
- #3690Neo Gamma от 1X Новый прототип куда шустрее августовской Beta. Интересно, когда…
Neo Gamma от 1X Новый прототип куда шустрее августовской Beta. Интересно, когда они уйдут в продажу? @ainewz
- #3691Нейродайджест за неделю (#57) LLM - Grok 3 — новая топовая LLM от Маска идет в…
Нейродайджест за неделю (#57) LLM - Grok 3 — новая топовая LLM от Маска идет в релиз малыми шажками.
- #3692У DeepSeek началась неделя опенсорса Первый релиз — FlashMLA, Flash Attention…
У DeepSeek началась неделя опенсорса Первый релиз — FlashMLA, Flash Attention для моделей DeepSeek.
- #3687Helix - локальный AI на роботе Из-за этой модели Figure разорвала сделку с…
Helix - локальный AI на роботе Из-за этой модели Figure разорвала сделку с OpenAI, заявив что им удалось совершить прорыв.
- #3686Ultra-Scale Playbook - книга по распределённой тренировке от Huggingface…
Ultra-Scale Playbook - книга по распределённой тренировке от Huggingface Хороший общий обзор того, как эффективно использовать сотни GPU для обучения самых…