3.5 месяца назад после выхода Kimi K2 Thinking, как и после любого другого релиза, началась волна комментариев в духе «Да всё, да Китай догнал, да эти модели уже на уровне не то что OpenAI а Anthropic». Как и в случае с R1 vs o1, я считаю, что это бред. Мой твит с хот-тейком про превращение паритета на бумаге в разрыв в реальности набрал под 80 тысяч просмотров, поэтому я решил вернуться и проверить, был ли я прав. Отстают ли модели от фронтира, и если да, то почему? Об этом читайте в новом блогпосте: ikot.blog/the-illusion-of-parity
3.5 месяца назад после выхода Kimi K2 Thinking, как и после любого другого…
Из этого канала
- #3411Google выпустили Gemini 3.1 Pro (снова Preview), вот метрики. Самые интересные…
Google выпустили Gemini 3.1 Pro (снова Preview), вот метрики. Самые интересные выделил на картинке — 86% на BrowseComp это очень много, сразу видно, что…
- #3412Мы победили. Не будет дата-центра. И им придётся построить парк. — 200 тысяч…
Мы победили. Не будет дата-центра. И им придётся построить парк. — 200 тысяч лайков за чуть более чем сутки.
- #3413Экспонента штука такая. Вот решают двухчасовые задачи, вот 4-часовые, вот…
Экспонента штука такая. Вот решают двухчасовые задачи, вот 4-часовые, вот 8-часовые... 😳 в смысле 16-часовые.
- #3408https://www.anthropic.com/news/claude-sonnet-4-6 Новый Sonnet уже вышел Цены те…
https://www.anthropic.com/news/claude-sonnet-4-6 Новый Sonnet уже вышел Цены те же, $3/$15 per million tokens
- #3406Grok 4.20, обещаемый Elon Musk с августа прошлого года, появился в бете на…
Grok 4.20, обещаемый Elon Musk с августа прошлого года, появился в бете на https://grok.com/ .