Хоть пересекающихся бенчмарков не так много, ответ, видимо, такой, что Mythos…

23 апр. 2026 г.21 503 views78 forwardsОткрыть в Telegram →

Хоть пересекающихся бенчмарков не так много, ответ, видимо, такой, что Mythos лучше (но к нему у нас и доступа нет 😀). По ценам на модели можно сделать умеренное предположение, что 5.5 всё ещё сильно меньше Mythos — может быть +- класса Opus.

Источник

https://t.me/seeallochnaya/3568

Канал Сиолошная · опубликовано 23 апр. 2026 г.

Из этого канала

#3569Когда вышел Opus 4.6 (а потом и 4.7 (а потом и Mythos)), то Andon Labs…
Когда вышел Opus 4.6 (а потом и 4.7 (а потом и Mythos)), то Andon Labs прогоняли модели на Vending Bench — это где LLM в симуляции управляет бизнесом в виде…
#3570Вышли превью DeepSeek v4: 🔹 DeepSeek-V4-Pro: 1.6T total / 49B active params. 🔹…
Вышли превью DeepSeek v4: 🔹 DeepSeek-V4-Pro: 1.6T total / 49B active params. 🔹 DeepSeek-V4-Flash: 284B total / 13B active params.
#3573🍿 самая интересная часть
🍿 самая интересная часть
#3567— модель станет доступна сегодня всем, кроме бесплатников. API будет позже (мне…
— модель станет доступна сегодня всем, кроме бесплатников. API будет позже (мне в Codex уже прилетело) — цена сильно выросла: $5/ $30 за 1 миллион токенов на…
#3565https://openai.com/index/introducing-gpt-5-5/
https://openai.com/index/introducing-gpt-5-5/