Хоть пересекающихся бенчмарков не так много, ответ, видимо, такой, что Mythos лучше (но к нему у нас и доступа нет 😀). По ценам на модели можно сделать умеренное предположение, что 5.5 всё ещё сильно меньше Mythos — может быть +- класса Opus.
Хоть пересекающихся бенчмарков не так много, ответ, видимо, такой, что Mythos…
Из этого канала
- #3569Когда вышел Opus 4.6 (а потом и 4.7 (а потом и Mythos)), то Andon Labs…
Когда вышел Opus 4.6 (а потом и 4.7 (а потом и Mythos)), то Andon Labs прогоняли модели на Vending Bench — это где LLM в симуляции управляет бизнесом в виде…
- #3570Вышли превью DeepSeek v4: 🔹 DeepSeek-V4-Pro: 1.6T total / 49B active params. 🔹…
Вышли превью DeepSeek v4: 🔹 DeepSeek-V4-Pro: 1.6T total / 49B active params. 🔹 DeepSeek-V4-Flash: 284B total / 13B active params.
- #3573🍿 самая интересная часть
🍿 самая интересная часть
- #3567— модель станет доступна сегодня всем, кроме бесплатников. API будет позже (мне…
— модель станет доступна сегодня всем, кроме бесплатников. API будет позже (мне в Codex уже прилетело) — цена сильно выросла: $5/ $30 за 1 миллион токенов на…
- #3565https://openai.com/index/introducing-gpt-5-5/
https://openai.com/index/introducing-gpt-5-5/