А вот и первые независимые бенчи o4-mini Artificial Analysis уже протестили…

17 апр. 2025 г.36 012 views169 forwardsОткрыть в Telegram →

А вот и первые независимые бенчи o4-mini Artificial Analysis уже протестили o4-mini и прямо сейчас тестят o3. Модель очень хорошо себя показывает на всех бенчах, но есть и отличия — по сравнению с данными OpenAI HLE заметно выше, а GPQA немного ниже. Но это нормально — результаты на бенчмарках всегда немного отличаются между разными прогонами, особенно когда сетап немного отличается. В целом вышла очень хорошая модель — даже лучше чем o3 на визуальных тасках, судя по заявлениям сотрудников OpenAI. А теперь представьте что сможет полноценная o4. @ai_newz

Источник

https://t.me/ai_newz/3848

Канал эйай ньюз · опубликовано 17 апр. 2025 г.

Из этого канала