Не без ложки дёгтя для OpenAI в свежем тесте Aider polyglot coding benchmark: – o3 дал 79,6% правильных ответов — выше, чем Gemini 2.5 Pro (72,9%), но стоит в 17 раз дороже — $111 против $6.32. – o4-mini набрал 72%, то есть чуть хуже Gemini 2.5 Pro, и при этом оказался в 3 раза дороже — $19.64 против $6.32. Выводы: по балансу цена/качество Gemini 2.5 Pro по-прежнему выглядит сильнее и интереснее для разработчиков, несмотря на крутость новых моделей OpenAI. При этом Google вроде как готовит новую модель заточенную на разработку - Night Whisper и думаю, вполне могут прыгнуть выше по качеству сохранив при этом доступные цены. ИИволюция
Не без ложки дёгтя для OpenAI в свежем тесте Aider polyglot coding benchmark: –…
Источник
https://t.me/ai_driven/93Канал AI-Driven Development. Родион Мостовой · опубликовано 17 апр. 2025 г.
Из этого канала
- #94А у вас какие результаты показали новые модели? Чувствуется прирост в качестве?
А у вас какие результаты показали новые модели? Чувствуется прирост в качестве?
- #95Ещё, OpenAI выпустили свой аналог aider'a под названием Codex - это автономный…
Ещё, OpenAI выпустили свой аналог aider'a под названием Codex - это автономный агент для программирования, работающий из командой строки, фишка которого в…
- #96Суть вайб-кодинга в одном меме)) Не удержался :)
Суть вайб-кодинга в одном меме)) Не удержался :)
- #92ChatGPT 4.1 Не знаю, интересно ли читать про сомнительные релизы моделей, но,…
ChatGPT 4.1 Не знаю, интересно ли читать про сомнительные релизы моделей, но, может, кому сэкономлю время.
- #88Улучшения в AI прототипировании В общем, сейчас набирает популярность такой…
Улучшения в AI прототипировании В общем, сейчас набирает популярность такой класс AI-тулинга, как Prompt Coding - причем, в отличие от вайб кодинга,…