"Снижение цен на ChatGPT o3 Собственно o3-pro стоило выпустить хотя бы ради того, чтобы снизить цены на o3 :) Стоит o3 теперь сравнимо с Gemini 2.5 Pro, дешевле GPT-4o и одинаково с GPT-4.1: $2 input / $8 output за 1м токенов (для использования по API требуется верификация) И в Cursor вызов к ней теперь тарифицируется как 1 запрос ($0.04). Что это меняет? Для меня не так много: код с её помощью писать - то ещё развлечение (см. ниже), а для чистого ризонинга она сравнима с Gemini 2.5 Pro, работать с которой мне __приятнее__. Но то, что у нас теперь есть ещё один дешёвый и при этом мощный ризонер - это прекрасно, т.к. задачи они решают по-разному, и, если один не справился, можно дать шанс другому :) Особенности Краткий обновленный пересказ из прошлого обзора: 🟢 Мощный ризонинг - главное преимущество, но теперь уже не такое явное на фоне Gemini 🟢 Использование инструментов - прошлые модели о-серии использовали инструменты либо нехотя, либо вообще отказывались их задействовать. По факту, лучший Tool Use сейчас всё равно у Claude 4 🟡 (Само)уверенность и неуступчивость - o3 реже вам поддакивает и соглашается, если вы ей возражаете, и может аргументированно отстаивать свою позицию. Это ценно для брейншторминга и поиска объективных решений там, где разные мнения имеют право на существование, но запросто может и создавать проблемы. 🔴 Малая длина фактического вывода ● модель скупа на количество выдаваемого кода, пытается его ужать там, где это лишено смысла; ● не дает пояснений к тому, что делает и комментариев к нетривиальному коду. 🔴 Галлюцинации - есть много жалоб на галлюцинации, особенно на нишевых темах, и этому есть даже подтверждения в system card модели от самих OpenAI. 🔴 ""Враньё"" - а эта проблема посерьёзнее - сообщения пользователей (и отчёт TransluceAI) о том, что модель может фабриковать информацию о своих действиях (например, имитировать поиск или вызов других тулов) и настаивать на своем, даже будучи неправой. Вердикт для разработчиков ● Модель хороша для решения узких сложных задач, фиксов нетривиальных багов, но её не так эффективно использовать где-то ещё из-за вышеперечисленных минусов. ● Передача контекста заранее является особенно важным - описывайте задачу подробнее и со всеми ограничениями, накладываемыми на потенциальное решение. ● Для ответственных задач, которые выходят за рамки вашей собственной интуиции/понимания, и которые нельзя легко проверить, использовать её нужно с осторожностью, и обязательно делать кросс-чек с той же Gemini 2.5 Pro / специалистами в теме. #ai #model #review"
"Снижение цен на ChatGPT o3 Собственно o3-pro стоило выпустить хотя бы ради…
Из этого канала
- #217Микроменеджмент 2.0 — От пояснительной бригады: В работу некоторых агентов…
Микроменеджмент 2.0 — От пояснительной бригады: В работу некоторых агентов можно вмешиваться на ходу, но по большей части контроля над агентом нет до тех пор,…
- #218"Cursor Ultra и новый бесконечный (нет) Pro Cursor отжигает в последнее время,…
"Cursor Ultra и новый бесконечный (нет) Pro Cursor отжигает в последнее время, конечно :) Сообщество снова немного порвалось.
- #219"$100-200/мес С полгода назад я писал, что у компаний-""врапперов моделей"",…
"$100-200/мес С полгода назад я писал, что у компаний-""врапперов моделей"", навроде Cursor, есть свои способы экономить: ...
- #215"ChatGPT o3-pro Вчера OpenAI выпустила улучшенный вариант своего флагманского…
"ChatGPT o3-pro Вчера OpenAI выпустила улучшенный вариант своего флагманского ризонера - o3-pro, который они сами описывают как ""o3 с бóльшим компьютом для…
- #213Фоновые агенты (3/3) Что это меняет? ● Повышение уровня абстракции: для…
Фоновые агенты (3/3) Что это меняет? ● Повышение уровня абстракции: для разработчиков становится проще переход к задачам более высокого уровня вместо написания…