GPT-5, мнение (2/2) Знания модели SimpleBench немного удивил - модель всё-таки хороша в соображалке на повседневных задачах, хотя я и обнаружил пробелы в знаниях по некоторым доменам. Возможно, модель не настолько широка по знаниям в целом, насколько глубока по некоторым областям, на которых её больше тренировали. Ну то есть её не получится применять везде, где захочется, и эти области неглубоких знаний заранее неизвестны, их придётся нащупывать. __Кажется__, что та же Gemini обладает бОльшим объёмом встроенных знаний, и за счёт этого ощущается как универсальная модель, а вот с GPT-5 такого ощущения не возникает. Проблемы экосистемы Чего остро не хватает? Развитого тулинга. Если рассмотреть Claude Code как пример - он отлично работает с моделями Anthropic, хорошо их промптит, учитывает их специфику, пользуется сильными сторонами (tool use) и применяет уловки для работы со слабыми (контекст). В случае с GPT-5 тулинг пока что посредственный - Codex CLI, который по идее должен быть эталоном работы с новой моделью, работает с ней хуже, чем Cursor. А в сравнении с СС Codex CLI и вовсе будто из каменного века как по функционалу, так и по и удобству работы. Так вот, можно надеяться на то, что если вокруг модели выстроить нормальный тулинг, который будет с ней правильно работать - возможно, она раскроется и в агентских сценариях, но на это потребуется время. Если же её пытаться использовать сейчас так, как мы обычно используем Claude Code - результаты будут разочаровывающими. Цены При использовании по API модель стоит сравнимо с Gemini 2.5 Pro, намного дешевле Sonnet и уж тем более Opus. Но использование по подписке, конечно, куда более приятно, и тут теперь есть возможность использовать Codex CLI по подписке OpenAI. Для Plus-пользователей обещают лимиты в виде нескольких 1-2-часовых сессий в неделю. Не хватает промежуточного тира между $20 и $200 :) Кстати, в Cursor она до четверга должна быть бесплатной, и там нужно использовать вариант gpt-5-high или gpt-5-high-fast (fast тут приоритетный процессинг за 2x цены, но, несмотря на бесплатность, и в лимиты можно упереться быстрее). Итог Это действительно хорошая модель для своих задач, и я согласен терпеть её неспешность в случаях, где нужно что-то этакое раскопать, но в итоге получить результат. Будем надеяться, что тулинг подтянут, ну а пока порадуемся тому, что у нас есть новый мощный, и при этом дешёвый, ризонер :) — Прошлые посты по связанным темам: ● Бенчмарки GPT-5 в сравнении с Gemini 2.5 Pro, Claude Opus/Sonnet и o3. ● Обзор o3 на момент выхода: плюсы, минусы. #ai #model #review
GPT-5, мнение (2/2) Знания модели SimpleBench немного удивил - модель всё-таки…
Из этого канала
- #232"Claude Code + Stream Deck = Claude Deck Рубрика ненормальное программирование…
"Claude Code + Stream Deck = Claude Deck Рубрика ненормальное программирование 🤪 Одна из приятных особенностей Claude Code - это его кастомизируемость.
- #235"Про строку состояния в Claude Code. У CC есть команда /statusline, которая…
"Про строку состояния в Claude Code. У CC есть команда `/statusline`, которая позволяет в вайб-режиме установить строку состояния.
- #237"Qoder = Cursor + Kiro + Augment (1/2) Тут вышла новая VSCode-based AI IDE от…
"Qoder = Cursor + Kiro + Augment (1/2) Тут вышла новая VSCode-based AI IDE от китайской Alibaba (от неё же недавно были модели Qwen3-Coder и консольный агент…
- #230GPT-5, мнение (1/2) It's a good model, sir (с) tl;dr: отличная модель для…
GPT-5, мнение (1/2) It's a good model, sir (с) tl;dr: отличная модель для архитектурных обсуждений, сложного кода и парного программирования, но для агентской…
- #229"GPT-5, бенчмарки Отобрал те, которые считаю важными для разработки (тут везде…
"GPT-5, бенчмарки Отобрал те, которые считаю важными для разработки (тут везде скорее всего gpt-5-thinking high).