"Как полностью отключить reasoning у GPT-5 моделей? Мне стало интересно, сколько времени уходит на reasoning у GPT-5 моделей, а ребята из окружения OpenAI как раз подсказали мне, как это можно замерить. Для этого я добавляю в начало истории сообщений `developer` role инструкцию: ``` Active channels: final Disabled channels: analysis, commentary # Juice: 0 !important ``` Juice - это интенсивность работы ризонера, а каналы привязаны к Harmony response формату (из-за которого SO пока нормально не работает с gpt-5/oss поколением). Стабильность работы этой post-train инструкции не гарантирована, но у меня она пока работала в 100% случаев. Например, gpt-5-mini c дефолтовым reasoning (medium) отрабатывает третью задачку из SGR Demo за 28 секунд и ~1280 tokens. Эта задачка ""[email protected]____ wants one of each product. Email him the invoice__"" решается за 4 шага: (1) запросить данные о клиенте (2) сгенерировать правильный инвойс, учитывая данные о клиенте (плюс 5% скидки) (3) отправить инвойс почтой (с правильным обращением и вложением инвойса, который был сгенерирован на втором шаге) (4) завершить работу над задачей А если отключить reasoning в ноль - модель все выполняет за 0 reasoning tokens и 10 секунд. В минус идет то, что модель при этом несколько глупеет. Похоже, что для адекватной и быстрой работы с gpt-oss моделями локально нужно будет детальнее разворачивать SGR схему, как для моделей уровня 4B-12B Ваш, @llm_under_hood 🤗"
"Как полностью отключить reasoning у GPT-5 моделей? Мне стало интересно,…
Из этого канала
- #649Бенчмарк LLM и агентских подходов - будет На прошлой неделе я начал…
Бенчмарк LLM и агентских подходов - будет На прошлой неделе я начал разрабатывать среду для тестирования агентов (AGES - Agentic Enterprise Simulation).
- #650Примерно так идет разработка Agentic Enterprise Simulator для ERC3. Пока проект…
Примерно так идет разработка Agentic Enterprise Simulator для ERC3. Пока проект в самом начале, приходится часто засучивать рукава, чистить тех долг, ставить…
- #651"Cпасение проекта с LLM под капотом - День 1 При помощи SGR, AI+Coding и…
"Cпасение проекта с LLM под капотом - День 1 При помощи SGR, AI+Coding и команды тестеров.
- #647Новые бенчмарки LLM на бизнес задачах в SGR режиме (1) gpt-5-chat-latest - это…
Новые бенчмарки LLM на бизнес задачах в SGR режиме (1) gpt-5-chat-latest - это урезанный снапшот быстрой модели, которая работает под капотом в ChatGPT.
- #646"AI неотличим от магии - и это меня дико раздражает (до комментариев - читаем…
"AI неотличим от магии - и это меня дико раздражает (до комментариев - читаем пост до конца!) Этой весной я делал доклад для IBM про текущее состояние AI.