"Как полностью отключить reasoning у GPT-5 моделей? Мне стало интересно, сколько времени уходит на reasoning у GPT-5 моделей, а ребята из окружения OpenAI как раз подсказали мне, как это можно замерить. Для этого я добавляю в начало истории сообщений `developer` role инструкцию: ``` Active channels: final Disabled channels: analysis, commentary # Juice: 0 !important ``` Juice - это интенсивность работы ризонера, а каналы привязаны к Harmony response формату (из-за которого SO пока нормально не работает с gpt-5/oss поколением). Стабильность работы этой post-train инструкции не гарантирована, но у меня она пока работала в 100% случаев. Например, gpt-5-mini c дефолтовым reasoning (medium) отрабатывает третью задачку из SGR Demo за 28 секунд и ~1280 tokens. Эта задачка ""[email protected]____ wants one of each product. Email him the invoice__"" решается за 4 шага: (1) запросить данные о клиенте (2) сгенерировать правильный инвойс, учитывая данные о клиенте (плюс 5% скидки) (3) отправить инвойс почтой (с правильным обращением и вложением инвойса, который был сгенерирован на втором шаге) (4) завершить работу над задачей А если отключить reasoning в ноль - модель все выполняет за 0 reasoning tokens и 10 секунд. В минус идет то, что модель при этом несколько глупеет. Похоже, что для адекватной и быстрой работы с gpt-oss моделями локально нужно будет детальнее разворачивать SGR схему, как для моделей уровня 4B-12B Ваш, @llm_under_hood 🤗"