"OpenAI API для сжатия длинных разговоров Если общаться долго с чатботом, то разговор раздуется и, рано или поздно, перестанет вылазить в контекст. Особенно это актуально в системах с агентными архитектурами. Там контекст раздувает не только от общения LLM с человеком, но и взаимодействия с инструментами и MCP серверами. Чтобы справиться с этим, историю переписки с ботом могут сжимать например, отдельным промптом: __ChatGPT, сделай мне выжимку из этого разговора. __Но этот процесс каждый реализует сам и мало кто тестирует. А в OpenAI Platform (Responses API) есть штатный метод /responses/compact, который реализован и протестирован. При его вызове OpenAI упаковывает контекст модели (model's latent understanding) в зашифрованный снапшот, который занимает меньше места. Его теперь можно отправлять как `input` в дальнейшие обсуждения: ``` { ""id"": ""cmp_001"", ""type"": ""compaction"", ""encrypted_content"": ""gAAAAABpM0Yj-...="" } ``` Именно он используется, скажем, под капотом у цикла агента во всех реализациях Codex (см рассказ OpenAI Codex). Насколько я помню, пока ни одна из архитектур агентов в ERC3 не использовала этот штатный режим compaction для контекста. Возможно, если его натянуть на SGR Next Step Agent, то получится выжать больше качества и скорости из демо-архитектуры. Кто-нибудь уже использовал `/responses/compact`? Как оно вам? Ваш, @llm_under_hood 🤗"
"OpenAI API для сжатия длинных разговоров Если общаться долго с чатботом, то…
Из этого канала
- #736FYI, я переписываю логику бота защиты от спама прямо сейчас. Прошлую версию…
FYI, я переписываю логику бота защиты от спама прямо сейчас. Прошлую версию написал давным давно Claude, когда канал был поменьше, а процесс добавления сильно…
- #737"Cloud Code Swarm - это экспериментальный режим, который построен на…
"Cloud Code Swarm - это экспериментальный режим, который построен на асинхронных event-driven субагентах, работающих одновременно над одной и той же задачей.
- #738Я попробовал ClawdBot, который нынче бурно обсуждают Установка заняла минут…
Я попробовал ClawdBot, который нынче бурно обсуждают Установка заняла минут пять (см сайт).
- #734"Кто там хотел локальной Claude Code ? ollama с версии 0.14 поддерживает…
"Кто там хотел локальной Claude Code ? ollama с версии 0.14 поддерживает Anthropic Messages API, что позволяет использовать Claude Code с локальными моделями…
- #733Список моих ChatGPT запросов в этом месяце, которые с лихвой окупили подписку…
Список моих ChatGPT запросов в этом месяце, которые с лихвой окупили подписку (обычно это не один запрос, а несколько, которые запускаются последовательно) (0)…