Также во время обучения на задачах с инструментами начали применять подход как у OpenAI, когда рассуждения не выкидываются, и видны модели при генерации следующего вызова инструмента — смотрите картинку. Представьте что для ответа на первый запрос пользователя нужно вызвать 2 инструмента, и после этого дать ответ. При вызове второго модель будет видеть, о чём она уже подумал, а обычно это выкидывают, что приводит к значительной неэффективности использования токенов. Этот подход заставляет модель заново обдумывать всю проблему при каждом последующем вызове инструмента. После того как модель написала ответ и он вернулся пользователю, то цепочки рассуждений удаляются, история вызовов инструментов и их результатов остается сохраненной в контексте, так что модели видно, что она делала, но не о чём думала.
Также во время обучения на задачах с инструментами начали применять подход как…
Из этого канала
- #3160И теперь самое интересное — масштабирование датасетов для агентского RL.…
И теперь самое интересное — масштабирование датасетов для агентского RL. Разнообразный набор задач имеет решающее значение для повышения надежности и…
- #3161Пример сгенерированной задачи для General Agent: 1) есть детальнейшее описание…
Пример сгенерированной задачи для General Agent: 1) есть детальнейшее описание того, что хочет человек при планировании путешествия 2) есть набор функций,…
- #3162Для категории General Agent делают дополнительную фильтрацию, чтобы выкинуть…
Для категории General Agent делают дополнительную фильтрацию, чтобы выкинуть некачественную синтетику.
- #3158DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models В конце…
DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models В конце сентября DeepSeek уже представили модель V3.2, но тогда она была с суффиксом…
- #31571) ChatGPT сегодня 3 года, урааа 🎉 2) я потихонечку начал писать в твиттер, вот…
1) ChatGPT сегодня 3 года, урааа 🎉 2) я потихонечку начал писать в твиттер, вот вчера один из постов набрал 100 тысяч просмотров, и ещё несколько 1-2 недельной…