Пример сгенерированной задачи для General Agent: 1) есть детальнейшее описание того, что хочет человек при планировании путешествия 2) есть набор функций, предоставляющий большое количество информации по городу, отелям, транспорту итд 3) задача агента придумать, какие методы и с какими аргументами вызывать инструменты, чтобы получить правильный ответ.
Пример сгенерированной задачи для General Agent: 1) есть детальнейшее описание…
Из этого канала
- #3162Для категории General Agent делают дополнительную фильтрацию, чтобы выкинуть…
Для категории General Agent делают дополнительную фильтрацию, чтобы выкинуть некачественную синтетику.
- #3163Про метрики не вижу большого смысла говорить — по бенчмаркам показывают, что на…
Про метрики не вижу большого смысла говорить — по бенчмаркам показывают, что на равне или почти нос к носу с фронтиром, но мы-то с вами знаем, что это не так,…
- #3165Ещё обучили DeepSeek-V3.2-Speciale — всё то же самое, только снизили штраф за…
Ещё обучили DeepSeek-V3.2-Speciale — всё то же самое, только снизили штраф за длину размышлений, плюс выкинули все данные без рассуждений.
- #3160И теперь самое интересное — масштабирование датасетов для агентского RL.…
И теперь самое интересное — масштабирование датасетов для агентского RL. Разнообразный набор задач имеет решающее значение для повышения надежности и…
- #3159Также во время обучения на задачах с инструментами начали применять подход как…
Также во время обучения на задачах с инструментами начали применять подход как у OpenAI, когда рассуждения не выкидываются, и видны модели при генерации…