Агенты ИИ | AGI_and_RL@AGI_and_RL· 5 852 subs

Together AI и Agentica team потюнили Qwen3-32B и опенсурсят DeepSWE-Preview…

3 июл. 2025 г.2 205 views73 forwardsОткрыть в Telegram →

Together AI и Agentica team потюнили Qwen3-32B и опенсурсят DeepSWE-Preview агента для разработки Тюнили с GRPO++ (GRPO с улучшалками из некоторых недавних статей) своей либы https://github.com/agentica-project/rllm Самое крутое что все дают - веса, датасет, код ну и пайплайн описывают В датасете данные на использование тулов вызов bash, поиск, файл едитор https://www.together.ai/blog/deepswe блог про RLLM https://pretty-radio-b75.notion.site/rLLM-A-Framework-for-Post-Training-Language-Agents-21b81902c146819db63cd98a54ba5f31 веса https://huggingface.co/agentica-org/DeepSWE-Preview датасет на 4.5к семплов https://huggingface.co/datasets/R2E-Gym/R2E-Gym-Subset PS проектики делаем и ИИнфу собираем в https://t.me/researchim

Источник

https://t.me/AGI_and_RL/1153

Канал Агенты ИИ | AGI_and_RL · опубликовано 3 июл. 2025 г.

Из этого канала