Together AI и Agentica team потюнили Qwen3-32B и опенсурсят DeepSWE-Preview агента для разработки Тюнили с GRPO++ (GRPO с улучшалками из некоторых недавних статей) своей либы https://github.com/agentica-project/rllm Самое крутое что все дают - веса, датасет, код ну и пайплайн описывают В датасете данные на использование тулов вызов bash, поиск, файл едитор https://www.together.ai/blog/deepswe блог про RLLM https://pretty-radio-b75.notion.site/rLLM-A-Framework-for-Post-Training-Language-Agents-21b81902c146819db63cd98a54ba5f31 веса https://huggingface.co/agentica-org/DeepSWE-Preview датасет на 4.5к семплов https://huggingface.co/datasets/R2E-Gym/R2E-Gym-Subset PS проектики делаем и ИИнфу собираем в https://t.me/researchim