Together AI и Agentica team потюнили Qwen3-32B и опенсурсят DeepSWE-Preview агента для разработки Тюнили с GRPO++ (GRPO с улучшалками из некоторых недавних статей) своей либы https://github.com/agentica-project/rllm Самое крутое что все дают - веса, датасет, код ну и пайплайн описывают В датасете данные на использование тулов вызов bash, поиск, файл едитор https://www.together.ai/blog/deepswe блог про RLLM https://pretty-radio-b75.notion.site/rLLM-A-Framework-for-Post-Training-Language-Agents-21b81902c146819db63cd98a54ba5f31 веса https://huggingface.co/agentica-org/DeepSWE-Preview датасет на 4.5к семплов https://huggingface.co/datasets/R2E-Gym/R2E-Gym-Subset PS проектики делаем и ИИнфу собираем в https://t.me/researchim
Together AI и Agentica team потюнили Qwen3-32B и опенсурсят DeepSWE-Preview…
Из этого канала
- #1156Сегодня я доказал что мы живем в симуляции Клод Сонет 4 доделал некоторые…
Сегодня я доказал что мы живем в симуляции Клод Сонет 4 доделал некоторые важные штучки за o3, на которые тот не обращал внимания Вагон смайликов также был…
- #1157из SSI уволился Даниэль Гросс (я на самом деле хз кто это) А Илья теперь гендир…
из SSI уволился Даниэль Гросс (я на самом деле хз кто это) А Илья теперь гендир SSI У них есть вычислительная техника кстати.
- #1158жесть модельки деграднули за 5 лет
жесть модельки деграднули за 5 лет
- #1152"🚀 Разбираем решение, которое принесло нашей команде 6-е место в…
"🚀 Разбираем решение, которое принесло нашей команде 6-е место в Kaggle-соревновании по обработке данных миссии Ariel Пост про то, что это вообще за сорева вот…
- #1151А вот и решение задачки с прошлогодней соревы
А вот и решение задачки с прошлогодней соревы