Не кажется ли вам, что инновации ОпенАИ как бы подсократились в последнее время? Ресерч их как будто сжался
Не кажется ли вам, что инновации ОпенАИ как бы подсократились в последнее…
Из этого канала
- #1039Ребята из OpenPipe выкладывают Agent Reinforcement Trainer (ART)…
Ребята из OpenPipe выкладывают Agent Reinforcement Trainer (ART) https://github.com/OpenPipe/ART Пишут что есть multi-turn.
- #1040Один раз исследователи не написали обзорку по агентам, больше их никто не видел…
Один раз исследователи не написали обзорку по агентам, больше их никто не видел Эти написали.
- #1042так смешнее
так смешнее
- #1037шьто-то пусто в коментах. Пригоршня гпт 4.1 вас не удивила? Жду локальную…
шьто-то пусто в коментах. Пригоршня гпт 4.1 вас не удивила? Жду локальную модельку от ОпенАИ. Может они прям всех разорвут в опенсурсе? Хотелось бы.
- #1036Я буду кидать очередной имплемент GRPO когда вы меньше всего этого ждете. Я и…
Я буду кидать очередной имплемент GRPO когда вы меньше всего этого ждете. Я и сам не ждал https://github.com/policy-gradient/GRPO-Zero