хм интересная штука двое ребят kalomaze (хз кто он, в иксе часто про всякое рльное пишет) и Will Brown (он одним из первых выложил пример с кодом по grpo для тюна 1б лламы в домашних условиях, который быстро разошелся и многие взяли этот пример за базу и вообще разбирались во всей этой грпо штуке) вот только что пошли работать в https://www.primeintellect.ai/ https://github.com/PrimeIntellect-ai Как понял они делают всякое по распределенному трену моделек и агентские штуки Я к чему - прикольно что кто-то пылесосит популярных рльных/ллмных челов И еще вот вышел видосик по открытым вопросам агентик рля с Виллом Брауном как раз https://www.youtube.com/watch?v=Xkwok_XXQgw