Кстати тоже все хотел сделать как-нить подборку РЛ челов и стартапов. Все руки не дойдут Пока можно тут почитать https://www.chemistry.vc/post/rl-reigns-supreme Из тех что выше вижу часто мелькают Thinking Machines и OpenPipe PS высвобождаем и делаем потихоньку в https://t.me/researchim
Кстати тоже все хотел сделать как-нить подборку РЛ челов и стартапов. Все руки…
Из этого канала
- #1170HF выложили thinking модельку SmolLM3-3B и рассказывают как тюнили. Русского в…
HF выложили thinking модельку SmolLM3-3B и рассказывают как тюнили. Русского в языках нету https://huggingface.co/HuggingFaceTB/SmolLM3-3B…
- #1171Вышел Grok-4 По бенчмаркам SOTA, понятное дело, как обычно, в принципе. Его…
Вышел Grok-4 По бенчмаркам SOTA, понятное дело, как обычно, в принципе. Его почти сразу завезли в курсор, поэтому я немного потыкался и поспрашивал.
- #1174Ну шьто, как вам грок 4 кто уже трогал?
Ну шьто, как вам грок 4 кто уже трогал?
- #1168В любой момент времени можно скинуть лучший конспект по RLю на русском…
В любой момент времени можно скинуть лучший конспект по RLю на русском https://arxiv.org/abs/2201.09746
- #1167Челы из Allen AI сделали бенчмарк по саенсу Пишешь запрос, там внутри достается…
Челы из Allen AI сделали бенчмарк по саенсу Пишешь запрос, там внутри достается контекст из релевантных статеек и по нему моделька отвечает пользователю Дипсик…