HF выложили thinking модельку SmolLM3-3B и рассказывают как тюнили. Русского в языках нету https://huggingface.co/HuggingFaceTB/SmolLM3-3B https://huggingface.co/blog/smollm3 Думаю самое интересное это почитать про сам трен
HF выложили thinking модельку SmolLM3-3B и рассказывают как тюнили. Русского в…
Из этого канала
- #1171Вышел Grok-4 По бенчмаркам SOTA, понятное дело, как обычно, в принципе. Его…
Вышел Grok-4 По бенчмаркам SOTA, понятное дело, как обычно, в принципе. Его почти сразу завезли в курсор, поэтому я немного потыкался и поспрашивал.
- #1174Ну шьто, как вам грок 4 кто уже трогал?
Ну шьто, как вам грок 4 кто уже трогал?
- #1175"Пара приятных и полезных находок Введение в диффузионки Step-by-Step…
"Пара приятных и полезных находок Введение в диффузионки Step-by-Step Diffusion: An Elementary Tutorial https://arxiv.org/abs/2406.08929 И обзор методов…
- #1169Кстати тоже все хотел сделать как-нить подборку РЛ челов и стартапов. Все руки…
Кстати тоже все хотел сделать как-нить подборку РЛ челов и стартапов. Все руки не дойдут Пока можно тут почитать…
- #1168В любой момент времени можно скинуть лучший конспект по RLю на русском…
В любой момент времени можно скинуть лучший конспект по RLю на русском https://arxiv.org/abs/2201.09746