Каждая рандомная группа челов автоматически становится новой LLM RL лабой CUDA-L1: Improving CUDA Optimization via Contrastive Reinforcement Learning https://arxiv.org/abs/2507.14111 https://www.alphaxiv.org/ru/overview/2507.14111v1
Каждая рандомная группа челов автоматически становится новой LLM RL лабой…
Из этого канала
- #1190шьто ни день то новые соты опенсурсы Обнова самой большой модельки от квенов…
шьто ни день то новые соты опенсурсы Обнова самой большой модельки от квенов https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507 Щас бы дипсику чонить…
- #1191Сегодня мы выложили улучшенную версию RefalMachine/RuadaptQwen3-4B-Instruct 🎉…
Сегодня мы выложили улучшенную версию RefalMachine/RuadaptQwen3-4B-Instruct 🎉 Модель стала лучше по всем фронтам: 1️⃣ На бенчмарке по каждой категории рост, в…
- #1192Мне кажется, что опенаи скинут опенсурсную модельку сегодня
Мне кажется, что опенаи скинут опенсурсную модельку сегодня
- #1188🚀 Уважаемые коллеги, кому интересна математика и машинное обучение, приглашаем…
🚀 Уважаемые коллеги, кому интересна математика и машинное обучение, приглашаем Вас принять участие в неформальном научном проекте.
- #1187Ставим звездочки и участвуем в интересном проекте
Ставим звездочки и участвуем в интересном проекте