Шок! Сенсация! Трансформеры выиграли в лотерею! 😂 https://t.me/gonzo_ML_podcasts/369
Шок! Сенсация! Трансформеры выиграли в лотерею! 😂…
Из этого канала
- #3767~~RLHF~~, ~~RLVR~~, RLIF! https://t.me/gonzoMLpodcasts/375 В этом есть что-то…
~~RLHF~~, ~~RLVR~~, RLIF! https://t.me/gonzoMLpodcasts/375 В этом есть что-то интересное.
- #3768Pay Attention to Small Weights Chao Zhou, Tom Jacobs, Advait Gadhikar, Rebekka…
Pay Attention to Small Weights Chao Zhou, Tom Jacobs, Advait Gadhikar, Rebekka Burkholz Статья: https://arxiv.org/abs/2506.21374 Какая-то интересная тема про…
- #3769Итоговая идея -- надо сконцентрироваться на обновлении малых по магнитуде…
Итоговая идея -- надо сконцентрироваться на обновлении малых по магнитуде весов. Во-первых, благодаря оверпараметризации этого может быть достаточно.
- #3765Не про архитектуры и статьи, но тоже важно для контекста. Пока мы тут сидим,…
Не про архитектуры и статьи, но тоже важно для контекста. Пока мы тут сидим, Цукерберг вовсю собирает свою Superintelligence Labs, переманивая людей из ведущих…
- #3756Однако авторы упоминают и о существующих ограничениях. Качество работы…
Однако авторы упоминают и о существующих ограничениях. Качество работы RL-контроллера ограничено разрывом между симуляцией и реальностью, который проявился в…