gonzo-обзоры ML статей@gonzo_ML· 24 246 subs

Дожили... Документ переполнился

11 окт. 2025 г.5 066 views8 forwardsОткрыть в Telegram →

Источник

https://t.me/gonzo_ML/4095

Канал gonzo-обзоры ML статей · опубликовано 11 окт. 2025 г.

Из этого канала

#4097Hierarchical Reasoning Model Guan Wang, Jin Li, Yuhao Sun, Xing Chen, Changling…
Hierarchical Reasoning Model Guan Wang, Jin Li, Yuhao Sun, Xing Chen, Changling Liu, Yue Wu, Meng Lu, Sen Song, Yasin Abbasi Yadkori Статья:…
#4098- Приближённый градиент Ключевое нововведение HRM — это способность эффективно…
- Приближённый градиент Ключевое нововведение HRM — это способность эффективно обучать такие глубокие рекуррентные процессы.
#4099Оба модуля, H и L, реализованы с использованием современных блоков…
Оба модуля, H и L, реализованы с использованием современных блоков трансформер-энкодера (привет, BERT!), включающих такие улучшения, как Rotary Positional…
#4093Интересно, что параллельно с LLM/VLM Google продолжает совершенствовать модели…
Интересно, что параллельно с LLM/VLM Google продолжает совершенствовать модели для роботов, свежая — Gemini Robotics 1.5.
#4092"Неужели мы наблюдаем возрождение эволюционных стратегий как альтернативы RL? Я…
"Неужели мы наблюдаем возрождение эволюционных стратегий как альтернативы RL? Я помню ту работу 2017 года от OpenAI и Суцкевера в частности ""Evolution…