Когда ты думал, что оно грокнуло, а оно, зараза, переобучилось 😹
Когда ты думал, что оно грокнуло, а оно, зараза, переобучилось 😹
Из этого канала
- #4180The Principles of Diffusion Models: From Origins to Advances Chieh-Hsin Lai,…
The Principles of Diffusion Models: From Origins to Advances Chieh-Hsin Lai, Yang Song, Dongjun Kim, Yuki Mitsufuji, Stefano Ermon Статья:…
- #4182Kimi Linear: An Expressive, Efficient Attention Architecture…
Kimi Linear: An Expressive, Efficient Attention Architecture https://arxiv.org/abs/2510.26692 Новинка в линейке Kimi, SSM-Трансформер гибрид с линейным…
- #4186Продолжаем серию обзорных работ по большой области. После обзора диффузионок…
Продолжаем серию обзорных работ по большой области. После обзора диффузионок приехал обзор по KAN. Этот поскромнее, всего 63 страницы.
- #4177"Графовый LSTM подвезли, gLSTM. Что сделано? В статье пересматривается проблема…
"Графовый LSTM подвезли, gLSTM. Что сделано? В статье пересматривается проблема ""over-squashing"" в графовых нейронных сетях (GNN), разделяя её на два…
- #4175"Продолжается развитие интересной линейки Dreamer, моделей, способных обучаться…
"Продолжается развитие интересной линейки Dreamer, моделей, способных обучаться ""в воображении"", внутри выученной модели мира.