Продолжаем серию обзорных работ по большой области. После обзора диффузионок приехал обзор по KAN. Этот поскромнее, всего 63 страницы. Title: A Practitioner's Guide to Kolmogorov-Arnold Networks Authors: __Amir Noorizadegan, Sifan Wang, and Leevan Ling__ Статья: https://arxiv.org/abs/2510.25781 Главный вклад работы — это смещение фокуса на выбор базиса как на ключевой аспект проектирования KAN. Выбор базисной функции — это не второстепенная деталь реализации, а основной механизм для введения inductive bias, определяющий такие свойства сети, как гладкость, локальность и спектральное поведение. Обзор также предлагает практические советы в руководстве «Выбери свой KAN». Этот практический фреймворк сопоставляет характеристики задач с рекомендуемыми вариантами KAN, выбором базиса и конфигурациями обучения. Подробнее: https://t.me/gonzo_ML_podcasts/1213
Продолжаем серию обзорных работ по большой области. После обзора диффузионок…
Из этого канала
- #4188Обзор трансформеров с памятью. Memory-Augmented Transformers: A Systematic…
Обзор трансформеров с памятью. Memory-Augmented Transformers: A Systematic Review from Neuroscience Principles to Enhanced Model Architectures Authors: Parsa…
- #4190Прекрасная картинка от a16z (на самом деле от Air Street Capital и State of AI)…
Прекрасная картинка от a16z (на самом деле от Air Street Capital и State of AI) про предпочтения разработчиками открытых моделей
- #4191Всё ещё кипятите? What Really Matters in Matrix-Whitening Optimizers? Авторы:…
Всё ещё кипятите? What Really Matters in Matrix-Whitening Optimizers? Авторы: Kevin Frans, Pieter Abbeel, Sergey Levine Статья:…
- #4182Kimi Linear: An Expressive, Efficient Attention Architecture…
Kimi Linear: An Expressive, Efficient Attention Architecture https://arxiv.org/abs/2510.26692 Новинка в линейке Kimi, SSM-Трансформер гибрид с линейным…
- #4180The Principles of Diffusion Models: From Origins to Advances Chieh-Hsin Lai,…
The Principles of Diffusion Models: From Origins to Advances Chieh-Hsin Lai, Yang Song, Dongjun Kim, Yuki Mitsufuji, Stefano Ermon Статья:…