Прекрасная картинка от a16z (на самом деле от Air Street Capital и State of AI) про предпочтения разработчиками открытых моделей
Прекрасная картинка от a16z (на самом деле от Air Street Capital и State of AI)…
Из этого канала
- #4191Всё ещё кипятите? What Really Matters in Matrix-Whitening Optimizers? Авторы:…
Всё ещё кипятите? What Really Matters in Matrix-Whitening Optimizers? Авторы: Kevin Frans, Pieter Abbeel, Sergey Levine Статья:…
- #4193"Сначала рассматривали предобучение в контексте бесконечного компьюта (см.…
"Сначала рассматривали предобучение в контексте бесконечного компьюта (см. Pre-training under infinite compute, https://t.me/gonzoML/4038), теперь инференс.
- #4195"Классно, когда на Arxiv публикуют sci-fi. Была летом практическая работа про…
"Классно, когда на Arxiv публикуют sci-fi. Была летом практическая работа про Context Engineering (""A Survey of Context Engineering for Large Language…
- #4188Обзор трансформеров с памятью. Memory-Augmented Transformers: A Systematic…
Обзор трансформеров с памятью. Memory-Augmented Transformers: A Systematic Review from Neuroscience Principles to Enhanced Model Architectures Authors: Parsa…
- #4186Продолжаем серию обзорных работ по большой области. После обзора диффузионок…
Продолжаем серию обзорных работ по большой области. После обзора диффузионок приехал обзор по KAN. Этот поскромнее, всего 63 страницы.