"Сначала рассматривали предобучение в контексте бесконечного компьюта (см. Pre-training under infinite compute, https://t.me/gonzo_ML/4038), теперь инференс. И там, и тут, выводы близкие: в любой непонятной ситуации делай ансамблирование 😁 Title: Best-of-∞ - Asymptotic Performance of Test-Time Compute Authors: __Junpei Komiyama, Daisuke Oba, Masafumi Oyamada__ Paper: https://arxiv.org/abs/2509.21091 Review: https://arxiviq.substack.com/p/best-of-asymptotic-performance-of Code: https://github.com/jkomiyama/BoInf-code-publish В статье представлен теоретический фреймворк ""Best-of-∞"", определяющий асимптотический предел производительности для стратегии best-of-N (BoN) с голосованием по большинству. Чтобы приблизиться к этому пределу с конечными ресурсами, авторы предлагают два ключевых нововведения: 1) Адаптивный алгоритм сэмплинга, который использует байесовское моделирование (в частности, фактор Байеса), чтобы динамически решать, когда прекратить генерацию ответов, тем самым оптимизируя вычислительные затраты. 2) Метод создания оптимально взвешенных ансамблей из нескольких LLM, который формулирует задачу оптимизации весов в асимптотическом пределе как решаемую задачу смешанного целочисленного линейного программирования (MILP). Подробнее: https://t.me/gonzo_ML_podcasts/1251"
"Сначала рассматривали предобучение в контексте бесконечного компьюта (см.…
Из этого канала
- #4195"Классно, когда на Arxiv публикуют sci-fi. Была летом практическая работа про…
"Классно, когда на Arxiv публикуют sci-fi. Была летом практическая работа про Context Engineering (""A Survey of Context Engineering for Large Language…
- #4199"В целом постить анонсы появления разных новых моделей перестало быть особенно…
"В целом постить анонсы появления разных новых моделей перестало быть особенно интересно, про это и так все напишут (тут ещё и Gemini 3.0 Pro и GPT-5.1…
- #4201Тут вышла свежая статья про AlphaEvolve с Теренсом Тао в соавторстве. В отличие…
Тут вышла свежая статья про AlphaEvolve с Теренсом Тао в соавторстве. В отличие от старой статьи разбирают большую кучу математических проблем.
- #4191Всё ещё кипятите? What Really Matters in Matrix-Whitening Optimizers? Авторы:…
Всё ещё кипятите? What Really Matters in Matrix-Whitening Optimizers? Авторы: Kevin Frans, Pieter Abbeel, Sergey Levine Статья:…
- #4190Прекрасная картинка от a16z (на самом деле от Air Street Capital и State of AI)…
Прекрасная картинка от a16z (на самом деле от Air Street Capital и State of AI) про предпочтения разработчиками открытых моделей