Больше рекурсий богу рекурсий! По факту добавили в TRM работу с популяцией… — @gonzo_ML

Больше рекурсий богу рекурсий! По факту добавили в TRM работу с популяцией решений. Generative Recursive Reasoning __Junyeob Baek, Mingyu Jo, Minsu Kim, Mengye Ren, Yoshua Bengio, Sungjin Ahn__ Paper: https://arxiv.org/abs/2605.19376 Code: https://ahn-ml.github.io/gram-website Review: https://arxiviq.substack.com/p/generative-recursive-reasoning # TL;DR ЧТО сделали: Авторы представили GRAM (Generative Recursive reAsoning Models) — вероятностный фреймворк, который превращает рекурсивные латентные рассуждения из детерминированной последовательности шагов в стохастический многотраекторный процесс. За счёт интеграции обучаемых гауссовских шумов в скрытые переходы и обучения системы через амортизированный вариационный вывод, GRAM строит как условные рассуждения `p_θ(y | x)`, так и генерирует распределения `p_θ(x)` на непрерывных латентных траекториях. ПОЧЕМУ это важно: Существующие рекурсивные модели страдают от коллапса мод в задачах со множеством решений, так как их латентные траектории детерминированы. GRAM преодолевает это ограничение, позволяя масштабироваться на этапе инференса «в ширину» (через параллельный сэмплинг траекторий), что отлично дополняет классическое масштабирование «в глубину» без роста задержек. Модель обходит сильные детерминированные бейзлайны в сложных задачах на рассуждение и удовлетворение ограничений (таких как экстремальное Судоку, задача о ферзях и раскраска графов), оставаясь компактной по числу параметров. Для практиков: Получена эффективная по параметрам архитектура, которая умеет искать альтернативные пути решения сложных комбинаторных задач прямо в латентном пространстве. Метод позволяет гибко балансировать точность и вычислительные затраты на инференсе, запуская параллельные потоки рассуждений и выбирая лучший вариант с помощью встроенной модели оценки. Рекурсировать тут: https://t.me/gonzo_ML_podcasts/3687

Из этого канала