Шмидхубер ссылается на фундаментальные работы Беннета и Шмидхубера! Multiple Token Divergence: A Measure of In-Context Computation Density __Vincent Herrmann, Eric Alcaide, Jürgen Schmidhuber__ Статья: https://openreview.net/forum?id=jNJwgg0opm Ревью: https://arxiviq.substack.com/p/multiple-token-divergence-a-measure # TL;DR ЧТО сделали: Авторы предложили метрику Multiple Token Divergence (MTD), которая оценивает «вычислительную плотность» сгенерированного токена. Это делается через измерение KL-дивергенции между выходным распределением полной модели и её ограниченной, «поверхностной» вспомогательной головы. ПОЧЕМУ это важно: Стандартный лосс предсказания следующего токена (`L_NLL`) — плохой прокси для оценки затрат на рассуждение. Модель может показывать низкий лосс на тривиальных задачах (копирование) и такой же низкий на сложных, но детерминированных вычислениях. MTD позволяет отделить «предсказуемость» от «вычислительных усилий», давая неинвазивный способ понять, использует ли модель всю свою глубину для ризонинга или выезжает на простых эвристиках. Подробнее: https://t.me/gonzo_ML_podcasts/1741
Шмидхубер ссылается на фундаментальные работы Беннета и Шмидхубера! Multiple…
Из этого канала
- #4411Любопытный (но дорогой) заход на стабильность мультишаговых воркфлоу с LLM :)…
Любопытный (но дорогой) заход на стабильность мультишаговых воркфлоу с LLM :) Solving a Million-Step LLM Task with Zero Errors Elliot Meyerson, Giuseppe Paolo,…
- #4414Альтернатива. Извинити )
Альтернатива. Извинити )
- #4415100-страничный обзор про память агентов с кучей красивых картинок. С таким…
100-страничный обзор про память агентов с кучей красивых картинок. С таким добром и комикс не нужен! Memory in the Age of AI Agents: A Survey Yuyang Hu,…
- #4405Ну и, кстати, если ещё не видели, новая Gemini 3 Flash выглядит неплохо!…
Ну и, кстати, если ещё не видели, новая Gemini 3 Flash выглядит неплохо! https://blog.google/products/gemini/gemini-3-flash/
- #4404А вот это прикольно! https://ai.meta.com/samaudio/
А вот это прикольно! https://ai.meta.com/samaudio/