Mythos является очень эффективной моделью в плане токенов. Причиной этому, скорее всего, является использование подхода похожего на LoopLM от ByteDance (в соавторстве с Бенжио). Не вдаваясь в математику, это значит что модель вместо генерации chain-of-thought размышлений в виде текста, делает это в своем скрытом, латентном пространстве без какого-либо промежуточного аутпута. При тренировке, модель сама учится тому когда ей нужно делать несколько циклов инфренса для более сложных задач. Если это так, то это дает большую экономию в токенах, и одновременно позволяет модели более «глубоко» думать над задачами, которые трудно решить обычной цепочкой рассуждений.
Mythos является очень эффективной моделью в плане токенов. Причиной этому,…
Из этого канала
- #2951"Главная ошибка в ИИ сегодня — это то, что им кажется, что модели недостаточно…
"Главная ошибка в ИИ сегодня — это то, что им кажется, что модели недостаточно умны.
- #2952"Я ищу контент-лида, который хочет стать главным голосом в домашней…
"Я ищу контент-лида, который хочет стать главным голосом в домашней робототехнике.
- #2953второй год подряд в Пекине проходит марафон роботов: больше 100 команд…
второй год подряд в Пекине проходит марафон роботов: больше 100 команд соревновались на дистанции в 21 км.
- #2949"Мы живём в мире, где каждому последнему идиоту какая-нибудь LLM прямо сейчас…
"Мы живём в мире, где каждому последнему идиоту какая-нибудь LLM прямо сейчас пишет ""Отличная идея, молодец!"" И куда это нас приведёт? 😬"
- #2948"Если услышав от модели ""классная идея, ты молодец"" вы не думаете, что это…
"Если услышав от модели ""классная идея, ты молодец"" вы не думаете, что это действительно, скорее всего, довольно крутая идея в сравнении со всем, что вы…