Рассказываю про препринт нашей новой статьи, которую написали совместно с моим аспирантом и научным сотрудником AIRI Глебом Мезенцевым. Оказывается, LLM могут восстанавливать длинные тексты из одного обученного эмбеддинга за один forward-pass — без итеративного декодинга. Получается, что у LLM есть скрытый талант генерировать сотни слов практически моментально, осталось понять, как этот талант развить :)
Рассказываю про препринт нашей новой статьи, которую написали совместно с моим…
Из этого канала
- #203Сегодня выступил на Data Fest’25 в офисе Сбера, рассказал про основы обучения…
Сегодня выступил на Data Fest’25 в офисе Сбера, рассказал про основы обучения больших моделей в эпоху ризонинга.
- #205В эти выходные хор «Юность» Ансамбля песни и пляски имени В.С. Локтева вместе с…
В эти выходные хор «Юность» Ансамбля песни и пляски имени В.С. Локтева вместе с народной артисткой России Ларисой Долиной исполнил Гимн страны на Большой…
- #206Группа Влада Куренкова в AIRI сегодня представила Vintix — SOTA action-модель…
Группа Влада Куренкова в AIRI сегодня представила Vintix — SOTA action-модель для роботов и индустриальных процессов, умеющую имитировать ход обучения с…
- #201Следующий Большой Семинар AIRI, посвященный кардиологии и искусственному…
Следующий Большой Семинар AIRI, посвященный кардиологии и искусственному интеллекту, пройдет уже завтра ⤵️ Обращаем внимание на обновлённое расписание: сбор…
- #200Уверен, что крутые и важные исследования рождаются именно на стыке дисциплин,…
Уверен, что крутые и важные исследования рождаются именно на стыке дисциплин, поэтому приглашаю вас обсудить ИИ и кардиологию на наш следующий Большой Семинар…