Экспериментирую с заменой себя и обкатываю первую версию мультиагентной системы для разбора статей. Вот сгенерил ревью этой же самой статьи про DyT, что постил утром. Какие-то ограничения системы ясны, будем устранять в следующих версиях. Фидбек приветствуется!
Экспериментирую с заменой себя и обкатываю первую версию мультиагентной системы…
Из этого канала
- #3478"Transformers without Normalization: Многообещающий шаг к более простым и…
"Transformers without Normalization: Многообещающий шаг к более простым и быстрым моделям Название статьи: Transformers without Normalization Авторы: Jiachen…
- #3479"Экспериментальные результаты, суммированные в многочисленных таблицах, в целом…
"Экспериментальные результаты, суммированные в многочисленных таблицах, в целом подтверждают утверждения авторов.
- #3480"Just for fun продолжаю автоматическую публикацию обзоров статей, которые…
"Just for fun продолжаю автоматическую публикацию обзоров статей, которые вручную разбирать всё равно не буду.
- #3466Но предварительные эксперименты на ResNet показали, что прямая замена BN там не…
Но предварительные эксперименты на ResNet показали, что прямая замена BN там не очень работает, требует отдельного разбирательства. Короче, назад, к основам! 🙂
- #3465Transformers without Normalization Jiachen Zhu, Xinlei Chen, Kaiming He, Yann…
Transformers without Normalization Jiachen Zhu, Xinlei Chen, Kaiming He, Yann LeCun, Zhuang Liu Статья: https://arxiv.org/abs/2503.10622 Сайт:…