"Я пока основное свободное время трачу на развитие и обновление своей системы генерации обзоров, на ручное временно не хватает. Но поток интересных статей не ослабевает, среди прочего хочу обратить внимание на новый подход ""grafting"", позволяющий экспериментировать с тяжелыми предобученными диффузионками и заменять их на более лёгкие почти без потери качества. А также менять архитектуру имеющихся моделей. В примере авторы распараллелили 28-слойную модель, заменив пары последовательных слоёв на параллельные, и побили более глубокие варианты и запруненные до тех же 14 слоёв модели. Автообзор тут: https://t.me/gonzo_ML_podcasts/224 Заодно скажите, как вам новый формат автообзора?"
"Я пока основное свободное время трачу на развитие и обновление своей системы…
Из этого канала
- #3690"Log-Linear Attention [Статья][Код] Введение Вообще, давно пора было бы…
"Log-Linear Attention [Статья][Код] Введение Вообще, давно пора было бы смириться с тем фактом, что лучше Attention ничего нет на свете, но человек в своем…
- #3691Метод Почти с момента выхода Attention было предложено много альтернатив с…
Метод Почти с момента выхода Attention было предложено много альтернатив с субквадратичной сложностью.
- #3692Очень обсуждаемая сейчас работа от исследователей из Apple про ризонинг модели:…
Очень обсуждаемая сейчас работа от исследователей из Apple про ризонинг модели: https://t.me/gonzoMLpodcasts/234 Из интересного, авторы постарались уйти от…
- #3688Вот ещё тоже прекрасное
Вот ещё тоже прекрасное
- #3687Хинтона вам в ленту
Хинтона вам в ленту