Интересная работа про Energy-based трансформеры: https://t.me/gonzo_ML_podcasts/633 Модель выучивает энергетическую функцию, и далее генеря что-то, может оценивать это же по энергетической функции и оптимизировать результат градиентным спуском. Результат выглядит неплохо.
Интересная работа про Energy-based трансформеры:…
Из этого канала
- #3884https://t.me/gonzoMLpodcasts/636
https://t.me/gonzoMLpodcasts/636
- #3885Если вам нечего посмотреть на выходных, то есть прекрасный фильм Memento,…
Если вам нечего посмотреть на выходных, то есть прекрасный фильм Memento, который предсказал мир LLM задолго до него.
- #3886Прекрасное субботнее нашёл! Что мы всё про AI, да AGI. Когда есть ETI…
Прекрасное субботнее нашёл! Что мы всё про AI, да AGI. Когда есть ETI (Extra-terrestrial Intelligence).
- #3882А ещё сегодня Цукерберг опубликовал своё видение про персональный…
А ещё сегодня Цукерберг опубликовал своё видение про персональный сверхинтеллект. Любопытный комментарий тут.
- #3881Любопытная тёрка между Лекуном и Маском про инженеров и исследователей…
Любопытная тёрка между Лекуном и Маском про инженеров и исследователей…