"Прикольная работа про эволюцию промптов, которая бьёт RL — GEPA (не путать с лекуновской JEPA!) https://t.me/gonzo_ML_podcasts/619 Рефлексия на естественном языке вместо скалярных наград, эволюция только инструкций без few-shot примеров — и на редкость хороший результат. Очередной пример, когда всё больше ""интеллекта"" выносится на сторону LLM (как и в AlphaEvolve, например, https://t.me/gonzo_ML/3624), и это работает хорошо."
"Прикольная работа про эволюцию промптов, которая бьёт RL — GEPA (не путать с…
Из этого канала
- #3880https://t.me/gonzoMLpodcasts/628
https://t.me/gonzoMLpodcasts/628
- #3881Любопытная тёрка между Лекуном и Маском про инженеров и исследователей…
Любопытная тёрка между Лекуном и Маском про инженеров и исследователей…
- #3882А ещё сегодня Цукерберг опубликовал своё видение про персональный…
А ещё сегодня Цукерберг опубликовал своё видение про персональный сверхинтеллект. Любопытный комментарий тут.
- #3878Я, кстати, хочу подсветить, что в работе про subliminal learning в большинстве…
Я, кстати, хочу подсветить, что в работе про subliminal learning в большинстве экспериментов была не logit-дистилляция, для которой всё было бы более-менее…
- #3877https://t.me/gonzoMLpodcasts/618
https://t.me/gonzoMLpodcasts/618