Я, кстати, хочу подсветить, что в работе про subliminal learning в большинстве экспериментов была не logit-дистилляция, для которой всё было бы более-менее очевидно (был один эксперимент на MNIST с logit-дистилляцией), а дистилляция на уровне токенов, по сути обычный SFT, когда модель-учитель (например, закрытая GPT-4.1/mini/nano) генерит ответы на несвязанные со скрытой способностью запросы, а другая такая же модель (тоже закрытая GPT-4.1/mini/nano) на этом датасете файнтюнится. Это добавляет находке красоты!
Я, кстати, хочу подсветить, что в работе про subliminal learning в большинстве…
Из этого канала
- #3879"Прикольная работа про эволюцию промптов, которая бьёт RL — GEPA (не путать с…
"Прикольная работа про эволюцию промптов, которая бьёт RL — GEPA (не путать с лекуновской JEPA!) https://t.me/gonzoMLpodcasts/619 Рефлексия на естественном…
- #3880https://t.me/gonzoMLpodcasts/628
https://t.me/gonzoMLpodcasts/628
- #3881Любопытная тёрка между Лекуном и Маском про инженеров и исследователей…
Любопытная тёрка между Лекуном и Маском про инженеров и исследователей…
- #3877https://t.me/gonzoMLpodcasts/618
https://t.me/gonzoMLpodcasts/618
- #3876Очень прикольная работа про subliminal learning:…
Очень прикольная работа про subliminal learning: https://t.me/gonzoMLpodcasts/602 Из серии про природу вещей и геометрию репрезентаций.