gonzo-обзоры ML статей@gonzo_ML· 24 246 subs

Я, кстати, хочу подсветить, что в работе про subliminal learning в большинстве…

30 июл. 2025 г.5 788 views21 forwardsОткрыть в Telegram →

Я, кстати, хочу подсветить, что в работе про subliminal learning в большинстве экспериментов была не logit-дистилляция, для которой всё было бы более-менее очевидно (был один эксперимент на MNIST с logit-дистилляцией), а дистилляция на уровне токенов, по сути обычный SFT, когда модель-учитель (например, закрытая GPT-4.1/mini/nano) генерит ответы на несвязанные со скрытой способностью запросы, а другая такая же модель (тоже закрытая GPT-4.1/mini/nano) на этом датасете файнтюнится. Это добавляет находке красоты!

Источник

https://t.me/gonzo_ML/3878

Канал gonzo-обзоры ML статей · опубликовано 30 июл. 2025 г.

Из этого канала