Правильная дистилляция помогает избавиться от лишнего запоминания моделью! Memorization Dynamics in Knowledge Distillation for Language Models __Jaydeep Borkar, Karan Chadha, Niloofar Mireshghallah, Yuchen Zhang, Irina-Elena Veliche, Archi Mitra, David A. Smith, Zheng Xu, Diego Garcia-Olano__ Статья: https://arxiv.org/abs/2601.15394 Ревью: https://arxiviq.substack.com/p/memorization-dynamics-in-knowledge # TL;DR ЧТО сделали: Систематически изучили проблему запоминания обучающих данных (memorization) в LLM, обученных с помощью дистилляции знаний (Knowledge Distillation, KD). Сравнив дистиллированные модели («студентов») с независимо зафайнтюненными бейзлайнами и исходными «учителями» (семейства Pythia, OLMo-2, Qwen-3), авторы обнаружили, что дистилляция снижает запоминание тренировочных данных более чем на 50%. ПОЧЕМУ это важно: Работа опровергает устоявшееся мнение, что модели-студенты неизбежно наследуют уязвимости приватности своих учителей. Исследование показывает, что KD действует как регуляризатор, который избирательно отфильтровывает высокоэнтропийный «шум» (сложные для обучения примеры), сохраняя при этом обобщающую способность. Кроме того, авторы показали, что запоминание отлично предсказывается с помощью метрик сжатия (zlib), что позволяет проводить санитарную обработку данных (data sanitation) ещё до начала обучения. Подробнее: https://t.me/gonzo_ML_podcasts/2336
Правильная дистилляция помогает избавиться от лишнего запоминания моделью!…
Из этого канала
- #4725"Легенды диплёнинга. Список Ильи или 90% всего, что важно в AI Существует…
"Легенды диплёнинга. Список Ильи или 90% всего, что важно в AI Существует легенда о том, что однажды Джон Кармак (создатель id Software, коим мы благодарны за…
- #4726"🔁 RNN / LSTM / Sequence Models 1. The Unreasonable Effectiveness of Recurrent…
"🔁 RNN / LSTM / Sequence Models 1. The Unreasonable Effectiveness of Recurrent Neural Networks (http://karpathy.github.io/2015/05/21/rnn-effectiveness/) — A.
- #4727🎯 Attention / Transformers 8. Neural Machine Translation by Jointly Learning to…
🎯 Attention / Transformers 8. Neural Machine Translation by Jointly Learning to Align and Translate (https://arxiv.org/abs/1409.0473) — Bahdanau et al., 2015…
- #4716Снова про проблемы перплексии. Недавно рассматривали альтернативную метрику,…
Снова про проблемы перплексии. Недавно рассматривали альтернативную метрику, Epiplexity (https://t.me/gonzoML/4543).
- #4713"Фильтрация на уровне токенов при обучении даёт сильно более безопасные модели,…
"Фильтрация на уровне токенов при обучении даёт сильно более безопасные модели, чем другие способы.