Не про архиваторы. Binary Retrieval-Augmented Reward, или Binary RAR, — это очень простой способ побороть галлюцинации модели, сохранив при этом её способности. Не нужен никакой хитрый реворд, только 1 (если ответ модели фактологически верен) или 0 (если есть хотя бы одно несоответствие). Binary RAR достигает SOTA-показателей в снижении уровня галлюцинаций (на 39.3% в задачах генерации длинных текстов), при этом уникальным образом сохраняя такие способности, как следование инструкциям и рассуждения — а это слабое место методов с непрерывным вознаграждением. Строгое наказание по принципу «всё или ничего» противостоит «взлому вознаграждения» (reward hacking) и побуждает модель выучивать сложное поведение, например, калиброванный отказ от ответа, когда она стратегически говорит «Я не знаю», если не уверена. Подробнее: https://t.me/gonzo_ML_podcasts/1136
Не про архиваторы. Binary Retrieval-Augmented Reward, или Binary RAR, — это…
Из этого канала
- #4175"Продолжается развитие интересной линейки Dreamer, моделей, способных обучаться…
"Продолжается развитие интересной линейки Dreamer, моделей, способных обучаться ""в воображении"", внутри выученной модели мира.
- #4177"Графовый LSTM подвезли, gLSTM. Что сделано? В статье пересматривается проблема…
"Графовый LSTM подвезли, gLSTM. Что сделано? В статье пересматривается проблема ""over-squashing"" в графовых нейронных сетях (GNN), разделяя её на два…
- #4179Когда ты думал, что оно грокнуло, а оно, зараза, переобучилось 😹
Когда ты думал, что оно грокнуло, а оно, зараза, переобучилось 😹
- #4172Extropic анонсировал своё новое железо…
Extropic анонсировал своё новое железо http://extropic.ai/writing/inside-x0-and-xtr-0 Мы писали про эту и другие интересные темы тут
- #4170Краткость — сестра Адаптация LLM через прунинг весовых матриц. Что надо прунить…
Краткость — сестра Адаптация LLM через прунинг весовых матриц. Что надо прунить — определяется по градиенту функции потерь по сингулярным значениям матрицы,…