Почему AI иногда будто «встал не с той ноги»? Вы наверное замечали, как порой болтаешь-болтаешь с chatGPT и ощущение, что он сегодня «не с той ноги встал» и придумывает больше обычного, или как-то нагловато отвечает. Прямо как недавно grok возомнил себя МехаГитлером. Ребята из Anthropic поделились результатами своего ресерча на тему: вкратце, они смогли выявить, что заставляет AI вести себя определенным образом - так называемые, персона-векторы. Оказывается, проблема может быть как на этапе тренировки модели: в исходных данных - например, запросы на сексуальные ролевые игры активируют вектор подхалимажа, и усиливают эту черту у AI. Так и в ходе общения с пользователем AI может «сьезжать» в ту или иную «личность». Вообще, круто было бы, когда загружаешь чат и по мере общения с ним, видеть какая личность с тобой болтает сегодня и подкручивать ее. К примеру, при подготовке сейлзов к сложным переговорам задавать «характер» модели - например, «комдир из 90х, который звонит тебе и кроет матом» (реальная история из моей жизни). Еще очень прикольный прием, как во время обучения моедли они спецом «заражают» модель небольшими дозами нежелательных черт, чтобы «привить» у нее иммунитет к ним о__О В общем, еще один шаг в сторону механистического понимания AI, а значит более тонкого управления им.
Почему AI иногда будто «встал не с той ноги»? Вы наверное замечали, как порой…
Из этого канала
- #1352До чего дошел прогресс ... до невиданных чудес: Опустился на глубины и поднялся…
До чего дошел прогресс ... до невиданных чудес: Опустился на глубины и поднялся до небес.
- #1353Благодаря вам перевалили за 10К подписчиков в YouTube - спасибо за поддержку!…
Благодаря вам перевалили за 10К подписчиков в YouTube - спасибо за поддержку! Топ видео за все время: 1) AI Product Engineer - Алматы 2) От идеи до прототипа…
- #1354Монетизация AI продукта - эксперимент с AI коучем На прошлом занятии AI Founder…
Монетизация AI продукта - эксперимент с AI коучем На прошлом занятии AI Founder провел эксперимент: вместо лекции - диалог с AI коучем по монетизации с моими…
- #1350GenAI S2E3 - Анонс Пора очередного вебинара со всем новым в AI за последние 2…
GenAI S2E3 - Анонс Пора очередного вебинара со всем новым в AI за последние 2 месяца - 6 авг в 19 мск, записываемся тут: https://lu.ma/cscx9xti P.S.
- #1349Как согрешить? Есть 1 грех, который совершает почти каждый молодой специалист.…
Как согрешить? Есть 1 грех, который совершает почти каждый молодой специалист. Включая меня. Винить в своих решениях и поступках других.