"Как добиться разнообразия в ответах chatGPT? Я как-то шерил промпт для генерации 100 идей продуктов, но некоторые жаловались, что многие идеи повторяются, не особо оригинальны. Сегодня узнал про verbalized sampling, как с помощью простого хака в промпте улучшить разнообразие —> нужно добавить перед задачкой формулировку а-ля <instruction> Generate 5 responses to the user query, each within a separate <response> tag. Each <response> must include a <text> and a numeric <probability>. Randomly sample the responses from the full distribution. </instruction> Почему это происходит? Некоторые из вас знают, что после тренировки есть этап RLHF, где люди дотренировывают LLM-ку, выбирая более предпочтительные ответы. Ну так вот, люди в этих выборах предпочитают более ~~скучные~~ ""знакомые"" ответы, и поэтому LLMки в итоге такие же выдают нам. Задавая же такой промпт, мы просим генерить несколько ответов и рандомно выбирать их из распределения. Более того, мы можем попросить выдать только варианты с низкой вероятностью (см ниже) Насколько разнообразнее? Ресерчеры обещают: в 1.5-2 раза более разнообразные истории, более правдоподобные диалоги (важно для виртуальных опросов и ролевых игр), и более разнообразные синтетические данные для тестирования ваших агентов и продуктов. Мои тесты На моем промпте генерации идей я не особо заметил разницы, если честно —> возможно, потому что у меня там есть гайдлайны а-ля "" не повторяйся"", ""важно быть оригинальным"" и т.п. Но я попробовал чуть подкрутить промпт, чтобы он выдавал варианты с низкими вероятностями: <instruction> sample at random from the full distribution, such that the probability of each idea is below 0.10"" </instruciton> И так стало сильно интереснее! Но, если честно, больше всего мне это понравилось в контексте генерации картинок и видео - см примеры в аттаче. Сначала с этой инструкцией я генерю промпты аля <instruction> Generate 5 responses to the user query, each within a separate <response> tag. Each <response> must include a <text> and a numeric <probability>. Randomly sample the responses from the full distribution and only output responses with probability <0.10. </instruction> write prompt for video generation llm for ""astronaut riding a horse"" А потом уже каждый промпт загоняю в nanobanana/veo3/sora2. В общем, интересный подход, будем юзать для повышения output-а LLMок"
"Как добиться разнообразия в ответах chatGPT? Я как-то шерил промпт для…
Из этого канала
- #1478"Про доверие, полезное знание, и Нобелевку Помните, я писал о доверии и разнице…
"Про доверие, полезное знание, и Нобелевку Помните, я писал о доверии и разнице между оным к ""неизвестным другим"" между США и Россией? Когда я узнал, за что…
- #1479Учим Claude уму разуму или Claude Skills Помните, как в матрице Нео скачивает…
Учим Claude уму разуму или Claude Skills Помните, как в матрице Нео скачивает скиллы и фигачит в кунгфу и не только? Anthropic выпустил нечто похожее, но…
- #1484Запись встречи GenAI S2E4 А вот и запись встречи по ключевым апдейтам GenAI с…
Запись встречи GenAI S2E4 А вот и запись встречи по ключевым апдейтам GenAI с середины августа: https://youtu.be/hW4yNAlUMt8 - enjoy!
- #1474Chain-of-Frames или gpt-3 момент для визуала Вы наверное уже в своих фидах…
Chain-of-Frames или gpt-3 момент для визуала Вы наверное уже в своих фидах ощутили волну видео контента, запущенного veo3 & sora? Ну точно видели фаундера,…
- #1473VCBench: предсказываем успех фаундера Коль есть такие бенчмарки как SWEBench -…
VCBench: предсказываем успех фаундера Коль есть такие бенчмарки как SWEBench - для оценки качества кодинга LLM-ками - то пора бы уже сделать и бенчмарки для…