"Как добиться разнообразия в ответах chatGPT? Я как-то шерил промпт для генерации 100 идей продуктов, но некоторые жаловались, что многие идеи повторяются, не особо оригинальны. Сегодня узнал про verbalized sampling, как с помощью простого хака в промпте улучшить разнообразие —> нужно добавить перед задачкой формулировку а-ля <instruction> Generate 5 responses to the user query, each within a separate <response> tag. Each <response> must include a <text> and a numeric <probability>. Randomly sample the responses from the full distribution. </instruction> Почему это происходит? Некоторые из вас знают, что после тренировки есть этап RLHF, где люди дотренировывают LLM-ку, выбирая более предпочтительные ответы. Ну так вот, люди в этих выборах предпочитают более ~~скучные~~ ""знакомые"" ответы, и поэтому LLMки в итоге такие же выдают нам. Задавая же такой промпт, мы просим генерить несколько ответов и рандомно выбирать их из распределения. Более того, мы можем попросить выдать только варианты с низкой вероятностью (см ниже) Насколько разнообразнее? Ресерчеры обещают: в 1.5-2 раза более разнообразные истории, более правдоподобные диалоги (важно для виртуальных опросов и ролевых игр), и более разнообразные синтетические данные для тестирования ваших агентов и продуктов. Мои тесты На моем промпте генерации идей я не особо заметил разницы, если честно —> возможно, потому что у меня там есть гайдлайны а-ля "" не повторяйся"", ""важно быть оригинальным"" и т.п. Но я попробовал чуть подкрутить промпт, чтобы он выдавал варианты с низкими вероятностями: <instruction> sample at random from the full distribution, such that the probability of each idea is below 0.10"" </instruciton> И так стало сильно интереснее! Но, если честно, больше всего мне это понравилось в контексте генерации картинок и видео - см примеры в аттаче. Сначала с этой инструкцией я генерю промпты аля <instruction> Generate 5 responses to the user query, each within a separate <response> tag. Each <response> must include a <text> and a numeric <probability>. Randomly sample the responses from the full distribution and only output responses with probability <0.10. </instruction> write prompt for video generation llm for ""astronaut riding a horse"" А потом уже каждый промпт загоняю в nanobanana/veo3/sora2. В общем, интересный подход, будем юзать для повышения output-а LLMок"