"Предсказываем покупки с LLM Еще ~~один гвоздь в гроб ~~~~маркетинговых исследований~~ - статья о том, как при помощи LLM предсказывают покупки людей: разбираемся 1) Протестили на результатах 57 опросов по продуктам по персональному уходу (зубная паста и тп), 9300 ответов 2) Обычно в этих опросах используют шкалу Ликерта а-ля ""Я куплю этот продукт, если он появится в продаже"" от ""Точно нет"" (1) до ""Конечно да"" (5) 3) При помощи LLM генерируем виртуальных покупателей (типа того, как мы делали с юзерами) и просим их ответить по шкале. НО вот тут зарыта собака: обычно при прямом промптировании LLM на шкалу от 1 до 5, они достаточно плохо это делают (сдвинутые распределения, несоответствующие реальности). 4) Поэтому ресерчеры чуть подкрутили этот шаг: сначала они просят LLM сгенерировать текстовый ответ а-ля ""выглядит прикольно, я бы наверное попробовал, если не очень дорого и работает стабильно"", а потом по смыслу - специальным методом, который назвали Semantic-Similarity Rating - маппят эти ответы на шкалу. И сразу получилось адекватно - 90%+ корреляция результатов реальных и виртуальных покупателей. 5) Парочка ""но"": LLM-ки плохо предсказывали ответы в зависимости от пола, религии, этнической принадлежности и вероятно плохо работают с продуктами, по которым недостаточно данных/обсуждения онлайн; с доходом и возрастом же все было гуд. А я вот думаю: это реально LLMки молодцы или мы зря делаем исследования, можно было просто почитать форумы?"
"Предсказываем покупки с LLM Еще ~~один гвоздь в гроб ~~~~маркетинговых…
Из этого канала
- #1469У нас новый мерч :-)
У нас новый мерч :-)
- #1470"AI билдер от n8n Я уже показывал, как создать своего Телеграм бота за 10 мин…
"AI билдер от n8n Я уже показывал, как создать своего Телеграм бота за 10 мин на n8n, а буквально вчера учил делать AI агента для квалификации лидов.
- #1473VCBench: предсказываем успех фаундера Коль есть такие бенчмарки как SWEBench -…
VCBench: предсказываем успех фаундера Коль есть такие бенчмарки как SWEBench - для оценки качества кодинга LLM-ками - то пора бы уже сделать и бенчмарки для…
- #1466"Пульс chatGPT и Sleep Time Compute Получаю удовольствие от подборки chatGPT…
"Пульс chatGPT и Sleep Time Compute Получаю удовольствие от подборки chatGPT Pulse: очень релевантные новости и идеи, это заменило мне scheduled таски - в…
- #1463Мой первый chatGPT апп После ~~кучи геморроя~~ изучения документации и…
Мой первый chatGPT апп После ~~кучи геморроя~~ изучения документации и неработающего chatGPT получилось-таки создать свое первое chatGPT приложение.