Project Deal: Anthropic сделали внутренний маркетплейс, где все сделки от имени людей совершали Claude-агенты Ранее они уже проводили эксперимент Project Vend, когда агент управлял маленьким вендинговым автоматом (подробнее). Теперь же Anthropic хотят понять, насколько мы близки к целым рынкам с множеством продавцов-агентов и покупателей-агентов. В проекте участвовали 69 сотрудников. Каждому из них выдали личного агента и 100 долларов бюджета. Агенты получали от владельцев инструкции: что примерно человек хотел бы купить и продать, за сколько, уместен ли торг и тд. После получения инструкций агенты уходили полностью автономно жить на маркетплейсе и тратить/зарабатывать деньги. В итоге агенты за короткий срок заключили 186 сделок по 500 товарам, общая сумма транзакций превысила $4000. Кстати, потом сотрудники реально принесли вещи и обменялись ими в офисе. Оказалось, что качество модели напрямую влияет на ее способность торговаться. Opus в среднем заключал примерно на две сделки больше, чем Haiku, продавал те же товары дороже и как покупатель платил меньше. Например, один и тот же сломанный складной велосипед Haiku продал за $38, а Opus – за $65. Были, конечно, и смешные моменты. Один сотрудник разрешил Claude купить подарок самому себе, и агент выбрал 19 шариков для пинг-понга за $3, назвав их «сферическими орбами возможностей». Другой агент внезапно продал не вещь, а день с собакой сотрудницы (люди потом действительно это устроили, деньги-то уплачены). www.anthropic.com/features/project-deal
Project Deal: Anthropic сделали внутренний маркетплейс, где все сделки от имени…
Из этого канала
- #9111Новая обложка The Economist Как вам? 💪
Новая обложка The Economist Как вам? 💪
- #9112За любой big data-инфраструктурой стоит большая команда. На митапе к трехлетию…
За любой big data-инфраструктурой стоит большая команда. На митапе к трехлетию выхода YTsaurus в опенсорс Максим Бабенко, руководитель отдела технологий…
- #9113А это уже AGI? Без комментариев, просто ответ нового DeepSeek V4 на простую…
А это уже AGI? Без комментариев, просто ответ нового DeepSeek V4 на простую задачку с подвохом: – Как разделить четыре одинаковых апельсина поровну между…
- #9109~5% запросов к Алисе обрабатываются с ошибками распознавания речи По статистике…
~5% запросов к Алисе обрабатываются с ошибками распознавания речи По статистике это небольшой процент.
- #9108Google вложит до 40 миллиардов долларов в Anthropic 10 миллиардов они заплатят…
Google вложит до 40 миллиардов долларов в Anthropic 10 миллиардов они заплатят сразу, и еще 30 – в будущем, при условии достижения определенных целей…