Конференция M2020 - огонь. Не в смысле, что много передового AI (наше комьюнити куда передовее), а в смысле неожиданных инсайтов с полей. Например, про агентов в e-commerce и печальное состояние SotA в бизнесе. __Кстати, наверняка немало инженеров сталкивались с e-commerce: пилили сайты для магазинов, пилили что-то со складскими запасами, платежками, привинчивали платежные шлюзы, или хотя бы совершали покупки онлайн. Напишите в комментарии, если встречались. __ Так вот, сейчас в e-commerce пытаются дать агентам возможность покупать самостоятельно за людей. Вроде Agent Pay у MasterCard, Intelligent Commerce у Visa, или ещё тысячи вариантов у компаний поменьше. Чтобы агенты могли безопасно покупать и подписываться за людей - создают защищенные среды для их работы, дают отдельные ограниченные ключи, привязывают к компаниям, контролируют максимальные суммы, проверяют, что агент запускается в защищенной среде и многое другое. Единственное, что компании не делают - не проверяют поведение самих агентов на устойчивость к ошибкам, инъекциям, системному дрифту, двусмысленностям и просто новым рискам. Почему так - ещё предстоит разобраться. И если рассказать, что «а вот наша платформа, которая запускает симуляции неожиданных ситуаций в виртуальных мирах, инженеры со всего мира пилят агентов для их преодоления, и мы вместе верифицируем и анализируем их поведение», то это вызывает разные реакции. От удивления, что так можно, до острого интереса. И ведь это типично не только для e-commmerce. В большей части случаев внедрения AI/LLM в бизнес, этот самый бизнес не задумывается или не знает, что все эти системы с LLM под капотом можно тестировать, верифицировать и улучшать. Продолжаю наблюдения. Ваш, @llm_under_hood 🤗
Конференция M2020 - огонь. Не в смысле, что много передового AI (наше комьюнити…
Из этого канала
- #860"LLM Бенчмарки Qwen 3.7, GPT-5.4+, Opus 4.7+, DeepSeek V4 Пока я хожу по…
"LLM Бенчмарки Qwen 3.7, GPT-5.4+, Opus 4.7+, DeepSeek V4 Пока я хожу по конференции, вот вам неожиданный подарок от @AigizK - обновленная версия наших LLM…
- #861"Мы с COLIBRIX нашли классных партнеров на ECOM2! Правда они еще секретные и…
"Мы с COLIBRIX нашли классных партнеров на ECOM2! Правда они еще секретные и медленные, к июню раскачаться не успеют, поэтому ECOM2 перенесем на осень.
- #862Все читали про взлом аккаунтов в Instagram через агента службы поддержки? Там…
Все читали про взлом аккаунтов в Instagram через агента службы поддержки? Там подсунули боту фейковый контекст и попросили поменять почтовый адрес своего…
- #858Лечу на Money 20/20 в Амстердаме. Буду с Colibrix рассказывать про нашу…
Лечу на Money 20/20 в Амстердаме. Буду с Colibrix рассказывать про нашу платформу, верификацию агентов, искать новые кейсы и коллабы для ECOM2.
- #857"Анализ: Nous Hermes Agent + DeepSeek V4 на BitGN ECOM1 Итак, это архитектура…
"Анализ: Nous Hermes Agent + DeepSeek V4 на BitGN ECOM1 Итак, это архитектура Ивана Коновалова.