Вот это 20 минутное видео я разослал всем командам, которые я курирую в области внедрения AI в бизнес, чтобы они обязательно его посмотрели. YouTube __Я это видео упоминал ____в прошлом посте____, но там оно могло затеряться. __ Если кратко, то всякие агенты и прочие архитектуры с LLM под капотом могут очень много. Это обусловливает весь хайп. Достаточно просто сделать на коленке очень классный прототип, который даст правильный ответ на сложный вопрос. Проблема в том, что бизнесу обычно нужна надежная система, которая будет стабильно давать правильные ответы на сложные вопросы. И разработка такой системы требует совершенно иных подходов. Это уже не capability engineering, а reliability engineering. Люди, которые работают с распределенными системами знают, что, скажем, очень просто добиться работы серверной системы (аптайма) в 90% или даже 99%. Но требуется совершенно иной инженерный подход для повышения аптайма до 99.999%. Аналогично и с системами с LLM под капотом. Очень просто сделать чатбота, который сможет правильно ответить на несколько вопросов. Но на порядки сложнее сделать систему, которая будет стабильно корректно отвечать на все разнообразные вопросы пользователей. Как раз про стабильность систем, способы оценки и рассказывает это видео. - Evaluating Agents is hard - Static benchmarks can be misleading - LLM systems are about reliability engineering, not capability engineering Очень советую выделить 20 минут времени для его просмотра. Это поможет сэкономить гораздо больше времени на проектах в будущем https://www.youtube.com/watch?v=d5EltXhbcfA Ваш, @llm_under_hood 🤗
Вот это 20 минутное видео я разослал всем командам, которые я курирую в области…
Из этого канала
- #559Как системно внедрять LLM в бизнес без галлюцинаций? Для engineering leads. Что…
Как системно внедрять LLM в бизнес без галлюцинаций? Для engineering leads. Что делать компании среднего размера, которая попробовала решить несколько проблем…
- #560"История про AI R&D Lab Pass У меня есть несколько клиентов-компаний, которые…
"История про AI R&D Lab Pass У меня есть несколько клиентов-компаний, которые внедряют LLM в бизнес в EU/USA.
- #561"Наш чатбот популярен, но как жить дальше? Кейс. В одной компании сделали…
"Наш чатбот популярен, но как жить дальше? Кейс. В одной компании сделали внутреннего чат-бота для крупной организации, он стал популярным, им пользуются…
- #556"7 выводов о внедрении AI в бизнес на примерах крупных компаний TLDR; начинаем…
"7 выводов о внедрении AI в бизнес на примерах крупных компаний TLDR; начинаем со сбора evals Если кто знает больше всего про то, как внедрять OpenAI в бизнес,…
- #555Нас не волнует то, чего мы не знаем. LLM тоже На фотографии - McArthur Wheeler,…
Нас не волнует то, чего мы не знаем. LLM тоже На фотографии - McArthur Wheeler, который в 1995 году ограбил два банка. Он это делал даже без маски, т.к.