"В сведенной статье от Pragmatic Engineer - The Pulse: token spend breaks budgets – what next? (Расходы на AI-токены выходят из-под контроля) рассказывают насколько проблема токенов становиться острой. __Расходы на токены у многих компаний выросли до 10 раз за последние месяцы. Автор опросил сотрудников 15 компаний и выявил два лагеря: 1. ”Let it rip and measure"" — дать командам использовать AI без ограничений, потом смотреть на метрики. Так чаще поступают крупные компании, где операционная гибкость важнее экономии. 2. ”Curbing spending"" — активное управление расходами и оптимизация использования токенов. Этим занимаются небольшие компании, которые либо оптимизируют потребление, либо закладывают больший бюджет. Общий консенсус: рост продуктивности оправдывает расходы, даже если они высоки. Среди популярных способов оптимизации — переключение на более дешёвые модели для рутинных задач, кэширование промптов и лимиты на уровне команд. По сути, статья фиксирует момент, когда AI из ""эксперимента"" превратился в реальную статью операционных расходов, с которой инженерные и финансовые команды пока не очень умеют работать.__ Я вижу такие паттерны: 1. Условно безлистный Claude Code с моделями Opus и Sonnet. Иногда использую сторонний Gateway, чтобы контролировать расходы. 2. Полный запрем на Code Assist. И тут происходит несколько сценариев: • Без AI люди пытаются что-то гуглить, что-то сами делать, что-то в Teams Copilot, бесплатном ChatGPT. Все очень медленно и плохого качества. Мне лично кажется это проблема людей, у них вообще нет мотивации учить что-то новое, как говорится - и так сойдет. • Люди полностью поддерживают запрет на AI, ведь не безопасно же, но при этом сами урвали себе за 20$ AI и что-то лепят втихушку, как будто без AI, но по факту с AI. • Использование AI на максималках, окольными путями завести модели антропика черех API ключ, и фигачат в режиме YOLO. Без AI уже как без интернета, можно не работать. 3. Есть еще промежуточный вариант, он как правило всегда с Microsoft Teams. Мне вообще кажется, если компании используют Microsoft Teams это дно для инженера, ведь стек будет соответствующий. В данном случае у вас будет бесплатный и бесполезный copilot. В целом полностью согласен - AI токены дорого. Особенно, когда это корпоративный план и там уже квоты работают по другому."
"В сведенной статье от Pragmatic Engineer - The Pulse: token spend breaks…
Из этого канала
- #5894Уверен, что меня читает много студентов с разных направлений, а у этих…
Уверен, что меня читает много студентов с разных направлений, а у этих читателей скорее всего еще и широкий круг общения.
- #5895Альтернатива Claude Code - Pi agent.
Альтернатива Claude Code - Pi agent.
- #589610 готовых шаблонов дашбордов для разных C-level ролей от Cloud.ru 🌐 В новом…
10 готовых шаблонов дашбордов для разных C-level ролей от Cloud.ru 🌐 В новом практическом руководстве эксперты Cloud.ru отвечают на вопрос, как руководителю…
- #5892Hightouch получил новый раунд инвестиций, на эти деньги они уже сняли офис в…
Hightouch получил новый раунд инвестиций, на эти деньги они уже сняли офис в San Francisco и начали хайрить куча людей.
- #5891Уже скоро можно перестать платить за токены.
Уже скоро можно перестать платить за токены.