На позапрошлой неделе у меня расходы на инференс моделей достигли $1000 в день. Пришлось все выходные экстренно заниматься оптимизацией расходов. Задача была снизить расходы на порядок-два. То есть в 10-100 раз. Желательно без потери качества. Чтобы метрики не просели сильно. Пересобрал пайплайн обработки данных, изучил поведение пользователей и поменял дефолтное-поведение в UI. В итоге за первую неделю расходы в среднем упали до 50$ в день, то есть в 20 раз. На этой неделе уже $20 в день (в 50 раз ниже). Завтра в 15:00 проведу вебинар, где расскажу про архитектуру AI-first тендерного агрегатора: bids.do Планирую рассказать и об этом опыте тоже. Регистрация доступна всем желающим по ссылке: https://datanomix.pro/bids_do-architecture
На позапрошлой неделе у меня расходы на инференс моделей достигли $1000 в день.…
Источник
https://t.me/vitaliytrenkenshu/152Канал Vitaliy Trenkenshu (Datanomix) · опубликовано 4 мар. 2026 г.
Из этого канала
- #153А у меня всё развернуто в регионе UAE как раз в Azure... Риск, что дата-центр…
А у меня всё развернуто в регионе UAE как раз в Azure... Риск, что дата-центр могут разбомбить я как-то не рассматривал. Пока все работает (https://bids.do).
- #154🔥 Разработчики AI-ready data platform, которую используют в Byte Dance (TikTok,…
🔥 Разработчики AI-ready data platform, которую используют в Byte Dance (TikTok, CapCut), Xiaomi, Baidu, Kling AI, JD.com, MiniMax объявили о партнерстве с…
- #155Пообщались с Евгением на разные темы: 00:00 - Тизер 00:35 - Вступление и…
Пообщались с Евгением на разные темы: 00:00 - Тизер 00:35 - Вступление и представление гостя 01:10 - Кто такой Виталий и чем занимается 02:20 - Бизнес в…
- #151Расскажу больше про ИИ и технологии под капотом
Расскажу больше про ИИ и технологии под капотом
- #1501000 товаров vs 50 000 тендеров: как AI автоматизирует подбор лотов…
1000 товаров vs 50 000 тендеров: как AI автоматизирует подбор лотов Масштабировать участие в госзакупках вручную — путь к выгоранию тендерного отдела.