Стратегия использования с позиции CIO/CTO Давайте на основе этой встречи… — @blog_sb

Стратегия использования с позиции CIO/CTO Давайте на основе этой встречи попробуем провести SWOT-анализ и построить достаточно универсальную стратегию действий. Сильные стороны ▪️Открытые модели достигли сравнимого (условно) уровня с закрытыми ▪️Железо перестало быть барьером ▪️Начинает оформляться рабочая (не уровня хайпа) методология работы, базовые процессы уже можно брать в работу Слабые стороны ▪️Отсутствие массовой внутренней экспертизы (в технически сложных вещах, связанных именно с самими моделями и организации инфраструктуры под них) ▪️Инвестиции в CAPEX/OPEX, требуют расчетов в каждом отдельном случае, но точно не нулевые ▪️Риск концентрации знаний (уйдет один ключевой инженер и рухнет вся инфраструктура) ▪️Большинство команд не умеет работать с агентами как с продуктом Возможности ▪️Конкурентное окно 2026–2027 (ранние выигрывают, поздние догоняют) ▪️Сокращение продуктовых команд при росте эффективности к 2027 (гипотеза) ▪️Данные остаются внутри как стратегический актив ▪️Регуляторный арбитраж (регуляторные требования делают локальный инференс обязательным) Угрозы ▪️Vendor lock: OpenAI/Anthropic сейчас субсидируют цены на токены, рыночные цены появятся позже ▪️Сокращение людей до выстраивания процессов означает потерять контекст навсегда ▪️Железо 2026 года может устареть за год ▪️Доступ к железу (тех же Nvidia) и облачным моделям может быть ограничен по политическим причинам Очевидным образом выстраивается стратегия на своего рода AI-суверенитет: «способность работать независимо от любого внешнего провайдера на горизонте 3 лет». Я вообще не вижу других вариантов 🙂 Причем это справедливо и на уровне отдельного человека и на уровне компании и на уровне государства. Черновик стратегии широкими мазками Этап 1 - пилот 1. Выделить 2–3 senior-инженера в AI Platform Team для строительства инфры 2. Поднять пилотный кластер 3. Запустить модель (например - Qwen3.5-122B) на внутренних задачах: code review, документация, внутренний RAG 4. Параллельно использовать облачные модели, без резких движений Этап 2 - методология и масштабирование опыта 1. Выработать базовую методологию работу с агентами и использовать только ее (важно дисциплинированное развитие) 2. Выработать метод определения критичности и распределить процессы по уровням критичности (только локальный инференс, локально + облако, облако без ограничений) 3. Развернуть второй кластер под критичные процессы для отработки процесса 4. Никого не увольнять, переводить инженеров в роль AI-операторов (формирование промптов, валидация агентов, владение доменным контекстом и тд) Этап 3 - оптимизация 1. (Только) органическое сокращение команд (т.е. не увольнять, а остановить найм) 2. Оценить CAPEX/OPEX по архитектуре 3. Выстроить мультимодельную независимость (без привязки к одному провайдеру, даже локально по модели) Ну а для себя - чем раньше развернуть локально (дома) модель для экспертиментов, тем лучше. Добиться 20-30 токенов в секунду локально вполне реально.

Из этого канала