Стратегия использования с позиции CIO/CTO Давайте на основе этой встречи попробуем провести SWOT-анализ и построить достаточно универсальную стратегию действий. Сильные стороны ▪️Открытые модели достигли сравнимого (условно) уровня с закрытыми ▪️Железо перестало быть барьером ▪️Начинает оформляться рабочая (не уровня хайпа) методология работы, базовые процессы уже можно брать в работу Слабые стороны ▪️Отсутствие массовой внутренней экспертизы (в технически сложных вещах, связанных именно с самими моделями и организации инфраструктуры под них) ▪️Инвестиции в CAPEX/OPEX, требуют расчетов в каждом отдельном случае, но точно не нулевые ▪️Риск концентрации знаний (уйдет один ключевой инженер и рухнет вся инфраструктура) ▪️Большинство команд не умеет работать с агентами как с продуктом Возможности ▪️Конкурентное окно 2026–2027 (ранние выигрывают, поздние догоняют) ▪️Сокращение продуктовых команд при росте эффективности к 2027 (гипотеза) ▪️Данные остаются внутри как стратегический актив ▪️Регуляторный арбитраж (регуляторные требования делают локальный инференс обязательным) Угрозы ▪️Vendor lock: OpenAI/Anthropic сейчас субсидируют цены на токены, рыночные цены появятся позже ▪️Сокращение людей до выстраивания процессов означает потерять контекст навсегда ▪️Железо 2026 года может устареть за год ▪️Доступ к железу (тех же Nvidia) и облачным моделям может быть ограничен по политическим причинам Очевидным образом выстраивается стратегия на своего рода AI-суверенитет: «способность работать независимо от любого внешнего провайдера на горизонте 3 лет». Я вообще не вижу других вариантов 🙂 Причем это справедливо и на уровне отдельного человека и на уровне компании и на уровне государства. Черновик стратегии широкими мазками Этап 1 - пилот 1. Выделить 2–3 senior-инженера в AI Platform Team для строительства инфры 2. Поднять пилотный кластер 3. Запустить модель (например - Qwen3.5-122B) на внутренних задачах: code review, документация, внутренний RAG 4. Параллельно использовать облачные модели, без резких движений Этап 2 - методология и масштабирование опыта 1. Выработать базовую методологию работу с агентами и использовать только ее (важно дисциплинированное развитие) 2. Выработать метод определения критичности и распределить процессы по уровням критичности (только локальный инференс, локально + облако, облако без ограничений) 3. Развернуть второй кластер под критичные процессы для отработки процесса 4. Никого не увольнять, переводить инженеров в роль AI-операторов (формирование промптов, валидация агентов, владение доменным контекстом и тд) Этап 3 - оптимизация 1. (Только) органическое сокращение команд (т.е. не увольнять, а остановить найм) 2. Оценить CAPEX/OPEX по архитектуре 3. Выстроить мультимодельную независимость (без привязки к одному провайдеру, даже локально по модели) Ну а для себя - чем раньше развернуть локально (дома) модель для экспертиментов, тем лучше. Добиться 20-30 токенов в секунду локально вполне реально.
Стратегия использования с позиции CIO/CTO Давайте на основе этой встречи…
Из этого канала
- #736Единая модель данных и сами данные Сейчас идет интересный проект с внутренней…
Единая модель данных и сами данные Сейчас идет интересный проект с внутренней платформой в организации.
- #737Роль архитектора в условиях нарастающей ИИ-автоматизации Сегодня прошел…
Роль архитектора в условиях нарастающей ИИ-автоматизации Сегодня прошел очередной блок Школы Архитекторов и у меня оформилась, как мне кажется, корневая идея,…
- #738Новый кейс в архитектурных этюдах «Бонусы в архитектуре процессинга»…
Новый кейс в архитектурных этюдах «Бонусы в архитектуре процессинга» https://t.me/archicases/8989/8990
- #734Поздравляю. Все заблокировали, создали SPOF, пользуйтесь VK. Только VK уже…
Поздравляю. Все заблокировали, создали SPOF, пользуйтесь VK. Только VK уже неделю не работает (не только у меня).
- #732ИИ в разработке на локальном инференсе Вчера встретились небольшой группой…
ИИ в разработке на локальном инференсе Вчера встретились небольшой группой обсудить итоги практических экспериментов по использованию локального инференса для…