MWS Cloud запустила платформу для внедрения и работы ИИ, выйдя на рынок объемом более 15 млрд рублей. Платформа Inference Valve помогает вывести в продакшн обученные ML-модели, большие языковые модели и модели компьютерного зрения. С помощью платформы их можно разворачивать на инфраструктуре, подключать к ИТ-системам компаний через стандартные API, масштабировать, а также обновлять и мониторить. После запуска кластера специалисты заказчика загружают артефакты модели (например, ONNX, TorchScript) в платформу, после чего она автоматически формирует контейнер сервиса и публикует эндпоинт. Платформа поддерживает одновременную работу сразу с несколькими моделями с выделением квот вычислительных ресурсов, управление версиями, маршрутизацию трафика между версиями и масштабирование под нагрузку как на GPU, так и на CPU. Inference Valve также предоставляет метрики задержек и пропускной способности, мониторинг доступности, алёрты и дашборды; доступна телеметрия качества, включая отслеживание дрейфа данных и моделей, контроль целевых метрик и уведомления при деградации. Интеграция с системами наблюдаемости (Prometheus/Grafana) и журналированием запросов упрощает аудит и разбор инцидентов. По словам CEO MWS Cloud, исполнительного директора МТС Web Services Игоря Зарубинского, платформа позволяет: - В десятки раз быстрее интегрировать LLM и CV-модели с ИТ-системами компаний; - На 70% снизить операционную нагрузку на ML-команды при эксплуатации моделей; - Повысить автоматизацию CI/CD более чем на треть; - Уменьшить затраты на GPU более чем на 15%;
MWS Cloud запустила платформу для внедрения и работы ИИ, выйдя на рынок объемом…
Из этого канала
- #5357Пример data stack в компании Clair. Взял у них в Linkedin. Очень стандартный и…
Пример data stack в компании Clair. Взял у них в Linkedin. Очень стандартный и понятный кейс.
- #5358⚡Гендиректор GitHub Томас Думке уходит, чтобы вернуться к работе над…
⚡Гендиректор GitHub Томас Думке уходит, чтобы вернуться к работе над стартапами. - Microsoft не будет назначать нового CEO и полностью интегрирует GitHub в…
- #5360Для всех кто делает курсы - пример отличного pivot, как залететь в топ и…
Для всех кто делает курсы - пример отличного pivot, как залететь в топ и создавать учебный контент, собирать лайки и просмотры😃
- #5354Тут не только LinkedIn, даже все телеграмм каналы про ИТ👀
Тут не только LinkedIn, даже все телеграмм каналы про ИТ👀
- #5350Само решение достаточно не сложное, данные все хранятся в AWS S3 в Parquet.…
Само решение достаточно не сложное, данные все хранятся в AWS S3 в Parquet. Другая команда использует kinesis и пишет в S3.