Отличная и редкая статья - с глубоким техническим и практическим погружением в…

1 июн. 2026 г.861 views29 forwardsОткрыть в Telegram →

Отличная и редкая статья - с глубоким техническим и практическим погружением в проблему скорости инференса. Не общие слова про «мы внедрили ИИ», а конкретика: continuous batching, admission control, выбор движка под нагрузку (vLLM на старт, SGLang в прод с длинным контекстом) - всё на примерах из боевых проектов, с цифрами по latency и GPU. Много утащил себе в заметки и вам рекомендую. https://habr.com/ru/companies/otus/articles/1031286/

Источник

https://t.me/cdo_club/2888

Канал Клуб CDO · опубликовано 1 июн. 2026 г.

Из этого канала