mini-SGLang — оптимизированный минималистичный инференс движок Кодбаза способна на полноценный инференс Qwen 3 (Dense) и Llama 3 на уровне производительности большого SGLang, в котором на два порядка больше кода. Проект предназначен как и для обучения работе современных инференс движков, так и как минималистичная кодбаза для ресёрча. В ~5,000 строк кода на Python влезают основные оптимизации SGLang и довольно много функционала. Движок поддерживает как онлайн (по OpenAI API) так и оффлайн инференс, инференс на нескольких GPU, context caching. Но в то же время многим пришлось пожертвовать — выкинули поддержку большинства моделей, поддержку MoE, поддержку AMD и т.д. Но сама идея иметь минималистичную версию проекта с такой же архитектурой для экспериментирования и онбординга новых контрибьюторов мне нравится, хотелось бы больше такого. Блогпост https://github.com/sgl-project/mini-sglang @ai_newz
mini-SGLang — оптимизированный минималистичный инференс движок Кодбаза способна…
Из этого канала
- #4339Kandinsky 5.0 Video на text-to-video арене На арене появились результаты…
Kandinsky 5.0 Video на text-to-video арене На арене появились результаты моделей Kandinsky 5.0 Video Lite и Pro. Pro-версия — ТОП-1 открытая модель в мире.
- #4341Команда Три Дао снова применяет чёрную магию оптимизации, на этот раз для…
Команда Три Дао снова применяет чёрную магию оптимизации, на этот раз для ускорения тренировки MoE.
- #4342Предлагаю ребрендинг – не АИ слоп, а эко-текст и не бездушная АИ-картинка - а…
Предлагаю ребрендинг – не АИ слоп, а эко-текст и не бездушная АИ-картинка - а эко-графика Потому что текст из LLM и генеративные АИ-картинки оставляют намного…
- #4337Вышла Gemini 3 Flash Выносит по бенчам 2.5 Pro в одни ворота, при этом будучи…
Вышла Gemini 3 Flash Выносит по бенчам 2.5 Pro в одни ворота, при этом будучи значительно дешевле. На паре бенчмарков обгоняет даже Gemini 3 Pro.
- #4334SAM-Audio: находка для шпиона Meta продолжает расширять возможности SAM…
SAM-Audio: находка для шпиона Meta продолжает расширять возможности SAM (Segment Anything Model), и теперь туда добавилась аудиомодальность.