Как мы улучшили MLX Engine в LM Studio для агентных рабочих процессов LM Studio выпустила mlx-engine v1.8.5 с дисковым кэшированием KV-кэша, непрерывной пакетной обработкой для VLM и значительными улучшениями производительности — до 82% меньше потребления оперативной памяти и до 3,5x ускорения обработки повторных запросов. Читать статью