🕸️ Наткнулся на потрясающую объяснялку квантизации LLM для чайников — как разработчики уменьшают модели в 4 раза и ускоряют их двукратно, при этом почти не теряя в качестве. Автор рассказывает без воды и скучной теории, а через интерактивные визуалы — можно менять параметры квантизации и сразу видеть результат, чтобы глубже погрузиться в процесс. Мастрид на выходные — тут. @notboring_tech