Как SSA делает длинный контекст практичным SubQ представляет SSA — механизм внимания с субквадратичным масштабированием, который обеспечивает до 52-кратного ускорения обработки на миллионе токенов и сохраняет качество извлечения информации на уровне ведущих моделей с плотным вниманием. Читать статью