Теперь не нужно ждать часами пока сбилдится Flash Attention 🤗 запилили репозиторий кернелов, которые они сбилдили под кучу сочетаний видеокарт, ОС и версий PyTorch. Прирост по сравнению с автоматически сгенерированными кернелами вплоть до 2.5x, всё совместимо с torch.comple(). huggingface.co/kernels @ai_newz