⚡️ Speculative Speculative Decoding (SSD) Tanishq Kumar вместе с Tri Dao и Avner May представили новый алгоритм инференса, который ускоряет генерацию текста до 2× по сравнению с лучшими SD-движками. Проблема классического SD - черновая модель простаивает, пока целевая верифицирует токены. Железо есть, а работы нет. SSD это фиксит: пока большая модель проверяет - маленькая уже предсказывает исходы и готовит следующую цепочку. Если угадала, токены выдаются мгновенно. Ошиблась, откат к стандартному SD без потери качества 🎯 Оптимизированная версия алгоритма называется Saguaro и показывает: - до 2× быстрее лучших бейзлайнов классического SD - до 5× быстрее стандартного авторегрессионного декодирования - нулевые потери качества генерации 🔒 📄 Статья (март 2026) 💻 GitHub 🐦 Твит
⚡️ Speculative Speculative Decoding (SSD) Tanishq Kumar вместе с Tri Dao и…
Из этого канала
- #6267на какие задачи его можно отправлять ?
на какие задачи его можно отправлять ?
- #6268Простеньки утилиты на уровни калулятора или простой лейдинг сможет сделать ?
Простеньки утилиты на уровни калулятора или простой лейдинг сможет сделать ?
- #6269это клон Claude Code, живёт в том же терминале что и Claude Code, абсолютно…
это клон Claude Code, живёт в том же терминале что и Claude Code, абсолютно такие же задачи, есть много сравнения frontend'a: z.ai vs Codex vs Claude etc -…
- #6263A CPU that runs entirely on GPU — registers, memory, flags, and program counter…
A CPU that runs entirely on GPU — registers, memory, flags, and program counter are all tensors. Every ALU operation is a trained neural network.
- #6262"""Real data"" эт вообще ужасно смешно"
"""Real data"" эт вообще ужасно смешно"