Свежак от DeepSeek https://github.com/deepseek-ai/TileKernels Tile Kernels Optimized GPU kernels for LLM operations, built with TileLang. TileLang is a domain-specific language for expressing high-performance GPU kernels in Python, featuring easy migration, agile development, and automatic optimization. Most kernels in this project approach the limit of hardware performance regarding the compute intensity and memory bandwidth. Some of them have already been used in internal training and inference scenarios. However, they do not represent best practices and we are actively working on improving the code quality and documentation.
Свежак от DeepSeek https://github.com/deepseek-ai/TileKernels Tile Kernels…
Из этого канала
- #5236Про важность харнесса на примере Клод Кода:…
Про важность харнесса на примере Клод Кода: https://www.anthropic.com/engineering/april-23-postmortem Продолжение темы https://t.me/gonzoML/5209
- #5237Разбор архитектуры свежего DeepSeek-V4. Впечатляет вот это: на контексте в…
Разбор архитектуры свежего DeepSeek-V4. Впечатляет вот это: на контексте в миллион токенов V4 требует всего 27% FLOPs при инференсе одного токена и лишь 10%…
- #5247Интересное на подумать. Generalization at the Edge of Stability Mario Tuci,…
Интересное на подумать. Generalization at the Edge of Stability Mario Tuci, Caner Korkmaz, Umut Şimşekli, Tolga Birdal Статья:…
- #5232"Шажок на пути к автоматической науке GIANTS: Generative Insight Anticipation…
"Шажок на пути к автоматической науке GIANTS: Generative Insight Anticipation from Scientific Literature Joy He-Yueya, Anikait Singh, Ge Gao, Michael Y.
- #5228Прикольный подход к оценке моделей через тензорные разложения. Для 3D тензора…
Прикольный подход к оценке моделей через тензорные разложения. Для 3D тензора <навык модели> <сложность промпта> <особенности оценщика> мы сначала выучиваем…