https://z.ai/blog/glm-4.7 🔥
Из этого канала
- #4452Важная тема на живом примере. Переход от прототипа к продакшн-агенту…
Важная тема на живом примере. Переход от прототипа к продакшн-агенту нетривиален. Имхо это вообще одна из самих больших проблем области в моменте.
- #4455"Монстрический Tri Dao (соавтор Мамбы) и его группа снова делает хардкорные…
"Монстрический Tri Dao (соавтор Мамбы) и его группа снова делает хардкорные инженерные вещи, теперь про MoE.
- #4459Интересно как... Today, Groq announced that it has entered into a non-exclusive…
Интересно как... Today, Groq announced that it has entered into a non-exclusive licensing agreement with Nvidia for Groq’s inference technology.
- #4439Результат: бьют HRM и TRM на Sudoku, ARC-AGI-1 и ARC-AGI-2. В предыдущих…
Результат: бьют HRM и TRM на Sudoku, ARC-AGI-1 и ARC-AGI-2. В предыдущих работах ещё был Maze-Hard, здесь не сделали.
- #4438Авторы добавляют одномерную depthwise свёртку с ядром k=2 (так понимаю, текущий…
Авторы добавляют одномерную depthwise свёртку с ядром k=2 (так понимаю, текущий токен и предыдущий токен) поверх фич, уже прошедших гейт: Hconv = σ(Wdwconv…