Интересная архитектурная инновация: трилинейное внимание, где каждому Q соответствует не один K, а два разных. Ценный бонус — более хорошая экспонента для скейлинга, что значит можно обучать более хорошие модели на том же количестве данных. https://t.me/gonzo_ML_podcasts/436
Интересная архитектурная инновация: трилинейное внимание, где каждому Q…
Из этого канала
- #3812https://t.me/gonzoMLpodcasts/439
https://t.me/gonzoMLpodcasts/439
- #3813И прекрасного пятничного вам в ленту!
И прекрасного пятничного вам в ленту!
- #3814В шаббат разбирать статьи не будем, но вот вам на почитать, если ещё не видели.…
В шаббат разбирать статьи не будем, но вот вам на почитать, если ещё не видели. Шмидхубух про историю современного AI.
- #3809Популярная новость сегодняшнего дня :)…
Популярная новость сегодняшнего дня :) https://www.reuters.com/business/ai-slows-down-some-experienced-software-developers-study-finds-2025-07-10/ Before the…
- #3808А вот и Эндрю Ын подоспел! https://youtu.be/RNJCfif1dPY
А вот и Эндрю Ын подоспел! https://youtu.be/RNJCfif1dPY