gonzo-обзоры ML статей@gonzo_ML· 24 246 subs

Интересная архитектурная инновация: трилинейное внимание, где каждому Q…

11 июл. 2025 г.5 743 views54 forwardsОткрыть в Telegram →

Интересная архитектурная инновация: трилинейное внимание, где каждому Q соответствует не один K, а два разных. Ценный бонус — более хорошая экспонента для скейлинга, что значит можно обучать более хорошие модели на том же количестве данных. https://t.me/gonzo_ML_podcasts/436

Источник

https://t.me/gonzo_ML/3811

Канал gonzo-обзоры ML статей · опубликовано 11 июл. 2025 г.

Из этого канала

#3812https://t.me/gonzoMLpodcasts/439
https://t.me/gonzoMLpodcasts/439
#3813И прекрасного пятничного вам в ленту!
И прекрасного пятничного вам в ленту!
#3814В шаббат разбирать статьи не будем, но вот вам на почитать, если ещё не видели.…
В шаббат разбирать статьи не будем, но вот вам на почитать, если ещё не видели. Шмидхубух про историю современного AI.
#3809Популярная новость сегодняшнего дня :)…
Популярная новость сегодняшнего дня :) https://www.reuters.com/business/ai-slows-down-some-experienced-software-developers-study-finds-2025-07-10/ Before the…
#3808А вот и Эндрю Ын подоспел! https://youtu.be/RNJCfif1dPY
А вот и Эндрю Ын подоспел! https://youtu.be/RNJCfif1dPY