"Вышел огромный обзор ""Speed Always Wins: A Survey on Efficient Architectures for Large Language Models"": https://t.me/gonzo_ML_podcasts/699 В каком-то смысле это продолжение старой доброй “Efficient Transformers: A Survey” 2020 года (https://arxiv.org/abs/2009.06732)."
"Вышел огромный обзор ""Speed Always Wins: A Survey on Efficient Architectures…
Из этого канала
- #3949https://t.me/gonzoMLpodcasts/702
https://t.me/gonzoMLpodcasts/702
- #3950В свежем IEEE Spectrum статья про термодинамические вычисления и компанию…
В свежем IEEE Spectrum статья про термодинамические вычисления и компанию Normal Computing (писали про них тут и ранее).
- #3951DeepSeek-R2 пока всё никак не подвезут, но кажется назревает V-3.1…
DeepSeek-R2 пока всё никак не подвезут, но кажется назревает V-3.1 https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base/tree/main
- #3946Давайте я вам ещё чего-нибудь прекрасного субботнего дам. Вот например Gerard…
Давайте я вам ещё чего-нибудь прекрасного субботнего дам. Вот например Gerard 't Hooft, лауреат Нобелевской премии и Breakthrough Prize.
- #3945Кстати, прям щас начался кейноут Йоши Баха…
Кстати, прям щас начался кейноут Йоши Баха https://www.youtube.com/live/fdftA37yZJw?si=KDamycsVMbu7qjax