Brand new 2025 AI Index Report is released! https://hai.stanford.edu/ai-index/2025-ai-index-report
Brand new 2025 AI Index Report is released!…
Из этого канала
- #3561Вчера в разборе Multi-Token Attention упоминалась статья про Differential…
Вчера в разборе Multi-Token Attention упоминалась статья про Differential Transformer.
- #3563Пообщались с Иваром Максутовым и Постнаукой о ~~хренах и пряниках~~ разном
Пообщались с Иваром Максутовым и Постнаукой о ~~хренах и пряниках~~ разном
- #3564Что ждёт профессии, связанные с переводами, в ближайшие годы? Каким станет…
Что ждёт профессии, связанные с переводами, в ближайшие годы? Каким станет мышление и коммуникация в эпоху AI? Как LLM справляются с пониманием языка?…
- #3548Head mixing convolution позволяет перемешивать внимание между разными головами…
Head mixing convolution позволяет перемешивать внимание между разными головами в пределах одного временного шага.
- #3547Multi-Token Attention Olga Golovneva, Tianlu Wang, Jason Weston, Sainbayar…
Multi-Token Attention Olga Golovneva, Tianlu Wang, Jason Weston, Sainbayar Sukhbaatar Статья: https://arxiv.org/abs/2504.00927 Продолжаем разборы архитектур.