🧠 CNNs / Vision 11. ImageNet Classification with Deep Convolutional Neural Networks (https://proceedings.neurips.cc/paper_files/paper/2012/file/c399862d3b9d6b76c8436e924a68c45b-Paper.pdf) — Krizhevsky et al., 2012 (AlexNet) 12. Deep Residual Learning for Image Recognition (https://arxiv.org/abs/1512.03385) — He et al., 2015 (ResNet) 13. Identity Mappings in Deep Residual Networks (https://arxiv.org/abs/1603.05027 — He et al., 2016 (ещё ResNet) Классика, да. Для исторической справедливости добавил бы: *. Highway Networks (https://arxiv.org/abs/1505.00387) — Шмидхубер и ко, 2015 14. Multi-Scale Context Aggregation by Dilated Convolutions (https://arxiv.org/abs/1511.07122 ) — Yu & Koltun, 2015 Я бы к этому добавил про раздельные свёртки от Франсуа Шолле: *. Xception: Deep Learning with Depthwise Separable Convolutions (https://arxiv.org/abs/1610.02357) — Chollet, 2016 А ещё по зрению имхо маст: *. A Neural Algorithm of Artistic Style (https://arxiv.org/abs/1508.06576) от Леона Гатиса, 2015. Если бы не было этой работы, не было бы Призмы и многого другого. И она красивая внутри, до неё я как-то не думал, что для получения лосса можно использовать другие нейросети. 15. CS231n: CNNs for Visual Recognition (http://cs231n.stanford.edu/) — Stanford курс (2017) Да, курс божественный. Более поздний CS224N по NLP тоже того стоит: *. CS224N: Natural Language Processing with Deep Learning (https://web.stanford.edu/class/cs224n/) И конечно надо добавить Vision Transformer, ViT: *. An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale (https://arxiv.org/abs/2010.11929) — Лёша Досовицкий и другие, 2020, это мы даже разбирали (https://t.me/gonzo_ML/434)