🧠 CNNs / Vision 11. ImageNet Classification with Deep Convolutional Neural Networks (https://proceedings.neurips.cc/paper_files/paper/2012/file/c399862d3b9d6b76c8436e924a68c45b-Paper.pdf) — Krizhevsky et al., 2012 (AlexNet) 12. Deep Residual Learning for Image Recognition (https://arxiv.org/abs/1512.03385) — He et al., 2015 (ResNet) 13. Identity Mappings in Deep Residual Networks (https://arxiv.org/abs/1603.05027 — He et al., 2016 (ещё ResNet) Классика, да. Для исторической справедливости добавил бы: *. Highway Networks (https://arxiv.org/abs/1505.00387) — Шмидхубер и ко, 2015 14. Multi-Scale Context Aggregation by Dilated Convolutions (https://arxiv.org/abs/1511.07122 ) — Yu & Koltun, 2015 Я бы к этому добавил про раздельные свёртки от Франсуа Шолле: *. Xception: Deep Learning with Depthwise Separable Convolutions (https://arxiv.org/abs/1610.02357) — Chollet, 2016 А ещё по зрению имхо маст: *. A Neural Algorithm of Artistic Style (https://arxiv.org/abs/1508.06576) от Леона Гатиса, 2015. Если бы не было этой работы, не было бы Призмы и многого другого. И она красивая внутри, до неё я как-то не думал, что для получения лосса можно использовать другие нейросети. 15. CS231n: CNNs for Visual Recognition (http://cs231n.stanford.edu/) — Stanford курс (2017) Да, курс божественный. Более поздний CS224N по NLP тоже того стоит: *. CS224N: Natural Language Processing with Deep Learning (https://web.stanford.edu/class/cs224n/) И конечно надо добавить Vision Transformer, ViT: *. An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale (https://arxiv.org/abs/2010.11929) — Лёша Досовицкий и другие, 2020, это мы даже разбирали (https://t.me/gonzo_ML/434)
🧠 CNNs / Vision 11. ImageNet Classification with Deep Convolutional Neural…
Из этого канала
- #4729🧮 Теория, описания, обучение 16. Keeping the Neural Network Simple via MDL…
🧮 Теория, описания, обучение 16. Keeping the Neural Network Simple via MDL (https://www.cs.toronto.edu/~hinton/absps/colt93.pdf) — Hinton & van Camp, 1993 17.
- #4730🔬 Архитектура / масштабирование / продвинутое обучение 22. GPipe: Efficient…
🔬 Архитектура / масштабирование / продвинутое обучение 22. GPipe: Efficient Training of Giant Neural Networks using Pipeline Parallelism…
- #4731🗣 Speech / Multimodality 27. Deep Speech 2: End-to-End Speech Recognition in…
🗣 Speech / Multimodality 27. Deep Speech 2: End-to-End Speech Recognition in English and Mandarin (https://arxiv.org/abs/1512.02595 ) — Amodei et al., 2016 —…
- #4727🎯 Attention / Transformers 8. Neural Machine Translation by Jointly Learning to…
🎯 Attention / Transformers 8. Neural Machine Translation by Jointly Learning to Align and Translate (https://arxiv.org/abs/1409.0473) — Bahdanau et al., 2015…
- #4726"🔁 RNN / LSTM / Sequence Models 1. The Unreasonable Effectiveness of Recurrent…
"🔁 RNN / LSTM / Sequence Models 1. The Unreasonable Effectiveness of Recurrent Neural Networks (http://karpathy.github.io/2015/05/21/rnn-effectiveness/) — A.