🗣 Speech / Multimodality 27. Deep Speech 2: End-to-End Speech Recognition in English and Mandarin (https://arxiv.org/abs/1512.02595 ) — Amodei et al., 2016 — Вот ведь как судьба повернулась, работал Дарио на Байду, а теперь за ограничение чипов Китаю :) Это было так давно, что эту работу я уже не очень помню. Но мне кажется, что стоило бы добавить WaveNet: *. WaveNet: A Generative Model for Raw Audio (https://arxiv.org/abs/1609.03499) — Дипмайнд, 2016. Что с остальными 13 позициями? Есть различные собранные версии (https://tensorlabbet.com/2024/11/11/lost-reading-items/). В листе нет ни одного reinforcement learning-пейпера, что странно — возможно, они были в утерянной части. Тогда точно стоило бы добавить много чего, но как минимум: *. Playing Atari with Deep Reinforcement Learning (https://arxiv.org/abs/1312.5602) — классика DRL от DM, 2013 *. Mastering the game of Go with deep neural networks and tree search (https://www.nature.com/articles/nature16961) — классический AlphaGo *. Mastering the game of Go without human knowledge (https://www.nature.com/articles/nature24270) — AlphaGo Zero, учившийся уже без человеческих демонстраций *. Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm (https://arxiv.org/abs/1712.01815) — AlphaZero, учившийся без человеческих демонстраций нескольким разным играм Для RL, думаю, отдельный список нужен, я сам им не то чтобы прям много занимался, но там точно ещё много чего важного. Нет и мета-обучения. Наверняка должен был быть какой-нибудь MAML (https://arxiv.org/abs/1703.03400) и что-нибудь ещё. Но этим я тоже мало занимался. Наверное, я бы и про эволюционные алгоритмы чуток добавил, это тоже достойно отдельного разбора, но по крайней мере классика, которую за последнее время уже неоднократно упоминали: *. Evolution Strategies as a Scalable Alternative to Reinforcement Learning (https://arxiv.org/abs/1703.03864) — тоже кстати с участием Суцкевера. Но это всё только догадки. В любом случае, даже по современным меркам список всё ещё неплохой. Мы канал завели заметно после того, как вышла большая часть этих статей, так что их разборов у нас не найдёте. Читайте оригиналы! В то время они были короче, чем нынче :) А я пойду поиграю в Дум.
🗣 Speech / Multimodality 27. Deep Speech 2: End-to-End Speech Recognition in…
Из этого канала
- #4733Интересная работа, при этом мне кажется очень полезная для large-scale…
Интересная работа, при этом мне кажется очень полезная для large-scale оптимизации и ускорения исследований.
- #4739"Симбиогенез в массы! С одной стороны, прикольная библиотека для всего в одном…
"Симбиогенез в массы! С одной стороны, прикольная библиотека для всего в одном месте.
- #4744"Ещё один обзор про память агентов. Другой обзор был в декабре…
"Ещё один обзор про память агентов. Другой обзор был в декабре (https://t.me/gonzoML/4415), тоже от китайской команды.
- #4730🔬 Архитектура / масштабирование / продвинутое обучение 22. GPipe: Efficient…
🔬 Архитектура / масштабирование / продвинутое обучение 22. GPipe: Efficient Training of Giant Neural Networks using Pipeline Parallelism…
- #4729🧮 Теория, описания, обучение 16. Keeping the Neural Network Simple via MDL…
🧮 Теория, описания, обучение 16. Keeping the Neural Network Simple via MDL (https://www.cs.toronto.edu/~hinton/absps/colt93.pdf) — Hinton & van Camp, 1993 17.