Создатели Reinforcement Learning получили премию Тьюринга! Эндрю Барто и Ричард Саттон разработали кучу основополагающих алгоритмов в RL. Они же потом и написали лучшую и самую влиятельную книгу по RL (рекомендую!), которую процитировали 75к+ раз. RL в последнее время на большом хайпе, и используется как в тренировке LLM так и в диффузии и робототехнике. Премия Тьюринга — самая влиятельная премия в мире информатики, с которой идёт денежное вознаграждение в миллион долларов. Её в 2018 ещё получили Ян Лекун, Джеффри Хинтон и Йошуа Бенжио за deep learning. Кстати, сейчас Саттон работает вместе с Джоном Кармаком над его стартапом Keen Technologies. Для тех кто не знает, Кармак — главный программист Doom, Quake, Wolfenstein 3D и бывший CTO Oculus, в 2022 году он ушёл из Meta чтобы самостоятельно работать над AGI. @ai_newz
Создатели Reinforcement Learning получили премию Тьюринга! Эндрю Барто и Ричард…
Из этого канала
- #3721Artificial Analysis протестили QwQ 32B Модель показала себя очень хорошо для…
Artificial Analysis протестили QwQ 32B Модель показала себя очень хорошо для своего размера — местами она отстаёт лишь от o3-mini.
- #3723Hunyuan Image2Video Tencent подсуетились и следом за WAN 2.1 выложили код и…
Hunyuan Image2Video Tencent подсуетились и следом за WAN 2.1 выложили код и веса img2video функционала для своей базовой модельки в 13B параметров.
- #3724"Нейродайджест за неделю (#59) LLM - +3.5 миллиарда в Anthropic – компания…
"Нейродайджест за неделю (#59) LLM - +3.5 миллиарда в Anthropic – компания наращивает капитал ""маленькими"", но частыми раундами, и вот зачем.
- #3718AI для обработки звонков Я уже писал о том, как топовые компании используют…
AI для обработки звонков Я уже писал о том, как топовые компании используют AI/ML в своей деятельности.
- #3717QwQ 32B Новый опенсорс от команды Qwen из Alibaba (не путать с QwQ-Preview, это…
QwQ 32B Новый опенсорс от команды Qwen из Alibaba (не путать с QwQ-Preview, это совсем другая модель).