Агенты ИИ | AGI_and_RL@AGI_and_RL· 5 852 subs

просто double DQN проходит простой уровень из марио…

10 мая 2025 г.1 768 views12 forwardsОткрыть в Telegram →

просто double DQN проходит простой уровень из марио https://www.reddit.com/r/reinforcementlearning/comments/1kidoi3/mario/

Источник

https://t.me/AGI_and_RL/1091

Канал Агенты ИИ | AGI_and_RL · опубликовано 10 мая 2025 г.

Из этого канала

#1092хм интересная штука двое ребят kalomaze (хз кто он, в иксе часто про всякое…
хм интересная штука двое ребят kalomaze (хз кто он, в иксе часто про всякое рльное пишет) и Will Brown (он одним из первых выложил пример с кодом по grpo для…
#1093Optimal Brain Damage - это когда ежедневно читаешь статьи по RL LLM агентам
Optimal Brain Damage - это когда ежедневно читаешь статьи по RL LLM агентам
#1094NVIDIA научила гуманоидных роботов двигаться, как люди - но при нулевом…
NVIDIA научила гуманоидных роботов двигаться, как люди - но при нулевом дообучении после переключения из симуляции на реальный мир Если коротко, десять лет…
#1090Полный ноль в ризонинге В смысле, что для обучению ризонингу не надо…
Полный ноль в ризонинге В смысле, что для обучению ризонингу не надо заготовленных данных. Моделька сама формулирует задачи, сама пытается их решать.
#1087Хм, там Хуавей выложили статью как тренили свою PanguUltraMoE с 718 миллиардов…
Хм, там Хуавей выложили статью как тренили свою PanguUltraMoE с 718 миллиардов параметров Модельку саму не выкладывают Интересного тут 1. моделька от хуавея 2.