Агенты ИИ | AGI_and_RL@AGI_and_RL· 5 852 subs

rl... rl всегда возвращается это еще из очень олдовых экспериментов хардмару,…

22 февр. 2025 г.2 111 views8 forwardsОткрыть в Telegram →

rl... rl всегда возвращается это еще из очень олдовых экспериментов хардмару, но ржомба Если убрать все ограничения конструкции, оптимизатор придумал действительно высокого двуногого шагающего робота, который «решает» задачу, просто падая и приземляясь около выхода. https://x.com/hardmaru/status/1892995060557640098

Источник

https://t.me/AGI_and_RL/968

Канал Агенты ИИ | AGI_and_RL · опубликовано 22 февр. 2025 г.

Из этого канала

#969Ребята на https://www.alphaxiv.org/ завезли o3-mini с которой можно по статьям…
Ребята на https://www.alphaxiv.org/ завезли o3-mini с которой можно по статьям общаться, вот это прикольно
#970сори, тупанул, вот правильный скрин 🤨 кроме 03-mini есть claude 3.5 и Gemini 2…
сори, тупанул, вот правильный скрин 🤨 кроме 03-mini есть claude 3.5 и Gemini 2 По лимитам я пока не понял. Но блин, с такой штукой очень удобно статейки читать
#971У нас тут бегущий по ризонингу Ребята потренили Qwen 1.5B на то чтобы проходить…
У нас тут бегущий по ризонингу Ребята потренили Qwen 1.5B на то чтобы проходить не сильно сложные лабиринты 5x5. Но исходная моделька и этого не умела.
#967"🌸MLGym – открытый фреймворк и бенчмарк для Агентов в автоматизации ML-задач🌸…
"🌸MLGym – открытый фреймворк и бенчмарк для Агентов в автоматизации ML-задач🌸 #nlp #проnlp #nlppapers Сегодня, под конец этой насыщенной недели, мы с коллегами…
#966Там это... Ребята из Саканы выложили своего оптимизатора торч кода для…
Там это... Ребята из Саканы выложили своего оптимизатора торч кода для видеокарт. The AI CUDA Engineer: Agentic CUDA Kernel Discovery, Optimization and…