gonzo-обзоры ML статей@gonzo_ML· 24 246 subs

Прикольная свежая работа от Superintelligence Labs, включая Руслана…

6 окт. 2025 г.6 980 views32 forwardsОткрыть в Telegram →

Прикольная свежая работа от Superintelligence Labs, включая Руслана Салахутдинова. Метод оптимизации ризонинга, когда части можно параллелить и синтезировать в саммари, последовательно уточняя. Получаем latency ниже, а глубину продумывания выше :) https://t.me/gonzo_ML_podcasts/924

Источник

https://t.me/gonzo_ML/4089

Канал gonzo-обзоры ML статей · опубликовано 6 окт. 2025 г.

Из этого канала

#4091Вышел новый State of AI report 2025! https://www.stateof.ai/ Всегда достойно…
Вышел новый State of AI report 2025! https://www.stateof.ai/ Всегда достойно изучения.
#4092"Неужели мы наблюдаем возрождение эволюционных стратегий как альтернативы RL? Я…
"Неужели мы наблюдаем возрождение эволюционных стратегий как альтернативы RL? Я помню ту работу 2017 года от OpenAI и Суцкевера в частности ""Evolution…
#4093Интересно, что параллельно с LLM/VLM Google продолжает совершенствовать модели…
Интересно, что параллельно с LLM/VLM Google продолжает совершенствовать модели для роботов, свежая — Gemini Robotics 1.5.
#4086Новую архитектуру подвезли! ‘Dragon Hatchling’ (BDH) построена на принципах…
Новую архитектуру подвезли! ‘Dragon Hatchling’ (BDH) построена на принципах распределённых графовых моделей мозга, при этом есть GPU-friendly имплементация.
#4071Обучают dense декодеры с GQA, RMSNorm + pre-norm, RoPE. Модели 1.5B и 3B.…
Обучают dense декодеры с GQA, RMSNorm + pre-norm, RoPE. Модели 1.5B и 3B. Оптимизатор AdamW. Токенизатор Llama3, словарь 128k + 256 зарезервированных токенов.