Огромная работа с обзором всего современного RL для ризонинга: https://t.me/gonzo_ML_podcasts/849
Огромная работа с обзором всего современного RL для ризонинга:…
Из этого канала
- #4030"16 сентября у Элиезера Юдковского выходит новая книга! О книге уже…
"16 сентября у Элиезера Юдковского выходит новая книга! О книге уже положительно отозвались крупные учёные (от самого высокоцитируемого живущего учёного и…
- #4031Потрясающий набор реакций на Юдковского, впрочем ожидаемо. Я лично прочитаю,…
Потрясающий набор реакций на Юдковского, впрочем ожидаемо. Я лично прочитаю, мне интересно, какие у него аргументы.
- #4032Вот вам ещё свежая работа из Дипмайнда: Virtual Agent Economies…
Вот вам ещё свежая работа из Дипмайнда: Virtual Agent Economies https://t.me/gonzoMLpodcasts/860 Авторы утверждают, что наш путь по умолчанию — спонтанная и…
- #4026Стартап Миры Мурати разродился на этой неделе первым постом в блоге. Тема:…
Стартап Миры Мурати разродился на этой неделе первым постом в блоге. Тема: воспроизводимость ответов LLM.
- #4025Ещё одна любопытная недавно нашумевшая работа про SpikingBrain LLM, где взяли…
Ещё одна любопытная недавно нашумевшая работа про SpikingBrain LLM, где взяли Qwen2.5 и делают на его базе эффективную модель.