Агенты ИИ | AGI_and_RL@AGI_and_RL· 5 852 subs

Наткнулся на проект (выложен 3 часа назад первый коммит) где чел учит мелкие…

7 янв. 2025 г.2 208 views44 forwardsОткрыть в Telegram →

Наткнулся на проект (выложен 3 часа назад первый коммит) где чел учит мелкие 9/26м параметров RWKV (подвид RNNок, конкурент трансформерам) модельки играть в Othello Применяет test-time scaling (моделька может делать альфа/бета прунинг по дереву ходов) Короче что-то прикольное, надо поразбираться https://github.com/Jellyfish042/RWKV_Othello

Источник

https://t.me/AGI_and_RL/906

Канал Агенты ИИ | AGI_and_RL · опубликовано 7 янв. 2025 г.

Из этого канала

#908"Боремся с проклятыми токенами 😎 Люблю статьи от авторов phi — очень простые с…
"Боремся с проклятыми токенами 😎 Люблю статьи от авторов phi — очень простые с топорными методами, но работают хорошо.
#910Ни дня без агентов - на этот раз помощник ресерчера. (AMD + университет Джона…
Ни дня без агентов - на этот раз помощник ресерчера. (AMD + университет Джона Хопкинса) Лаборатория Агентов состоит из трех основных фаз, которые…
#913Еще кайфец от HF 🤗 - smol course по всем видам тюнингов LLMок (все на скрине…
Еще кайфец от HF 🤗 - smol course по всем видам тюнингов LLMок (все на скрине видно) Построен вокруг семейства моделек HF SmolLM2 в размерах 135M, 360M, and…
#905Уверен, что многих интересует как вот там реализуются методы распределенного…
Уверен, что многих интересует как вот там реализуются методы распределенного трейна, может кто-то хотел бы сам реализовать (а это очень полезно).
#904Ребята из проекта опенсурс агента для написания кода OpenHands 🥳 релизнули…
Ребята из проекта опенсурс агента для написания кода OpenHands 🥳 релизнули первую 0.18.0 версию 5 дней назад https://github.com/All-Hands-AI/OpenHands…