Наткнулся на проект (выложен 3 часа назад первый коммит) где чел учит мелкие 9/26м параметров RWKV (подвид RNNок, конкурент трансформерам) модельки играть в Othello Применяет test-time scaling (моделька может делать альфа/бета прунинг по дереву ходов) Короче что-то прикольное, надо поразбираться https://github.com/Jellyfish042/RWKV_Othello