у любителей ллмного RLя сегодня снова приподнятое настроение там потюнили квен coder 7б с PPO, чтобы он оптимизировал асемблерный код. Ну и получили ускорение в среднем x1.47 (дефолтный 7б кодер x1.1 выдавал), и % компиляции с 79% до 96% поднял ну и круче других протесченых ллмок получилось 🎹 Improving Assembly Code Performance with Large Language Models via Reinforcement Learning https://www.arxiv.org/abs/2505.11480 увидел в https://t.me/j_links кстати