Агенты ИИ | AGI_and_RL@AGI_and_RL· 5 852 subs

у любителей ллмного RLя сегодня снова приподнятое настроение там потюнили квен…

19 мая 2025 г.2 355 views38 forwardsОткрыть в Telegram →

у любителей ллмного RLя сегодня снова приподнятое настроение там потюнили квен coder 7б с PPO, чтобы он оптимизировал асемблерный код. Ну и получили ускорение в среднем x1.47 (дефолтный 7б кодер x1.1 выдавал), и % компиляции с 79% до 96% поднял ну и круче других протесченых ллмок получилось 🎹 Improving Assembly Code Performance with Large Language Models via Reinforcement Learning https://www.arxiv.org/abs/2505.11480 увидел в https://t.me/j_links кстати

Источник

https://t.me/AGI_and_RL/1104

Канал Агенты ИИ | AGI_and_RL · опубликовано 19 мая 2025 г.

Из этого канала