https://github.com/databricks/megablocks
0 viewsОткрыть в Telegram →
Из этого канала
- #5816https://allenai.org/blog/open-coding-agents
https://allenai.org/blog/open-coding-agents
- #5817Фух ребятки завтра апдейтик еще Починил инференс в вллм своих претрейненых…
Фух ребятки завтра апдейтик еще Починил инференс в вллм своих претрейненых моделек+ в sft поменял теги на квеновские Сегодня минимальную модельку Прогнал через…
- #5818[2601.09032] The Hierarchy of Agentic Capabilities: Evaluating Frontier Models…
[2601.09032] The Hierarchy of Agentic Capabilities: Evaluating Frontier Models on Realistic RL Environments https://arxiv.org/abs/2601.09032
- #5814Пока тесчу понял что надо конфиги моделек скорректировать немного + добавил мое…
Пока тесчу понял что надо конфиги моделек скорректировать немного + добавил мое посмотрим как тюниться будет
- #5813допустим можно 600м модельку с 16к контекстом на 2х3090 поставить в претрен в…
допустим можно 600м модельку с 16к контекстом на 2х3090 поставить в претрен в ds zero 3 + cpu offload на 8гб данных fineweb2 (ну это супермало, но для примеру)…