привет я погенерил себе данных рандомных и потом пошел заниматься студией вендинг чуть попозже покручу. цель потюнить маленькую модельку чисто на эту таску. и пока не знаю может надо генерить хорошие траектории внешними модельками там же в чем смысл - среда есть но нам надо находить хорошие траектории чтобы оптимайзить. в целом ожно и grpo чисто запустить и посмотреть что будет. ну или обычны rl пока короче немного недобрался
привет я погенерил себе данных рандомных и потом пошел заниматься студией…
0 viewsОткрыть в Telegram →
Из этого канала
- #6233скоро апдейт агентика будет
скоро апдейт агентика будет
- #6234оч много чего добавил теперь хоть как-то можно пользоваться
оч много чего добавил теперь хоть как-то можно пользоваться
- #6235тесчу на 8к контекста всего доступного
тесчу на 8к контекста всего доступного
- #6231Привет! А ты вендинг энв попробовал?
Привет! А ты вендинг энв попробовал?
- #6230Интересно на самом деле, к чему все придет. Будто, парадигма, что маленькие…
Интересно на самом деле, к чему все придет. Будто, парадигма, что маленькие модели не могут физически в себя уместить достаточно знаний, постепенно двигается