😢 разборы становятся всё длиннее и длиннее
😢 разборы становятся всё длиннее и длиннее
Из этого канала
- #2918It's gonna be big: во внутренней записке в слаке Sama написал, что хочет иметь…
It's gonna be big: во внутренней записке в слаке Sama написал, что хочет иметь вычислительных мощностей на 250 ГигаВатт к 2033-му году.
- #2919А вот и первый продукт, который (пока) будет доступен только Pro-пользователям:…
А вот и первый продукт, который (пока) будет доступен только Pro-пользователям: ChatGPT Pulse.
- #2920Прикольно, мне ChatGPT Pulse подсказывает какие у Vibe moat нужно развивать,…
Прикольно, мне ChatGPT Pulse подсказывает какие у Vibe moat нужно развивать, какие метрики считать для предсказания виральности, как растить ретеншен
- #2916Напоследок запускают RL поверх разогретой модели. Предлагают использовать свою…
Напоследок запускают RL поверх разогретой модели. Предлагают использовать свою модификацию DAPO, упомянутого вчера: Duplicating Sampling Policy Optimization…
- #2914Сам по себе датасет получается сложным: это видно по сравнению количества…
Сам по себе датасет получается сложным: это видно по сравнению количества действий, необходимых для ответа на вопрос, с другими бенчмарками, уже упомянутым…