Just in case, бахнул авторазбор статьи про iCoT (https://arxiv.org/abs/2405.14838), которую упоминали в разборе Coconut'а (https://t.me/gonzo_ML/3567). По мне так довольно полезно уже. https://t.me/gonzo_ML_podcasts/117
Just in case, бахнул авторазбор статьи про iCoT…
Из этого канала
- #3584Работы, на которые надо обратить внимание…
Работы, на которые надо обратить внимание https://blog.iclr.cc/2025/04/22/announcing-the-outstanding-paper-awards-at-iclr-2025/
- #3585Концепция изменилась
Концепция изменилась
- #3586Ну и раз мы сегодня про терминаторов, то вот есть прекрасный свежий…
Ну и раз мы сегодня про терминаторов, то вот есть прекрасный свежий THOUGHTTERMINATOR (https://t.me/gonzoMLpodcasts/123), заставляющий ризонинг модели не…
- #3569Отдельный интересный результат в том, что Coconut с k=0, то есть когда он…
Отдельный интересный результат в том, что Coconut с k=0, то есть когда он вынужден генерировать обычную языковую цепочку CoT без латентных мыслей (но уже с…
- #3568Тестируют подход на трёх датасетах с математическим (GSM8k) и логическим…
Тестируют подход на трёх датасетах с математическим (GSM8k) и логическим ризонингом (ProntoQA, и новый ProsQA). Проверяют на предобученной GPT-2.