Агенты для исследования массово выходят в опенсорс. Сразу две работы за последнее время: * Barbarians at the Gate: How AI is Upending Systems Research (https://t.me/gonzo_ML_podcasts/966) * Scientific Algorithm Discovery by Augmenting AlphaEvolve with Deep Research (https://t.me/gonzo_ML_podcasts/979) Используют OpenEvolve (https://github.com/codelion/openevolve) и DeepEvolve (https://github.com/liugangcode/deepevolve)
Агенты для исследования массово выходят в опенсорс. Сразу две работы за…
Из этого канала
- #4144Если не видели, тут очередной курс по трансформерам выкладывают. CME 295 -…
Если не видели, тут очередной курс по трансформерам выкладывают. CME 295 - Transformers & Large Language Models This course explores the world of Transformers…
- #4145Дистилляцию в BitNet (тернарные веса и 1.58-битные модели) завезли!…
Дистилляцию в BitNet (тернарные веса и 1.58-битные модели) завезли! https://t.me/gonzoMLpodcasts/990
- #4147"Прочитал какое-то время назад книгу Юдковского и Соареса ""If Anyone Builds…
"Прочитал какое-то время назад книгу Юдковского и Соареса ""If Anyone Builds It, Everyone Dies: The Case Against Superintelligent AI""…
- #4130Подбирали количество рекурсий, обнаружили оптимальные значения для HRM T = 3, n…
Подбирали количество рекурсий, обнаружили оптимальные значения для HRM T = 3, n = 3 (эквивалентно 48 рекурсиям) и для TRM T = 3, n = 6 (42 рекурсии), это на…
- #4129Интересно, что это отличается от латентного ризонинга в стиле Coconut…
Интересно, что это отличается от латентного ризонинга в стиле Coconut (https://t.me/gonzoML/3567), там он был на уровне токенов при авторегрессионной…