Много работ, где к нейросеткам добавляют эволюцию, в частности где LLM… — @gonzo_ML

Много работ, где к нейросеткам добавляют эволюцию, в частности где LLM управляет этой эволюцией. Сходу вспоминается AlphaEvolve, ShinkaEvolve, Gödel Agent, GEPA, OpenEvolve и DeepEvolve. DeepResearch вообще стал коммодити. И готовых имплементаций уже навалом, и через API можно использовать уже, тот же гугловый. 9. Media generation on the rise Генерация картинок и видео за этот год очень прокачалась. Sora и Sora 2, Veo 3 и прочие генерят очень неплохо. У меня в ленте фейсбука уже довольно много AI-generated видео, не про все легко понять, что они ненастоящие. Началось, короче. В нише для взрослых и не очень, похоже, тоже всё процветает, генерация полуодетых девушек на потоке; видел, что появились приложения про виртуальных подружек. В генерации картинок в целом уже было всё довольно хорошо, но по мне так Nano Banana Pro знатно продвинула всё вперёд, такой хорошей работы с текстом я до неё не встречал. Теперь у нас есть комиксы, хоть они вас, возможно, и достали 🙂 10. Model welfare Слово года для меня. Подробнее тут: https://www.anthropic.com/research/exploring-model-welfare X. What else? Убийцы трансформеров не появилось, зато гибриды трансформеров и мамбы (и всяких других SSM-подобных штук) продолжают плодиться. KAN’ы из прошлого года как-то сильно пока никого не потеснили, но где-то локально вроде используются. Какую-то новую архитектуру сложно назвать, из условно прикольного были Tversky Neural Networks, но не ожидаю от них какого-то особого прорыва, честно говоря. Рекуррентность возвращается, на ARC-AGI пришло несколько моделей, воскрешающих старые идеи Universal Transformer — HRM, TRM, URM. Много было работ про reasoning in the latent space (например, это и это), ожидаю дальнейшего развития. ——— Что важного упустил?

Из этого канала