Много работ, где к нейросеткам добавляют эволюцию, в частности где LLM управляет этой эволюцией. Сходу вспоминается AlphaEvolve, ShinkaEvolve, Gödel Agent, GEPA, OpenEvolve и DeepEvolve. DeepResearch вообще стал коммодити. И готовых имплементаций уже навалом, и через API можно использовать уже, тот же гугловый. 9. Media generation on the rise Генерация картинок и видео за этот год очень прокачалась. Sora и Sora 2, Veo 3 и прочие генерят очень неплохо. У меня в ленте фейсбука уже довольно много AI-generated видео, не про все легко понять, что они ненастоящие. Началось, короче. В нише для взрослых и не очень, похоже, тоже всё процветает, генерация полуодетых девушек на потоке; видел, что появились приложения про виртуальных подружек. В генерации картинок в целом уже было всё довольно хорошо, но по мне так Nano Banana Pro знатно продвинула всё вперёд, такой хорошей работы с текстом я до неё не встречал. Теперь у нас есть комиксы, хоть они вас, возможно, и достали 🙂 10. Model welfare Слово года для меня. Подробнее тут: https://www.anthropic.com/research/exploring-model-welfare X. What else? Убийцы трансформеров не появилось, зато гибриды трансформеров и мамбы (и всяких других SSM-подобных штук) продолжают плодиться. KAN’ы из прошлого года как-то сильно пока никого не потеснили, но где-то локально вроде используются. Какую-то новую архитектуру сложно назвать, из условно прикольного были Tversky Neural Networks, но не ожидаю от них какого-то особого прорыва, честно говоря. Рекуррентность возвращается, на ARC-AGI пришло несколько моделей, воскрешающих старые идеи Universal Transformer — HRM, TRM, URM. Много было работ про reasoning in the latent space (например, это и это), ожидаю дальнейшего развития. ——— Что важного упустил?
Много работ, где к нейросеткам добавляют эволюцию, в частности где LLM…
Из этого канала
- #4503Да, чуть картинку не забыл!
Да, чуть картинку не забыл!
- #4504Забористая штука! Предлагают подход к созданию искусственных сред (или игр) с…
Забористая штука! Предлагают подход к созданию искусственных сред (или игр) с детерминированной сущностной компонентой и стохастической выразительной.
- #4508"Развитие темы про Large Concept Model (LCM) и Byte Latent Transformer (BLT), в…
"Развитие темы про Large Concept Model (LCM) и Byte Latent Transformer (BLT), в каком-то смысле микс обеих.
- #4501DeepSeek, конечно, стал офигенным прорывом, особенно R1, пожалуй. После него…
DeepSeek, конечно, стал офигенным прорывом, особенно R1, пожалуй. После него стало понятно, что гэп между американскими фронтирными компаниями и остальными,…
- #4500#2025 Продолжу традицию подбивания результатов. В 2024-м было так. Я снова не…
#2025 Продолжу традицию подбивания результатов. В 2024-м было так. Я снова не тратил слишком много времени на подробный анализ, и попробовал собрать свой…