Про важность обвязки (харнеса) и прогрессирующую экстернализацию у LLM агентов. Externalization in LLM Agents: A Unified Review of Memory, Skills, Protocols and Harness Engineering __Chenyu Zhou, Huacan Chai, Wenteng Chen, Zihan Guo, Rong Shan, Yuanyi Song, Tianyi Xu, Yingxuan Yang, Aofan Yu, Weiming Zhang, Congming Zheng, Jiachen Zhu, Zeyu Zheng, Zhuosheng Zhang, Xingyu Lou, Changwang Zhang, Zhihui Fu, Jun Wang, Weiwen Liu, Jianghao Lin, Weinan Zhang__ Paper: https://arxiv.org/abs/2604.08224 Review: https://arxiviq.substack.com/p/externalization-in-llm-agents-a-unified Code: N/A Model: N/A # TL;DR Что сделали: Сформулировали системный подход, который объясняет развитие ИИ-агентов на базе больших языковых моделей (LLM — алгоритмов, предсказывающих следующее слово в тексте) не через увеличение нейросетей, а через вынос когнитивных задач во внешнюю инфраструктуру — память, готовые наборы навыков и протоколы взаимодействия под управлением специальной программной «обвязки» (harness). Почему это важно: Попытки заставить модель решать сложные многошаговые задачи только за счёт её внутренних весов и длинных, хрупких текстовых запросов (промптов) часто приводят к ошибкам. Перенос этих функций во внешнюю среду делает ИИ-системы безопаснее, предсказуемее и проще в аудите без необходимости постоянно переобучать саму модель. Экстернализировать тут: https://t.me/gonzo_ML_podcasts/3878
Про важность обвязки (харнеса) и прогрессирующую экстернализацию у LLM агентов.…
Из этого канала
- #5489Ян и Рэндал продолжают копать свои темы про JEPA и доказали интересную штуку…
Ян и Рэндал продолжают копать свои темы про JEPA и доказали интересную штуку про латенты такой модели — они с точностью до поворота восстанавливают истинные…
- #5475"Новости рекуррентного ризонинга. Теперь нейросимвольный подход с добавлением…
"Новости рекуррентного ризонинга. Теперь нейросимвольный подход с добавлением решёток (Дима Игнатов будет счастлив!).
- #5472Ещё один свежий заход на то, что надо предсказывать латенты (как и в JEPA), а…
Ещё один свежий заход на то, что надо предсказывать латенты (как и в JEPA), а не финальные представления. Тогда ещё и выборочная сложность сильно лучше.
- #5467Пиксели тоже думают. А мегапиксели... Если серьёзно, то это моя любимая тема…
Пиксели тоже думают. А мегапиксели... Если серьёзно, то это моя любимая тема про рекуррентный ризонинг, теперь применённая к диффузионным моделям.