Chroma Context-1: обучение поискового агента с самостоятельным редактированием контекста (Часть 2 из 3) Продолжение технического отчёта Chroma о модели Context-1. Часть 2 охватывает агентную обвязку, обучение модели (SFT и RL), дизайн награды и наблюдаемое поведение модели. Читать статью