Считаем, что BitGN Sandbox проверку на дым прошел Инженеры подключаются к Harness, запускают в среде AI агентов, получают оценку действий и уже спрашивают про будущие ловушки и грабли в соревновании 11 апреля. Sandbox - это тестовый стенд с простой средой - папка a la Obsidian Vault с кучкой markdown файлов и возможностью создавать типизированные записи (вроде TODO или контактов). Задач там сейчас всего 7 штук и не требуется авторизация. А на само соревнование персональных агентов я подготовлю runtime поинтереснее, с симуляцией бОльшего количества инструментов. Что-нибудь с эмуляцией чатов, почты, хождения на другие сервера и вызова деструктивных команд. Если ломать виртуальные среды, то так ломать. Ваш, @llm_under_hood 🤗 PS: Leaderboards, профили, ключи, режим отладки и прочие фишки от прошлых соревнований - тоже скоро начну включать.