BitGN Sandbox доступен! __Update: это новая версия видео, подлиннее__ В нем мы симулируем работу персонального агента, у которого есть полный доступ к Obsidian Vault человека. Это пока еще не соревнование, а технический тест инфраструктуры. Задачек всего семь, но там уже есть даже prompt injection :) Можно взять пример персонального SGR агента на питоне, подключиться к платформе и прогнать eval. Или использовать SDK, чтобы написать аналог на своем языке. Все ссылки есть тут: https://api.bitgn.com Cможете написать агента, который не ведется на спрятанную инструкцию? Ваш, @llm_under_hood 🤗 PS: Leaderboards, профили и прочие привычные фишки от ERC3 потом тоже включим.