BitGN Sandbox доступен! __Update: это новая версия видео, подлиннее__ В нем мы симулируем работу персонального агента, у которого есть полный доступ к Obsidian Vault человека. Это пока еще не соревнование, а технический тест инфраструктуры. Задачек всего семь, но там уже есть даже prompt injection :) Можно взять пример персонального SGR агента на питоне, подключиться к платформе и прогнать eval. Или использовать SDK, чтобы написать аналог на своем языке. Все ссылки есть тут: https://api.bitgn.com Cможете написать агента, который не ведется на спрятанную инструкцию? Ваш, @llm_under_hood 🤗 PS: Leaderboards, профили и прочие привычные фишки от ERC3 потом тоже включим.
BitGN Sandbox доступен! Update: это новая версия видео, подлиннее В нем мы…
Из этого канала
- #773Считаем, что BitGN Sandbox проверку на дым прошел Инженеры подключаются к…
Считаем, что BitGN Sandbox проверку на дым прошел Инженеры подключаются к Harness, запускают в среде AI агентов, получают оценку действий и уже спрашивают про…
- #774"Как запустить рандомную модель на своем железе? Можно повторить то, что сделал…
"Как запустить рандомную модель на своем железе? Можно повторить то, что сделал Dan Woods, когда ему захотелось самому запустить Qwen3.5-397B на своем M3 Max…
- #775Я попросил ChatGPT Codex построить таймлайн разработки моих основных проектов…
Я попросил ChatGPT Codex построить таймлайн разработки моих основных проектов (на основе git), и получилась такая картинка.
- #770В чате канала был вопрос > На следующей неделе в одной очень большой корпорации…
В чате канала был вопрос > На следующей неделе в одной очень большой корпорации будет приниматься решение о программе внедрения LLM в операционную…
- #769"Выпускать продукты с LLM под капотом нынче проще, т.к. теперь можно частично…
"Выпускать продукты с LLM под капотом нынче проще, т.к. теперь можно частично снять с себя DevOps нагрузку.