Вектора - ничто, инструменты - все Это девиз второго дропа функционала для соревнования агентов в бенчмарке PAС1-DEV (а еще и обсуждений RAG в этом канале в последние два года). Теперь: (1) `Read` - можно указывать диапазон строчек для чтения (как в sed) и отображать номера строчек в файле (в как cat) (2) `Write` - можно передавать диапазон строчек для замены (3) `Tree` - теперь можно ограничивать глубину вложенности (4) pac1-py пример агента использует все это и бережнее относится к контексту, благодаря чему выбивает с дремучей gpt-4.1 не жалкие 33%, а все 44%-66% (5) grpc/proto для API теперь тоже лежат в github. (6) вывод демо-агента более человеко-читаем (скрины в комментариях) Если переключить ваших агентов на инструменты из новой версии SDK - точность вырастет? Ваш, @llm_under_hood 🤗 PS: Само соревнование персональных агентов-ассистентов будет 11 апреля. Будет использоваться интерфейс от PAC1-DEV, но с новым набором задач.
Вектора - ничто, инструменты - все Это девиз второго дропа функционала для…
Из этого канала
- #781"Новые задачи в BitGN PAC1-DEV - со вкусом ERC3! Новые задачи t12-t20…
"Новые задачи в BitGN PAC1-DEV - со вкусом ERC3! Новые задачи t12-t20 используют генератор рантаймов, который немного похож на ERC3, а это значит, что агентам…
- #782Обсуждения агентов и задачек PAC1-DEV провалились в чат, поэтому в комментариях…
Обсуждения агентов и задачек PAC1-DEV провалились в чат, поэтому в комментариях к прошлому посту их не видно.
- #788Что делать агенту, если его инструкции противоречат друг другу? Вопрос задавали…
Что делать агенту, если его инструкции противоречат друг другу? Вопрос задавали в чате применительно к задачкам и evaluation harness в BitGN PAC1, но это еще…
- #779Псст, я выложил первые задачи на PAC1-DEV Sample agent находится тут -…
Псст, я выложил первые задачи на PAC1-DEV Sample agent находится тут - https://github.com/bitgn/sample-agents/tree/main/pac1-py В этот дроп задач встроена…
- #778"Мелкий status update (0) На HackerNews очень классное обсуждение того (ну или…
"Мелкий status update (0) На HackerNews очень классное обсуждение того (ну или признания в любви), почему люди используют NixOS для управления средами и…