Я поднял потолок ECOM1-DEV до 40, теперь и с мошенничеством! В тестовой BitGN арене для AI агентов (BitGN ECOM1-DEV) добавилось 9 новых задач. Последние три задачи самые интересные. Если кто помнит, я люблю симуляции (см раздел про симуляции у меня на сайте). И, чтобы сделать задачи посложнее, я добавил симулятор мошенничества. У агента стоит задача исследовать историю старых платежей и найти мошеннические платежи. Информации в данных достаточно (сами паттерны достаточно простые), но нужно будет провести расследование. Очки за задания выдаются пропорционально найденным случаям мошенничества. Минус штраф за платежи, которые мошенническими не были. Правда после первой реализации задачи, я прогнал ее через Codex CLI агентов (см BitGN Insights), и выяснилось, что она щелкается запросто. Поэтому пришлось добавить в один мир несколько генераторов с разными паттернами. И тогда агентам сразу стало интереснее. А теперь задачи с t01 по t40 доступны и вам в ECOM1-DEV! Ваш, @llm_under_hood 🤗
Я поднял потолок ECOM1-DEV до 40, теперь и с мошенничеством! В тестовой BitGN…
Из этого канала
- #840Если дать агентам свободу - они могут лениться Про такое сейчас можно часто…
Если дать агентам свободу - они могут лениться Про такое сейчас можно часто услышать.
- #841"Что у нас сейчас происходит в мире? - продавцы быстрее делают AI-приложения и…
"Что у нас сейчас происходит в мире? - продавцы быстрее делают AI-приложения и AI-обертки; - маркетинг обещает пользователю все больше магии (сейлзы теперь…
- #842ECOM1 получил продолжение на второй сезон! ECOM1 заходит хорошо (6.4k…
ECOM1 получил продолжение на второй сезон! ECOM1 заходит хорошо (6.4k завершенных агентских прогонов и четверть миллиона попыток решения задач, нагрузка идет…
- #838"Codex Desktop / CLI поддерживает режим ""копать отсюда до обеда"" Для этого…
"Codex Desktop / CLI поддерживает режим ""копать отсюда до обеда"" Для этого нужно в `~/.codex/config.toml` включить такой флаг: ``` [features] goals = true…
- #837"Когда-то, когда только появлялись первые сервера и BBS-ки, а по сетям бродили…
"Когда-то, когда только появлялись первые сервера и BBS-ки, а по сетям бродили призраки Кейса и Стрелка (Глубина-глубина, я не твой…), субкультура хакеров…