Агенты OpenAI Нам показывают Operator: https://openai.com/index/introducing-operator/ агент для работы в вебе на базе новой модельки Computer-Using Agent - это типа GPT-4o + ризонинг 🎹 (учился с помощью reinforcement learning), работает с внутренним браузером смотрит на скриншоты и выполняет действия с GUI как делал бы человек используя клаву + мышку, а когда надо - рассуждает (если что-то не выходит сделать например), а если совсем никак - отдает управлению юзеру. Ну т.е. эту штуку можно просить делать что угодно что в интернетике через браузер можно делать. (и кстати это самая развитая область сегодня - вебагенты) При этом он научен просить пользователя самого работать с задачами типа логина и ввода капчи. (security) Пишут, что sota на WebArena и WebVoyager Ссылочки https://openai.com/index/operator-system-card/ https://openai.com/index/computer-using-agent/
Агенты OpenAI Нам показывают Operator:…
Из этого канала
- #939Куда ни глянь везде RL, реварды, агенты... шьто за время)
Куда ни глянь везде RL, реварды, агенты... шьто за время)
- #940Полезный листик на гитхабе в котором собирают статьи по ризонингам и рлю для…
Полезный листик на гитхабе в котором собирают статьи по ризонингам и рлю для llms, агентам и вот этому всему https://github.com/open-thought/system-2-research…
- #941HuggingFace 🤗 хотят повторить модельки семейства DeepSeek-R1 и расшарить…
HuggingFace 🤗 хотят повторить модельки семейства DeepSeek-R1 и расшарить пайплайны для воспроизведения Хотят нагенерить данных из R1 и дистильнуть в свои…
- #936Salt Мы начали собирать эту модель в августе, в конце августа получили первый…
Salt Мы начали собирать эту модель в августе, в конце августа получили первый прототип, а потом стало выходить миллион вариантов вида: а давайте whisper для…
- #934TREAD: Token Routing for Efficient Architecture-agnostic Diffusion Training -…
TREAD: Token Routing for Efficient Architecture-agnostic Diffusion Training - Этот простой трюк ускорит претрен вашего DIT в 25 раз! Идея такая: не все токены…