👏 сегодня объявляю марафон разборов статей. Tongyi, одна из команд AliBaba, занимающихся AI/ML, на прошлой неделе выпустила Tongyi DeepResearch — систему на основе 30B-3A модельки для DeepResearch, которая сопоставима по качеству с проприетарными решениями. Вместе с этим выпустили целых шесть статей за один день, а в сумме с подготовительной работой с начала года вышло аж 11. Вот они все слева направо на картинке выше Краткий блогпост с описанием системы: https://tongyi-agent.github.io/blog/introducing-tongyi-deep-research/ Там есть и про сбор данных, и про генерацию синтетики, и про использование графов для обогащения базы запросов, как сделать «Pro» версию со скейлингом через параллельную генерацию — расскажу про все основные моменты. Так что узнаем what it takes to build a SoTA DR Agent in 2025! Каждый день я буду разбирать по одной статье из списка по порядку. Не факт, что прям каждая статья актуальна и стоит разбора, поэтому пока ограничимся одной неделей, как минимум 7 из 11 статей. Дальше посмотрим. Первая статья на сегодня — WebWalker: Benchmarking LLMs in Web Traversal.
👏 сегодня объявляю марафон разборов статей. Tongyi, одна из команд AliBaba,…
Из этого канала
- #2896🌸Релизим GAIA2 — Агенты в реалистичной среде😘 #nlp #nlppapers 🌸TL;DR Выпускаем…
🌸Релизим GAIA2 — Агенты в реалистичной среде😘 #nlp #nlppapers 🌸TL;DR Выпускаем GAIA2, новую версию основного многоступенчатого бечмарка для агентов, и Agentic…
- #2899Я уже один раз писал про сборник песен с радио GTA IV — и даже получил…
Я уже один раз писал про сборник песен с радио GTA IV — и даже получил благодарности в личку за то, что поделился ❤️ Сегодня у нас снова играет Vladivostok FM…
- #2900WebWalker: Benchmarking LLMs in Web Traversal Первая статья в цикле разборов…
WebWalker: Benchmarking LLMs in Web Traversal Первая статья в цикле разборов Tongyi DeepResearch.
- #28922 дня назад xAI представили Grok 4 Fast — меньшую версию своей модели, которая…
2 дня назад xAI представили Grok 4 Fast — меньшую версию своей модели, которая а) быстрее б) существенно дешевле в) поддерживает 2 миллиона токенов контекста.
- #2891Чуть больше недели назад в Cursor обновили Tab-модель — это которая…
Чуть больше недели назад в Cursor обновили Tab-модель — это которая подсказывает вам код прямо когда вы его пишете, без длительного ожидания генерации.