"Шажок на пути к автоматической науке GIANTS: Generative Insight Anticipation… — @gonzo_ML

"Шажок на пути к автоматической науке GIANTS: Generative Insight Anticipation from Scientific Literature __Joy He-Yueya, Anikait Singh, Ge Gao, Michael Y. Li, Sherry Yang, Chelsea Finn, Emma Brunskill, Noah D. Goodman__ Статья: https://arxiv.org/abs/2604.09793 Код: https://github.com/joyheyueya/giants Модель: https://huggingface.co/giants2026 Ревью: https://arxiviq.substack.com/p/giants-generative-insight-anticipation # TL;DR ЧТО сделали: Авторы формализуют задачу ""предвосхищения инсайтов"" (insight anticipation) — предсказания главной новизны будущей научной статьи исключительно по саммари её основополагающих ""родительских"" работ. Для этого собрали датасет GiantsBench на 17 тысяч примеров и обучили GIANTS-4B, языковую модель на 4 миллиарда параметров, прошедшую файнтюнинг с помощью обучения с подкреплением (RL), где в качестве награды выступает семантическая близость. ПОЧЕМУ это важно: Работа показывает, что способность синтезировать научную литературу не масштабируется линейно только за счёт размера модели. Изолировав этап концептуального синтеза от шума открытой генерации идей, авторы доказывают, что специализированное RL на небольших open-weight моделях сильно превосходит огромные SOTA-модели в целенаправленных задачах на рассуждение. Для практиков: Для тех, кто разрабатывает агентов для научных открытий или проверяемые RAG-системы, предложенный пайплайн (ограниченный контекст + GRPO с семантическим ревордом) — это отличный шаблон. Он заставляет небольшую модель делать строгий концептуальный синтез, а не галлюцинировать абстрактными идеями. Подробнее тут: https://t.me/gonzo_ML_podcasts/3311"

Из этого канала