Организаторы научной конференции AAAI 2026 два дня назад объявили, что теперь будут пилотировать инновационную систему ревью на основе фронтир модели от OpenAI. Всё дело в том, что на конференцию подали 31 тысячу статей, каждую из которых должно внимательно отсмотреть несколько человек. Вообще поблема ревью в последние годы стоит достаточно остро: на некоторых конференциях всех авторов обязали заниматься этим. То есть если хочешь пройти на конференцию — то будь добр побыть волонтёром. Понятно, что это сказывается и на качестве их работы. Новая AI-система использует многоэтапный процесс с собственными инструментами для проверки технической точности, поиска литературы и верификации результатов, а все решения и рекомендации полностью остаются за людьми. Авторы, рецензенты и члены комитета дадут обратную связь по результатам отсмотренных ИИ-рецензий, чтобы улучшить систему в будущем. Итоги будут представлены в техническом отчёте для широкого исследовательского сообщества. Думаю, что чтобы ситуация была честной, а не воспринималась так, что рецензенты выступают бесплатными разметчиками OpenAI, данные должны быть опубликованы: сами сгенерированные ревью и обратная связь с правками. Это не первый раз, когда AI-агент используется в ревью на конференции, такое было год назад, но первый, когда это становится обязательной, не опциональной частью процесса. Вообще, как я писал, недавно OpenAI запустили команду, направленную на применение LLM в науке — и думаю, что эта инициатива им очень поможет в улучшении модели-критика, которая будет использоваться в процессе тренировки условной GPT-5.1-Science. Ну а чем качественнее критика — тем лучше результаты модели. На днях в твиттере как раз несколько учёных писали по то, как сильно им помогает GPT-5-Pro: кому-то помогла найти уже существующие решения, кому-то подкинула идеи и/или автоматизировала проверку гипотез, обернувшихся тупиками. Часть из учёных уже приняли в OpenAI для дальнейшей работы, и уверен, что в течении года мы увидим много интересных новостей.
Организаторы научной конференции AAAI 2026 два дня назад объявили, что теперь…
Из этого канала
- #3023На неделе Apple выпустили обновление для Apple Vision Pro, в котором поменяли…
На неделе Apple выпустили обновление для Apple Vision Pro, в котором поменяли чип (один из двух) с M2 на M5.
- #3024Попробовал решить проблему с ChatGPT Atlas браузером и доволен: Есть у меня…
Попробовал решить проблему с ChatGPT Atlas браузером и доволен: Есть у меня такой сервис на сайте, позволяет парсить интернет статьи в формате удобном для LLM:…
- #3025Ждем пока кто-то наладит парсинг через Агента, чтобы он автоматически проходил…
Ждем пока кто-то наладит парсинг через Агента, чтобы он автоматически проходил капчу 😶
- #3020Я слышал, что многим не нравится, как в GPT-5 добавили вопросы-зацепки в конец…
Я слышал, что многим не нравится, как в GPT-5 добавили вопросы-зацепки в конец почти каждого ответа: «Хочешь, я распишу X?» или «Хочешь, я коротко объясню Y?»…
- #3019"Нормального решения на столе до сих пор нет, от всех ИИ компаний лучится…
"Нормального решения на столе до сих пор нет, от всех ИИ компаний лучится нескончаемый венчурный оптимизм, подкреплённый ничем.