Помните я буквально два дня назад писал про результаты конкурса предсказаний по… — @seeallochnaya

Помните я буквально два дня назад писал про результаты конкурса предсказаний по АИ на 2025-й? Авторы запустили опрос на 2026й (несмотря на то, что в твиттере две недели назад автор сказал, что не будут этого делать, так как мало времени 👨‍🦳) Заполняйте ваши предсказания тут: https://forecast2026.ai/ (до 25-го января) (для 2025-го подвели результаты тут. Ajeya, iykyk, заняла третье место — она кстати недавно присоединилась к METR 👀👀) В этом году ставим на (выборочно): — FrontierMath Tier 4 (бенчмарк сложных исследовательских задач) — Remote Labor Index (бенчмарк задач с Upwork, среднее время выполнения человеком 29 часов) — OpenAI-Proof QA (баги, которые замедлили работу OpenAI на сутки и более) — сумму выручек OpenAI, Anthropic и xAI на конец 2026-го (в этом декабре было ~30.8B, за год до этого $6.6B. Будет ли $100B+ в этом???) Отдельно напишу, что недавно обновили лидерборд Remote Labor Index — одного из самых интересных для меня бенчмарков — первое место там занимает теперь Opus 4.5 с 3.75% 💪 (прошлый топ-1 это Manus 1.5, взявший 2.5%). Попросил GPT-5.2 Pro оценить, сколько потенциальной выручки может приносить каждый процент на этом бечмарке в среднем на основе рынка США. Вышло, что: — $13B (если брать только фрилансеров) — $30B (если просто брать зарплатный фонд удалёнщиков — $54B (если брать все задачи, которые могли бы делаться удалённо, но пока не делаются — тогда 100% это ~46% от всех зарплат в США) Уж очень интересно, сколько % на RLI будет к концу 2026-го.

Из этого канала