Помните я буквально два дня назад писал про результаты конкурса предсказаний по АИ на 2025-й? Авторы запустили опрос на 2026й (несмотря на то, что в твиттере две недели назад автор сказал, что не будут этого делать, так как мало времени 👨🦳) Заполняйте ваши предсказания тут: https://forecast2026.ai/ (до 25-го января) (для 2025-го подвели результаты тут. Ajeya, iykyk, заняла третье место — она кстати недавно присоединилась к METR 👀👀) В этом году ставим на (выборочно): — FrontierMath Tier 4 (бенчмарк сложных исследовательских задач) — Remote Labor Index (бенчмарк задач с Upwork, среднее время выполнения человеком 29 часов) — OpenAI-Proof QA (баги, которые замедлили работу OpenAI на сутки и более) — сумму выручек OpenAI, Anthropic и xAI на конец 2026-го (в этом декабре было ~30.8B, за год до этого $6.6B. Будет ли $100B+ в этом???) Отдельно напишу, что недавно обновили лидерборд Remote Labor Index — одного из самых интересных для меня бенчмарков — первое место там занимает теперь Opus 4.5 с 3.75% 💪 (прошлый топ-1 это Manus 1.5, взявший 2.5%). Попросил GPT-5.2 Pro оценить, сколько потенциальной выручки может приносить каждый процент на этом бечмарке в среднем на основе рынка США. Вышло, что: — $13B (если брать только фрилансеров) — $30B (если просто брать зарплатный фонд удалёнщиков — $54B (если брать все задачи, которые могли бы делаться удалённо, но пока не делаются — тогда 100% это ~46% от всех зарплат в США) Уж очень интересно, сколько % на RLI будет к концу 2026-го.
Помните я буквально два дня назад писал про результаты конкурса предсказаний по…
Из этого канала
- #3292Продолжается судебная сага OpenAI v Musk. В рамках процедуры раскрытия…
Продолжается судебная сага OpenAI v Musk. В рамках процедуры раскрытия документов юристы со стороны Elon Musk получили доступ к внутренним перепискам и даже…
- #3293Помню где-то услышал шутку: — Так у меня доступ ко всему интернету есть, все…
Помню где-то услышал шутку: — Так у меня доступ ко всему интернету есть, все сайты.
- #3294Скоро начнётся выкатка SLS на LC-39B. Ворота высотного цеха VAB уже подняты.…
Скоро начнётся выкатка SLS на LC-39B. Ворота высотного цеха VAB уже подняты. Чувствуете, как начинает подбираться это ощущение, что скоро 4 человека полетит к…
- #3290ChatGPT Go за $8/месяц стала доступна везде, а не только в Индии и 8 десятках…
ChatGPT Go за $8/месяц стала доступна везде, а не только в Индии и 8 десятках других стран.
- #3289"OpenAI в целом и Sama в частности инвестировали в только что созданную Merge…
"OpenAI в целом и Sama в частности инвестировали в только что созданную Merge Labs — компанию, сфокусированную на создании интерфейса для подключения мозга к…