Ещё одна работа про анализ ИИ-автоматизации. Crashing Waves vs. Rising Tides: Preliminary Findings on AI Automation from Thousands of Worker Evaluations of Labor Market Tasks __Matthias Mertens, Adam Kuzee, Brittany S. Harris, Harry Lyu, Wensu Li, Jonathan Rosenfeld, Meiri Anto, Martin Fleming, Neil Thompson__ Paper: https://arxiv.org/abs/2604.01363 # TL;DR ЧТО сделали: Исследователи из MIT FutureTech оценили 41 LLM на 3000+ реалистичных рабочих задачах, взятых из базы данных O*NET (другая недавняя работа на этой же базе). Они собрали более 17 000 двойных слепых оценок от профильных экспертов и смоделировали вероятность успеха ответов ИИ в зависимости от времени, которое потребовалось бы человеку на выполнение той же задачи. ПОЧЕМУ это важно: Эта работа кардинально меняет наше представление о динамике автоматизации. ИИ не захватывает узкие ниши резко и внезапно (как «цунами»), пасуя перед всем остальным. Наоборот, модели улучшаются параллельно во всех текстовых профессиональных областях (как «прилив»). Такое плоское распределение роста производительности указывает на более предсказуемый и всеобъемлющий сценарий трансформации рынка труда. Для практиков: Статья даёт отличную эмпирическую базу для стратегов и аналитиков. Передовые системы уже достигают 50% успешности на задачах, занимающих у человека 3–4 часа. Однако пологий наклон кривой успеха означает, что достижение идеальной надёжности без ошибок займёт значительно больше времени. Базовые способности к рассуждению стремительно растут, но главным барьером для реальных экономических сдвигов станет системная инженерия — та самая «последняя миля», необходимая для внедрения моделей в сложные корпоративные процессы. Автоматизировать тут: https://t.me/gonzo_ML_podcasts/3136
Ещё одна работа про анализ ИИ-автоматизации. Crashing Waves vs. Rising Tides:…
Из этого канала
- #5138"Дорожная карта развития железа для ИИ на ближайшие 10 лет. Хотим ускорения в…
"Дорожная карта развития железа для ИИ на ближайшие 10 лет. Хотим ускорения в 1000 раз: 10x от инноваций в алгоритмах, 20x от архитектурных улучшений и…
- #5145В продолжение темы про Thrust2 и ThrustSSC. Bloodhound LSR/SSC…
В продолжение темы про Thrust2 и ThrustSSC. Bloodhound LSR/SSC (https://en.wikipedia.org/wiki/BloodhoundLSR) -- машина с реактивным двигателем Rolls-Royce…
- #5151ИИ-исследователи всё более полного цикла. ASI-Evolve: AI Accelerates AI Weixian…
ИИ-исследователи всё более полного цикла. ASI-Evolve: AI Accelerates AI Weixian Xu, Tiantian Mi, Yixiu Liu, Yang Nan, Zhimeng Zhou, Lyumanshan Ye, Lin Zhang,…
- #5126Это что-то очень прикольное! Вычисление — это постоянное обновление латентов.…
Это что-то очень прикольное! Вычисление — это постоянное обновление латентов. Нейрокомпьютер на базе диффузионки.
- #5121Drop-in замена индексатора для разреженного внимания в трансформерах типа…
Drop-in замена индексатора для разреженного внимания в трансформерах типа DeepSeek. Ускорение в 3.75 раза на инференсе.