Ryan Greenblatt, Chief scientist at Redwood Research, я всегда читаю с удовольствием — и вот он как раз выпустил новый пост (совпадение ли — про ожидания Anthropic 😀) с рассуждениями про «What's up with Anthropic predicting AGI by early 2027?» Я не буду лишать вас возможности прочитать все выкладки и рассуждения, лишь покажу пару картинок и опишу ход поста. Сначала Ryan делает аккуратный анализ заявлений лидершип-команды Anthropic, включая высказывания CEO Dario Amodei (ну, что 90% кода будет писаться AI — Greenblatt 2 недели назад и про это делал глубокий анализ). Затем он старается выстроить по кварталам ход развития от текущей точки развития моделей, если замерять их навык решения ML/AI research задач, до 2027-го, и оценить, как это согласуется с имеющимися данными. Сам Ryan делает более сдержанный прогноз (зелёные точки на картинке) и описывает в деталях, как и когда какие вещи должны произойти по ходу 2026-го, чтобы понять, по какому пути мы идём. При этом автор пишет то, что в целом согласуется с моим мнением (у меня чуть быстрее таймлайны): «Я считаю, что создание AGI, трансформирующего экономику, сопоставимых по возможностям или превосходящих понятие мощного ИИ по версии Anthropic, вероятно уже через 5 лет и весьма вероятно (более 50%) в течение 10 лет. Соответственно, общество крайне недостаточно готовится к рискам, связанным с такими системами ИИ». Думаю, одно из главных различий наших точек зрения, если сильно упрощать — это ожидание прорывов, подобных появлению рассуждающих моделей.
Ryan Greenblatt, Chief scientist at Redwood Research, я всегда читаю с…
Из этого канала
- #3052Epoch.AI собрали информацию по крупным строящимся и планируемым датацентрам…
Epoch.AI собрали информацию по крупным строящимся и планируемым датацентрам мощностью не менее 1 ГигаВатта, всего таких в США 13 штук.
- #3053Собираю материал для нового лонгрида, и его уже так много, что точно придётся…
Собираю материал для нового лонгрида, и его уже так много, что точно придётся выкидывать часть.
- #3054CodeClash: Benchmarking Goal-Oriented Software Engineering (сайт проекта) Новый…
CodeClash: Benchmarking Goal-Oriented Software Engineering (сайт проекта) Новый бенчмарк от Ofir Press и команды SWE-bench.
- #3049Anthropic прогнозирует выручку в размере 70 миллиардов долларов и положительный…
Anthropic прогнозирует выручку в размере 70 миллиардов долларов и положительный денежный поток в размере 17 миллиардов долларов в 2028 году — пишет…
- #3048Первая H100 вышла в космос В небольшом спутнике размером с мини-холодильник…
Первая H100 вышла в космос В небольшом спутнике размером с мини-холодильник влезли солнечные панели, радиаторы и, собственно, компьютер с одной видеокартой.