Не спите? про ARC-AGI бенчмарк поговорим? Или 🥱?
Не спите? про ARC-AGI бенчмарк поговорим? Или 🥱?
Из этого канала
- #3208Про ARC-AGI и свою критику этого бенчмарка и мнений его автора, François…
Про ARC-AGI и свою критику этого бенчмарка и мнений его автора, François Chollet (автор Keras), я писал много раз (если пропустили — читать тут, тут, тут, тут…
- #3209Получается, что такой результат это в большей степени заслуга Google и OpenAI…
Получается, что такой результат это в большей степени заслуга Google и OpenAI (GPT-5.2 X-High там вообще какой-то безумный скор показала).
- #3210И результаты разных моделей и систем на ARC AGI 2.
И результаты разных моделей и систем на ARC AGI 2.
- #3206Во всех описанных выше экспериментах люди выполняли протоколы самостоятельно и…
Во всех описанных выше экспериментах люди выполняли протоколы самостоятельно и руками; но OpenAI сколлаборировались с одним робо-стартапом и попробовали…
- #3205Measuring AI’s capability to accelerate biological research in the wet lab…
Measuring AI’s capability to accelerate biological research in the wet lab OpenAI For Science не унимается и набирает обороты — и в этот раз они поделились…