Нашелся лидерборд: https://arcprize.org/leaderboard Кратко: – Gemini 3.1 Pro: 0.2% за 2.2к$ – Opus 4.6: 0.2% за 8.9к$ (!) – GPT-5.4: 0.3% за 5.2к$ – Grok 4.20: 0.0% за 3.8к$ (хаха)
Нашелся лидерборд: https://arcprize.org/leaderboard Кратко: – Gemini 3.1 Pro:…
Из этого канала
- #8929Отрывок из новой статьи Теренса Тао ⬆️ А вот отрывок из сопутствующего блога:…
Отрывок из новой статьи Теренса Тао ⬆️ А вот отрывок из сопутствующего блога: Один из аргументов для теоремы 1.4 был предложен мне ChatGPT, так как я ранее не…
- #8931Вайбкодить теперь можно даже виртуальную реальность Google выкатили Vibe Coding…
Вайбкодить теперь можно даже виртуальную реальность Google выкатили Vibe Coding XR – платформу для генерации AR/VR интерфейсов из промпта.
- #8933Meta представили TRIBE v2 – открытый симулятор человеческого мозга Это модель,…
Meta представили TRIBE v2 – открытый симулятор человеческого мозга Это модель, которая предсказывает, как будет активироваться мозг человека, когда он что-то…
- #8927⚡️ Вышел ARC-AGI-3 – новая версия бенчмарка Шолле и первый интерактивный тест…
⚡️ Вышел ARC-AGI-3 – новая версия бенчмарка Шолле и первый интерактивный тест для эвала агентов В первых двух версиях задачки были статичные.
- #8926MWS Cloud запустила MWS GPT Model Hub - сервис по работе с большими языковыми…
MWS Cloud запустила MWS GPT Model Hub - сервис по работе с большими языковыми моделями.