9 областей и 44 профессии, интеллектуальные задачи из которых отобрали в бенчмарк. 1. Недвижимость, аренда и лизинг 2. Государственные службы 3. Производство 4. Профессиональные, научные и технические услуги 5. Здравоохранение и социальная помощь 6. Финансы и страхование 7. Розничная торговля 8. Оптовая торговля 9. Работа с информацией Пусть вас не путает наличие «производства» — задачи, для которых требуется физическое исполнение, не покрыты бенчмарком намеренно. В этот раздел могут входить задачи про чертежи, закупку оборудования, проверку накладных.
9 областей и 44 профессии, интеллектуальные задачи из которых отобрали в…
Из этого канала
- #2925А вот и результаты — они показывают, что модели уже могут быстрее и дешевле…
А вот и результаты — они показывают, что модели уже могут быстрее и дешевле справляться с некоторыми повторяющимися, четко определёнными задачами.
- #2926Качество ИИ-систем не одинаковое во всех 9 доменах. На первой картинке видно,…
Качество ИИ-систем не одинаковое во всех 9 доменах. На первой картинке видно, что есть группы задач, в которых модели очень отстают.
- #2928Также сделали анализ проигрышных ответов от ИИ. На первой картинке — причины,…
Также сделали анализ проигрышных ответов от ИИ. На первой картинке — причины, которые указывали эксперты, почему они считают, что решение хуже, чем у человека.
- #2923"В уставе OpenAI AGI, artificial general intelligence, определяется так:…
"В уставе OpenAI AGI, artificial general intelligence, определяется так: высокоавтономные системы, которые превосходят людей в большинстве экономически ценных…
- #2920Прикольно, мне ChatGPT Pulse подсказывает какие у Vibe moat нужно развивать,…
Прикольно, мне ChatGPT Pulse подсказывает какие у Vibe moat нужно развивать, какие метрики считать для предсказания виральности, как растить ретеншен