Качество ИИ-систем не одинаковое во всех 9 доменах. На первой картинке видно, что есть группы задач, в которых модели очень отстают. Вот несколько из конкретных профессий (со второй картинки) с малым качеством: — Аудио- и Видео- монтажёры — Аудиторы и бухгалтеры — Консьержи (лол) Опять же, очень рекомендую перейти на страницу датасета и внимательно прочитать, какие конкретно задачи попали в каждую группу.
Качество ИИ-систем не одинаковое во всех 9 доменах. На первой картинке видно,…
Из этого канала
- #2928Также сделали анализ проигрышных ответов от ИИ. На первой картинке — причины,…
Также сделали анализ проигрышных ответов от ИИ. На первой картинке — причины, которые указывали эксперты, почему они считают, что решение хуже, чем у человека.
- #2930На основе решений от ИИ строят модель, которая оценивает, какой выигрыш по…
На основе решений от ИИ строят модель, которая оценивает, какой выигрыш по времени и по деньгам можно ожидать при выполнении задач, схожими с теми, что…
- #2931GDPval — это лишь начальный этап. OpenAI продолжат совершенствовать подход.…
GDPval — это лишь начальный этап. OpenAI продолжат совершенствовать подход. Пожалуй, главное ограничение текущего бенчмарка — это то, что он является…
- #2925А вот и результаты — они показывают, что модели уже могут быстрее и дешевле…
А вот и результаты — они показывают, что модели уже могут быстрее и дешевле справляться с некоторыми повторяющимися, четко определёнными задачами.
- #29249 областей и 44 профессии, интеллектуальные задачи из которых отобрали в…
9 областей и 44 профессии, интеллектуальные задачи из которых отобрали в бенчмарк. 1. Недвижимость, аренда и лизинг 2. Государственные службы 3.