Помните как Claude 4 уведомлял власти если видел серьёзное правонарушение? После выхода system card многие возмутились — ведь LLM всё ещё часто галлюцинируют и могут что-то не так понять, а потом разбирайся с органами. Но когда такой же промпт попробовали дать другим моделям, они, внезапно, тоже начали стучать регуляторам. Но это не замечали, потому что лишь Anthropic решили протестировать модель на такое. Из этого всего сделали даже шуточный бенчмарк — Snitch Bench, который проверяет насколько часто модель будет пытаться уведомлять регуляторов, если увидит (якобы) серьёзное правонарушение. Больше всех закрывает глаза на преступления o4-mini, а вот мимо последних Claude и Gemini 2.0 Flash уже не пройдёшь. Бенч @ai_newz
Помните как Claude 4 уведомлял власти если видел серьёзное правонарушение?…
Из этого канала
- #3937"Нейродайджест за неделю (#71) LLM - DeepSeek R1 обновили — теперь обходит Qwen…
"Нейродайджест за неделю (#71) LLM - DeepSeek R1 обновили — теперь обходит Qwen 3 235B, но всё ещё за Gemini 2.5 Pro и o3.
- #3938"OpenAI дают доступ к Codex подписчикам Plus Доступ уже раскатывают, лимиты…
"OpenAI дают доступ к Codex подписчикам Plus Доступ уже раскатывают, лимиты ""щедрые"", но во время высокой нагрузки их будут резать для Plus юзеров.
- #3939Claude Code теперь доступен подписчикам Pro (план за $20) Лимиты должны…
Claude Code теперь доступен подписчикам Pro (план за $20) Лимиты должны позволить Claude 4 Sonnet работать в небольших кодбазах час-два, лимиты сбрасываются…
- #3935Сегодня GPT-3 исполнилось пять лет Хороший повод вспомнить насколько всё сильно…
Сегодня GPT-3 исполнилось пять лет Хороший повод вспомнить насколько всё сильно изменилось за эти пять лет.
- #3934А вот и бенчи DeepSeek R1 0528 Прокачали знатно — модель теперь уверенно…
А вот и бенчи DeepSeek R1 0528 Прокачали знатно — модель теперь уверенно обходит Qwen 3 235B, но отстаёт от Gemini 2.5 Pro и o3, хоть и не так сильно.