NousResearch выпустили новую модель, на которую в целом во многом побоку, но вместе с ней выпустили RefusalBench, «который проверяет готовность модели быть полезной в различных сценариях, которые обычно недопустимы как в закрытых, так и в открытых моделях» — или по простому как часто модель отвечает на не безопасные вопросы. Что примечательно, GPT-5 и недавние GPT-OSS находятся в самом низу, что плохо, если вы хотите узнать, как сделать динамит в домашних условиях. Но зато OpenAI нельзя упрекнуть, что они говорят про AI Safety просто так, для прикрытия — во многих схожих бенчмарках их модели зачастую лидируют или хотя бы находятся в топе. OpenAI даже запустили конкурс (по стечению обстоятельств, он заканчивается сегодня!) на полмиллиона долларов, которые выплатят командам, предложившим лучшие способы обхода встроенного в модели механизма безопасности. Grok от Elon Musk в самом верху 🙂 — отвечает аж на половину таких запросов. Похоже, не зря недавно компанию покинул со-основатель Igor Babuschkin — он как раз выражал обеспокоенность вопросом безопасности ИИ.
NousResearch выпустили новую модель, на которую в целом во многом побоку, но…
Из этого канала
- #2811Быстрые итоги Flight 10. Это был успешный запуск, но с парой оговорок. Теперь…
Быстрые итоги Flight 10. Это был успешный запуск, но с парой оговорок. Теперь точно можно сказать, что проклятье блока V2 наконец-то побеждено, и SpaceX…
- #2812😢 хотел сегодня написать разбор двух статей а написал 0 статьи достаточно…
😢 хотел сегодня написать разбор двух статей а написал 0 статьи достаточно технические 🤓, нет ощущения, что многим будет интересно + полезно...
- #2813От одного из авторов AI 2027 слышал рассуждения, что ограничение поставок GPU в…
От одного из авторов AI 2027 слышал рассуждения, что ограничение поставок GPU в Китай носит двойной характер: это даёт меньше мощностей сейчас, в моменте, но…
- #2809Когда деньги решают не всё: по информации wired, как минимум три человека уже…
Когда деньги решают не всё: по информации wired, как минимум три человека уже успели покинуть META Superintelligence Team.
- #2805Всем тем, кто последние недели ждал нано-банану — праздник: Google официально…
Всем тем, кто последние недели ждал нано-банану — праздник: Google официально выпустили апдейт своей image-editing модели.