Внезапно: новая Muse Spark от Meta* демонстрирует самые высокие показатели evaluation awareness среди всех моделей Она не просто понимает, что ее тестируют, но и называет имена тестирующих организаций (Apollo и METR) в своих цепочках мыслей, и обзывает сценарии тестирования «классическими ловушками» 😎 https://ai.meta.com/static-resource/muse-spark-safety-and-preparedness-report/
Внезапно: новая Muse Spark от Meta демонстрирует самые высокие показатели…
Из этого канала
- #9061Любимое видео сегодняшнего дня
Любимое видео сегодняшнего дня
- #9062Дженсен Хуанг сказал, что США должны сотрудничать с Китаем, потому что те уже…
Дженсен Хуанг сказал, что США должны сотрудничать с Китаем, потому что те уже могут сделать свой собственный Claude Mythos У Дваркеша Пателя вышло новое…
- #9063Как вывести ваши научные исследования на новый уровень с ИИ Если вы занимаетесь…
Как вывести ваши научные исследования на новый уровень с ИИ Если вы занимаетесь наукой – сейчас крайне важно научиться применять AI к своей задаче и встраивать…
- #9059Google выпустили SOTA модель для генерации речи Вышла Gemini 3.1 Flash TTS –…
Google выпустили SOTA модель для генерации речи Вышла Gemini 3.1 Flash TTS – новое поколение голосового движка в экосистеме Gemini.
- #9058"GPT-5.4 Pro решила задачу Эрдеша номер 1196 Она была открыта с 1968, когда…
"GPT-5.4 Pro решила задачу Эрдеша номер 1196 Она была открыта с 1968, когда Эрдеш, Саркожи и Семереди поставили в своей работе вопрос о плотности так…