Когда написал разбор статьи на 5 постов с утра пораньше
Когда написал разбор статьи на 5 постов с утра пораньше
Из этого канала
- #2830"Ещё в конце июля наткнулся на репост вот этого текста парой каналов и хотел…
"Ещё в конце июля наткнулся на репост вот этого текста парой каналов и хотел написать его разгромную критику.
- #2831На помощь пришёл SWE-ReBench от команды исследователей из Nebius. Они тоже…
На помощь пришёл SWE-ReBench от команды исследователей из Nebius. Они тоже видят проблему в SWE-Bench (что он статичен и заточен на 12 очень популярных…
- #2832Ну и давайте уж сразу не отходя от кассы посмотрим на самый свежий срез за…
Ну и давайте уж сразу не отходя от кассы посмотрим на самый свежий срез за июль. Внезапно GPT-5 оказывается впереди с большим отрывом от всех, особенно на…
- #2828Сравнение с другими подходами. Оно не особо информативно, как по мне, главное…
Сравнение с другими подходами. Оно не особо информативно, как по мне, главное что MetaRM накидывает, и позволяет иметь лучшее качество даже при 4 генерациях…
- #2827Можно сказать, что на этом всё — теперь модель можно замерять на разных…
Можно сказать, что на этом всё — теперь модель можно замерять на разных бенчмарках.