😃 и это у ребят топовый бенчмарк ещё (в буквальном смысле тир-1), а не какой-то пустяковый. И средства на прогон есть, просто Opus ну очень дорогой (кстати, им же OpenAI насыпали бесплатных кредитов почти сразу для того, чтобы протестировать o3 / GPT-5. Последняя заняла там первое место с большим отрывом 👌) Big model ~~smell~~ problem