Почему SWE-bench Verified больше не измеряет возможности фронтирного кодирования SWE-bench Verified все больше подвержен контаминации данных. OpenAI рекомендует переходить на SWE-bench Pro для оценки возможностей моделей в программировании. Читать статью