Хорошо, что новый метод не даёт погрешность в 2 раза 😨 (если кроме шуток, то в статье есть и интересные тезисы — например, какие из моделей OpenAI были обновлением/тренировкой новой базовой модели, и в целом ранжирование моделей скорее ближе к правде, чем нет)