Один из интересных графиков в статье с анализом поведениям моделей авторами статей. GPT думает гораздо больше перед тем, как начать писать какой-либо код. (Однако это может быть артефактом и обосновано тем, что модель заканчивает раньше из-за плохой обёртки, поэтому процент по оси OX посчитан по гораздо меньшему количеству шагов)