Экономика reasoning моделей Когда OpenAI анонсировали o1 модель, то стало понятно, что механизм ее работы заметно меняет экономику LLM провайдеров: если ранее они много тратили на претрейнинг модели, а потом использовали эту модель миллиарды раз, то по классике наслаждались эффектом масштаба (постоянные издержки, размазанные на кучу запросов). С o1 же все не совсем так: ведь при подготовке ответа модель генерирует много вариантов ответов, «усредняет» их каким-то правилом —> каждый запрос генерирует кучу переменных издержек. Но я рискну предположить, что это временная ситуация: нагенерив миллиарды «chain of thought” размышлений, они заново запустят пре-трейнинг и опять переведут это в постоянные издержки. А вы как считаете?