Полистал разные бенчмарки, выглядит так, что больше всего, помимо кодинг-агентов, выиграло здравоохранение — модель на 120B в HealthBench почти достигает уровня o3, даже на сложной выборке заданий. Можно начинать делать онлайн-клинику с AI-докторами — вот тут писал, что все промпты с пилота в Кении опубликованы 👀 (правда GPT-OSS обучалась в основном на английских текстах, поэтому для других регионов придётся или тратиться на переводчик, или пытаться вытянуть качество самостоятельно)