Последствия масштабного test-time compute По мере роста возможностей больших языковых моделей результаты бенчмарков (*эталонных тестов*) всё больше определяются вычислительными ресурсами на этапе инференса (*вывода модели*). Скорее всего, мы даже не знаем истинного потолка возможностей современных LLM, потому что измерить его слишком дорого. Пора менять подход к оценке моделей. Читать статью
Последствия масштабного test-time compute По мере роста возможностей больших…
Источник
https://t.me/ai_longreads/683Канал Про AI: Лучшие cтатьи и исследования · опубликовано 15 июн. 2026 г.
Из этого канала
- #684Printing Press превращает CLI в суперспособности для агентов Автор обнаружил,…
Printing Press превращает CLI в суперспособности для агентов Автор обнаружил, что командная строка — лучший интерфейс для ИИ-агентов, и рассказывает, как…
- #682Утренний AI-обзор: GitHub, Reddit, Hugging Face: MiniMax-M3 Модель использует…
Утренний AI-обзор: GitHub, Reddit, Hugging Face: MiniMax-M3 Модель использует технологию MiniMax Sparse Attention (MSA) — высокопроизводительный оператор для…
- #681Проектирование циклов с Fable 5 Лэнс Мартин из Anthropic делится практическими…
Проектирование циклов с Fable 5 Лэнс Мартин из Anthropic делится практическими советами по эффективной работе с моделями класса Mythos — самокорректирующиеся…
- #680Новая система одобрения в Pi Армин Ронахер, создатель Flask и основатель…
Новая система одобрения в Pi Армин Ронахер, создатель Flask и основатель Earendil, объясняет, почему в их ИИ-агенте Pi появился запрос на одобрение при первом…