DeepSeek выпустили веса R1, своей reasoner модели Как обычно, компания сначала… — @ai_newz

DeepSeek выпустили веса R1, своей reasoner модели Как обычно, компания сначала релизит веса, и лишь потом техрепорты и бенчмарки. Так что пока что у нас есть лишь результаты Preview версии на LiveCodeBench, где R1-Preview тягается по качеству с o1. Важный контекст к табличке - в отличие от o1, мы не знаем насколько много компьюта использовали для получения таких результатов от R1. Если бенчили аналог low-compute режима OpenAI, то модель может в итоге оказаться сильнее чем o1. Основана R1 на DeepSeek V3 (685 миллиардов параметров), так что требования для запуска модели такие же - 8xH200. Пока ждём техрепорта, можно поспекулировать в чём разница между R1 и R1-Zero. Веса R1 Веса R1-Zero @ai_newz

Из этого канала