OpenAI разродились двумя опенсурсными моделями, на 120b и 20b параметров. Обе — микстуры экспертов, что означает, что несмотря на размер, если вам хватает памяти GPU, модели быстрые: 5.1b и 3.6b активных параметров. Модели рассуждающие, поддерживают 3 типа длины рассуждений: low, medium, high. Ссылки: — https://openai.com/open-models/ — https://openai.com/index/gpt-oss-model-card/ — https://cookbook.openai.com/articles/openai-harmony — https://gpt-oss.com/ - тут можно поиграть с моделью Судя по лендингу, модели уже сегодня будут доступны на Groq и Cerebas, предлагая очень быструю генерацию. И почти все инференс-движки уже поддерживают модель. И самое крутое — как и o3, модели поддерживают вызов инструментов (поиск, Python, etc) в цепочке рассуждений. Самое некрутое: нет мультимодальности, картинки и тем более звук модели не воспринимают.
OpenAI разродились двумя опенсурсными моделями, на 120b и 20b параметров. Обе —…
Из этого канала
- #2718Как спит Сама, зная, когда релиз GPT-5 и насколько она хороша:
Как спит Сама, зная, когда релиз GPT-5 и насколько она хороша:
- #2719GPT-OSS 120B выдаёт 3000 токенов в секунду на Cerebras Цены не заоблачные —…
GPT-OSS 120B выдаёт 3000 токенов в секунду на Cerebras Цены не заоблачные — $0.25/$0.69👍 за миллион токенов, это дороже чем у GPU провайдеров, но в десятки раз…
- #2720Полистал разные бенчмарки, выглядит так, что больше всего, помимо…
Полистал разные бенчмарки, выглядит так, что больше всего, помимо кодинг-агентов, выиграло здравоохранение — модель на 120B в HealthBench почти достигает…
- #2715Посмотрел свежее интервью с тремя ключевыми сотрудниками OpenAI, стоящими за…
Посмотрел свежее интервью с тремя ключевыми сотрудниками OpenAI, стоящими за системой, выигравшей золотую медаль на международной олимпиаде по математике.
- #2714^ подписчик говорит, что, вероятно, нашел способ делать запросы к GPT-5 в…
^ подписчик говорит, что, вероятно, нашел способ делать запросы к GPT-5 в Perplexity.