GPT-OSS 120B выдаёт 3000 токенов в секунду на Cerebras Цены не заоблачные — $0.25/$0.69👍 за миллион токенов, это дороже чем у GPU провайдеров, но в десятки раз быстрее. Groq тоже запустили у себя эту модель, но результаты менее впечатляющие — 500 токенов в секунду для 120B ($0.15/$0.75 за миллион токенов) и 1000 токенов в секунду для 20B ($0.1/$0.5 за миллион). inference.cerebras.ai @ai_newz
GPT-OSS 120B выдаёт 3000 токенов в секунду на Cerebras Цены не заоблачные —…
Из этого канала
- #2720Полистал разные бенчмарки, выглядит так, что больше всего, помимо…
Полистал разные бенчмарки, выглядит так, что больше всего, помимо кодинг-агентов, выиграло здравоохранение — модель на 120B в HealthBench почти достигает…
- #2721Вчера DeepMind представили Genie 3 — новую world model (дают такое определение:…
Вчера DeepMind представили Genie 3 — новую world model (дают такое определение: AI-системы, которые могут использовать свое понимание мира для моделирования…
- #2723В преддверии выхода GPT-5 — выжимка двух постов TheInformation (первый и…
В преддверии выхода GPT-5 — выжимка двух постов TheInformation (первый и второй): — Изначально Orion, ставший GPT-4.5, хотели сделать GPT-5.
- #2718Как спит Сама, зная, когда релиз GPT-5 и насколько она хороша:
Как спит Сама, зная, когда релиз GPT-5 и насколько она хороша:
- #2717OpenAI разродились двумя опенсурсными моделями, на 120b и 20b параметров. Обе —…
OpenAI разродились двумя опенсурсными моделями, на 120b и 20b параметров. Обе — микстуры экспертов, что означает, что несмотря на размер, если вам хватает…