GPT-OSS 120B выдаёт 3000 токенов в секунду на Cerebras Цены не заоблачные —…

5 авг. 2025 г.47 919 views491 forwardsОткрыть в Telegram →

GPT-OSS 120B выдаёт 3000 токенов в секунду на Cerebras Цены не заоблачные — $0.25/$0.69👍 за миллион токенов, это дороже чем у GPU провайдеров, но в десятки раз быстрее. Groq тоже запустили у себя эту модель, но результаты менее впечатляющие — 500 токенов в секунду для 120B ($0.15/$0.75 за миллион токенов) и 1000 токенов в секунду для 20B ($0.1/$0.5 за миллион). inference.cerebras.ai @ai_newz

Источник

https://t.me/ai_newz/4095

Канал эйай ньюз · опубликовано 5 авг. 2025 г.

Из этого канала

#4096Ребят, напоминаю про опрос читателей канала (вот ссылка). Пройдите пожалуйста -…
Ребят, напоминаю про опрос читателей канала (вот ссылка). Пройдите пожалуйста - это займет у вас 1 минуту, а мне поможет делать для вас контент еще лучше!…
#4097Ничего необычного, просто исследователи из Google обнаружили что Genie 3 может…
Ничего необычного, просто исследователи из Google обнаружили что Genie 3 может эмулировать саму себя внутри симуляции.
#4098Через 5 минут начинается стрим с анонсом GPT-5 Я буду его смотреть, важное буду…
Через 5 минут начинается стрим с анонсом GPT-5 Я буду его смотреть, важное буду постить сразу, остальное попадёт в отдельный пост с выжимкой презентации.
#4091Мы дождались открытых моделей от OpenAI - они выкатили GPT OSS! MoE ризонеры в…
Мы дождались открытых моделей от OpenAI - они выкатили GPT OSS! MoE ризонеры в двух размерах — 20B (3.6 активных) и 120B (5.1 активных).
#4090Вышел Claude Opus 4.1 Небольшой скачок по всем бенчам по той же цене. Тестеры…
Вышел Claude Opus 4.1 Небольшой скачок по всем бенчам по той же цене. Тестеры говорят что обновлённый Opus лучше работает в больших кодбазах и на комплексных…