GPT-OSS 120B выдаёт 3000 токенов в секунду на Cerebras Цены не заоблачные — $0.25/$0.69👍 за миллион токенов, это дороже чем у GPU провайдеров, но в десятки раз быстрее. Groq тоже запустили у себя эту модель, но результаты менее впечатляющие — 500 токенов в секунду для 120B ($0.15/$0.75 за миллион токенов) и 1000 токенов в секунду для 20B ($0.1/$0.5 за миллион). inference.cerebras.ai @ai_newz
GPT-OSS 120B выдаёт 3000 токенов в секунду на Cerebras Цены не заоблачные —…
Из этого канала
- #4096Ребят, напоминаю про опрос читателей канала (вот ссылка). Пройдите пожалуйста -…
Ребят, напоминаю про опрос читателей канала (вот ссылка). Пройдите пожалуйста - это займет у вас 1 минуту, а мне поможет делать для вас контент еще лучше!…
- #4097Ничего необычного, просто исследователи из Google обнаружили что Genie 3 может…
Ничего необычного, просто исследователи из Google обнаружили что Genie 3 может эмулировать саму себя внутри симуляции.
- #4098Через 5 минут начинается стрим с анонсом GPT-5 Я буду его смотреть, важное буду…
Через 5 минут начинается стрим с анонсом GPT-5 Я буду его смотреть, важное буду постить сразу, остальное попадёт в отдельный пост с выжимкой презентации.
- #4091Мы дождались открытых моделей от OpenAI - они выкатили GPT OSS! MoE ризонеры в…
Мы дождались открытых моделей от OpenAI - они выкатили GPT OSS! MoE ризонеры в двух размерах — 20B (3.6 активных) и 120B (5.1 активных).
- #4090Вышел Claude Opus 4.1 Небольшой скачок по всем бенчам по той же цене. Тестеры…
Вышел Claude Opus 4.1 Небольшой скачок по всем бенчам по той же цене. Тестеры говорят что обновлённый Opus лучше работает в больших кодбазах и на комплексных…