"Релиз линейки gpt-5 - это самый крутой подарок от OpenAI разработчикам.… — @llm_under_hood

"Релиз линейки gpt-5 - это самый крутой подарок от OpenAI разработчикам. Включая тех, кто хочет запускать мощные модели на старых картах. Смотрите. (1) gpt-oss-120B занимает 5 место в бизнес бенчмарке при использовании SGR. И заодно 4-е место в виде gpt-5-mini (ибо модели идентичны). (2) это модель с открытыми весами. Бери и используй. Качаем тут. (3) 120B запускается неплохо (10-30 tokens per second) на старых картах (5-8GB VRAM для attention в bf16) и простой оперативке (советуют 64GB)! Это все благодаря Mixture of experts архитектуре, которая использует только часть весов. Про запуск 120B - можно почитать на Reddit. Если кратко у llama есть переключатель —cpu-moe, который позволяет использовать всякие 3060Ti или 3090 для запуска модели. ""Yeah, I'm now also hitting > 30T/s on my 3090"" Пишите сюда, если получится запустить модель из верха бенчмарка на карте, от которой такого не ожидали. Порадуемся вместе) Ваш, @llm_under_hood 🤗 PS: в ollama еще не завезли. Следить тут."

Из этого канала