Cекретная Quasar Alpha модель довольно неплоха. Погадаем, кто это? У модели 8 место в моем бенчмарке на текущий момент. Пока не совсем известно, кто это может быть, но мы можем применить дедукцию) Смотрите, у модели есть нормальный Structured Output, которым она умеет пользоваться. Это сразу сужает круг подозреваемых: (1) OpenAI (2) Fireworks SO (3) Mistral __Кстати, Google не стоит и близко, т.к. их Structured Output - это не JSON Schema, а огрызок от OpenAPI в версии VertexAI API. Он бы мой бенчмарк не вытащил.__ FireworksAI можно вычеркивать смело, новые модели - это не их формат. Остаются только OpenAI и Mistral. OpenAI слишком крупный для рекламной компании с OpenRouter - это не их профиль, а вот для небольшой французской компании Mistral - формат подойдет. Плюс, у них давно не было толковых релизов. Да и, если смотреть на `supported parameters` Quasar, то совпадений больше с предыдущими моделями Mistral, нежели с OpenAI. Профиль latency + throughput тоже похож. Так что я думаю, что секретный Quasar - это новая французская моделька. Если это так, то их стоит поздравить с хорошим результатом! Кстати, судя по профилю latency - модель относительно небольшая. То, что она так высоко забралась делает ее интересной и потенциально недорогой. Ваш, @llm_under_hood 🤗
Cекретная Quasar Alpha модель довольно неплоха. Погадаем, кто это? У модели 8…
Из этого канала
- #555Нас не волнует то, чего мы не знаем. LLM тоже На фотографии - McArthur Wheeler,…
Нас не волнует то, чего мы не знаем. LLM тоже На фотографии - McArthur Wheeler, который в 1995 году ограбил два банка. Он это делал даже без маски, т.к.
- #556"7 выводов о внедрении AI в бизнес на примерах крупных компаний TLDR; начинаем…
"7 выводов о внедрении AI в бизнес на примерах крупных компаний TLDR; начинаем со сбора evals Если кто знает больше всего про то, как внедрять OpenAI в бизнес,…
- #557Вот это 20 минутное видео я разослал всем командам, которые я курирую в области…
Вот это 20 минутное видео я разослал всем командам, которые я курирую в области внедрения AI в бизнес, чтобы они обязательно его посмотрели.
- #553Google: Agent2Agent Protocol (A2A) Google захотела сделать свой MCP протокол,…
Google: Agent2Agent Protocol (A2A) Google захотела сделать свой MCP протокол, только с крупными компаниями. Готово. Назвали его A2A (Agent2Agent).
- #552Исключительный повод написать про квантизацию (сжатие) моделей Про квантизации…
Исключительный повод написать про квантизацию (сжатие) моделей Про квантизации я обычно не пишу, т.к. в бизнес задачах их практически не используют [1].