Mistral Medium 3.5 Это мультимодальная dense модель на 128B, с контекстом на 256k. Обходит прошлые модели Mistral, но не дотягивает до самых больших открытых моделей. Модель единственная в своей весовой категории, все конкуренты в разы больше, так что для локального деплоя может быть неплохим вариантом. Для того чтобы модель не вела себя совсем как черепашка, опубликовали ещё и голову для спекулятивного декодинга. Просят за API этой модели $1.5/$7.5 за миллион токенов, так что смысла юзать в облаке особо нет. Лицензия открытая, но компаниям с выручкой больше $20M в месяц нужно покупать лицензию. Веса Блогпост @ai_newz
Mistral Medium 3.5 Это мультимодальная dense модель на 128B, с контекстом на…
Из этого канала
- #4557OpenAI добавили в Codex питомцев И да, его можно сделать гоблином. Ну а что,…
OpenAI добавили в Codex питомцев И да, его можно сделать гоблином. Ну а что, после роста выручки в два раза за неделю, команде можно и подурачиться.
- #4558Помните вы переживали что ваше резюме сделанное с LLM, может не пройти какой-то…
Помните вы переживали что ваше резюме сделанное с LLM, может не пройти какой-то отбор в HR-системе в месте куда откликаетесь? Можете больше не переживать, всё…
- #4559Нейродайджест за неделю (#116) Открытые модели Выложили веса Xiaomi MiMo 2.5 —…
Нейродайджест за неделю (#116) Открытые модели Выложили веса Xiaomi MiMo 2.5 — миллион токенов контекста, мультимодальность (даже аудио), неплохие агентские…
- #4555Talkie — LLM застрявшая в 1930 Есть такой жанр, тренировка LLM на исторических…
Talkie — LLM застрявшая в 1930 Есть такой жанр, тренировка LLM на исторических данных.
- #4554У Сбера вышел Kandinsky 6.0 Image Pro. Главный апдейт тут в editing. В…
У Сбера вышел Kandinsky 6.0 Image Pro. Главный апдейт тут в editing. В side-by-side модель сравнивают с Flux 2 Max и GPT Image 1.5, причём оценивают конкретные…