У Сбера вышел Kandinsky 6.0 Image Pro. Главный апдейт тут в editing. В side-by-side модель сравнивают с Flux 2 Max и GPT Image 1.5, причём оценивают конкретные вещи: как правка встраивается в сцену, сохраняются ли стиль, геометрия, лицо, фон и локальная консистентность. Именно на этом обычно сыпятся image editing модели. По скорости тоже прирост: больше 40% к прошлой версии за счёт MoE, распараллеливания инференса и оптимизации внимания. Самая интересная часть — Image RAG. Модель подтягивает релевантные изображения в контекст и точнее попадает в специфические штуки, которые в обычной генерации легко превращаются во «что-то примерно славянское». Из кейсов: удаление объектов и надписей, замена предметов с сохранением стиля, стилизация с сохранением лица, реставрация архивных фото, интерьеры по плану и фасады одним промтом. Анонс @ai_newz
У Сбера вышел Kandinsky 6.0 Image Pro. Главный апдейт тут в editing. В…
Из этого канала
- #4555Talkie — LLM застрявшая в 1930 Есть такой жанр, тренировка LLM на исторических…
Talkie — LLM застрявшая в 1930 Есть такой жанр, тренировка LLM на исторических данных.
- #4556Mistral Medium 3.5 Это мультимодальная dense модель на 128B, с контекстом на…
Mistral Medium 3.5 Это мультимодальная dense модель на 128B, с контекстом на 256k.
- #4557OpenAI добавили в Codex питомцев И да, его можно сделать гоблином. Ну а что,…
OpenAI добавили в Codex питомцев И да, его можно сделать гоблином. Ну а что, после роста выручки в два раза за неделю, команде можно и подурачиться.
- #4553Xiaomi MiMo V2.5 вышла в опенсорс Выложили две версии — Pro с 1.02T-A42B и…
Xiaomi MiMo V2.5 вышла в опенсорс Выложили две версии — Pro с 1.02T-A42B и обычная с 310B-A15B, обе поддерживаются миллион токенов контекста.
- #4552Очередное напоминание что арена — мусор если речь идёт об оценке LLM (и не…
Очередное напоминание что арена — мусор если речь идёт об оценке LLM (и не только LLM) Ну и давайте воспользуемся поводом чтобы обсудить методы оценки моделей.