Hunyuan Image 2.0: Быстрая генерация изображений Как известно, генерация изображений работает не быстро, и все хотят ее ускорить, чтобы можно было открывать разные новые продуктовые возможности. Вот и Hunyuan (Tencent) представили Hunyuan Image 2.0 — real-time генератор, напоминающий Imagine Flash (только мой флеш был быстрее) или Krea Realtime. Моделька действительно шустра и в сравнении с Krea делает добротные по качеству картинки. Кожа выглядит очень реалистичной, да и в целом видно, что сделан большой упор на фотореализм. По технологии: это дистилляция большой модели в несколько шагов (моя серия постов про это). Но официальных подробностей нет. По функционалу: есть такое же, как в Krea окошко, куда можно закидывать картинки, какие-то скетчи, управлять весом картинки и AI-генератора, менять местами и подгружать свои изображения на холсте. Всё это добро в реалтайме. Ждем техрепорт и возможно код. Ведь Hunyuan любят выкладывать свои модельки (например, вот Hunyuan Image2Video). Еще они выпустили стрим в стиле OpenAI. Конечно же, ничего не понятно, но внизу есть субтитры на английском, что, в общем-то, не очень помогает. Можно глянуть пару примеров, как это работает. По бенчмаркам, модель бьёт всех конкурентов. Но если всмотреться в цифры, то DALL-E 3 лучше Flux, и я уже молчу про SD3 Medium, которую Flux.1-dev обходит по качеству очень сильно. Так что бенчмарки их очень сомнительные. hunyuan.tencent.com @ai_newz
Hunyuan Image 2.0: Быстрая генерация изображений Как известно, генерация…
Из этого канала
- #3913"TSMC — завод, который печёт будущее ваших моделей Когда вы стоите в очереди за…
"TSMC — завод, который печёт будущее ваших моделей Когда вы стоите в очереди за H100 или мечтаете о Blackwell-кластере, реальное «узкое горлышко» — не NVIDIA.
- #3914Нейродайджест за неделю (#69) (nice) LLM - Codex от OpenAI — кодинг-агент на…
Нейродайджест за неделю (#69) (nice) LLM - Codex от OpenAI — кодинг-агент на тюне o3.
- #3915😮 Google тестит дифуззионки для текста! На Google I/O показали Diffusion версию…
😮 Google тестит дифуззионки для текста! На Google I/O показали Diffusion версию Gemini.
- #3911Codex — агент для кодинга от OpenAI Внутри модель codex-1, версия o3 для…
Codex — агент для кодинга от OpenAI Внутри модель codex-1, версия o3 для агентного кодинга.
- #3908"Что случилось с Grok? На днях бот Grok для реплаев в твиттере (тот самый что…
"Что случилось с Grok? На днях бот Grok для реплаев в твиттере (тот самый что ""Grok is this true?"") слетел с катушек и в чуть ли не каждом твите начал…