Hunyuan Image2Video Tencent подсуетились и следом за WAN 2.1 выложили код и… — @ai_newz

Hunyuan Image2Video Tencent подсуетились и следом за WAN 2.1 выложили код и веса img2video функционала для своей базовой модельки в 13B параметров. Пример выше, конечно, впечатляет, но говорят, что на деле модель плохо сохраняет лицо и слабо следует промпту. В стоке разрешение 720p с нехилыми требованиями — 60 GB VRAM, что сильно больше, чем у того же WAN. Официальная оптимизация fp8 пока в прогрессе, но умельцы уже умудрились запихнуть Хуянь в одну единственную RTX 3060. На генерацию видоса в 129 кадров (5 секунд) уходит 10 минут. В целом, модель я бы сказал проходная — она буквально ни в чём не лучше WAN, ещё и более требовательная. GitHub Hugging Face @ai_newz

Из этого канала