Hunyuan Image2Video Tencent подсуетились и следом за WAN 2.1 выложили код и веса img2video функционала для своей базовой модельки в 13B параметров. Пример выше, конечно, впечатляет, но говорят, что на деле модель плохо сохраняет лицо и слабо следует промпту. В стоке разрешение 720p с нехилыми требованиями — 60 GB VRAM, что сильно больше, чем у того же WAN. Официальная оптимизация fp8 пока в прогрессе, но умельцы уже умудрились запихнуть Хуянь в одну единственную RTX 3060. На генерацию видоса в 129 кадров (5 секунд) уходит 10 минут. В целом, модель я бы сказал проходная — она буквально ни в чём не лучше WAN, ещё и более требовательная. GitHub Hugging Face @ai_newz
Hunyuan Image2Video Tencent подсуетились и следом за WAN 2.1 выложили код и…
Из этого канала
- #3724"Нейродайджест за неделю (#59) LLM - +3.5 миллиарда в Anthropic – компания…
"Нейродайджест за неделю (#59) LLM - +3.5 миллиарда в Anthropic – компания наращивает капитал ""маленькими"", но частыми раундами, и вот зачем.
- #3725Помните, почти год назад, когда анонсировали gpt4o обещали, что она будет…
Помните, почти год назад, когда анонсировали gpt4o обещали, что она будет делать и картинки (не через Dalle как сейчас) и вообще мультимодальная донельзя, и…
- #3727Через пять минут у OpenAI начинается очередной стрим Обещают показать что-то…
Через пять минут у OpenAI начинается очередной стрим Обещают показать что-то новое для агентов в API. https://www.youtube.com/watch?v=hciNKcLwSes @ainewz
- #3721Artificial Analysis протестили QwQ 32B Модель показала себя очень хорошо для…
Artificial Analysis протестили QwQ 32B Модель показала себя очень хорошо для своего размера — местами она отстаёт лишь от o3-mini.
- #3720Создатели Reinforcement Learning получили премию Тьюринга! Эндрю Барто и Ричард…
Создатели Reinforcement Learning получили премию Тьюринга! Эндрю Барто и Ричард Саттон разработали кучу основополагающих алгоритмов в RL.