Wan 2.5 — китайский нейрокомбайн с генерацией видео по аудио Вышла моделька Wan… — @ai_newz

Wan 2.5 — китайский нейрокомбайн с генерацией видео по аудио Вышла моделька Wan 2.5, продолжение всеми любимой в опенсорсе 2.2 версии. Можно было бы написать просто про её релиз сразу, но после него выкатили ещё кучу фич. Оказалось, что платформа теперь моделька мультимодальная и чуть ли не единственная в своём роде. Считайте сами, Wan 2.5 поддерживает вход и выход в следующих форматах: Text, Image, Video, Audio. Только запах осталось добавить. Причём видео и картинки можно редактировать промптом, и, судя по всему, всё это можно комбинировать. Например, только что появилась возможность генерации видео по аудиовходу. Что это значит? Персонажи и окружение в видео теперь могут двигаться в такт музыке! Ну и нативный липсинк, конечно же. Кроме того, обновили интерфейс и добавили удобный редактор. Полноценно монтировать там, конечно, не получится, но генерацию в целом это упрощает. В опенсорс, как и ожидалось, пока не выложили. Анонс @ai_newz

Из этого канала