Higgsfield Soul - новая text2image модель? Ребята явно решили замахнуться на кусок пирога Midjourney. В твиттере сейчас только о них и говорят, называя их новый генератор картинок Soul самым реалистичным и эстетичным. Но так ли это? Higgsfield — это изначально апка с видеогенераторами. Я про нее никогда не писал, потому что в целом это аггретатор моделей, а не какая-то новая модель. Просто на сайте есть куча пресетов и нейроэффектов (по сути, LoRA для видео). Иногда это даёт прикольный результат, и для определённых задач выходит лучше и быстрее, чем пытаться добиться того же через промпт в другом генераторе. Для художников удобно, но с технической точки зрения ничего любопытного. А теперь про их новую t2i-модель — Soul. Судя по черри-пикам в твиттере, это и правда очень красивая и реалистичная модель. Что мы видим на самом сайте? Куча готовых пресетов и стилей. Я взял рандомный промпт из галереи (отмечу, что все они там очень длинные) и провёл тесты: 1. Оригинальный промпт + оригинальный пресет «office beach». 2. Оригинальный промпт + пресет «general» (то есть базовая, не затюненная версия модели). 3. Другой промпт из галереи + оригинальный пресет «office beach». 4. Другой промпт + его родной пресет «movie». 5. Другой промпт + пресет «general». Для сравнения я прогнал те же промпты через Runway (6,7) и Flux dev (8,9). Итог предсказуем: магии не случилось. Удивлен, что generation diversity ≈ 0, что видно из последней пикчи (10), они больше похожи на вариации одной общей картинки, а не на новые изображения. Есть подозрение, что они просто берут случайную фотку из трейна (ближайшуюу по клип скору) по заданному стилю и в этом же стиле перерисовывают, помешивая промпт и добавляя LoRA. По сути, это тот же Flux либо HiDream, но с пачкой действительно качественных LoRA-пресетов. Какие-то вещи повторить быстро и легко можно, но вряд ли выйдет создать что-то принципиально новое. И что самое ироничное, со всеми этими «четырёхэтажными» промптами, которые даже не влезли в лимит Runway в 1000 знаков, последний, по-моему, справился даже лучше! Может, чуть меньше реализма, но с точки зрения стиля, атмосферы и эстетики... Просто посмотрите на ковбоя от Runway. P.S. Все генерации сделаны с первого раза. higgsfield.ai @ai_newz
Higgsfield Soul - новая text2image модель? Ребята явно решили замахнуться на…
Из этого канала
- #4011"Над Cursor сгущаются тучи Тут вокруг самой популярной тулы для вайбкодинга…
"Над Cursor сгущаются тучи Тут вокруг самой популярной тулы для вайбкодинга возник небольшой скандал.
- #4012Нейродайджест за неделю (#76) Стартапы и бизнес - Что я делаю как CEO — о…
Нейродайджест за неделю (#76) Стартапы и бизнес - Что я делаю как CEO — о важном 😎 - AWS — Акселератор от Амазона для AI-стартапов, подача до 10-го июля.
- #4013Вышел доклад от François Chollet, который я слушал ещё 3 недели назад в…
Вышел доклад от François Chollet, который я слушал ещё 3 недели назад в Сан-Франциско на YC AI Startup School.
- #4000Восхождение Oracle Тут SemiAnalysis написали прекрасный отчёт о том, как…
Восхождение Oracle Тут SemiAnalysis написали прекрасный отчёт о том, как поднялся этот компьют-гигант.
- #3999Turbo ML Conf Я часто пишу про конференции типа CVPR и ECCV и о том, почему…
Turbo ML Conf Я часто пишу про конференции типа CVPR и ECCV и о том, почему это важно. Но не у всех есть возможность кататься по таким крупным ивентам.