"Языковая 3Д-генерация. У нас есть некоторое количество сервисов для 3Д-генерации, о которых я неоднократно писал. Проблема там в основном в топологии (каша) и в качестве текстур. Плюс в ограниченности сцены - как правило это один объект. Уже неделю как интернет бомбит от связки Блендора и Клода 3.7 через MCP, о которой я тоже писал. Ну и действительно, поглядите на пример. Все, что потребовалось здесь, это сгенерировать картинку, а потом сказать Клюду: ""Recognize any elements of this scene individually. Describe them precisely, then build them in a scene."" ""Распознай все элементы этой сцены по отдельности. Опишите их точно, а затем сделай из них сцену"". ""Традиционные"" 3Д-генераторы тоже пытаются распознать картинку, потом сгенерить ее с разных ракурсов, а потом восстановить 3Д из нескольких картинок. А Клод пытается ""собрать\отрендерить сцену"" с помощью, грубо говоря, скриптов для Блендора - запуская разные команды, о которых он в курсе. Процедурное моделирование на стрероидах LLM. Понятно, что пока довольно примитивные сцены, понятно, что замоделить голову неведомого ему персонажа будет сложновато, но дайте время. Интересно подумать, над специальным файнтюном как для распознавания картинок, так и для (и особенно) для Блендора. Файнтьюн, который обучен на последовательностях действий и сценах. Просто сцены, которые генерит Клод, отлично редактируются, анимируются - это нормальная геометрия, а не обмылки из 3Д-генераторов. Интересно, посмотреть, что будет дальше. @cgevent"
"Языковая 3Д-генерация. У нас есть некоторое количество сервисов для…
Из этого канала
- #6210Тут кто-то сделал графическую обертку для Gemini Flash, теперь можно рисовать…
Тут кто-то сделал графическую обертку для Gemini Flash, теперь можно рисовать наброски и допиливать их с помощью текста.
- #6211Stability AI запилили интересную штуку — Stable Virtual Camera. По одной или…
Stability AI запилили интересную штуку — Stable Virtual Camera. По одной или нескольким фотографиями генерирует плавное видео, имитируя движение камеры.
- #6212Теперь роботы-пылесосы будут выглядеть так. Киберпанк, который мы зслужили.
Теперь роботы-пылесосы будут выглядеть так. Киберпанк, который мы зслужили.
- #6200Принес вам позалипать на ночь. Это визуализация выходных сигналов трансформера…
Принес вам позалипать на ночь. Это визуализация выходных сигналов трансформера (архитектура, на которой работают почти все современные LLM: ChatGPT, Claude,…
- #6196Было слегка скучно, потому я игрался с новым Gemini, проверял консистентность…
Было слегка скучно, потому я игрался с новым Gemini, проверял консистентность генерируемых картинок.