Мультимодальная генерация в ChatGPT Наконец-то завезли нативную генерацию картинок в 4o, обещанную ещё в прошлом году. В этот раз на стрим заявился даже сам Сэм Альтман. Появилось всё то же, от чего мы восторгались в мультимодальной генерации Gemini Flash 2.0, но гораздо лучше. Хотя, судить о качестве пока рано — я быстро потестил и скажу, что фотореализм модель не генерит. Оно и ожидаемо, так как пока что LLM-ки генерят изображения хуже, чем чисто диффузионные модели. Поэтому и в шоукейсе (по крайней мере на стриме) не показали ни одного изображения в реалистичном стиле. Всё было больше стилизованным, иллюстративным. Можно, конечно попробовать сделать более фотореалистичный стиль через какой-нибудь Flux, либо вытянуть детали через диффузионный апскейлер вроде этого. Но будет уже не то пальто. Вообще, это уже какой-то тренд. Кто-то релизит какую-то прикольную фичу, которую OpenAI анонсировали 100 лет назад. А потом приходит Сэма и всех уделывает (или нет). Блогпост Тред с видосами OpenAI @ai_newz
Мультимодальная генерация в ChatGPT Наконец-то завезли нативную генерацию…
Из этого канала
- #3771Новый генератор — шлак? Генерацию картинок в 4o уже раскатили. Похоже, что…
Новый генератор — шлак? Генерацию картинок в 4o уже раскатили. Похоже, что вопреки всему, этот генератор ничем не хуже текущего топа.
- #3780"Ideogram 3.0 Рисует красиво, ничего не скажешь. Заявляют SOTA на внутренних…
"Ideogram 3.0 Рисует красиво, ничего не скажешь. Заявляют SOTA на внутренних метриках, других бенчмарков нет.
- #3781GPT-4o серьёзно апнули Модель заметно выросла по всем бенчам, особенно по…
GPT-4o серьёзно апнули Модель заметно выросла по всем бенчам, особенно по кодингу. Модель сравнялась в бенчах с новой Claude 3.7 и апдейтнутой DeepSeek V3.
- #3769Gemini 2.5 Pro Наконец-то reasoning завезли в Gemini Pro. На бенчах себя…
Gemini 2.5 Pro Наконец-то reasoning завезли в Gemini Pro. На бенчах себя показывает очень хорошо — на нескольких это SOTA, в большей части бенчей модель…
- #3768DeepSeek V3 обновили Оригинальную модель тюнили крайне мало — всего 5 тысяч…
DeepSeek V3 обновили Оригинальную модель тюнили крайне мало — всего 5 тысяч H800 часов (это менее чем 0,2% компьюта на тренировку модели), а теперь её…