Google выпустил мультимодальную embedding-модель: Gemini Embedding 2 Работает с текстом, изображениями, видео, аудио и PDF В бенчмарках обходит всех конкурентов. Других моделей, покрывающих такой спектр задач, вроде бы, пока нет https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-embedding-2/