Гугл выпустил новую Gemini Embedding — с мультимодальными эмбеддингами! Новая модель может нативно эмбеддить до 120 секунд видео, 6 страниц PDF ну и аудио с текстом не остались в стороне. Модель доступна как и во free tier, так и в платном API. Эмбеддинги, разумеется, сделаны матрёшкой — куски эмбеддинга сами по себе являются полноценными эмбеддингами, пусть и менее точными. Цены гугл опять повысил — за текст просят $0.2 за миллион токенов, а вот за мультимодальность цена как-то нездраво растёт — цена за видео доходит до 12 долларов за миллион токенов (15к кадров). Гугл пользуется отсутствием альтернатив — другие фронтирные компании этим не занимаются — те же OpenAI в последний раз обновляли эмбеддинг модели в январе 2024, обновив заодно GPT 3.5 Turbo и GPT 4 Turbo. @ai_newz