Для совсем ленивых или тех кто вообще не в теме, вот выжимка из дока от NotebookLM в любезном переводе gpt: Встраивания — это низкоразмерные числовые представления реальных данных, таких как текст, изображения и аудио, разработанные для захвата семантического значения и отношений путем размещения похожих объектов ближе в векторном пространстве. Они имеют решающее значение для эффективной обработки и хранения крупномасштабных мультимодальных данных и используются в различных приложениях, таких как поиск, рекомендации и обнаружение мошенничества. В техническом документе рассматриваются различные типы встраиваний, включая встраивание текста (встраивание слов и документов с использованием таких методов, как Word2Vec, GloVe, Doc2Vec, и тех, которые получены из больших языковых моделей, таких как BERT и Gemini), встраивание изображений и мультимодальное встраивание, встраивание структурированных данных и встраивание графов. Качество моделей встраивания оценивается на основе их способности извлекать похожие элементы и исключать несхожие, используя такие метрики, как точность, полнота и nDCG. Векторный поиск — это мощный метод, который выходит за рамки сопоставления ключевых слов путем поиска значения в различных модальностях данных с использованием встроенных семантических представлений. Эффективный векторный поиск опирается на алгоритмы Approximate Nearest Neighbor (ANN), такие как Locality Sensitive Hashing (LSH), KD-деревья, Ball-деревья, Hierarchical Navigable Small Worlds (HNSW) и ScaNN, чтобы преодолеть ограничения линейного поиска в больших наборах данных. Векторные базы данных — это специализированные системы, предназначенные для хранения, управления и запроса вложений в масштабе для производственных сред, решая такие проблемы, как масштабируемость, доступность и согласованность данных. Примерами являются Vertex Vector Search от Google Cloud, AlloyDB, Cloud SQL Postgres и Pinecone. Встраивания и векторные хранилища позволяют использовать многочисленные приложения, в частности Retrieval Augmented Generation (RAG), который объединяет извлечение соответствующих документов с использованием семантического поиска с большими языковыми моделями для генерации более точных и фактических ответов с указанием источника. Выбор модели встраивания и векторной базы данных должен основываться на конкретных данных, варианте использования, бюджете и бизнес-потребностях.
Для совсем ленивых или тех кто вообще не в теме, вот выжимка из дока от…
144 viewsОткрыть в Telegram →
Из этого канала
- #281А это точно computer autopilot? 😈 Просто сильно похоже на прилизанный…
А это точно computer autopilot? 😈 Просто сильно похоже на прилизанный browser-use Выглядит конечно здорово. Отличный пример как надо воровать опенсорс 😃
- #283"Короче, сижу я такой наслаждаюсь своей ноотропной таблеткой с Шен Пуэром и…
"Короче, сижу я такой наслаждаюсь своей ноотропной таблеткой с Шен Пуэром и начинаю затаскивать в наш проект локальный энкодер семантик роутера (чтобы каждый…
- #285Вот и кончилась неделя интесива про LLM трансформеры и все что вокруг них от…
Вот и кончилась неделя интесива про LLM трансформеры и все что вокруг них от Google/Kaggle. тут написал небольше резюме по 3-ему и оставшимся дням.
- #277"Честно говоря, даже не знаю, что рассказать про WhitePaper о эмбеддингах и…
"Честно говоря, даже не знаю, что рассказать про WhitePaper о эмбеддингах и векторных хранилищах из вчерашнего дня интенсива.
- #274У нас было 2 кластера TPU, 75 слоев семантик роутера, полдюжины мелких…
У нас было 2 кластера TPU, 75 слоев семантик роутера, полдюжины мелких PydanticAI агентов, половина квоты Google Cloud и целое множество мелких опенсорсных…