"#ai_on_backend Проблема: векторные базы ищут по косинусной близости или гибридно – и то и другое связей между данными не понимает. Запрос ""найди все контракты с японскими поставщиками"" возвращает случайные японские документы (Манга Берсерк?), а не логические связи между поставщиками и контрактами. Это достаточно легко может превратиться в черную коробку — система находит что-то похожее, но не то что нужно. Бизнес платит за галлюцинации, а разработчикам сложно отладить систему. 😨 Почему так происходит? Ну ""близость в векторном пространстве"" это вообще не про смысловую связность, а про статистическую корреляцию в данных на которых обучалась эмбеддинг модель (паттерны совместной встречаемости токенов). Если проще, то документы могут быть семантически близки, но контекстуально далеки. Возможное решение – Knowledge Graph RAG Вместо тупого поиска по косинусной близости строим граф связей между сущностями в документах. Каждый узел в графе — это конкретная сущность (компания, контракт, персона), а ребра — установленная связь. Как это работает на практике: 1. LLM анализирует документы и создает структурированный граф, формирует ""долгосрочную память"" (Да, вдохновлено белковыми мозгами) 2. Вместо косинусной близости делаем траверс по графу с учетом связей 3. В результате система ""понимает"" не только что искать, но и как связаны найденные данные Главный профит тут это прозрачность и наблюдаемость. Становится возможным отслеживать весь путь решения и рассуждать о том как модель выбирала конкретные документы. Большая прозрачность в проде означает: - Более понятный дебаг – можно проследить путь обхода графа, в отличие от малопрозрачных векторных пространств (почему оно вообще сметчилось?!) - Повышаем нашу способность наблюдать, понимать и объяснять логику решения - Некоторое снижение рисков галлюцинаций – ведь данные такая система должна вытаскивать более релевантные Но честно, сам процесс построения графа может вносить ошибки – LLM может неправильно извлечь сущности или связи между ними. Это просто смещает проблему с retrieval на extraction. Microsoft уже показала в своем прошлогоднем GraphRAG исследовании, что такой подход улучшает точность в сложных кейсах с multi-hop reasoning. Тут как всегда есть компромисы – построение графов знаний может требовать более емкой предварительной обработки данных и более сложной архитектуры чем обычный векторный поиск. Как я уже писал вчера – для простых кейсов (FAQ, документация) обычный векторный поиск часто хорош и достаточен. GraphRAG имеет смысл для структурированных запросов с множественными связями между сущностями. А еще, если свернуть не туда то, переусложить граф, то наблюдаемость... будет не такой уж и хорошей :) Разбираться в запутанных графах то еще удовольствие. Еще посмотреть по теме: - mem0 - Cortex - fast-graphrag - Cognee --- Если пред вами стоит задача построить внедрить на бекенд AI систему с памятью – приходите! Я с удовольствием помогу вам в разработке @m0n0x41d 💗"
"#aionbackend Проблема: векторные базы ищут по косинусной близости или гибридно…
Из этого канала
- #430Внедряя AI на бэкенд, или в бизнес/разработческие процессы довольно часто…
Внедряя AI на бэкенд, или в бизнес/разработческие процессы довольно часто хочется использовать любимые и знакомые инструменты, и при этом...
- #431"Ваша новая AI-система на моднейшем no-code конструкторе (который вы выбрали…
"Ваша новая AI-система на моднейшем no-code конструкторе (который вы выбрали калассического внедрения на бэкенд) обходится в несколько штук баксов, но не может…
- #432#aionbackend Хочется Schema Guided Reasoning но на компилируемом языке c…
#aionbackend Хочется Schema Guided Reasoning но на компилируемом языке c сильными гарантиями системы типов? Cкомпилироваться – я дам сильные типы я не дам 😏…
- #427"Чат-бот аптеки упорно палил бюджет Коллега из е-комм аутсорса делал…
"`Чат-бот аптеки упорно палил бюджет` Коллега из е-комм аутсорса делал AI-поисковик для португальской аптеки: - ""Какое лекарство от мигрени?"" - ""Чем лечить…
- #426"Так-так-так... Топ-менеджмент все еще в восторге, а команды все так же в…
"Так-так-так... Топ-менеджмент все еще в восторге, а команды все так же в окопах. Wharton School изучили последние ~три года внедрений AI в бэкенд системы…