"AI-ассистент для разработчиков — кейс для ""АльфаБанк"". Разбираем: — pipeline RAG (LLM + vector DB + retrieval) — где теряются релевантные документы — почему top-k не спасает — как embeddings влияют на поиск — что даёт перефраз запроса — кейсы, где chunking делает только хуже Плюс: — реальный фейл: система не отвечает на очевидный вопрос — пошаговый разбор, где именно всё ломается Для тех, кто уже делал RAG и понял, что ""что-то не работает"", ну или будет делать) https://youtu.be/LnNkMMb9jT8 https://vkvideo.ru/video-228941334_456239067"