Привет! У кого-то был опыт реально работающей RAG базы знаний? Связка qwen3.5:9b и bge-m3 на GPU дает хорошие ответы только на простых тестовых документах. По настоящим 100 страничным методологиям отвечает очень плохо Куда копать? Может Графовый РАГ?
Привет! У кого-то был опыт реально работающей RAG базы знаний? Связка…
0 viewsОткрыть в Telegram →
Из этого канала
- #6565Я в итоге прокопал в модели побольше. У малых моделей проблемы пока что как с…
Я в итоге прокопал в модели побольше. У малых моделей проблемы пока что как с мозгами, так и с тул-колингом. Qwen 27b уже имеет смысл пробовать. Или gemma 4
- #6566граф раг pageindex semantic (llm-based chunking) parent child chunking agentic…
граф раг pageindex semantic (llm-based chunking) parent child chunking agentic rag
- #6567Интересный результат, ведь по сути модель получает 5 чанков с контекстом…
Интересный результат, ведь по сути модель получает 5 чанков с контекстом максимум 8к токенов, из которых надо слепить ответ Неочевидно, как помогает большая…
- #6563И еще интересны перспективные сетки помимо tor, i2p и p2p, я хочу добавить…
И еще интересны перспективные сетки помимо tor, i2p и p2p, я хочу добавить параллели при отказе
- #6562Была еще идея запилить датасет агентом синтетический и дообучить модель…
Была еще идея запилить датасет агентом синтетический и дообучить модель эмбрендингов под задачу в гугл ноуте.