Была еще идея запилить датасет агентом синтетический и дообучить модель эмбрендингов под задачу в гугл ноуте. Но у меня не хватает экспертизы это оценивать здраво. С самим процессом обучения справится агент через коллаб MCP. Там как минимум траблы с мультиязычностью уже видны при поверхностном ресерче, разумнее наверное не трогать то что работает, непонятно вообщем Может придется изобрести бенч) для такого эксперимента
Была еще идея запилить датасет агентом синтетический и дообучить модель…
0 viewsОткрыть в Telegram →
Из этого канала
- #6563И еще интересны перспективные сетки помимо tor, i2p и p2p, я хочу добавить…
И еще интересны перспективные сетки помимо tor, i2p и p2p, я хочу добавить параллели при отказе
- #6564Привет! У кого-то был опыт реально работающей RAG базы знаний? Связка…
Привет! У кого-то был опыт реально работающей RAG базы знаний? Связка qwen3.5:9b и bge-m3 на GPU дает хорошие ответы только на простых тестовых документах.
- #6565Я в итоге прокопал в модели побольше. У малых моделей проблемы пока что как с…
Я в итоге прокопал в модели побольше. У малых моделей проблемы пока что как с мозгами, так и с тул-колингом. Qwen 27b уже имеет смысл пробовать. Или gemma 4
- #6561но bm25 не так круто канеш
но bm25 не так круто канеш
- #6560Там можешь погуглить ресерч
Там можешь погуглить ресерч