"Значит, Эмбеддинги. Вчера у меня в гостях был мой замечательный дружище, который сейчас работает в одной махровой компании – у них там всякие интеграции аккаунтингов, онлайн магазины и так далее. Ну, говорю же – махровая 😊 Зашел долгий разговор про эмбеддинги, начиная с ""а что с ними вообще можно сделать?"" Я весь разговор пересказывать не буду, но TLDR такой – никакие эмбеддинги им там не нужны, и старое решение работает более чем замечательно. На сам вопрос ""что сделать то можно"", я много и рассказать не смог, потому что со страхом и ненавистью RAG все понятно, а остальные кейсы хоть и крайне специфичные, но с разной скоростью всегда сваливаются в ""насколько X похоже на Y"" 😯 Мы сначала подумали что можно было-бы сделать улучшенный поиск товаров, но в итоге оказалось что улучшать попросту нечего – там сейчас очень и очень шустро поиск работает на redis c redis-search плагином. --- Но вообще хороший пример некоторого __более общего__ применения эмбеддингов это идея библиотеки semantic-router. Я уже неоднократно ее использовал для того чтобы собирать пайпланы с высоким требованием к точности ""выбора"". При том выбирать то можно почти что угодно :) Например RAG источники, правильное под-системы (агент, если хотитите. Основная идея либы), или даже выборать функций для вызовов. Последнее получается много лучше чем нативные function-calls, как минимум потому что можно добиться большей степени детерминированности и в смысле конечного результата, и в смысле работы самой системы если строим pipeline/workflow без всяких графов. На дворе 2025 год а loop-like LLM агенты до сих пор в бесконечные циклы проваливаются. Самое классное что есть под капотом у semantic-router это fastembed – быстрая векторная rust молотилка, работающая на ONNX. Оно легкое и более чем сносно работает без GPU. В общем если вам правда надо в эмбеддинги – рекомендую сразу смотреть на fastembed. А на счет ""правда"" и ""надо"" напишу позже отдельно 📝"
"Значит, Эмбеддинги. Вчера у меня в гостях был мой замечательный дружище,…
Из этого канала
- #390"Значит, вайбкодинг. За последний год с хвостиком мой голос по поводу…
"Значит, вайбкодинг. За последний год с хвостиком мой голос по поводу вайбкодинга принимал совершенно разные значения на шкале от ""Боже, это просто…
- #391Судя по количеству реакций, как минимум 10 человек меня читают с интересом.…
Судя по количеству реакций, как минимум 10 человек меня читают с интересом. Спасибо вам! Мне очень важно собрать хотя бы от половины из вас фидбек про канал и…
- #392"Значит, AI заменит программистов. В последнее время я наблюдаю радикально…
"`Значит, AI заменит программистов.` В последнее время я наблюдаю радикально позитивную тенденцию – пусть и зачастую почти беспредметно, но в популярных…
- #387"Как заставить думать обоих – машину и себя самого. В любой системе где есть…
"Как заставить думать обоих – машину и себя самого. В любой системе где есть хоть какой-то интеллект можно обнаружить так называемое концептуальное…
- #384"Эта записка только для тех кто хочет сдвинуться с мертвого места. Хотя комфорт…
"Эта записка только для тех кто хочет сдвинуться с мертвого места. Хотя комфорт это даже не ""мертвая зона"".