Какая самая маленькая LLM, которая может управлять бизнес-агентами? Участники сообщества и курса решили выяснить это и допилили SGR демку до состояния, что она внятно запустилась на Qwen3-4B 🤯 ибо: тут был спортивный интерес добиться чего то вменяемого от такого размера Среди изменений: - убрали OpenAI SDK, заменив прямыми запросами к локальной модели (llama.cpp для inference модели `Qwen3-4B-Instruct-2507-Q8_0`) - добавили инструкций в промпт, прописав явно некоторые правила - добавили еще одно reasoning поле в самое начало SGR каскада в NextStep Посмотреть эту версию можно тут: gist Спасибо @amekhrishvili за порт! Ваш, @llm_under_hood 🤗
Какая самая маленькая LLM, которая может управлять бизнес-агентами? Участники…
Из этого канала
- #638А вы знаете, что пост про демку бизнес-ассистента с SGR под капотом - это самый…
А вы знаете, что пост про демку бизнес-ассистента с SGR под капотом - это самый тщательно скрываемый секрет нашего коммьюнити? Если верить статистике Telegram,…
- #639"Попробовал в деле Schema Guided Reasoning - перевёл на неё скрипт составления…
"Попробовал в деле Schema Guided Reasoning - перевёл на неё скрипт составления протокола встречи по транскрипту встречи. Результаты: 1.
- #640⬆️ Я всегда очень рад читать такие отзывы! Здорово, что решения работают и…
⬆️ Я всегда очень рад читать такие отзывы! Здорово, что решения работают и помогают вам делать продукты с LLM под капотом точнее, умнее и быстрее.
- #636Бенчмарк новых моделей: Grok, Opus 4.1, Mistral Medium 3.1 Elon Musk что-то…
Бенчмарк новых моделей: Grok, Opus 4.1, Mistral Medium 3.1 Elon Musk что-то делает правильно.
- #635Меня сегодня спросили - есть ли идеи по поводу следующего Enterprise RAG…
Меня сегодня спросили - есть ли идеи по поводу следующего Enterprise RAG Challenge? Я сказал, что есть две: (1) Сделать ERC, как он был в прошлые два раза…