На чем запускать локальные модели? В нашем комьюнити очень много людей и команд с практическим опытом локального разнообразных систем с LLM под капотом. Это видно по RAG решениям на ERC, обсуждениям в чате и представлениям в группе курса. А давайте поговорим про то, как вы запускаете свои системы для пользователей? Речь не столько про запуск через ollama на ноутбуке, сколько про разворачивание системы для 5-30 одновременных пользователей (скорее throughput, чем latency). - Какие модели используете? - Как заводите Structured Outputs (если используете)? - Какое железо и inference framework под капотом, с какими параметрами? - Сколько tokens per second получается выжать и с какими контекстами. Но, самое главное, как оно вообще вам на практике? Ваш, @llm_under_hood 🤗 PS: Если кажется, что в комментариях дискуссия прервалась - она могла отвязаться от обсуждения и провалиться в чат канала: @llm_driven_products. PPS: Если впервые заходите в чат, пожалуйста, не игнорируйте запрос от нашего бота. Он бдит, банит ботов и не понимает шуток.
На чем запускать локальные модели? В нашем комьюнити очень много людей и…
Из этого канала
- #522"Завтра в 10:00 по CET (UTC+1) я расскажу про победителей Enterprise RAG…
"Завтра в 10:00 по CET (UTC+1) я расскажу про победителей Enterprise RAG Challenge и новые инсайты. Встретимся в MS Teams.
- #523Победители Enterprise RAG Challenge! Я поздравляю всех победителей и…
Победители Enterprise RAG Challenge! Я поздравляю всех победителей и участников. Мы сейчас не только классное соревнование устроили, но и сделали прямо…
- #524Первые инсайты из Enterprise RAG Challenge r2 Мы с вами их обнаружили вместе!…
Первые инсайты из Enterprise RAG Challenge r2 Мы с вами их обнаружили вместе! Во-первых, качество извлечения документов важно для точности.
- #520Презентация «The Power of Context» от Stefan Gillich (директор AI GTM в Intel).…
Презентация «The Power of Context» от Stefan Gillich (директор AI GTM в Intel). Основная часть довольно техническая, но потом он отвечал на вопросы из нашего…
- #519Самые популярные архитектуры в Enterprise RAG Challenge Вот вам краткая выжимка…
Самые популярные архитектуры в Enterprise RAG Challenge Вот вам краткая выжимка того, что люди использовали во время Enterprise RAG Challenge round 2.