Победители Enterprise RAG Challenge! Я поздравляю всех победителей и участников. Мы сейчас не только классное соревнование устроили, но и сделали прямо громадный research по практическому сравнению эффективности разных архитектур на конкретной бизнес-задаче. Плюс получили живой опыт работы документами и PDF (кто бодался с отчетом на 1000 страниц - ставьте 🤝) Отчеты, ссылки, посты, leaderboards, ground truth - все это мы будем выкладывать и дублировать в ближайшие недели. Итак, победители. __Теоретический максимум - 133 (100 за ответы и 33 за retrieval)__ IBM WatsonX AI Track 🏆 3. nightwalkers - 356ef42c: 96.7. Векторный RAG с deepseek-r1-distill-llama-70b и granite-embedding-107m-multilingual embeddings 2. A.Rasskazov/V.Kalesnikau - efabd48e: 109.3 multi_agent_ibm_openai - meta-llama/llama-3-405b-instruct, ibm/granite-embedding-107m-multilingual, text-embedding-3-small, gpt-4o-mini 1. Ilia Ris - 25fabf22: 120.3 PDF parsing with heavily modified Docling library + Dense retrieval + Router + Parent Document Retrieval + LLM Reranking + SO CoT + SO reparser + Majority vote (Self-Consistency); llm = llama-3.3 70b from IBM WatsonX Main Track 🏆 3. hopeless - 6b0d78ba: 117.5 __gpt-4o-2024-08-06__ Dynamic Structured Output + SEC EDGAR Ontologies Query Expansion with selecting indicators on CBOW similarity Majority Selection for several runs (works for pages and final answers) Chunking by pages only with focus on balancing pages vs tokens 2. Emil Shagiev - 0a878232: 121.6 __gpt-4o-mini-2024-07-18, gpt-4o-2024-08-06, o3-mini-2025-01-31__ 1. Query Expansion 2. Search relevant pages using with fast and cheap LLM 3. Answer questions 4. Finalize answers 1. Ilia Ris - 320a7d36: 121.6 __o3-mini__ PDF parsing with heavily modified Docling library + Dense retrieval + Router + Parent Document Retrieval + LLM Reranking + SO CoT + Majority vote (Self-Consistency); llm = o3-mini Еще раз поздравляю всех! SotA Leaderboard - в комментариях. А вообще - что вам больше всего запомнилось в этом соревновании? Я думаю про третий раунд, уже с reasoning и поглубже в бизнес. Надо такое? Ваш, @llm_under_hood 🤗 PS: Если еще хотите поучаствовать ради опыта в соревновании, то еще не поздно. Submission API я пока выключать не буду - пара команд попросила отсрочку до следующей недели.
Победители Enterprise RAG Challenge! Я поздравляю всех победителей и…
Из этого канала
- #524Первые инсайты из Enterprise RAG Challenge r2 Мы с вами их обнаружили вместе!…
Первые инсайты из Enterprise RAG Challenge r2 Мы с вами их обнаружили вместе! Во-первых, качество извлечения документов важно для точности.
- #525"Benchmark qwen/qwq-32b - она может и больше! Итак, новая qwen/qwq-32b на моем…
"Benchmark qwen/qwq-32b - она может и больше! Итак, новая qwen/qwq-32b на моем reasoning бенчмарке показала себя лучше, чем qwen-2.5-72b-instruct и предыдущие…
- #526Финальные результаты Enterprise RAG Challenge - Team Leaderboard - оценивает…
Финальные результаты Enterprise RAG Challenge - Team Leaderboard - оценивает команды (берется лучшее решение каждой команды) - SotA Leaderboard - оценивает все…
- #522"Завтра в 10:00 по CET (UTC+1) я расскажу про победителей Enterprise RAG…
"Завтра в 10:00 по CET (UTC+1) я расскажу про победителей Enterprise RAG Challenge и новые инсайты. Встретимся в MS Teams.
- #521На чем запускать локальные модели? В нашем комьюнити очень много людей и…
На чем запускать локальные модели? В нашем комьюнити очень много людей и команд с практическим опытом локального разнообразных систем с LLM под капотом.