Победители Enterprise RAG Challenge! Я поздравляю всех победителей и… — @llm_under_hood

Победители Enterprise RAG Challenge! Я поздравляю всех победителей и участников. Мы сейчас не только классное соревнование устроили, но и сделали прямо громадный research по практическому сравнению эффективности разных архитектур на конкретной бизнес-задаче. Плюс получили живой опыт работы документами и PDF (кто бодался с отчетом на 1000 страниц - ставьте 🤝) Отчеты, ссылки, посты, leaderboards, ground truth - все это мы будем выкладывать и дублировать в ближайшие недели. Итак, победители. __Теоретический максимум - 133 (100 за ответы и 33 за retrieval)__ IBM WatsonX AI Track 🏆 3. nightwalkers - 356ef42c: 96.7. Векторный RAG с deepseek-r1-distill-llama-70b и granite-embedding-107m-multilingual embeddings 2. A.Rasskazov/V.Kalesnikau - efabd48e: 109.3 multi_agent_ibm_openai - meta-llama/llama-3-405b-instruct, ibm/granite-embedding-107m-multilingual, text-embedding-3-small, gpt-4o-mini 1. Ilia Ris - 25fabf22: 120.3 PDF parsing with heavily modified Docling library + Dense retrieval + Router + Parent Document Retrieval + LLM Reranking + SO CoT + SO reparser + Majority vote (Self-Consistency); llm = llama-3.3 70b from IBM WatsonX Main Track 🏆 3. hopeless - 6b0d78ba: 117.5 __gpt-4o-2024-08-06__ Dynamic Structured Output + SEC EDGAR Ontologies Query Expansion with selecting indicators on CBOW similarity Majority Selection for several runs (works for pages and final answers) Chunking by pages only with focus on balancing pages vs tokens 2. Emil Shagiev - 0a878232: 121.6 __gpt-4o-mini-2024-07-18, gpt-4o-2024-08-06, o3-mini-2025-01-31__ 1. Query Expansion 2. Search relevant pages using with fast and cheap LLM 3. Answer questions 4. Finalize answers 1. Ilia Ris - 320a7d36: 121.6 __o3-mini__ PDF parsing with heavily modified Docling library + Dense retrieval + Router + Parent Document Retrieval + LLM Reranking + SO CoT + Majority vote (Self-Consistency); llm = o3-mini Еще раз поздравляю всех! SotA Leaderboard - в комментариях. А вообще - что вам больше всего запомнилось в этом соревновании? Я думаю про третий раунд, уже с reasoning и поглубже в бизнес. Надо такое? Ваш, @llm_under_hood 🤗 PS: Если еще хотите поучаствовать ради опыта в соревновании, то еще не поздно. Submission API я пока выключать не буду - пара команд попросила отсрочку до следующей недели.

Из этого канала