"PDF Extraction Agenda — сборник множества инструментов для задачи PDF2Markdown Привет! Я Руслан Бельков — разработчик R77 AI, давно занимаюсь проблемой доставания красивого текста из PDF сканов. Эта задача особенно актуальна для RAG-систем внедряемых в существующую инфраструктуру документооборота. Мне надоело перебирать кучи разных библиотек для того, чтобы выбрать тот самый ""лучший"" инструмент для парсинга документов, и решил составить свою агенду всех пайплайнов и бенчмарков. Вот и с вами делюсь) https://github.com/dantetemplar/pdf-extraction-agenda"