"PDF Extraction Agenda — сборник множества инструментов для задачи PDF2Markdown Привет! Я Руслан Бельков — разработчик R77 AI, давно занимаюсь проблемой доставания красивого текста из PDF сканов. Эта задача особенно актуальна для RAG-систем внедряемых в существующую инфраструктуру документооборота. Мне надоело перебирать кучи разных библиотек для того, чтобы выбрать тот самый ""лучший"" инструмент для парсинга документов, и решил составить свою агенду всех пайплайнов и бенчмарков. Вот и с вами делюсь) https://github.com/dantetemplar/pdf-extraction-agenda"
"PDF Extraction Agenda — сборник множества инструментов для задачи PDF2Markdown…
Источник
https://t.me/r77_ai/188Канал R77 AI | Кейсы в ИИ (от выпускников МФТИ) · опубликовано 11 апр. 2025 г.
Из этого канала
- #189В Mr Group (вы наверняка видели в Москве их крутые высотки) сейчас год ИИ, и мы…
В Mr Group (вы наверняка видели в Москве их крутые высотки) сейчас год ИИ, и мы поехали c ними знакомиться.
- #190"Text2sql для inSales Провели демо для нашего заказчика. Делаем помощника…
"Text2sql для inSales Провели демо для нашего заказчика. Делаем помощника чат-бот для селлеров, то есть селлер спрашивает: ""А что у меня лучше всего…
- #191Вакансии у нас) Привет, я Ярослав Шмулев кофаундер и технический директор в…
Вакансии у нас) Привет, я Ярослав Шмулев кофаундер и технический директор в R77 AI и ищу себе в команду несколько LLM (NLP) инженеров и опытныго NLP-лида.
- #187Делаем свой продукт — Ищем ошибки юристов в документах с помощью AI. Привет! Я…
Делаем свой продукт — Ищем ошибки юристов в документах с помощью AI. Привет! Я Миша, PM в R77 AI.
- #186"Норникель и Данил Ивашечкин Завтра у нас подкаст с хедом эйяя ""Норникеля""…
"Норникель и Данил Ивашечкин Завтра у нас подкаст с хедом эйяя ""Норникеля"" Данилом, а вы знаете, как мы любим металлургию) Накиньте вопросов плиз, что вам…