Not Boring Tech@notboring_tech· 20 707 subs

🐬 ByteDance дропнули самую точную OCR-модель для распознавания любых PDF —…

14 июн. 2025 г.8 555 views511 forwardsОткрыть в Telegram →

🐬 ByteDance дропнули самую точную OCR-модель для распознавания любых PDF — Dolphin превращает в оформленный текст фотки документов, сканы отчётов и даже научные статьи. Нейронка сохраняет форматирование и вытаскивает содержимое — абзацы, таблицы, диаграммы, рисунки и формулы. Можно точечно парсить даже отдельные элементы (например, таблицы). GitHub лежит тут, демка — тут. @notboring_tech

Источник

https://t.me/notboring_tech/3621

Канал Not Boring Tech · опубликовано 14 июн. 2025 г.

Из этого канала