📜 Datalab выпустили лучшую OCR-модель — Chandra максимально точно извлекает всё содержимое из любых изображений и PDF-документов. • Превращает фотки и файлы в структурированные форматы HTML, Markdown и JSON. • Сохраняет макет и отлично вытаскивает таблицы, формулы, диаграммы и даже рукописный текст. • Поддерживает более 40 языков. • Возглавляет все независимые бенчмарки, обгоняя DeepSeek OCR, Mistral OCR и других конкурентов. • Модель Chandra доступна как локально, так и удалённо. GitHub — здесь, а бесплатная демка — тут. @notboring_tech
📜 Datalab выпустили лучшую OCR-модель — Chandra максимально точно извлекает всё…
Из этого канала
- #3897🤯 Вау: вышла команда ИИ-учёных, которая проводит настоящие исследования от…
🤯 Вау: вышла команда ИИ-учёных, которая проводит настоящие исследования от начала до конца — они размышляют, планируют, спорят, экспериментируют, кодят и пишут…
- #3901🦙 Вышел полностью локальный ChatGPT — Llama.cpp наконец-то получил юзер-френдли…
🦙 Вышел полностью локальный ChatGPT — Llama.cpp наконец-то получил юзер-френдли интерфейс в вебе, который полностью работает у вас дома.
- #3903🚨 Для Chrome выпустили годное расширение, которое фиксит любые сайты — Tweeks…
🚨 Для Chrome выпустили годное расширение, которое фиксит любые сайты — Tweeks по вашему запросу генерирует плагины для конкретных страниц.
- #3894📚 Лучшие лекции для изучения нейронок с нуля за всю историю канала — собрал…
📚 Лучшие лекции для изучения нейронок с нуля за всю историю канала — собрал шедевры от Андрея Карпаты, гениев из Стэнфорда и других гуру.
- #3893🍯 HuggingFace выложили бесплатную книгу на 200 страниц о том, как обучать…
🍯 HuggingFace выложили бесплатную книгу на 200 страниц о том, как обучать нейросети с нуля — Smol Training Playbook.