Присоединяюсь к вопросу. Могу только сказать, что знаю про qwen и deepseek ocr. По качеству более менее, но есть проблемы с зацикливанием и с галлюцинациями, особенно на плохих сканах. Кто-нибудь сталкивался? Есть решение?
Присоединяюсь к вопросу. Могу только сказать, что знаю про qwen и deepseek ocr.…
0 viewsОткрыть в Telegram →
Из этого канала
- #5845ASR https://github.com/salute-developers/GigaAM
ASR https://github.com/salute-developers/GigaAM
- #5846недавно вышел https://huggingface.co/microsoft/VibeVoice-ASR но он такой…
недавно вышел https://huggingface.co/microsoft/VibeVoice-ASR но он такой огромный. Гигу можно на cpu крутить. vibe voice еще не тестил
- #5847https://huggingface.co/Qwen/Qwen3-ASR-1.7B
https://huggingface.co/Qwen/Qwen3-ASR-1.7B
- #5843ребятки, вопросик есть лучшие модельки прямо сейчас локальные для OCR и ASR для…
ребятки, вопросик есть лучшие модельки прямо сейчас локальные для OCR и ASR для русского языка? по вашему опыту
- #5842я своей работой доволен максимально
я своей работой доволен максимально