Добавил в новость про китайские модели упоминание DeepSeek-OCR-2. Новый энкодер у них и правда интересный, не растр сканирует как все, а объекты, и соответственно порядок визуальных токенов получается иной. Теперь и энкодеры у нас с ризонингом! Из забавного, DeepSeek использует чужой энкодер от Qwen.
Добавил в новость про китайские модели упоминание DeepSeek-OCR-2. Новый энкодер…
Из этого канала
- #4655Новый энкодер DeepSeek-OCR-2
Новый энкодер DeepSeek-OCR-2
- #4656Интересный кейс создания нетривиального софта от Нвидии: VibeTensor: System…
Интересный кейс создания нетривиального софта от Нвидии: VibeTensor: System Software for Deep Learning, Fully Generated by AI Agents Bing Xu, Terry Chen,…
- #4660Ещё одна работа про агентов для автоматизации ИИ-исследований (ИИИ). Эта прям…
Ещё одна работа про агентов для автоматизации ИИ-исследований (ИИИ). Эта прям заземляет всё на практику, чтобы агенты делали код, который работает и работает…
- #4648Maia 200: Ускоритель для инференса от Microsoft Вчера был интересный анонс от…
Maia 200: Ускоритель для инференса от Microsoft Вчера был интересный анонс от Microsoft, они сделали свой чип для инференса, Maia 200…
- #4643Обучаться во время экзамена — зыко! Что отдельно интересно, это слияние…
Обучаться во время экзамена — зыко! Что отдельно интересно, это слияние обучения с инференсом.