Нейродайджест за неделю (#81) LLM - Вышел Claude Opus 4.1 — Небольшой скачок по всем бенчам, лучше работает в больших кодбазах. Уже доступен в подписке, API и Claude Code. - GPT-OSS от OpenAI — OpenAI впервые за 6 лет выкатили открытые LLM — два MoE-ризонера (20B и 120B). Старшая модель обгоняет o4-mini на бенчах. - GPT-OSS 120B на Cerebras — Выдаёт 3000 токенов/сек, Groq показывает более скромные 500 токенов/сек. - Анонс GPT-5 — OpenAI представили новую флагманскую модель (с не однозначными плотами😳), объявили цены и уже закончили роллаут. Генеративные модели - Qwen Image — Новый открытый 20B-генератор картинок от Alibaba. Хорошо справляется с текстом и редактированием на уровне GPT-4o и FLUX Kontext. - Genie 3 — SOTA World Model от Google, нейронный игровой движок. Генерирует риал-тайм интерактивные миры в 720p, которые помнят действия пользователя на протяжении нескольких минут. - Рекурсия Genie 3 — Ничего необычного просто Genie симулирует Genie внутри себя. Прочее - Проклятый бенчмарк для VLM — VLMBias показывает, что визуальные модели подвержены стереотипам и часто игнорируют реальные изменения на картинках, полагаясь на заученные знания. - Опрос — Еще разок напоминаю пройти опросик для канала, чтобы всем жилось лучше. > Читать дайджест #80 #дайджест @ai_newz
Нейродайджест за неделю (#81) LLM - Вышел Claude Opus 4.1 — Небольшой скачок по…
Из этого канала
- #4106Контекст Claude 4 Sonnet расширили до миллиона токенов Апдейт запустили в бете…
Контекст Claude 4 Sonnet расширили до миллиона токенов Апдейт запустили в бете для клиентов Tier 4 — это те кто купили API кредитов на $400+.
- #4107Технологическая платформа Авито запускает AI лабу с прикладным уклоном…
Технологическая платформа Авито запускает AI лабу с прикладным уклоном Заниматься будут генеративными моделями, компьютерным зрением, распознаванием голоса,…
- #4108Artificial Analysis начали проверять API провайдеров на точность Начали пока…
Artificial Analysis начали проверять API провайдеров на точность Начали пока что с GPT OSS 120B, хотя такую практику стоило бы расширить и на другие модели.
- #4102Абсолютно проклятый бенч для VLM Визуальные модели крайне подвержены…
Абсолютно проклятый бенч для VLM Визуальные модели крайне подвержены стереотипам — например, если на изображении добавить лишний палец человеку или у пумы…
- #4101Polymarket совершенно чудесно реагирует на презентацию OpenAI @ainewz
Polymarket совершенно чудесно реагирует на презентацию OpenAI @ainewz