Нейродайджест за неделю (#81) LLM - Вышел Claude Opus 4.1 — Небольшой скачок по… — @ai_newz

Нейродайджест за неделю (#81) LLM - Вышел Claude Opus 4.1 — Небольшой скачок по всем бенчам, лучше работает в больших кодбазах. Уже доступен в подписке, API и Claude Code. - GPT-OSS от OpenAI — OpenAI впервые за 6 лет выкатили открытые LLM — два MoE-ризонера (20B и 120B). Старшая модель обгоняет o4-mini на бенчах. - GPT-OSS 120B на Cerebras — Выдаёт 3000 токенов/сек, Groq показывает более скромные 500 токенов/сек. - Анонс GPT-5 — OpenAI представили новую флагманскую модель (с не однозначными плотами😳), объявили цены и уже закончили роллаут. Генеративные модели - Qwen Image — Новый открытый 20B-генератор картинок от Alibaba. Хорошо справляется с текстом и редактированием на уровне GPT-4o и FLUX Kontext. - Genie 3 — SOTA World Model от Google, нейронный игровой движок. Генерирует риал-тайм интерактивные миры в 720p, которые помнят действия пользователя на протяжении нескольких минут. - Рекурсия Genie 3 — Ничего необычного просто Genie симулирует Genie внутри себя. Прочее - Проклятый бенчмарк для VLM — VLMBias показывает, что визуальные модели подвержены стереотипам и часто игнорируют реальные изменения на картинках, полагаясь на заученные знания. - Опрос — Еще разок напоминаю пройти опросик для канала, чтобы всем жилось лучше. > Читать дайджест #80 #дайджест @ai_newz

Из этого канала