Нейродайджест за ~~неделю~~ (#117) __Аж за 3 недели 4.05 - 24.05.__ LLM - Обновление GPT Instant 5.5 — Модель поумнела, а в ChatGPT обновили интерфейс памяти, чтобы было понятно, на что опирается ответ. - Mythos порвал разработчиков Firefox — Модель Mythos от Anthropic за месяц нашла 271 уязвимость (включая критические), обойдя результаты людей за полтора года. - Управление роем агентов и режим /goal — В Claude Code завезли мульти-агентный режим и слизали фичу Codex, где модель не останавливается до достижения цели. - Бесплатные API-кредиты для сторонних приложений — Anthropic будет насыпать подписчикам токены (до $200) для использования в сторонних тулах на базе Agent SDK. - Приговор для TurboQuant на серверах — В vLLM детально протестили квантизацию KV-кэша. Для локального инференса годится, но на серверах деквантизация роняет пропускную способность до 70%. - Первая модель из датацентров SpaceX — Cursor выпустили Composer 2.5 на базе K2.5. Модель стала умнее, но стоимость fast-режима выросла вдвое (до уровня Sonnet). - Gemini 3.5 Flash написала свою ОС за 12 часов — Вышла Gemini 3.5 Flash с сильным упором на агентность. Модель заметно умнее, но цены выросли в 3 раза по сравнению с прошлой версией. - Тысяча токенов в секунду на триллионнике — Cerebras (которые только что вышли на IPO) запустили Kimi K2.6 с безумной скоростью, пока только для энтерпрайз-клиентов. - Ремонт кэша и тизер новых фич — OpenAI пофиксили баг с выжиранием лимитов в Codex и тизерят режим /slow для объёмных несрочных задач. Генеративные модели - Смерть линейки Veo — Google выпустила Gemini Omni. Модель теперь сама умеет в видеогенерацию. Прочее - Маск и Anthropic теперь партнеры — Anthropic арендует датацентр Colossus у SpaceX. В ответ Клоду вдвое подняли лимиты для подписчиков. - Настоящая меха за $650k — Unitree показали робота GD01 весом в полтонны. Может ходить как на двух, так и на четырёх ногах. - Анекдот про обезьяну и скейлинг лоуз — Немного нейросетевого юмора про стажеров и автоматизацию ресёрча. - Миграция с Zig на Rust за 10 дней — Лид-разработчик Bun полностью переписал рантайм при помощи Claude. Новая версия стабильнее и быстрее. - Счёт за токены на $1.3 млн в месяц — Создатели OpenClaw держат сотню агентов, которые сами ревьюят PR, слушают митинги и пишут код. - Арендовать H100 почти нереально — В мире заканчиваются GPU. Старые A100 стоят дороже, чем два года назад, а неоклауды отдают всё крупным игрокам. - Андрей Карпатый вышел с вольных хлебов — Легендарный ресерчер поддался FOMO и официально присоединился к Anthropic. Личное - Голосовухи от рекрутеров в LinkedIn — Заанлочил новый уровень безумия: рекрутеры скидывают аудиосообщения, пытаясь схантить людей к нам в GenPeach AI. - Как попасть в топовую AI-лабу или стартап — Мои мысли о карьерном пути в frontier-лабы и почему стартапы (как наш) часто дают больше ownership и пространства для быстрого роста. > Читать дайджест #116 #дайджест @ai_newz
Нейродайджест за ~~неделю~~ (#117) Аж за 3 недели 4.05 - 24.05. LLM -…
Из этого канала
- #4591Bonsai Image 4B — чудеса квантизации Стартап PrismML, специализирующийся на…
Bonsai Image 4B — чудеса квантизации Стартап PrismML, специализирующийся на экстремальном сжатии моделек, сделал квантизированную до одного бита FLUX.2 Klein…
- #4594На Хабре вышел подробный разбор ~~массивного ~~whitepaper от Сбера «AI-Disrupt…
На Хабре вышел подробный разбор ~~массивного ~~whitepaper от Сбера «AI-Disrupt PDLC».
- #4595Вышел Claude Opus 4.8 Модель стала заметно умнее на токен, новый low иногда…
Вышел Claude Opus 4.8 Модель стала заметно умнее на токен, новый low иногда обгоняет старый max.
- #4589"Эвалы здорового человека Все мы знаем этот классический флоу разработки…
"Эвалы здорового человека Все мы знаем этот классический флоу разработки LLM-фич — ""потыкал промпт, вроде работает"", и радостно катим всё это дело в прод.
- #4588OpenAI пофиксили баг с кэшем в Codex Из-за него быстро выжирались лимиты,…
OpenAI пофиксили баг с кэшем в Codex Из-за него быстро выжирались лимиты, поэтому их снова ресетнули, Anthropic тут стоит поучиться.