Нейродайджест за неделю (#70) __Юбилейный и неделя Google__ Google I/O - Дайджест по презентации — собрал все фишки с пояснениями, что как работает. - Gemini Diffusion — экспериментальная диффузионная модель для текста, в 5 раз быстрее Gemini 2.0 Flash Lite (самой быстрой модели Google), при сохранении качества (но это не точно), особенно в коде и математике. 1479 токенов в секунду — это не шутка. - Veo 3 — Veo 2 ещё не успели сместить с пьедестала, а Google уже дропнули 3-ю версию SOTA видеогенератора. Лучше во всём, и теперь с нативной генерацией аудио, включая диалоги с липсинком (пример). LLM - Devstral 24B — король опенсорс кодинга; если поднимать на своей машине — то его. Влезает в 3090. - Claude 4 Sonnet и Opus — SOTA для кода и агентов, остальное тоже неплохо + фишки для API. Ликбез - Parallel Scaling Law — большой разбор параллельного масштабирования с фокусом через баланс между временем инференса и потребления памяти. Полезно для локального инференса. > Читать дайджест #69 #дайджест @ai_newz
Нейродайджест за неделю (#70) Юбилейный и неделя Google Google I/O - Дайджест…
Из этого канала
- #3929NVIDIA готовит новые GPU для Китая Судя по утечкам, речь идёт о GPU с рабочим…
NVIDIA готовит новые GPU для Китая Судя по утечкам, речь идёт о GPU с рабочим названием B40/6000D: та же архитектура Blackwell, но урезанное число SM и с…
- #3930Стенфордский курс по внутреннему устройству LLM CS336, Language Modeling from…
Стенфордский курс по внутреннему устройству LLM CS336, Language Modeling from Scratch, показывает, как сделать полноценную LLM с нуля: от сбора и очистки…
- #3931В Telegram интегрируют Grok Ещё марте подписчикам Telegram Premium дали доступ…
В Telegram интегрируют Grok Ещё марте подписчикам Telegram Premium дали доступ к Grok через бота, похоже партнёрство решили расширить, а расширенный функционал…
- #3927"Parallel Scaling Law Обычно LLM масштабируют либо через параметры (Dense,…
"Parallel Scaling Law Обычно LLM масштабируют либо через параметры (Dense, MoE), либо через время инференса (CoT).
- #3925Anthropic только что релизнули Claude 4 Sonnet и Opus Модели концентрируются на…
Anthropic только что релизнули Claude 4 Sonnet и Opus Модели концентрируются на кодинге и агентах — там они SOTA, в остальных бенчах всё более спорно.