Минутка впечатляющих цифр: Яндекс повысил эффективность обучения LLM почти на 5 млрд рублей в год Это примерно 400 миллионов в месяц. Про часть оптимизации компания уже рассказывала в техрепорте, а сейчас раскрыла цифры. Итак, за счет чего удалось повысить эффективность: 1. Собственная разработка Яндекса – библиотека YCCL (Yet Another Collective Communication Library). С ее помощью удалось в 2 раза ускорить обмен данными между графическими процессорами и сократить объем передаваемой информации. В мире подобные системы есть только у Meta, AMD и пары китайских IT‑гигантов. 2. Переход на FP8 и увеличение размера батча. Применение FP8 ускорило обучение моделей на 30% и сократило коммуникации в 2 раза. Батч увеличили до 16–32 млн токенов, что позволило обучать модели без простоев GPU, и благодаря исследованиям это даже не замедлило обучение. 3. А также оптимизация кода, аппаратной инфраструктуры и усовершенствование архитектур.
Минутка впечатляющих цифр: Яндекс повысил эффективность обучения LLM почти на 5…
Из этого канала
- #8757Unity встраивает генерацию игр прямо в движок Компания на созвоне с инвесторами…
Unity встраивает генерацию игр прямо в движок Компания на созвоне с инвесторами подтвердила, что готовит обновление Unity AI, где можно будет описать игру…
- #8758Принципы работы Nested Learning и Titans вдохновлены идеями российских ученых…
Принципы работы Nested Learning и Titans вдохновлены идеями российских ученых Google идет по дорожке, заданной учениками Михаила Бурцева — Юрием Куратовыи и…
- #8759История о том, что будет, если не ревьюить вайб-код: DeFi‑протокол Moonwel…
История о том, что будет, если не ревьюить вайб-код: DeFi‑протокол Moonwel потерял около 1.78 млн долларов из-за ошибки в коде, которую сделал Opus 4.6 В PR,…
- #8755Кстати, ровно год назад Anthropic выпустили Sonnet 3.7 и Claude Code…
Кстати, ровно год назад Anthropic выпустили Sonnet 3.7 и Claude Code Сравниваем прогресс за год на сложных бенчмарках (это только серия Sonnet): – SWE bench:…
- #8753Вышел Claude Sonnet 4.6! Главное: – На 40% дешевле Opus и доступна для всех…
Вышел Claude Sonnet 4.6! Главное: – На 40% дешевле Opus и доступна для всех планов (включая бесплатный) в Claude Code, Cowork и тд – В бета версии доступен…