Наконец-то и Яндекс выложили модель в опенсорс 😘 На растерзание энтузиастам отдали YandexGPT 5 Lite на 8B параметров, это базовая модель до пост-трейна. Перфоманс по бенчам чуть лучше, чем у LLaMA и Qwen тех же размеров, и значительно лучше в русском языке. Интересно, что если Lite обучали с нуля, то Pro обучали гибридно - инициализировали веса с чекпоинта Qwen 2.5 32B Base, а поверх него уже запустили полноценный претрейн пайплайн на своих данных. Это не просто файнтюн, потому что включает в себя все этапы тренировки модели и использует сильно больше токенов. ИМХО это хороший способ сэкономить ресурсы и ускорить обучение, если архитектура как-то кардинально не меняется. Тренили Lite на датасете в 15 триллионов токенов (прямо как Llama 3), он включал в себя 30% русского и 70% английского. При этом из них только 15% — код, 10% — математика, поэтому в этих задачах она проигрывает тому же Qwen. В базовой модели, которую выложили в опенсорс, нет никакой цензуры. А вот старшая модель PRO уже доступна в чатике с Алисой. Так что виртуальный ассистент теперь совсем умный) Почти 4o, lol. Пишут, что PRO сильна в кодинге. И хоть среди англоязычных разрабов все топят за Клод в работе с кодом, последняя моделька Яндекса, по моему опыту, тоже неплохо справляется, особенно с русскоязычными промтами. PRO доступна через API, и к ней даже можно прикрутить RAG. В блог-посте на Хабре расписаны детали про тренировку модели. Потыкать здесь Моделька на обнимающем лице 🤗 @ai_newz
Наконец-то и Яндекс выложили модель в опенсорс 😘 На растерзание энтузиастам…
Из этого канала
- #3708Alexa наконец-то станет умной Теперь внутри Alexa будут полноценные агентные…
Alexa наконец-то станет умной Теперь внутри Alexa будут полноценные агентные LLM (Claude и Amazon Nova), которые смогут взаимодействовать с десятками тысяч…
- #3709Ну что, поехали смотреть анонс GPT 4.5? ➖ Модель уже начали раскатывать в API и…
Ну что, поехали смотреть анонс GPT 4.5? ➖ Модель уже начали раскатывать в API и для Pro пользователей, в Plus на следующей неделе.
- #3710Ребят, накидайте в комменты своих любимых, авторов, каналов, блогеров,…
Ребят, накидайте в комменты своих любимых, авторов, каналов, блогеров, инфлюенсеров и прочих сказочных существ вроде меня.
- #3706Claude играет в покемонов на стриме Добро пожаловать в будущее, теперь игры —…
Claude играет в покемонов на стриме Добро пожаловать в будущее, теперь игры — бенчмарки для агентных моделей. https://www.twitch.tv/claudeplayspokemon @ainewz
- #3705Доступ к Deep Research дают теперь всем подписчикам ChatGPT Обычные подписчики…
Доступ к Deep Research дают теперь всем подписчикам ChatGPT Обычные подписчики получают 10 запросов в месяц, а Pro подписчикам повысили ограничение с 50 до 120…