Выложили веса Qwen 3.6 35B-A3B Модель прокачали, так что она теперь часто обгоняет Qwen 3.5 27B dense модель (надеюсь и ситуацию с тулколингом поправили). Скорее всего добились этого опять увеличив количество ризонинга — модели Qwen традиционно очень разговорчивые. Основной конкурент, Gemma 4 хоть и немного отстаёт по бенчам, но и использует в разы меньше токенов на эти результаты. В подразделении которое занимается Qwen сейчас большие перестановки с упором на получение прибыли, из-за чего они стали выкладывать меньше моделей. Но, к счастью, мы всё ещё получаем неплохие релизы. Веса @ai_newz
Выложили веса Qwen 3.6 35B-A3B Модель прокачали, так что она теперь часто…
Из этого канала
- #4535Вот и Opus 4.7 подоспел 4.6 по ощущениям совсем в труху занерфили за последнее…
Вот и Opus 4.7 подоспел 4.6 по ощущениям совсем в труху занерфили за последнее время, так что релиз очень ожидаемый.
- #4536xAI начинают сдавать компьют в аренду Маск заметил что все эти Colossus на…
xAI начинают сдавать компьют в аренду Маск заметил что все эти Colossus на сотни тысяч GPU как-то простаивают, не принося деньги, и решил выйти на рынок…
- #4537Claude Design Клод Лабс запустили Claude Design. Я еще полгода назад писал про…
Claude Design Клод Лабс запустили Claude Design. Я еще полгода назад писал про то, что лучший способ дизайна через нейросети — это простой Canvas в ChatGPT или…
- #4532Anthropic потихоньку прикрывает лавочку подписок На этот раз пришли за…
Anthropic потихоньку прикрывает лавочку подписок На этот раз пришли за энтерпрайз пользователями (те кто платят за 150+ подписок).
- #4531"Яндекс показали новый телек — ТВ Станция MiniLED По сути это вход в…
"Яндекс показали новый телек — ТВ Станция MiniLED По сути это вход в премиальную линейку ТВ Станций по более вменяемой цене: MiniLED-подсветка, яркость до 650…