DeepSeek V3 обновили Оригинальную модель тюнили крайне мало — всего 5 тысяч…

25 мар. 2025 г.27 729 views211 forwardsОткрыть в Telegram →

DeepSeek V3 обновили Оригинальную модель тюнили крайне мало — всего 5 тысяч H800 часов (это менее чем 0,2% компьюта на тренировку модели), а теперь её наконец-то затюнили нормально. В результате модель лучше использует тулы, разрабатывает фронтенд и размышляет. Это не reasoner, R1 всё ещё лучше для сложных тасков. Новую версию релизнули сразу под лицензией MIT, как и R1 (оригинальная V3 была под кастомной лицензией). Модель со вчерашнего дня доступна в API, чате и на 🤗. https://huggingface.co/deepseek-ai/DeepSeek-V3-0324 @ai_newz

Источник

https://t.me/ai_newz/3768

Канал эйай ньюз · опубликовано 25 мар. 2025 г.

Из этого канала