DeepSeek V3 обновили Оригинальную модель тюнили крайне мало — всего 5 тысяч H800 часов (это менее чем 0,2% компьюта на тренировку модели), а теперь её наконец-то затюнили нормально. В результате модель лучше использует тулы, разрабатывает фронтенд и размышляет. Это не reasoner, R1 всё ещё лучше для сложных тасков. Новую версию релизнули сразу под лицензией MIT, как и R1 (оригинальная V3 была под кастомной лицензией). Модель со вчерашнего дня доступна в API, чате и на 🤗. https://huggingface.co/deepseek-ai/DeepSeek-V3-0324 @ai_newz
DeepSeek V3 обновили Оригинальную модель тюнили крайне мало — всего 5 тысяч…
Из этого канала
- #3769Gemini 2.5 Pro Наконец-то reasoning завезли в Gemini Pro. На бенчах себя…
Gemini 2.5 Pro Наконец-то reasoning завезли в Gemini Pro. На бенчах себя показывает очень хорошо — на нескольких это SOTA, в большей части бенчей модель…
- #3770Мультимодальная генерация в ChatGPT Наконец-то завезли нативную генерацию…
Мультимодальная генерация в ChatGPT Наконец-то завезли нативную генерацию картинок в 4o, обещанную ещё в прошлом году.
- #3771Новый генератор — шлак? Генерацию картинок в 4o уже раскатили. Похоже, что…
Новый генератор — шлак? Генерацию картинок в 4o уже раскатили. Похоже, что вопреки всему, этот генератор ничем не хуже текущего топа.
- #3767🔥В генерации изображений новый игрок Reve только вышли на рынок, а их модель…
🔥В генерации изображений новый игрок Reve только вышли на рынок, а их модель Halfmoon 🌗 уже ТОП-1 на Image Generation Arena, обогнав Recraft V3, Imagen 3 и…
- #3760"Умная роборука за $110 Я уже писал про LeRobot — красавчики из Hugging Face…
"Умная роборука за $110 Я уже писал про LeRobot — красавчики из Hugging Face продолжают пилить годноту для тех, кто хочет собрать и натренировать собственного…