https://huggingface.co/mistralai/Devstral-Small-2505 Новая кодовая агентная открытая моделька от мистраля. 24B, 128к контекст В сыром виде в 3090/4090 не влезет, надо подождать awq lm-studio уже сделали GGUF кванты, можно в LM studio или llama.cpp пробовать запускать https://huggingface.co/lmstudio-community/Devstral-Small-2505-GGUF интересно что там с русским
https://huggingface.co/mistralai/Devstral-Small-2505 Новая кодовая агентная…
Из этого канала
- #1109Всем привет! Рад сообщить о нашем новом релизе RuadaptQwen3-32B-Instruct 🎉. Это…
Всем привет! Рад сообщить о нашем новом релизе RuadaptQwen3-32B-Instruct 🎉. Это адаптированная версия Qwen3-32B, которая также является гибридным ризонером с…
- #1110ллмный RL апдейтит лишь 5%-30% весов и эти веса образуют подсеть, которую можно…
ллмный RL апдейтит лишь 5%-30% весов и эти веса образуют подсеть, которую можно тюнить рлем саму по себе (заморозив остальные веса) и после тюна она будет…
- #1114ToneSpeak - первый русскоязычный датасет с описанием акецента и настроения.…
ToneSpeak - первый русскоязычный датасет с описанием акецента и настроения. Сгенерили через openai api, получилось очень приятно, пользуйтесь! Huggingface
- #1107Ребят, если что интересного увидите в презухе гугла, черкните в коменты плиз И…
Ребят, если что интересного увидите в презухе гугла, черкните в коменты плиз И надо будет посчитать количество упоминаний ИИ агентов
- #1106Кстати, вообще считаю что вайбкодинг это очень круто если понимаешь что…
Кстати, вообще считаю что вайбкодинг это очень круто если понимаешь что делаешь. Прямо быстро можно прототипчик сделать чего угодно.