со своей стороны хочу сказать: жду качественно потрененый deepseek v4
со своей стороны хочу сказать: жду качественно потрененый deepseek v4
Из этого канала
- #1318на фоне новости про дистил антропика чел выложил реп который сразу конвертит…
на фоне новости про дистил антропика чел выложил реп который сразу конвертит историю сообщенийс клодом/кодексом в датасет его датасета уже на хф нет :) (но я…
- #1320квены надистилили небольших моделек https://huggingface.co/Qwen/Qwen3.5-27B…
квены надистилили небольших моделек https://huggingface.co/Qwen/Qwen3.5-27B https://huggingface.co/Qwen/Qwen3.5-35B-A3B gguf для лмстудии и llama.cpp:…
- #1321там кстати челы выложили датасеты которые использовали для трена…
там кстати челы выложили датасеты которые использовали для трена Goedel-Prover-V2 - модельки для доказательств теорем выходила моделька и статья в августе 2025…
- #1314Подписчики я ни на что не намекаю, но... Для рля бы пошло, чисто mountaincar на…
Подписчики я ни на что не намекаю, но... Для рля бы пошло, чисто mountaincar на флажочек закатить…
- #1313довольно приятный прошлогодний блог про diffusion language models…
довольно приятный прошлогодний блог про diffusion language models https://spacehunterinf.github.io/blog/2025/diffusion-language-models/ + большой awesome…