квены надистилили небольших моделек https://huggingface.co/Qwen/Qwen3.5-27B https://huggingface.co/Qwen/Qwen3.5-35B-A3B gguf для лмстудии и llama.cpp: https://huggingface.co/lmstudio-community/Qwen3.5-35B-A3B-GGUF https://huggingface.co/unsloth/Qwen3.5-35B-A3B-GGUF https://huggingface.co/lmstudio-community/Qwen3.5-27B-GGUF https://huggingface.co/unsloth/Qwen3.5-27B-GGUF
квены надистилили небольших моделек https://huggingface.co/Qwen/Qwen3.5-27B…
Из этого канала
- #1321там кстати челы выложили датасеты которые использовали для трена…
там кстати челы выложили датасеты которые использовали для трена Goedel-Prover-V2 - модельки для доказательств теорем выходила моделька и статья в августе 2025…
- #1323приятно знать что у Сэма появились деньги чтобы делать инструменты для всех нас…
приятно знать что у Сэма появились деньги чтобы делать инструменты для всех нас кстати кодексом 5.3 я доволен
- #1324https://voxelbench.ai/compare бенч моделек на генерации всякого из кубиков…
https://voxelbench.ai/compare бенч моделек на генерации всякого из кубиков довольно прикольно выглядит можно пооценивать и полюбоваться
- #1318на фоне новости про дистил антропика чел выложил реп который сразу конвертит…
на фоне новости про дистил антропика чел выложил реп который сразу конвертит историю сообщенийс клодом/кодексом в датасет его датасета уже на хф нет :) (но я…
- #1315со своей стороны хочу сказать: жду качественно потрененый deepseek v4
со своей стороны хочу сказать: жду качественно потрененый deepseek v4