Как насчет опенсурсной агенточной модельки на 1Т параметров? Kimi K2 https://moonshotai.github.io/Kimi-K2/ https://huggingface.co/moonshotai/Kimi-K2-Instruct https://huggingface.co/moonshotai/Kimi-K2-Base https://github.com/MoonshotAI/Kimi-K2?tab=License-1-ov-file#readme MOE с 32б активных параметров. Но все равно 1Т общих оч много Но зато опенсурс и поэтому кайфуем. Еще и от челов которые RL над ллмками активно делают Всем РЛьным респект всегда
Как насчет опенсурсной агенточной модельки на 1Т параметров? Kimi K2…
Из этого канала
- #1177Для тех кому куда и гпу прог интересен чел выложил решения ко всем задачкам из…
Для тех кому куда и гпу прог интересен чел выложил решения ко всем задачкам из известной книжки Programming Massively Parallel Processors…
- #1178"Кстати Kimi K2 это раздутый DeepSeek V3/R1. Меньше хедов в мульти-хеде, больше…
"Кстати Kimi K2 это раздутый DeepSeek V3/R1. Меньше хедов в мульти-хеде, больше экспертов https://x.com/rasbt/status/1944056316424577525 Еще померили на…
- #1179Gguf с любыми квантами Kimi K2 от анслота на месте. Рекомендуют 256гб оперативы…
Gguf с любыми квантами Kimi K2 от анслота на месте. Рекомендуют 256гб оперативы и 16гб врам+ иметь для мелких квантов unsloth/Kimi-K2-Instruct-GGUF · Hugging…
- #1175"Пара приятных и полезных находок Введение в диффузионки Step-by-Step…
"Пара приятных и полезных находок Введение в диффузионки Step-by-Step Diffusion: An Elementary Tutorial https://arxiv.org/abs/2406.08929 И обзор методов…
- #1174Ну шьто, как вам грок 4 кто уже трогал?
Ну шьто, как вам грок 4 кто уже трогал?