Какая локальная моделька лучшая для кодинга? Это прям вопрос, я сам ищу. Я думал что может Gemma 3 27B или QwQ. Если смотреть на ливбенч с чисто фильтром по коду, то https://livebench.ai/#/?Coding=a получается, что дистил R1 Qwen 32B https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-32B Он обходит и клода 3.7 (?) И сильно QwQ. Да и сам R1. Волшебная в общем моделька получилась Если кто-то локально разворачивает более-менее модельки большие и считает какую-то крутой, то пишите в коментах
Какая локальная моделька лучшая для кодинга? Это прям вопрос, я сам ищу. Я…
Из этого канала
- #1032Там кстати говорят что Safe Superintelligence Inc. Ильи Суцкевера оценивается в…
Там кстати говорят что Safe Superintelligence Inc. Ильи Суцкевера оценивается в $32B…
- #1033Может кому-то интересны локальные ллмки с длинными контекстами. Нвидия потюнили…
Может кому-то интересны локальные ллмки с длинными контекстами. Нвидия потюнили лламы 3.1 8B аж до 4м контекста как они пишут. С одной стороны это круто.
- #1034В майкрософте озаботились окружением в котором модельке было бы удобнее править…
В майкрософте озаботились окружением в котором модельке было бы удобнее править проекты с кодом с использованием pdb (питон дебагер) Т.е.
- #1030Давайте составим план (предсказание) по AI до 2030 в комментариях к этому посту…
Давайте составим план (предсказание) по AI до 2030 в комментариях к этому посту (жду ваших вариантов)
- #1029За последнее время выходила куча работ по ризонингам Среди них было много по…
За последнее время выходила куча работ по ризонингам Среди них было много по тюну 1.5B моделек.