Mistral Small 3.1 24B - не революция, но планку поднимает Эта новая модель от Mistral по своим оценкам на бенчмарке очень похожа на предыдущую версию 3.0 от 25 января. Только она немного лучше во всем, и это прекрасно - прогресс не стоит на месте. Обогнала qwen2.5-32b-instruct и догнала qwen-2.5-72b-instruct, а это многого стоит. Mistral Small 3.1 24B можно скачать и запустить у себя (лицензия Apache 2.0). Mistral упоминает запуск на одной RTX 4090 или Маке с 32GB (естественно, с квантизацией). Получается в итоге неплохая модель довольно редкого размера - 24B. Интересная вещь. Ваш, @llm_under_hood 🤗 PS: Бенчмарк пока еще черновой. Туда загружено только 20% кейсов. Прочитать про мой подход к бенчмаркам можно тут. Там есть и FAQ со всеми вопросами, которые мне задают последние полтора года.
Mistral Small 3.1 24B - не революция, но планку поднимает Эта новая модель от…
Из этого канала
- #534Все архитектуры Enterprise RAG Challenge Какие RAG архитектуры работают лучше…
Все архитектуры Enterprise RAG Challenge Какие RAG архитектуры работают лучше всего с бизнес-документами? Вот вам обновленный и интерактивный leaderboard по…
- #535"Сегодня я запускаю новый эксперимент. Это курс AI+Coding для одной компании.…
"Сегодня я запускаю новый эксперимент. Это курс AI+Coding для одной компании. Какую проблему мы пытаемся решить? Во множестве компаний есть свои IT отделы с…
- #536Формат третьего раунда ERC - приземляем наш R&D Итак, смотрите. Во втором…
Формат третьего раунда ERC - приземляем наш R&D Итак, смотрите. Во втором раунде Enterprise RAG challenge мы искали ответы на вопросы в сотне годовых отчетов.
- #532Новую PDF распознавалку от IBM подвезли - SmolDocling Это vision LM в 256M.…
Новую PDF распознавалку от IBM подвезли - SmolDocling Это vision LM в 256M. Говорят, что работает лучше Qwen2.5VL, но не со всеми языками.
- #531"Можно ли использовать LLM для оптимизации промптов? Время от времени…
"Можно ли использовать LLM для оптимизации промптов? Время от времени кто-нибудь в чате поднимает этот вопрос.