Лучшая модель для кодирования - Claude Sonnet 3.5 Вы уже наверняка слышали, что Anthropic на днях выпустили новую LLM, которая во многих бенчмарках обходит gpt-4o. Таким образом, Claude Sonnet 3.5 становится лучшей моделей для написания кода на сегодня. Действительно ли лучшая? Скорее всего, да. Я уже писал о своем любимом бенчмарке на кодирование LiveCodeBench - это набор задач а-ля литкод разной сложности. Так вот, в LCB в задачках средней сложности новая Sonnet примерно на четверть обходит gpt-4o, а вот в Hard задачки она решает аж в 2 раза лучше! (даже чуть больше). Теперь понятно почему у людей новая соннет действительно решает принципиально более сложные задачи лучше, чем gpt-4o. Кстати, неожиданные результаты в бенчмарке aider - обычные правки новая Sonnet действительно делает лучше всех с отрывом от GPT-4o на 5.3% (и то при формате редактирования whole, но это уже детали). При этом сразу за Sonnet идёт новая DeepSeek Coder V2, слегка опережая GPT-4o - видимо, из-за лучшего следования инструкциям. А вот, в задачах на рефакторинг (с большим контекстом), новая Sonnet заметно проседает и отстаёт от Opus на 17.2%, и от GPT-4o на 7.8%. Мой опыт 1. Мою сложную задачу на вычисление максимальной глубины проекта в зависимостях в итоге смогла решить только новая Sonnet, остальные не вывозили, как я их ни мучал. 2. Новая Sonnet смогла полностью реализовать программу для мерджа множество .NET солюшенов в один большой солюшн (правда, с моими подсказками). Об этом я напишу в отдельном посте. Так что, рекомендую попробовать (особенно скептикам) - возможно, нейросети вам откроются с новой стороны. Как воспользоваться? A) На сайте Claude новая моделька доступна даже в бесплатной версии (с определенными лимитами). B) Через OpenRouter (после регистрации). — Пробелов.NET. Спасибо, что читаете :)
Лучшая модель для кодирования - Claude Sonnet 3.5 Вы уже наверняка слышали,…
Источник
https://t.me/ai_driven/21Канал AI-Driven Development. Родион Мостовой · опубликовано 27 июн. 2024 г.
Из этого канала
- #23"Учимся промптить, генерировать картинки видео и музыку и все это за 3 часа Не…
"Учимся промптить, генерировать картинки видео и музыку и все это за 3 часа Не совсем про программирование, но очень интересно.
- #24"Текущая картина по моделькам для кодинга, мое грядущее выступление на DotNext…
"Текущая картина по моделькам для кодинга, мое грядущее выступление на DotNext и...
- #28aider — AI-Junior разработчик, доступный из вашей любимой IDE Друзья, совместно…
aider — AI-Junior разработчик, доступный из вашей любимой IDE Друзья, совместно с клубом Эволюция Кода публикуем воркшоп по (субъективно) наиболее удобному и…
- #20Гибкая генерация JSON DTO'шек из json файла на любом ЯП через ChatGPT Обнаружил…
Гибкая генерация JSON DTO'шек из json файла на любом ЯП через ChatGPT Обнаружил очередной классный юзкейс применения ChatGPT.
- #19Ключевые навыки в программировании с использованием ChatGPT Дмитрий Нестерук…
Ключевые навыки в программировании с использованием ChatGPT Дмитрий Нестерук записал получасовой ролик про использование нейронок в программировании -…