"От себя добавлю про выбор оптимальных моделей для кодинга Их сейчас действительно накопилось какое-то несчетное количество, причем множество их них вполне приличные. В чем еще сила старой доброй Sonnet 3.7? Все еще в задачах на фронтэнд - на текущий момент, кажется, что она все еще делает наилучший UI/UX. И это подтверждают результаты WebDev Arena. Что интересно - новенькая GPT 4.1 незаметно ее догоняет, так что, господа фронтэдщики, - присмотритесь. Кроме того, похоже, что Sonnet 3.7 в составе Cursor'а все еще лучшая модель для агентского режима. Что насчет больших (и сложных) рефакторингов? Тут, на мой взгляд, лучший выбор - это Gemini 2.5 Pro и o3. Почему? Прежде всего, из-за их максимальной внимательности к контексту (см. бенчмарк Fiction.liveBench). Ну и здесь же вам эксклюзив - обратите внимание на относительно новую модельку QwQ-32B от Qwen - похоже, что она получилась очень удачной - результаты в LiveBench на уровне Sonnet 3.7 (Thinking!), но главное - внимательность к контексту почти на уровне Gemini 2.5 Pro(!). При этом, она еще и опенсорс. Так что, любители поработать с большим контекстом (я) - присмотритесь Что касается новой модели GPT-4.1 - это хорошая рабочая лошадка для повседневных несложных задач. Ну, и поделитесь своим опытом, дорогие мои читатели, про o3 - уже столкнулись с ее ""странностями"" на своем опыте? А то всякие страшилки тут рассказывают про нее в соседних каналах :))"
"От себя добавлю про выбор оптимальных моделей для кодинга Их сейчас…
Источник
https://t.me/ai_driven/104Канал AI-Driven Development. Родион Мостовой · опубликовано 20 апр. 2025 г.
Из этого канала
- #106"А теперь, для любителей локальных моделей: Gemma 3 QAT Что-то мы все про…
"А теперь, для любителей локальных моделей: Gemma 3 QAT Что-то мы все про проприетарщину да и проприетарщину.
- #111В Курсоре появилась генерация правил проекта Запускается так: /Generate Cursor…
В Курсоре появилась генерация правил проекта Запускается так: /Generate Cursor Rules В моем проекте курсор создал список всех файлов и краткое описание…
- #112Gemini 2.5 Pro обновилась, по показываемым бенчмаркам самый большой прирост…
Gemini 2.5 Pro обновилась, по показываемым бенчмаркам самый большой прирост произошёл в веб-программировании (см. вторую картинку).
- #103"ChatGPT o3 (2/2) Минусы 🔴 Малая длина фактического вывода ● модель обрезает…
"ChatGPT o3 (2/2) Минусы 🔴 Малая длина фактического вывода ● модель обрезает код, выдает 200 строк вместо ожидаемых 800, пытается его ужать там, где это лишено…
- #98"ChatGPT o3 и немного o4-mini (1/2) Итак, несколько дней назад вышла…
"ChatGPT o3 и немного o4-mini (1/2) Итак, несколько дней назад вышла долгожданная модель o3 и семейство o4-mini.