Дешевые LLM модели приносят больше вреда, чем пользы Сейчас случайно поймал в одной из задач, что вместо Опуса субагент запустился на Хайку. Хайку это самая дешевая, тупая и быстрая модель у Клода, Опус самая дорогая, умная и медленная. По умолчанию я всегда работаю с Опусом Агент делал аудит. Из 7 его находок 5 оказалось ложно-положительными. Т.е. Хайку нашел какие-то проблемы в документах, которых на самом деле не существует. И вроде бы запуск Хайку для этой задачи произошел ради экономии, но на деле на задачу ушло еще больше времени и лимитов из-за его косяков На этот счет у меня для Клода прописано глобальное правило: Никогда не используй Хайку. И оно в целом помогало, субагенты никогда не запускались на этой модельке до сегодняшнего дня. Ну или я так думал. В Клоде есть встроенные агенты, настройки которых предопределены заранее и не следуют правилам проекта. Так вот оказалось, что по умолчанию один из них — Explore агент, который имеет права только на чтение файлов для быстрого исследования — запускается всегда на Хайку. И вот главный агент запустил его и я получил кучу ложных результатов в аудите, потому что тупая и дешевая модель сильно чаще галлюцинирует Так вот, если используете нейронки, то всегда выбирайте самую мощную модель из доступных, даже если она быстрее жрёт лимиты в подписке. Выбор в сторону более дешевых даст вам кучу багов, ошибок и косяков, исправление которых потребует больше вложений, чем стоит использование нормальной модели со старта
Дешевые LLM модели приносят больше вреда, чем пользы Сейчас случайно поймал в…
Из этого канала
- #1278🔴 Сообщество — инструмент роста бизнеса. Руководство по применению. 13 мая,…
🔴 Сообщество — инструмент роста бизнеса. Руководство по применению. 13 мая, 19:00 (мск).
- #1279Надеюсь это спойлер нового рекламного плейсмента в Telegram Ads 😊
Надеюсь это спойлер нового рекламного плейсмента в Telegram Ads 😊
- #1280Не можете сказать, какой ЖК реально продаётся. Лиды есть. CRM есть. Реклама…
Не можете сказать, какой ЖК реально продаётся. Лиды есть. CRM есть. Реклама работает.
- #1276Менеджер проектов в виде скилла для Клода😳 Запускаю в отдельной сессии,…
Менеджер проектов в виде скилла для Клода😳 Запускаю в отдельной сессии, активирую скилл и агент собирает инфу о том, что было сделано, раскладывает по…
- #1275Классическая ситуация в перформансе: запустили кампанию, аудитория быстро…
Классическая ситуация в перформансе: запустили кампанию, аудитория быстро выгорает, охват падает и масштабировать некуда.