Хм. Клод что-то мудрит. Агенты стали отмечать выпоненными задачи, которые не… — @blog_sb

Хм. Клод что-то мудрит. Агенты стали отмечать выпоненными задачи, которые не делали? «Реализовать FR-100 и подписки FR-047; очередь email через Celery» - отметил как выполненное, а по факту ничего не сделал вообще, даже не начинал. Пока на уровне гипотез я пришел к тому, что Claude оптимизирован на снижение затрат на инференс, а не на решение пользовательских задач, что иногда приводит к тому, что он «ленится», потому что так дешевле при заданных стимулах. Уже было наблюдение, что если начать ему угрожать и очень грубо общаться, то он начинает лучше рассуждать и давать более качественный ответ, это действительно работает, я проверял, да и вы можете проверить сами. Интересно, что воспитанном человеку дайже нейронку выматерить чрезвычайно непросто 🙂 Вот может и в разработке ему нужно не уважительно/нейтрально, а грубо в приказном тоне ставить задачи 🤨

Из этого канала