С некоторой периодичностью попадаются посты в духе «Claude снёс мою базу данных», «Claude удалил важные файлы» или распространённое «Claude написал фейковые тесты и отчитался, что всё работает, хотя я просил проверить на реальных тестах». При этом про Codex я такого не читал — мб иногда что-то не то с тестами, но не звучит, как попытка уклониться от выполнения задачи. Интересно, с чем это может быть связано? У меня есть 3 объяснения: 1) банально разные модели и разное поведение, Anthropic проиграли в алайнмент модели 2) случаи очень редки, и так как у Codex меньше пользователей (хотя я не поверю в 10x разницу), то случайности не случаются 3) я в пузыре и мне просто такие случаи не попадаются, а на самом деле они на каждом шагу Сам я гоняю Codex в Full Access режиме 😳 но это я смелый такой до первого инцидента. Расскажите, были ли у вас неприятности с Codex? 🤖
С некоторой периодичностью попадаются посты в духе «Claude снёс мою базу…
Из этого канала
- #3504На прошлой неделе видел новость, что OpenAI готовит лайнап: новая модель…
На прошлой неделе видел новость, что OpenAI готовит лайнап: новая модель (выйдет скоро), новая структура компании и перестановки, новые полиси.
- #3505WSJ получили доступ к конфиденциальным финансовым документам, которыми OpenAI и…
WSJ получили доступ к конфиденциальным финансовым документам, которыми OpenAI и Anthropic поделились с инвесторами перед раундами финансирования.
- #3509Anthropic отчитались о росте run-rate revenue (кстати впервые правильный…
Anthropic отчитались о росте run-rate revenue (кстати впервые правильный термин, обычно во всех новостях пишут ARR.
- #3502Свежий материал от TheInforamtion: DeepSeek будут предоставлять свою модель…
Свежий материал от TheInforamtion: DeepSeek будут предоставлять свою модель DeepSeek V4 эксклюзивно на чипах Huawei, показывая самодостатчноссть Китая.
- #3500Двигатель, который смог. Вы может видели, как корабль Orion и ракету SLS…
Двигатель, который смог. Вы может видели, как корабль Orion и ракету SLS окрестили «летающим музеем».