Котятки🐱, Неделю назад при работе с датасетом в AI меня поставила в тупик достаточно нетривиальная проблема: он читал и пытался делать аналитику на ‘мусорных’ столбцах -guid, нумерация строк, аудиторский след, технические отметки времени, суррогатные ключи. И поле row_number, которое у меня вылезло из оконной функции. Я была сильно удивлена - ибо заранее скормила ему набор метаданных (‘сущность’ в копилот) и объяснила, как с ним работать на уровне вшитых промтов - то есть, я полагала, что AI-агент держит контекст на каждое значимое поле. Почему ему вдруг понравились другие поля хз, я была озадачена. В итоге в ТЗ на витрину все незначимые столбцы убраны. Ну и сегодня Гугл навел меня на старенькую статью про графические датасеты: https://www.aiweirdness.com/when-data-is-messy-20-07-03/ Проводя параллели, если в обучении модели, которая под капотом моего агента, был фактор ‘равенства’ всех столбцов в датасете, то поведение становится очевидным, как бы я не задавала доп контекст значимым полям. Поможет или их исключение совсем, или доп контекст с ограничением на использование. P.S. Будем честны, с людьми такой проблемы не возникает. Ни одному BI-разработчику на моей памяти использовать мусор в датасете в голову не приходило, это некая очевидная вещь, гигиенический минимум профессионализма в нашей профессии. И она же сделала меня ‘небрежной’ в датасете. Расслабилась, короче;) Всем хороших выходных!