Котятки🐱, Неделю назад при работе с датасетом в AI меня поставила в тупик достаточно нетривиальная проблема: он читал и пытался делать аналитику на ‘мусорных’ столбцах -guid, нумерация строк, аудиторский след, технические отметки времени, суррогатные ключи. И поле row_number, которое у меня вылезло из оконной функции. Я была сильно удивлена - ибо заранее скормила ему набор метаданных (‘сущность’ в копилот) и объяснила, как с ним работать на уровне вшитых промтов - то есть, я полагала, что AI-агент держит контекст на каждое значимое поле. Почему ему вдруг понравились другие поля хз, я была озадачена. В итоге в ТЗ на витрину все незначимые столбцы убраны. Ну и сегодня Гугл навел меня на старенькую статью про графические датасеты: https://www.aiweirdness.com/when-data-is-messy-20-07-03/ Проводя параллели, если в обучении модели, которая под капотом моего агента, был фактор ‘равенства’ всех столбцов в датасете, то поведение становится очевидным, как бы я не задавала доп контекст значимым полям. Поможет или их исключение совсем, или доп контекст с ограничением на использование. P.S. Будем честны, с людьми такой проблемы не возникает. Ни одному BI-разработчику на моей памяти использовать мусор в датасете в голову не приходило, это некая очевидная вещь, гигиенический минимум профессионализма в нашей профессии. И она же сделала меня ‘небрежной’ в датасете. Расслабилась, короче;) Всем хороших выходных!
Котятки🐱, Неделю назад при работе с датасетом в AI меня поставила в тупик…
Из этого канала
- #958🍿Дерево технологий, которое показывает развитие от древнейших изобретений до…
🍿Дерево технологий, которое показывает развитие от древнейших изобретений до наших дней (3.300.000г. до н.э — 2025г.
- #959Котятки🐱, Вчера у меня была интересная дискуссия по моей традиционной теме -…
Котятки🐱, Вчера у меня была интересная дискуссия по моей традиционной теме - self-service BI.
- #960Котятки, я обещала пост-размышление по self-service BI, и вот он. Что на него…
Котятки, я обещала пост-размышление по self-service BI, и вот он. Что на него повлияло: -знакомство со связкой Power BI + Copilot – теперь Copilot может сам…
- #956Как и зачем интегрировать BI-системы с сенсорными данными IoT? Сегодня бизнесу…
Как и зачем интегрировать BI-системы с сенсорными данными IoT? Сегодня бизнесу мало просто собирать информацию — важно превращать её в своевременные действия.
- #955Котятки, Я люблю Qlik, но больше Sense, чем view. Сейчас слежу за новыми…
Котятки, Я люблю Qlik, но больше Sense, чем view. Сейчас слежу за новыми обновлениями MCP -сервера от ChernovDev , пробую тихонько.