Котятки, Мне очень понравилась вот эта статья по масштабированию данных. Аккурат как раз когда я решаю вопрос о горизонте хранения: https://arxiv.org/html/2501.13779v1 Несмотря на то, что она относится к LLM, в ней важные мысли про критерии качества данных и расширение этих критериев для разных целей, и как это влияет на масштабирование. Грубо говоря, зачем хранить факт за 10 лет, если его поведение стабильно и доп горизонт хранения не даст дополнительных полезных свойств ни в задачах анализа, ни в задачах прогнозирования? Ну то есть, результат расчета всяких корреляций за 10 лет и за 3 года дает близкие коэффициенты? Впрочем, эти проблемы решены в Data vault 2.0, где мы можем сжать сателлит до состояния ‘признак-период’, оптимизировать производительность и оставить неограниченной глубину хранения.
Котятки, Мне очень понравилась вот эта статья по масштабированию данных.…
Из этого канала
- #1078Нашла эту книгу на одной уютной кухне, не смогла с вами не поделиться👆
Нашла эту книгу на одной уютной кухне, не смогла с вами не поделиться👆
- #1079"qvd — чтение Qlik QVD файлов из Python и SQL Написал open-source библиотеку…
"qvd — чтение Qlik QVD файлов из Python и SQL Написал open-source библиотеку для работы с QVD файлами без Qlik. Ядро на Rust, биндинги для Python.
- #1080Котятки🐱, В этом сезоне у меня новый интерес - Decision‑Centric Visual…
Котятки🐱, В этом сезоне у меня новый интерес - Decision‑Centric Visual Interfaces (DCVI).
- #1075"Опубликовал mcp-superset — MCP-сервер для Apache Superset 128+ инструментов.…
"Опубликовал mcp-superset — MCP-сервер для Apache Superset 128+ инструментов. Дашборды, графики, датасеты, SQL Lab, пользователи, роли, RLS, группы, аудит прав…
- #1074Котятки🐱, С 8м марта девочек) пусть будет прекрасной и удивительной эта весна…
Котятки🐱, С 8м марта девочек) пусть будет прекрасной и удивительной эта весна для всех нас! Ну и сегодня еще тот самый день, который оказывает сильное влияние…