Бодрая неделька выдалась, столько новинок интересных. Ведь скоро Databricks и Snowflake Summit. __Если вы будете на этих конференциях пишите в комментах, может там найдетесь, и выпьете по стаканьчику.__ Я сам смогу намутить pass на 1 бесплатный день на Snowflake конференцию, но этого малова-то. Если вы в Калифорнии и хотите попасть бесплатно на один день (среда) Snowlfake, я расскажу как это сделать. 1️⃣ dbt labs там выкатили большой список обновлений - dbt Launch Showcase 2025 recap __dbt MCP Server - сервер, обрабатывающий dbt-команды централизованно и ускоряющий запуск моделей, особенно в облачных и CI/CD-средах. А кто сейчас не делает MCP? Fusion engine - движок на Rust, который анализирует SQL-код ещё до выполнения, улучшая производительность и предотвращая ошибки. Как раз был ____потс в январе про покупку SDF.____ VS Code Extension - официальное расширение для VS Code с поддержкой Fusion, автодополнением и анализом SQL, но работает только с dbt Cloud. dbt Canvas - визуальный интерфейс для проектирования моделей и связей между ними, ориентированный на командную работу и документирование. Получается, что главное преимущество аналитика как код уходит на 2й план. Это дает доступ простым бизнес пользователям (больше пользователей, больше лицензий?!), но по факту может изменить концепт. У меня уже коллеги интересуются как они могут модельки-то строить в канвасе. dbt Insights - помогает отслеживать перформанс моделей и находить узкие места. dbt Catalog - расширенный каталог моделей, колонок и источников с поиском, тегами и улучшенной навигацией по проекту. Удобно, но dbt docs и так был достаточно хорош. Cost management dashboard - дашборд для мониторинга стоимости выполнения моделей в разных средах и выявления неэффективных запросов. Полезно, но можно и свой сделать в обычном BI.__ Мы видим все больше и больше разделение dbt core (открытое ПО) и коммерческий dbt labs. Вы не поверите, но у меня даже проблемы использовать оба инструменты в командной строке, так как оба используют `dbt` команду. 2️⃣ вышел Spark 4.0. Но там нет таких красивых красочных изменений, поэтому и в новостях потише. __Spark Connect - новая клиент-серверная архитектура, позволяющая подключаться к Spark-кластерам из различных языков (Python, Scala, Go, Swift, Rust) без необходимости установки Spark локально, что упрощает разработку и масштабирование приложений. ANSI SQL по умолчанию - включение режима ANSI SQL обеспечивает более строгую проверку данных и совместимость с другими СУБД, улучшая переносимость и предсказуемость SQL-запросов. SQL PIPE-синтаксис - введение оператора |> для последовательного применения SQL-операций, повышая читаемость и упрощая написание сложных запросов. SQL-скрипты с переменными и управляющими конструкциями — поддержка переменных, циклов и условий в SQL позволяет реализовывать сложную бизнес-логику непосредственно в SQL-скриптах без необходимости использования внешних языков программирования. Тип данных VARIANT - новый тип данных (прям как у Snowflake 10 лет назад) для хранения полуструктурированных данных, таких как JSON, обеспечивая эффективную работу с вложенными структурами без необходимости явного определения схемы. Нативная визуализация в PySpark - возможность создавать графики и диаграммы непосредственно из DataFrame в PySpark с использованием Plotly, упрощая анализ данных. Python Data Source API - новый API, позволяющий разработчикам создавать собственные источники данных для пакетной и потоковой обработки полностью на Python, расширяя возможности интеграции. Polymorphic Python UDTFs - поддержка пользовательских табличных функций в Python с динамической схемой, позволяя создавать гибкие и мощные трансформации данных. Structured Logging - введение структурированного логирования в формате JSON, облегчая мониторинг и отладку приложений. transformWithState API - новый API для обработки состояния в потоковой обработке, предоставляющий более гибкие и мощные возможности для управления состоянием в реальном времени.__ PS вы можете посмотреть Snowflake Keynotes онлайн по этой ссылке
Бодрая неделька выдалась, столько новинок интересных. Ведь скоро Databricks и…
Из этого канала
- #5238Вот такой сервис который сравнивает IT зарплаты из всего русского сегмента. Как…
Вот такой сервис который сравнивает IT зарплаты из всего русского сегмента. Как я понял, он пылесосит все открытые источники типа hh и сливает все в приятный…
- #5239"Очень интересная точка зрения основателя Tobiko (SQLMesh) — главного…
"Очень интересная точка зрения основателя Tobiko (SQLMesh) — главного конкурента dbt.
- #5240"AI-помощники при работе с кодом. Взгляд в будущее - Евгений Колесников -…
"AI-помощники при работе с кодом. Взгляд в будущее - Евгений Колесников - Platform Engineering Night (Рубрика #AI) Крутое выступление Евгения из команды Yandex…
- #5236Как ВЫЙТИ из IT и стать счастливым? Владислав Князев, тимлид из финтеха,…
Как ВЫЙТИ из IT и стать счастливым? Владислав Князев, тимлид из финтеха, искренне и с жизнелюбием пишет про путь от выгоревшего айтишника в надежного…
- #5234"DuckDB предложил очень интересную альтернативу - DuckLake: SQL as a Lakehouse…
"DuckDB предложил очень интересную альтернативу - DuckLake: SQL as a Lakehouse Format Что это значит? Если мы откатимся назад и повторим эволюцию аналитических…