🕷 Как находить причинные связи в данных без А/В? Когда говорят о причинно-следственных связях, чаще всего имеют в виду Causal Inference. Но есть и другое направление, о котором незаслуженно вспоминают намного реже... Вообще у нас есть 3 основных источника знаний о причинности: 🔸 Эксперименты – золотой стандарт, но не всегда возможны 🔸 Экспертное знание – полезно, но может быть неполным или субъективным 🔸 Алгоритмы Causal Discovery 🚀 Causal Discovery — это подход, который помогает по данным восстановить возможную причинную структуру: что действительно на что влияет, а что только выглядит связанным. 📌 Классический пример: продажи мороженого и атаки акул коррелируют. Но это не значит, что мороженое привлекает акул. У этих явлений есть общая причина в виде температуры: в жару люди чаще покупают мороженое, чаще идут купаться, и поэтому растёт число атак акул. То есть наблюдаемая связь есть, а прямой причинности – нет. Именно такие ситуации Causal Discovery и помогает распутывать: отделять реальное влияние от ложных зависимостей, в том числе выявляя скрытые общие факторы (confounders). Такие алгоритмы смотрят не только на корреляции. Они проверяют, что происходит со связью между переменными, если учитывать другие переменные, и пытаются определить возможное направление влияния. 📌 Например: мороженое и атаки акул коррелируют. Но если зафиксировать температуру, то связь исчезает. Это сильный сигнал, что перед нами не причинность, а эффект общего фактора. При этом важно не переоценивать возможности метода. Он лишь отбрасывает те структуры, которые противоречат наблюдениям, и оставляет те, которые могут быть с ними согласованы при определённых допущениях. То есть на выходе мы получаем набор правдоподобных причинных структур, с которыми уже можно работать дальше. ❓ Зачем это нужно на практике? Представьте, что у вас есть причинный граф, который хотя бы частично показывает, какие действия пользователя с высокой вероятностью инкрементально растят его LTV. Например, активации в фичи или приглашение друзей. Тогда вы: 🔸 лучше понимаете, куда действительно стоит копать дальше; 🔸 генерируете более сильные гипотезы; 🔸 реже попадаете в ловушку ложных взаимосвязей; 🔸 получаете основу для дальнейшей проверки причинных связей, где они ещё не подтверждены, и оценки размера эффектов. Все это, на мой взгляд, делает Causal Discovery довольно недооцененным инструментом. Интересно было бы узнать больше про Causal Discovery? Тогда поддержи пост огоньком 🔥
🕷 Как находить причинные связи в данных без А/В? Когда говорят о…
Источник
https://t.me/nodatanogrowth/1096Канал No Data No Growth | Pavel Bukhtik · опубликовано 10 апр. 2026 г.
Из этого канала
- #1097⭐ 8 аспектов качественных данных Хорошие данные нужны нам везде: для принятия…
⭐ 8 аспектов качественных данных Хорошие данные нужны нам везде: для принятия решений, поиска точек роста, А/В и обучения ML.
- #1106🎲 Почему в A/A-тестах p-value распределены равномерно? В A/A тесте между…
🎲 Почему в A/A-тестах p-value распределены равномерно? В A/A тесте между группами нет реального эффекта, только случайный шум.
- #1107🔍 Откуда берется p-value в лин. регрессии в контексте A/B? В одном из последних…
🔍 Откуда берется p-value в лин. регрессии в контексте A/B? В одном из последних постов я писал, что A/B тест можно рассматривать как частный случай линейной…
- #1095🤓 Всем, кто хоть раз участвовал в сверке, посвящается: Утро. Дейли. Все пока…
🤓 Всем, кто хоть раз участвовал в сверке, посвящается: Утро. Дейли. Все пока еще верят в свои данные.
- #1085🧠 Разбор 20 вопросов по ML и Causal Impact Ранее я делился с вами своим тестом…
🧠 Разбор 20 вопросов по ML и Causal Impact Ранее я делился с вами своим тестом по ML и Causal Inference.