🕷 Как находить причинные связи в данных без А/В? Когда говорят о… — @nodatanogrowth

🕷 Как находить причинные связи в данных без А/В? Когда говорят о причинно-следственных связях, чаще всего имеют в виду Causal Inference. Но есть и другое направление, о котором незаслуженно вспоминают намного реже... Вообще у нас есть 3 основных источника знаний о причинности: 🔸 Эксперименты – золотой стандарт, но не всегда возможны 🔸 Экспертное знание – полезно, но может быть неполным или субъективным 🔸 Алгоритмы Causal Discovery 🚀 Causal Discovery — это подход, который помогает по данным восстановить возможную причинную структуру: что действительно на что влияет, а что только выглядит связанным. 📌 Классический пример: продажи мороженого и атаки акул коррелируют. Но это не значит, что мороженое привлекает акул. У этих явлений есть общая причина в виде температуры: в жару люди чаще покупают мороженое, чаще идут купаться, и поэтому растёт число атак акул. То есть наблюдаемая связь есть, а прямой причинности – нет. Именно такие ситуации Causal Discovery и помогает распутывать: отделять реальное влияние от ложных зависимостей, в том числе выявляя скрытые общие факторы (confounders). Такие алгоритмы смотрят не только на корреляции. Они проверяют, что происходит со связью между переменными, если учитывать другие переменные, и пытаются определить возможное направление влияния. 📌 Например: мороженое и атаки акул коррелируют. Но если зафиксировать температуру, то связь исчезает. Это сильный сигнал, что перед нами не причинность, а эффект общего фактора. При этом важно не переоценивать возможности метода. Он лишь отбрасывает те структуры, которые противоречат наблюдениям, и оставляет те, которые могут быть с ними согласованы при определённых допущениях. То есть на выходе мы получаем набор правдоподобных причинных структур, с которыми уже можно работать дальше. ❓ Зачем это нужно на практике? Представьте, что у вас есть причинный граф, который хотя бы частично показывает, какие действия пользователя с высокой вероятностью инкрементально растят его LTV. Например, активации в фичи или приглашение друзей. Тогда вы: 🔸 лучше понимаете, куда действительно стоит копать дальше; 🔸 генерируете более сильные гипотезы; 🔸 реже попадаете в ловушку ложных взаимосвязей; 🔸 получаете основу для дальнейшей проверки причинных связей, где они ещё не подтверждены, и оценки размера эффектов. Все это, на мой взгляд, делает Causal Discovery довольно недооцененным инструментом. Интересно было бы узнать больше про Causal Discovery? Тогда поддержи пост огоньком 🔥

Из этого канала