📊 Что такое репрезентативность в A/B? Репрезентативность определяет возможность корректно перенести выводы с выборок на всю исследуемую аудиторию (генеральную совокупность). Когда говорят о репрезентативности, чаще всего вспоминают размер выборки. Но на практике этого недостаточно. В A/B-тестах у репрезентативности есть две стороны: 1️⃣ Количественная репрезентативность Она отвечает на вопрос: достаточно ли у нас наблюдений, чтобы заметить эффект нужного размера (MDE) при заданных уровнях ошибок I и II рода? 2️⃣ Качественная репрезентативность Отвечает на другой вопрос: содержит ли выборка представителей всех сегментов совокупности и в соответствующей пропорции? Например, если в генеральной совокупности: - 60% мобильных пользователей; - 40% десктопных. А в выборках оказалось: - 85% мобильных; - 15% десктопных. То такая выборка уже не отражает структуру аудитории. И даже если наблюдений много – вывод будет смещен (нерепрезентативен). Чтобы результаты теста можно было переносить на всю аудиторию, важно, чтобы сегменты были представлены в тех же долях, что и в генеральной совокупности. ⚠️ Репрезентативность всегда оценивается относительно конкретной аудитории. Если тест идет только на новых пользователях или только на Android, то и оценивать репрезентативность нужно именно относительно этой аудитории, а не всего продукта. По этой же логике нельзя переносить результаты теста на Android-пользователях на iOS-аудиторию. ⚠️ В A/B-тесте важно не только то, насколько выборка похожа на исследуемую аудиторию (ГС), но и то, насколько группы A и B сопоставимы между собой. Если из-за ошибки сплитования в одной из групп окажется значимо больше, например, heavy-пользователей, результат тоже будет смещен. --- Репрезентативность в A/B – это и про количество, и про качество. Поэтому важно смотреть не только на размер выборки, но и на то, кого именно она отражает. А на какую тему вы бы хотели следующий пост? Напишите в комментариях 👇 #абтесты
📊 Что такое репрезентативность в A/B? Репрезентативность определяет возможность…
Источник
https://t.me/nodatanogrowth/1048Канал No Data No Growth | Pavel Bukhtik · опубликовано 2 мар. 2026 г.
Из этого канала
- #1049🤖 Зачем аналитику разбираться в ML? Часто ML воспринимают как что-то далекое от…
🤖 Зачем аналитику разбираться в ML? Часто ML воспринимают как что-то далекое от аналитики. Ведь «это уже зона ответственности DS/ML-команд».
- #1057🤯 Как связаны А/В и линейная регрессия? Что если я скажу, что классический A/B…
🤯 Как связаны А/В и линейная регрессия? Что если я скажу, что классический A/B тест – это частный случай линейной регрессии? Когда я впервые это осознал, моя…
- #1058📈 Метрики выросли. А продукт не факт, что стал лучше Одна из дорогих ошибок в…
📈 Метрики выросли. А продукт не факт, что стал лучше Одна из дорогих ошибок в продуктовой аналитике – принимать рост метрик за рост ценности.
- #1039👥 9 типов кандидатов на собеседовании Не так давно на канале был пост про 8…
👥 9 типов кандидатов на собеседовании Не так давно на канале был пост про 8 типов интервьюеров на собесе.
- #1038🚀 Пятый поток курса по А/В стартует уже на следующей неделе В эту пятницу уже…
🚀 Пятый поток курса по А/В стартует уже на следующей неделе В эту пятницу уже встреча-знакомство потока. Осталось 9 мест.