⚖️ Думаете, у вас нет SRM? Проверьте ещё раз О том, что такое Sample Ratio Mismatch (SRM) в АБ тестировании, как его определить и почему это важно – я уже рассказывал вот в этом посте. Если думаете, что проблемы с SRM не касаются АБ тестов вашего продукта – это хороший повод задуматься. Даже крупные корпорации с крайне развитой experiment-driven культурой и принципами «тестировать каждый пиксель» страдают от этой проблемы. Например, 6% всех в Microsoft имели SRM. Или 10% АБ в LinkedIn с кастомным условием попадания в тест. Я не исключение – SRM сжег десятки часов моей жизни. И сегодня хочу поделиться парой кейсов столкновения с SRM из своего опыта: 1️⃣ Я занимался АБ-тестами веб-версии продукта. Технически деление происходило через Nginx (обратный прокси, балансировщик) – направляли трафик на ноды с разными ветками продукта. Теоретически делили трафик 50/50. На практике, практически вне зависимости от размера выборки, с поражающей стабильностью выходило 45/55. Много недель было потрачено в попытке найти корень проблемы. Оказалось, что дело было в конфиге Nginx – баланс был указан в процентах, а нужно было указать в абсолютах 🤦♂️ Почему две фактически эквивалентные записи работали по-разному – осталось загадкой. Наверное, потому что Javascript. 2️⃣ Проводил ревью АБ-платформы в одном стартапе. Основной продукт – мобильное приложение. При делении 50/50 следов SRM не было. Но стоило поделить как-то иначе, например, 90/10 – он возникал. Оказалось, что дело бы в самописной хеш-функции для распределения пользователей на ветки (вместо, например, классического md5), которую ребята сами изобрели. --- «Ну подумаешь – выборки получились разного размера. Это же никак не влияет на результаты. Можно просто подводить итоги как обычно и все» А это заблуждение может стоить вам корректности принимаемых решений. Sample Ratio Mismatch – индикатор более серьезных проблем где-то в глубине механизмов проведения АБ. Так, в первом моем кейсе «из-за SRM» пользователи бывали сразу в нескольких ветках за тест. А во втором – появился эффект памяти. Т. е. те пользователи, кто уже был в контроле, в следующем эксперименте вероятнее тоже попадут в контроль. Это все приводит к нерепрезентативности получаемых результатов. А сталкивались ли вы с SRM на практике? В чем была его причина? #абтесты
⚖️ Думаете, у вас нет SRM? Проверьте ещё раз О том, что такое Sample Ratio…
Источник
https://t.me/nodatanogrowth/749Канал No Data No Growth | Pavel Bukhtik · опубликовано 25 мар. 2025 г.
Из этого канала
- #750История о том, как система поощряет хаос Этим летом я планировал поездку в…
История о том, как система поощряет хаос Этим летом я планировал поездку в Европу. Хотелось поехать по маршруту Турция - Италия - Португалия - Мадейра.
- #751📈 Как определить метрики для АБ-теста? 4 вида метрик. Как в рабочих задачах,…
📈 Как определить метрики для АБ-теста? 4 вида метрик. Как в рабочих задачах, так и на собеседованиях, важно уметь подбирать метрики АБ-экспериментов.
- #752👨💻 Разбор тестового задания на SQL в один EdTech Как и в любом навыке,…
👨💻 Разбор тестового задания на SQL в один EdTech Как и в любом навыке, регулярная практика — твой лучший друг.
- #748🎯 Почему понимать промахи важнее чем радоваться попаданиям? Позавчера я окончил…
🎯 Почему понимать промахи важнее чем радоваться попаданиям? Позавчера я окончил начальный курс по спортивно-прикладной стрельбе (IPSC) из огнестрельного оружия…
- #747🔥 Давайте знакомиться и прокачивать нетворкинг в комментариях! 🔥 На канал…
🔥 Давайте знакомиться и прокачивать нетворкинг в комментариях! 🔥 На канал подписано уже более 10 000 человек – довольно таки не мало.