logo

20 个 variant 的 A/B 测试出现大量显著结果(significant)是否可疑?为什么?

Is there anything suspicious about significant results from an A/B test with 20 variants?

题目类型: 技术面试题

这是一道技术面试题,常见于澳洲IT公司面试中。

难度: medium

分类: Experimentation, Statistics

标签: False Positives, SRM, Peeking, Replication

目标公司: TikTok

参考答案摘要

答案 是的,需要警惕多重比较(multiple comparisons):当你同时做很多对比,即便所有 variant 都没真实效果,也会因为随机波动出现一些“显著”。我会检查:1)是否做了显著性校正(FDR/Bonferroni);2)是否存在 peeking(中途频繁看结果)、SRM(样本比例偏差)、或埋点口径不一致;3)效果大小是否合理、置信区间是否稳定;4)是否在关键分群上可复现。通常做法...

本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案。

← 返回面试题库

20 个 variant 的 A/B 测试出现大量显著结果(significant)是否可疑?为什么?

Mediumexperimentationstatisticsmultiple-testing

想查看完整答案?

登录匠人学院学习中心,获取 STAR 格式回答和详细技术解析

前往学习中心查看答案