为什么概率型数据结构(如 HyperLogLog、Count-Min Sketch)不适合用来做“准确”的分布式计数器?
Why are probabilistic data structures (e.g., HyperLogLog, Count-Min Sketch) not suitable for an accurate distributed counter?
题目类型: 技术面试题
这是一道技术面试题,常见于澳洲IT公司面试中。
难度: medium
分类: System Design
标签: HyperLogLog, Count-Min Sketch
参考答案摘要
答案 概率型结构的核心优势是省空间,但以“可控误差”换取压缩。例如 HyperLogLog 适合估算基数且通常不支持删除;Count-Min Sketch 适合频次估计但会高估且难以精确递减。对于题目要求“计数必须准确、可递增也可递减”的在线人数/浏览数等场景,它们会引入误差或无法正确处理退出/撤销,因此不应作为主方案。
答题技巧
技术面试题建议先理清思路再作答,从基础概念讲起,逐步深入。可以结合实际项目经验解释技术原理,展示你的理解深度和实践能力。
本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案、收藏题目并进行模拟面试练习。