为什么概率型数据结构(如 HyperLogLog、Count-Min Sketch)不适合用来做“准确”的分布式计数器?
Why are probabilistic data structures (e.g., HyperLogLog, Count-Min Sketch) not suitable for an accurate distributed counter?
题目类型: 技术面试题
这是一道技术面试题,常见于澳洲IT公司面试中。
难度: medium
分类: System Design
标签: HyperLogLog, Count-Min Sketch
参考答案摘要
答案 概率型结构的核心优势是省空间,但以“可控误差”换取压缩。例如 HyperLogLog 适合估算基数且通常不支持删除;Count-Min Sketch 适合频次估计但会高估且难以精确递减。对于题目要求“计数必须准确、可递增也可递减”的在线人数/浏览数等场景,它们会引入误差或无法正确处理退出/撤销,因此不应作为主方案。
本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案。