如何做分布式计数器的可观测性与容量评估?关键指标有哪些?
How do you build observability and capacity planning for a distributed counter, and what metrics matter?
题目类型: 技术面试题
这是一道技术面试题,常见于澳洲IT公司面试中。
难度: medium
分类: System Design
标签: metrics, capacity planning, monitoring
参考答案摘要
答案 可观测性要覆盖服务层与存储层:监控 counter service 的 QPS、P95/P99 延迟、错误率、WebSocket 在线连接数、心跳超时数量;监控 CRDT 数据库的写入吞吐、复制延迟、合并耗时、内存/CPU、网络带宽;对热点 key 的分布做 top-N 统计。容量评估可通过压测/混沌测试找瓶颈,并以峰值并发、复制延迟上限、单节点吞吐为依据规划分片数与机房容量。
本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案。