你如何保证系统的高可用(High Availability)与容错(Fault Tolerance)?
How do you ensure high availability and fault tolerance in a system?
题目类型: 技术面试题
这是一道技术面试题,常见于澳洲IT公司面试中。
难度: medium
分类: Carsales Interview, Technical
标签: HA, Fault Tolerance
目标公司: carsales
参考答案摘要
答案 做法:多实例 + 负载均衡;跨可用区部署;自动伸缩;关键依赖做冗余与故障切换(DB 主从/多副本、缓存集群);限流与熔断;超时与重试(带退避);幂等;数据备份与演练;监控告警与 Runbook。 目标是用 SLO 驱动:把可用性拆到每个依赖上,明确错误预算。 Answer Approaches: multi-instance + load balancing; multi-AZ deploy...
本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案。