通知系统如何处理失败与重试?为什么需要指数退避(exponential backoff)和死信队列(DLQ)?
How does a notification system handle failures and retries? Why are exponential backoff and Dead Letter Queues (DLQ) needed?
题目类型: 技术面试题
这是一道技术面试题,常见于澳洲IT公司面试中。
难度: medium
分类: reliability, system-design
标签: failure-handling, retry, exponential-backoff, dlq, provider-downtime
参考答案摘要
TL;DR 发送失败通常是临时问题(网络抖动或第三方宕机)。Channel Processor 会用指数退避重试,避免重试风暴;超过最大重试次数则进入 DLQ,供管理员人工审查和补偿处理。 失败与重试机制 Channel Processor 调用第三方发送时若失败,触发重试。 使用 exponential backoff :每次重试间隔递增。 超过最大重试次数:写入 Dead Letter Que...
本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案。