Caching & Async
Batch vs Stream Processing
批处理与流式处理的取舍
Batch processing 是把一段时间的数据先收集起来,再一次性处理。它更适合大规模、可延迟的计算。
Stream processing 则是数据一到就处理,强调 near real-time 响应。

Trade-off 快览
- Batch:吞吐高、成本低、实现相对简单,但有延迟
- Stream:低 latency、实时性强,但系统复杂度更高、成本更高
示例
- 信用卡账单/日报表:适合 batch(每天/每小时聚合)
- 风控/欺诈检测:适合 stream(交易实时检测)
何时选哪种?
- 需要实时反馈 → 选 stream
- 允许延迟、重成本 → 选 batch
- 很多系统会 hybrid:实时流 + 定期 batch 纠错