Spark Streaming 是什么?它如何处理实时数据?
Define Spark Streaming.
题目类型: 技术面试题
这是一道技术面试题,常见于澳洲IT公司面试中。
难度: medium
分类: Spark Streaming, 实时处理
标签: spark-streaming, live-streams, kafka, flume, kinesis, micro-batch
参考答案摘要
定义 Spark Streaming 是 Spark API 的扩展,用于对 实时数据流 进行流式处理。数据可来自 Kafka、Flume、Kinesis 等来源,处理后可写入文件系统、实时 dashboard 或数据库。 处理方式 它在概念上类似 batch processing:会把流数据切分成类似“批次”的小段(micro-batch)进行处理。
本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案。