Stream ingestion and pub/sub systems - CS 591 K1: Data Stream Processing and Analytics Spring 2020
700.14 KB
33 页
0 评论
语言 | 格式 | 评分 |
---|---|---|
英语 | .pdf | 3 |
摘要 | ||
The document discusses stream processing and analytics, focusing on stream ingestion and pub/sub systems. It highlights various data sources for stream processing, including files, sockets, IoT devices, databases, and message queues. The discussion covers pub/sub systems, their decoupling capabilities in space, time, and synchronization, and their use cases such as workload balancing, event notifications, cache refreshing, logging, and data streaming. Additionally, it touches on content-based pub/sub systems, where consumers subscribe using filters based on event properties or metadata, and the role of Complex Event Processing (CEP) systems as predecessors. | ||
AI总结 | ||
《流处理与Pub/Sub系统概述》
本文档围绕流处理与发布/订阅(Pub/Sub)系统的核心内容进行了详细阐述,以下是主要内容的总结:
### 一、流处理数据来源
流处理器从多种数据源读取数据,包括:
- 文件(如事务日志)
- 网络套接字
- IoT设备与传感器
- 数据库与键值存储
- 消息队列与代理
### 二、Pub/Sub系统特性
1. **主题管理**:Pub/Sub系统基于主题(Topic)进行消息传递,主题采用类似URL的命名方式,部分系统支持通配符匹配。
2. **内容过滤**:事件根据属性或内容分组,消费者通过过滤条件(如名称-值对和基本比较运算符)订阅特定事件,支持构建复杂事件模式。
3. **与CEP系统的关系**:内容过滤机制是复杂事件处理(CEP)系统的前身。
### 三、Pub/Sub与其他通信范式对比
Pub/Sub在时间、空间和同步解耦等方面具有显著优势,相较于其他通信范式(如消息传递、RPC/RMI、异步RPC、Futures和消息队列),它实现了高效的生产者与消费者解耦,支持异步通知和并发操作。
### 四、Google Cloud Pub/Sub示例与应用场景
1. **发布者与订阅者**:发布者将消息发布到主题,消息经过持久化存储后被传递给所有订阅者。支持_push_和_pull_两种消息分发模式。
2. **典型应用场景**:
- 在网络集群中分配工作负载。
- 分发事件通知(如用户注册后的通知)。
- 刷新分布式缓存。
- 日志记录与多系统写入。
- 从设备或进程实现数据流式传输。
### 五、总结
本文介绍了流处理的数据来源和Pub/Sub系统的核心特性,分析了Pub/Sub在通信范式中的优势,并通过Google Cloud Pub/Sub的应用场景展示了其实际价值,体现了Pub/Sub在分布式系统中的重要地位。 |
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余
26 页请下载阅读 -
文档评分