搜索

pdf文档 海尔实时计算平台技术选型与实践

3.21 MB 41 页 0 下载 77 浏览 0 评论 0 收藏
语言 格式 评分
中文(简体)
.pdf
3
摘要
文档详细介绍了海尔实时计算平台的建设背景、技术选型与实践。内容涵盖平台建设的总体规划、数据采集方式的选择、日志收集技术的对比分析、流式处理架构的设计、实时计算质量的保证,以及平台监控和报警方案的实施。文档重点讨论了数据可视化目标的实现、实时数据采集的技术选型要求、实时计算结果正确性的验证方法,以及开源技术改造的经验分享。
AI总结
### 《海尔实时计算平台技术选型与实践》总结 #### 背景 - 海尔大数据总体规划:涵盖数据应用、数据可视化、精准化分析等。 - 数据架构分层: - **信息层系统**:Hadoop + MySQL。 - **数据层系统**:Hadoop。 - **应用层**:包括数据门户、内部应用、关键业务数据(如实时库存、用户行为、订单等)。 - **区域运营**:跨境电商、区域运营、服务网等。 #### 实时计算平台技术选型与实践 1. **数据可视化** - **目标**:为公司所有数据分析项目提供数据洞察和展示工具。 - **技术选型要求**:完整、低延时、不影响业务系统性能。 2. **实时数据采集** - **采集方式**: - **代码埋点**:采集能力强,但时间、人力成本高。 - **可视化埋点**:成本低、速度快,但行为记录信息少。 - **技术选型要求**:完整、低延时、不影响业务系统性能。 3. **日志收集技术** - 可选技术:Flume、Fluentd、Logstash、Scribe。 4. **实时计算平台监控与报警** - 监控工具:Ganglia、Nagios。 - 报警机制:实时监控平台运行状态,确保系统稳定。 5. **流式日志处理** - 常见架构:Storm流式日志处理。 - 质量保证:实时计算结果正确性验证。 6. **开源技术改造经验** - 数据可视化:Actly-once(具体技术需进一步确认)。 - 流式处理:Storm。 - 其他技术:RabbitMQ、Canal、JS Strom等。 #### 关键技术选型 - **实时数据采集**:完整、低延时、不影响业务系统性能。 - **日志收集**:Flume、Fluentd、Logstash、Scribe。 - **流式处理**:Storm。 - **监控报警**:Ganglia、Nagios。 #### 总结 海尔实时计算平台通过开源技术选型与实践,结合数据可视化、实时数据采集、流式日志处理、监控报警等技术,构建了一个高效、可靠的实时数据分析系统,为业务提供了实时数据支持和洞察能力。
P1
P2
P3
P4
P5
P6
P7
P8
P9
P10
P11
P12
下载文档到本地,方便使用
- 可预览页数已用完,剩余 29 页请下载阅读 -
文档评分
请文明评论,理性发言.