pdf文档 3. 数仓ClickHouse多维分析应用实践-朱元

3.03 MB 14 页 0 评论
语言 格式 评分
中文(简体)
.pdf
3
摘要
文档介绍了ClickHouse在数仓中的应用实践,包括数据同步、数据模型设计和多维分析。Oracle数据平台通过Kettle每天定时导出文件至本地,随后通过ClickHouse-Client导入ClickHouse数据库。ClickHouse数仓采用星型模型,维度表使用Log引擎和字典表,主题事实清单表使用MergeTree引擎,并采用T+1的数据同步策略。多维分析采用了开源报表系统DaVinci。
AI总结
以下是对文档《3. 数仓ClickHouse多维分析应用实践-朱元》的总结: --- ### 1.背景与问题 演讲主题为ClickHouse在数仓中的多维分析应用实践,演讲人为朱元,日期为2019年10月20日。 当前的数仓建设面临以下问题: - 数据对外开放以主题事实清单表和维度表为主,封装成视图进行展示并支持多维分析。 - 需要解决数据同步、建模和展示等关键环节的技术实现。 --- ### 2.数据同步方案 数据来源于Oracle数据平台,通过以下步骤实现同步: 1. 使用Kettle作为可视化同步工具,每日定时从Oracle导出数据文件至本地ETL服务器。 2. 通过ClickHouse-client将文本文件导入ClickHouse数据库。 **选择Kettle的原因**: - 符合公司T+1的数据要求(次日数据可用)。 - 基于现有开发人员水平及成本考虑。 --- ### 3.数仓建模与架构 1. **数据模型**: - 采用星型模型,分为主题事实清单表和维度表。 2. **表设计**: - **主题事实清单表**:采用MergeTree引擎,支持增量同步,每日从Oracle同步更新。 - **维度表**:数据量较小,采用Log引擎配合字典表(dictionary)存储。 3. **数据架构**: - clickhouse数据库与Oracle数据平台通过Kettle和ClickHouse-client完成数据同步。 --- ### 4.数据展示与多维分析 采用开源报表系统**Davinci**(项目地址:https://github.com/edp963/davinci)完成数据展示和多维分析,支持业务需求。 --- ### 总结 该实践主要围绕ClickHouse在数仓中的应用,通过Kettle实现数据同步,星型模型实现数据建模,Davinci支持数据展示与多维分析,全面解决了数仓建设中的关键问题。
P1
P2
P3
P4
P5
P6
P7
P8
P9
P10
P11
P12
下载文档到本地,方便使用
- 可预览页数已用完,剩余 2 页请下载阅读 -
文档评分
请文明评论,理性发言.