搜索

pdf文档 2. 腾讯 clickhouse实践 _2019丁晓坤&熊峰

3.58 MB 26 页 1 下载 108 浏览 0 评论 0 收藏
语言 格式 评分
中文(简体)
.pdf
3
摘要
文档主要介绍了腾讯在游戏数据分析中的ClickHouse应用实践。内容涵盖ClickHouse的部署与监控管理,包括单机配置、高内存和廉价存储等硬件要求。同时,文档详细描述了ClickHouse在iData数据分析引擎中的应用,包括其在游戏数据驱动场景中的实时干预能力、多维分析和画像分析能力。此外,文档还探讨了选择ClickHouse的原因,如OLAP能力、高性能和列式存储等,并提到了当前在ClickHouse使用中存在的扩展性问题和性能优化方向。
AI总结
# 腾讯 ClickHouse 实践总结 ## 1. 背景与概述 腾讯在游戏数据分析中引入 ClickHouse,主要用于解决传统数据分析引擎的性能瓶颈,提升实时分析能力。 ## 2. 部署与监控管理 ### 部署配置 - **单机配置**:高内存、廉价存储,单机配置为: - 内存:128G - CPU核数:24 - 存储:SATA 20T,RAID5 - 网络:万兆网卡 - **监控管理**: - 监控指标:CPU、内存、磁盘IO、网络流量等 - ClickHouse 自身指标:查询次数、响应时间等 - 物理层监控:磁盘IO、流量等 ## 3. 业务应用实践 ### iData 数据分析引擎 - **业务背景**: - 游戏数据分析需要实时干预用户,提升服务效果。 - 需要多维分析、画像分析能力。 - **iData 的问题**: - 扩展性差 - 数据导入后不支持修改/追加 - 数据类型有限(仅支持数字类型) - 数据量达到10亿级以上时,查询效率下降 - 单表计算,不能进行多表关联计算 - **选择 ClickHouse 的原因**: - OLAP 能力 - 超高性能 - 列式存储 - 丰富的统计函数 - 线性扩展能力 - 4亿数据下钻耗时显著降低 ### ClickHouse 集群与集成 - **ClickHouse 集群**: - 集成消息中间件 - 对接数据仓库(TDW) - 对接 RDBMS(MySQL) - 数据分析引擎(TGMARS DATA) - **性能提升**: - 实时分析能力增强 - 查询效率提升 ## 4. 未来改进方向 - **功能优化**: - 支持更多机器学习算法 - 支持 Explain 查看 SQL 执行计划 - **集群管理**: - 提高集群管理能力 - 优化响应耗时 - 物理层监控(磁盘IO、流量等) ## 总结 腾讯通过引入 ClickHouse,解决了传统数据分析引擎在扩展性、性能和数据类型上的限制,显著提升了游戏数据分析的实时性和准确性。ClickHouse 的高性能和列式存储特性使其成为大数据分析的理想选择,但未来仍需在功能扩展和集群管理方面进一步优化。
P1
P2
P3
P4
P5
P6
P7
P8
P9
P10
P11
P12
下载文档到本地,方便使用
- 可预览页数已用完,剩余 14 页请下载阅读 -
文档评分
请文明评论,理性发言.