数据库 · ClickHouse

ClickHouse on Kubernetes

0 码力 | 34 页 | 5.06 MB | 2 年前
3

文档主要介绍了在Kubernetes上运行ClickHouse的相关内容。ClickHouse是一种高性能的列式数据库，适用于数据分析场景。文档讨论了在Kubernetes上运行ClickHouse的挑战，包括配置复杂性、持久化存储、网络管理以及透明度问题。为了解决这些问题，Altinity推出了ClickHouse Operator，这是一个用于简化Kubernetes上ClickHouse集群管理的工具。Operator通过自动化部署、扩展和监控，提供了更高效和可靠的ClickHouse运行环境。文档还展示了如何使用Kubernetes API和YAML文件来配置ClickHouse集群，并提到了一些高级功能，如自动创建架构、监控集成以及容灾备份等。
ClickHouse on Kubernetes

0 码力 | 29 页 | 3.87 MB | 2 年前
3

文档介绍了如何在Kubernetes上运行ClickHouse，重点介绍了ClickHouse Operator的作用，该工具简化了数据仓库的配置管理。文档讨论了在Kubernetes上运行ClickHouse的优势，包括与其他应用的兼容性、便携性和快速部署。同时，提到了部署架构，包括Load Balancer Service、Stateful Set和Persistent Volume等组件。文档还指出了当前的挑战，如供应、持久性和网络问题，并提到了现有的功能如监控和自动架构创建，以及未来的改进方向，如多区域部署和存储管理。
8. Continue to use ClickHouse as TSDB

0 码力 | 42 页 | 911.10 KB | 2 年前
3

文档主要介绍了青云QingCloud选择并继续使用ClickHouse作为时间序列数据库（TSDB）的原因、当前的实施方式以及未来的计划。ClickHouse作为一种高效的数据存储和查询引擎，通过其列式存储模型和MergeTree引擎，能够有效处理时间序列数据。文档强调了ClickHouse在处理时间序列数据时的优势，并展望了未来的优化方向。
7. UDF in ClickHouse

0 码力 | 29 页 | 1.54 MB | 2 年前
3

文档主要介绍了ClickHouse中的用户定义函数（UDF）及其在机器学习系统中的应用。文档详细阐述了UDF的类型，包括标量函数、聚合函数和表函数，并展示了其在数据预处理、特征工程和连接识别等场景中的实际应用。此外，文档还介绍了Zora框架，这是一个高性能算法实现框架，支持与ClickHouse、NumPy和Pandas的无缝集成。Zora框架通过C++实现，提供了针对机器学习管道的定制算法组件，包括数据结构、图算法和统计操作等。文档还讨论了ClickHouse的性能优势，包括高效的内存使用和快速的数据处理能力，并通过示例展示了如何在ClickHouse中使用UDF进行复杂的数据处理和分析。
6. ClickHouse在众安的实践

0 码力 | 28 页 | 4.00 MB | 2 年前
3

文档详细介绍了ClickHouse在众安的应用实践，包括数据处理、性能优化和集群配置。通过利用ClickHouse的高效性能，解决了传统数据查询慢、数据更新慢以及灵活性不足的问题。文档还展示了ClickHouse在百亿级数据下的性能测试结果，包括数据导入速度和典型查询的性能表现，并提出了相应的优化方法。
5. ClickHouse at Ximalaya for Shanghai Meetup 2019 PDF

0 码力 | 28 页 | 6.87 MB | 2 年前
3

文档介绍了喜马拉雅公司在其业务中应用ClickHouse进行OLAP分析的情况。ClickHouse被用于用户行为分析、用户属性分析以及监控等方面，特别是在处理大规模数据时表现出色。文档还讨论了ClickHouse的性能评估、集成与优化，以及其在提升业务ROI和应用监控中的作用。
4. ClickHouse在苏宁用户画像场景的实践

0 码力 | 32 页 | 1.47 MB | 2 年前
3

本文详细介绍了苏宁在用户画像场景中使用ClickHouse的经验与实践。文档首先分析了传统用户画像流程的痛点，包括数据导入时间长、标签更新不实时、资源消耗大以及查询语法不友好等问题。随后，重点介绍了选择ClickHouse的原因，包括其快速的数据处理能力、高效的特性发布、高质量的软件架构、支持高基数查询以及精确去重计数等优势。通过性能测试对比，展示了ClickHouse在4亿数据集上的去重性能表现。最后，总结了ClickHouse在苏宁的应用场景，包括OLAP平台存储引擎、运维监控以及用户画像查询引擎等方面。
3. Sync Clickhouse with MySQL_MongoDB

0 码力 | 38 页 | 7.13 MB | 2 年前
3

文档详细介绍了如何将Clickhouse与MySQL和MongoDB同步。主要内容包括：通过配置文件快速同步多个数据源，处理分片表合并，解决Clickhouse在处理频繁更新/删除操作时的Mutation卡顿问题，以及通过MySQL Engine实现数据同步。文档还提到了使用Binlog和Oplog进行数据变更操作，并提供了针对大数据量场景的优化建议。
2. Clickhouse玩转每天千亿数据-趣头条

0 码力 | 14 页 | 1.10 MB | 2 年前
3

本文介绍了趣头条在使用Clickhouse处理每天千亿数据时的实践经验。文档详细描述了业务背景、集群现状以及在实际应用中遇到的问题，并提出了相应的解决方案。通过优化机器配置、改进Zookeeper集群规划以及选择合适的引擎，趣头条成功实现了高效的数据处理和稳定的系统运行。
1. Machine Learning with ClickHouse

0 码力 | 64 页 | 1.38 MB | 2 年前
3

文档介绍了如何在ClickHouse中进行机器学习，包括存储训练好的模型、使用聚合函数进行线性回归训练、导入实验数据集（如NYC出租车和Uber数据）以及应用CatBoost模型进行预测。文档还列出了未来改进的方向，如支持更多损失函数和优化模型训练功能。

共 22 条前往

页

搜索