搜索

排序方式
22 个文档
  • pdf 文档 ClickHouse on Kubernetes

    0 码力 | 34 页 | 5.06 MB | 2 年前
    3
    文档主要介绍了在Kubernetes上运行ClickHouse的相关内容。ClickHouse是一种高性能的列式数据库,适用于数据分析场景。文档讨论了在Kubernetes上运行ClickHouse的挑战,包括配置复杂性、持久化存储、网络管理以及透明度问题。为了解决这些问题,Altinity推出了ClickHouse Operator,这是一个用于简化Kubernetes上ClickHouse集群管理的工具。Operator通过自动化部署、扩展和监控,提供了更高效和可靠的ClickHouse运行环境。文档还展示了如何使用Kubernetes API和YAML文件来配置ClickHouse集群,并提到了一些高级功能,如自动创建架构、监控集成以及容灾备份等。
  • pdf 文档 ClickHouse on Kubernetes

    0 码力 | 29 页 | 3.87 MB | 2 年前
    3
    文档介绍了如何在Kubernetes上运行ClickHouse,重点介绍了ClickHouse Operator的作用,该工具简化了数据仓库的配置管理。文档讨论了在Kubernetes上运行ClickHouse的优势,包括与其他应用的兼容性、便携性和快速部署。同时,提到了部署架构,包括Load Balancer Service、Stateful Set和Persistent Volume等组件。文档还指出了当前的挑战,如供应、持久性和网络问题,并提到了现有的功能如监控和自动架构创建,以及未来的改进方向,如多区域部署和存储管理。
  • pdf 文档 8. Continue to use ClickHouse as TSDB

    0 码力 | 42 页 | 911.10 KB | 2 年前
    3
    文档主要介绍了青云QingCloud选择并继续使用ClickHouse作为时间序列数据库(TSDB)的原因、当前的实施方式以及未来的计划。ClickHouse作为一种高效的数据存储和查询引擎,通过其列式存储模型和MergeTree引擎,能够有效处理时间序列数据。文档强调了ClickHouse在处理时间序列数据时的优势,并展望了未来的优化方向。
  • pdf 文档 7. UDF in ClickHouse

    0 码力 | 29 页 | 1.54 MB | 2 年前
    3
    文档主要介绍了ClickHouse中的用户定义函数(UDF)及其在机器学习系统中的应用。文档详细阐述了UDF的类型,包括标量函数、聚合函数和表函数,并展示了其在数据预处理、特征工程和连接识别等场景中的实际应用。此外,文档还介绍了Zora框架,这是一个高性能算法实现框架,支持与ClickHouse、NumPy和Pandas的无缝集成。Zora框架通过C++实现,提供了针对机器学习管道的定制算法组件,包括数据结构、图算法和统计操作等。文档还讨论了ClickHouse的性能优势,包括高效的内存使用和快速的数据处理能力,并通过示例展示了如何在ClickHouse中使用UDF进行复杂的数据处理和分析。
  • pdf 文档 6. ClickHouse在众安的实践

    0 码力 | 28 页 | 4.00 MB | 2 年前
    3
    文档详细介绍了ClickHouse在众安的应用实践,包括数据处理、性能优化和集群配置。通过利用ClickHouse的高效性能,解决了传统数据查询慢、数据更新慢以及灵活性不足的问题。文档还展示了ClickHouse在百亿级数据下的性能测试结果,包括数据导入速度和典型查询的性能表现,并提出了相应的优化方法。
  • pdf 文档 5. ClickHouse at Ximalaya for Shanghai Meetup 2019 PDF

    0 码力 | 28 页 | 6.87 MB | 2 年前
    3
    文档介绍了喜马拉雅公司在其业务中应用ClickHouse进行OLAP分析的情况。ClickHouse被用于用户行为分析、用户属性分析以及监控等方面,特别是在处理大规模数据时表现出色。文档还讨论了ClickHouse的性能评估、集成与优化,以及其在提升业务ROI和应用监控中的作用。
  • pdf 文档 4. ClickHouse在苏宁用户画像场景的实践

    0 码力 | 32 页 | 1.47 MB | 2 年前
    3
    本文详细介绍了苏宁在用户画像场景中使用ClickHouse的经验与实践。文档首先分析了传统用户画像流程的痛点,包括数据导入时间长、标签更新不实时、资源消耗大以及查询语法不友好等问题。随后,重点介绍了选择ClickHouse的原因,包括其快速的数据处理能力、高效的特性发布、高质量的软件架构、支持高基数查询以及精确去重计数等优势。通过性能测试对比,展示了ClickHouse在4亿数据集上的去重性能表现。最后,总结了ClickHouse在苏宁的应用场景,包括OLAP平台存储引擎、运维监控以及用户画像查询引擎等方面。
  • pdf 文档 3. Sync Clickhouse with MySQL_MongoDB

    0 码力 | 38 页 | 7.13 MB | 2 年前
    3
    文档详细介绍了如何将Clickhouse与MySQL和MongoDB同步。主要内容包括:通过配置文件快速同步多个数据源,处理分片表合并,解决Clickhouse在处理频繁更新/删除操作时的Mutation卡顿问题,以及通过MySQL Engine实现数据同步。文档还提到了使用Binlog和Oplog进行数据变更操作,并提供了针对大数据量场景的优化建议。
  • pdf 文档 2. Clickhouse玩转每天千亿数据-趣头条

    0 码力 | 14 页 | 1.10 MB | 2 年前
    3
    本文介绍了趣头条在使用Clickhouse处理每天千亿数据时的实践经验。文档详细描述了业务背景、集群现状以及在实际应用中遇到的问题,并提出了相应的解决方案。通过优化机器配置、改进Zookeeper集群规划以及选择合适的引擎,趣头条成功实现了高效的数据处理和稳定的系统运行。
  • pdf 文档 1. Machine Learning with ClickHouse

    0 码力 | 64 页 | 1.38 MB | 2 年前
    3
    文档介绍了如何在ClickHouse中进行机器学习,包括存储训练好的模型、使用聚合函数进行线性回归训练、导入实验数据集(如NYC出租车和Uber数据)以及应用CatBoost模型进行预测。文档还列出了未来改进的方向,如支持更多损失函数和优化模型训练功能。
共 22 条
  • 1
  • 2
  • 3
前往