搜索

排序方式
4 个文档
  • pdf 文档 【05 计算平台 蓉荣】Flink 批处理及其应⽤

    0 码力 | 12 页 | 1.44 MB | 2 年前
    3
    文档介绍了Apache Flink作为一个分布式大数据处理引擎,能够处理有限和无限数据流,并支持有状态计算。Flink适用于各种集群环境和数据规模,具有高吞吐和低延时的特点。文档还探讨了Flink在数仓和数据湖中的应用,强调了存储计算分离架构的优势,并提到了阿里云实时计算产品的商业化方向和社区生态。
  • pdf 文档 Apache Flink的过去、现在和未来

    0 码力 | 33 页 | 3.36 MB | 2 年前
    3
    文档详细介绍了Apache Flink的发展历程,从2014年的起源到当前的架构变化,再到未来的发展规划。过去部分回顾了Flink的起源及其在流处理和批处理领域的演变。现在部分重点介绍了Flink 1.9版本的架构,包括DataStream API、Table API、SQL、DataSet API以及分布式流数据处理的实现。未来部分展望了Flink在集群扩展、性能优化、实时计算能力等方面的提升,并提到了社区支持和项目发展的重要性。
  • pdf 文档 Flink如何实时分析Iceberg数据湖的CDC数据

    0 码力 | 36 页 | 781.69 KB | 2 年前
    3
    文档详细介绍了如何利用Flink实时分析Iceberg数据湖中的CDC数据。内容包括Flink对CDC数据的自动合并和手动合并对接能力,提供Flink增量拉取CDC数据的功能,以及与其他生态工具如Spark Streaming、Presto等的集成。文档还对比了批量更新场景和CDC写入场景的特点,并提出了未来的工作规划,包括Iceberg内核优化和Flink集成的进一步发展。
  • pdf 文档 监控Apache Flink应用程序(入门)

    0 码力 | 23 页 | 148.62 KB | 2 年前
    3
    本文介绍了Apache Flink的监控和度量系统,重点讨论了如何通过内置的Metrics和MetricsReporters来监控Flink作业。文档详细讲解了关键指标,包括作业运行时间、重启次数、检查点状态以及吞吐量等,并提供了配置报告程序的指导。此外,文章还强调了监控系统资源和延迟的重要性,帮助开发人员更好地理解和优化Flink应用程序的运行状态。
共 4 条
  • 1
前往