云计算&大数据 · Apache Flink

【05 计算平台蓉荣】Flink 批处理及其应⽤

0 码力 | 12 页 | 1.44 MB | 2 年前
3

文档介绍了Apache Flink作为一个分布式大数据处理引擎，能够处理有限和无限数据流，并支持有状态计算。Flink适用于各种集群环境和数据规模，具有高吞吐和低延时的特点。文档还探讨了Flink在数仓和数据湖中的应用，强调了存储计算分离架构的优势，并提到了阿里云实时计算产品的商业化方向和社区生态。
Apache Flink的过去、现在和未来

0 码力 | 33 页 | 3.36 MB | 2 年前
3

文档详细介绍了Apache Flink的发展历程，从2014年的起源到当前的架构变化，再到未来的发展规划。过去部分回顾了Flink的起源及其在流处理和批处理领域的演变。现在部分重点介绍了Flink 1.9版本的架构，包括DataStream API、Table API、SQL、DataSet API以及分布式流数据处理的实现。未来部分展望了Flink在集群扩展、性能优化、实时计算能力等方面的提升，并提到了社区支持和项目发展的重要性。
Flink如何实时分析Iceberg数据湖的CDC数据

0 码力 | 36 页 | 781.69 KB | 2 年前
3

文档详细介绍了如何利用Flink实时分析Iceberg数据湖中的CDC数据。内容包括Flink对CDC数据的自动合并和手动合并对接能力，提供Flink增量拉取CDC数据的功能，以及与其他生态工具如Spark Streaming、Presto等的集成。文档还对比了批量更新场景和CDC写入场景的特点，并提出了未来的工作规划，包括Iceberg内核优化和Flink集成的进一步发展。
监控Apache Flink应用程序(入门)

0 码力 | 23 页 | 148.62 KB | 2 年前
3

本文介绍了Apache Flink的监控和度量系统，重点讨论了如何通过内置的Metrics和MetricsReporters来监控Flink作业。文档详细讲解了关键指标，包括作业运行时间、重启次数、检查点状态以及吞吐量等，并提供了配置报告程序的指导。此外，文章还强调了监控系统资源和延迟的重要性，帮助开发人员更好地理解和优化Flink应用程序的运行状态。

共 4 条前往

页

搜索

【05 计算平台 蓉荣】Flink 批处理及其应⽤

Apache Flink的过去、现在和未来

Flink如何实时分析Iceberg数据湖的CDC数据

监控Apache Flink应用程序(入门)

【05 计算平台蓉荣】Flink 批处理及其应⽤