Ozone:Hadoop 原生分布式对象存储Ozone:Hadoop 原生分布式对象存储 Spark大数据博客 - https://www.iteblog.com Ozone:Hadoop 原生分布式对象存储 Hadoop 社区推出了新一代分布式Key-value对象存储系统 Ozone,同时提供对象和文件访问的接 口,从构架上解决了长久以来困扰HDFS的小文件问题。本文作为Ozone系列文章的第一篇,抛个 砖,介绍Ozone的产生背景,主要架构和功能。 砖,介绍Ozone的产生背景,主要架构和功能。 如果想及时了解Spark、Hadoop或者HBase相关的文章,欢迎关注微信公众号:iteblog_hadoop 背景 HDFS是业界默认的大数据存储系统,在业界的大数据集群中有非常广泛的使用。HDFS集群有着 很高的稳定性,得益于它较简单的构架,集群也很容易扩展。业界包含几千个数据节点,保存上 百PB数据的集群也不鲜见。 HDFS通过把文件系统元数据全部加载到Name e的设 计和实现。Ozone的设计遵循一下原则: 1 / 10 Ozone:Hadoop 原生分布式对象存储 Spark大数据博客 - https://www.iteblog.com 强一致性 构架简洁性: 当系统出现问题时,一个简单的架构更容易定位,也容易调试。Ozone尽可能的保持架构 的简单,即使因此需0 码力 | 10 页 | 1.24 MB | 1 年前3
2022 Apache Ozone 的最近进展和实践分享使⽤场景 #1 HDFS (300M FILES) AI/ML HIVE/IMPALA/SPARK KAFKA / FLINK 计算 OZONE (2 BILLION Objects) AI/ML HIVE/IMPALA/SPARK KAFKA / FLINK 计算 OTHER WORKLOADS OTHER WORKLOADS • 集约化的⼀套存储来⾯向不同的业务负载 • 更易于运维的控制⾯ • 只需要⼀个运维团队⽽不是多个 运维价值 OZONE STORAGE AI/ML HIVE/IMPALA/ SPARK KAFKA / Flink 计算 数据科学 数据仓库 S3 应⽤ S3 API OTHER WORKLOADS ⽬录 • Apache Hadoop HDFS⾯临的问题 • Apache0 码力 | 35 页 | 2.57 MB | 1 年前3
Apache Ozone Erasure Coding(EC)HDFS and S3 Object Store ➢ Scale to 1000’s of nodes with dense storage configurations ➢ Apache Spark, Hive and YARN work without any code modifications by using OFS protocol Ozone Client Apache Ozone0 码力 | 29 页 | 7.87 MB | 1 年前3
共 3 条
- 1













