pdf文档 Greenplum 介绍

220.42 KB 3 页 0 评论
语言 格式 评分
中文(简体)
.pdf
3
摘要
Greenplum 是全球领先的开源大数据平台,基于 MPP 架构,支持实时处理、弹性扩容、混合负载、云原生和集成数据分析等功能。其兼容 SQL 标准,能够存储和处理PB级结构化、半结构化和非结构化数据,部署灵活,支持裸机、私有云和公有云。Greenplum 具备企业级稳定性和成熟生态系统,广泛应用于金融、通信、制造等多个领域。其开源社区活跃,采用敏捷开发方法,具备强大的内核技术和灵活的扩展能力,支持多种数据源和格式,并集成多种数据分析和机器学习算法。
AI总结
### 《Greenplum介绍》总结 Greenplum是全球领先的开源大数据平台,提供实时处理、弹性扩容、混合负载、云原生和集成数据分析等功能,基于MPP(大规模并行处理)架构构建,具有良好的弹性和线性扩展能力。它兼容SQL标准,支持结构化、半结构化和非结构化数据的存储与分析,可部署于裸机、容器、私有云和公有云中。作为OLAP型平台,Greenplum还支持OLTP型业务的混合负载,帮助客户实现业务-数据-洞见-业务的闭环。 Greenplum在Gartner 2019年报告中排名全球第三(经典数据分析)和并列第四(实时分析),是唯一一款入围前十的开源产品。其核心优势包括: - **一次打包到处运行**:无需受限于硬件环境,灵活部署,降低迁移成本。 - **企业级稳定性**:经过十多年发展,稳定性高,服务于全球2000强企业的生产系统。 - **成熟生态系统**:与PgAdmin、Informatica等多款上下游产品集成,生态完善。 Greenplum支持多种数据源(如Kafka、Hadoop、Hive等)和数据格式(结构化、半结构化、非结构化),并具备强大的内核技术,包括数据水平分布、并行查询执行、高可用等。同时,支持扩展功能和多种编程语言开发用户自定义函数。 自2015年开源以来,Greenplum社区活跃,贡献者遍布全球,核心版本发布频率高,采用敏捷开发方法,质量持续优化。其生态系统开放,支持商业智能、机器学习等多种分析场景,集成Apache顶级项目MADlib,提供50多种数据分析和机器学习算法,支持高效数据分析。 Greenplum广泛应用于金融、通信、航空、零售、医疗等多个行业,客户包括摩根斯坦利、摩根大通、三星等国际企业,以及深交所、建设银行、中国移动等国内企业。开源后,吸引了阿里云、百度云、中移动等众多用户。 总之,Greenplum是一款功能强大、生态完善、稳定可靠的开源大数据平台,适用于多种场景,能够满足企业对结构化、半结构化和非结构化数据的高效处理与分析需求。
P1
P2
P3
下载文档到本地,方便使用
文档评分
请文明评论,理性发言.