扩展性 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

大数据集成与Hadoop - IBM

采用计划，必须遵循最佳实践方法，充分考虑各种新兴技术、可扩展性需求以及当前的资源和技能水平。面临的挑战：创建最佳的大数据集成方法和架构，同时避免各种实施缺陷。海量数据可扩展性：总体要求如果您的大数据集成解决方案无法支持海量数据可扩展性，那么很可能无法达到预期的效果。为发挥大数据措施的整体业务价值，对于大部分Hadoop项目的大数据集成而言，海量数据可扩展性是必不可少的。海量数据可扩展性意味着对处理的数据中，这样需要在Hadoop群集间动态执行的其他应用即可使用它们。结果是，这种方法可将大规模可扩展数据集成引擎作为本机 Hadoop应用程序来实现，而且不会影响 MapReduce的性能。希望在Hadoop上实现可扩展性和有效性的所有企业技术都需要采用YARN，并将其作为产品路线图的一部分。开始集成之旅以前，请务必了解MapReduce的性能限制，以及数据集成供应商在解决这类问题方面的差异。请在 “Themis: 维度的可扩展性 • 线性数据可扩展性：硬件和软件系统通过线性增加硬件资源来线性提高处理吞吐量。例如，如果在50个处理器上运行4小时可以处理200GB数据，在100个处理器上运行4小时可以处理400GB数据，以此类推，则说明应用程序可以实现线性数据可扩展性。 • 应用程序纵向扩展：衡量软件在一个对称多处理器 (SMP) 系统中的多个处理器间实现线性数据可扩展性的有效程度。

0 码力 | 16 页 | 1.23 MB | 1 年前
3
Hadoop 概述

分布式文件系统，或者说 HDFS，则是 Hadoop 的核心，然而它并不会威胁到你的预算。如果要分析一组数据，你可以使用 MapReduce 中包含的编程逻辑，它提供了在 Hadoop 群集上横跨多台服务器的可扩展性。为实现资源管理，可考虑将 Hadoop YARN 加入到软件栈中，它是面向大数据应用程序的分布式操作系统。 ZooKeeper 是另一个 Hadoop Stack 组件，它能通过共享层次名系统，而这些系统可扩展为 Hadoop 数据平台。公司和开源社区中的开发人员正在设计和定义基于 Hadoop 的大规模企业数据的最佳实践。企业以及 IT 社区都非常关注各种数据类型的可扩展性。使用 Hadoop，公司便不再局限于昂贵的企业级解决方案或者价格不菲的数据仓库设备。 Hadoop 并不是大多数组织现有富数据环境的替代品。在考虑使用 Hadoop 时，也要同样重视其他方面，例如

0 码力 | 17 页 | 583.90 KB | 1 年前
3
Hadoop 3.0以及未来

 劢态资源配置  容器资源的劢态调整  资源隔离  调度的增强  YARN的Web页面的增强 • MapReduce YARN Timeline Service v.2 • 扩展性分布式读写读写分离 HBase存储 YARN Timeline Service v.2 • 可用性流(flow) 聚合(aggregation) YARN Federation •

0 码力 | 33 页 | 841.56 KB | 1 年前
3
银河麒麟服务器操作系统V4 Hadoop 软件适配手册

特性，兼容适配长城、联想、浪潮、华为、曙光等国内主流厂商的服务器整机产品，以及达梦、金仓、神通等主要国产数据库和中创、金蝶、东方通等国产中间件，满足虚拟化、云计算和大数据时代，服务器业务对操作系统在性能、安全性及可扩展性等方面的需求，是一款具有高安全、高可用、高可靠、高性能的自主可控服务器操作系统。 1.2 环境概述服务器型号长城信安擎天 DF720 服务器 CPU 类型飞腾 2000+处理器

0 码力 | 8 页 | 313.35 KB | 1 年前
3
尚硅谷大数据技术之Hadoop（入门）

4 Hadoop 优势（4 高） Hadoop优势（4高） 1）高可靠性：Hadoop底层维护多个数据副本，所以即使Hadoop某个计算元素或存储出现故障，也不会导致数据的丢失。 2）高扩展性：在集群间分配任务数据，可方便的扩展数以千计的节点。 Hadoop102 Hadoop103 Hadoop104 Hadoop105 Hadoop106 双11、618可以动态增加服务器 Hadoop102

0 码力 | 35 页 | 1.70 MB | 1 年前
3

共 5 条前往

页

大数集成 Hadoop IBM 概述 3.0 以及未来银河麒麟服务务器服务器操作系统操作系统 V4 软件适配手册硅谷技术入门

分类

语言

格式

大数据集成与Hadoop - IBM

Hadoop 概述

Hadoop 3.0以及未来

银河麒麟服务器操作系统V4 Hadoop 软件适配手册

尚硅谷大数据技术之Hadoop（入门）