散列表 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

大数据集成与Hadoop - IBM

独立数据分区并行运行单一数据集成作业，也无法实现设计一次作业，无需重新设计和重新调整作业即可在任何硬件配置中非共享架构从头开始创建软件，以便利用非共享的大规模并行架构，方法是将数据集分散到多个计算节点，执行单一应用程序（对每个数据分区执行相同的应用程序逻辑）。使用软件数据流来实施项目软件数据流通过简化在一个或多个节点实施和执行数据管道和数据分区的过程，从而充分利用非共享 2014年12月保留所有权利 IBM、IBM徽标和ibm.com是国际商业机器公司在全球许多司法管辖区注册的商标。其他产品和服务名称可能是IBM或其他公司的商标。可在网络上获得最新的IBM商标列表，请访问ibm.com/legal/copytrade.shtml上的 “Copyright and trademark information”部分。 JEOPARDY! (c) 2011 Jeopardy

0 码力 | 16 页 | 1.23 MB | 1 年前
3
尚硅谷大数据技术之Hadoop（生产调优手册）

生产环境，可以直接过滤掉空值；如果想保留空值，就自定义分区，将空值加随机数打散。最后再二次聚合。（2）能在 map 阶段提前处理，最好先在 Map 阶段处理。如：Combiner、MapJoin （3）设置多个 reduce 个数第 9 章 Hadoop-Yarn 生产经验 9.1 常用的调优参数 1）调优参数列表（1）Resourcemanager 相关 yarn.resourcemanager

0 码力 | 41 页 | 2.32 MB | 1 年前
3
Hadoop 概述

使得你能够将其部署到云端或者自己的数据中心。 HDP 为你提供数据平台基础以供搭建自己的 Hadoop 基础设施，这包括一长串商业智能(BI)及其他相关供应商的列表。平台的设计目标是支持处理多种来源及格式的数据，并且允许设计自定义解决方案。资源列表过大，以至于无法在这里展示，强烈推荐直接从供应商处获取此信息。选择像 HDP 这样产品的美妙之处在于他们是 Hadoop 的主要贡献者之一。这便开启了在多种数据库资源上使

0 码力 | 17 页 | 583.90 KB | 1 年前
3
Hadoop 迁移到阿里云MaxCompute 技术方案

就会报错，不会走到 commit。 6.3.3.2 从 Dataworks 获得评估报告：  查看节点列表：Dataworks 会将客户上传的 Hive SQL 和调度配置，自动转换成 ODPS SQL，并且映射成 Dataworks 的工作流类型。  查看报告明细：列表中会给出 Hive meta、SQL、DI、OOZIE 作业的转换、迁移风险等级，及异常的详细信息。

0 码力 | 59 页 | 4.33 MB | 1 年前
3
尚硅谷大数据技术之Hadoop（入门）

System，简称 HDFS，是一个分布式文件系统。 HDFS架构概述 1）NameNode（nn）：存储文件的元数据，如文件名，文件目录结构，文件属性（生成时间、副本数、文件权限），以及每个文件的块列表和块所在的DataNode等。 2）DataNode(dn)：在本地文件系统存储文件块数据，以及块数据的校验和。 3）Secondary NameNode(2nn)：每隔一段时间对NameNode元数据备份。 jar wordcount /input /output 7）查看日志（1）历史服务器地址 http://hadoop102:19888/jobhistory （2）历史任务列表（3）查看任务运行日志（4）运行日志详情尚硅谷大数据技术之 Hadoop（入门） —————————————————————————————

0 码力 | 35 页 | 1.70 MB | 1 年前
3
大数据时代的Intel之Hadoop

咨询您的应用厂商以了解具体信息。 *文中涉及的其它名称及商标属亍各自所有者资产。英特尔所列的厂商仅为方便英特尔客户。但英特尔对亍这些设备的质量、可靠性、功能戒兼容性丌提供仸何担保戒保证。本列表和/戒这些设备可随时更改，恕丌另行通知。版权所有 © 2012 英特尔公司。所有权保留。提纲 • 大数据时代的新挑戓 • 大数据时代的Intel • 关注产业应用，产研相亏促迚

0 码力 | 36 页 | 2.50 MB | 1 年前
3

共 6 条前往

页

大数集成 Hadoop IBM 硅谷技术生产调优手册概述迁移阿里 MaxCompute 方案入门时代 Intel

分类

语言

格式

大数据集成与Hadoop - IBM

尚硅谷大数据技术之Hadoop（生产调优手册）

Hadoop 概述

Hadoop 迁移到阿里云MaxCompute 技术方案

尚硅谷大数据技术之Hadoop（入门）

大数据时代的Intel之Hadoop