文本分类 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

Hadoop 概述

用户可将数据加载到数据库，或者通过外部表使用 Oracle SQL 在 Hadoop 中就地查询数据。Oracle SQL Connector for HDFS 能够查询或者加载数据到文本文件或者基于文本文件的 Hive 表中。分区也可以在从 Hive 分区表中查询或加载时被删减。另一种 Oracle 解决方案 Oracle Loader for Hadoop 是一种高性能且高效率的连接器，用于从 SQL 加载到数据库中自动负载均衡，从而最大限度地提高性能外部表使用外部表机制并行访问或加载到数据库中 ORACLE 客户端图 1-8 日志文件更多… 文本压缩文件序列文件并行负载，针对 Hadoop 做优化自动负载均衡在 Hadoop 上转换成 Oracle 格式 ——节省数据库的 CPU 加载特定的 Hive 分区 Kerberos

0 码力 | 17 页 | 583.90 KB | 1 年前
3
MATLAB与Spark/Hadoop相集成：实现大数据的处理和价值挖

据集合 ▪ 使用方式等同于MATLAB 数组(array) – 支持数据类型包括数值型、字符串、时间类型、表等… – 支持众多基本的数学函数、统计函数、索引函数等. – 支持机器学习算法包括分类、聚类和回归 7 tall array Single Machine Memory tall arrays ▪ 自动将数据分解成适合内存的小 “块”(chunk) ▪ 计算过程中，一次处理一个“块”(chunk)

0 码力 | 17 页 | 1.64 MB | 1 年前
3
Hadoop 迁移到阿里云MaxCompute 技术方案

基于借助该大数据架构，对 Hadoop 及开源生态组件与阿里云大数据生态产品进行了对比映射（仅作为对功能定位的映射，不代表对应组件可无缝迁移），以便读者对相关服务的迁移至阿里云大数据产品服务有更好的理解。组件分类 Hadoop 开源组件阿里云产品/产品组件数据存储 HDFS 文件系统对象存储 MaxCompute 存储(仅开放表数据存储) OSS 对象存储 EMR HDFS

0 码力 | 59 页 | 4.33 MB | 1 年前
3
通过Oracle 并行处理集成 Hadoop 数据

图3 至图 5 实现的解决方案使用以下代码。所有的代码均在 Oracle Database 11g 和 5 个节点的 Hadoop 集群上进行过测试。与大多数白皮书一样，请将这些脚本复制到文本编辑器中并确保格式正确。处理数据的表函数该脚本中包含某些设置组件。例如，脚本开始的部分创建了图 3 中第 1 步所展示的仲裁表。本例中使用的是一直广受欢迎的 OE 模式。

0 码力 | 21 页 | 1.03 MB | 1 年前
3

共 4 条前往

页

Hadoop 概述 MATLAB Spark 集成实现数据处理价值迁移阿里 MaxCompute 技术方案通过 Oracle 并行并行处理

分类

语言

格式

Hadoop 概述

MATLAB与Spark/Hadoop相集成：实现大数据的处理和价值挖

Hadoop 迁移到阿里云MaxCompute 技术方案

通过Oracle 并行处理集成 Hadoop 数据