Hadoop 概述用户可将数据加载到数据库,或者通过外部表使用 Oracle SQL 在 Hadoop 中就地查询数据。Oracle SQL Connector for HDFS 能够查询 或者加载数据到文本文件或者基于文本文件的 Hive 表中。分区也可 以在从 Hive 分区表中查询或加载时被删减。 另一种 Oracle 解决方案 Oracle Loader for Hadoop 是一种高性能 且高效率的连接器,用于从 SQL 加载到数据库中 自动负载均衡,从而最大限度地提高 性能 外部表 使用外部表机制 并行访问或加载 到数据库中 ORACLE 客户端 图 1-8 日志文件 更多… 文本 压缩文件 序列文件 并行负载,针对 Hadoop 做优化 自动负载均衡 在 Hadoop 上转换成 Oracle 格式 ——节省数据库的 CPU 加载特定的 Hive 分区 Kerberos0 码力 | 17 页 | 583.90 KB | 1 年前3
通过Oracle 并行处理集成 Hadoop 数据图3 至 图 5 实现的解决方案使用以下代码。所有的代码均在 Oracle Database 11g 和 5 个节点 的 Hadoop 集群上进行过测试。与大多数白皮书一样,请将这些脚本复制到文本编辑器中并 确保格式正确。 处理数据的表函数 该脚本中包含某些设置组件。例如,脚本开始的部分创建了图 3 中第 1 步所展示的仲裁表。 本例中使用的是一直广受欢迎的 OE 模式。0 码力 | 21 页 | 1.03 MB | 1 年前3
共 2 条
- 1













