Hadoop 概述自动负载均衡,从而最大限度地提高 性能 外部表 使用外部表机制 并行访问或加载 到数据库中 ORACLE 客户端 图 1-8 日志文件 更多… 文本 压缩文件 序列文件 并行负载,针对 Hadoop 做优化 自动负载均衡 在 Hadoop 上转换成 Oracle 格式 ——节省数据库的 CPU 加载特定的 Hive 分区 Kerberos 认证0 码力 | 17 页 | 583.90 KB | 1 年前3
大数据集成与Hadoop - IBM工作负载管理,为共享服务环境中的某些项目分配资源 优先级,在繁忙系统上对工作负载进行排队 • 性能分析,深入了解资源使用情况,辨别瓶颈并确定何 时系统可能需要更多的资源 • 构建工作流,其中包括通过Oozie直接按作业序列定义 的基于Hadoop的活动,以及其他数据集成活动 大数据集成的行政管理必须包括: • 基于Web的集成式安装程序,用于执行所有功能 • 高可用性配置,用于满足全天候需求 • 灵活的部署选项,用于部署新实例或展开经过优化的专0 码力 | 16 页 | 1.23 MB | 1 年前3
共 2 条
- 1













