大规模并行处理（MPP） - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

通过Oracle 并行处理集成 Hadoop 数据

Oracle 白皮书 2011年1月通过 Oracle 并行处理集成 Hadoop 数据 ## 引言许多垂直行业都在关注文件系统中庞大的数据。这些数据中通常包含大量无关的明细信息，以及部分可用于趋势分析或丰富其他数据的精华信息。尽管这些数据存储在数据库之外，但一些客户仍然希望将其与数据库中的数据整合在一起以提取对业务用户有价值的信息。本文详细介绍了如何从 Oracle 数据库访问存储在动直接访问 HDFS 文件。FUSE（File System in Userspace）项目针对这种情况提供了解决方法。有多种 FUSE 驱动程序支持用户挂载 HDFS 存储，并将其作为常规文件系统处理。通过使用一个此类驱动程序，并在数据库实例上挂载 HDFS（如果是 RAC 数据库，则在其所有实例上挂载 HDFS），即可使用外部表基础架构轻松访问 HDFS 文件。 ![Image](/uplo 通过外部表进行访问在图 1 中，我们利用 Oracle Database 11g 实现本文所述的数据库内的 mapreduce。通常情况下，Oracle Database 11g 中的并行执行框架足以满足针对外部表大多数的并行操作。在有些情况下（例如，如果 FUSE 不可用），外部表方法可能不适用。Oracle 表函数提供了从 Hadoop 中获取数据的替代方法。本文附带的示例展示了一种这样的方法。

0 码力 | 21 页 | 1.03 MB | 2 年前
3
Greenplum开源MPP数据库介绍

Agenda Greenplum简介 Greenplum的MPP架构 > 分布式优化器: Postgres planner 和 ORCA > 分布式事务和执行 Greenplum存储 Greenplum生态 Greenplum 7 Greenplum简介：什么是Greenplum? 基于PostgreSQL、开源、分布式MPP、ACID完备、为OLAP优化的关系型数据仓库。 https://greenplum 2003年，Luke Lonergan 和 Scott Yara 发起 Greenplum 项目，从 PostgreSQL 8 分支，做成 MPP 架构 2010年被EMC收购 2012年成为Pivotal的一部分 2015年开源，可能是世界上第一个成熟商用的开源MPP数据仓库 ➢ 2019年底跟随Pivotal被VMware收购 ## 谁在用Greenplum? ➢ 500多付费企业客户成千上万的开源用户 ae0a0e1f69abbe60d5572e8/p5_11.jpg) ## Greenplum的MPP架构 ## Massively: ☐ PB级的数据，单台主机无法处理 ☐ 所以数据分布在多个主机上 ☐ 高效、灵活的数据分布，和实际业务相关 ## Parallel: ☐ 数据并行处理计算 ☐ 通过网络进行数据交换和汇总 ## 执行架构 ## ➤ Coordinator: ☐ 管理其它节点

0 码力 | 23 页 | 4.55 MB | 2 年前
3
Pivotal Greenplum 5：新一代数据平台

不受限于基础架构，这意味着它是一种可完全移植的分析数据库软件解决方案，可部署在多云环境（公有云和私有云）中，也适用不同的本地配置。其大规模并行处理 (MPP) SQL 的设计核心是一个称为 GPORCA 的新一代查询优化器。GPORCA 专为满足在多结构数据环境中进行高级分析的需求而设计，能够处理多种并发混合工作负载的复杂查询。与旧式 MPP 数据库中常用的传统 RDBMS 查询优化器相比，GPORCA 大幅度地提高了查询性能。 ## 数据洞察方法方面，这些功能对大多数客户都很有帮助。Greenplum 解决方案的架构设计目的是管理非常复杂的查询，以及为符合 ANSI 标准的 SQL 提供强有力的分析改进。通过自动对数据进行分区和并行运行查询，它让服务器群集能够以单一数据超级计算机的方式运行，且性能比传统数据库或其他同类平台高出数十甚至数百倍。其多种分析扩展功能支持 ANSI SQL，并通过封装扩展提供多种内置语言和附加功能。Greenplum 5：不受限于基础架构的软件架构。 ## 集成分析：改进后的全新分析接口一直以来，客户都能在 Pivotal Greenplum 中做高级分析，无论是提供将应用逻辑向下推送至数据所在位置的方法，执行分析功能，还是以大规模并行方式构建数据模型，都可以实现。Greenplum 5 支持适用于数据挖掘和数据科学工作的最全面、最先进的分析程序包和扩展。 Greenplum 5 还针对最受欢迎的 Python 和 R 语言算法库提供简单易用的安装程序。

0 码力 | 9 页 | 690.33 KB | 2 年前
3
Greenplum on Kubernetes 容器化MPP数据库

## Greenplum on Kubernetes 容器化MPP数据库 ## AGENDA ## 云数据库背景云数据库实现方案 Greenplum on Kubernetes Greenplum Operator 总结 ## 云数据库背景 ## 云数据库背景 ● 资源变化 ☐ 本地资源 → 云 ☐ 静态资源 → 弹性需求 ## ● 数据变化 ☐ 内部数据 → 多数据源

0 码力 | 33 页 | 1.93 MB | 2 年前
3
Java 应用与开发 - 异常处理

# Java 应用与开发异常处理王晓东 wangxiaodong@ouc.edu.cn 中国海洋大学 October 30, 2018 ![Image](/uploads/documents/7/b/6/e/7b6e89c6527e52f11ca8c8438e33ae70/p1_1.jpg) ![Image](/uploads/documents/7/b/6/e/7b6e89c6 异常的概念和分类 2. 深入理解 Java 异常处理机制异常的概念及分类 ## 大纲异常的概念及分类 Java 异常处理机制 ## C++ 中的异常处理 ## 《The C++ Programming Language》一个库的作者可以检测出发生了运行时错误，但一般不知道怎样去处理它们（因为和用户具体的应用有关）；另一方面，库的用户知道怎样处理这些错误，但却无法检查它们何时发生（如果能检测，就可以再用户的代码里处理了，不用留给库去发现）。 ## 提供异常处理机制的基本思想让一个函数在发现了自己无法处理的错误时抛出（throw）一个异常，然后它的（直接或者间接）调用者能够处理这个问题。 ## 《C++ primer》将问题检测和问题处理相分离。 (Exceptions let us separate problem detection from problem resolution

0 码力 | 33 页 | 626.40 KB | 2 年前
3
Go在工程实践的错误处理

Golang在工程实践中的错误处理 ![Image](/uploads/documents/8/5/9/9/85998d82ea624e4fd6cb1c1abd3d8499/p1_1.jpg) 彭友顺石墨文档产研负责人 ![Image](/uploads/documents/8/5/9/9/85998d82ea624e4fd6cb1c1abd3d8499/p2_1.jpg) 为什么我们处理错误会这么慢为什么我们处理错误会这么慢 01 如何完善错误信息 02 优雅处理错误信息 03 分布式错误处理 04 错误信息手册的必要性 05 第一部分 ## 为什么我们处理错误会这么慢 ## 为什么我们处理错误会这么慢 why 出现错误定位慢恢复慢效率低 ## 原因错误信息不够完善错误处理不够优雅分布式错误难以串联错误信息难以识别 ## 第二部分 ## 如何完善错误信息 ## GET./hello => "Hello client: main" • 没有调试信息和错误信息 • 对接起来会非常麻烦 ## 第三部分 ## 优雅处理错误信息 ## 为什么定位慢？-- 错误处理 ## 假设用户反馈了无法打开一个文件 ## 记录一次错误不要透传错误错误码唯一性 ## 我们的程序员非常认真 err := fmt.Errorf(format:

0 码力 | 30 页 | 3.11 MB | 2 年前
3
Golang大规模云原生应用管理实践

## Golang大规模云原生应用管理实践刘洋（炎寻） ## 关于我 • 毕业于中国科学技术大学，定居杭州 · 就职于阿里云-云原生应用平台团队 • Problem Solver，聚焦中间件，容器，Kubernetes，PaaS平台... • OAM社区成员 GOPHER CHINA 2020 ## 开局一张图 2020云上双11 阿里云扛住全球最大流量洪峰规模化应用交付效率对比去年 applied components 应用关联的事件与日志 GOPHER CHINA 2020 中国上海 / 2020-11.21-22 ## 新的复杂度-控制器运维 ## 我们要管控大规模的集群，每个集群也会部署大量的控制器，控制器本身的运维成为问题 • 控制器管控平台 · 升级 • 回滚 · 灰度 • 重启 • 观测性 • Prometheus • 统一日志收集

0 码力 | 23 页 | 7.70 MB | 2 年前
3

Rust并行编译的挑战与突破

TECHNOLOGY CONFERENCE # OPEN SOURCE, INTO THE FUTURE # Rust并行编译的挑战与突破李原 2022年5月28日 ## 目录 - 相关浅谈 - Rust并行编译的挑战与突破 - 从并行编译到并行程序设计 - Rust社区与并行编译 ![Image](/uploads/documents/4/a/8/b/4a8bb6fe19e141c7 [Image](/uploads/documents/4/a/8/b/4a8bb6fe19e141c71c8eb7726070bfef/p5_3.jpg) Rust社区编译器性能工作组 ## 并行编译或成下一代编译效率突破利器

Primary benchmarks 1
Benchmar [Image](/uploads/documents/4/a/8/b/4a8bb6fe19e141c71c8eb7726070bfef/p5_4.jpg) ## 更多更好的并行化？ ## Rust编译器并行化 Cargo多crate并行 ![Image](/uploads/documents/4/a/8/b/4a8bb6fe19e141c71c8eb7726070bfef/p6_2.jpg) 0 码力 \| 25 页 \| 4.60 MB \| 2 年前 3 Pivotal Greenplum 5.0 - 开源MPP 数据库的不二之选 # 开源 MPP 数据库的不二之选: Pivotal Greenplum 5.0 姚延栋 yyao@pivotal.io ## 开放源代码 ![Image](/uploads/documents/3/a/3/e/3a3eccbe36a78a665b1d53a70d1e2a95/p2_2.jpg) ![Image](/uploads/documents/3/a/3/e/3a3eccbe36 /p5_21.jpg) ![Image](/uploads/documents/3/a/3/e/3a3eccbe36a78a665b1d53a70d1e2a95/p5_22.jpg) ## MPP ![Image](/uploads/documents/3/a/3/e/3a3eccbe36a78a665b1d53a70d1e2a95/p6_2.jpg) Master Servers Query a95/p7_2.jpg) ## 多态存储表'SALES' 5月 4月 3月 2月 1月 12月 11月一年前二年前行存储列存储外部表 ## 并行执行 ![Image](/uploads/documents/3/a/3/e/3a3eccbe36a78a665b1d53a70d1e2a95/p9_1.jpg) gang gang ![ 0 码力 \| 18 页 \| 913.39 KB \| 2 年前 3 C++高性能并行编程与优化 - 课件 - 06 TBB 开启的并行编程之旅 3.jpg) ![Image](/uploads/documents/1/0/0/5/10051dd97d247e9f7a97909b93f2890b/p1_4.jpg) # TBB 开启的并行编程之旅 by 彭于斌 (@archibate) 往期录播：https://www.bilibili.com/video/BV1fa411r7zp 课程 PPT 和代码：https://github [Image](/uploads/documents/1/0/0/5/10051dd97d247e9f7a97909b93f2890b/p1_8.jpg) ## 高性能并行编程与优化 - 课程大纲 • 分为前半段和后半段，前半段主要介绍现代 C++，后半段主要介绍并行编程与优化。 1. 课程安排与开发环境搭建：cmake 与 git 入门 2. 现代 C++ 入门：常用 STL 容器，RAII 内存管理 3. C++ 5. C++11 起的多线程编程：从 mutex 到无锁并行 6. 并行编程常用框架：OpenMP 与 Intel TBB 7. 被忽视的访存优化：内存带宽与 cpu 缓存机制 8. GPU 专题：wrap 调度，共享内存，barrier 9. 并行算法实战：reduce，scan，矩阵乘法等 10. 存储大规模三维数据的关键：稀疏数据结构 11. 物理仿真实战：邻居搜索表实现 0 码力 \| 116 页 \| 15.85 MB \| 2 年前 3 共 1000 条 1 2 3 4 5 6 100 前往页相关搜索词 Hadoop Oracle Database 外部表表函数并行处理 MPP架构分布式系统 Greenplum PostgreSQL 数据仓库 GPORCA Greenplum资源组 Workload Manager 架构化查询语言大规模并行处理（MPP）Kubernetes 容器化存储管理资源分配异常处理机制 Java 错误违例异常错误处理错误信息分布式错误 Fail Fast 错误链云原生容器运行时声明式资源控制器扩展 Rust并行编译共享数据结构编译器性能社区工作组并行程序设计 Pivotal Greenplum 5.0 开源 MPP 数据库 JSON Intel TBB 并行编程流水线并行任务并行数据并行关于我们文库协议联系我们意见反馈免责声明本站文档数据由用户上传或本站整理自互联网，不以营利为目的，供所有人免费下载和学习使用。如侵犯您的权益，请联系我们进行删除。 IT文库 ©1024 - 2026 \| 站点地图 Powered By MOREDOC AI v3.5.0-beta.10

搜索

分类

语言

格式