动态并行 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

通过Oracle 并行处理集成 Hadoop 数据

Oracle 白皮书 2011年1月通过 Oracle 并行处理集成 Hadoop 数据 ## 引言许多垂直行业都在关注文件系统中庞大的数据。这些数据中通常包含大量无关的明细信息，以及部分可用于趋势分析或丰富其他数据的精华信息。尽管这些数据存储在数据库之外，但一些客户仍然希望将其与数据库中的数据整合在一起以提取对业务用户有价值的信息。本文详细介绍了如何从 Oracle 数据库访问存储在通过外部表进行访问在图 1 中，我们利用 Oracle Database 11g 实现本文所述的数据库内的 mapreduce。通常情况下，Oracle Database 11g 中的并行执行框架足以满足针对外部表大多数的并行操作。在有些情况下（例如，如果 FUSE 不可用），外部表方法可能不适用。Oracle 表函数提供了从 Hadoop 中获取数据的替代方法。本文附带的示例展示了一种这样的方法。将数据排入一个公共队列，而表函数则从该队列中取出数据。由于该表函数能够并行运行，因此使用额外的逻辑来确保仅有一个服务进程提交外部作业。 ![Image](/uploads/documents/f/8/5/f/f85f9a4a775705a2785c1154058d889e/p4_1.jpg) 图 2. 利用表函数进行并行处理由于表函数可以并行运行，Hadoop 流作业也可以不同程度地并行运行，并且后者不受 Oracle 查

0 码力 | 21 页 | 1.03 MB | 2 年前
3

Rust并行编译的挑战与突破

TECHNOLOGY CONFERENCE # OPEN SOURCE, INTO THE FUTURE # Rust并行编译的挑战与突破李原 2022年5月28日 ## 目录 - 相关浅谈 - Rust并行编译的挑战与突破 - 从并行编译到并行程序设计 - Rust社区与并行编译 ![Image](/uploads/documents/4/a/8/b/4a8bb6fe19e141c7 [Image](/uploads/documents/4/a/8/b/4a8bb6fe19e141c71c8eb7726070bfef/p5_3.jpg) Rust社区编译器性能工作组 ## 并行编译或成下一代编译效率突破利器

Primary benchmarks 1
Benchmar [Image](/uploads/documents/4/a/8/b/4a8bb6fe19e141c71c8eb7726070bfef/p5_4.jpg) ## 更多更好的并行化？ ## Rust编译器并行化 Cargo多crate并行 ![Image](/uploads/documents/4/a/8/b/4a8bb6fe19e141c71c8eb7726070bfef/p6_2.jpg) 0 码力 \| 25 页 \| 4.60 MB \| 2 年前 3 C++高性能并行编程与优化 - 课件 - 06 TBB 开启的并行编程之旅 3.jpg) ![Image](/uploads/documents/1/0/0/5/10051dd97d247e9f7a97909b93f2890b/p1_4.jpg) # TBB 开启的并行编程之旅 by 彭于斌 (@archibate) 往期录播：https://www.bilibili.com/video/BV1fa411r7zp 课程 PPT 和代码：https://github [Image](/uploads/documents/1/0/0/5/10051dd97d247e9f7a97909b93f2890b/p1_8.jpg) ## 高性能并行编程与优化 - 课程大纲 • 分为前半段和后半段，前半段主要介绍现代 C++，后半段主要介绍并行编程与优化。 1. 课程安排与开发环境搭建：cmake 与 git 入门 2. 现代 C++ 入门：常用 STL 容器，RAII 内存管理 3. 编译器如何自动优化：从汇编角度看 C++ 5. C++11 起的多线程编程：从 mutex 到无锁并行 6. 并行编程常用框架：OpenMP 与 Intel TBB 7. 被忽视的访存优化：内存带宽与 cpu 缓存机制 8. GPU 专题：wrap 调度，共享内存，barrier 9. 并行算法实战：reduce，scan，矩阵乘法等 10. 存储大规模三维数据的关键：稀疏数据结构 11 0 码力 \| 116 页 \| 15.85 MB \| 2 年前 3 在 JavaScript 中的并行语言特性-周爱民 ## 在JavaScript中的并行语言特性周爱民 @aimingoo https://github.io/aimingoo 上海南潮信息科技有限公司/ruff.io 全球技术领导力峰会 # 500+高端科技领导者与你一起探讨技术、管理与商业那些事儿 2019年6月14–15日上海圣诺亚皇冠假日酒店 ![Image](/uploads/documents/9/1/3/ jpg) 并行 promise.then() 结构化 .catch .finally top level await 函数式 async/await for await..of async* asynclater then.call(p) 面向对象 Promise() class x extends ... pure promise instance 动态 import() [Image](/uploads/documents/9/1/3/f/913f07cec8e87d6a2f1136aaefd2e432/p39_1.jpg) → Promise并行方法的实现 → 在ES2017及其之后的扩展多线程环境下的并行与并发 → 分布式环境下的应用 ## 极客邦科技会议推荐2019 ![Image](/uploads/documents/9/1/3/f/913f07cec8 0 码力 \| 41 页 \| 8.61 MB \| 2 年前 3 C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程 3\gg> $ 试试看。你会看到 Hello, world! 打印了三遍！ - 原来，三重尖括号里的第二个参数决定着启动 kernel 时所用 GPU 的线程数量。 - GPU 是为并行而生的，可以开启很大数量的线程，用于处理大吞吐量的数据。 ![Image](/uploads/documents/6/b/e/7/6be70db418434c4b3ebda53c2593beaa/p24_1 x 获取。可以看到这里执行了两个板块，每个板块又有三个线程，总共有 $ 2 \times 3 = 6 $ 个线程。 - 而且看到这里板块 1 在板块 0 之前执行了，这是因为板块之间是高度并行的，不保证执行的先后顺序。线程之间也是，这里线程打印顺序没乱，不过是碰巧小于 32 而已。 Block 1 of 2, Thread 0 of 3 Block 1 of 2, Thread 1 of 当前线程在板块中的编号：threadIdx - 当前板块中的线程数量：blockDim - 当前板块的编号：blockIdx - 总的板块数量：gridDim • 线程 (thread) ：并行的最小单位 • 板块 (block) : 包含若干个线程 • 网格 (grid)：指整个任务，包含若干个板块 • 从属关系：线程 < 板块 < 网格 • 调用语法：<< 0 码力 \| 142 页 \| 13.52 MB \| 2 年前 3 并行不悖- OLAP 在互联网公司的实践与思考 ## 并行不悖 – OLAP 在互联网公司的实践与思考 ## 赵飞祥一数据仓库体系架构二 Greenplum体系架构三 Greenplum现状说明四 Greenplum运维体系五 Greenplum开发规范六 Greenplum扩展规划 ## 业务数据与数据使用归类时间维度：过去 - 现在 - 未来（数据的生命周期） “现在”的数据 —— OLTP “过去”的数据执行查询计划及数据存储管理外部数据源并行装载或导出 ![Image](/uploads/documents/0/6/4/9/0649ae809c3edae2f168baa817155db1/p13_1.jpg) ## greenplum体系架构 ## greenplum的体系结构 ## • greenplum的架构特点 MPP ShareNothing 海量并行处理+完全无共享 ➢ cpu计算能力避免直接在Greenplum执行消耗session会话的操作 ➢ 尽量不创建索引 ## • 上线与调度规范上线的程序，必须要经过测试，才可以生产使用调度程序需考虑每个任务的前后关系，时间富裕避免因为过于追求并行度，对多个任务造成相互影响一数据仓库体系架构二 Greenplum体系架构三 Greenplum现状说明四 Greenplum运维体系五 Greenplum开发规范 0 码力 \| 43 页 \| 9.66 MB \| 2 年前 3 C++高性能并行编程与优化 - 课件 - 17 由浅入深学习 map 容器 0 码力 \| 90 页 \| 8.76 MB \| 2 年前 3 C++高性能并行编程与优化 - 课件 - 11 现代 CMake 进阶指南 build 目录 • 切换到 build 目录 • 在 build 目录运行 cmake < 源码目录> 生成 Makefile - 执行本地的构建系统 make 真正开始构建（4 进程并行） - 让本地的构建系统执行安装步骤回到源码目录 ## 现代 CMake 提供了更方便的 -B 和 --build 指令，不同平台，统一命令！ • cmake -B build // 在源码目录用 cmake libmylib.a main Makefile bate@archer ~/Codes/course/11/00 (master) $ 改进：mylib 作为一个动态库 CMakeLists.txt main.cpp \| mylib.cpp 1 add_library(mylib SHARED mylib.cpp) 3 add_executable(main 4 printf("main function\n") 5 } mylib initialized main function ## 虽然动态库也可以避免剔除没引用的对象文件，但引入了运行时链接的麻烦 CMakeLists.txt 1 add_library(mylib SHARED mylib.cpp) main.cpp mylib 0 码力 \| 166 页 \| 6.54 MB \| 2 年前 3 C++高性能并行编程与优化 - 课件 - 01 学 C++ 从 CMake 学起 [Image](/uploads/documents/b/9/2/9/b92965fc278f6399099ce51dd8119d4d/p1_2.jpg) ## 高性能并行编程与优化 - 课程大纲 • 分为前半段和后半段，前半段主要介绍现代 C++，后半段主要介绍并行编程与优化。 1. 课程安排与开发环境搭建：cmake 与 git 入门 2. 现代 C++ 入门：常用 STL 容器，RAII 内存管理 3. 编译器如何自动优化：从汇编角度看 C++ 5. C++11 起的多线程编程：从 mutex 到无锁并行 6. 并行编程常用框架：OpenMP 与 Intel TBB 7. 被忽视的访存优化：内存带宽与 cpu 缓存机制 8. GPU 专题：wrap 调度，共享内存，barrier 9. 并行算法实战：reduce，scan，矩阵乘法等 10. 存储大规模三维数据的关键：稀疏数据结构 11 12.C++ 在 ZENO 中的工程实践：从 primitive 说起 13.结业典礼：总结所学知识与优秀作业点评 ## 硬件要求： 64 位（32 位时代过去了）至少 2 核 4 线程（并行课...）英伟达家显卡（GPU 专题）软件要求： Visual Studio 2019 ( Windows 用户 ) GCC 9 及以上（Linux 用户） CMake 3.12 及以上（跨平台作业） 0 码力 \| 32 页 \| 11.40 MB \| 2 年前 3 C++高性能并行编程与优化 - 课件 - 07 深入浅出访存优化 ## cpu-bound 与 memory-bound - 通常来说，并行只能加速计算的部分，不能加速内存读写的部分。 - 因此，对 fill 这种没有任何计算量，纯粹只有访存的循环体，并行没有加速效果。称为内存瓶颈（memory-bound）。 - 而 sine 这种内部需要泰勒展开来计算，每次迭代计算量很大的循环体，并行才有较好的加速效果。称为计算瓶颈（cpu-bound）。 \|Ben } } BENCHMARK(BM_parallel_sine); ## 浮点加法的计算量 - 冷知识：并行地给浮点数组每个元素做一次加法反而更慢。因为一次浮点加法的计算量和访存的超高延迟相比实在太少了。 • 计算太简单，数据量又大，并行只带来了多线程调度的额外开销。 • 小彭老师经验公式：1 次浮点读写 ☐ 8 次浮点加法 - 如果矢量化成功（SSE）：1 次浮点读写 invalidation)\|10K - 1M\| \|Disk read\|400K+\| ## 多少计算量才算多？ - 看右边的 func，够复杂了吧？也只是勉勉强强超过一点内存的延迟了，但在 6 个物理核心上并行加速后，还是变成 mem-bound 了。 • 加速比：1.36 倍 • 应该达到 6 倍（物理核心数量）才算理想加速比。 \|Benchmark\|Time\|CPU\|Iterations\| \|---\|---\|---\|---\| 0 码力 \| 147 页 \| 18.88 MB \| 2 年前 3 共 1000 条 1 2 3 4 5 6 100 前往页相关搜索词 Hadoop Oracle Database 外部表表函数并行处理 Rust并行编译共享数据结构编译器性能社区工作组并行程序设计 Intel TBB 并行编程流水线并行任务并行数据并行 Promise 异步编程并行多线程任务调度 CUDA GPU 核函数动态并行性能优化 Greenplum OLAP 数据仓库数据集市扩展规划 map容器 set容器 map函数遍历修改底层实现 CMake Ninja CMakeLists.txt 缓存变量构建类型 C++优化访存优化缓存预取内存带宽寄存器分块关于我们文库协议联系我们意见反馈免责声明本站文档数据由用户上传或本站整理自互联网，不以营利为目的，供所有人免费下载和学习使用。如侵犯您的权益，请联系我们进行删除。 IT文库 ©1024 - 2026 \| 站点地图 Powered By MOREDOC AI v3.5.0-beta.10

分类

语言

格式

通过Oracle 并行处理集成 Hadoop 数据

Rust并行编译的挑战与突破

C++高性能并行编程与优化 - 课件 - 06 TBB 开启的并行编程之旅

在 JavaScript 中的并行语言特性-周爱民

C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程

并行不悖- OLAP 在互联网公司的实践与思考

C++高性能并行编程与优化 - 课件 - 17 由浅入深学习 map 容器

C++高性能并行编程与优化 - 课件 - 11 现代 CMake 进阶指南

C++高性能并行编程与优化 - 课件 - 01 学 C++ 从 CMake 学起

C++高性能并行编程与优化 - 课件 - 07 深入浅出访存优化

搜索

分类

语言

格式