-
Oracle 白皮书
2011年1月
通过 Oracle 并行处理集成 Hadoop 数据
## 引言
许多垂直行业都在关注文件系统中庞大的数据。这些数据中通常包含大量无关的明细信息,以及部分可用于趋势分析或丰富其他数据的精华信息。尽管这些数据存储在数据库之外,但一些客户仍然希望将其与数据库中的数据整合在一起以提取对业务用户有价值的信息。
本文详细介绍了如何从 Oracle 数据库访问存储在 动直接访问 HDFS 文件。FUSE(File System in Userspace)项目针对这种情况提供了解决方法。有多种 FUSE 驱动程序支持用户挂载 HDFS 存储,并将其作为常规文件系统处理。通过使用一个此类驱动程序,并在数据库实例上挂载 HDFS(如果是 RAC 数据库,则在其所有实例上挂载 HDFS),即可使用外部表基础架构轻松访问 HDFS 文件。
,外部表方法可能不适用。Oracle 表函数提供了从 Hadoop 中获取数据的替代方法。本文附带的示例展示了一种这样的方法。
0 码力 |
21 页 |
1.03 MB
| 2 年前 3
-
Agenda
Greenplum简介
Greenplum的MPP架构
> 分布式优化器: Postgres planner 和 ORCA
> 分布式事务和执行
Greenplum存储
Greenplum生态
Greenplum 7
Greenplum简介:什么是Greenplum?
基于PostgreSQL、开源、分布式MPP、ACID完备、为OLAP优化的关系型数据仓库。
https://greenplum 2003年,Luke Lonergan 和 Scott Yara 发起 Greenplum 项目,从 PostgreSQL 8 分支,做成 MPP 架构
2010年被EMC收购
2012年成为Pivotal的一部分
2015年开源,可能是世界上第一个成熟商用的开源MPP数据仓库
➢ 2019年底跟随Pivotal被VMware收购
## 谁在用Greenplum?
➢ 500多付费企业客户
成千上万的开源用户 ae0a0e1f69abbe60d5572e8/p5_11.jpg)
## Greenplum的MPP架构
## Massively:
☐ PB级的数据,单台主机无法处理
☐ 所以数据分布在多个主机上
☐ 高效、灵活的数据分布,和实际业务相关
## Parallel:
☐ 数据并行处理计算
☐ 通过网络进行数据交换和汇总
## 执行架构
## ➤ Coordinator:
☐ 管理其它节点
0 码力 |
23 页 |
4.55 MB
| 2 年前 3
-
不受限于基础架构,这意味着它是一种可完全移植的分析数据库软件解决方案,可部署在多云环境(公有云和私有云)中,也适用不同的本地配置。其大规模并行处理 (MPP) SQL 的设计核心是一个称为 GPORCA 的新一代查询优化器。GPORCA 专为满足在多结构数据环境中进行高级分析的需求而设计,能够处理多种并发混合工作负载的复杂查询。与旧式 MPP 数据库中常用的传统 RDBMS 查询优化器相比,GPORCA 大幅度地提高了查询性能。
## 数据洞察方法方面,这些功能对大多数客户都很有帮助。Greenplum 解决方案的架构设计目的是管理非常复杂的查询,以及为符合 ANSI 标准的 SQL 提供强有力的分析改进。通过自动对数据进行分区和并行运行查询,它让服务器群集能够以单一数据超级计算机的方式运行,且性能比传统数据库或其他同类平台高出数十甚至数百倍。其多种分析扩展功能支持 ANSI SQL,并通过封装扩展提供多种内置语言和附加功能。Greenplum 5:不受限于基础架构的软件架构。
## 集成分析:改进后的全新分析接口
一直以来,客户都能在 Pivotal Greenplum 中做高级分析,无论是提供将应用逻辑向下推送至数据所在位置的方法,执行分析功能,还是以大规模并行方式构建数据模型,都可以实现。Greenplum 5 支持适用于数据挖掘和数据科学工作的最全面、最先进的分析程序包和扩展。
Greenplum 5 还针对最受欢迎的 Python 和 R 语言算法库提供简单易用的安装程序。
0 码力 |
9 页 |
690.33 KB
| 2 年前 3
-
## Greenplum on Kubernetes 容器化MPP数据库
## AGENDA
## 云数据库背景 云数据库实现方案 Greenplum on Kubernetes Greenplum Operator 总结
## 云数据库背景
## 云数据库背景
● 资源变化
☐ 本地资源 → 云
☐ 静态资源 → 弹性需求
## ● 数据变化
☐ 内部数据 → 多数据源
0 码力 |
33 页 |
1.93 MB
| 2 年前 3
-
# Java 应用与开发 异常处理
王晓东
wangxiaodong@ouc.edu.cn
中国海洋大学
October 30, 2018

;
另一方面,库的用户知道怎样处理这些错误,但却无法检查它们何时发生(如果能 检测,就可以再用户的代码里处理了,不用留给库去发现)。
## 提供异常处理机制的基本思想
让一个函数在发现了自己无法处理的错误时抛出(throw)一个异常,然后它的(直接或者间接)调用者能够处理这个问题。
## 《C++ primer》
将问题检测和问题处理相分离。
(Exceptions let us separate problem detection from problem resolution
0 码力 |
33 页 |
626.40 KB
| 2 年前 3
-
## Golang大规模云原生应用管理实践
刘洋(炎寻)
## 关于我
• 毕业于中国科学技术大学,定居杭州
· 就职于阿里云-云原生应用平台团队
• Problem Solver,聚焦中间件,容器,Kubernetes,PaaS平台...
• OAM社区成员
GOPHER CHINA 2020
## 开局一张图
2020云上双11
阿里云扛住全球最大流量洪峰
规模化应用交付效率对比去年 applied components
应用关联的事件与日志
GOPHER CHINA 2020
中国 上海 / 2020-11.21-22
## 新的复杂度-控制器运维
## 我们要管控大规模的集群,每个集群也会部署大量的控制器,控制器本身的运维成为问题
• 控制器管控平台
· 升级
• 回滚
· 灰度
• 重启
• 观测性
• Prometheus
• 统一日志收集
0 码力 |
23 页 |
7.70 MB
| 2 年前 3
-
Golang在工程实践中的错误处理

彭友顺
石墨文档
产研负责人

为什么我们处理错误会这么慢 为什么我们处理错误会这么慢 01
如何完善错误信息 02
优雅处理错误信息 03
分布式错误处理 04
错误信息手册的必要性 05
第一部分
## 为什么我们处理错误 会这么慢
## 为什么我们处理错误会这么慢
why
出现错误
定位慢
恢复慢
效率低
## 原因
错误信息不够完善
错误处理不够优雅
分布式错误难以串联
错误信息难以识别
## 第二部分
## 如何完善错误信息
## GET./hello => "Hello client: main"
• 没有调试信息和错误信息
• 对接起来会非常麻烦
## 第三部分
## 优雅处理错误信息
## 为什么定位慢?-- 错误处理
## 假设用户反馈了无法打开一个文件
## 记录一次错误
不要透传错误
错误码唯一性
## 我们的程序员非常认真
err := fmt.Errorf(format:
0 码力 |
30 页 |
3.11 MB
| 2 年前 3
-
TECHNOLOGY CONFERENCE
# OPEN SOURCE, INTO THE FUTURE #
Rust
并行编译的挑战与突破
李原 2022年5月28日
## 目录
- 相关浅谈
- Rust
并行编译的挑战与突破
- 从
并行编译到
并行程序设计
- Rust社区与
并行编译

Rust社区编译器性能工作组
##
并行编译或成下一代编译效率突破利器
| Primary benchmarks 1 |
Benchmar [Image](/uploads/documents/4/a/8/b/4a8bb6fe19e141c71c8eb7726070bfef/p5_4.jpg)
## 更多更好的并行化?
## Rust编译器并行化
Cargo多crate并行

0 码力 |
25 页 |
4.60 MB
| 2 年前 3 -
3.jpg)

# TBB 开启的并行编程之旅
by 彭于斌 (@archibate)
往期录播:https://www.bilibili.com/video/BV1fa411r7zp 课程 PPT 和代码:https://github [Image](/uploads/documents/1/0/0/5/10051dd97d247e9f7a97909b93f2890b/p1_8.jpg)
## 高性能并行编程与优化 - 课程大纲
• 分为前半段和后半段,前半段主要介绍现代 C++,后半段主要介绍并行编程与优化。
1. 课程安排与开发环境搭建:cmake 与 git 入门
2. 现代 C++ 入门:常用 STL 容器,RAII 内存管理
3. C++
5. C++11 起的多线程编程:从 mutex 到无锁并行
6. 并行编程常用框架:OpenMP 与 Intel TBB
7. 被忽视的访存优化:内存带宽与 cpu 缓存机制
8. GPU 专题:wrap 调度,共享内存,barrier
9. 并行算法实战:reduce,scan,矩阵乘法等
10. 存储大规模三维数据的关键:稀疏数据结构
11. 物理仿真实战:邻居搜索表实现 0 码力 |
116 页 |
15.85 MB
| 2 年前 3 -
# 开源 MPP 数据库的不二之选: Pivotal Greenplum 5.0
姚延栋
yyao@pivotal.io
## 开放源代码



## MPP

Master Servers
Query a95/p7_2.jpg)
## 多态存储
表'SALES'
5月
4月
3月
2月
1月
12月
11月
一年前
二年前
行存储
列存储
外部表
## 并行执行

gang
gang
![ 0 码力 |
18 页 |
913.39 KB
| 2 年前 3
|