-
Oracle 白皮书
2011年1月
通过 Oracle 并行处理集成 Hadoop 数据
## 引言
许多垂直行业都在关注文件系统中庞大的数据。这些数据中通常包含大量无关的明细信息,以及部分可用于趋势分析或丰富其他数据的精华信息。尽管这些数据存储在数据库之外,但一些客户仍然希望将其与数据库中的数据整合在一起以提取对业务用户有价值的信息。
本文详细介绍了如何从 Oracle 数据库访问存储在 动直接访问 HDFS 文件。FUSE(File System in Userspace)项目针对这种情况提供了解决方法。有多种 FUSE 驱动程序支持用户挂载 HDFS 存储,并将其作为常规文件系统处理。通过使用一个此类驱动程序,并在数据库实例上挂载 HDFS(如果是 RAC 数据库,则在其所有实例上挂载 HDFS),即可使用外部表基础架构轻松访问 HDFS 文件。
,外部表方法可能不适用。Oracle 表函数提供了从 Hadoop 中获取数据的替代方法。本文附带的示例展示了一种这样的方法。
0 码力 |
21 页 |
1.03 MB
| 2 年前 3
-
GO CN
基于Go构建海量作业作业平台
袁帅 villager
bilibili/基础架构部/SRE/平台工程组/资深开发工程师
作业平台简介 01
作业平台的挑战 02
B站作业平台Job的介绍 03
Job设计实现:Agent/Worker 作业执行和上报 04
Job设计实现:Scheduler 作业调度 05
Job设计实现:ApiServer 鉴权+数据处理 06
Job设计实现:其他技术难点和细节 系统集成:作业平台需要集成多个系统和工具,这些系统可能来自不同的操作系统或供应商
自动化作业编排开发:运维作业平台的核心是自动化编排作业
安全性:运维作业平台需要处理敏感数据和关键操作,平台需要采用安全的认证和授权机制
性能优化:运维作业平台需要处理大量的数据和任务,因此需要具备高性能和可伸缩性
故障排除:平台需要具备完善的故障排除机制和技术支持,以快速定位和解决问题
用户体验:运维作业平台需 作业平台组件升级维护成本太高
’ alt=‘OCR图片’/>
第三部分
B站作业平台Job介绍
作业平台(Job)是一套基于作业平台Agent/SSH双模式,提供基础操作的原子平台;具备上万台机器并发处理能力,除了支持脚本执行、文件分发、定时任务等一系列基础运维场景以外,还支持通过流程调度能力将零碎的单个任务组装成一个自动化作业流程;而每个任务都可做为一个原子节点,提供给上层或周边系统/平台使用,实现调度自动化。
0 码力 |
34 页 |
4.48 MB
| 1 月前 3
-
# Java 应用与开发 异常处理
王晓东
wangxiaodong@ouc.edu.cn
中国海洋大学
October 30, 2018

;
另一方面,库的用户知道怎样处理这些错误,但却无法检查它们何时发生(如果能 检测,就可以再用户的代码里处理了,不用留给库去发现)。
## 提供异常处理机制的基本思想
让一个函数在发现了自己无法处理的错误时抛出(throw)一个异常,然后它的(直接或者间接)调用者能够处理这个问题。
## 《C++ primer》
将问题检测和问题处理相分离。
(Exceptions let us separate problem detection from problem resolution
0 码力 |
33 页 |
626.40 KB
| 2 年前 3
-
## ClickHouse在B站海量数据场景的落地实践
胡甫旺
哔哩哔哩OLAP平台

## 目录
ClickHouse在B站
内核
日志
用户行为数据分析
Future Work
Q&A

## 事件分析
海量埋点事件数据,日增数据千亿级。
用户行为事件的多维度分析场景。
事件包含公共属性和私有属性,均可作过滤和聚合维度。
不同事件有不同的私有属性字段。
动态选择的过滤维度和聚合维度。
交互式分析延迟要求
0 码力 |
26 页 |
2.15 MB
| 2 年前 3
-
自我介绍
## 极光推送后台开发工程师
多年互联网开发经验,专注后台开发技术。2016年加入极光,负责极光推送平台架构设计及开发,主导包括K8S在内的技术架构实施落地,推动系统架构的演进,构造支撑海量用户的推送系统,对大规模分布式系统架构及设计有深入的理解。
## 目录
- 极光推送服务架构
- 关于极光
- 消息推送系统面临的挑战
- 极光推送相关架构
- 极光推送后台系统架构 亿
%
APP
移动终端
月独立
活跃设备
覆盖率
## 消息推送系统面临的挑战
☐
亿级长连接用户
品
SDK多版本并存
DM
消息实时性
触达率要求
## 国
海量用户数据存储
移动网络环境复杂性
## 极光推送服务架构
API
用户筛选
用户分发
推送通道
系统通道
共享通道
极光通道
短信通道
## 极光推送后台系统架构
iOS SDK Broadcast
OnlineCache
StatCenter
JCache
XPNS
API
PushTask
DB
## 极光推送后台系统架构
01 模块化
02 异步化
03 并行化
04 缓存化
05 程序及系统优化
06 基础组件服务化
07 链接管理
08 系统安全
09 新技术的应用—
新技术的应用——K8S部署业务
##
0 码力 |
23 页 |
1.26 MB
| 2 年前 3
-
Go如何帮滴滴支撑海量运维场景
秦晓辉
’ alt=‘OCR图片’/>
秦晓辉
18612185520,qinxiaohui@didiglobal.com
先后履职于百度、小米、金山云,开源互联网监控解决方案 Open-Falcon主程,Nightingale开源发起人之一,现在滴滴负责产业云技术中心,推动滴滴中后台能力商业化输出
’ alt=‘OCR图片’/>
大纲
海量运维问题域是什么样的 构筑了什么样的运维平台体系
如何开始体系化平台的构建
’ alt=‘OCR图片’/>
海量运维问题域是什么样的
海量运维问题域典型特点
大量不同语言的服务
大规模机器
异地多个机房
有物理机虚拟机容器多种运行环境
网络分区多样
各类开源中间件
各类自研工具
各种安全要求
大量不同厂商的硬件大量过保更迭
对接的人多角色分工细
海量运维问题域典型问题
统一服务治理困难
机器环境各异
网络抖动带宽争抢
不同的运行环境如何提供统一的使用体验 不同的运行环境如何提供统一的使用体验
各种网络分区隔离
各类中间件、自研平台均需构建运维体系
完备的权限审计诉求
每天都有各种硬件故障
每天各种人追着你答疑提需求
海量运维问题域典型解法
在流量转发层做文章
统一机器初始化、整包或镜像部署、静态编译
页面和流程层面统一,底层驱动式设计
网络分区代理、防火墙友好设计
运维体系是平台核心+扩展共建的思路
统一权限、统一日志、统一审计
让业务能漂起来不依赖底层硬件
0 码力 |
30 页 |
4.80 MB
| 1 月前 3
-
[Image](/uploads/documents/9/8/b/3/98b3d2ca5ab52d44cfe0bd9d7d1dfbef/p2_2.jpg)
- Greenplum是一家数据库软件公司,在数据处理和BI/DW领域,提供容量最大、速度最快、性价比最好的数据库引擎产品和服务。
• Greenplum总部位于圣马蒂奥,加利福尼亚州,美国,成立于2003年6月。
• Greenplum 中国于2008年12月正式成立 [Image](/uploads/documents/9/8/b/3/98b3d2ca5ab52d44cfe0bd9d7d1dfbef/p7_1.jpg)
## 数据仓库工作量:数据膨胀 面临的新难题是如何处理大规模数据

## 金融服务
## 行业商务智能解决方案的实例 nts/9/8/b/3/98b3d2ca5ab52d44cfe0bd9d7d1dfbef/p12_2.jpg)
• “一切皆可商用”:商业即用型x86服务器、存储设备、网络
•通过软件很容易将处理能力扩展到1000s的内核/系统
过去Google $ ^{TM} $ 曾经用来实现信息搜索功能的技术,现在被Greenplum用于数据仓库
## Greenplum愿景:企业数据集合
源数据
0 码力 |
45 页 |
2.07 MB
| 2 年前 3
-
Golang在工程实践中的错误处理

彭友顺
石墨文档
产研负责人

为什么我们处理错误会这么慢 为什么我们处理错误会这么慢 01
如何完善错误信息 02
优雅处理错误信息 03
分布式错误处理 04
错误信息手册的必要性 05
第一部分
## 为什么我们处理错误 会这么慢
## 为什么我们处理错误会这么慢
why
出现错误
定位慢
恢复慢
效率低
## 原因
错误信息不够完善
错误处理不够优雅
分布式错误难以串联
错误信息难以识别
## 第二部分
## 如何完善错误信息
## GET./hello => "Hello client: main"
• 没有调试信息和错误信息
• 对接起来会非常麻烦
## 第三部分
## 优雅处理错误信息
## 为什么定位慢?-- 错误处理
## 假设用户反馈了无法打开一个文件
## 记录一次错误
不要透传错误
错误码唯一性
## 我们的程序员非常认真
err := fmt.Errorf(format:
0 码力 |
30 页 |
3.11 MB
| 2 年前 3
-
TECHNOLOGY CONFERENCE
# OPEN SOURCE, INTO THE FUTURE #
Rust
并行编译的挑战与突破
李原 2022年5月28日
## 目录
- 相关浅谈
- Rust
并行编译的挑战与突破
- 从
并行编译到
并行程序设计
- Rust社区与
并行编译

Rust社区编译器性能工作组
##
并行编译或成下一代编译效率突破利器
| Primary benchmarks 1 |
Benchmar [Image](/uploads/documents/4/a/8/b/4a8bb6fe19e141c71c8eb7726070bfef/p5_4.jpg)
## 更多更好的并行化?
## Rust编译器并行化
Cargo多crate并行

0 码力 |
25 页 |
4.60 MB
| 2 年前 3 -
3.jpg)

# TBB 开启的并行编程之旅
by 彭于斌 (@archibate)
往期录播:https://www.bilibili.com/video/BV1fa411r7zp 课程 PPT 和代码:https://github [Image](/uploads/documents/1/0/0/5/10051dd97d247e9f7a97909b93f2890b/p1_8.jpg)
## 高性能并行编程与优化 - 课程大纲
• 分为前半段和后半段,前半段主要介绍现代 C++,后半段主要介绍并行编程与优化。
1. 课程安排与开发环境搭建:cmake 与 git 入门
2. 现代 C++ 入门:常用 STL 容器,RAII 内存管理
3. 编译器如何自动优化:从汇编角度看 C++
5. C++11 起的多线程编程:从 mutex 到无锁并行
6. 并行编程常用框架:OpenMP 与 Intel TBB
7. 被忽视的访存优化:内存带宽与 cpu 缓存机制
8. GPU 专题:wrap 调度,共享内存,barrier
9. 并行算法实战:reduce,scan,矩阵乘法等
10. 存储大规模三维数据的关键:稀疏数据结构
11 0 码力 |
116 页 |
15.85 MB
| 2 年前 3
|