端到端模型 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

Rust 异步并发框架在移动端的应用 - 陈明煜

第三届中国 Rust 开发者大会 Rust 异步并发框架在移动端的应用陈明煜 chenmingyu4@huawei.com 华为公共开发部嵌入式软件能力中心本科就读加州大学圣地亚哥分校，毕业时长两年半， Rustacean 在华为目前正在使用 Rust 开发并行调度框架等模块。 Rust 异步并发框架在移动端的应用陈明煜 chenmingyu4@huawei.com #2 社区并发框架介绍以及与移动端的不适配性 Introduction to third party Runtime crates and their incompatibility with mobile environment Rust 异步机制 Asynchronous Rust 异步并发框架是许多大型应用、系统具备的底层能力。区别于多线程编程模型，它带来以下优势：  任务调度颗粒度更小，充分利用线程资源类似支持异步 IO ，目前已经半废弃 async-std 更轻量化的调度框架，功能被拆分到其他多个库中， IO 密集场景性能不如 Tokio smol Rayon 并非异步运行时。它通过同步多线程模型提供了并行迭代器功能，适用于处理 CPU 密集型计算任务 rayon 现有框架无法完美适配移动端（一） Core Thread Thread Worker Worker task

0 码力 | 25 页 | 1.64 MB | 1 年前
3
JVM 内存模型

JVM 内存模型 Heap Method Area Runtime Constant Pool Thread Thread Thread PC Register JVM Stack Native Method Stack PC Register JVM Stack Native Method Stack PC Register JVM Stack Native Method

0 码力 | 1 页 | 48.42 KB | 1 年前
3
RustBelt - Rust 的形式化语义模型

第三届中国 Rust 开发者大会王俊吉 RustBelt - Rust 的形式化语义模型 Outline Background • RustBelt Project • Rust Types Overview Rust Semantics • Type System • The own Predict • Exclusive Ownership & Mutable Borrow

0 码力 | 21 页 | 2.63 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 10 从稀疏数据结构到量化数据类型

从稀疏数据结构到量化数据类型 by 彭于斌（ @archibate ）往期录播： https://www.bilibili.com/video/BV1fa411r7zp 课程 PPT 和代码： https://github.com/parallel101/course 本课涵盖：稀疏矩阵、 unordered_map 、空间稀疏网格、位运算、浮点的二进制格式、内存带宽优化面向人群：图形学、要把浮点数转换成定点数，只需乘以 100 ，然后转换成 int 即可。 • 要从定点数中获取原来的浮点数，只需把定点数除以 100 即可。 • 注意：定点数的表示范围比较小，比如 0 到 99999 ，但精度均匀。 • 而浮点数表示范围很大，如 1e-9 到 1e9 ，但精度在数字大时变低。图片解释定点数与浮点数的精度差别浮点定点 0 0.1 1 int8_t 表示 • 发现结果不对了……说明 int8_t 太小了（可以容纳 - 128 到 127 ），容纳不下 97*100 这么大的数，发生了溢出导致结果错误。试图解决：用 uint8_t 表示，定点数系数调小到 2 • 注意到我们的值始终是正数，因此可以用无符号的 uint8_t （可以容纳 0 到 255 ），然后把刚刚的系数 100 改小到 2 ，成功算对结果了，代价是精度损失了

0 码力 | 102 页 | 9.50 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程

完成队列的所有任务后再返回。从而能够在 main 退出前等到 kernel 在 GPU 上执行完。定义在 GPU 上的设备函数 • __global__ 用于定义核函数，他在 GPU 上执行，从 CPU 端通过三重尖括号语法调用，可以有参数，不可以有返回值。 • 而 __device__ 则用于定义设备函数，他在 GPU 上执行，但是从 GPU 上调用的，而且不需要三重尖括号，和普通函数用起来一这个需求。 • 不过必须指定 --expt-relaxed-constexpr 这个选项才能用这个特性，我们可以用 CMake 的生成器表达式来实现只对 .cu 文件开启此选项（不然给到 gcc 就出错了）。 • 当然， constexpr 里没办法调用 printf ，也不能用 __syncthreads 之类的 GPU 特有的函数，因此也不能完全替代 __host__ <<>> 的简写而已。图片解释三维的板块和线程 • 之所以会把 blockDim 和 gridDim 分三维主要是因为 GPU 的业务常常涉及到三维图形学和二维图像，觉得这样很方便，并不一定 GPU 硬件上是三维这样排列的。 • 三维情况下同样可以获取总的线程编号（扁平化）。 • 如需总的线程数量： blockDim * gridDim

0 码力 | 142 页 | 13.52 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 12 从计算机组成原理看 C 语言指针

的空间称为一个位（ bit ），一位可以存储 0 或 1 两个可能的值。 • 现在的计算机都会把 8 个位打包成一个字节（ byte ），也就是说： 1 字节 = 8 位。 • 一字节可以表示 0 到 255 区间中所有的值，表示方式如下： • 00000000 表示 0 00000001 表示 1 00000010 表示 2 00000011 表示 3 • 00000100 表示 4 00000101 11111111 表示 255 • 字节实际上就是 C 语言中的 unsigned char 类型。表示更大范围的整数：字（ word ） • 但是单单一个字节表示的范围还是太有限了，只能表示 0 到 255 的值。 • 如何扩大表示范围？简单，用两个字节合在一起即可，例如： • 00000000-00000000 表示 0 00000000-00000001 表示 1 • 00000000-00000010 位长的整数能表示的范围是 0 到 2^8-1 ，也就是 0 到 255 。 • 16 位长的整数能表示的范围是 0 到 2^16-1 ，也就是 0 到 65535 。 • 32 位长的整数能表示的范围是 0 到 2^32-1 ，也就是 0 到 4294967295 。 • 64 位长的整数能表示的范围是 0 到 2^64-1 ，也就是 0 到 [ 数据删除 ] 。 • 这就是为什么现在的计算机都升级到 64 位了，因为能表示更大范围的

0 码力 | 128 页 | 2.95 MB | 1 年前
3
Zadig 面向开发者的云原生 DevOps 平台

平台高人效低人效低人效 / 低质量 / 低效率 / 高成本：人淹没在系统的海洋里，无数平台手工切换高人效 / 高质量 / 高效率 / 低成本：人在系统之外 / 上，复杂性下沉到单一平台希望工程师不再花时间在开发写代码之外的脏活累活，比如服务部署、找环境，服务编排等 Infra 的事情。 1 0 0 % 开源基本能力开源 1.5 个月核心重构业务负责人研发不透明，规划凭感觉： • 发版时间靠运气 • 团队熬夜冲进度研发透明化：不同项目清晰可见的效率、质量、进度进度管理：根据团队客观数据，预测和确定项目规划迭代进度一目了然项目从无到有可核算管理有数据科学依据解放管理，更多时间花在业务创新平台运维业务压力大，能力建设缓慢： • 大量工作花在工具链维护 • 项目间依赖复杂，环境管理难 • 交付版本依赖工单，发布风险高低效率 / 高成本 • 人淹没在系统的海洋里 • 无数平台手工切换靠系统和技术，能力长在平台上 • 高人效 / 高质量 / 高效率 / 低成本 • 人在系统之上 / 高效交互 • 复杂性下沉到单一平台整体人效提升 1-5 倍解除组织 / 流程 / 系统孤岛，打造成长型组织企业收益分析现存方案典型代表方案特点分析 Zadig 方案优势传统 Jenkins 方案 GitLab

0 码力 | 59 页 | 81.43 MB | 1 年前
3
新一代分布式高性能图数据库的构建 - 沈游人

领先水平。” 以终为始，以行为知，这一项目从图计算所面临的挑战出发，解决了大规模图数据所产生的建模能力不足、结构知识难用、巨量数据难算等技术挑战，实现了大规模复杂异质图数据的表示学习模型、语义推荐和风险管理关键技术，构建了完整的兼具理论指导与应用检验的大规模图数据智能分析系统与平台，满足了大数据时代从复杂异质图数据中进行知识发现的重要需求。最终获得国内外授权发明专利 43 项，链接预测连接强度一致行动人同事关系实际控制人可能认识的人上下游同爱好的人亲属关系 …  人与人、企业与企业、企业与人之间的复杂、潜在关系推导和挖掘  为已有的分析模型增加“关系特征”维度客户贡献度客户信用分客户忠诚度客户欺诈分客户风险度违约概率客户资质 … 集团关系社群关系欺诈团伙担保关系资金圈 / 链 …  设别出带有某种共同特征 Productivity • Modern development tools • Lots of amazing libraries Rust 编译通过了 bug 比 cpp 少上百倍 !!! 图模型—— Labeled Property Graph Model Arbitrary (key,value) pairs where key identifies a property and value

0 码力 | 38 页 | 24.68 MB | 1 年前
3
Zadig 产品使用手册

价值链平台产业数字化核心资产是软件和数据：传统软件 / 配置 / 数据迭代方式已经无法适应，软件工程化时代已然到来。 Z a d i g 软件工程平台是国内落地程度最深、使用范围最广（近千家企业）的云原生 D e v O p s 平台设计思路：通过「平台工程」解决流程挑战，通过「技术升级」提升组织效能 01 04 02 03 工程化协同：“人、技术、流程、工具” 四维协同基线，沉淀全流程数据，从感知到赋能，服务于工程师释放云基建能力：链接任何云及自建资源（容器、主机、车机、端等），释放云原生价值和企业创新力生态开放：广泛开放系统模块和 OpenAPI ，链接一切流程、服务、工具和上下游伙伴安全简单自主可控：私有化无法支持敏捷交付模式支持从需求到发布全流程敏捷交付。尤其面向多服务并行部署发布，云原生构建环境和运行环境，基础设施对接及企业级 SSO/ 权限管理等运维管理类平台蓝鲸 Rainbond KubeSphere KubeVela 面向资源管理的运维工具集面向开发者，需结合 CI/CD 工具额外搭建全流程能力专门面向开发者的生产力平台，涵盖需求到开发，测试，运维的云原生一体化技术底座支撑

0 码力 | 52 页 | 22.95 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 性能优化之无分支编程 Branchless Programming

果烧开水被烫伤”这件事似乎从来没发生过，于是你渐渐意识到，被烫伤是个小概率事件，所以你“预判”到今天应该也不会发生意外，不再等待烧完开水才开始刷牙，而是针对性地为“没烫伤”的那个剧本优化。把刷牙、看比站和烧开水同时进行，但刷牙、看比站在烧完开水前都处于“虚”的状态，也就是虽然在做但是不写到日记里（提前执行数学计算，但不实际写回数据到内存）。直到烧完开水确认没有被烫伤后，才实际把刷牙、看比站的操作写到日记本里（的所有指令和数据删了（浪费了 50% 的算力）。这就是说 CPU 第一次遇见一个分支时，两个分支都会被预执行。 • 同一段程序被多次执行后，如果每次都是分支 A ，下一次 CPU 就会总结经验，预判到下一次应该也是分支 A ，并且把 90% 的流水线用于预先执行分支 A 的剧本， 10% 的流水线用于预先执行分支 B 。如果预判成功，的确走了分支 A ，那么只会浪费 10% 的算力；如果预判失败，最后走了分支支预执行的比例。其实就像训练神经网络一样，一直喂给他正确的数据，他就越来越自信。 • 随着 CPU 预判分支 A 成功的次数越来越多， CPU 对自己的结果就越来越自信，并进一步加大预执行分支 A 所占的比例，从最初的 50% 到 60% 、 90% 、 99% 直到有一次，突然出现了一次分支 B 成功的案例， CPU 瞬间被打脸！不得不浪费 99% 已经填满 A 数据的流水线清空，重启整个流水线，这就是分支预测失败，他是导致分支性能低下的罪魁祸

0 码力 | 47 页 | 8.45 MB | 1 年前
3

共 30 条前往

页

分类

语言

格式