C++高性能并行编程与优化 - 课件 - 10 从稀疏数据结构到量化数据类型e/p1_3.jpg) 本课涵盖:稀疏矩阵、unordered_map、空间稀疏网格、位运算、浮点的二进制格式、内存带宽优化 面向人群:图形学、CFD 仿真、深度学习编程人员  第 0 章:稀疏矩阵 ## 稠密数组存储矩阵 #define correct\n"); bate::timing("main"); return 0; 第 1 章:稀疏网格 ## 稠密网格计算粒子经过的格点数量 terminate called after throwing an instance of 'std::bad_alloc' what(): count: 193505 main: 0.00721933s 会浪费分块中一部分空间。 然而我们这里是要用他记录粒子经过的点,因此具有一定空间局域性,能够被分块优化。 实际上空间局域性正是稀疏网格能够实现的一大前提,稍后详细讨论。 struct Grid { struct MyHash { std::size_t operator()(std::tuple0 码力 | 102 页 | 9.50 MB | 2 年前3
Facebook -- TVM AWS Meetup Talk0 码力 | 11 页 | 3.08 MB | 1 年前3
MoonBit月兔编程语言 现代编程思想 第七课 命令式编程:命令,可变数据结构,循环 ## 别名 - 指向相同的可变数据结构的两个标识符可以看作是别名 1. fn alter(a: Ref[Int], b: Ref[Int]) { 2. a.val = 10 3. b.val = 20 4. } 5. : 1 } 8. alter(x, x) 9. println(x.val.to_string() // x.val 的值将会被改变两次 10. } ## 别名 - 指向相同的可变数据结构的两个标识符可以看作是别名  - Int View No quick fixes ## 可变数据 • 使用场景广泛 ☐ 直接操作程序外环境,如硬件等 ☐ 一些情况下性能更好,如随机访问数组等 ☐ 可以构建部分复杂数据结构,如图 ☐ 重复利用空间(原地修改) - 可变数据并不总是与引用透明性冲突 1. fn fib_mut(n: Int) -> Int { // 对于相同输入,总是有相同输出 2.0 码力 | 23 页 | 780.46 KB | 2 年前3
GraphBLAS: Building a C++ Matrix API for Graph Algorithms0 码力 | 172 页 | 7.40 MB | 1 年前3
从推荐模型的基础特点看大规模推荐类深度学习系统的设计 袁镱e00ef/p3_1.jpg) ## ☐ 袁镱 博士,专家工程师 ☐ 研究方向:机器学习系统,云计算,大数据系统 ☐ 负责腾讯平台与内容事业群(PCG)技术中台核心引擎:无量系统。支持大规模稀疏模型训练,上线与推理 ## ☐ 无量系统 ☐ 项目于17年启动,先后经过了6个主要版本的迭代 ☐ 覆盖腾讯PCG全部业务的推荐场景,支持腾讯IEG,CSIG,QQ音乐,阅文等业务的部分推荐场景 ede00ef/p6_2.jpg) 百万级稠密交叉参数 单个样本命中的key 千亿级稀疏输入层参数 一段时间样 本命中的 unique key ID/tag/交叉特征 (千,千万) 小特征 中型特征 (个) (十) □ Feature 3(机器学习的特点) Embedding以稀疏的方式表达信息 ☐ 2.2 hotkey现象,且训练与推理的hotkey高度重合 e9d4f868ca103d724198ede00ef/p11_3.jpg) ☐ 推荐模型GPU训练的挑战 ☐ 显存(A100最大80GB)放不下TB级的模型 ☐ GPU多线程并行计算能力对稀疏数据不友好 ArchSummit 全球架构师峰会 ☐ Feature 2.1: 短时间内只有部分item和user被命中,只有部分参数被用到 ## ☐ 方案 ☐ 原有:内存能够存储的参数->对应的样本量Group0 码力 | 22 页 | 6.76 MB | 2 年前3
2022年美团技术年货 合辑画。 - 超高维稀疏性:特征高维稀疏,数据规模庞大,包含了7亿个用户、20亿次浏览记录。 基于多层级多因子的模型融合方案:针对本次赛题的挑战,我们队采用了基于多层级多因子的模型融合方案来进行建模。一方面对于异构站点行为,单一模型不易于全面刻画,另一方面,亿级别的数据规模给多模型的分别优化带来了较大的空间。由于FFM具有强大的特征交叉能力以及较强的泛化能力,能更好地处理高维稀疏特征。因此,我们选 交叉特征如用户商品点击率等往往有较强的业务意义,让模型直接感知组合好的特征往往比自动学习特征间的关系更为简单;第三方面对于许多高维度稀疏 ID 特征,如亿级别以上的推荐或广告场景中,DeepFM、DeepFFM 对于这些特征的学习很难充分,自动化特征工程能给这些稀疏 ID 构造很强的特征表示。 ### 3.3 自动化模型优化 。 # 图神经网络训练框架的实践和探索 作者:付浩 宪鹏 祥洲 玉基 徐灏 梦迪 武威 ### 1. 前言 万物之间皆有联系。图作为一种通用的数据结构,可以很好地描述实体与实体之间的关系。例如,在社交网络中,用图来表示用户与用户之间的好友关系;在电商网站中,用图表示用户与商品之间的点击购买行为;在知识图谱构建中,还可以用图表示实体与实体间多样的0 码力 | 1356 页 | 45.90 MB | 2 年前3
机器学习课程-温州大学-01机器学习-引言注意:安装路径尽量不使用带有 中文或空格 的目录,这样在之后的使用过程中减少一些莫名的错误。 ## Python 的主要数据类型 ● 字符串 ●整数与浮点数 布尔值 ● 日期时间 ● 其它 ## Python 的数据结构 ## 列表(list) 用来存储一连串元素的容器,列表用[]来表示,其中元素的类型可不相同。 ## ●元组(tuple) 元组类似列表,元组里面的元素也是进行索引计算。列表里面的元素的值 : 1、一个强大的N维数组对象Array; 2、比较成熟的(广播)函数库; 3、用于整合C/C++和Fortran代码的工具包; 4、实用的线性代数、傅里叶变换和随机数生成函数。numpy和稀疏矩阵运算包scipy配合使用更加方便。 NumPy(Numeric Python)提供了许多高级的数值编程工具,如:矩阵数据类型、矢量处理,以及精密的运算库。专为进行严格的数字处理而产生。多为很多 的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。 ## Python模块-Pandas ## ● 基本数据结构 Series 一维数据结构,包含行索引和数据两个部分 DataFrame 二维数据结构,包含带索引的多列数据,各列的数据类型可能不同  用来存储一连串元素的容器,列表用[]来表示,其中元素的类型可不相同。 ## ●元组(tuple) 元组类似列表,元组里面的元素也是进行索引计算。列表里面的元素的值 : 1、一个强大的N维数组对象Array; 2、比较成熟的(广播)函数库; 3、用于整合C/C++和Fortran代码的工具包; 4、实用的线性代数、傅里叶变换和随机数生成函数。numpy和稀疏矩阵运算包scipy配合使用更加方便。 NumPy(Numeric Python)提供了许多高级的数值编程工具,如:矩阵数据类型、矢量处理,以及精密的运算库。专为进行严格的数字处理而产生。多为很多 的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。 ## Python模块-Pandas ## ● 基本数据结构 Series 一维数据结构,包含行索引和数据两个部分 DataFrame 二维数据结构,包含带索引的多列数据,各列的数据类型可能不同  稀疏矩阵存储 ..... 1105 85.2 稀疏向量储存 ..... 1106 85.3 稀疏向量与矩阵构造函数 ..... 1106 85.4 稀疏矩阵的操作 ..... 1107 85.5 Correspondence of dense 5.0e-324 两个相邻可表示的浮点数之间的距离并不是常数,数值越小,间距越小,数值越大,间距越大。换句话说,可表示的浮点数在实数轴上的零点附近最稠密,并沿着远离零点的方向以指数型的速度变得越来越稀疏。根据定义, $ \text{eps}(1.0) $ 与 $ \text{eps}(\text{Float64}) $ 相等,因为 1.0 是 64 位浮点值。 Julia 也提供了 nextfloat0 码力 | 1238 页 | 4.59 MB | 2 年前3
共 437 条
- 1
- 2
- 3
- 4
- 5
- 6
- 44













