计算复杂度 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

构建基于富媒体大数据的弹性深度学习计算平台

构建基于富媒体大数据的弹性深度学习计算平台 SPEAKER / 土土@七牛 AtLab Mobile —> 富媒体时代数据存储数据加速数据处理直播点播 Connect 每天超过10亿图像上传超过万亿小时的音视频存储 What are they？内容审核团队运营分析团队 AI？ Content 分类检测分割跟踪描述搜索分析 …

0 码力 | 21 页 | 1.71 MB | 1 年前
3
机器学习课程-温州大学-05机器学习-机器学习实践

（假设百万条数据） 1.数据集划分数据集训练集验证集测试集 5 交叉验证 1. 使用训练集训练出k个模型 2. 用k个模型分别对交叉验证集计算得出交叉验证误差（代价函数的值） 3. 选取代价函数值最小的模型 4. 用步骤3中选出的模型对测试集计算得出推广误差（代价函数的值） 6 数据不平衡是指数据集中各类样本数量不均衡的情况. 常用不平衡处理方法有采样和代价敏感学习采样欠采样、过采样和综合采样的方法欠拟合的处理 1.添加新特征当特征不足或者现有特征与样本标签的相关性不强时，模型容易出现欠拟合。通过挖掘组合特征等新的特征，往往能够取得更好的效果。 2.增加模型复杂度简单模型的学习能力较差，通过增加模型的复杂度可以使模型拥有更强的拟合能力。例如，在线性模型中添加高次项，在神经网络模型中增加网络层数或神经元个数等。 3.减小正则化系数正则化是用来防止过拟合的，但当模型出现欠拟合现象时，则需要有针对性地减 stopping的优点是，只运行一次梯度下降，你可以找出?的较小值，中间值和较大值，而无需尝试?2 正则化超级参数?的很多值。 27 正则化大部分的计算机视觉任务使用很多的数据，所以数据增强是经常使用的一种技巧来提高计算机视觉系统的表现。计算机视觉任务的数据增强通常以下方法实现： (1) 随意翻转、镜像。 (2) 随意裁剪。 (3) 扭曲变形图片。 (4) 颜色转换，然后给R、G和B三个通道上

0 码力 | 33 页 | 2.14 MB | 1 年前
3
机器学习课程-温州大学-特征工程

99.0] 4 13 2. 特征构建 • 聚合特征构造主要通过对多个特征的分组聚合实现，这些特征通常来自同一张表或者多张表的联立。 • 聚合特征构造使用一对多的关联来对观测值分组，然后计算统计量。 • 常见的分组统计量有中位数、算术平均数、众数、最小值、最大值、标准差、方差和频数等。聚合特征构造 14 2. 特征构建相对于聚合特征构造依赖于多个特征的分组统计，通常依赖于对于特征本常见的转换方法有单调转换（幂变换、log变换、绝对值等）、线性组合、多项式组合、比例、排名编码和异或值等。转换特征构造 15 2. 特征构建 • 基于单价和销售量计算销售额. • 基于原价和售价计算利润. • 基于不同月份的销售额计算环比或同比销售额增长/下降率. • …… 转换特征构造此外，由于业务的需求，一些指标特征也需要基于业务理解进行特征构造。 16 3. 特征提取 01 中国各地区人口特征和房价波动的动态关系[J].统计研究,2019,36(01) 2. HOG特征方向梯度直方图(HOG)特征是 2005 年针对行人检测问题提出的直方图特征，它通过计算和统计图像局部区域的梯度方向直方图来实现特征描述。归一化处理计算图像梯度统计梯度方向特征向量归一化生成特征向量步骤图像特征提取 3. 特征提取 22 许永洪,吴林颖.中国各地区人口特征和房价波动的动态关系[J]

0 码力 | 38 页 | 1.28 MB | 1 年前
3
机器学习课程-温州大学-01机器学习-引言

机器学习与人工智能、深度学习的关系人工智能：机器展现的人类智能机器学习：计算机利用已有的数据(经验)，得出了某种模型，并利用此模型预测未来的一种方法。深度学习：实现机器学习的一种技术人工智能机器学习深度学习 5 杨立昆（Yann LeCun）杰弗里·欣顿（Geoffrey Hinton）本吉奥（ Bengio ）共同获得了2018年计算机科学的最高奖项 ——ACM图灵奖。机器学习界的执牛耳者现任字节跳动科技有限公司人工智能实验室总监，北京大学、南京大学客座教授，IEEE 会士，ACM 杰出科学家，CCF 高级会员。代表作：《统计学习方法》机器学习界的国内泰斗周志华，南京大学计算机科学与技术系主任、人工智能学院院长。代表作：《机器学习》（西瓜书） 7 陈天奇,陈天奇是机器学习领域著名的青年华人学者之一，本科毕业于上海交通大学ACM班，博士毕业于华盛顿大学计算机系。市值/估值/融资额 1 Microsoft（微软）计算机视觉技术、自然语言处理技术等办公美国 1975年上市市值1.21万亿美元 2 Google（谷歌）计算机视觉技术、自然语言处理技术等综合美国 1998年上市市值9324亿美元 3 Facebook（脸书）人脸识别、深度学习等社交美国 2004年上市市值5934亿美元 4 百度计算机视觉技术、自然语言处理技术、知识图谱等

0 码力 | 78 页 | 3.69 MB | 1 年前
3
动手学深度学习 v2.0

. . . . . . . . . . . . . . . . 71 2.5.3 分离计算 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 2.5.4 Python控制流的梯度计算 . . . . . . . . . . . . . . . . . . . . . . . 前向传播、反向传播和计算图 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162 4.7.1 前向传播 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 4.7.2 前向传播计算图 . . . 10.8 提交Kaggle预测 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188 5 深度学习计算 191 5.1 层和块 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

0 码力 | 797 页 | 29.45 MB | 1 年前
3
搜狗深度学习技术在广告推荐领域的应用

Representation based Framework for Question Answering. CIKM2016, pages 1869-1872, 2016. Sogou Inc 文本相关性计算文本相关性计算深度学习在搜狗搜索广告的一些应用 LSTM LSTM LSTM 中长款牛仔外套 ResNet-50层 CNN-LSTM Encoder CNN CNN 中长款牛仔外套 Cosine-Loss 容易设计；刻画细致；特征稀疏；特征量巨大；模型复杂度受限连续特征连续特征需要仔细设计；定长；特征稠密特征量相对较小，可以使用多种模型训练模型类别模型类别线性  简单、处理特征量大、稳定性好  需借助交叉特征  Logistic Regression 非线性  能够学习特征间非线性关系  模型复杂、计算耗时  DNN、GBDT 模型融合模型融合的工程实现 • 可支持多个不同模型的加载和计算 • 可支持模型之间的交叉和CTR的bagging • 可通过配置项随时调整模型融合方案 • 避免不必要的重复操作，减少时间复杂度目标 • 模型本身也看做一个抽象特征 • 模型特征依赖于其它特征，通过计算得到新的特征 • 模型特征输出可作为CTR，也可作为特征为其它模型使用 • 限定ModelFeature的计算顺序，即可实现bagging/模型交叉等功能

0 码力 | 22 页 | 1.60 MB | 1 年前
3
机器学习课程-温州大学-02机器学习-回归

Function)度量全部样本集的平均误差。常用的代价函数包括均方误差、均方根误差、平均绝对误差等。目标函数(Object Function)代价函数和正则化函数，最终要优化的函数。备注：损失函数的系数1/2是为了便于计算，使对平方项求导后的常数系数为1，这样在形式上稍微简单一些。有些教科书把系数设为1/2，有些设置为1，这些都不影响结果。损失函数采用平方和损失： ?(?(?)) = 1 2 (ℎ(?(?)) Descent,BGD）梯度下降的每一步中，都用到了所有的训练样本随机梯度下降（Stochastic Gradient Descent,SGD）梯度下降的每一步中，用到一个样本，在每一次计算之后便更新参数，而不需要首先将所有的训练集求和小批量梯度下降（Mini-Batch Gradient Descent,MBGD）梯度下降的每一步中，用到了一定批量的训练样本 14 梯度下降的三种形式梯度下降的每一步中，用到一个样本，在每一次计算之后便更新参数，而不需要首先将所有的训练集求和参数更新 ??: = ?? − ? ℎ ?(?) − ?(?) ??(?) (同步更新?? ，(j=0,1,...,n )) 17 梯度下降的三种形式小批量梯度下降（Mini-Batch Gradient Descent）梯度下降的每一步中，用到了一定批量的训练样本每计算常数?次训练实例，便更新一次参数

0 码力 | 33 页 | 1.50 MB | 1 年前
3
机器学习课程-温州大学-08机器学习-集成学习

回归树问题的提升算法：输入：训练数据集? = ?1, ?1 , ?2, ?2 , … , ??, ?? 输出：提升树??(?) 1 初始化?0 ? = 0 2 对? = 1,2, … ? (?)计算残差 ??? = ?? − ??−1 ?? , ? = 1,2, … , ? ? 拟合残差???学习一个回归树，得到?(?: ??) ? 更新??(?) = ??−1 ? + ? ?: ?? 3 =1 ? ?(??, ?) 2 对? = 1,2, … ? ? 对? = 1,2 … ?计算 ??? = − ??(??, ?(??)) ??(??) ? ? =??−1(?) ? 拟合???学习一个回归树，得到? ?: ?? ? 更新?? ? = ??−1 ? + ??? ?: ?? ? 计算步长, ?? = ??? min ? ෍ ?=1 L(??, ??−1 ?? + ?? 分裂前左、右子树的分数：不分割可以拿到的分数加入新叶子节点引入的复杂度代价 34 3.XGBoost 使用贪心方法，选增益（ ???? ）最大的分裂方式贪心方法，众多????中找到最大值做为最优分割节点（split point），因此模型会将所有样本按照（一阶梯度）从小到大排序，通过遍历，查看每个节点是否需要分割，计算复杂度是：决策树叶子节点数 – 1。 XGBoost的分裂方式

0 码力 | 50 页 | 2.03 MB | 1 年前
3
机器学习课程-温州大学-07机器学习-决策树

，自顶向下来构建决策树。 ⚫ 贪心算法：在每一步选择中都采取在当前状态下最好/优的选择。 ⚫ 在决策树的生成过程中，分割方法即属性选择的度量是关键。 6 1.决策树原理优点： ⚫ 推理过程容易理解，计算简单，可解释性强。 ⚫ 比较适合处理有缺失属性的样本。 ⚫ 可自动忽略目标变量没有贡献的属性变量，也为判断属性变量的重要性，减少变量的数目提供参考。缺点： ⚫ 容易造成过拟合，需要采用剪枝操作。 ID3 算法是以信息论为基础，以信息增益为衡量标准，从而实现对数据的归纳分类。 ⚫ ID3 算法计算每个属性的信息增益，并选取具有最高增益的属性作为给定的测试属性。 ID3 算法 10 2.ID3算法 ID3 算法其大致步骤为： 1. 初始化特征集合和数据集合； 2. 计算数据集合信息熵和所有特征的条件熵，选择信息增益最大的特征作为当前决策节点； 3. 更新数据集合和 1, ?2 , ?3,……, ??−1, ?? 从小到大排列，取相邻两样本值的平均数做划分点，一共取? − 1个，其中第?个划分点?? 表示为： ?? = ??−1+?? 2 。分别计算以这? − 1个点作为二元分类点时的基尼系数。选择基尼指数最小的点为该连续特征的二元离散分类点。比如取到的基尼指数最小的点为??，则小于??的值为类别1，大于??的值为类别2，这样

0 码力 | 39 页 | 1.84 MB | 1 年前
3
经典算法与人工智能在外卖物流调度中的应用

算法，求得最优路线 1 8 时间预估用户下单开始配送骑士到店骑士取餐到达用户完成交付商户接单商户出餐到店时间出餐时间送餐时间交付时间等餐时间 2 到达识别，交付时间计算数据积累，异常数据剔除网格建立，分时段统计交付时间预估取餐/送餐分别回归拟合骑士速度预估 9 时间预估 — 出餐时间预估 10 数据 & 特征工程 • 特征 = 基础特征的出餐时间训练数据，DNN 更好地学习自身有用的特征 - DNN对特征工程要求较低，自身可以学习有用的特征，PCA降维影响较小，但时间复杂度较高 • XGBoost模型 - 采用近似求解算法，找出可能的分裂点，避免选用贪心算法的过高时间复杂度 - 计算采用不同分裂点时，叶子打分函数的增益；并选择增益最高的分裂点，作为新迭代树的最终分裂节点，构造新的迭代树 - 通过调节迭代树数目、学基于现有状况、订单增速、消化速度、天气、当前手段等多维特征，使用XGBoost模型回归预测未来五分钟进单的平均配送时长 • 分商圈、分时段、多模型的精细化预估 • 分布式、多线程、并行计算最佳分割点，满足海量数据的实时性要求 • 在供需失衡之前，即实施调控手段 5 供需平衡 14 5.2 单量调控模型 • 通过价格平衡未来的进单量和系统可承载的单量 • 基于GBRT对未来进入单量的

0 码力 | 28 页 | 6.86 MB | 1 年前
3

共 64 条前往

页

分类

语言

格式