机器学习课程-温州大学-07机器学习-决策树针 对每一个非叶子节点,评估用一个最佳叶子节点去代 替这课子树是否有益。如果剪枝后与剪枝前相比其错 误率是保持或者下降,则这棵子树就可以被替换掉。 C4.5 通过训练数据集上的错误分类数量来估算未知样 本上的错误率。 后剪枝决策树的欠拟合风险很小,泛化性能往往优于 预剪枝决策树。 25 C4.5的剪枝 后剪枝 后剪枝的决策树 剪枝方法 在已经生成的决策树上进行剪枝,从而得到简化版的 针 对每一个非叶子节点,评估用一个最佳叶子节点去代 替这课子树是否有益。如果剪枝后与剪枝前相比其错 误率是保持或者下降,则这棵子树就可以被替换掉。 C4.5 通过训练数据集上的错误分类数量来估算未知样 本上的错误率。 后剪枝决策树的欠拟合风险很小,泛化性能往往优于 预剪枝决策树。 平坦 色泽 好瓜 坏瓜 根蒂 脐部 坏瓜 坏瓜 好瓜 好瓜 好瓜 凹陷 硬挺 蜷曲0 码力 | 39 页 | 1.84 MB | 1 年前3
【PyTorch深度学习-龙龙老师】-测试版202112训练数据集与真实的手写数字图片的分布(Ground-truth Distribution)尽可能的逼近,这样在 训练数据集上面学到了模型才能够很好地用于未见过的手写数字图片的预测。 为了方便业界统一测试和评估算法,Yann LeCun 等人 (Lecun, Bottou, Bengio, & Haffner, 1998)发布了一个手写数字图片数据集,命名为 MNIST,它包含了 0~9 共 10 种数 的环境状态与奖励。但是考虑到真实环境的复杂性以及实验代价等因素,一般优先在虚拟 的软件环境中测试算法,再考虑迁移到真实环境中。 强化学习算法可以通过大量的虚拟游戏环境来测试,为了方便研究人员调试和评估算 法模型,OpenAI 开发了 Gym 游戏交互平台,用户通过 Python 语言,只需要少量代码即可 完成游戏的创建与交互,使用起来非常方便。 OpenAI Gym 环境包括了众多简单经典的控制小游戏,如平衡杆、过山车(图 MuJoco 物理环境模拟器(图 14.4)。在 Atari 游戏 环境中,有大家耳熟能详的小游戏,如太空侵略者、打砖块(图 14.3)、赛车等,这些游戏 规模虽小,但是对决策能力要求很高,非常适合评估算法的智能程度。 图 14.2 过山车 图 14.3 打砖块 图 14.4 行走机器人 目前在 Windows 平台安装 Gym 环境可能会遇到一些问题,因为0 码力 | 439 页 | 29.91 MB | 1 年前3
经典算法与人工智能在外卖物流调度中的应用0 云端分组派单模式 A 组 B 组 • 系统综合考虑各因素进行 订单分组,然后再指派给 合适的骑士 订单云端分组 整体最优分配 调度 系统 4.0 深度学习智能模式 • 出餐时间估算更准,缩短 骑士到店等待时间,节省 运力,提升用户等餐体验 出餐时间预估 深度学习智能 调度 系统 2.0 系统派单模式 • 系统综合考虑配送距离、 骑士运力、期望送达时间 等因素来自动派单0 码力 | 28 页 | 6.86 MB | 1 年前3
动手学深度学习 v2.0解决了一些回归问题。例如,你让人修理了排水 管,承包商花了3小时清除污水管道中的污物,然后他寄给你一张350美元的账单。而你的朋友雇了同一个承 包商2小时,他收到了250美元的账单。如果有人请你估算清理污物的费用,你可以假设承包商收取一些基本 费用,然后按小时收费。如果这些假设成立,那么给出这两个数据样本,你就已经可以确定承包商的定价结 构:50美元上门服务费,另外每小时100美元。在不经 元素的加权 和,这里通常允许包含观测值的一些噪声;其次,我们假设任何噪声都比较正常,如噪声遵循正态分布。 为了解释线性回归,我们举一个实际的例子:我们希望根据房屋的面积(平方英尺)和房龄(年)来估算房 屋价格(美元)。为了开发一个能预测房价的模型,我们需要收集一个真实的数据集。这个数据集包括了房 屋的销售价格、面积和房龄。在机器学习的术语中,该数据集称为训练数据集(training data 先,将训练好的模型用于预 测时,我们不再需要样本均值中的噪声以及在微批次上估计每个小批次产生的样本方差了。其次,例如,我 们可能需要使用我们的模型对逐个样本进行预测。一种常用的方法是通过移动平均估算整个训练数据集的样 本均值和方差,并在预测时使用它们得到确定的输出。可见,和暂退法一样,批量规范化层在训练模式和预 测模式下的计算结果也是不一样的。 7.5.3 从零实现 下面,我们从头开始实现一个具有张量的批量规范化层。0 码力 | 797 页 | 29.45 MB | 1 年前3
共 4 条
- 1













