机器学习课程-温州大学-12机器学习-关联规则2021年06月 机器学习-第十一章 关联规则 黄海广 副教授 2 本章目录 01 关联规则概述 02 Apriori 算法 03 FP-Growth算法 3 1.关联规则概述 01 关联规则概述 02 Apriori 算法 03 FP-Growth算法 4 1.关联规则概述 关联规则 关联规则(Association Rules)反映一个事物与其他事物之间的相互依存 一个事物就能够通过其他事物预测到。 关联规则可以看作是一种IF-THEN关系。假设 商品A被客户购买,那么在相同的交易ID下, 商品B也被客户挑选的机会就被发现了。 5 1.关联规则概述 有没有发生过这样的事:你出去买东西, 结果却买了比你计划的多得多的东西?这 是一种被称为冲动购买的现象,大型零售 商利用机器学习和Apriori算法,让我们倾 向于购买更多的商品。 6 1.关联规则概述 购物车分析是大型超市用来揭示商品之间关联的关 的 顾客,向他们提供报价,以便他们购买第三种商品,比如鸡蛋。 因此,如果顾客买了面包和黄油,看到鸡蛋有折扣或优惠,他们就会倾向于 多花些钱买鸡蛋。这就是购物车分析的意义所在。 7 1.关联规则概述 置信度: 表示你购买了A商品后,你还会有 多大的概率购买B商品。 支持度: 指某个商品组合出现的次数与总次 数之间的比例,支持度越高表示该组合出现 的几率越大。 提升度: 提升度代表商品A的出现,对商品0 码力 | 49 页 | 1.41 MB | 1 年前3
超大规模深度学习在美团的应用-余建平模型可变计算路径 运行阶段 计算图裁剪 模型训练框架 • 应用场景——离线预计算 模型召回,ANN检索 粗排模型,降低线上计算量 • 分布式Sharding 模型分片存储,支持超大规模模型 数据并行计算,加速Optimizer计算 • 低频特征过滤 Counting Bloom Filter 概率方式 • 模型数据通路 Base + Delta方式 • Ps分布式分片的均衡,避免分片大小不一致 NN网络矩阵按行切分,解决请求包不均衡问题 特征按照Hash方式分布式存储 • 模型并行调超参 grid search random search PS的多模型训练 • 提高内存使用效率 model group内共享特征key的存储 • 超大规模模型 -> 高扇出的分布式PS • 长尾效应:单个分片的抖动(网络、CPU)对请求影响变大 长尾效应:单个分片的抖动(网络、CPU)对请求影响变大 单分片4个9的可用性 16分片整体可用性:99.99% ^ 16 = 99.84% 64分片整体可用性:99.99% ^ 64 = 99.36% 128分片整体可用性:99.99% ^ 128 = 98.72% • Backup Request Jeff Dean在解决BigTable高扇出时提出的方案 PS的长尾效应 Backup Request0 码力 | 41 页 | 5.96 MB | 1 年前3
AI大模型千问 qwen 中文文档tokenizer.save_pretrained(quant_path) 很遗憾,save_quantized 方法不支持模型分片。若要实现模型分片,您需要先加载模型,然后使用来自 transformers 库的 save_pretrained 方法来保存并分片模型。除此之外,一切操作都非常简单。祝您 使用愉快! 1.9 GGUF 最近,在社区中本地运行 LLM 变得越来越流行,其中使用0 码力 | 56 页 | 835.78 KB | 1 年前3
微博在线机器学习和深度学习实践-黄波线训练周期模型融合 • 模型结构训练与推理兼容:在线PS与离线PS模型结构兼容,自动模型参数转换 • 稳定性优化 • 模型快照:基于ps-scheduler的周期模型版本探测与保存,模型稀疏化分片存储 • 冷备容灾:基于checkpoint机制(Local模式&Remote模式),实现参数服务的高可用,支持基于模型的异构集群迁移,支持集 群扩缩容 • 性能优化 • 通信优化:数据请求0 码力 | 36 页 | 16.69 MB | 1 年前3
pytorch 入门笔记-03- 神经网络数,完整的文档请查看 here。 剩下的最后一件事: ● 新网络的权重 更新权重 在实践中最简单的权重更新规则是随机梯度下降(SGD): weight = weight - learning_rate * gradient 我们可以使用简单的 Python 代码实现这个规则: learning_rate = 0.01 for f in net.parameters(): f.data data.sub_(f.grad.data * learning_rate) 但是当使用神经网络是想要使用各种不同的更新规则时,比如 SGD、Nesterov-SGD、Adam、RMS ROP 等,PyTorch 中构建了一个包 torch.optim 实现了所有的这些规则。 使用它们非常简单: import torch.optim as optim # 创建优化器 optimizer =0 码力 | 7 页 | 370.53 KB | 1 年前3
【PyTorch深度学习-龙龙老师】-测试版202112人类可以将提前设计好的交互逻辑交给 机器重复且快速地执行,从而将人类从简单枯燥的重复劳动工作中解脱出来。但是对于需 要较高智能水平的任务,如人脸识别、聊天机器人、自动驾驶等任务,很难设计明确的逻 辑规则,传统的编程方式显得力不从心,而人工智能(Artificial Intelligence,简称 AI)是有 望解决此问题的关键技术。 随着深度学习算法的崛起,人工智能在部分任务上取得了类人甚至超人的智力水平, 的探索足迹。早期,人们试图通过总 结、归纳出一些逻辑规则,并将逻辑规则以计算机程序的方式实现,来开发出智能系统。 但是这种显式的规则往往过于简单,并且很难表达复杂、抽象的概念和规则。这一阶段被 称为推理期。 1970 年代,科学家们尝试通过知识库加推理的方式解决人工智能,通过构建庞大复杂 的专家系统来模拟人类专家的智能水平。这些明确指定规则的方式存在一个最大的难题, 就是很多复杂、抽象的概念 就是很多复杂、抽象的概念无法用具体的代码实现。比如人类对图片的识别、对语言的理 解过程,根本无法通过既定规则模拟实现。为了解决这类问题,一门通过让机器自动从数 据中学习规则的研究学科诞生了,称为机器学习,并在 1980 年代成为人工智能中的热门学 预览版202112 第 1 章 人工智能绪论 2 科。 在机器学习中,有一个通过神经网络来学习复杂、抽象逻辑的研究方向,称为神经网 络。神经网络方向的研究经历了两起两落。从0 码力 | 439 页 | 29.91 MB | 1 年前3
机器学习课程-温州大学-11深度学习-序列模型000的话,那么这里的每个向量都是10,000维的。 6 循环神经网络解决的问题 卷积神经网络或全连接网络的局限性 同一层节点之间无关联,从而导致获取时序规则方面功 能不足 循环神经网络可以解决时序问题 基于语言模型(LM),故可以捕捉时序规则信息 它是如何实现的? 7 03 长短期记忆(LSTM) 04 双向循环神经网络 2.循环神经网络(RNN) 010 码力 | 29 页 | 1.68 MB | 1 年前3
Qcon北京2018-《深度学习在视频搜索领域的实践》-刘尚堃pdf第一季a唐唐神吐槽:最作死的女神 184 3 3 % 语k h国达r秀震惊全场 h国好声音李安1+岁参加澳洲达r秀时震惊全场的表演 % % 3 长短距离依赖 潜规则女秘n 职场大尺度虐恋激情电影《错爱,爱错》(性感女秘n欲望潜规则男c司_ 1 1 % 长短距离依赖 日本广岛原子弹爆炸 100810C廣島C原子彈爆炸後的日子C寰宇地理C13TB 3 3 % 语k模型——举例 �������������0 码力 | 24 页 | 9.60 MB | 1 年前3
机器学习课程-温州大学-10机器学习-聚类签?,无 监督学习主要分为聚类、降维、关联规则、推荐系统等方面。 监督学习和无监督学习的区别 5 1.无监督学习方法概述 ✓ 聚类(Clustering) ✓ 如何将教室里的学生按爱好、身高划分为5类? ✓ 降维( Dimensionality Reduction ) ✓ 如何将将原高维空间中的数据点映射到低维度的空间中? ✓ 关联规则( Association Rules) ✓0 码力 | 48 页 | 2.59 MB | 1 年前3
动手学深度学习 v2.0用户的动态;其中,这个应用程序的核心——“业务逻辑”,详细说明了应用程序在各种情况下进行的操作。 为了完善业务逻辑,开发人员必须细致地考虑应用程序所有可能遇到的边界情况,并为这些边界情况设计合 适的规则。当买家单击将商品添加到购物车时,应用程序会向购物车数据库表中添加一个条目,将该用户ID与 商品ID关联起来。虽然一次编写出完美应用程序的可能性微乎其微,但在大多数情况下,开发人员可以从上 述的 时间的推移, 对生物学的解释变得不再肤浅,但这个名字仍然存在。其核心是当今大多数网络中都可以找到的几个关键原 则: • 线性和非线性处理单元的交替,通常称为层(layers); • 使用链式规则(也称为反向传播(backpropagation))一次性调整网络中的全部参数。 经过最初的快速发展,神经网络的研究从1995年左右开始停滞不前,直到2005年才稍有起色。这主要是因为 两个原因 手可及,但在 这个方向上已经取得了很好的进展,特斯拉(Tesla)、英伟达(NVIDIA)和Waymo等公司的产品至少 实现了部分自主。让完全自主如此具有挑战性的是,正确的驾驶需要感知、推理和将规则纳入系统的能 力。目前,深度学习主要应用于这些问题的计算机视觉方面。其余部分则由工程师进行大量调整。 同样,上面的列表仅仅触及了机器学习对实际应用的影响之处的皮毛。例如,机器人学、物流、计算生物学、0 码力 | 797 页 | 29.45 MB | 1 年前3
共 17 条
- 1
- 2













