动手学深度学习 v2.08.5 循环神经网络的从零开始实现 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 317 8.5.1 独热编码 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 317 8.5.2 初始化模型参数 词嵌入(word2vec) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 650 14.1.1 为何独热向量是一个糟糕的选择 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 650 14.1.2 自监督的word2vec . . . . v)。具体计算方法是ci ← f(ui, vi),其中ci、ui和vi分别是向量c、u和v中的元素。在这里,我们 通过将标量函数升级为按元素向量运算来生成向量值 F : Rd, Rd → Rd。 对于任意具有相同形状的张量,常见的标准算术运算符(+、-、*、/和**)都可以被升级为按元素运算。我 们可以在同一形状的任意两个张量上调用按元素操作。在下面的例子中,我们使用逗号来表示一个具有5个 元素的0 码力 | 797 页 | 29.45 MB | 1 年前3
微博在线机器学习和深度学习实践-黄波• 参数规模 • 支持百亿特征维度,千亿参数 • 模型版本 • 多模型多版本:多组实验并行执行,提高实验迭代效率 • 在线版本切换:基于ZK的版本感知机制,动态进行版本切换,实现BASE模型的热更新,实时训练与离线训练周期模型融合 • 模型结构训练与推理兼容:在线PS与离线PS模型结构兼容,自动模型参数转换 • 稳定性优化 • 模型快照:基于ps-scheduler的周期模型版本探测与保存,模型稀疏化分片存储 排序损失:DeepFM+Pair-Wise Rank Loss 多目标 融合点击模型和 互动模型 单目标 LR、W&D、 FM和DeepFM 等模型排序 排序损失 针对信息流业务场景,从 点击损失升级到排序损 失,基础模型为 DeepFM,排序损失为 BPR 召 回 排 序 • 深度学习模型训练:WeiLearn 样本库 WeiLearn-深度学习模型训练 CTR样本 自然语言样本0 码力 | 36 页 | 16.69 MB | 1 年前3
谭国富:深度学习在图像审核的应用相似度:98% 政治人物 不在黑名单 检索结果:林志玲 相似度:99% 在版权库 SACC2017 图片场景识别 l 社交图像分类应用:微云,相册管家 Ø 标签体系:面向社交领域的热词标签200余种, 涵盖人物、风景、人造物、 建筑、动植物、食物等9个大类 。 Ø 技术指标:20个类别平均准确率MAP>90%以上,200种MAP>63%以上, 性能CPU上约200ms/张。 cephfs存储集 群 本地文件系统 数据 模型/日志 client 管理数据 提取模型、 查看日志 提交/管理任务 用户 docker.oa.co m 自动拉取镜像 Redis 冷数据 热任务/监控数据/集群信息 • 任务监控与自动重启 • 分布式多机训练,不可避免遇到由于硬件/网 络波动引起的异常 • 监控任务运行状况,当任务发生异常时,选 择不同的重启策略 • 集群管理与监控0 码力 | 32 页 | 5.17 MB | 1 年前3
【PyTorch深度学习-龙龙老师】-测试版202112合其它类型的神经网络的应用。Caffe 的主要开发语言是 C++,也提供 Python 语言等 接口,支持 GPU 和 CPU。由于开发时间较早,在业界的知名度较高,2017 年 Facebook 推出了 Caffe 的升级版本 Cafffe2,Caffe2 目前已经融入到 PyTorch 库中。 ❑ Torch 是一个非常优秀的科学计算库,基于较冷门的编程语言 Lua 开发。Torch 灵活性 较高,容易实现自定义网络层,这也是 的显卡设备,则可以安装 CPU 版本。CPU 版本无法利用 GPU 加 速运算,计算速度相对缓慢,但是作为学习用途所介绍的算法模型一般不大,使用 CPU 版 本也能勉强应付,待日后对深度学习有了一定了解再升级 NVIDIA GPU 设备也未尝不可。 亦或者,安装 PyTorch GPU 版本可能会出现安装失败的情况,很多读者朋友动手能力欠 缺,如果折腾了很久还不能搞定,可以选择直接安装 CPU 版本。 )。只考虑输入图片属于某一个类别的情况,此时输入图片的真实标签已经 唯一确定:如果样本属于第?类的话,那么索引为?的位置上设置为 1,其它位置设置为 0, 一般把这种编码方式叫作 One-hot 编码(独热编码)。以图 3.7 中的“猫狗鱼鸟”识别系统为 例,所有的样本只属于“猫狗鱼鸟”4 个类别中其一,假设将第1~4号索引位置分别表示 猫狗鱼鸟的类别,那么对于所有猫的图片,它的数字编码为 0,One-hot0 码力 | 439 页 | 29.91 MB | 1 年前3
经典算法与人工智能在外卖物流调度中的应用通过调节迭代树数目、学习倍率、迭代树最大深度、L2正则化参数等进一步避免过拟合 2 获取样本数据 过滤数据 抽取基础特征 组合基础特征,构造组合特征 组合基础特征,构造组合特征 统计基础信息,构造统计特征 独热编码,构造稀疏特征 降维 决策模型 11 • 骑士体验 取餐距离、订单数量、订单组数 • 用户体验 订单剩余时间、骑士完成时间、 订单准时性 • 配送效率 等餐时间、空驶距离、空闲骑士、0 码力 | 28 页 | 6.86 MB | 1 年前3
从推荐模型的基础特点看大规模推荐类深度学习系统的设计 袁镱中型特征 (⼗) � 2.2 hotkey现象,且训练与推理的 hotkey⾼度重合 百万级稠密 交叉参数 千亿级 稀疏输⼊ 层参数 单个样本命 中的key ⽐如:性别,年龄等取值少的特征; 热⻔⽂章的特征,活跃⽤户的特征 推荐系统 模型上线 在线推理 模型训练 ⽂章 新闻 视频 Item User Item特征 ⽤户反馈 Item推荐 Embedding参数 本⼩时访问过的key0 码力 | 22 页 | 6.76 MB | 1 年前3
QCon北京2018-《未来都市--智慧城市与基于深度学习的机器视觉》-陈宇恒• Kubernetes版本发布快,新特性更新频繁,对异构调度的支持不断加强;但配套设施落后(e.g. Spark on K8s, GitlabCI) • 容器系统调用栈深,需要仔细验证操作系统,内核及异构设备驱动的兼容性 • Kubernetes对NUMA、异构计算、存储设备的调度能力待加强 1.6 nvidia/gpu custom scheduler 1.8 local-volume0 码力 | 23 页 | 9.26 MB | 1 年前3
AI大模型千问 qwen 中文文档我们建议您在部署 Qwen 时尝试使用 vLLM 。它易于使用,且具有最先进的服务吞吐量、高效的注意力键值 内存管理(通过 PagedAttention 实现)、连续批处理输入请求、优化的 CUDA 内核等功能。要了解更多关于 vLLM 的信息,请参阅 论文 和 文档 。 1.10.1 安装 默认情况下,你可以通过 pip 来安装 vLLM :pip install vLLM>=0.3.0 ,但如果你正在使用0 码力 | 56 页 | 835.78 KB | 1 年前3
共 8 条
- 1













