阿里云上深度学习建模实践-程孟力PAI-Rec – 推荐引擎 BE召回/Hologres hot x2i vec 排序 粗排 精排 重排 MaxCompute Datahub 离线特征 样本构造 实时特征 Flink 训练数据 推荐日志 模型发布 在线流程 离线流程 智能推荐解决方案 > PAI-REC 推荐引擎 PAI-REC 推荐引擎 多路召回 曝光/状态过滤 粗排/精排 消息队列(datahub/kafka) PAI-REC平台 自动化降级 负载均衡 灰度发布 超时控制 平台支持 日志SLS 在线存储 Hologres/OTS BE Redis 读取数据 向量引擎 BE/Hologres/Faiss/Milvus 向量检索 冷启动召 回 冷启动排 序 Pipeline1 Pipeline2 标准化: Standard Solutions 标准化: /Alink/…) 计算引擎(MaxCompute / EMR / Flink) 基础硬件(CPU/GPU/FPGA/NPU) 阿里云容器服务(ACK) • 200+组件 • 数十个场景化模版 • 所见即所得 交互式建模(DSW) • JupyterLab、WebIDE • 多框架兼容 • 可视化+tensorboard • 图像、视频、文本、 语音标注 • 多场景模板:物体检 测、语音识别0 码力 | 40 页 | 8.51 MB | 1 年前3
Keras: 基于 Python 的深度学习库2.3 Keras 可以轻松将模型转化为产品 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2.4 Keras 支持多个后端引擎,并且不会将你锁定到一个生态系统中 . . . . . . . . . . 6 2.5 Keras 拥有强大的多 GPU 和分布式训练支持 . . . . . . . . . . . . . . 目录中,你会找到更多高级模型:基于记忆网络的问答系统、基于 栈式 LSTM 的文本生成等等。 KERAS: 基于 PYTHON 的深度学习库 3 1.4 安装指引 在安装 Keras 之前,请安装以下后端引擎之一:TensorFlow,Theano,或者 CNTK。我们 推荐 TensorFlow 后端。 • TensorFlow 安装指引。 • Theano 安装指引。 • CNTK 安装指引。 网页应用后端(比如 Flask app)中。 • 在 JVM,通过 SkyMind 提供的 DL4J 模型导入。 • 在 Raspberry Pi 树莓派上。 2.4 Keras 支持多个后端引擎,并且不会将你锁定到一个生态系统中 你的 Keras 模型可以基于不同的深度学习后端开发。重要的是,任何仅利用内置层构建的 Keras 模型,都可以在所有这些后端中移植:用一种后端训练模型,再将它载入另一种后端中(比0 码力 | 257 页 | 1.19 MB | 1 年前3
机器学习课程-温州大学-01机器学习-引言人脸识别、深度学习等 社交 美国 2004年 上市 市值5934亿美元 4 百度 计算机视觉技术、自然语言处理技 术 、知识图谱等 综合 中国 2001年 上市 市值438亿美元 5 大疆创新 图像识别技术、智能引擎技术等 无人机 中国 2006年 战略融资 估值210亿美元 6 商汤科技 计算机视觉技术、深度学习 安防 中国 2014年 D轮融资 估值70亿美元 7 旷视科技 计算机视觉技术等 安防 中国 ree 53 ⚫Pycharm https://www.jetbrains.com/pycharm/ Pycharm 提供 免费的社区版 与 付费的专业版。专业版额外增加了一些功能, 如项目模板、远程开发、数据库支持等。个人学习 Python 使用免费的社区版 已足够。 如果有edu邮箱,那么推荐使用专业版,edu邮箱是可以免费使用专业版的。 安装过程照着提示一步步操作就可以了。 注意:安装路径尽量不使用带有0 码力 | 78 页 | 3.69 MB | 1 年前3
机器学习课程-温州大学-01深度学习-引言人脸识别、深度学习等 社交 美国 2004年 上市 市值5934亿美元 4 百度 计算机视觉技术、自然语言处理技 术 、知识图谱等 综合 中国 2001年 上市 市值438亿美元 5 大疆创新 图像识别技术、智能引擎技术等 无人机 中国 2006年 战略融资 估值210亿美元 6 商汤科技 计算机视觉技术、深度学习 安防 中国 2014年 D轮融资 估值70亿美元 7 旷视科技 计算机视觉技术等 安防 中国 ree 54 ⚫Pycharm https://www.jetbrains.com/pycharm/ Pycharm 提供 免费的社区版 与 付费的专业版。专业版额外增加了一些功能, 如项目模板、远程开发、数据库支持等。个人学习 Python 使用免费的社区版 已足够。 如果有edu邮箱,那么推荐使用专业版,edu邮箱是可以免费使用专业版的。 安装过程照着提示一步步操作就可以了。 注意:安装路径尽量不使用带有0 码力 | 80 页 | 5.38 MB | 1 年前3
动手学深度学习 v2.0流程,所以我 们不得不自行组装。我们在 16.5节 中详细描述了我们的方法。我们选择GitHub来共享源代码并允许编辑,选 择Jupyter记事本来混合代码、公式和文本,选择Sphinx作为渲染引擎来生成多个输出,并为论坛提供讨论。 虽然我们的体系尚不完善,但这些选择在相互冲突的问题之间提供了一个很好的妥协。我们相信,这可能是 第一本使用这种集成工作流程出版的书。 1 http://distill 零编写的。比如,现在开发人员要编写一个程序 来管理网上商城。经过思考,开发人员可能提出如下一个解决方案:首先,用户通过Web浏览器(或移动应 用程序)与应用程序进行交互;紧接着,应用程序与数据库引擎进行交互,以保存交易历史记录并跟踪每个 用户的动态;其中,这个应用程序的核心——“业务逻辑”,详细说明了应用程序在各种情况下进行的操作。 为了完善业务逻辑,开发人员必须细致地考虑应用程序所有可能遇到的边界情况,并为这些边界情况设计合 每个元素分配相应的相关性分数,然后检索评级最高的元素。 PageRank15,谷歌搜索引擎背后最初的秘密武器就是这种评分系统的早期例子,但它的奇特之处在于它不依 赖于实际的查询。在这里,他们依靠一个简单的相关性过滤来识别一组相关条目,然后根据PageRank对包含 查询条件的结果进行排序。如今,搜索引擎使用机器学习和用户行为模型来获取网页相关性得分,很多学术 会议也致力于这一主题。 推荐系统0 码力 | 797 页 | 29.45 MB | 1 年前3
AI大模型千问 qwen 中文文档add_generation_prompt 参数用于在输入中添加生成提示,该提示指向 <|im_start|>assistant\n 。尤其需要注意的是,我们 遵循先前实践,对 chat 模型应用 ChatML 模板。而 max_new_tokens 参数则用于设置响应的最大长度。此 外,通过 tokenizer.batch_decode() 函数对响应进行解码。关于输入部分,上述的 messages 是一个 �→safetensors=True) 接下来,您需要准备数据以进行校准。您需要做的就是将样本放入一个列表中,其中每个样本都是一段文 本。由于我们直接使用微调数据来进行校准,所以我们首先使用 ChatML 模板对其进行格式化。例如: data = [] for msg in messages: msg = c['messages'] text = tokenizer.apply_chat_template(msg for i in range(4)} ) 接下来,你需要准备数据进行校准。你需要做的是将样本放入一个列表中,其中每个样本都是一段文本。由 于我们直接使用微调数据进行校准,所以我们首先使用 ChatML 模板对它进行格式化处理。例如: import torch data = [] for msg in messages: text = tokenizer.apply_chat_template(msg0 码力 | 56 页 | 835.78 KB | 1 年前3
超大规模深度学习在美团的应用-余建平提供系统的平台化工具,为用户提供易用的界面操作; MLX模型能力 MLX平台架构 MLX平台架构 • 基于Worker + PS架构搭建 • Worker 模型计算引擎(Engine) 计算图框架(Graph) • 模型计算引擎Engine 模型结构处理 与PS通信交换模型参数 计算图的计算 • 计算图框架Graph 计算逻辑抽象op,通过op组合形成模型结构 定义了流式数据的时钟,不可逆性 Smooth low watermark:异常数据时间跳变 流式拼接 • Checkpoint解决不重不丢问题 外存解决大数据量性能问题 在引擎中流转log key,特征数据在外存 • 分业务场景支持 轻量级predictor:仅支持模型的计算,特征由业务传入,无状态设计 自定义predictor: 提供业务抽象,支持业务自定义逻辑,插件化实现 逻辑阶段抽象,业务根据自身需求选择性实现 数据获取: 根据业务的自身逻辑获取特征原始数据 特征抽取: 将特征数据进行转换,转换成模型所需的格式,比如离散化 模型计算: 传入转换后的特征数据,调用模型计算引擎 在线预估服务 • 特征编码方式 通过明文hash的方式编码 适用于特征的动态增长 不需要预分配,提高处理效率 • 框架与实现分离 提供op形式的特征抽取类 逻辑一致性:在线、近线、离线0 码力 | 41 页 | 5.96 MB | 1 年前3
深度学习在电子商务中的应用目前商品搜索中的一些问题 7 人工智能/深度学习在搜索中的应用:网页/电商搜索 • 基于深度学习的(Query, Document)分数是Google搜索引擎中第3重要的排序信 号 • 亚马逊(Amazon/A9)电子商务搜索引擎中, 深度学习还在实验阶段, 尚未进入生产线。 8 • 搜索数值矢量化 传统搜索基于文字匹配, 商品包含搜索词或者不包含搜索词 利用深度学习技术, 将搜索词和商品全部数值矢量化, 用户点击日志 用户购物车 日志 用户购买日志 Word2vec模型 计算距离最近 的矢量 产品类别过滤 产品频率过滤 矢量转换回商 品 14 原型评测结果 矢量化搜索引擎与易购传统引擎搜索效果对比 (2016-07-25测试结果) 15 • 该技术不仅召回与搜索词完全匹配的结果,还可召回与搜索词文本不匹配、但含义近似的结果。 效果示例 如:经测评,当搜索词为“松下筒灯”,0 码力 | 27 页 | 1.98 MB | 1 年前3
微博在线机器学习和深度学习实践-黄波• 加快计算速度: batching/TensorRT/MPS/SSE/AVX/Neon • operator fusion • 针对特定场景重写耗时算子 • 重构tensorflow计算引擎 • batching • 批量调度请求到GPU,增大并发和吞吐量 4 深度学习-分布式模型推理 • 深度特征效果对比 • 文本Embedding特征,相比于文本标签,相关指标提升约3+% 算法/模型(WeiFlow) 模型训练/评估 样本库 模型库 模型服务/推荐引擎 数据/特征(WeiData) 数据/特征生成 数据/特征存储 数据/特征服务 2 平台架构 用户 微博 曝光/阅读 点击/互动 Feed流排序 数据样本 正样本:曝光有互动 负样本:曝光无互动 样本数据 推荐引擎 业务引擎 用户特征 女性,19-22岁,北京 爱好娱乐,明星,高 活跃……0 码力 | 36 页 | 16.69 MB | 1 年前3
亚马逊AWSAI Services Overviewfor Autonomous Driving Clarifai • Computer Vision APIs AWS 上的 AI 应用 • Pinterest Lens • Netflix 推荐引擎 数千名员工致力于人工智能领域 发现& 搜索 执行 &物流 现有产品的增强 定义新的产品分类 将机器学习拓 展更广领域 Amazon 的人工智能应用 在Amazon 最初的人 工智能应用 (1995) 可以帮助客户把人工智能应用于每个应 用程序的核心&业务之中吗? Amazon AI 构建于深度学习之上的智能服务 Amazon AI: 新的深度学习服务 生活化的语音服务 Polly Lex 对话引擎 Rekognition 图像分析 深度学习框架 MXNet, TensorFlow, Theano, Caffe, Torch 为客户模型定制的 深度学习框架 人工智能 的托管的 API服务 AI 服务 • 充分利用了 Amazon 内部在 AI / Ml领域的经验 • 全托管的API 服务,嵌入的AI服务提供了最大的 可访问性和简单性 • 完整的深度学习堆栈,包含了专业的平台、引擎 应用程序 Thank you! lianghong@amazon.com0 码力 | 56 页 | 4.97 MB | 1 年前3
共 17 条
- 1
- 2













