召回率 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

如何利用深度学习提高高精地图生产的自动化率-邹亮

0 码力 | 34 页 | 56.04 MB | 1 年前
3
微博在线机器学习和深度学习实践-黄波

基础模型，对特征工程依赖较强 • FM：大规模稀疏数据下的特征组合问题 • DeepFM • 优化算法选择 • FTRL：调节学习率，突出低频特征，非batch优化 • Adagrad : 调节学习率，突出低频特征，实现简单 • SGD：参数少，效率高，固定学习率 • ID特征处理 • Hash：BKDRhash/CityHash，ID高维度稀疏+实时 3 在线机器学习-实时模型训练模型稳定性/… 一键打包端口探测蓝绿部署/灰度发布 AUC/准确率/ 召回率/… 流量切换版本更新全量发布 … verson1 verson2 … kubenetes/olsubmit 模型库 3 在线机器学习-模型服务部署 • 模型评估 • 模型上线部署前指标评估 • 周期使用验证样本进行点击率预估 • 待部署模型与线上模型进行指标对比，评估是否满足上线条件 • 深度学习物料粗排特征向量化基于Item2vec的博主召回和微博召回物料精排向量索引 DSSM/FM/FF M生成博主与物料向量，采用向量进行召回特征向量化：Item2vec 向量索引：FM/FFM/ DSSM 模型召回：DIN/DIEN/TDM 模型召回融入用户近期互动行为的深度模型召回单目标：LR->W&D->FM->DeepFM 多目标：点击FM+互动FM

0 码力 | 36 页 | 16.69 MB | 1 年前
3
机器学习课程-温州大学-05机器学习-机器学习实践

错误否定（False Negative,FN）：预测为假，实际为真混淆矩阵（confusion_matrix）评价指标准确率 Accuracy = TP + TN TP + TN + FP + FN 精确率 Precision = TP TP + FP 召回率 Recall = TP TP + FN F1 score F1 = 2 × Precision × Recall Precision 评价指标正确率（Accuracy）=(TP+ TN)/S TP+ TN =70，S= 100，则正确率为： Accuracy =70/100=0.7 精度（Precision）=TP/(TP+ FP) TP=40，TP+ FP=50。 Precision =40/50=0.8 召回率（Recall）=TP/(TP+ FN) TP=40，TP+FN =60。则召回率为： Recall 各种不同算法在输入的数据量达到一定级数后，都有相近的高准确度。于是诞生了机器学习界的名言：成功的机器学习应用不是拥有最好的算法，而是拥有最多的数据！数据决定一切数据大小准确率 22 欠拟合的处理 1.添加新特征当特征不足或者现有特征与样本标签的相关性不强时，模型容易出现欠拟合。通过挖掘组合特征等新的特征，往往能够取得更好的效果。 2.增加模型复杂度简单

0 码力 | 33 页 | 2.14 MB | 1 年前
3
谭国富：深度学习在图像审核的应用

等，方便平台进行违规处理和风险管控。业务痛点：面对越来越爆发的安全风险，解决办法门槛高，成本高；迫切需要技术解决方案 SACC2017 图像内容审核技术 OCR技术图像分割以及超分辨率技术优图图像技术还包括：图像分类、图像增强、艺术滤镜、图片去水印、图像融合、图像修补等。图像识别技术 01 腾讯优图图像技术能力 SACC2017 内容审核 - 图片鉴黄解决方案区分图像中的色情、性感和正常内容分析给出其属于武装份子、管制刀具、枪支弹药、人群聚集、火灾、血腥、极端主义或恐怖主义标识的概率，通过其概率最大的类型，判断其图片性质属于属于暴恐还是正常。 Ø 高准确率：在内部业务上测试，准确率97%，覆盖80%以上的案例 Ø 腾讯云，承担每天数亿的图像审核，已经累计支持上百家客户。 Ø 微云，QQ群，支持视频识别的解决方案，成熟灵活的产品方案，帮助业务扫除掉互图片场景识别 l 社交图像分类应用：微云，相册管家 Ø 标签体系：面向社交领域的热词标签200余种，涵盖人物、风景、人造物、建筑、动植物、食物等9个大类。 Ø 技术指标：20个类别平均准确率MAP>90%以上，200种MAP>63%以上，性能CPU上约200ms/张。微云相册，相册管家识别标签效果 Ø 微云，相册管家新版本推出智能全自动图片分类，通过上百种常用图片标签，实现对所有照片的自动识别分类。

0 码力 | 32 页 | 5.17 MB | 1 年前
3
深度学习在电子商务中的应用

词语的矢量化模型已经有开源实现方案  句子和文档的矢量化还在摸索阶段，尚不成熟  已经有一些在词语相似度，舆情分析等方面的应用矢量化搜索模型 9 词语矢量化模型 CBOW: 通过上下文词语来预测词语本身出现的概率 Skip-gram: 通过词语本身来预测上下文词语出现的概率 10 基于词语聚类的矢量化模型 • Word2vec等工具可以有效地将词语转化为向量 • 将句子／段落／文章有效转化为向量则有很大的挑战。的矢量产品类别过滤产品频率过滤矢量转换回商品 14 原型评测结果矢量化搜索引擎与易购传统引擎搜索效果对比（2016-07-25测试结果） 15 • 该技术不仅召回与搜索词完全匹配的结果，还可召回与搜索词文本不匹配、但含义近似的结果。效果示例如：经测评，当搜索词为“松下筒灯”，易购网站返回6个相关结果，美研方案返回64个相关结果现有方案原型系统 16 • 首先进行词语的矢量化请问有什么可以帮您的吗] 26 聊天机器人评测结果 • 从实际客户回话中抽样选取约1700个问题 • 问题覆盖不同的应用场景 • 经过4个版本迭代后，机器人问题回答的准确率和覆盖率均达到业界领先水平 27 Questions and Answers

0 码力 | 27 页 | 1.98 MB | 1 年前
3
搜狗深度学习技术在广告推荐领域的应用

CONTENTS 01 搜索广告背景知识 02 深度学习在搜狗搜索广告的一些应用 03 基于多模型融合的CTR预估 04 若干思考搜索广告背景知识信息需求用户查询查询理解广告召回点击率预估排序计价结果展示点击及后续行为广告库日志收集展示日志点击日志深度学习在搜狗搜索广告的一些应用无需分词：基于字符粒度表达的问答系统设计 L.X Meng, Y.Li Encoder CNN CNN 中长款牛仔外套 Cosine-Loss 广告物料推荐深度学习在搜狗搜索广告的一些应用方向用途相关技术图像理解图片物料推荐 CNN 文本相关性广告召回、创意生成 Word2Vec、CSR、LSTM CTR预估广告排序、特征挖掘 DNN、MxNet、TensorFlow 基于多模型融合的CTR预估 CTR预估流程原始数据领域特征模型训练 CTR Table DNN Model Feature LR Model Feature 特征池模型效果评估 AUC 上线收益是否一致？ Survival Bias 特征覆盖率并行化训练并行化训练诉求  加大数据量，提升模型稳定性  加大数据量，提升模型收益方案  MxNet支持多机多卡, 使用成本低  构建多机多卡 GPU集群，优化

0 码力 | 22 页 | 1.60 MB | 1 年前
3
阿里云上深度学习建模实践-程孟力

要求:  准确: 低噪声  全面: 同分布模型选型:  容量大  计算量小训练推理:  高qps, 低rt  支持超大模型  性价比流程长、环节多:  推荐场景: 召回 + 粗排 + 精排 + 多样性/冷启动  实人认证: 卡证识别 + 人脸检测 + 活体检测 + 人脸识别 … 模型构建: 问题: ✗ 方案复杂周期长/见效慢 ✗ 细节多难免踩坑 PAI-Rec – 推荐引擎 BE召回/Hologres hot x2i vec 排序粗排精排重排 MaxCompute Datahub 离线特征样本构造实时特征 Flink 训练数据推荐日志模型发布在线流程离线流程智能推荐解决方案 > PAI-REC 推荐引擎 PAI-REC 推荐引擎多路召回曝光/状态过滤粗排/精排策略[类目打散、流量控制、…] 标注速度慢 ✗ 标注成本高 ✗ 样本分布不均匀 ✗ 隐私保护 • 多个环节 • 多种模型 ✗ 海量参数 ✗ 海量数据深度学习应用主要的挑战： 2.模型效果优化困难 1.方案复杂  学习率: 1e-3, 1e-4, 1e-5 ?  Embedding维度: 8, 16, 32 ?  Normalization: bn, gn, ln?  激活函数: relu, leaky_relu

0 码力 | 40 页 | 8.51 MB | 1 年前
3
Qcon北京2018-《深度学习在视频搜索领域的实践》-刘尚堃pdf

%、深度学m在视频内容理解h的应用——召回 3、深度学m在语k搜索h的应用——语k表征 4、深度学m在排序h的应用——g性化表征视频搜索的挑战 1��/��——�� 2��/��——�� 3��——�� 1�� 2��/�� 3�� 内容理解——基q视频内容的召回 �� 目的a输入v意视频，通过内容理解的方法对视频进行类目和标签预测 • 方法a采用1::+8ST9的UHSuHPFH-VQ- UHSuHPFH RTHGLFVLQP的方法 • 效果a • 基类目平均准确率.8(% �� pu/行i检测技术 • 目的a给定e定长视频，定x感兴趣行i发生的时间段并给出对应行i类标 • 方法a采取1QPvQNuVLQP 32+5DVHG >HFuTTHPV

0 码力 | 24 页 | 9.60 MB | 1 年前
3
《TensorFlow 2项目进阶实战》4-商品检测篇：使用RetinaNet瞄准你的货架商品

(IoU) Bounding Box Ground Truth ??? = ???????????? ????? = Bounding Box Ground Truth 目标检测评估：准确率与召回率（以GT为中心）目标检测评估：mean Average Precision（mAP）基础：深度学习在目标检测的应用目标检测近20年发展 Ref: Zou, Z., Shi, Z., Guo 正负样本不平衡 RetinaNet 提出了什么好想法？ RetinaNet 提出了什么好想法？ Focal Loss 解决类不平衡问题 Focal Loss 最终形式 RetinaNet 准确率与性能对比 RetinaNet 网络结构 RetinaNet 与同期SOTA检测器对比 YOLOv3 申请出战！ YOLOv3：小目标识别大提升 YOLOv3：工业级高性能目标检测器再谈检测器上生产的利弊权衡 bbox的编码方式，是预测offset还是相对位置？ • 数据预处理的数据增强方法； • 定位误差函数的实现方法； • 不同AI框架； • 训练时候的不同设置参数，如batch_size, 输入图片大小，学习率，学习衰减率等因素；应用：检测数据准备与标注检测数据标注工具-labelImg https://github.com/tzutalin/labelImg pip 安装 labelImg $ pip3

0 码力 | 67 页 | 21.59 MB | 1 年前
3
《TensorFlow 快速入门与实战》4-实战TensorFlow房价预测

看数据集分布情况。在模型设计过程中，用户往往需要分析和检查数据流图是否正确实现。在模型训练过程中，用户也常常需要关注模型参数和超参数变化趋势。在模型测试过程中，用户也往往需要查看准确率和召回率等评估指标。因此，TensorFlow 项目组开发了机器学习可视化工具 TensorBoard ，它通过展示直观的图形，能够有效地辅助机器学习程序的开发者和使用者理解算法模型及其工作流程，提升模型开发工作效率。

0 码力 | 46 页 | 5.71 MB | 1 年前
3

共 114 条前往

页

分类

语言

格式

如何利用深度学习提高高精地图生产的自动化率-邹亮

微博在线机器学习和深度学习实践-黄波

机器学习课程-温州大学-05机器学习-机器学习实践

谭国富：深度学习在图像审核的应用

深度学习在电子商务中的应用

搜狗深度学习技术在广告推荐领域的应用

阿里云上深度学习建模实践-程孟力

Qcon北京2018-《深度学习在视频搜索领域的实践》-刘尚堃pdf

《TensorFlow 2项目进阶实战》4-商品检测篇：使用RetinaNet瞄准你的货架商品

《TensorFlow 快速入门与实战》4-实战TensorFlow房价预测