动手学深度学习 v2.0特征不能预测任务目标,那么模型很可能无效。有一句古语很好地反映了这个现象:“输入的是垃圾,输出的 也是垃圾。”(“Garbage in, garbage out.”)此外,糟糕的预测性能甚至会加倍放大事态的严重性。在一些敏 感应用中,如预测性监管、简历筛选和用于贷款的风险模型,我们必须特别警惕垃圾数据带来的后果。一种 常见的问题来自不均衡的数据集,比如在一个有关医疗的训练数据集中,某些人群没有样本表示。想象一下, 性”。 2. 局部性(locality):神经网络的前面几层应该只探索输入图像中的局部区域,而不过度在意图像中相隔 较远区域的关系,这就是“局部性”原则。最终,可以聚合这些局部特征,以在整个图像级别进行预测。 让我们看看这些原则是如何转化为数学表示的。 6.1.2 多层感知机的限制 首先,多层感知机的输入是二维图像X,其隐藏表示H在数学上是一个矩阵,在代码中表示为二维张量。其 中X和H 5 examples/sec on cuda:0 小结 • Inception块相当于一个有4条路径的子网络。它通过不同窗口形状的卷积层和最大汇聚层来并行抽取 信息,并使用1×1卷积层减少每像素级别上的通道维数从而降低模型复杂度。 • GoogLeNet将多个设计精细的Inception块与其他层(卷积层、全连接层)串联起来。其中Inception块 的通道数分配之比是在ImageNet数据集上通过大量的实验得来的。0 码力 | 797 页 | 29.45 MB | 1 年前3
QCon北京2018-《未来都市--智慧城市与基于深度学习的机器视觉》-陈宇恒l单机、简易分布式人脸检测、跟踪、比对平台 l处理数十路到数百路监控摄像头数据 l千万级别深度学习特征检索 l行业试水 2018-2019 l云原生Cloud-Native超大规模视图存储、处理、检 索 l处理数万到数十万路,城市范围级别监控、门禁摄 像头数据 l10-100 Billion级别深度学习特征检索 - PB以上级别数据库存储 - 100PB级别抓拍图片存储 - 每秒万次并发检索请求 l大规模推广应用 Go在开发高性能应用上也有一些不足, 对比C++: - 无法直接控制操作系统线程,CUDA 调用需要特殊处理 - 部分标准库实现依赖reflect,性能较 差 - GC的带来的开销,如在Go Heap上 构建百万以上级别的对象缓存,需要 仔细优化 百倍慢于等价的C实现! 回顾 • 智慧城市中,在智能安防领域机器视觉有着爆发式应用 • 我们使用基于深度学习的机器视觉技术,构建了超大规模的自我演化 的分布式智能系统0 码力 | 23 页 | 9.26 MB | 1 年前3
超大规模深度学习在美团的应用-余建平美团点评用户平台研究员 自我介绍 自我介绍 2011年硕士毕业于南京大学计算机科学与技术系。毕业后曾在百度凤巢从事机器学习 工程相关的工作,加入美团后,负责超大规模机器学习系统,从无到有搭建起支持千亿 级别规模的深度学习系统,与推荐、搜索、广告业务深度合作,在算法上提供从召回到 排序的全系统优化方案,在工程上提供离线、近线、在线的全流程解决方案。 目录 • 美团超大规模模型场景简介 • 超大规模机器学习MLX 美团推荐 美团搜索 美团广告 美团应用场景简介 • 场景特点 亿级的用户,千万级的O2O商品 海量的用户行为,完整的交易闭环 LBS相关的推荐 • 模型特点 百亿级别的训练数据 千亿级别的模型特征 秒级实时的模型反馈 目录 • 美团超大规模模型场景简介 • 超大规模机器学习MLX MLX平台目标 MLX平台架构 • 模型场景应用 召回模型 粗排阶段的特点 候选集大,通常在千到万级别 线上的响应时间要求高,通常在几到十几ms • 简单模型 计算耗时短:线性模型LR、树模型 模型表达能力不足,效果一般 • 复杂模型 DNN模型解决耗时是关键,利用预计算解决耗时问题 效果保障:保证用户的个性化信息,降低候选集计算复杂度 粗排模型 • 精排阶段的特点 候选集较少,通常在百级别 线上耗时相对宽松,几十毫秒(视效果而定)0 码力 | 41 页 | 5.96 MB | 1 年前3
从推荐模型的基础特点看大规模推荐类深度学习系统的设计 袁镱更灵活的⽤法:模型多切⽚,按需上线 � Dssm � wdl ... 分布式Serving集群 副本1 副本2 Group 1 Group N 副本1 副本2 推理节点 SDK MB级别DNN部分 Sparse Hotkey TB级别Embedding部分 全量模型,TB级,低峰期(Cos存储) 增量模型,GB级,20分钟(Cos存储) 实时模型,KB级,秒(Kafka) 分布式 Serving集群 痛点: 1. 更少的values: 变⻓Embedding 特征出现次数少,⽤1个float 结合show/click,有效果提升 2. 更少的key: group lasso key级别的稀疏化 3. 更短的values a) 混合精度: float16+int8+int4 b) 量化压缩,1bit或2bit 优点:与优化器⽆关 缺点:1. 只适合低频特征多的场景0 码力 | 22 页 | 6.76 MB | 1 年前3
机器学习课程-温州大学-02-数学基础回顾-1.CS229-LinearAlgebra初始定义(在一行数学中)之后。 这些不同方法的直接优势在于它们允许您在向量的级别/单位而不是标量上进行操作。 为了完全理解线 性代数而不会迷失在复杂的索引操作中,关键是要用尽可能多的概念进行操作。 实际上所有的线性代数都处理某种矩阵乘法,花一些时间对这里提出的观点进行直观的理解是非常必要 的。 除此之外,了解一些更高级别的矩阵乘法的基本属性是很有必要的: 矩阵乘法结合律: 矩阵乘法分配律:0 码力 | 19 页 | 1.66 MB | 1 年前3
AI大模型千问 qwen 中文文档/quantize models/7B/qwen1_5-7b-chat-fp16.gguf models/7B/qwen1_5-7b-chat-q2_k.gguf q2_ �→k 我们现在提供了以下量化级别的 GGUF 模型:q2_k 、q3_k_m 、q4_0 、q4_k_m 、q5_0 、q5_k_m 、q6_k 和 q8_0 。欲了解更多信息,请访问 llama.cpp 。 1.10 vLLM 之一。在大多数情况下,我们建议在多 GPU 训练中使用 ZeRO3,但针对 Q-LoRA,我们推荐使用 ZeRO2。 有一系列需要调节的超参数。您可以向程序传递 --bf16 或 --fp16 参数来指定混合精度训练所采用的精 度级别。此外,还有其他一些重要的超参数如下: • --output_dir: the path of your output models or adapters. • --num_train_epochs:0 码力 | 56 页 | 835.78 KB | 1 年前3
《TensorFlow 快速入门与实战》4-实战TensorFlow房价预测CSV(comma-separated) 文件到数据框的功能。 数据可视化库:matplotlib & seaborn & mplot3d matplotlib 是一个 Python 2D 绘图库,可以生成出版物质量级别的图像和各种硬拷贝格式, 并广泛支持多种平台,如:Python 脚本,Python,IPython Shell 和 Jupyter Notebook。 seaborn 是一个基于 matplotlib的0 码力 | 46 页 | 5.71 MB | 1 年前3
亚马逊AWSAI Services OverviewQuickbooks Hubspot Lex: 构建自然的通过语音和文本的会话交互 不断提升的 人性化交互… • 联系、服务支持中心的接口 (文本 + 语音) • 员工工作效率和协同 (分钟级别到秒级) Origin Destination Departure Date Flight Booking “Book a flight to London” Automatic Speech0 码力 | 56 页 | 4.97 MB | 1 年前3
谭国富:深度学习在图像审核的应用暴恐识别技术 武装份子 管制刀具 枪支弹药 人群聚集 火灾 血腥 极端主义、恐怖主义标识 SACC2017 内容识别 – 人脸识别 l 政治敏感人物识别, 直播, 视频等场景 Ø 上亿级别的人脸检索,秒级的检索速度从黑名 单,白名单数据库中返回目标人脸信息。 Ø 技术指标:优图人脸识别通过传统方法和深度 学习技术结合,以空间面孔墙和微众银行远程 核身为基础,在性能上达到LFW0 码力 | 32 页 | 5.17 MB | 1 年前3
机器学习课程-温州大学-01机器学习-引言69 Python模块-Matplotlib ⚫Matplotlib Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格 式和跨平台的交互式环境生成 出版质量级别的图形 。 通过 Matplotlib,开发者可以 仅需要几行代码,便可以生成 绘图,直方图,功率谱,条形 图,错误图,散点图等。 https://matplotlib.org/gallery/index0 码力 | 78 页 | 3.69 MB | 1 年前3
共 13 条
- 1
- 2













