【PyTorch深度学习-龙龙老师】-测试版202112链式法则 7.7 反向传播算法 7.8 Himmelblau 函数优化实战 7.9 反向传播算法实战 7.10 参考文献 第 8 章 PyTorch 高级用法 8.1 常见功能模块 8.2 模型装配、训练与测试 8.3 模型保存与加载 8.4 自定义类 8.5 模型乐园 8.6 测量工具 8.7 可视化 8.8 参考文献 第 9 章 过拟合 机器重复且快速地执行,从而将人类从简单枯燥的重复劳动工作中解脱出来。但是对于需 要较高智能水平的任务,如人脸识别、聊天机器人、自动驾驶等任务,很难设计明确的逻 辑规则,传统的编程方式显得力不从心,而人工智能(Artificial Intelligence,简称 AI)是有 望解决此问题的关键技术。 随着深度学习算法的崛起,人工智能在部分任务上取得了类人甚至超人的智力水平, 如在围棋上 AlphaGo 智能程序已经击败人类最强围棋专家之一柯洁,在 以及它们之间的联 系与区别。 1.1.1 人工智能 人工智能是让机器获得像人类一样具有思考和推理机制的智能技术,这一概念最早出 现在 1956 年召开的达特茅斯会议上。这是一项极具挑战性的任务,人类目前尚无法对人脑 的工作机制有全面、科学的认知,希望能制造达到人脑水平的智能机器无疑是难于上青 天。即使如此,在某个方面呈现出类似、接近甚至超越人类智能水平的机器被证明是可行 的。 怎么实0 码力 | 439 页 | 29.91 MB | 1 年前3
动手学深度学习 v2.0效率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 5.2 参数管理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 5.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 300 8.2.4 整合所有功能 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302 8.3 语言模型和数据集 . . 2 字节对编码(Byte Pair Encoding) . . . . . . . . . . . . . . . . . . . . . . . . . . . 675 14.7 词的相似性和类比任务 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 678 14.7.1 加载预训练词向量 .0 码力 | 797 页 | 29.45 MB | 1 年前3
谭国富:深度学习在图像审核的应用自建识别模型 加大审核人力 一旦出现严重违规平 台面临停业整顿风险 昂贵的专业机器、AI专家, 样本不足导致识别模型漏 过模型调优难度大 人力审核疲劳容易发 生漏过,人力招聘、 管理需要耗费不小成 本 识别种类 完备 节约成本 节省审核 人力 减少人工 漏审 技术诉求:自动识别图片或视频中出现的文 字、二维码、logo等内容以及违规人像、淫 秽、血腥、暴力、极端主义、恐怖主义图像 应用场景:快递单据,广告识别等。 l 手写体OCR以及通用OCR识别 l 落地应用: Ø 微云相册识别,广点通广告识别,顺丰快递单据识别,微云文本 识别等 SACC2017 更多图像定制识别功能 l 图标识别 Ø 图标形式:水印、二维码、条形码、logo等。并可根 据业务需求定制。 Ø 基于团队自研的深度识别引擎,核心算法与基础模型 经过多轮优化,可以准确快速地识别图片中所包含的 Era https://arxiv.org/abs/1707.02968 数据除了人工以外的获取方法 • 扩增数据 – 各种图像增强,加噪声 • 非监督学习 - 聚类 • 迁移学习 – 利用相似任务训练好的网络 • 生成样本数据 – 深度生成对抗网络 SACC2017 深度学习 训练框架 和 硬件选择 不同场景,不同框架 特性 GTX - 1080TI G7-P40 PCIe-V1000 码力 | 32 页 | 5.17 MB | 1 年前3
AI大模型千问 qwen 中文文档模型的各种用途。若想了解更多,请随时查阅本文档中的其他内容。 1.3 使用 Transformers 实现 Chat Qwen1.5 最重要同时也最简单的用途是通过 transformers 库实现 Chat 功能。在本文档中,我们将展示如何在 流式模式或非流式模式下与 Qwen1.5-7B-Chat 进行对话。 1.3.1 基本用法 你只需借助 transformers 库编写几行代码,就能与 Qwen1 Qwen 成为可能。该库是 一个纯 C/C++ 实现,不依赖任何外部库,并且针对 x86 架构提供了 AVX、AVX2 和 AVX512 加速支持。此 外,它还提供了 2、3、4、5、6 以及 8 位量化功能,以加快推理速度并减少内存占用。对于大于总 VRAM 容量的大规模模型,该库还支持 CPU+GPU 混合推理模式进行部分加速。本质上,llama.cpp 的用途在于运行 GGUF(由 GPT 生成的 TGW 中包含了许多更多用途,您甚至可以在其中享受角色扮演的乐趣,并使用不同类型的量化模型。您可 以训练诸如 LoRA 这样的算法,并将 Stable Diffusion 和 Whisper 等扩展功能纳入其中。赶快去探索更多高级 用法,并将它们应用于 Qwen 模型中吧! 1.7 AWQ 对于量化模型,我们推荐使用 AWQ 结合 AutoAWQ 。AWQ 即激活感知权重量化,是一种针对 LLM0 码力 | 56 页 | 835.78 KB | 1 年前3
机器学习课程-温州大学-01深度学习-引言2011年 D轮融资 估值40亿美元 8 科大讯飞 智能语音技术 综合 中国 1999年 上市 市值108亿美元 9 Automation Anywhere 自然语言处理技术、非结构化数据认知 企业管理 美国 2003年 B轮融资 估值68亿美元 10 IBM Watson(IBM沃森) 深度学习、智适应学习技术 计算机 美国 1911年 上市 市值1198亿美元 11 松鼠AI 1对1 智适应学习技术、机器学习 由于90%的医疗数据都是基于图像的,因此医 学中的计算机视觉有很多用途。比如启用新的 医疗诊断方法,分析X射线,乳房X光检查,监 测患者等。 13 深度学习入门-目标检测 目标检测结合了目标分 类和定位两个任务。 目标检测器的框架分为 one-stage(YOLO,YOLO9000,YOLOV3,YOLOV4, YOLOV5,SSD等) two-stage(OverFeat,R-CNN,Fast R-CNN,Faster http://localhost:8088/tree 54 ⚫Pycharm https://www.jetbrains.com/pycharm/ Pycharm 提供 免费的社区版 与 付费的专业版。专业版额外增加了一些功能, 如项目模板、远程开发、数据库支持等。个人学习 Python 使用免费的社区版 已足够。 如果有edu邮箱,那么推荐使用专业版,edu邮箱是可以免费使用专业版的。 安装过程照着提示一步步操作就可以了。0 码力 | 80 页 | 5.38 MB | 1 年前3
机器学习课程-温州大学-01机器学习-引言2011年 D轮融资 估值40亿美元 8 科大讯飞 智能语音技术 综合 中国 1999年 上市 市值108亿美元 9 Automation Anywhere 自然语言处理技术、非结构化数据认知 企业管理 美国 2003年 B轮融资 估值68亿美元 10 IBM Watson(IBM沃森) 深度学习、智适应学习技术 计算机 美国 1911年 上市 市值1198亿美元 11 松鼠AI 1对1 智适应学习技术、机器学习 http://localhost:8088/tree 53 ⚫Pycharm https://www.jetbrains.com/pycharm/ Pycharm 提供 免费的社区版 与 付费的专业版。专业版额外增加了一些功能, 如项目模板、远程开发、数据库支持等。个人学习 Python 使用免费的社区版 已足够。 如果有edu邮箱,那么推荐使用专业版,edu邮箱是可以免费使用专业版的。 安装过程照着提示一步步操作就可以了。 ⚫元组(tuple) 元组类似列表,元组里面的元素也是进行索引计算。列表里面的元素的值可以修改,而元组 里面的元素的值不能修改,只能读取。元组的符号是( ) ⚫集合(set) 集合主要有两个功能,一个功能是进行集合操作,另一个功能是消除重复元素。 集合的格式 是:set( ),其中()内可以是列表、字典或字符串,因为字符串是以列表的形式存储的 ⚫字典(dict) 字典dict也叫做关联数组,用大括号{ }0 码力 | 78 页 | 3.69 MB | 1 年前3
TensorFlow on Yarn:深度学习遇上大数据没有GPUs集群资源管理和调度(内存、CPU、GPU、 端⼝),集群资源负载不均� • 训练数据⼿动分发,训练模型⼿动保存� • 进程遗留问题,需要⼿动杀死� • 缺乏作业统⼀管理,不便对作业运⾏状态跟踪� • 日志查看不⽅便� � 总结:� TensorFlow使用现状及痛点 • 集群资源的管理(目前支持CPU、内存,需要扩展GPU 资源管理)� • 作业的统⼀管理、状态跟踪� Pool)的划分� • 作业进程的资源隔离� Yarn能解决什么问题:� TensorFlow on Yarn设计 • 同时支持单机和分布式TensorFlow程序� • 支持GPU资源管理和调度� • 不再需要⼿动配置CluserSpec信息,仅需要设置work 和ps的数量� • 训练数据和训练模型基于HDFS统⼀存储� • 作业训练结束自动回收work、ps和Tensorboard进程� 数量 分配 ResourceManager统计计数并按数量 分配 作业必须占用CPU资源 作业可以不需要GPU资源 系统自动分配物理CPU核心 需要知道具体GPU卡号,代码分配 计算任务到指定GPU设备 设备亲和性影响较小 设备亲和性影响较大 TensorFlow on Yarn技术细节揭秘 Yarn支持GPU调度ResourceManager端实现:� 扩展org0 码力 | 32 页 | 4.06 MB | 1 年前3
PyTorch OpenVINO 开发实战系列教程第一篇����������������������������������������������������������������������������� 2 1.1.2 Pytorch 的模块与功能 �������������������������������������������������������������������������������������������������� 开发者生态社区,因为其开发效率高、特别容 易构建各种复杂的深度学习模型网络,因此很快得到大量人工 智能开发者的认可与追捧,也成为工业界最受欢迎的深度学习 框架之一。 Pytorch 发展至今,其版本跟功能几经迭代,针对不同的场景 任务分裂出不同的分支扩展库,比如针对自然语言处理(NLP) 的 torchtext、针对计算机视觉的 torchvision、针对语音处理 的 torchaudio,这些库支持快速模型训练与演示应用,可以 移动端部署。 在版本发布管理方面,Pytorch 分为三种不同的版本分别是稳 定版本 (Stable Release)、Beta 版本、原型版本(Prototype)。 其中稳定版本长期支持维护没有明显的性能问题与缺陷,理论 上支持向后兼容的版本;Beta 版本是基于用户反馈的改动版 本,可能有 API/SDK 函数改动,性能有进一步需要提升的空间; 原型版本是新功能还不可以,需要开发不能通过0 码力 | 13 页 | 5.99 MB | 1 年前3
阿里云上深度学习建模实践-程孟力Generation Video Caption EasyVision: 图像视频算法库 Bert TextInput Optim izer 性能优越: 分布式存储 分布式查询 功能完备: GSL/负采样 主流图算法 异构图 (user/item/attribute) 动态图 标准化: Standard Libraries Graph-Learn: 分布式图算法库 gn, ln? 激活函数: relu, leaky_relu, swish ? Backbone: resnet, hrnet, mobilenet, transformer? 多任务模型: share-bottom, mmoe, ple? 特征选择/生成: Age, sex, comment, click… 解决方案: 超参搜索 效果提升 模型理解 问题: 黑盒 Tran sform er decoder Tran sform er decoder Tran sform er decoder 解决方案: 多模态预训练 Vit based 下游任务: 视频分类 视频打标签 推荐模型特征 解决方案: 小样本学习 小样本结构化模型 在线预测服务(EAS) • 一键部署 • 多模型 • 蓝绿部署 • 弹性扩缩 • 推理优化0 码力 | 40 页 | 8.51 MB | 1 年前3
机器学习课程-温州大学-12深度学习-自然语言处理和词嵌入务中,比如说用这个300维的词嵌入来表示你的单词。这样做的一个好处就是你 可以用更低维度的特征向量代替原来的10000维的one-hot向量,现在你可以用 一个300维更加紧凑的向量。 第三步,当你在你新的任务上训练模型时,在你的命名实体识别任务上,只有少 量的标记数据集上,你可以自己选择要不要继续微调,用新的数据调整词嵌入。 11 2.词嵌入 ?king − ?queen = −0.95 0.93 0.70 0 及 其相关的负样本),并再次执行相同的过程。 当我们循环遍历整个数据集多次时,嵌入继续得到改进。然后我们可以停 止训练过程,丢弃`Context`矩阵,并使用`Embeddings`矩阵作为下一个任务 的预训练嵌入。 27 4.GloVe 03 Word2Vec 04 GloVe 02 词嵌入 05 GPT 01 词汇表征和文本数据处理 28 Transformer摆脱了人工标注数据集的缺陷,模型在质量上更优、 更易于并行化,所需训练时间明显更少 ◼ Transformer通过成功地将其应用于具有大量和有限训练数据的分 析,可以很好地推广到其他任务 ✓ 2017年,在Ashish Vaswani et.al 的论文《Attention Is All You Need》 中,考虑到主导序列转导模型基于编码器-解码器配置中的复杂递归或卷积0 码力 | 44 页 | 2.36 MB | 1 年前3
共 43 条
- 1
- 2
- 3
- 4
- 5













