机器学习课程-温州大学-机器学习项目流程1 2021年06月 机器学习-机器学习项目流程 黄海广 副教授 2 本章目录 01 机器学习项目流程概述 02 数据清洗 03 特征工程 04 数据建模 3 1.机器学习项目流程概述 01 机器学习项目流程概述 02 数据清洗 03 特征工程 04 数据建模 4 机器学习的一般步骤 5 机器学习的一般步骤 数据搜集 数据清洗 数据清理和格式化 • 探索性数据分析(EDA) • 特征工程 • 特征选择 • 网络下载 • 网络爬虫 • 数据库读取 • 开放数据 • …… 7 2.数据清洗 01 机器学习项目流程概述 02 数据清洗 03 特征工程 04 数据建模 8 2.数据清洗 什么是数据清洗? 数据清洗是指发现并纠正数据文件中可识别的错误的最后一道程序,包 括检查 17 探索性数据分析(EDA) Pairs Plot是一次检查多个变 量的好方法,因为它显示了 对角线上的变量对和单个变 量直方图之间的散点图。 18 3.特征工程 01 机器学习项目流程概述 02 数据清洗 03 特征工程 04 数据建模 19 3.特征工程 特征工程和特征选择 •特征工程: 获取原始数据并提取或创建新特征的过程。这可能意味着需要对0 码力 | 26 页 | 1.53 MB | 1 年前3
《TensorFlow 2项目进阶实战》7-TensorFlow2进阶使用TensorFlow 2 进阶使用 扫码试看/订阅 《 TensorFlow 2项目进阶实战》视频课程 • 使⽤ TensorFlow 2 实现图像数据增强 • 使⽤ TensorFlow 2 实现分布式训练 • 使⽤ TensorFlow Hub 迁移学习 • 使⽤ @tf.function 提升性能 • 使⽤ TensorFlow Serving 部署云端服务 • 使⽤ TensorFlow android.com/studio Step 1:下载 TensorFlow examples 项目 $ git clone https://github.com/tensorflow/examples Step 2:在 Android Studio 中加载 examples 项目 项目路径:examples/lite/examples/image_classification/android examples 项目 Step 3:在 Android Studio 中编译 examples 项目 Step 3:在 Android Studio 中编译 examples 项目 Step 4:在 Android Studio 中安装物品识别 APP Step 5:在 Android Studio 中运行物品识别 APP 扫码试看/订阅 《 TensorFlow 2项目进阶实战》视频课程0 码力 | 28 页 | 5.84 MB | 1 年前3
《TensorFlow 2项目进阶实战》1-基础理论篇:TensorFlow 2设计思想TensorFlow 2 项目实战进阶 扫码试看/订阅 《TensorFlow 2 项目进阶实战》视频课程 基础理论篇:TensorFlow 2 设计思想 • TensorFlow 2 设计原则 • TensorFlow 2 核心模块 • TensorFlow 2 vs TensorFlow 1.x • TensorFlow 2 落地应用 目录 TensorFlow 2 设计原则 API 完全兼容原生 Keras • 支持保存和加载 TensorFlow SavedModel • 支持 Eager Execution • 支持分布式训练 tf.data:功能强大的数据管理模块 支持多种数据处理 图像解码 Shuffle py_function 重采样 支持多种数据格式 图像文件 文本文件 CSV 文件 NumPy 数组 Python 生成器 TFRecord TensorFlow 与企业服务的结合 – QQ 音乐 来源:《 案例分享 | QQ 音乐应用 TensorFlow 构建 AI 赋能的音乐曲库》 扫码试看/订阅 《TensorFlow 2 项目进阶实战》视频课程0 码力 | 40 页 | 9.01 MB | 1 年前3
《TensorFlow 2项目进阶实战》2-快速上手篇:动⼿训练模型和部署服务TensorFlow 2 项目实战进阶 扫码试看/订阅 《TensorFlow 2 项目进阶实战》视频课程 快速上手篇:动⼿训练模型和部署服务 • TensorFlow 2 开发环境搭建 • 使用 tf.keras.datasets 加载数据 • 使用 tf.data.Dataset 加载数据 • 使用 tf.keras.Model 管理模型 • Fashion MNIST 数据集介绍 from_generator 加载 Generator 使用 tf.data.TextLineDataset 加载文本 “Hello TensorFlow” Try it! 使用 tf.keras.Model 管理模型 历史上的 tf.keras.Model • Class tf.compat.v1.keras.Model • Class tf.compat.v1.keras.models.Model test_labels) plt.show() Visualize prediction “Hello TensorFlow” Try it! 扫码试看/订阅 《TensorFlow 2 项目进阶实战》视频课程0 码力 | 52 页 | 7.99 MB | 1 年前3
《TensorFlow 2项目进阶实战》6-业务落地篇:实现货架洞察Web应⽤业务落地篇:实现货架洞察 Web 应用 扫码试看/订阅 《 TensorFlow 2项目进阶实战》视频课程 • 串联 AI 流程理论:商品检测与商品识别 • 串联 AI 流程实战:商品检测与商品识别 • 展现 AI 效果理论:使用 OpenCV 可视化识别结果 • 展现 AI 效果实战:使用 OpenCV 可视化识别结果 • 搭建 AI SaaS 理论:Web 框架选型 • 搭建 AI AI SaaS 理论:Web 框架选型 Python Web 框架 Python Web 框架 - Flask Python Web 框架 - Flask Flask 常用扩展 Flask 项目常见目录结构 启动文件 manage.py 示例 搭建 AI SaaS 理论:数据库 ORM 选型 ORM 是什么 ORM 是什么 常见的 Python ORM • SQLAlchemy http://localhost:9000/tf2/ai_saas AI SaaS 服务识别结果 “Hello TensorFlow” Try it! 扫码试看/订阅 《 TensorFlow 2项目进阶实战》视频课程0 码力 | 54 页 | 6.30 MB | 1 年前3
《TensorFlow 2项目进阶实战》5-商品识别篇:使用ResNet识别你的货架商品商品识别篇:使用 ResNet 识别你的货架商品 扫码试看/订阅 《 TensorFlow 2项目进阶实战》视频课程 • 基础:图像分类问题定义与说明 • 基础:越来越深的图像分类网络 • 应⽤用:检测SKU抠图与分类标注流程 • 应⽤用:分类训练集与验证集划分 • 应⽤用:使⽤用TensorFlow 2训练ResNet • 应⽤用:使用ResNet识别货架商品 • 扩展:图像分类常用数据集综述 图像分类应用:户型图识别(空间、家具) 原始户型图 空间分割 (整体效果) 空间分割 (中间结果) 图像分类应用:智能相册 图像分类应用:瑕疵检测 扫码试看/订阅 《 TensorFlow 2项目进阶实战》视频课程0 码力 | 58 页 | 23.92 MB | 1 年前3
《TensorFlow 2项目进阶实战》4-商品检测篇:使用RetinaNet瞄准你的货架商品商品检测篇:使用 RetinaNet 瞄准你的货架商品 扫码试看/订阅 《 TensorFlow 2项目进阶实战》视频课程 • 基础:目标检测问题定义与说明 • 基础:R-CNN系列二阶段模型综述 • 基础:YOLO系列一阶段模型概述 • 基础:RetinaNet 与 Facol Loss 带来了什么 • 应用:检测数据准备与标注 • 应用:划分检测训练集与测试集 • 应用:生成CSV 目标检测应用:仓库流水审计 目标检测应用:仓库盘点 无人智能盘点 人工盘点 目标检测应用:安全防护检测 目标检测应用:内容审核 目标检测应用:车流统计 扫码试看/订阅 《 TensorFlow 2项目进阶实战》视频课程0 码力 | 67 页 | 21.59 MB | 1 年前3
《TensorFlow 2项目进阶实战》3-方案设计篇:如何设计可落地的AI解决方案方案设计篇:如何设计可落地的AI解决方案 扫码试看/订阅 《 TensorFlow 2项目进阶实战》视频课程 • 行业背景:AI新零售是什么? • 用户需求:线下门店业绩如何提升? • 长期⽬目标:货架数字化与业务智能化 • 短期目标:自动化陈列审核和促销管理 • 方案设计:基于深度学习的检测/分类的AI流水线 • 方案交付:支持在线识别和API调用的 AI SaaS 目录 行业背景:AI新零售是什么 陈列达标率 • 产品价格指数 • 促销执行统计 客户需求:棚格图推荐设计与销量预测 如何落地项目第一期? 短期目标:自动化陈列审核和促销管理 业务落地基础:货架数字化 SKU 种类 数量 位置 品类 占比 货架 设计 场景 层数 编号 业务落地:自动化陈列审核和促销管理 陈列 必分销 新品 纯度 排面 SKU 种类 数量 位置 品类 占比 货架 Showcase AI SaaS Showcase AI 通用物品识别平台架构 品 识 AI 中 台 AI 算法库 AI 核心模块 AI 行业模型 数据集 模型训练 模型管理 AutoML AI 物品库 服务管理 模型压缩 棚格图识别 货架巡检 商品推荐 陈列审核 入库审计 货物盘点 构件识别 CAD解析 规则审查 户型图识别 视频盘点 自动分拣 细粒度识别 目标检测0 码力 | 49 页 | 12.50 MB | 1 年前3
PyTorch OpenVINO 开发实战系列教程第一篇构建各种深度学习模型并实现分布式的训练,因此一发布就引 发学术界的追捧热潮,成为深度学习研究者与爱好者的首选开 发工具。在 pytorch 发布之后两年的 2018 年 facebook 又把 caffe2 项目整合到 pytorch 框架中,这样 pytorch 就进一步 整合原来 caffe 开发者生态社区,因为其开发效率高、特别容 易构建各种复杂的深度学习模型网络,因此很快得到大量人工 智能开发 语言到如今支持 Python/C++/Java 主流编程语言, 目前已经支持 Linux、Windows、MacOS 等主流的操作系统、 同时全面支持 Android 与 iOS 移动端部署。 在版本发布管理方面,Pytorch 分为三种不同的版本分别是稳 定版本 (Stable Release)、Beta 版本、原型版本(Prototype)。 其中稳定版本长期支持维护没有明显的性能问题与缺陷,理论 OpenVINO 开发实战系列教程 第一篇 6 点击【New Project】,输入项目名称,显示如下: 图 1-6(创建新项目) 点击【Create】按钮完成项目创建,选择文件 (File)-> 设置 (Setting) 选项: 图 1-7(设置选项) 图 1-8(设置系统 Python 解释器) 完成之后,在项目中创建一个空的 python 文件命名为 main. py,然后直接输入下面两行测试代码:0 码力 | 13 页 | 5.99 MB | 1 年前3
谭国富:深度学习在图像审核的应用自建识别模型 加大审核人力 一旦出现严重违规平 台面临停业整顿风险 昂贵的专业机器、AI专家, 样本不足导致识别模型漏 过模型调优难度大 人力审核疲劳容易发 生漏过,人力招聘、 管理需要耗费不小成 本 识别种类 完备 节约成本 节省审核 人力 减少人工 漏审 技术诉求:自动识别图片或视频中出现的文 字、二维码、logo等内容以及违规人像、淫 秽、血腥、暴力、极端主义、恐怖主义图像 或点击标签即可获取对应类别的图片。 l 图片场景识别技术 SACC2017 OCR识别 – 证件类 Ø 优图OCR识别技术支持数字识别和超过7000个常用汉字 的识别 Ø 在国际ICDAR 2015文本检测项目中刷新世界纪录 Ø 技术指标: 名片91.4%,驾驶证91.5%,行驶证85.5% Ø 应用场景:身份证、驾驶证、行驶证、营业执照、银行 卡、车牌、名片等等多个垂直场景 l 证件类OCR识别 Job 1 Train Job 1 Val Job 2 WK Job 2 WK Job 3 监控/启停 任务调度/资源管理 监控上报 cephfs存储集 群 本地文件系统 数据 模型/日志 client 管理数据 提取模型、 查看日志 提交/管理任务 用户 docker.oa.co m 自动拉取镜像 Redis 冷数据 热任务/监控数据/集群信息 • 任务监控与自动重启0 码力 | 32 页 | 5.17 MB | 1 年前3
共 32 条
- 1
- 2
- 3
- 4













