回归的评价指标 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

机器学习课程-温州大学-02机器学习-回归

机器学习-第二章回归黄海广副教授 2022年09月 ## 本章目录 01 线性回归 02 梯度下降 03 正则化 04 回归的评价指标 ### 1. 线性回归 01 线性回归 02 梯度下降 03 正则化 04 回归的评价指标 ## 回归的概念 ## 监督学习分为回归和分类 ✓ 回归（Regression、Prediction） ✓ 如何预测上海浦东的房价？标签连续标签连续 √ 未来的股票市场走向？ ✓ 分类（Classification） ## 标签离散 ✓ 身高1.85m，体重100kg的男人穿什么尺码的T恤？ ✓ 根据肿瘤的体积、患者的年龄来判断良性或恶性？ ## 线性回归-概念 ## 线性回归（Linear Regression）是一种通过属性的线性组合来进行预测的线性模型，其目的是找到一条直线或者一个平面或者更高维的超平面，使得预测值与真实值之间的误差最小化。与真实值之间的误差最小化。 ![Image](/uploads/documents/9/9/0/e/990e7845b4e774c84fea91a89b00e1cf/p5_1.jpg) ## 线性回归-符号约定 m 代表训练集中样本的数量 n 代表特征的数量 x 代表特征/输入变量 y 代表目标变量/输出变量 $ (x,y) $ 代表训练集中的样本 $ (x^{(i)}, y^{(i)})

0 码力 | 33 页 | 1.50 MB | 2 年前
3
机器学习课程-温州大学-03机器学习-逻辑回归

## 机器学习-逻辑回归黄海广副教授 2022年02月 ## 本章目录 01 分类问题 02 Sigmoid函数 03 逻辑回归求解 04 逻辑回归代码实现 ### 1. 分类问题 01 分类问题 02 Sigmoid函数 03 逻辑回归求解 04 逻辑回归代码实现 ## 分类问题 ## 监督学习的最主要类型 ## ✓ 分类（Classification） ## 标签离散 ✓ 身高1.85m，体重100kg的男人穿什么尺码的T恤？ ✓ 根据肿瘤的体积、患者的年龄来判断良性或恶性？ ✓ 根据用户的年龄、职业、存款数量来判断信用卡是否会违约？输入变量可以是离散的，也可以是连续的。 ## 分类问题 ## 二分类我们先从用蓝色圆形数据定义为类型1，其余数据为类型2；只需要分类1次步骤：①->② ![Image](/uplo (One-vs-Rest) 一对多 (一对余) ### 2. Sigmoid函数 01 分类问题 02 Sigmoid函数 03 逻辑回归求解 04 逻辑回归代码实现 ### 2. Sigmoid函数 ## Sigmoid 函数 $ \sigma(z) $ 代表一个常用的逻辑函数（logistic function）为S形函数（Sigmoid function）则： $ \sigma(z)=

0 码力 | 23 页 | 1.20 MB | 2 年前
3
简单回归案例

0 码力 | 12 页 | 748.45 KB | 2 年前
3
简单回归案例实战

0 码力 | 7 页 | 860.99 KB | 2 年前
3
机器学习课程-温州大学-Scikit-learn

Scikit-learn是基于NumPy、SciPy和Matplotlib的开源Python机器学习包,它封装了一系列数据预处理、机器学习算法、模型选择等工具,是数据分析师首选的机器学习工具包。自2007年发布以来，scikit-learn已经成为Python重要的机器学习库了，scikit-learn简称sklearn，支持包括分类，回归，降维和聚类四大机器学习算法。还包括了特征提取，数据处理和模型评估三大模块。 Scikit-learn支持以NumPy的arrays对象、Pandas对象、SciPy的稀疏矩阵及其他可转换为数值型arrays的数据结构作为其输入，前提是数据必须是数值型的 ✓ sklearn.datasets模块提供了一系列加载和获取著名数据集如鸢尾花、波士顿房价、Olivetti人脸、MNIST数据集等的工具，也包括了一些toy data如S型数据等的生成工具 from sklearn.datasets train_test_split(X, y, random_state=12, stratify=y, test_size=0.3) ## 数据集将完整数据集的70%作为训练集，30%作为测试集，并使得测试集和训练集中各类别数据的比例与原始数据集比例一致（stratify分层策略），另外可通过设置 shuffle=True 提前打乱数据 ### 2. Scikit-learn主要用法 ##

0 码力 | 31 页 | 1.18 MB | 2 年前
3
Keras: 基于 Python 的深度学习库

Python 的深度学习库 Keras: The Python Deep Learning library $ ^{*} $ Author: Keras-Team Contributor: 万震 (WAN Zhen) wanzhenchn wanzhen@cqu.edu.cn 2018年12月24日 ## 前言整理 Keras: 基于 Python 的深度学习库 PDF 版的主要原因在于学习版的主要原因在于学习 Keras 深度学习库时方便本地查阅，下载最新 PDF 版本请访问: https://github.com/wanzhenchn/keras-docs-zh。感谢 keras-team 所做的中文翻译工作，本文档制作基于此处。严正声明：本文档可免费用于学习和科学研究，可自由传播，但切勿擅自用于商业用途，由此引发一切后果贡献者概不负责。 The main reason of organizing Keras: 基于 Python 的深度学习库 1.1 你恰好发现了 Keras 1.2 指导原则 1.3 快速开始：30 秒上手 Keras 1.4 安装指引 1.5 使用 TensorFlow 以外的后端 1.6 技术支持 1.7 为什么取名为 Keras？ 2 为什么选择 Keras？ 2.1 Keras 优先考虑开发人员的经验 2.2 Keras 被工业界和学术界广泛采用

0 码力 | 257 页 | 1.19 MB | 2 年前
3
【PyTorch深度学习-龙龙老师】-测试版202112

这是一本面向人工智能，特别是深度学习初学者的书，本书旨在帮助更多的读者朋友了解、喜欢并进入到人工智能行业中来，因此作者试图从分析人工智能中的简单问题入手，一步步地提出设想、分析方案以及实现方案，重温当年科研工作者的发现之路，让读者身临其境式的感受算法设计思想，从而掌握分析问题、解决问题的能力。这种方式也是对读者的基础要求较少的，读者在学习本书的过程中会自然而然地了解算法的相关背景知识，体会到知识是为了解决问题而生的，避免陷入为了学习而学习的窘境。了学习而学习的窘境。尽管作者试图将读者的基础要求降到最低，但是人工智能不可避免地需要使用正式化的数学符号推导，其中涉及到少量的概率与统计、线性代数、微积分等数学知识，一般要求读者对这些数学知识有初步印象或了解即可。比起理论基础，读者需要有少量的编程经验，特别是 Python 语言编程经验，显得更加重要，因为本书更侧重于实用性，而不是堆砌公式。总的来说，本书适合于大学三年级左右的理工科本科生和研人工智能算法感兴趣的朋友。本书共 15 章，大体上可分为 4 个部份：第 1~3 章为第 1 部分，主要介绍人工智能的初步认知，并引出相关问题；第 4~5 章为第 2 部分，主要介绍 PyTorch 相关基础，为后续算法实现铺垫；第 6~9 章为第 3 部分，主要介绍神经网络的核心理论和共性知识，让读者理解深度学习的本质；第 10~15 章为模型算法应用部分，主要介绍常见的算法与模型，让读者能够学有所用。

0 码力 | 439 页 | 29.91 MB | 2 年前
3
2022年美团技术年货合辑

## 序新春将至，一年一度的美团技术年货也如约到来！时间煮雨，岁月缝花，花开无声，花谢无语。2022这一年，我们一起经历了无数的悲喜，也留下了满满的回忆。也许生活就是这样，只有历尽波澜，才能欣赏茫茫大海的辽阔和无边，才能感受到漫天星辰的光芒和温暖。在2023年春节到来之际，我们从去年美团技术团队公众号上精选了60多篇技术文章，整理制作成一本1300多页的电子书，作为新年礼物赠送给大家。。这本电子书内容覆盖算法、前端、后端、数据、安全等多个技术领域，希望能对同学们的工作和学习有所帮助。也欢迎大家转给更多有相同兴趣、积极上进的同事和朋友们，一起切磋，共同成长。祝愿2023年，大家诸事顺遂，健康平安。 ![Image](/uploads/documents/5/b/1/9/5b19ae814e1fdbee8febba2ae4abed19/p2_1.jpg) 微信扫码关注美团技术团队 YOLOv6：又快又准的目标检测框架开源啦目标检测开源框架 YOLOv6 全面升级，更快更准的 2.0 版本来啦通用目标检测开源框架 YOLOv6 在美团的量化部署实战 7 次 KDD Cup&Kaggle 冠军的经验分享：从多领域优化到 AutoML 框架图神经网络训练框架的实践和探索图技术在美团外卖下的场景化应用及探索大规模异构图召回在美团到店推荐广告的应用美团搜索粗排优化的探索与实践

0 码力 | 1356 页 | 45.90 MB | 2 年前
3
机器学习课程-温州大学-05机器学习-机器学习实践

2022年02月 ## 本章目录 01 数据集划分 02 评价指标 03 正则化、偏差和方差 ### 1. 数据集划分 ## 01 数据集划分 02 评价指标 03 正则化、偏差和方差 ### 1. 数据集划分训练集（Training Set）：帮助我们训练模型，简单的说就是通过训练集的数据让我们确定拟合曲线的参数。验证集（Validation Set）：也叫做开发集（Dev Set）：也叫做开发集（Dev Set），用来做模型选择（model selection），即做模型的最终优化及确定的，用来辅助我们的模型的构建，即训练超参数，可选；测试集（Test Set）：为了测试已经训练好的模型的精确度。
数据集
训练集验证集测试集
个模型分别对交叉验证集计算得出交叉验证误差（代价函数的值） $$ \frac{\epsilon_{1}+\ldots+\epsilon_{k}}{k} $$ $$ \epsilon_{k} $$ 3. 选取代价函数值最小的模型 4. 用步骤3中选出的模型对测试集计算得出推广误差（代价函数的值） ## 不平衡数据的处理数据不平衡是指数据集中各类样本数量不均衡的情况. 常用不平衡处理方法有采样和代价敏感学习

0 码力 | 33 页 | 2.14 MB | 2 年前
3

机器学习课程-温州大学-特征工程

01 相关概念 02 特征构建 03 特征提取 04 特征选择 ### 1. 相关概念特征工程相关概念定义是把原始数据转变为模型的训练数据的过程目的获取更好的训练数据特征，使得机器学习模型逼近这个上限作用使模型的性能得到提升构成特征构建特征提取特征选择 ### 1. 相关概念 ## 数据决定一切准确率 ![Image](/upload 6/f/6f6fb0eb1a57b4cc30fdaec2abe8c269/p5_1.jpg) 通过这张图可以看出，各种不同算法在输入的数据量达到一定级数后，都有相近的高准确度。于是诞生了机器学习界的名言：成功的机器学习应用不是拥有最好的算法，而是拥有最多的数据！ ### 1. 相关概念 ## 特征提取VS特征选择

项目	特征 colspan="2">都从原始特征中找出最有效的特征都能帮助减少特征的维度、数据冗余
区别	➢ 强调通过特征转换的方式得到一组具有明显物理或统计意义的特征➢ 有时能发现更有意义的特征属性	➢ 从特征集合中挑选一组具有明显物理或统计意义的特征子集➢ 能表示出每个特征对于模型构建的重要性

0 码力 | 38 页 | 1.28 MB | 2 年前

共 1000 条前往

页

数据集
训练集	验证集	测试集

搜索

分类

语言

格式