无监督学习 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

Lecture 1: Overview

0 码力 | 57 页 | 2.41 MB | 2 年前
3
机器学习课程-温州大学-Scikit-learn

## 机器学习-机器学习库Scikit-learn 黄海广副教授 2022年01月 ## 本章目录 01 Scikit-learn概述 02 Scikit-learn主要用法 03 Scikit-learn案例 ### 1. Scikit-learn概述 01 Scikit-learn概述 02 Scikit-learn主要用法 03 Scikit-learn案例 ### Scikit-learn是基于NumPy、SciPy和Matplotlib的开源Python机器学习包,它封装了一系列数据预处理、机器学习算法、模型选择等工具,是数据分析师首选的机器学习工具包。自2007年发布以来，scikit-learn已经成为Python重要的机器学习库了，scikit-learn简称sklearn，支持包括分类，回归，降维和聚类四大机器学习算法。还包括了特征提取，数据处理和模型评估三大模块。 ![Ima 嵌入式（Embedded），从模型中自动选择特征，任何具有coef_或者 feature_importances_的基模型都可以作为estimator参数传入 ### 2. Scikit-learn主要用法监督学习算法-回归 from sklearn.linear_model import LinearRegression 构建模型实例 lr = LinearRegression(normalize=True)

0 码力 | 31 页 | 1.18 MB | 2 年前
3
方志恒轻舟服务网格的无侵入增强 Istio 经验

## 轻舟服务网格的无侵入增强 Istio 经验方志恒（网易数帆云原生技术专家） ## 关于侵入、无侵入 ☑ 立目标，求上得中 ● 为什么强调“无侵入”? 业务适配、快速落地、定制需求等，有太多“侵入”的理由 ● 长期维护、社区对齐、版本演进等，一分“侵入”一分成本 ## 定开、维护的经验 ### 1. 原生的API，无侵入扩展直接使用做上层的封装、转换 “计算机科学领

0 码力 | - 页 | 1.28 MB | 1 年前
3
2.2.1通过Golang+eBPF实现无侵入应用可观测

## GCN ## 通过Golang + eBPF实现无侵入应用可观测 ![Image](/uploads/documents/d/0/2/8/d028cc07af07a8a0036272e9f1cb2f68/p1_1.jpg) 张海彬阿里云应用可观测技术专家 ![Image](/uploads/documents/d/0/2/8/d028cc07af07a8a0036272e9f1cb2f68/p2_1 jpg) 无侵入 ![Image](/uploads/documents/d/0/2/8/d028cc07af07a8a0036272e9f1cb2f68/p15_2.jpg) 多语言/多协议/多框架 ![Image](/uploads/documents/d/0/2/8/d028cc07af07a8a0036272e9f1cb2f68/p15_3.jpg) 全栈覆盖 ## 无侵入性 cb2f68/p27_1.jpg) 告警收敛，幸福感UP ## eBPF + Golang 在阿里云应用可观测的实践应用监控eBPF版 ## 无侵入的应用可观测 eBPF是一种在Linux内核运行的沙盒程序，无需修改任何应用代码，提供无侵入的应用无关、语言无关、框架无关的应用可观测能力，提供如网络、虚拟内存、系统调用等Otel无法获取的数据指标。 eBPF & Otel SDK均支持

0 码力 | 29 页 | 3.83 MB | 2 年前
3
机器学习课程-温州大学-08机器学习-集成学习

## 机器学习-集成学习黄海广副教授 2022年12月 ## 本章目录 01 集成学习方法概述 02 AdaBoost和GBDT算法 03 XGBoost 04 LightGBM ### 1. 集成学习方法概述 01 集成学习方法概述 02 AdaBoost和GBDT算法 03 XGBoost 04 LightGBM ## 集成学习 ## Bagging 从 ## 集成学习 ## Boosting 训练过程为阶梯状，基模型按次序——进行训练（实现上可以做到并行），基模型的训练集按照某种策略每次都进行一定的转化。对所有基模型预测的结果进行线性综合产生最终的预测结果。 ![Image](/uploads/documents/a/3/b/e/a3be2cf0225d91ae47bbea4a4089f601/p5_1.jpg) ## 集成学习 ## Stacking 2. 易于并行化，在大数据集上有很大的优势； 3. 能够处理高维度数据，不用做特征选择。 ## 随机森林 Random Forest（随机森林）是 Bagging 的扩展变体，它在以决策树为基学习器构建 Bagging 集成的基础上，进一步在决策树的训练过程中引入了随机特征选择，因此可以概括随机森林包括四个部分： 1. 随机选择样本（放回抽样）； 2. 随机选择特征; 3. 构建决策树；

0 码力 | 50 页 | 2.03 MB | 2 年前
3
机器学习课程-温州大学-05机器学习-机器学习实践

## 机器学习-机器学习实践黄海广副教授 2022年02月 ## 本章目录 01 数据集划分 02 评价指标 03 正则化、偏差和方差 ### 1. 数据集划分 ## 01 数据集划分 02 评价指标 03 正则化、偏差和方差 ### 1. 数据集划分训练集（Training Set）：帮助我们训练模型，简单的说就是通过训练集的数据让我们确定拟合曲线的参数。验证集（Validation >训练集验证集测试集三者划分：训练集、验证集、测试集机器学习：60%，20%，20%；70%，10%，20% 深度学习：98%，1%，1%（假设百万条数据） ## 交叉验证 ![Image](/uploads/documents/4/4/0/8/44080acc01be0b7f2aa90282cb8ae007/p5_1 选取代价函数值最小的模型 4. 用步骤3中选出的模型对测试集计算得出推广误差（代价函数的值） ## 不平衡数据的处理数据不平衡是指数据集中各类样本数量不均衡的情况. 常用不平衡处理方法有采样和代价敏感学习采样欠采样、过采样和综合采样的方法 ![Image](/uploads/documents/4/4/0/8/44080acc01be0b7f2aa90282cb8ae007/p6_1.jpg)

0 码力 | 33 页 | 2.14 MB | 2 年前
3
机器学习课程-温州大学-05深度学习-深度学习实践

## 深度学习-深度学习实践黄海广副教授 2023年03月 ## 本章目录 01 数据集划分 02 数据集制作 03 数据归一化/标准化 04 正则化 05 偏差和方差 ## 数据集划分训练集（Training Set）：帮助我们训练模型，简单的说就是通过训练集的数据让我们确定拟合曲线的参数。验证集（Validation Set）：也叫做开发集（Dev Set），用来做模型选择（model selection），即做模型的最终优化及确定的，用来辅助我们的模型的构建，即训练超参数，可选；测试集（Test Set）：为了测试已经训练好的模型的精确度。三者划分：训练集、验证集、测试集机器学习：60%，20%，20%；70%，10%，20% 深度学习：98%，1%，1%（假设百万条数据） ## 交叉验证 ![Image](/uploads/documents/2/a/7/7/2a77e24c5633c7605ed85cf4c6f7f8b7/p4_1 够让模型学习到更多更有效的特征，减小噪声的影响。 ### 2. 降维即丢弃一些不能帮助我们正确预测的特征。可以是手工选择保留哪些特征，或者使用一些模型选择的算法来帮忙（例如PCA）。 ### 3. 正则化正则化(regularization)的技术，保留所有的特征，但是减少参数的大小（magnitude），它可以改善或者减少过拟合问题。 ### 4. 集成学习方法集成学习是把多个

0 码力 | 19 页 | 1.09 MB | 2 年前
3
机器学习课程-温州大学-10机器学习-聚类

## 机器学习-聚类黄海广副教授 2023年04月 ## 本章目录 01 无监督学习概述 02 K-means聚类 03 密度聚类和层次聚类 04 聚类的评价指标 ### 1. 无监督学习概述 01 无监督学习概述 02 K-means聚类 03 密度聚类和层次聚类 04 聚类的评价指标 ### 1. 无监督学习方法概述 ## 监督学习和无监督学习的区别 ## ## 监督学习在一个典型的监督学习中，训练集有标签y，我们的目标是找到能够区分正样本和负样本的决策边界，需要据此拟合一个假设函数。 ## 无监督学习与此不同的是，在无监督学习中，我们的数据没有附带任何标签y，无监督学习主要分为聚类、降维、关联规则、推荐系统等方面。 ### 1. 无监督学习方法概述 ## 主要的无监督学习方法 ✓ 聚类（Clustering） ✓ 如何将教室里的学生按爱好、身高划分为5类？给他们推荐什么商品呢？ ### 1. 无监督学习方法概述 ## 聚类主要算法 K-means、密度聚类、层次聚类主要应用市场细分、文档聚类、图像分割、图像压缩、聚类分析、特征学习或者词典学习、确定犯罪易发地区、保险欺诈检测、公共交通数据分析、IT资产集群、客户细分、识别癌症数据、搜索引擎应用、医疗应用、药物活性预测…… ### 1. 无监督学习方法概述 ## 聚类案例 ### 1

0 码力 | 48 页 | 2.59 MB | 2 年前
3
机器学习课程-温州大学-02机器学习-回归

## 机器学习-第二章回归黄海广副教授 2022年09月 ## 本章目录 01 线性回归 02 梯度下降 03 正则化 04 回归的评价指标 ### 1. 线性回归 01 线性回归 02 梯度下降 03 正则化 04 回归的评价指标 ## 回归的概念 ## 监督学习分为回归和分类 ✓ 回归（Regression、Prediction） ✓ 如何预测上海浦东的房价？代表特征的数量 x 代表特征/输入变量 y 代表目标变量/输出变量 $ (x,y) $ 代表训练集中的样本 $ (x^{(i)}, y^{(i)}) $ 代表第 i 个观察样本 h 代表学习算法的解决方案或函数也称为假设（hypothesis） $ \widehat{y} = h(x) $ , 代表预测的值 $ x^{(i)} $ 是特征矩阵中的第 i 行，是一个向量。 \cdots+w_{n}x_{n}\end{array} $$ ![Image](/uploads/documents/9/9/0/e/990e7845b4e774c84fea91a89b00e1cf/p7_1.jpg) 机器学习算法可以设 $ x_{0}=1 $ 则： $ h(x)=w_{0}x_{0}+w_{1}x_{1}+w_{2}x_{2}+\ldots+w_{n}x_{n}=w^{T}X $ 注意：若表达式

0 码力 | 33 页 | 1.50 MB | 2 年前
3
机器学习课程-温州大学-01机器学习-引言

## 机器学习-引言黄海广副教授 2022年02月 ## 目录 01 机器学习概述 02 机器学习的类型 03 机器学习的背景知识 04 机器学习的开发流程 ### 1. 机器学习概述 01 机器学习概述 02 机器学习的类型 03 机器学习的背景知识 04 机器学习的开发流程 ## 机器学习与人工智能、深度学习的关系人工智能：机器展现的人类智能机器学习：计算机机器学习：计算机利用已有的数据(经验)，得出了某种模型，并利用此模型预测未来的一种方法。深度学习：实现机器学习的一种技术 ![Image](/uploads/documents/c/7/b/8/c7b85d1805db4f3c7d5012f0d747b787/p4_1.jpg) ## 机器学习界的执牛耳者 ![Image](/uploads/documents/c/7/b/8/c7b85d1805db4 度首席科学家。 ## 机器学习界的国内泰斗 ![Image](/uploads/documents/c/7/b/8/c7b85d1805db4f3c7d5012f0d747b787/p6_1.jpg) 李航, 现任字节跳动科技有限公司人工智能实验室总监, 北京大学、南京大学客座教授, IEEE 会士, ACM 杰出科学家, CCF 高级会员。代表作: 《统计学习方法》 ![Image]

0 码力 | 78 页 | 3.69 MB | 2 年前
3

共 1000 条前往

页

搜索

分类

语言

格式