机器学习课程-温州大学-04机器学习-朴素贝叶斯## 机器学习-第四章 朴素贝叶斯 黄海广 副教授 2022年02月 ## 本章目录 01 贝叶斯方法 02 朴素贝叶斯原理 03 朴素贝叶斯案例 04 朴素贝叶斯代码实现 ### 1. 贝叶斯方法 ## 01 贝叶斯方法 02 朴素贝叶斯原理 03 朴素贝叶斯案例 04 朴素贝叶斯代码实现 ### 1. 贝叶斯方法-背景知识 贝叶斯分类: 贝叶斯分类是一类分类算法的总称 贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。 先验概率:根据以往经验和分析得到的概率。我们用 $ P(Y) $ 来代表在没有训练数据前假设Y拥有的初始概率。 后验概率:根据已经发生的事件来分析得到的概率。以 $ P(Y|X) $ 代表假设X成立的情下观察到Y数据的概率,因为它反映了在看到训练数据X后Y成立的置信度。 ### 1. 贝叶斯方法-背景知识 联合概率:联合概率是指在多元的概 事件共同发生的概率。 ### 1. 贝叶斯方法 ## 贝叶斯公式  $$ P(Y|X)=\frac{P(X,Y)}{P(X)}=\frac{P(X|Y)P(Y)}{P(X)} $$ 朴素贝叶斯法是典型的生成学习方法。生成方法由训练数据学习联合概率分布0 码力 | 31 页 | 1.13 MB | 2 年前3
Lecture Notes on Gaussian Discriminant Analysis, Naive0 码力 | 19 页 | 238.80 KB | 2 年前3
Lecture 5: Gaussian Discriminant Analysis, Naive Bayes0 码力 | 122 页 | 1.35 MB | 2 年前3
Qcon北京2018-《文本智能处理的深度学习技术》-陈运文隐层 后处理 表示层 不同深度学习模型 情感分析 结果 分词 NER 机器翻译 ## 文本分类 ## 达观数据 DATA GRAND ## 传统机器学习 - 选择分类器(朴素贝叶斯,SVM,KNN,LR,决策树) • 特征工程构造特征 不同领域定制优化成本高 - 常需要分类算法融合提升效果 ## 深度学习(CNN,RNN等) • 端到端,无需大量特征工程 • 框架通用性好,满足多领域需求 包含一个以上同一类型的关系,那么就采用就近原则来进行配对。 目前这套标签并不支持实体关系重叠的情况。 输入:美国总统特朗普将考察苹果公司,该公司由乔布斯创立。 标签: 输出:(美国,国家-总统,特朗普) (苹果公司,公司-创立者,乔布斯) ## 05 总结&QA ## 总结:深度学习用于文本挖掘的优缺点 优点: 1,可以使用非监督数据训练字词向量,提升泛化能力 2,端到端,提供新思路0 码力 | 46 页 | 25.61 MB | 2 年前3
机器学习课程-温州大学-Scikit-learn“1” 类的概率 ### 1. Scikit-learn概述 ## 监督学习算法-分类 逻辑回归 linear model.LogisticRegression 支持向量机 svm.SVC 朴素贝叶斯 naive bayes.GaussianNB K近邻 neighbors.NearestNeighbors ### 2. Scikit-learn主要用法 ## 监督学习算法-集成学习 sklearn0 码力 | 31 页 | 1.18 MB | 2 年前3
机器学习课程-温州大学-05机器学习-机器学习实践的。 ## 不需要做数据归一化/标准化 决策树、基于决策树的Boosting和Bagging等集成学习模型对于特征取值大小并不敏感,如随机森林、XGBoost、LightGBM等树模型,以及朴素贝叶斯,以上这些模型一般不需要做数据归一化/标准化处理。 ## 过拟合和欠拟合  • 逻辑回归(Logistic Regression) • 决策树(Decision Tree) - 随机森林(Random Forest) • 最近邻算法(k-NN) • 朴素贝叶斯(Naive Bayes) - 支持向量机(SVM) • 感知器(Perceptron) • 深度神经网络(DNN)  $ ,非概率模型则为 $ z = f(x) $ 。 其中,x是输入,z是输出。 ## 机器学习的概念-模型 决策树、朴素贝叶斯、隐马尔科夫模型、高斯混合模型属于概率模型。 感知机、支持向量机、KNN、AdaBoost、K-means以及神经网络均属于非概率模型。 对于非概率模型而言,可按照判别函数线性与否分成线性模型与非线性模型。0 码力 | 78 页 | 3.69 MB | 2 年前3
共 276 条
- 1
- 2
- 3
- 4
- 5
- 6
- 28













