MoonBit月兔编程语言 现代编程思想 第十二课 案例:自动微分现代编程思想 案例:自动微分 Hongbo Zhang ## 微分 • 微分被应用于机器学习领域 ◦ 利用梯度下降求局部极值 牛顿迭代法求函数解: $ x^{3}-10x^{2}+x+1=0 $ • 我们今天研究简单的函数组合 ○ 例: $ f(x_{0},x_{1})=5x_{0}^{2}+x_{1} $ ■ $ f(10,100)=600 $ ■ $ \frac{\partial jpg) ## 牛顿迭代法  ## 微分 • 微分被应用于机器学习领域 ◦ 利用梯度下降求局部极值 牛顿迭代法求函数解: $ x^{3}-10x^{2}+x+1=0 $ • 我们今天研究简单的函数组合 ○ 例: $ f(x_{0}, f}{\partial x_{1}}(10,100)=1 $ ## 微分 • 函数微分的几种方式 ☐ 手动微分:纯天然计算器 ■ 缺点:对于复杂表达式容易出错 ○ 数值微分: $ \frac{f(x+\delta x)-f(x)}{\delta x} $ ■ 缺点:计算机无法精准表达小数,且绝对值越大,越不精准 符号微分:Mul(Const(2), Var(1)) -> Const(2)0 码力 | 30 页 | 3.24 MB | 2 年前3
深度学习与PyTorch入门实战 - 16. 什么是梯度## PyTorch ## 什么是梯度 主讲人:龙良曲 ## Clarification 导数, derive - 偏微分, partial derive 梯度, gradient $$ \nabla f=\left(\frac{\partial f}{\partial x_{1}};\frac{\partial f}{\partial x_{2}};\ldots;\frac{\partial0 码力 | 17 页 | 1.49 MB | 2 年前3
机器学习课程-温州大学-高等数学回顾## 机器学习-高等数学回顾 黄海广 副教授 2021年07月 ## 高等数学 ### 1. 导数定义: 导数和微分的概念 $$ f^{\prime}(x_{0})=\lim_{\Delta x\to0}\frac{f(x_{0}+\Delta x)-f(x_{0})}{\Delta x} $$ 或者: $ f'(x_{0}) = \lim_{x \to x_{0}} \frac{f(x) -uv^{\prime}}{v^{2}}(v\neq0) $ $$ d(\frac{u}{v})=\frac{vdu-udv}{v^{2}} $$ ## 高等数学 ### 6. 基本导数与微分表 (1) y = c (常数) 则: $ y' = 0 \quad dy = 0 $ (2) $ y = x^{\alpha} $ ( $ \alpha $ 为实数) 则: $ (16) y = chx 则: $ y' = shx $ $ d(chx) = shxdx $ ## 高等数学 ### 7. 复合函数,反函数,隐函数以及参数方程所确定的函数的微分法 (1) 反函数的运算法则: 设 $ y = f(x) $ 在点 x 的某邻域内单调连续,在点 x 处可导且 $ f'(x) \neq 0 $ ,则其反函数在点 x 所对应的 y 处可导,并且有0 码力 | 28 页 | 787.86 KB | 2 年前3
机器学习课程-温州大学-02-数学基础回顾-0.机器学习的数学基础整理(国内教材)机器学习的数学基础.....1 高等数学.....1 线性代数.....9 概率论和数理统计.....19 ## 机器学习的数学基础 ## 高等数学 ### 1. 导数定义: 导数和微分的概念 $$ f^{\prime}(x_{0})=\lim_{\Delta x\to0}\frac{f(x_{0}+\Delta x)-f(x_{0})}{\Delta x} $$ $$ \prime}-uv^{\prime}}{v^{2}}(v\neq0) $$ $$ d(\frac{u}{v})=\frac{vdu-udv}{v^{2}} $$ ### 6. 基本导数与微分表 (1) y = c (常数) 则: $ y' = 0 $ dy = 0 (2) $ y = x^{\alpha} $ ( $ \alpha $ 为实数) 则: $ y' = chxdx $ (16) y = chx 则: $ y' = shx $ $ d(chx) = shxdx $ ### 7. 复合函数,反函数,隐函数以及参数方程所确定的函数的微分法 (1) 反函数的运算法则:设 $ y = f(x) $ 在点x的某邻域内单调连续,在点x处可导且 $ f'(x) \neq 0 $ 。 0,则其反函数在点x所对应的y处可导,并且有 $0 码力 | 31 页 | 1.18 MB | 2 年前3
动手学深度学习 v2.0Li, and Alexander J. Smola Aug 18, 2023 Powered by TCPDF (www.tcpdf.org) ## 目录 前言 1 安装 9 符号 13 1 引言 17 2 预备知识 39 2.1 数据操作 40 2.1.1 入门 40 2.1.2 运算符 42 2.1.3 广播机制 44 2.3.11 关于线性代数的更多信息 ..... 62 2.4 微积分 ..... 63 2.4.1 导数和微分 ..... 64 2.4.2 偏导数 ..... 68 2.4.3 梯度 ..... 68 2.4.4 链式法则 ..... 68 2.5 自动微分 ..... 69 2.5.1 一个简单的例子 ..... 70 2.5.2 非标量变量的反向传播 .... 493 11.11.2 学习率调度器 ..... 495 11.11.3 策略 ..... 497 12 计算性能 12.1 编译器和解释器 ..... 503 12.1.1 符号式编程 ..... 504 12.1.2 混合式编程 ..... 506 12.1.3 Sequential的混合式编程 ..... 506 12.2 异步计算 ..... 508 120 码力 | 797 页 | 29.45 MB | 2 年前3
KiCad 5.1 Reference manual0 码力 | 27 页 | 327.91 KB | 2 年前3
机器学习课程-温州大学-06深度学习-优化算法jpg) 在第t次迭代中,该算法会照常计算当下mini-batch的微分dW,db,所以我会保留这个指数加权平均数,我们用到新符号 $ S_{dW} $ ,而不是 $ v_{dW} $ ,因此 $ S_{dW}=\beta S_{dW}+(1-\beta)dW^{2} $ ,澄清一下,这个平方的操作是针对这一整个符号的,这样做能够保留微分平方的加权平均数,同样 $ S_{db}=\beta S_{db}+(1-\beta)db^{2} S_{db}+(1-\beta)db^{2} $ ,再说一次,平方是针对整个符号的操作。 接着RMSprop会这样更新参数值, $ W := W - a \frac{dW}{\sqrt{S_{dW}}} $ , $ b := b - a \frac{db}{\sqrt{S_{db}}} $ , ## ADAM Adam优化算法基本上就是将Momentum和RMSprop结合在一起 最后更新权重,所以W更新后是0 码力 | 31 页 | 2.03 MB | 2 年前3
机器学习课程-温州大学-01深度学习-引言、文本校对、信息抽取、语音合成、语音识别等。可以说,自然语言处理就是要计算机理解自然语言,自然语言处理机制涉及两个流程,包括自然语言理解和自然语言生成,自然语言理解是让计算机把输入的语言变成有意思的符号和关系,然后根据目的再处理;自然语言生成则是把计算机数据转化为自然语言。实现人机间的信息交流,是人工智能界、计算机科学和语言学界所共同关注的重要问题。 自然语言处理技术的技术层次 ![Image |Φ|φ|phi|fai|斐| |X|χ|chi|khai|喜| |Ψ|ψ|psi|psai|普西| |Ω|ω|omega|omiga|欧米| ### 3. 深度学习的背景知识-数学基础 ## 高等数学 导数、微分、泰勒公式..... ## 线性代数 向量、矩阵、行列式、秩、线性方程组、特征值和特征向量..... ## 概率论与数理统计 随机事件和概率、概率的基本性质和公式、常见分布、期望、协方差.. x}\bigg|_{x=x_{0}}\quad 或 \quad\frac{\mathrm{d}f(x)}{\mathrm{d}x}\bigg|_{x=x_{0}} $$ ## 高等数学-基本导数与微分表 (1) y = c (常数) 则: $ y' = 0 $ (2) $ y = x^{\alpha} $ ( $ \alpha $ 为实数) 则: $ y' = \alpha0 码力 | 80 页 | 5.38 MB | 2 年前3
机器学习课程-温州大学-01机器学习-引言|Φ|φ|phi|fai|斐| |X|χ|chi|khai|喜| |Ψ|ψ|psi|psai|普西| |Ω|ω|omega|omiga|欧米| ### 3. 机器学习的背景知识-数学基础 ## 高等数学 导数、微分、泰勒公式..... ## 线性代数 向量、矩阵、行列式、秩、线性方程组、特征值和特征向量..... ## 概率论与数理统计 随机事件和概率、概率的基本性质和公式、常见分布、期望、协方差.. x}\bigg|_{x=x_{0}}\quad 或 \quad\frac{\mathrm{d}f(x)}{\mathrm{d}x}\bigg|_{x=x_{0}} $$ ## 高等数学-基本导数与微分表 (1) y = c (常数) 则: $ y' = 0 $ (2) $ y = x^{\alpha} $ ( $ \alpha $ 为实数) 则: $ y' = \alpha 用来存储一连串元素的容器,列表用[]来表示,其中元素的类型可不相同。 ## ●元组(tuple) 元组类似列表,元组里面的元素也是进行索引计算。列表里面的元素的值可以修改,而元组里面的元素的值不能修改,只能读取。元组的符号是() ## ●集合(set) 集合主要有两个功能,一个功能是进行集合操作,另一个功能是消除重复元素。集合的格式是: $ set() $ ,其中()内可以是列表、字典或字符串,因为字符串是以列表的形式存储的0 码力 | 78 页 | 3.69 MB | 2 年前3
机器学习课程-温州大学-02-数学基础回顾-1.CS229-LinearAlgebra备注:请关注github的更新,线性代数和概率论已经更新完毕。 ## CS229 机器学习课程复习材料-线性代数 CS229 机器学习课程复习材料-线性代数 线性代数复习和参考 1. 基础概念和符号 1.1 基本符号 2. 矩阵乘法 2.1 向量-向量乘法 2.2 矩阵-向量乘法 2.3 矩阵-矩阵乘法 3. 运算和属性 3.1 单位矩阵和对角矩阵 3.2 黑塞矩阵 4.3 二次函数和线性函数的梯度和黑塞矩阵 4.4 最小二乘法 4.5 行列式的梯度 4.6 特征值优化 ## 线性代数复习和参考 ### 1. 基础概念和符号 线性代数提供了一种紧凑地表示和操作线性方程组的方法。例如,以下方程组: $$ 4x_{1}-5x_{2}=-13 $$ $$ -2x_{1}+3x_{2}=9 $$ 这是两个方程和 -2&3\end{bmatrix},b=\begin{bmatrix}-13\\ 9\end{bmatrix} $$ 我们可以看到,这种形式的线性方程有许多优点(比如明显地节省空间)。 ### 1.1 基本符号 我们使用以下符号: • $ A \in R^{m \times n} $ ,表示 A 为由实数组成具有 m 行和 n 列的矩阵。 $ x \in R^{n} $ ,表示具有n个元素的向量。通常,向0 码力 | 19 页 | 1.66 MB | 2 年前3
共 576 条
- 1
- 2
- 3
- 4
- 5
- 6
- 58













