机器学习课程-温州大学-09机器学习-支持向量机C&\geq\alpha_{i}\geq0,i=1,2,\cdots,m\quad&\sum_{i=1}^{m}\alpha_{i}y_{i}=0\end{aligned} $$ 软间隔 C为惩罚参数,C值越大,对分类的惩罚越大。跟线性可分求解的思路一致,同样这里先用拉格朗日乘子法得到拉格朗日函数,再求其对偶问题。 ### 3. 线性支持向量机 ## ξ 为"松弛变量" $$ \xi_{i}=\mathsf{m 这三个常用的核函数中,只有高斯核函数是需要调参的。 ### 4. 线性不可分支持向量机 ## SVM的超参数 $ \gamma $ 越大,支持向量越少, $ \gamma $ 值越小,支持向量越多。其中 C 是惩罚系数,即对误差的宽容度。C越高,说明越不能容忍出现误差,容易过拟合。C越小,容易欠拟合。 ,采样参数的本质就是在此基础上,根据不同策略 “重新调整”或“截断”分布,从而改变大模型输出的下一个token。 Temperature:温度是控制模型输出“随机性”与“确定性”的关键参数。其原理是引入温度系数 $ T > 0 $ ,将Softmax改写为 $ p_{i}^{(T)}=\frac{e^{z_{i}/T}}{\sum_{i=1}^{k}e^{z_{j}/T}}。 $ 当T变小时,分布“更加陡 与Top-k的区别与联系:相对于固定截断大小的Top-k,Top-p能动态适应不同分布的“长尾”特性,对概率分布不均匀的极端情况的适应性更好。 在文本生成中,当同时设置 Top-p、Top-k 和温度系数时,这些参数会按照分层过滤的方式协同工作,其优先级顺序为:温度调整 $\rightarrow$ Top-k $\rightarrow$ Top-p。温度调整整体分布的陡峭程度,Top-k 会先保留概率最高的 memory_time).total_seconds() / 3600 # 指数衰减:24小时内保持高分,之后逐渐衰减 decay_factor = 0.1 # 衰减系数 recency_score = math.exp(-decay_factor * age_hours / 24) return max(0.1, recency_score)0 码力 | 633 页 | 58.72 MB | 1 月前3
【PyTorch深度学习-龙龙老师】-测试版2021129所示。划分过的训练集与原来的训练集的功能一致,用于训练模型的参数,而验证集则用于选择模型的超参数(模型选择,Model selection),它的功能包括: ☐ 根据验证集的性能表现来调整学习率、权值衰减系数、训练次数等。 ☐ 根据验证集的性能表现来重新调整网络拓扑结构。 ☐ 根据验证集的性能表现判断是否过拟合和欠拟合。 和训练集-测试集的划分类似,训练集、验证集和测试集可以按着自定义的比例来划分 \cdots,\beta_{n} $ 均为0,那么网络的实际容量退化到k次多项式的函数容量。因此,通过限制网络参数的稀疏性,可以来约束网络的实际容量。 这种约束一般通过在损失函数上添加额外的参数稀疏性惩罚项实现,在未加约束之前的优化目标是 $$ \min\mathcal{L}(f_{\theta}(\boldsymbol{x}),y),(\boldsymbol{x},y)\in\mathbb{D}^{train} 超参数,可以获得较好的训练性能,同时保证网络的稀疏性,从而获得不错的泛化能力。 常用的正则化方式有 L0、L1、L2 正则化。 #### 9.5.1 L0 正则化 L0 正则化是指采用 L0 范数作为稀疏性惩罚项 $ \Omega(\theta) $ 的正则化计算方式,即 $$ \varOmega(\theta)=\sum_{\theta_{i}}\|\theta_{i}\|_{0} $$ 其中0 码力 | 439 页 | 29.91 MB | 2 年前3
动手学深度学习 v2.0束时:当智能体获胜时,智能体可以得到奖励1;当智能体失败时,智能体将得到奖励-1。因此,强化学习者必须处理学分分配(credit assignment)问题:决定哪些行为是值得奖励的,哪些行为是需要惩罚的。就像一个员工升职一样,这次升职很可能反映了前一年的大量的行动。要想在未来获得更多的晋升,就需要弄清楚这一过程中哪些行为导致了晋升。 强化学习可能还必须处理部分可观测性问题。也就是说,当前的观察 set_axes(axes, xlabel, ylabel, xlim, ylim, xscale, yscale, legend) 现在我们可以绘制函数 $ u=f(x) $ 及其在x=1处的切线y=2x-3,其中系数2是切线的斜率。 x = np.arange(0, 3, 0.1) plot(x, [f(x), 2 * x - 3], 'x', 'f(x)', legend=['f(x)' b)=\frac{1}{2}\left(\hat{y}^{(i)}-y^{(i)}\right)^{2}. $$ 常数 $ \frac{1}{2} $ 不会带来本质的差别,但这样在形式上稍微简单一些(因为当我们对损失函数求导后常数系数为1)。由于训练数据集并不受我们控制,所以经验误差只是关于模型参数的函数。为了进一步说明,来看下面的例子。我们为一维情况下的回归问题绘制图像,如图3.1.1所示。 图3.1.1: 用线性模型拟合数据。0 码力 | 797 页 | 29.45 MB | 2 年前3
Keras: 基于 Python 的深度学习库..... 231 16 正则化 Regularizers ..... 232 16.1 正规化的使用 ..... 232 16.2 例子 ..... 232 16.3 可用的惩罚 ..... 232 16.4 开发新的正则化器 ..... 232 ## 目录 17 约束 Constraints 233 17.1 约束项的使用 233 17.2 可用的约束 233 'accuracy'}。 - loss_weights: 可选的指定标量系数(Python 浮点数)的列表或字典,用以衡量损失函数对不同的模型输出的贡献。模型将最小化的误差值是由 loss_weights 系数加权的加权总和误差。如果是列表,那么它应该是与模型输出相对应的 1:1 映射。如果是张量,那么应该把输出的名称(字符串)映到标量系数。 - sample_weight_mode: 如果你需要执行按时间步采样权重(2D 可以是任意的。如果将该层作为模型的第一层,则需要指定 input_shape 参数(整数元组,不包含样本数量的维度)。 ## 输出尺寸 与输入相同。 ## 参数 • alpha: float >= 0。负斜率系数。 ## 参考文献 • Rectifier Nonlinearities Improve Neural Network Acoustic Models #### 5.9.2 PReLU [source]0 码力 | 257 页 | 1.19 MB | 2 年前3
数字货币交易系统架构 Python实现 黄毅9_2.jpg) ## 交易系统架构设计-关键点 • 内存撮合服务的状态持久化和高可用 消息处理顺序的保证 • 异步服务之间消息传送的可靠性 • K线:实时的分组聚合操作 • 高效利用关系数据库  ## 交易系统架构设计-架构图 [offset])  ## 交易系统架构设计-关系数据库批量操作 insert into trades values (1, ...) (2, ...) ... psycopg2.extras.execute_values( cur, 'insert 'trades')  ## 交易系统架构设计-关系数据库批量操作 with tmp(id, amount) as ( values (1, ...), (2, ...), (3, ...)) update orders set amount=tmp0 码力 | 24 页 | 799.65 KB | 2 年前3
机器学习课程-温州大学-01机器学习-引言{n=1}^{N}L\big(y_{n},f(x_{n})\big) $$ 其中, $ J(f) $ 代表对模型复杂度的惩罚。模型越复杂, $ J(f) $ 越大,模型越简单, $ J(f) $ 就越小。 $ \lambda $ 是一个正的常数,也叫正则化系数,用于平衡经验风险和模型复杂度。 一般来说,结构风险小的模型需要经验风险和模型复杂度同时小,因此对训练数据和测试数据都能有较好的拟合。0 码力 | 78 页 | 3.69 MB | 2 年前3
机器学习课程-温州大学-10机器学习-聚类colspan="2">ARI0.9517 0.2673 0 0.5414 ## DBSCAN超参数案例 聚类的评价指标 ## (4) 轮廓系数 样本i的轮廓系数: $$ s(i)=\frac{b(i)-a(i)}{max\{a(i),b(i)\}} $$ 簇内不相似度:计算样本i到同簇其它样本的平均距离为 $ a(i) $ ,应尽可能小。 簇间不相似度:计算样本i到其它簇 $ C_{j} $ 的所有样本的平均距离 $ b_{ij} $ ,应尽可能大。 轮廓系数 $ s(i) $ 值越接近1 值越接近1表示样本i聚类越合理,越接近-1,表示样本i应该分类到另外的簇中,近似为0,表示样本i应该在边界上;所有样本的 $ s(i) $ 的均值被成为聚类结果的轮廓系数。 假设数据集被拆分为4个簇,样本i对应的 $ a(i) $ 值就是所有 $ C_{1} $ 中其他样本点与样本i的距离平均值; 样本对应的 $ b(i) $ 值分两步计算,首先计算该点分别到 $ C_{2} $ 、 $ C_{3} $轮廓系数 0.6255 -0.3659 0.0611 0.3845 0 码力 | 48 页 | 2.59 MB | 2 年前3
FISCO BCOS 1.3 中文文档考虑到POW的短板,行业里提出了PoS(Proof Of Stake)权益证明的思路。 PoS的基本思想是让在网络中拥有更多权益的人有机会在更短时间里做更多的决定,因为毕竟权益持有者人更倾向维护网络的利益,且害怕作恶后被惩罚,损伤自己的声望和财产。 PoS的算法实现有很多变种,其中一个比较典型的是引入了“币龄”的概念,比如,一个人手里拿了一笔钱,而且持续拿了一段时间,那么基本上可以认为这个人是比较忠于这个网络的,他的 —持有权益较多的一拨人竞争或轮流记账。 2. 做为互相不信任的参与者,为什么要接受和相信某一个人给出的记账。 ——记账者用自己的财力做为背书,大家相信他们不会轻易作恶,如果作恶,可以用经济方式惩罚他。 3. 怎么保证大家最终收到的结果都是一致的,无错的。 —通过验证记账权益和数据,大家相信这一轮的记账者,一致使用他的记账结果。 在PoS的基础上,又发展出了一个DPoS的共识算法。和Po 体本身是权益所有人,看起来更民主,更开放。网络参与者做为选民有机会选出自己的代表,来给自己的利益代言。如果选出的代表不作为(轮到自己记账时不记账),或者作恶,可以把他们踢掉,如有必要进行惩罚(选民们也有可能被惩罚)。否则记账者有机会获得相应的奖励,也有可能将奖励发放给选出自己的民众们。 ## 总结一下DPoS : 1. 谁在这个网络里有记账权,也就是做为leader发起一次记账。 —拥有权益的散户,分别选出自己的代表参与记账。0 码力 | 491 页 | 5.72 MB | 2 年前3
2020美团技术年货 算法篇job;一个订单的两个任务取餐和送餐,可以认为是一个 job 的 operation。任意两个任务点之间的通行时间,可以认为是序列相关的准备时间。每一单承诺的送达时间,包括预订单和即时单,可以映射到流水线调度问题中的提前和拖期惩罚上。 ## 算法应用效果 做了这样的建模转换之后,流水线调度问题就有大量的启发式算法可以借鉴。我们把一个经典的基于问题特征的启发式算法做了适当适配和改进,可以得到非常好的效果。相比于之前的算法, 预估方式中的 u2i(user2item)的兴趣建模。并且,我们采用基于 i2i 图的多跳游走进行候选样本生成,代替基于 Pageview 样本生成思路。同时,在构图过程、i2i 建模过程我们引入了流行度惩罚。最终有效地解决了上面的偏差挑战。 ## 竞赛技术方案 针对选择性偏差和流行度偏差两方面挑战,我们进行了建模设计,有效地优化了上述偏差。已有的 CTR 建模方法可以理解为 u2i 的建模,通常刻 关系可以探索更多无偏数据来增大商品候选集和训练集,达到了缓解选择性偏差的目的。同时,考虑到流行商品引起的流行度偏差,我们在构图过程中对边权引入流行度惩罚,使得多跳游走时更有机会探索到低流行度的商品,同时在建模过程以及后处理过程中我们也引入了流行度惩罚,缓解了流行度偏差。 最终,我们形成了一个基于 i2i 建模的排序框架,框架图如图 4 所示。在我们的框架中商品推荐过程被分为三个阶段,第一个阶段是基于用户行为数据和商品多模态数据构建0 码力 | 317 页 | 16.57 MB | 2 年前3
共 243 条
- 1
- 2
- 3
- 4
- 5
- 6
- 25













