机器学习课程-温州大学-13深度学习-Transformer[Image](/uploads/documents/a/b/7/b/ab7b254a5c187d70765c98d89cffb40d/p6_1.jpg) ### 1 \.Transformer介绍 ## Attention注意力机制 在介绍什么是注意力机制之前,先让大家看一张图片。当大家看到下面图片,会首先看到什么内容?当过载信息映入眼帘时,我们的大脑会把注意力放在主要的信息上,这就是大脑的注意力机制。 ! [Image](/uploads/documents/a/b/7/b/ab7b254a5c187d70765c98d89cffb40d/p7_1.jpg) ### 1 \.Transformer介绍 ## 每个词的Attention计算 ## 每个词的Q会跟整个序列中每一个K计算得分,然后基于得分再分配特征 Q: query,要去查询的 K: key,等着被查的 V: value,实际的特征信息 












