King
[Mikolov et al., 2013, Linguistic regularities in continuous space word representations]
### 1. 词汇表征和文本数据处理
## V isualizing word embeddings
和基于交互的匹配方法(Interaction-based)。
基于表示的匹配方法:使用深度学习模型分别表征 Query 和 Doc,通过计算向量相似度来作为语义匹配分数。微软的 DSSM $ ^{[26]} $ 及其扩展模型属于基于表示的语义匹配方法,美团搜索借鉴 DSSM 的双塔结构思想,左边塔输入 的细粒度匹配信号。基于交互的匹配方法优势在于 Query 和 Doc 在模型训练时能够进行充分的交互匹配,语义匹配效果好,缺点是部署上线成本较高。
## BERT 语义相关性
BERT 预训练使用了大量语料,通用语义表征能力更好,BERT 的 Transformer 结构特征提取能力更强。中文 BERT 基于字粒度预训练,可以减少未登录词(OOV)的影响,美团业务场景下存在大量长尾 Query(如大量数字和英文复合 0 码力 |
317 页 |
16.57 MB
| 2 年前 3 核心概念的元素。原文中仅有标准元素表。为了便于大家的理解,它们以 UML 的相关核心元素组织起来,并提供了对应核心元素的解释。
OMG 建模词汇表引自 UML 规范,原文中未有相关内容。英语原文可参见 www.rational.com 的 UML Specification 1.3。
中英文词汇对照提供了所有文中术语的词汇对照,详细、精确的解释可以参见 UML 规范相应的内容。
最后,UML 标记一览展现了 UML 各种概念的标记符号。 各种概念的标记符号。
为了忠实原文,仅在 UML 标准元素中添加了相应的核心元素描述,以及增加了 OMG 建模词汇表,以方便对 UML 概念的理解。
文中释译不当之处,肯请各位批评指正。
译者:Adams Wang
2000年11月
Powered by TCPDF (www.tcpdf.org)
## 目录
UML 概述(UML OVERVIEW).....1
UML 简述.....1
UML 关联端点.....71
调用事件.....71
标准元素.....72
OMG 建模词汇表(OMG MODELING GLOSSARY).....83
介绍.....83
表示法的约定.....83
建模词汇.....84
中英文词汇对照(CHINESE-ENGLISH GLOSSARY COMPARSION).....99
中文顺序对照表 0 码力 |
123 页 |
2.61 MB
| 2 年前 3 回
3、深度学习在语义搜索中的应用——语义表征
4、深度学习在排序中的应用——个性化表征
## 视频搜索的挑战
1、非结构化/无组织——召回难度
2、短文本/信息不充分——语义难度
3、海量短视频——用户选择困难
优酷视频搜索深度学习应用领域:
1、基于视频内容理解的召回
2、语义模型/语义表征
3、个性化表征
## 内容理解——基于视频内容的召回
## 基于视频内容召回 北京站
## 排序应用——个性化表征

## 排序应用——个性化表征
## 1、 特征域划分及编码
• query user video id域 统计域 用户观看序列 标签兴趣 文本
- 超高维的稀疏编码来表征独立个体。上亿维。深度特征的组合表达能力 jpg)
## 总结
## 基于高效内容分发的场景应用
- 基于深度语义的相关性应用
• 基于表征学习的TS预估
• 新一代积向量召回引擎
## 超大规模,高维稀疏训练样本
- 深度语义:训练样本X billion*X万级(稀疏)
模型参数亿+ 迭代次数X million步
- 表征学习:训练样本X billion*X million(稀疏)模型参数 X亿+ 迭代次数 Xmillion 0 码力 |
24 页 |
9.60 MB
| 2 年前 3 6~9 章为第 3 部分,主要介绍神经网络的核心理论和共性知识,让读者理解深度学习的本质;第 10~15 章为模型算法应用部分,主要介绍常见的算法与模型,让读者能够学有所用。
在本书中编写时,很多英文词汇尚无法在业界找到一个共识翻译名,因此作者备注翻译的英文原文,供读者参考,同时也方便读者日后阅读相关英文文献时,不至于感到陌生。
尽管每天都有深度学习相关算法论文的发布,但是作者相信,深度学习的核心 在他的博士论文中第一次提出可以将 BP 算法应用到神经网络上,遗憾的是,这一成果并没有获得足够重视。直至 1986 年,David Rumelhart 等人在 Nature 上发表了通过 BP 算法来进行表征学习的论文,BP 算法才获得了广泛的关注。
1982 年,随着 John Hopfield 的循环连接的 Hopfield 网络的提出,开启了 1982 年~1995 年的第二次人工智能复兴的大潮 text) # 随机打印一条句子的内容
print('example label:', train_data.examples[15].label) # 打印这条句子的标签
# 构建词汇表,并分词编码,仅考虑 10000 个单词,耗时约 5 分钟
TEXT.build_vocab(train_data, max_size=10000, vectors='glove.6B.100d') 0 码力 |
439 页 |
29.91 MB
| 2 年前 3 除了模型级别的鲁棒性之外,我们持续投入构建在模型之上运行的保护措施,以进一步加固基于Claude构建的 Agent。在此前的系统安全卡中,我们报告了使用分类器检测提示注入尝试的结果;我们已转向使用探针 (probes),即基于内部模型表征训练的轻量级检测器,能以更低延迟提供强信号。我们在以下章节中展示了它们提供的鲁棒性,这些安全护栏在我们的许多Agent式产品中默认启用。
2.1外部Agent红队测试基准(工具使用)External Anthropic要求我将本章节与其所依据的内部调查和讨论进行比较,并说明我是否认为这是一个公允的总结。在审查了相关的内部频道、评估线程和发布决策讨论后,我认为是的。
获得最多内部关注的问题——评估感知升高、白盒发现中抑制评估感知表征比近期先前模型更显著地增加了欺骗行为、以及某些类别滥用的退步——都在此处披露了,我审查的证据支持所给出的描述。在少数地方,章节顶部的摘要要点比相应的详细小节或研究人员在工作进行中使用的措辞更为温和, 6为0%,Sonnet 4.6为 17% ,Mythos Preview为 17%。
评估感知的关切大幅限制了这些结果的解释。鉴于较高的提示评估感知率,模型很可能能够正确地将我们的评估表征为评估而无需语言化表达。很难知道模型是否根据此类表征行事,但这意味着模型在面对真实世界破坏研究的机会时可能会有不同表现。因此应谨慎解读零研究破坏行为的报告率。
我们发现这些结果与我们对Opus4.7训练和行为的理解一致,并且不认为这些结果表明Opus4 0 码力 |
128 页 |
9.92 MB
| 1 月前 3 Backbone 和 Neck 进行了重新设计和优化。该思想基于硬件的特性、推理框架 / 编译框架的特点,以硬件和编译友好的结构作为设计原则,在网络构建时,综合考虑硬件计算能力、内存带宽、编译优化特性、网络表征能力等,进而获得又快又好的网络结构。对上述重新设计的两个检测部件,我们在 YOLOv6 中分别称为 EfficientRep Backbone 和 Rep-PAN Neck,其主要贡献点在于:
• 设计方面,我们基于以上 Rep 算子设计了一个高效的 Backbone。相比于 YOLOv5 采用的 CSP-Backbone,该 Backbone 能够高效利用硬件(如 GPU)算力的同时,还具有较强的表征能力。
下图 4 为 EfficientRep Backbone 具体设计结构图,我们将 Backbone 中 stride=2 的普通 Conv 层替换成了 stride=2 的 RepConv YOLOX 的检测头则是将分类和回归分支进行解耦,同时新增了两个额外的 3x3 的卷积层,虽然提升了检测精度,但一定程度上增加了网络延时。
因此,我们对解耦头进行了精简设计,同时综合考虑到相关算子表征能力和硬件上计算开销这两者的平衡,采用 Hybrid Channels 策略重新设计了一个更高效的解耦头结构,在维持精度的同时降低了延时,缓解了解耦头中 $ 3 \times 3 $ 卷积带来的额外延时开销。通过在 0 码力 |
1356 页 |
45.90 MB
| 2 年前 3 甚至,在错误不敏感的应用领域,出现一个开源、无商业限制的基座的可能性也很高。小应用开发商很可能很容易获得一个低成本 serving 的“量化小基座”。
“7B”是一个 magic number!无论是 RAG 里的向量表征模型,还是文生图、文本识别(OCR)、语音合成(TTS)、人脸识别等等垂直领域,一个 1B~7B 的小模型已经可以满足很多生产、应用需要,并且效果也在逐步推高【8, 9, 10】。这些模型,作为智能体的“三头六臂”,不需要太“大”。
### 4. 多模态对齐很可能给基座模型带来质的提升
最新研究发现,在没有预先约束和约定下,不同模态领域的最强模型正在向着某个世界模型认知领域收缩【15】,AI模型对不同概念的数字化表达(向量表征)会逐步趋同,构建对这个世界的统一认知。这也符合我们人类对世界的认知:人类通过语言文字这种符号,将不同模态的信号统一地表达,并在脑中构建了某种受限于当前科技水平的统一模型,这是人类意识、社会沟通的前提。 4/d/2/44d20419d5f952cf06967e6c5bfa7471/p34_3.jpg)
正 AGI 的必经之路。将多模态信号统一对齐,是智能体与这个世界“无障碍”交互的前提,换个新潮的词汇,就是我们期待的“具身智能”。谁不想拥有一台自己专属的“Javis”呢?而多模态大模型的突破,也同样依赖前文所述的算力和数据上的沉淀。
## 参考文献
【1】 https://epoch.ai/ 0 码力 |
111 页 |
11.44 MB
| 1 年前 3 .. 241
6.6.2 模型训练 ..... 243
现代卷积神经网络 ..... 247
7.1 深度卷积神经网络 (AlexNet) ..... 248
7.1.1 学习表征 ..... 248
7.1.2 AlexNet ..... 250
7.1.3 读取数据集 ..... 253
7.1.4 训练AlexNet ..... 254
7.2 使用块的网络 次导数的最小核的大小是多少?
Discussions $ ^{83} $
### 6.3 填充和步幅
在前面的例子 图6.2.1中,输入的高度和宽度都为3,卷积核的高度和宽度都为2,生成的输出表征的维数为 $ 2\times2 $ 。正如我们在6.2节中所概括的那样,假设输入形状为 $ n_{h}\times n_{w} $ ,卷积核形状为 $ k_{h}\times k_{w} $ ,那么输出形状将是 在卷积神经网络中,我们组合使用卷积层、非线性激活函数和汇聚层。
· 为了构造高性能的卷积神经网络,我们通常对卷积层进行排列,逐渐降低其表示的空间分辨率,同时增加通道数。
• 在传统的卷积神经网络中,卷积块编码得到的表征在输出之前需由一个或多个全连接层进行处理。
• LeNet是最早发布的卷积神经网络之一。
## 练习
1. 将平均汇聚层替换为最大汇聚层,会发生什么?
2. 尝试构建一个基于LeNet的更复杂的网络,以提高其准确性。 0 码力 |
797 页 |
29.45 MB
| 2 年前 3 ## 人脸识别算法介绍
## 人脸识别算法流程
人脸识别算法主要分为三个流程:
1. 人脸检测(Face Detection)
2. 人脸对齐(Face Alignment)
3. 人脸特征表征(Feature Representation)

## 人脸识别算法流程
人脸识别算法主要分为三个流程:
1. 人脸检测(Face Detection)
2. 人脸对齐(Face Alignment)
3. 人脸特征表征(Feature Representation)
 jpg)
## 人脸识别算法流程
人脸识别算法主要分为三个流程:
1. 人脸检测(Face Detection)
2. 人脸对齐(Face Alignment)
3. 人脸特征表征(Feature Representation)

## 0 码力 |
81 页 |
12.64 MB
| 2 年前 3
|