pdf文档 Qcon北京2018-《文本智能处理的深度学习技术》-陈运文

25.61 MB 46 页 0 评论
语言 格式 评分
中文(简体)
.pdf
3
摘要
文档介绍了达观数据在文本智能处理领域的技术应用及实践经验。深度学习在文本挖掘中具有优点,如利用非监督数据训练字词向量、端到端模型提供新思路、克服传统模型缺点,但也存在小数据效果有限、调参工作量大、硬件环境限制等缺点。实践中建议结合业务场景选择模型,初期使用传统机器学习-model作为baseline,难题可尝试端到端方法。NLP的应用包括文本分类、情感分析、机器翻译等,达观数据专注于文本处理,为多行业提供服务。
AI总结
### 总结:文本智能处理的深度学习技术 #### 讲座背景与讲者介绍 - **讲者**:陈运文,达观数据CEO,专注于企业文本挖掘技术,拥有30项国家技术发明专利和15篇国际学术论文。 - **公司**:达观数据是全球领先的文本智能处理专家,提供文本挖掘、知识图谱、搜索引擎和个性化推荐等服务,覆盖金融、制造、法律、电商、传媒等行业,为数百家知名客户提供服务。 #### 文本智能处理背景 - **自然语言处理(NLP)**:旨在让机器理解人类语言,应用于文本分类、情感分析、机器翻译等领域。 - **文本处理任务**:包括分词、命名实体识别、情感分析等,属于人工智能细分领域。 #### 深度学习在文本处理中的应用框架 - **处理流程**:文本数据预处理、深度学习模型选择、表示层和隐层处理、后处理。 - **常见模型**:适用于文本分类、情感分析、机器翻译等任务。 #### 深度学习优缺点分析 - **优点**: - 非监督数据训练字词向量,提升泛化能力。 - 端到端方法提供新思路。 - 克服传统模型缺点。 - **缺点**: - 小数据量效果有限。 - 调参工作量大。 - 硬件环境部署受限。 #### 实践经验与建议 1. 理解数据本质,选择合适模型。 2. 初始阶段使用传统机器学习模型验证。 3. 对难题尝试端到端方法。 4. 不断实验,积累经验。 ### 核心观点:深度学习在文本挖掘中的应用需权衡优缺点,结合实际业务场景选择合适方法。
P1
P2
P3
P4
P5
P6
P7
P8
P9
P10
P11
P12
下载文档到本地,方便使用
- 可预览页数已用完,剩余 34 页请下载阅读 -
文档评分
请文明评论,理性发言.