长短期记忆(LSTM) - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

LSTM原理

## PyTorch ## LSTM 主讲人：龙良曲 ## The problem of long-term dependencies (Vanilla) RNNs connect previous information to present task: - enough for predicting the next word for “the clouds are in the sky” [Image](/uploads/documents/a/1/6/2/a1621b960ddea198d7320d4ff531e405/p5_1.jpg) The repeating module in an LSTM contains four interacting layers. ![Image](/uploads/documents/a/1/6/2/a1621b960ddea198d7320d4ff531e405/p5_2 ents/a/1/6/2/a1621b960ddea198d7320d4ff531e405/p6_2.jpg) An LSTM has three of these gates, to protect and control the cell state. ## LSTM : Forget gate ![Image](/uploads/documents/a/1/6/2/a1621b960d

0 码力 | 16 页 | 1.53 MB | 2 年前
3
2.1.5 千万级高性能长连接Go服务架构实践

GO CN 千万级高性能长连接Go服务架构实践彭宝江百度公司资深研发工程师统一长连接服务背景 01 统一长连接服务介绍 02 统一长连接服务架构 03 统一长连接golang实践 04 总结和规划 05 01统一长连接服务背景 ’ alt=‘OCR图片’/> 什么是长连接长连接长连接 APP生命期常驻支持全双工上下行提升实时性、互动性应用场景：消息&直播&PUSH ’ alt=‘OCR图片’/> 统一长连接服务背景 ’ alt=‘OCR图片’/> 02统一长连接服务介绍 ’ alt=‘OCR图片’/> 支持的业务场景业务支持能力推送场景推送预计UPS 消息请求转发下行推送单播/批量单播万级直播请求转发下行推送组播千万级云控请求转发下行推送批量单播百万级 PUSH 请求转发下行推送批量单播百万级统一长连接-功能目标统一长连接-功能目标功能目标服务能力服务特性服务接入 ’ alt=‘OCR图片’/> 统一长连接-性能目标性能项性能支持说明并发连接数千万级长连接支持横向扩容下行QPS 百万级批量单播推送千万级组播推送支持横向扩容服务延时毫秒级 - ’ alt=‘OCR图片’/> 统一长连接设计目标稳定性少出问题快速恢复高性能高并发高实时

0 码力 | 34 页 | 1.24 MB | 3 月前
3
Golang在接入层长连接服务中的实践-黄欣

## Golang 在接入层长连接服务中的实践黄欣基础平台—架构部 - 背景 - 架构 - 心得 ## 目录 - 背景 - 架构 - 心得 ## 目录 ## 背景—why 长连接? - 业务场景 - 大量实时计算 - 司机乘客撮合 - 实时计价 - 高频度的数据交互 - 坐标数据 - 计价数据 - launcher: 接收连接，接收请求，go出去，等待业务层返回结果，并write back business：业务代码，拿到请求自行处理，完事之后return到laucher backend：和长连接系统中的其他模块异步通信模块 storage：和存储交互模块，提供统一的封装 util：其他通用模块（时间轮、对象池、wait封装等） ## 心得—coding-实现 • 过程编程 - route

0 码力 | 31 页 | 1.67 MB | 2 年前
3
LSTM-Layer使用

## PyTorch ## LSTM使用主讲人：龙良曲 ![Image](/uploads/documents/a/c/6/5/ac65a7bf3d56750c5c5cfd5629ab64c6/p2_1.jpg) $$ \begin{pmatrix}\mathbf{i}^{(t)}\\\mathbf{f}^{(t)}\\\mathbf{o}^{(t)}\\\mathbf{g}^{(t) t)} $$ $$ \mathbf{h}^{(t)}=\mathbf{o}^{(t)}\circ\mathrm{t a n h}(\mathbf{c}^{(t)}). $$ ### nn.LSTM ## ___init___ • input_size – The number of expected features in the input x • hidden_size – The together to form a stacked LSTM, with the second LSTM taking in outputs of the first LSTM and computing the final results. Default: 1 ### LSTM.forward() - out, (ht, ct) = lstm(x, [ht_1, ct_1]) x: [seq

0 码力 | 11 页 | 643.79 KB | 2 年前
3
机器学习课程-温州大学-11深度学习-序列模型

2023年05月 ## 本章目录 01 序列模型概述 02 循环神经网络(RNN) 03 长短期记忆(LSTM) 04 双向循环神经网络 05 深层循环神经网络 ### 1. 序列模型概述 ## 01 序列模型概述 02 循环神经网络(RNN) 03 长短期记忆(LSTM) 04 双向循环神经网络 05 深层循环神经网络 ### 1. 序列模型概述循环神经网络（RN 循环神经网络可以解决时序问题 · 基于语言模型（LM），故可以捕捉时序规则信息它是如何实现的？ ### 2. 循环神经网络(RNN) 01 序列模型概述 02 循环神经网络(RNN) 03 长短期记忆(LSTM) 04 双向循环神经网络 05 深层循环神经网络 ### 2. 循环神经网络(RNN) ## RNN的前向传播 $$ a^{<0>}=0 $$ $$ a^{( and pear salad}) = 5.7 \times 10^{-10} $ , ### 3. 长短期记忆(LSTM) 01 序列模型概述 02 循环神经网络(RNN) 03 长短期记忆(LSTM) 04 双向循环神经网络 05 深层循环神经网络 ### 3. 长短期记忆 (LSTM) ![Image](/uploads/documents/0/2/e/f/02efafbc93

0 码力 | 29 页 | 1.68 MB | 2 年前
3
动手学深度学习 v2.0

.... 303 8.3.1 学习语言模型 ..... 303 8.3.2 马尔可夫模型与n元语法 ..... 305 8.3.3 自然语言统计 ..... 305 8.3.4 读取长序列数据 ..... 308 8.4 循环神经网络 ..... 312 8.4.1 无隐状态的神经网络 ..... 313 8.4.2 有隐状态的循环神经网络 ..... 313 8.4 335 9.1.1 门控隐状态 ..... 336 9.1.2 从零开始实现 ..... 338 9.1.3 简洁实现 ..... 341 9.2 长短期记忆网络（LSTM） ..... 342 9.2.1 门控记忆元 ..... 342 9.2.2 从零开始实现 ..... 345 9.2.3 简洁实现 ..... 348 9.3 深度循环神经网络 ..... 349 别）的预测概率；在这些情况下，模型只会将输入作为生成输出的“原料”，而不会“记住”输入的具体内容。如果输入的样本之间没有任何关系，以上模型可能完美无缺。但是如果输入是连续的，模型可能就需要拥有“记忆”功能。比如，我们该如何处理视频片段呢？在这种情况下，每个视频片段可能由不同数量的帧组成。通过前一帧的图像，我们可能对后一帧中发生的事情更有把握。语言也是如此，机器翻译的输入和输出都为文字序列。

0 码力 | 797 页 | 29.45 MB | 2 年前
3
Moonshot AI 介绍

产品Kimi智能助手中实现“无损长上下文窗口（Lossless Long Context Window）”，支持20万汉字输入，实现对长文本的无损记忆。OpenAI和Anthropic到11月才在Context Length上追上来，且在精度（无损记忆）和中文能力上Kimi智能助手依然领先。 b. 聚焦底层技术创新，不走技术捷径。最早提出 “Lossless Long Context 可以解决 90% ChatBots” 产品中排在第一；月环比增长率 94.1%，增长速度也在大模型创业公司的第一位。 ## “Kimi 智能助手” 详细介绍 Kimi 是由月之暗面（Moonshot AI）提供的超长记忆 AI 助手，支持约 20 万汉字的上下文输入，具备显著的中文优势，随时为你回答问题、速读文件、整理资料、激发灵感、辅助创作。你可以与 Kimi 聊天，发送网址链接，上传文件。提醒：对了，我们产品名字已更新为 everything Lossless long context is everything。这是我们跟杨植麟聊完两个小时后记忆最深刻的一个观点。这个技术判断在 23 年 10 月已经被传递出来，当时杨植麟创立的月之暗面发布了首个模型 moonshot 和智能助手 Kimi，支持 20 万字的输入。做 “长” 是因为杨植麟判断 AI-Native 产品的终极价值是提供个性化的交互，而 lossless long-context

0 码力 | 74 页 | 1.64 MB | 2 年前
3
2020美团技术年货算法篇

/4/42c4fbcf187df0f624a5e70022348082/p31_1.jpg) 图 3 Transformer 行为序列建模 ## 行为序列建模 ## 输入部分： · 分为短期行为序列和长期行为序列。 - 行为序列内部的每个行为原始表示是由商户 ID，以及一些商户泛化信息的 Embedding 进行 concat 组成。 · 每段行为序列的长度固定，不足部分使用零向量进行补齐。 Transformer 里面原生的正余弦以及距当前预测时间的时间间隔的位置编码都无效果，分析应该是我们在处理行为序列的时候，已经将序列切割成不同时间段，一定程度上包含了时序位置信息。为了验证这个想法，我们做了仅使用一个长序列的实验（对照组不加位置编码，实验组加位置编码，离线 NDCG 有提升），这验证了我们的猜测。 • Transformer 编码层不需要太多，层数过多导致模型过于复杂，模型收敛慢效果不好。 · 通过神经网络预训练方式来生成词向量（Word Embedding），极大地推动了深度自然语言处理的发展。针对 Word2vec 生成的固定词向量无法解决多义词的问题，2018 年，Allen AI 团队提出基于双向 LSTM 网络的 ELMo $ ^{[5]} $ 。ELMo 根据上下文语义来生成动态词向量，很好地解决了多义词的问题。2017 年底，Google 提出了基于自注意力机制的 Transformer $ ^{[6]}

0 码力 | 317 页 | 16.57 MB | 2 年前
3
【PyTorch深度学习-龙龙老师】-测试版202112

层使用方法 11.5 RNN 情感分类问题实战 11.6 梯度弥散和梯度爆炸 11.7 RNN 短时记忆 11.8 LSTM 原理 11.9 LSTM 层使用方法 11.10 GRU 简介 11.11 LSTM/GRU 情感分类问题再战 11.12 预训练的词向量 11.13 参考文献第12章自编码器算法应用在多层感知机上；1989 年 Yann LeCun 等人将 BP 算法应用在手写数字图片识别上，取得了巨大成功，这套系统成功商用在邮政编码识别、银行支票识别等系统上；1997 年，现在应用最为广泛的循环神经网络变种之一 LSTM 被 Jürgen Schmidhuber 提出；同年双向循环神经网络也被提出。遗憾的是，神经网络的研究随着以支持向量机(Support Vector Machine，简称 SVM)为代表的传 2D 图片的相关任务上取得较好的效果，具有时间维度信息的 3D 视频理解任务受到越来越多的关注。常见的视频理解任务有视频分类、行为检测、视频主体抽取等。常用的模型有 C3D、TSN、DOVF、TS_LSTM 等。图片生成(Image Generation) 是指通过学习真实图片的分布，并从学习到的分布中采样而获得逼真度较高的生成图片。目前常见的生成模型有 VAE 系列、GAN 系列等。其中 GAN

0 码力 | 439 页 | 29.91 MB | 2 年前
3
Keras: 基于 Python 的深度学习库

2 基于多层感知器的二分类 3.1.5.3 类似 VGG 的卷积神经网络 3.1.5.4 基于 LSTM 的序列分类 3.1.5.5 基于 1D 卷积的序列分类 3.1.5.6 基于栈式 LSTM 的序列分类 3.1.5.7 带有状态 (stateful) 的相同的栈式 LSTM 模型 3.2 函数式 API 指引 3.2.1 开始使用 Keras 函数式 API 1 RNN [source] ..... 89 5.6.2 SimpleRNN [source] ..... 91 5.6.3 GRU [source] ..... 92 5.6.4 LSTM [source] ..... 94 5.6.5 ConvLSTM2D [source] ..... 95 5.6.6 SimpleRNNCell [source] ..... 97 5.6 Keras 更深入的教程，请查看： • 开始使用 Sequential 顺序模型 • 开始使用函数式 API 在代码仓库的 examples 目录中，你会找到更多高级模型：基于记忆网络的问答系统、基于栈式 LSTM 的文本生成等等。 ### 1.4 安装指引在安装 Keras 之前，请安装以下后端引擎之一：TensorFlow，Theano，或者 CNTK。我们推荐 TensorFlow 后端。

0 码力 | 257 页 | 1.19 MB | 2 年前
3

共 679 条前往

页

搜索

分类

语言

格式