序列分类Tensorflow - LSTM

基础概念

序列分类是指将一个输入序列（如文本、时间序列数据等）分类到预定义的类别中。TensorFlow 是一个开源的机器学习框架，提供了丰富的工具和库来构建和训练各种机器学习模型。LSTM（长短期记忆网络）是一种特殊的循环神经网络（RNN），能够捕捉序列数据中的长期依赖关系。

优势

处理时间序列数据：LSTM 特别适合处理时间序列数据，因为它能够记住过去的信息并用于当前的决策。
捕捉长期依赖：传统的 RNN 在处理长序列时容易发生梯度消失或梯度爆炸问题，而 LSTM 通过其门控机制有效地解决了这些问题。
灵活性：LSTM 可以应用于各种序列分类任务，如情感分析、语音识别、股票价格预测等。

类型

单层 LSTM：最简单的 LSTM 结构，只有一个 LSTM 层。
多层 LSTM：包含多个 LSTM 层，可以捕捉更复杂的模式。
双向 LSTM：同时考虑序列的前向和后向信息，能够更好地理解上下文。

应用场景

自然语言处理：如情感分析、文本分类、机器翻译等。
语音识别：将语音信号转换为文本并进行分类。
时间序列预测：如股票价格预测、天气预报等。

示例代码

以下是一个使用 TensorFlow 和 Keras 构建简单 LSTM 分类模型的示例代码：

import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense, Embedding
from tensorflow.keras.preprocessing.sequence import pad_sequences
from tensorflow.keras.preprocessing.text import Tokenizer

# 假设我们有一些文本数据和对应的标签
texts = ["I love this movie", "This is a bad movie", "Great acting in this film"]
labels = [1, 0, 1]  # 1 表示正面情感，0 表示负面情感

# 文本预处理
tokenizer = Tokenizer(num_words=5000)
tokenizer.fit_on_texts(texts)
sequences = tokenizer.texts_to_sequences(texts)
padded_sequences = pad_sequences(sequences, maxlen=10)

# 构建模型
model = Sequential()
model.add(Embedding(input_dim=5000, output_dim=128, input_length=10))
model.add(LSTM(128))
model.add(Dense(1, activation='sigmoid'))

# 编译模型
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

# 训练模型
model.fit(padded_sequences, labels, epochs=10, batch_size=32)

# 评估模型
loss, accuracy = model.evaluate(padded_sequences, labels)
print(f'Loss: {loss}, Accuracy: {accuracy}')

参考链接

常见问题及解决方法

梯度消失或梯度爆炸：
- 使用 LSTM 的门控机制可以有效缓解这个问题。
- 可以尝试使用梯度裁剪（gradient clipping）。

过拟合：
- 使用 dropout 层或 L2 正则化来防止过拟合。
- 增加更多的训练数据。
模型性能不佳：
- 调整超参数，如学习率、批量大小、LSTM 单元的数量等。
- 尝试不同的预处理技术，如词嵌入（word embeddings）。

通过以上方法和示例代码，你可以构建一个基本的 LSTM 序列分类模型，并根据具体需求进行调整和优化。

页面内容是否对你有帮助？

有帮助

没帮助

如何选择LSTM中的隐藏层数和存储单元数？

、

如何选择LSTM中的隐藏层数和存储单元数？我想建立关于分类的LSTM模型。 from tensorflow.keras import Sequential model = Sequential() model.add(Embedding(44000,32)) model.add(LSTM(32)) model.add(Dense(1, activation='sigmoid'))

浏览 1提问于2022-09-01得票数 -2

2回答

Tensorflow中变长序列的双向LSTM

、、

我想在tensorflow中训练一个双向LSTM来执行序列分类问题(情感分类)。由于序列的长度是可变的，所以批量通常会填充零的向量。通常，我在单向神经网络中使用sequence_length参数来避免在填充向量上进行训练。如何使用双向LSTM来管理这个问题？"sequence_length“参数是否自动从后向序列中的高级位置开始工作？谢谢

浏览 4提问于2017-03-21得票数 7

1回答

是否有一个机器学习模型(类似于LSTM或1D-CNN)，以两个可变长度的时间序列作为输入，并输出二进制分类(对/假，时间序列是否具有相同的标签)？因此，数据如下所示 date value label 2020-01-01 2 0 # first input time series 2020-01-02 1 0 # first input time series 2020-01-03 1 0 # first input time series 2020-01-01 3 1 # second input tim

浏览 0提问于2020-04-21得票数 2

1回答

如何使用LSTM进行时间序列分类？

、、、、

我正在使用LSTM进行时间序列分类的实验，我已经经历了几个HOWTO，但我仍然在努力解决一些非常基本的问题：学习LSTM的主要思想是从每个时间序列中获取相同的样本吗？例如，如果我有时间序列A (with samples a1,a2,a3,a4)、B(b1,b2,b3,b4)和C(c1,c2,c3,c4)，那么我将向LSTM提供批量的(a1,b1,c1)，然后是(a2,b2,c2)等？这意味着所有的时间序列都需要具有相同的样本大小/数量？如果是这样的话，有没有比我更有经验的人能够如此友好地向我简单地描述如何学习LSTM和创建分类器的整个过程？我的目的是使用TensorFlow，但我还是个

浏览 2提问于2018-01-03得票数 1

1回答

不能用joblib保存科学学习模型吗？

、、、

我有合奏模型，结合了tensorflow和scikit-学习。我想把这个集成模型保存为一个输入数据并生成输出的盒子。我的代码如下所示 def model_base_LSTM(***): *** model = model_base_LSTM(***) ensem_model = BaggingRegressor(base_estimator=model, n_estimators=15) ensem_model.fit(x_train, y_train) bag_mod_pred = ensem_model.predict(x_test_bag) from joblib import

浏览 1提问于2020-01-03得票数 1

1回答

Tensorflow :如何转换tensorflow LSTM的输入数据？

、、、

所以，我尝试使用tensorflow进行简单的分类，我的疑问是如果我使用LSTM进行文本分类(例如:情感分类)，则我们对数据进行填充，之后为了馈送到LSTM tensorflow，我们使用word_embedding，因此在word_embedding查找后，二维数据变为3维或秩2矩阵变为秩3：例如，如果我有两个文本： import tensorflow as tf text_seq=[[11,21,43,22,11,4,1,3,5,2,8],[4,2,11,4,11,0,0,0,0,0,0]] #2x11 #text_seq are index of words from wor

浏览 0提问于2018-04-29得票数 0

1回答

如何处理深度学习方法体系结构中的可变长度输入？

、、、

我正在研究一个可变长度的分类问题。我想结合使用多种深度学习方法，如CNN、LSTM、关注点等。现在我很困惑，很难准备和输入数据到模型中，我收到了很多错误，但不知道为什么。因此，我急切地寻求帮助。我正在做实现Tensorflow Keras库。有什么帮助或指导可以实现以及理论上的吗？

浏览 0提问于2022-03-11得票数 1

1回答

TensorFlow lstm为测试数据集中的每个不同示例预测相同的类概率。

、、

我正在使用tensorflow进行时间序列分类。我正在向lstm单元提供固定窗口时间序列，并且我试图对属于A类或b类的时间序列进行分类。经过一些培训后，我正在测试新的时间序列模型，这些时间序列从未被训练过。问题是，该模型对测试数据集中的每个不同时间序列预测相同的概率。它的行为就像不同的时间序列是相同的。你知道为什么会这样吗？

浏览 3提问于2016-06-01得票数 0

回答已采纳

1回答

尝试将密集层连接到LSTM时，层双向与层不兼容

、、、、

我正在处理一个多类分类问题，为了好玩，我想尝试不同的模型。我发现了一个使用LSTM进行分类的blog，并试图调整我的模型以使其正常工作。这是我的模型： from tensorflow import keras from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense, Dropout, Activation, Bidirectional, LSTM from tensorflow.keras.optimizers import SGD, Adam

浏览 66提问于2020-09-02得票数 0

回答已采纳

2回答

使用deltaTime作为一个特性？如何处理不规则的时间戳？

、、、、

我正在尝试创建一个用于数据序列分类的LSTM。我将使用的每一项培训输入的数据结构如下： [[ [deltaX,deltaY,deltaTime], [deltaX,deltaY,deltaTime],... ],class] 其中deltaX和deltaY反映了给定时间内X和Y的变化，deltaTime。 deltaTime并不是每次都是一样的，它可以从40到50 is到有时1000 is不等。结尾的“类”是二进制分类，可以是0，也可以是1。问题1(常规LSTM)：如果要使用基本的LSTM (Keras )，应该将deltaTime作为特性输入吗？我知道LSTM有时间戳，但它们是固定在

浏览 4提问于2019-10-17得票数 3

回答已采纳

1回答

回归的LSTM (在Tensorflow中)

、

我想在Tensorflow中实现一些LSTM模型。我想我已经很好地理解了这些教程。在这些输入数据中，输入数据是以单词的形式给出的，这些单词被嵌入到连续的向量空间中(这有几个优点)。我现在想做一个LSTM来预测一系列连续的数字，但不知道最好的方法是什么。我应该离散化我的输入范围，从而有效地得到一个具有多个类的分类问题，并使用前面描述的嵌入，还是坚持连续的数字并进行回归？在这种情况下，我只是在每个时间步中向模型传递一个特征，即连续数字？

浏览 1提问于2016-12-14得票数 9

1回答

tensorflow如何确定哪些LSTM单元将被选为输出？

、、、

我使用以下代码创建了一个LSTM模型： model = tensorflow1.keras.Sequential() model.add(tensorflow1.keras.layers.LSTM(128, input_shape=(720, 4), return_sequences=True)) model.add(tensorflow1.keras.layers.LeakyReLU(alpha=0.5)) model.add(tensorflow1.keras.layers.LSTM(128, return_sequences=True)) model.add(tensorflow1.ke

浏览 3提问于2021-03-15得票数 0

回答已采纳

2回答

无法理解下面的LSTM网络中的输出形状

、、、、

我一直在尝试使用TensorFlow v2 keras来训练双向LSTM来进行文本分类。结构如下： model1 = Sequential() model1.add(Embedding(vocab, 128,input_length=maxlength)) model1.add(Bidirectional(LSTM(32,dropout=0.2,recurrent_dropout=0.2,return_sequences=True))) model1.add(Bidirectional(LSTM(16,dropout=0.2,recurrent_dropout=0.2,ret

浏览 6提问于2020-05-27得票数 1

回答已采纳

1回答

基于LSTM的脑电信号分类体系结构

、、、、

我有一个多类分类问题，我在python3.6中使用了keras & tensorflow。我基于本文中提到的“叠层 LSTM层(a)”实现了高精度的分类：。有些事情是这样的： model.add(LSTM(256,input_shape=(32, 15360), return_sequences=True)) model.add(LSTM(128), return_sequences=True) model.add(LSTM(64), return_sequences=False) model.add(Dense(6, activation='softmax'))

浏览 5提问于2021-01-20得票数 2

回答已采纳

2回答

默认初始化Tensorflow LSTM状态和权重？

、、、、

我在使用Tensorflow的LSTM细胞。 lstm_cell = tf.contrib.rnn.BasicLSTMCell(lstm_units) 我想知道权值和状态是如何初始化的，或者确切地说，对于Tensorflow中的LSTM单元格(状态和权重)，默认的初始化器是什么？是否有一种简单的方法来手动设置初始化程序？注意:对于tf.get_variable()，glorot_uniform_initializer是尽可能从中找到的。

浏览 2提问于2018-03-11得票数 1

回答已采纳

1回答

Tensorflow Keras -叠加LSTM层时的误差

、、、

我有以下的层序。在混合中添加额外的LSTM会产生以下错误，我无法真正理解。我在x64上使用python3.7.3 GCC 7.4.0 tensorflow-gpu=‘2.0’ print(x_train_uni.shape) # (299980, 20, 1) simple_lstm_model = tf.keras.models.Sequential([ tf.keras.layers.LSTM(128, input_shape=x_train_uni.shape[-2:]), tf.keras.layers.LSTM(64), tf.keras.layers.LS

浏览 5提问于2019-10-26得票数 1

回答已采纳

1回答

在TensorFlow和LSTMCell中使用带有输入字符串的LSTMCell时出错

、、、、

我想用TensorFlow来解决一个有监督的问题。它很简单：字符串输入的列表。该字符串的格式为：“word_10-062017” 浮动输出的列表。标签是一个浮标: 3.0 我想使用带有这种格式的字符串集和一组浮动标签来训练模型。系统信息 Windows 7 x64 Tensorflow 1.2 Python 3.5.2 IDE Pycharm 2017.1.1 我正在使用这段代码： # Input placeholder x = tf.placeholder(tf.string, shape=[None, 1, 1]) ... # Define

浏览 7提问于2017-07-18得票数 1

1回答

升级代码rnn.static_bidirectional_rnn以适应tensorflow 2.0API

、、、、

import tensorflow as tf from tf.contrib import rnn lstm_f = rnn.BasicLSTMCell(n_hidden, forget_bias=1.0) lstm_b = rnn.BasicLSTMCell(n_hidden, forget_bias=1.0) blstm_out, state_f, state_b = rnn.static_bidirectional_rnn(lstm_f, lstm_b, x, dtype=tf.float32) 上面的代码与tensorflow 1.x一起工作，但是我很难找到一种使用tensorflo

浏览 5提问于2019-05-07得票数 2

回答已采纳

1回答

Keras LSTM uni &转换为Tensorflowjs的双向模型不能产生正确的推理

、

TensorFlow.js版本使用 tensorflow 1.12.0 tensorflow-碱1.12.0 tensorflow-gpu 1.12.0 tensorflow-轮毂0.2.0 张力流0.8.0 浏览器版本使用 Windows 10上的Firefox 65.0 (64-it) Windows 10下的Microsoft 42.17134.1.0 问题描述我在Python中创建并训练了一个基于Keras的LSTM双向模型来对视频进行分类。该模型工作棒和分类的视频与90+的准确性。，但当我使用tensorflorjs_converter工

浏览 1提问于2019-02-12得票数 2

回答已采纳

1回答

可以在Keras中的CNN之前添加双向LSTM吗？

、、、、

我目前正在开发一个系统，该系统可以对两个句子是否具有相同的内容进行分类。为此，我使用了预训练的词向量，因此有一个包含句子一的词向量的数组(s1)和一个包含句子二的词向量的数组(s2)。为了对它们是否相似进行分类，我通过将s1中的所有向量与s2中的向量进行成对比较来创建一个矩阵。然后将该矩阵输入到CNN分类器中，并对数据进行训练。这一切都非常简单明了。为了得到s1和s2中每个向量的隐藏状态，需要使用双向LSTM，然后用成对余弦相似度来比较这些隐藏状态，就像之前比较s1和s2的向量一样。现在的问题是如何在Keras中做到这一点。目前，我正在使用numpy/sklearn创建矩阵，然后将其作为训

浏览 1提问于2018-10-11得票数 0

1回答

基于TensorFlow的时间序列分类初始化

、、、、

我正在TensorFlow上开发一个模型，将一个连续的标签赋予一个时间序列的每一个时间步骤。该模型用于实时数据，这样，在以前的时间步骤上观察到的时间序列的值将对LSTM赋予当前时间步骤的标签产生影响。为此，我使用tf.contrib.rnn.LSTMCell。我的数据由每天的时间序列组成，分分秒秒的分辨率。时间序列的总长度总是一样的.在下面的中，在左边的蓝色图中，您可以找到我的数据是什么样子的示例。我希望用+1和-1之间的浮点值对输入时间序列进行分类，这样+1对应于时间序列的最大值，-1对应于最小值，而任何其他值(在+1和-1内)对应于中间的某个值。因此，我希望LSTM根据以前的

浏览 1提问于2017-03-25得票数 0

1回答

用LSTM嵌入句子来分类句子是不起作用的

、、、、

我试图建立LSTM神经网络来对句子进行分类。我见过许多例子，其中句子被转换成文字向量使用手套，word2Vec等，这里是一个它的例子。这个解决方案是可行的，在类似的行上，我编写了下面的代码，它使用通用句子编码器生成整个句子的嵌入，并使用LSTM对句子进行分类，但是即使在200年以后，它也不能工作--模型不收敛。请找到下面的代码 import tensorflow as tf import keras from keras.layers import Input, LSTM, Dense, Activation, Dropout,Embedding from keras.models impo

浏览 0提问于2021-03-16得票数 1

回答已采纳

1回答

`return_sequences = False`‘等效于pytorch LSTM

、、、、

在tensorflow/keras中，我们可以简单地在分类/完全连接/激活(softmax/sigmoid)层之前为最后一个LSTM层设置return_sequences = False，以消除时间维。在PyTorch中，我没有发现类似的东西。对于分类任务，我不需要序列来对模型进行排序，而是需要像这样的多到一个体系结构：这是我的简单的双LSTM模型。 import torch from torch import nn class BiLSTMClassifier(nn.Module): def __init__(self): super(BiLSTMCl

浏览 4提问于2020-06-04得票数 9

回答已采纳

1回答

如何在tensorflow中加载数据帧列表

、、、

我有一个由各种数据帧(10000)组成的列表，每个数据帧代表来自视频的5帧序列。因此，这5行中的每一行都有一些主体指针(Rankle_X、Rankle_Y、Lankle_X、Lankle_Y等)在特定的框架中的人。我想要做的是构建一个分类器来检测基于这5帧的运动，所以我需要一个时间序列网络(LSTM，GRU)，但我不知道应该如何在tensorflow中加载我的数据。我的列表中有2个类(来自类1的5000个数据帧和来自类2的5000个数据帧) 提前谢谢你

浏览 4提问于2021-06-03得票数 0

1回答

Keras层LSTM中不兼容的输入

、、、、

我正在尝试复制： # as the first layer in a Sequential model model = Sequential() model.add(LSTM(32, input_shape=(10, 64))) # now model.output_shape == (None, 32) # note: `None` is the batch dimension. # for subsequent layers, no need to specify the input size: model.add(LSTM(16)) 但是当我运行以下命令时： # only lines

浏览 2提问于2017-08-06得票数 1

1回答

困惑于如何运行tensorflow LSTM

、

我看到了在tensorflow上调用lstm的两种不同的方法，我对一种方法和另一种方法的区别感到困惑。在哪种情况下使用其中一种第一种方法是创建一个lstm，然后像下面的代码那样立即调用它 lstm = rnn_cell.BasicLSTMCell(lstm_size) # Initial state of the LSTM memory. initial_state = tf.zeros([batch_size, lstm.state_size]) for i in range(num_steps): # The value of state is updated after pr

浏览 1提问于2016-06-03得票数 1

回答已采纳

1回答

ValueError:检查目标时出错:要求dense_13具有形状(None，6)，但得到形状为(6，1)的数组

、、

我正在用训练数据训练一个分类网络，它的X.shape = (1119，7)和Y.shape = (1119，6)。下面是我的简单Keras网络，输出dim为6(标签的大小)。返回的错误在代码下面 hidden_size = 128 model = Sequential() model.add(Embedding(7, hidden_size)) #model.add(LSTM(128, input_shape=(1,7))) model.add(LSTM(hidden_size, return_sequences=True)) model.add(LSTM(hidden_size, retu

浏览 17提问于2019-03-13得票数 0

1回答

有没有办法在tf.keras中加速嵌入层？

、、、、

我正在尝试实现一个用于DNA序列分类的LSTM模型，但目前它还不能使用，因为它需要训练的时间太长( 6.5K序列的每个时期需要25秒，每个样本大约4ms，我们需要训练该模型的几个版本，超过100s的数千个序列)。 DNA序列可以表示为A、C、G和T组成的字符串，例如"ACGGGTGACAT“可能是单个DNA序列的一个例子。每个序列属于我试图预测的两个类别中的一个，每个序列包含1000个字符。最初，我的模型不包括嵌入层，相反，我手动将每个序列转换为一个单热编码矩阵(4行乘1000列)，该模型工作得不是很好，但速度令人难以置信。不过，在这一点上，我已经在网上看到，使用嵌入层具有明显的优

浏览 11提问于2019-10-18得票数 2

1回答

如何使我的神经网络输入既包括向量化文本，也包括一个热编码？

、、、

假设我试图在像这一个，这样的数据集中对假新闻进行分类，其中有显示文章文本的列，也有有助于分类的文章标记。我可以将文章文本矢量化，并使用LSTM来训练一个假新闻预测器，这将需要这样的输入层。 import tensorflow from tensorflow.keras.models import Sequential from tensorflow.keras import Input model = Sequential() model.add(Input(shape=(1,), dtype=tensorflow.string)) 然后，我会添加一个文本向量化层，然后是LSTM，等

浏览 0提问于2022-02-06得票数 0

1回答

Tensorflow:当序列的每个部分都属于一个类时，LSTM？

、、

我正在尝试在Tensorflow中实现LSTM，但我的数据在以下方面有点“非传统”：一天中的每个小时，都可能发生以下五个事件之一。我想将24小时的序列输入到我的LSTM中。问题是，我需要它为每个序列的每个元素输出一个目标类。对于LSTM，这必须是可能的，对吧？LSTM的TF实现的唯一示例就是提供一个序列并获取该序列的目标类。任何帮助都将不胜感激！

浏览 0提问于2017-01-14得票数 1

1回答

应该使用哪个BiLSTM层的输出进行分类

、、、

我试图为文本分类问题实现一个BiLSTM层，并为此使用PyTorch。 self.bilstm = nn.LSTM(embedding_dim, lstm_hidden_dim//2, batch_first=True, bidirectional=True) lstm_out, (ht, ct) = self.bilstm(embeddings) 现在，在一些例子中(我在互联网上看到)，人们正在通过ht通过Linear层并生成输出。有些人也在使用lstm_out。现在我有两个问题- 对于文本分类，应该使用哪一种？如果我使用ht，对于bidirectional=True来说，它是形状的(2,

浏览 0提问于2021-04-29得票数 0

1回答

在每个时间步训练RNN并进行误差评估

、、、

我有一个simpleRNN / LSTM，我正在尝试使用tensorflow在顺序分类任务上进行训练。有一个数据序列(300个时间步长)预测t=300处的标签。对于我的任务，我希望RNN评估每个时间步的错误(不仅仅是在最后的时间点)，并向后传播它(如下图所示)。在下面的一些响应之后，我似乎需要做一些事情:使用return_sequences标志；使用TimeDistributed层访问来自LSTM/RNN的输出；还定义了一个自定义的损失函数。 model = Sequential() layer1 = LSTM(n_neurons, input_shape=(length, 1),

浏览 1提问于2021-04-20得票数 0

2回答

带条件的LSTM

、

我和CNN在tensorflow学习LSTM。我想在LSTM网络中加入一些标量标签作为条件。有人知道我的意思是哪个LSTM吗？如果有的话，请告诉我它的用法。谢谢。

浏览 3提问于2017-10-16得票数 4

回答已采纳

1回答

Tensorflow:使用tf.mat_fn()或tf.nn.dynamic_rnn()在LSTM之前应用层有什么区别？

、、、

这个问题是关于使用Tensorflow的编码策略。我想建立一个小型分类器网络，由： 1:输入 2:完全连接的简单层(W*x+B) 3: LSTM层 4:一个softmax层 5:输出在tensorflow中，要使用tf.nn.dynamic_rnn()类，我们需要一批序列到网络。到目前为止，这是完美的工作(我喜欢这个图书馆)。但是，由于我想对序列的每个特性(我描述的第二层)应用一个简单的层，我想知道：我是否在我的LSTM层之前使用这个简单的层，并将两者传递给操作. 或我是否两次使用函数 (一个用于解包批，一个用于解压缩序列)，如果理解得很好，

浏览 1提问于2016-11-30得票数 3

1回答

Tensorflow LSTM模型试验

、、、、

我是LSTM和Tensorflow的新手，我尝试使用LSTM模型来学习和分类我拥有的一些巨大的数据集。(我并不担心我打算学习的准确性)。我试图以类似于使用LSTM的PTB单词预测教程的方式实现该模型。教程()中的代码使用下面的行使用模型运行会话 cost, state, _ = session.run([m.cost, m.final_state, eval_op], {m.input_data: x, m.targets: y,

浏览 2提问于2016-04-29得票数 1

1回答

Tensorflow LSTM Dropout实现

、、、

在调用tf.nn.rnn_cell.DropoutWrapper()时，tensorflow如何具体地应用退出？我所读到的所有关于将辍学应用于rnn的参考资料--这篇由撰写的论文--说不要在重复的连接之间应用辍学。神经元应在LSTM层之前或之后随机脱落，而不应在LSTM层间脱落.好的。我的问题是，随着时间的推移，神经元是如何关闭的？在每个人引用的文件中，似乎每个时间步骤都应用了一个随机的“退出掩码”，而不是产生一个随机的“退出掩码”并重用它，将它应用于被删除的给定层中的所有时间步骤。然后在下一批上生成一个新的“辍学掩码”。更重要的是，现在更重要的是，tensor

浏览 2提问于2017-02-27得票数 9

回答已采纳

1回答

仅检索pytorch序列中lstm层的最后一个隐藏状态

、、、

我有一个pytorch模型： model = torch.nn.Sequential( torch.nn.LSTM(40, 256, 3, batch_first=True), torch.nn.Linear(256, 256), torch.nn.ReLU() ) 对于LSTM层，我只想从批处理中检索最后一个隐藏状态，以通过其余的层。例如： _, (hidden, _) = lstm(data) hidden = hidden[-1] 尽管如此，该示例仅适用于子类模型。我需要以某种方式在nn.Sequential()模型上执行此操作，这样当我保

浏览 5提问于2021-10-05得票数 0

1回答

在tensorflow-hub预训练模型之后添加LSTM层

、、、

我正在使用Tensorflow-hub预训练的Word2vec模型进行文本分类。我正在寻求将LSTM层添加到keras模型中。为此，我使用了以下代码： model = tf.keras.models.Sequential() model.add(hub.KerasLayer(hub.load('https://tfhub.dev/google/Wiki-words-250/2'), input_shape=[], dtype=tf.string,

浏览 36提问于2021-08-01得票数 0

回答已采纳

1回答

LSTM的输入应该是什么样子的？

、、

想象一下，您正在tensorflow中为序列分类任务训练一个LSTM模型。在每个时间步，你有一个二进制向量v_i (例如，v_i=[0, 1, 0, 1])，并且对于每个序列，你有可变数量的时间步(尽管二进制向量v_i的长度是相等的)。在tensorflow中训练LSTM模型时，如下所示： lstm_cell=tf.nn.rnn_cell.LSTMCell(number_of_hidden) tf.contrib.rnn.static_rnn (lstm_cell, training_data) 单个训练序列(具有三个时间步，v_1=[0, 1, 0, 1]，v_2=[1, 1, 1,

浏览 15提问于2019-06-18得票数 0

2回答

非文本数据的参差张量作为LSTM的输入

、、、、

我正在学习粗糙张量及其在粒子跟踪中的应用。我有以下最小的例子，它再现了我一直在经历的错误。 import tensorflow as tf from tensorflow.keras.layers import Dense, LSTM, Input, TimeDistributed from tensorflow.keras.models import Sequential n=10 data_n = 32 batch_size=8 window_length=8 splits = [n]*data_n #### Create a ragged tensor with shape (3

浏览 28提问于2020-12-14得票数 0

1回答

Keras错误:输入0与图层lstm_10不兼容:期望的ndim=3，找到的ndim=2

、、、

请容忍我，我对此还是个新手。我正在使用LSTM训练分类器，并具有以下代码我遇到了一个问题，第三层LSTM显示维度有问题我的训练集具有shape (34799, 32, 32) model = Sequential() model.add(LSTM(64, activation = 'relu', input_shape=X_train[0].shape, return_sequences=True)) model.add(Dropout(0.25)) model.add(LSTM(128, activation = 'relu')) model.add(D

浏览 14提问于2020-06-06得票数 0

1回答

用于多元序列预测的Lstm方法

、、、、

我和我堆叠的LSTM模型混在一起了。Lstm有不同类型的应用程序。例如，在图像中显示了两种类型的LSTM，机器翻译和视频分类。我的模型如下。 def create_stack_lstm_model(units): model = Sequential() model.add(LSTM(units, activation='relu', return_sequences=True, input_shape=(n_steps, n_features))) model.add(LSTM(units, activation='relu'

浏览 6提问于2020-12-20得票数 0

回答已采纳

1回答

cuda lstm未指明的启动失败错误

、、

我有Nvidia GTX1050卡，我的cuda版本是10.1，我有cuDNN 7.6.5，每当我尝试运行LSTM单元时，都会抛出一堆错误下面是我的代码： model = Sequential() model.add(LSTM(64, input_shape=(x_train.shape[1], x_train.shape[2]), return_sequences=True)) model.add(Dropout(0.2)) model.add(LSTM(64, return_sequences=True)) model.add(Dropout(0.2)) model.add(LSTM(

浏览 64提问于2020-09-04得票数 0

回答已采纳

1回答

TensorFlow:简单递归神经网络

、、、

我用TensorFlow建立了一些神经网络，比如基本的MLP和卷积神经网络。现在我想转到递归神经网络。然而，我在自然语言处理方面没有经验。因此，对于我来说，RNN的TensorFlow NLP教程并不容易阅读(也不是很有趣)。基本上，我想从一些简单的东西开始，而不是LSTM。如何在TensorFlow?中建立一个简单的递归神经网络，如Elman网络。我只能找到TensorFlow的GRU或LSTM示例，主要用于NLP。有人知道一些简单的递归神经网络教程或TensorFlow的例子吗？下图显示了一个基本Elman网络，它通常简单地称为SRN (简单递归网络)：

浏览 2提问于2016-04-25得票数 9

回答已采纳

1回答

在TensorFlow中使用一个LSTM的输出作为另一个LSTM的输入

、、、、

我想构建一个基于LSTM的神经网络，它接受两种输入并预测两种输出。粗略的结构如下图所示。 Output 2依赖于Output 1，正如在回答类似问题时所述，我尝试通过从LSTM1的隐藏状态设置LSTM2的初始状态来实现这一点。我使用TensorFlow使用以下代码实现了这一点。 import tensorflow as tf from tensorflow.keras.layers import Input from tensorflow.keras.layers import LSTM from tensorflow.keras.layers import Dense impor

浏览 11提问于2020-05-27得票数 1

2回答

使用LSTM进行二进制分类

、、、、

我有大小为100000*5的时间序列数据。100000个样本和5个变量。我已经将每个100000个样本标记为0或1。即二进制分类。我想使用LSTM来训练它，因为数据的时间序列性质。我见过LSTM用于时间序列预测的例子，它是否适合在我的情况下使用。

浏览 1提问于2017-01-23得票数 1

1回答

理解时间戳在Keras中的作用

、、、、

给定由10232个信号组成的信号数据集，200 K (10232, 200000)中的每一个都是为了分类目的而制作的。我对Keras的理解是，它接受(samples, timestamp, features)格式的数据。在阅读了许多文章后，LSTM只接受3D数据，所以我们首先应该将输入的数据从2D扩展到3D。以下是快照代码： X = np.expand_dims(X, -1) # ---> (10232, 200000, 1) input_layer = Input(shape=(X.shape[1], X.shape[2])) lstm_ = LSTM(64, return_seque

浏览 3提问于2020-11-28得票数 0

回答已采纳

4回答

在LSTM中“截断梯度”是什么意思？

、、

我正在学习关于LSTM：的tensorflow教程。这一节说代码使用“截断反向传播”，那么这到底意味着什么呢？

浏览 9提问于2016-08-01得票数 4

回答已采纳

1回答

如何利用LSTM层的tensorflow集线器嵌入模型？

、、

我正在学习tensorflow 2，通过TF集线器教程完成文本分类。它使用了TF集线器的嵌入模块。我想知道是否可以修改模型以包括LSTM层。以下是我尝试过的： train_data, validation_data, test_data = tfds.load( name="imdb_reviews", split=('train[:60%]', 'train[60%:]', 'test'), as_supervised=True) embedding = "https://tfhub.dev/go

浏览 5提问于2020-06-23得票数 4

回答已采纳

1回答

Keras: ValueError:输入0是不兼容的图层问题

、、、、

我使用Keras和Tensorflow作为后端，并得到不兼容的错误： model = Sequential() model.add(LSTM(64, input_dim = 1)) model.add(Dropout(0.2)) model.add(LSTM(16)) 以下错误显示： Traceback (most recent call last): File "train_lstm_model.py", line 36, in <module> model.add(LSTM(16)) File "/home/***/anaconda2/l

浏览 2提问于2017-02-20得票数 3

回答已采纳