腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
beam_search
(
huggingface
库
)
生成
文本
时
出现
张量
大小
不
匹配
错误
、
、
、
、
我正在
使用
huggingface
库
通过预先训练好的distilgpt2模型
生成
文本
。特别是,我
使用
了
beam_search
函数,因为我想包含一个LogitsProcessorList (您不能将其与generate函数一起
使用
)。eos_token_id=tokenizer.encode('.')[0], ) 但是,当我尝试<
浏览 132
提问于2021-04-23
得票数 1
2
回答
Pytorch: RuntimeError:结果类型浮点数不能转换到所需的输出类型Long
、
、
loss.item() return epoch_loss/len(iterator), epoch_acc/len(iterator)什么可能是我的问题,因为我试图将我的标签转换成long
张量
浏览 20
提问于2021-11-25
得票数 10
回答已采纳
1
回答
动态
张量
/裁剪
在训练
时
,我总是
使用
相同的图像
大小
(224x224,
使用
随机裁剪),一切都很好。 在干扰阶段,我想一次预测一个图像,因为我想要
使用
完整的图像(而不是裁剪)。例如,这样的图像具有[406,256]
大小
。训练
时
,两个
张量
的
大小
匹配
。当预测我的单一图像
时
,尺寸
不
匹配
(
张量
大小
:[1,47,47,64]对[1,46,46,64])。我认
浏览 3
提问于2017-08-10
得票数 2
回答已采纳
1
回答
动态填充bucket_by_sequence_length如何动态求出
张量
形状?
、
我正试图在TensorFlow中训练一个
文本
到语音模型。为了
生成
批处理,我
使用
bucket_by_sequence_length函数。我尝试过get_shape().as_list()和'tf.shape‘,但在运行时没有得到形状。对于时间维度,我总是没有。但是,当我计划添加一个需要知道时间维度的自定义层
时
,我得到了维度
不
匹配
的
错误
浏览 0
提问于2019-09-08
得票数 0
1
回答
在TPU上将tf.data.Dataset与Keras配合
使用
、
、
、
、
我正在用Keras训练一个模型,它由一个
Huggingface
RoBERTa模型组成,作为骨干,下游任务是
文本
的跨度预测和二进制预测。 我一直在用
大小
在2 Gb以下的数据集定期训练模型,效果很好。最近几周,数据集的
大小
不断增长,最近,它的
大小
已经达到了2.3 Gb左右,这使得它超过了2 Gb的google protobuf硬限制。这使得在没有
生成
器的情况下
使用
numpy
张量
的keras训练模型是不可能的,因为tensorflow
使用
浏览 2
提问于2021-01-22
得票数 0
1
回答
在Colab上运行GPT-2 (或GPT Neo)
文本
生成
模型w/ GPU
、
在我的Colab中开始“在Colab上运行训练GPT-2 (或GPT Neo)
文本
生成
模型w/ GPU”
时
,会
出现
以下
错误
: 该怎么办呢?
浏览 11
提问于2021-07-23
得票数 2
1
回答
如何将只有一个公共尺寸(批次
大小
)的两个三维
张量
传递给dynamic_lstm?
、
、
、
、
我想把两个不同尺寸的
张量
传递给一个tf.nn.dynamic_rnn。我有困难,因为尺寸
不
匹配
。我愿意接受关于最好的方法的建议。这些
张量
是来自tf.data.Dataset的批
张量
1 (?,?,1024)第一个维度是批处理
大小
,第二个维度是时间步骤数,第三个维度是每个时间步骤要输入的特征数。 目前,我有一个问题,即每个维度的时间步数
不
匹配
。不仅如此,它们在样本之间
浏览 0
提问于2018-08-06
得票数 4
回答已采纳
1
回答
将复
张量
转换为JS数组
在
使用
data()或dataSync()函数将复数
张量
转换为JS数组
时
,返回的数组的
大小
是原始
张量
的两倍,包含实部和虚部作为两个不同的值。我需要一个复数组。 输出是: Float32Array(6) 1,4,2,5,3,6,而预期的输出是这样的复数组:{ re: 1,im: 4 },{ re: 2,im: 5 },{ re: 3,im: 6} 如果我
使用
,array()或arraySync()函数,我会得到一个“
错误
:3
不
匹配
输
浏览 16
提问于2020-06-30
得票数 1
回答已采纳
1
回答
BCEWithLogitsLoss:试图将预测标签的二进制输出作为
张量
,与输出层混淆
、
、
我的数据集中的每个元素都有一个多标签
张量
,如[1, 0, 0, 1],1's和0's的组合各不相同。在这种情况下,由于我有4个
张量
,所以我的神经网络的输出层为4。在
使用
BCEWithLogitsLoss
时
,当我调用模型(输入)
时
,得到了一个输出
张量
,该模型(输入)在(0,3)的范围内,与输出层指定的输出层有4个输出神经元。这不符合预期目标的格式,尽管当我将输出神经元的数目改为2
时
,就会
出现
形状
不
匹配</em
浏览 4
提问于2020-09-22
得票数 2
回答已采纳
2
回答
为什么本征多维矩阵的第一个指数::
张量
能够遍历
张量
的所有成员?
、
、
为什么本征多维矩阵的第一个指数::
张量
能够成功地遍历
张量
的所有成员? { }它应该给出某种类型的
错误
令人惊讶的是,这正确地输出了
张量
的所有成员: 0 1 2 3 4 5 6 7 8 9 10 11 12 13 1
浏览 3
提问于2019-10-31
得票数 0
回答已采纳
1
回答
Keras层内三重态丢失的实现
、
、
) 但是,它给了我一个
错误
,1], []我的问题是,如何解决这个
错误
?
浏览 0
提问于2018-09-13
得票数 4
回答已采纳
1
回答
ValueError:不能重塑
张量
(伯特-转移学习)
、
、
、
我正在
使用
HuggingFace
的变压器
库
,
使用
Keras和BERT构建一个多类
文本
分类模型。bert-base-uncased",output_attentions = False, )model.fit(x_train, y[:100], epochs=1,
浏览 3
提问于2020-04-10
得票数 3
回答已采纳
1
回答
如何通过索引编程修改2D
张量
的单个值
、
、
、
我有一个2D
张量
my_tensor
大小
[50,50]和dtype int32,我需要在一个特定的位置递增该值。要更新的位置的索引由两个整数
张量
给出,这两个
张量
分别给出了轴0和轴1的位置:tf.Tensor([27], shape=(1,), dtype=int32)tf.Tensor如果我手动定义索引,代码就可以工作,但是如果我尝试
使用
idx_0和idx_1,每个实现都会
出现
一些索引/维度
不
匹配
的<
浏览 0
提问于2021-07-16
得票数 0
2
回答
是否有办法解决来自最终模型层的输出与输入之间的批量
大小
不
匹配
?
、
、
、
、
:我有一个包含898个标签的完整数据集,总共有55,000张图像。为了提高速度,我用了10个标签和大约600张图片来测试下面的代码。我尝试过修改batchSize,修改数据函数,但没有效果。目标:要么将dense_Dense1的最终输出更改为500,要么将conv2d_Conv2D1_input的预期输入更改为10。var tf = require('@
浏览 18
提问于2022-01-10
得票数 1
2
回答
基于制表符的行拆分缺少空列- Perl
、
、
、
、
我有一个制表符分隔的
文本
文件。我逐行逐列地阅读。我在每一列中做了很少的更改,并将该行写入一个新文件。当我
使用
perl的拆分函数读取每一列
时
最后,我错过了空栏。split函数创建
大小
为23的数组。我想要所有的柱子。因为这样,文件头(33列)与数据(23列)
不
匹配
,并且在将文件写入数据
库
时
出现
错误
。
浏览 0
提问于2013-05-10
得票数 1
回答已采纳
2
回答
Tensorflow train.batch问题
、
、
当我尝试
使用
tensorflow(我是tensorflow新手)构建一个神经网络
时
,这一行代码会产生一个
错误
。batches = tf.train.batch(input_list, batch_size=batch_size, enqueue_many=True, capacity=3)
错误
浏览 3
提问于2017-09-01
得票数 2
回答已采纳
2
回答
时序RNN初学者块中数组的整形
、
、
、
、
python和深度学习的新手。我试图用一些数据建立一个RNN,但我不知道我错在哪里了。import numpy as npimport matplotlib.pyplot as plt sales = raw.drop(['InvoiceNo','StockCode','Country
浏览 1
提问于2018-01-21
得票数 0
回答已采纳
1
回答
数据类型
不
匹配
在某些情况下而不是其他情况下
、
、
、
、
我正在MS中构建一个表单,并希望在数据
库
中的查询基础上添加一个带有简单DSum()函数的
文本
字段。我不断犯的
错误
是原始
文本
框公式:返回相同
错误
的Format(DSum("PValue","N_qryPLBreakdown",&q
浏览 6
提问于2022-04-25
得票数 0
2
回答
如何有效地将一个大型并行语料
库
转换成一个集合数据集来训练一个EncoderDecoderModel?
、
、
、
、
在预编码数据集上工作的典型EncoderDecoderModelfrom transformers import EncoderDecoderModel当
使用
wmt14数据集
时
,可以
使用
预处理/编码数据集来训练模型: train_data = datasets.load_dataset("wmt14", "de-en"train_data.save_to_d
浏览 33
提问于2022-10-20
得票数 0
回答已采纳
1
回答
Neo4jclient展开导致Pascal case属性名称仅与Bolt协议一起
使用
、
、
、
使用
Neo4j.Driver.Signed.1.7.2和Neo4jClient.3.1.0.6,我们尝试
生成
一个循环查询,该查询展开集合并在节点create语句中
使用
结果。当
使用
http协议
时
,展开中的属性名称在数据
库
中采用驼峰
大小
写,这与预期不谋而合。
使用
Bolt协议,该属性在数据
库
中为Pascal形式。这会导致在后续查询中
出现
匹配
属性的问题。该问题似乎是在创建查询
文本
后
浏览 17
提问于2019-08-09
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
有了这个工具,不执行代码就可以找PyTorch模型错误
使用 Hugging Face TRL 微调大型语言模型以实现特定任务
马斯克开源的 grok-1 大模型对标 openai chatGPT 源码硬核第一弹
首个大规模使用工具的大模型来了:伯克利发布Gorilla
鹅厂专家讲透AI文本生成解码策略与代码实现
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券