腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(3507)
视频
沙龙
2
回答
如
何在
使用
快速
文本
时
禁用
子
词
嵌入
训练
?
这是我尝试用来
训练
单词
嵌入
的语料库的一个片段。我不想让
快速
文本
构建
子
词
嵌入
,我只想要完整单词的
嵌入
,比如news_dlsub_01326、news_subent_12402等等。以下是
训练
脚本: .0.01 -epoch 50 -wordNgrams 1 -bucket 200000 -dim 128 -loss hs -thread 80 -ws 5 -minCount 1 那么,我如何设置
训练
脚本来
禁用
浏览 11
提问于2019-01-07
得票数 2
回答已采纳
1
回答
Tensorflow
嵌入
层中的权值更新
、
在
训练
seq2seq模型
时
,我想在
嵌入
层中启动一组预先
训练
的
快速
文本
权重,目的之一是减少测试环境中的未知单词(这些未知单词不在
训练
集中)。由于预
训练
的
快速
文本
模型词汇量较大,在测试环境中,未知
词
可以用
快速
文本
的词汇向量来表示,在
训练
集中,这些向量应该与语义相似的
词
具有相似的方向。然而,由于
嵌入
层中的初始
浏览 2
提问于2017-05-19
得票数 2
回答已采纳
2
回答
如何
训练
我自己的自定义
词
嵌入
网页?
、
、
、
、
我有大量的
文本
数据在多个网页上的产品,我有兴趣出售给客户。我试着在维基百科上
使用
预先
训练
过的
快速
文本
词
嵌入
,但它并没有给我分类任务带来好的结果。可能是因为网站上的
文本
数据包含了很多技术细节,它不同于维基百科中的
文本
数据。因此,我想做一些转移学习的
词
嵌入
,保持预先
训练
的
快速
文本
词
嵌入
为基础。我如何
使用</
浏览 2
提问于2019-01-24
得票数 1
1
回答
使用
Tensorflow和预
训练
的FastText获取未见单词的
嵌入
、
、
我正在
使用
一个预先
训练
好的
快速
文本
模型( )。print(en_model['car'])在tensorflow中,我知道我可以
使用
以下代码来获得所见单词的可
训练
<e
浏览 1
提问于2017-10-31
得票数 9
1
回答
快速
文本
监督学习模型的背后发生了什么?
、
、
、
我们可以
使用
以下命令在
快速
文本
中
训练
监督模型 import fasttext model = fasttext.train_supervised(input="cooking.train") 我的问题是,它如何表示特征(
词
包或tf/idf或
词
嵌入
),以及它
使用
什么算法进行
文本
分类?
浏览 26
提问于2020-08-14
得票数 0
回答已采纳
3
回答
如
何在
Keras
嵌入
层中
训练
嵌入
层
、
、
如
何在
Keras
嵌入
层中
训练
嵌入
层?(比如
使用
tensorflow后端,意思是类似于word2vec、手套还是
快速
文本
) 假设我们没有
使用
预先
训练
过的
嵌入
。
浏览 0
提问于2018-01-25
得票数 10
1
回答
快速
文本
和DANs在文档分类上有什么区别?
、
、
、
我遇到了两篇有趣的论文,它们描述了
使用
word
嵌入
的文档分类的有前途的方法。描述了在纸袋中为有效的
文本
分类这里。本文描述了基于深度无序构图的
文本
分类这里句法方法。这两种方法有什么区别? 它们本质上是一样的,它们看起来都是平均的单词
嵌入
并通过MLP传递吗?还是我遗漏了一些重要的东西?
浏览 0
提问于2017-04-01
得票数 10
2
回答
微调预培训的word2vec Google新闻
、
、
、
、
我目前
使用
的Word2Vec模式是在谷歌新闻语料库上培训的(来自),因为这是直到2013年才对新闻进行培训的,因此我需要更新矢量,并根据2013年以后的新闻在词汇表中添加新单词。
浏览 4
提问于2017-09-15
得票数 3
1
回答
如
何在
tensorflow
嵌入
层中
使用
快速
文本
向量?
我只是在努力找出如
何在
keras/tensorflow
嵌入
层中为OOV单词
使用
快速
文本
词
向量。外面什么都没有。也许有人也想到了这一点,并给了我一些提示?通过
词
嵌入
查找的方式通过像tf.nn.embedding_lookup(word_embeddings,x)这样的索引工作我想象一个函数,它可以自定
浏览 1
提问于2019-06-01
得票数 2
1
回答
位置编码(在变压器中)是对
训练
语料库
文本
中单词相对位置的估计吗?
、
这是对
训练
课文中单词相对位置的某种估计吗?他们是否创造了某种统计上的“分布”
词
?在英语中,“猫”通常离“牛奶”有两三个字吗?事情必须有意义,不是吗?
浏览 0
提问于2021-04-27
得票数 1
回答已采纳
1
回答
预
训练
的
嵌入
矩阵有<EOS>,字向量吗?
、
我想要建立一个预先
训练
的
嵌入
矩阵的seq2seq聊天机器人。预先
训练
过的
嵌入
矩阵,例如GoogleNews向量-负300,FastText和GloVe,有<EOS>和<UNK>的特定单词向量吗?
浏览 1
提问于2018-03-18
得票数 2
回答已采纳
1
回答
使用
预先
训练
过的
词
嵌入
对单词“池”进行分类
、
、
、
、
我已经看过很多文章,解释在
使用
CNN进行句子情感分类
时
使用
预先
训练
过的单词
嵌入
(
如
Word2Vec或Fasttext) (比如Yoon的论文)。然而,这些分类器也解释了单词出现的顺序。我对word
嵌入
的应用是预测单词的“池”类。example = [["red", "blue", "green", "orange"], ["bear", "horse"
浏览 0
提问于2018-05-26
得票数 1
回答已采纳
2
回答
将
文本
文件中的单词列表转换为Word矢量
、
、
、
、
我有一个有数百万行的
文本
文件,我想要将其转换为单词向量,然后我可以将这些向量与搜索关键字进行比较,看看哪些
文本
更接近搜索关键字。我的难题是,我所看到的Word2vec的所有
训练
文件都是以段落的形式出现的,因此每个单词在该文件中都有一些上下文含义。现在我的文件是独立的,并且每一行都包含不同的关键字。我的问题是,是否有可能
使用
这个
文本
文件创建
词
嵌入
,如果不可能,那么在如此多的
文本
中搜索匹配的搜索关键字的最佳方法是什么Walmart
浏览 60
提问于2019-03-26
得票数 0
1
回答
如
何在
字
嵌入
层前应用平滑技术(过采样)
、
、
、
如
何在
LSTM中应用词
嵌入
层前的平滑算法。我有一个
文本
二值分类的问题(好(9500)或坏(500个),总共有10000个
训练
样本和它的不平衡
训练
样本),意思是当我
使用
LSTM和预先
训练
的单词
嵌入
(每个单词的100个维空间),所以每个
训练
输入都有一个id(当
文本
描述小于50个单词,当描述超过50个字符
时
,每个
训练
输入有一个id's (50个id的总数,当
文本</em
浏览 0
提问于2018-11-19
得票数 6
3
回答
字
嵌入
模型
、
、
、
、
我一直在搜索并尝试实现一个
词
嵌入
模型来预测单词之间的相似性。我有一个由3550个公司名称组成的数据集,其想法是用户可以提供一个新单词(这个
词
不在词汇表中),并计算新名称与现有名称之间的相似性。在预处理过程中,我去掉了停止
词
和标点符号(连字符、点、逗号等)。此外,我应用词干和分隔前缀,希望得到更高的精度。然后,像BIOCHEMICAL这样的
词
最后变成了BIO CHEMIC,这个
词
被分成两个(前缀和词干
词
)。这是pet的更接近的单词的分布另一方面,当我
使
浏览 5
提问于2019-10-04
得票数 1
回答已采纳
1
回答
用RNN学习
词
嵌入
、
、
学习单词
嵌入
的常用方法是基于弓模型和跳格模型.任何对类似作品的引用都将受到高度赞赏。
浏览 0
提问于2018-08-17
得票数 3
回答已采纳
1
回答
如何正确地
使用
Keras的
嵌入
层?
、
、
、
我有点困惑于如何正确
使用
Keras中的
嵌入
层来实现seq2seq (我想在Keras中重建TensorFlow se2seq机器翻译教程 )。但我观察到
嵌入
层有两种不同的用法:一方面(
如
关于Keras博客的本教程)通过weights参数利用外部预
训练
的word2vec向量:此外,
嵌入
层的trainable参数的用途/效果是什么?我是否正
浏览 0
提问于2017-03-13
得票数 7
1
回答
在keras中结合
使用
Gensim Fasttext模型和LSTM nn
、
、
、
、
我已经用Gensim在非常短的句子(最多10个单词)语料库上
训练
了
快速
文本
模型。我知道我的测试集中包含不在我的
训练
语料库中的单词,即我的语料库中的一些单词,
如
“催产素”、“来曲霉素”、"Ematrophin“、”Betaxitocin“。给定测试集中的一个新词,fasttext非常清楚地知道通过
使用
字符级n-gram来生成与
训练
集中的其他相似
词
具有很高余弦相似度的向量 如何将
快速
文本
模型合并到LSTM ke
浏览 25
提问于2020-07-06
得票数 4
回答已采纳
1
回答
从零开始分析BERT与模型
、
、
我尝试了两种选择: precision recall f1-score support 0 0.74,BERT
使用
了一个较小的子集进行验证。当涉及到社交媒体的数据
浏览 0
提问于2023-02-21
得票数 0
回答已采纳
1
回答
chatGPT
使用
的是什么
词
嵌入
机制?
、
、
chatGPT
使用
的是什么
词
嵌入
机制?是Word2Vec,GloVe,还是别的什么?
浏览 0
提问于2023-01-27
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
图计算黑科技:打开中文词嵌入训练实践新模式
使用实体嵌入的结构化数据进行深度学习
嵌入向量能否理解数字?BERT竟不如ELMo?
绝区壹--LLM的构建模块
一次搞定多种语言:Facebook展示全新多语言嵌入系统
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券