腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
doc2vec: PV是如何实现的
、
、
、
、
我知道
python
(gensim)中已经存在一个
python
(段落
向量
)的实现。但我有兴趣知道如何自己实现它。实际上,这意味着在随机梯度下降的每一次迭代中,我们采样一个文本窗口,然后从文本窗口中抽取一个随机
单词
,并在给定段落
向量
的情况下形成一个分类任务。根据本文的说法,
单词
向量
不被存储,PV的工作原理类似于word2vec中的跳过图。 Skip-gram在中有解释.在跳格模型中,将
单词
向量
映射到隐藏层。在培训期间,将更新执行此映射的
浏览 3
提问于2016-03-15
得票数 9
1
回答
将词转化为潜在语义分析(LSA)
向量
、
、
、
、
有没有人对如何使用
Python
和scikit将文档中的
单词
转换为LSA
向量
有任何建议?我发现这些站点和限制了如何将整个文档转换为lsa
向量
,但我感兴趣的是转换单个
单词
本身。最终的结果是将每个句子的所有
向量
(代表每个
单词
)相加,然后比较连续句子,以评估语义相似性。
浏览 5
提问于2017-01-10
得票数 0
回答已采纳
1
回答
使用快速文本或word2vec计算最近的文档
、
、
、
、
我可以计算
单词
向量
,尽管我真正需要的是整个文档的
向量
。
浏览 0
提问于2018-06-07
得票数 2
1
回答
如何创建手套嵌入?
、
、
Python
3.9.6 有一个与Word2vek一起工作的GenSym,它创建所需的
单词
到
向量
空间的映射。据我所知,Glove是Word2Vec的优化版本,它在较小的词库中完全收敛。但我没有找到一种如何使用手套创建
单词
的
向量
表示的技术。 对于高度专业化的文学作品,获得
单词
的手套
向量
表示的技术是什么?
浏览 107
提问于2021-08-14
得票数 0
1
回答
从公开可用的
单词
嵌入中提取更有意义的
单词
、
、
我有两个公开可用的
单词
嵌入,如手套和谷歌Word2vec。然而,在他们的词汇表中,有太多的拼写错误或垃圾
单词
(例如##AA##、adirty等)。为了避免这个词,我想提取频繁的词(例如,前50000个
单词
),因为我认为比较频繁的词有正常的形式。 所以,我想知道是否有一种方法可以在上述两个预先训练过的
单词
嵌入中找到
单词
频率。
浏览 0
提问于2017-08-11
得票数 3
回答已采纳
1
回答
如何获取
python
中gensim中
单词
的最近文档
、
、
、
我使用doc2vec模型构建文档
向量
,如下所示。(docs, vector_size = 100, window = 10, min_count = 1, workers = 4, epochs = 20) 我见过gensim doc2vec也包含
单词
向量
假设我为
单词
deep learning创建了一个
单词
向量
。我的问题是,在
python
的gensim中,是否有可能得到与documents最接近的deep learning
单词
向量
?
浏览 1
提问于2019-07-22
得票数 1
回答已采纳
1
回答
将(从fastText)转换为在spaCy中使用的
单词
向量
失败
、
我用fastText生成了
单词
向量
,并希望将它们转换为spaCy模型(用于德语)。在spaCy文档中,它指出
向量
“应该是一个Word2Vec格式的选项卡分隔的文件,其中第一列包含
单词
,其余的列包含值。”所以,我把我的
单词
向量
转换成一个txt文件,这样它们就有了这个格式。但是,当我尝试运行
python
-m spacy init-model de /Users/vectors --vectors-loc test_vectors.txt时, 我得到了下
浏览 0
提问于2018-08-07
得票数 1
1
回答
在ML中对文本数据进行分类的最好方法是什么?
、
、
、
、
假设我有一个由评论列组成的数据集,每个评论恰好有100个
单词
,那么训练我的模型可能很容易,因为我可以简单地对每个评论的100个
单词
中的每个
单词
进行标记化,然后将其转换为数字数组,然后使用input_shape
浏览 1
提问于2020-05-07
得票数 1
1
回答
word2vec
向量
[gensim库]的“大小”是什么意思?
、
、
、
假设字典中有1000个
单词
(A1,A2,…,A1000)。据我所知,在
单词
嵌入或word2vec方法中,它的目标是用
向量
表示字典中的每个
单词
,其中每个元素表示该词与字典中剩余
单词
的相似性。正确的说法是每个
向量
中应该有999维,还是每个word2vec
向量
的大小应该是999?但是使用Gensim
Python
,我们可以修改Word2vec的" size“参数的值,在本例中我们假设size= 100。那么"size=100“是什么意思呢
浏览 0
提问于2018-12-03
得票数 2
回答已采纳
1
回答
将快速文本
向量
转换为word
、
、
、
、
我在将一个快速的FastText
向量
转换回一个
单词
时遇到了问题。下面是我的
python
代码:en_model = KeyedVectors.load_word2vec_format('wiki.en/wiki.en.vec')我如何获取
向量
(特别是具有适当维数的任意
向量
)并让它发出一个
单词</
浏览 1
提问于2018-11-07
得票数 3
1
回答
Tf-下手
向量
器分析从线而不是文字中的
向量
。
、
、
、
、
我试图分析一个由行给出的文本,我希望使用sckit-learn包的在
python
中将这些行
向量
化。问题是,
向量
化可以通过
单词
或n-克来完成,但我希望对行进行矢量化,而且我已经排除了一项工作,就是将每一行
向量
化为一个
单词
(因为这样就不会考虑
单词
及其含义)。
浏览 14
提问于2016-07-27
得票数 2
回答已采纳
1
回答
计算两个
向量
之间的相似性
、
、
、
、
因此,我有五个
单词
向量
,每个
单词
都有一个权重或重要程度,如下所示: 我知道还有人问过类似的问题(),但由于他没有得到答案,我
浏览 0
提问于2018-05-22
得票数 2
1
回答
如何在spacy中保存
单词
向量
、
、
、
目标是获得列表中每个
单词
的
向量
表示。我的意图是将这些
单词
向量
用于其他应用目的,如
单词
聚类。vectorize(text): category=['Dell','
Python
如何保存列表‘类别’中每个
单词
的词
向量
浏览 29
提问于2020-06-28
得票数 0
回答已采纳
1
回答
两种不同尺寸矢量余弦相似度的计算
、
、
、
、
我有两个问题, 使用上面的方法,我创建了16个文档的
向量
,它们是不同大小的。我遇到的问题是得到两个
向量
的点积,因为它们的大小不同。我该怎么做?
浏览 3
提问于2012-09-19
得票数 2
回答已采纳
1
回答
python
中视觉
单词
编码包的内置功能
、
、
、
、
function psi = encodeImage(encoder, im) 我在
python
中执行这个任务,我不想实现视觉
单词
编码包,因为我的主要任务是实现支持
向量
机。在
python
中是否有一个内置的函数,它可以对视觉
单词
进行编码并返回空间直方图,这样我就可以在直方图上训练SVM分
浏览 5
提问于2015-09-29
得票数 4
1
回答
我可以在LDA中得到一个
单词
的主题分布吗?
、
、
、
我是LDA的新手,我想计算
单词
之间的主题相似度。我能得到一个
单词
的主题分布吗?如果是这样,我如何在gensim.ldamodel中做到这一点?
浏览 54
提问于2021-04-18
得票数 0
回答已采纳
1
回答
Python
如何在csv文件中将一袋
单词
应用于tweet
、
、
、
、
我目前正在进行twitter数据分析,并一直致力于在
Python
中应用
单词
打包技术,但一直没有成功。目前,我已经能够通过一些预处理将数据流存储在数据库中,然后我将tweet导出到csv文件中,但无意中发现了下一部分使用
单词
袋来进行机器学习。有人能建议我可以遵循的教程来用
Python
3实现一袋
单词
吗?谢谢你的帮助
浏览 4
提问于2017-12-03
得票数 0
回答已采纳
2
回答
为什么FastText不处理查找多个
单词
的短语?
、
FastText预训练模型非常适合查找相似的
单词
:model = FastText('cc.en.300.bin')model.nearest_neighbors('Gone with the Wind', k=2000) [('DEky4M0BSpUOTPnSpkuL5I0GTSnRI4jMepcaFAoxIoFnX5kmJQk1aYvr2odG
浏览 0
提问于2021-01-05
得票数 1
1
回答
机器学习/文本分析/算法指针
、
、
、
我更愿意在R上工作,但我也可以做
Python
。任何对我可以使用的特定包的引用都是很棒的。 因此,我有一个参议院法案的清单和他们的描述是一到两句长篇。
浏览 0
提问于2018-05-24
得票数 3
1
回答
如何将字符串中的ngram和词频转换为
向量
,以构建SVN模型
、
、
、
、
我正在尝试使用
Python
和NLTK对平均长度仅为10-20个
单词
的文本字符串进行文本分类。 我想要计算词频和大小为2-4的ngram,并以某种方式将它们转换为
向量
,并使用它们来构建SVN模型。我在想,标准的方法可能已经很聪明了,比如对
单词
进行词干处理(因此“重要的”和“重要的”将被视为同一个
单词
),去掉标点符号,超级常见的英语
单词
,并可能实现一种聪明的方法,为我将这些计数转化为
向量
。我是文本分类和
python
的新手,我对这两种建议都持开放态度!
浏览 0
提问于2018-04-01
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python实现文本单词统计
必背Python单词:常用报错提示单词20个
python 给出的字母,猜单词
Python之支持向量机
SVM向量机的Python实现
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券