腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
是否有可能在大型稀疏矩阵上使用scikit TSNE?
、
、
、
文档说要对稀疏矩阵使用fit方法,但这并不返回
低
维
嵌入
。 我很感谢我可以像在.todense()中一样使用方法,但是我的数据集非常大(0.4*10^6行和0.5*10^4列),所以内存中不适合使用。是否有一种方法可以使用scikit TSNE (或TSNE的任何其他python实现)来降低大型稀疏矩阵的
维
数,然后返回
低
维
嵌入
以进行可视化?
浏览 6
提问于2017-09-26
得票数 4
回答已采纳
1
回答
使用Pytorch从自动编码器中提取隐藏表示
、
在用PyTorch训练了一个AutoEncoder之后,如何在某个隐藏级别提取输入特征的
低
维
嵌入
?
浏览 34
提问于2021-07-01
得票数 0
回答已采纳
2
回答
寻找最具代表性的形象
、
、
我有1000张在白色背景上拍摄的钢琴照片,噪音很小(背景中的人,等等)。我怎样才能找到最像其他钢琴的钢琴图像呢?或者,我怎样才能找到最像“普通”钢琴的五架钢琴。我特别寻找可能有用的python库(我目前正在查看skimage)。
浏览 0
提问于2015-10-21
得票数 2
3
回答
如何用一种很好的方式来划分集群?
、
、
、
我有一个大的文本数据集聚类。每个集群由属于它的向量化文本、文本数量、创建日期和其他参数的质心表示。我不能在n维空间中绘制星系团。我有哪些选择?
浏览 0
提问于2018-04-23
得票数 7
1
回答
关于(word2Vec)空间的维度与人类思维如何通过语言构建意义(或现实)之间的关系,有研究过吗?
、
、
是否有任何理论将(
低
维
)
嵌入
空间(如word2Vec)与心智(语言)模型联系起来?有认知语言学理论吗?
浏览 0
提问于2021-04-27
得票数 0
回答已采纳
1
回答
数据点与聚类中心的平均偏差随每次迭代而变化
、
、
我的数据集可以在kaggle 中找到。所以我在我的数据集上运行k-means,它有4列200行,k= 5。我想找到集群半径,所以我测量了每个数据点到各自集群中心的平均距离,但每当我重新运行我的程序时,它们的值都会改变。我的聚类中心不会随着每次迭代而改变,那么到底是怎么回事呢?我该如何解决这个问题?import pandas as pdfrom sklearn.decomposition import PCA from sklearn.metrics impo
浏览 11
提问于2020-05-19
得票数 0
回答已采纳
2
回答
如何减少降
维
后的位置变化?
、
、
、
我正致力于将高
维
数据(文本作为tdidf向量)可视化到2D空间中。我的目标是标记/修改这些数据点,并在修改和更新2D-图之后重新计算它们的位置。1000个文本文档/数据点必须非常快地计算(比方说< 3s),因为它的交互性Step 1:Step 2:我尝试了几种降
维
算法略读一些研究论文,我发现这个问题与一个类似的问题(高
维
变化很小,导致二
维
变化很大):总之,他们使用t-sne初始化每个迭代步骤,并得到第一步的结果。
浏览 0
提问于2019-05-22
得票数 4
1
回答
词
嵌入
的降
维
方法: PCA与TSNE
、
、
、
对于使用PCA可视化单词
嵌入
的局限性,我有一个一般性的问题。例如,一旦解释了80%的方差(或弯头),人们就可以相当自信地认为,这个数量的PC是描述
低
维空间中数据方差的一个很好的近似值。在可视化的情况下,由于明显的原因,只限于2D或3D。将主成分分析应用于一个字
嵌入
矩阵(向量为300列,N个字为N行),我对前两个PC (PC1: 4%,PC2: 3.5%)的贡献很小。我有一个线性衰变直到PC_N。在许多教程中,PCA仅直接应用于二
维
/三
维
,而不检查PCA的贡献。这就是为什么有些人一开始就使用the
浏览 0
提问于2023-05-03
得票数 0
回答已采纳
3
回答
构造SVD的组件数量
、
、
、
、
可以通过使用截断的奇异值分解来降低
维
数。它通过截断奇异值分解(SVD)进行线性降
维
。然而,在分解之前,必须选择组件的数量。
浏览 2
提问于2018-01-24
得票数 4
1
回答
关于特征从潜空间到正规空间的重要性
、
、
我有一个很大的矩阵(形状为(3000,25000)),我使用this /UMAP将其简化为(3000,2)表示,并且在这个表示上看到了分类性能的显著提高。然而,我希望能够理解潜藏的特征的重要性,不是在潜在的空间,而是在正常的空间。有没有一种方法可以从潜在的表示和我的feature_importances_ (从我的随机森林建立在它周围)追溯到底层特性?
浏览 1
提问于2019-02-16
得票数 0
2
回答
NN
嵌入
层
、
、
、
、
一些神经网络库,如tensorflow和pytorch提供了
嵌入
层。在过去实现了word2vec之后,我理解了想要更低维度表示的原因。在word2vec的情况下,
低
维
表示可以用于其他任务(臭名昭著的国王/王后示例)。但是,如果您的
嵌入
层永远不会用于替代任务,那么它的目的是什么?
浏览 0
提问于2018-05-31
得票数 10
1
回答
如何将不同的特征组合并提供给文本分类算法
、
、
、
、
我有大约12万个文本文件,我想将这些文档分为12个类别。我正在使用简单的词袋模型,并将其提供给NaiveBayes。但有人告诉我,混合使用各种功能会“有所帮助”,或者说我至少应该试一试。例如:2.] Bag-of-NER + POS tags
浏览 0
提问于2016-01-11
得票数 0
1
回答
叠层Bi-LSTM与单层Bi-LSTM的比较
、
、
我在BI LSTM上训练了我的模型用于多类文本分类,但是当我使用2个堆叠的BI LSTM时,我的结果与只使用1层的BI LSTM没有什么不同,你知道这一点吗?max_words = 17666 BB.add(Embedding(max_words, emb_dim,weights=[embedding_matrix], input_length=max_len)) BB.add(Bidirectional(LSTM(64, return_sequences=True,dropout=0.4, re
浏览 0
提问于2020-11-26
得票数 0
1
回答
使
嵌入
相似的火炬损失函数
、
、
、
、
我正在研究一个
嵌入
模型,其中有一个BERT模型,它接收文本输入并输出多维向量。该模型的目的是为相似的文本找到相似的
嵌入
(高余弦相似度),对于不相似的文本寻找不同的
嵌入
(
低
余弦相似度)。在小型批处理模式下进行训练时,BERT模型给出N*D
维
输出,其中N是批处理大小,D是BERT模型的输出
维
数。此外,我还有一个
维
数N*N的目标矩阵,如果sentence[i]和sentence[j]在意义上是相似的,则在[i, j]第th位置包含sentence[i],如果没有,则包含-1。
浏览 5
提问于2020-12-31
得票数 0
回答已采纳
1
回答
低
维
是什么?
、
、
、
、
我的问题是什么是
低
维
的?其中一些人提到了一些关于
低
维
,
低
维
因子等的东西。如果你知道这一点,请帮助我。
浏览 2
提问于2014-10-27
得票数 0
1
回答
如何正确地对文档名称进行聚类&基于Word2Vec模型查找文档之间的相似点?
、
、
、
我有一套文件(3000),每个文件都包含一个简短的描述。我想使用Word2Vec模型来查看是否可以根据描述对这些文档进行聚类。我使用的是谷歌受过训练的w2v模型。每个文档都被分割成单词,其中停止词被
浏览 2
提问于2019-10-08
得票数 1
回答已采纳
1
回答
nn.Embedding模块是如何直观地与一般的
嵌入
思想相关联的?
、
、
具体来说,我无法将我所理解的作为一个概念的
嵌入
和这个特定的实现之间的点联系起来。据我所知,这种映射是通过学习过程实现的,就像在自动编码器中一样。编码器学习最优的
嵌入
,以便解码器能够重建原始输入。所以我的问题是,这与nn.Embedding模块有什么关系: 一种简单的查找表,用于存储固定字典和大小的
嵌入
。该模块通常用于存储单词
浏览 4
提问于2020-12-06
得票数 3
回答已采纳
1
回答
在连体网络中选择对比性损失的边际
、
、
、
、
我对损失函数的输入目前是来自RNN层的1024
维
密集
嵌入
-该输入的维度是否会影响我选择边距的方式?我是不是应该先用一个密集的层把它投射到一个
低
维
的空间?
浏览 22
提问于2019-02-27
得票数 2
1
回答
不确定我的自动编码器神经网络从Keras predict给我的结果
、
、
、
我正在尝试构建一个自动编码器神经网络,用于在单列文本列表中查找异常值。我的输入有138行,它们看起来像这样: amaze_header_2.pngcircle_shape.xmlfab_label_background.xmlfab_shadow_dark.9.png 我已经使用Keras构建了一个自动编码器网络,并且我使用python函数将我的文本输入转换为一个数组,每个字符的ascii表示用零填充,这样它们都具有相同的大小。 我的完整代码是这样的
浏览 9
提问于2019-04-22
得票数 2
1
回答
在matplotlib/python中可视化高
维
数据
、
、
、
我对python使用了scikit-learn库,在我的例子中,我的输入是二
维
空间坐标,输出是一些转换后的版本,也是二
维
空间坐标。我生成了一些虚拟测试数据,并试图拟合一个GP模型。由于我的输入和输出
维
都是二
维
的,我不知道如何能够快速地可视化它,这样我就可以了解模型的适合性(特别是想知道模型之间的平滑性和方差)。当然,大多数在线例子都适用于一
维
案例.
浏览 0
提问于2018-02-06
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
将高维数据压缩到低维——降维利器“PCA”
低代码平台测评系列——维格表
老旧光伏电站发电量低,运维效率低,升级改造很有必要!
嵌入二维码识别模块,解决各景区检验票难题
教室设备运维成本高、效率低?广凌助力实现课室运维管理信息化
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券