但是,我想将所有预处理数据在0到1之间规范化,因为我的所有相似性度量(余弦、皮尔逊、欧几里得)都依赖于这个假设。在取SVD (A = USV^T)之后,是否有一种标准的方法来规范0到1之间的矩阵'A‘?谢谢!编辑:如果输入矩阵没有0到1之间的值,我希望所有的相似性度量都能给出0到1之间的结果,特别是我的归一化欧几里德距离。
我正在比较各种技术,并想找出对大量文本文档进行矢量化和降维的最佳方法。我已经测试了Bag of Words和TF-IDF,并使用PCA、SVD和NMF进行了降维。使用这些方法,我可以减少我的数据,并知道基于解释的方差的最佳维度数量。 然而,我想用doc2vec做同样的事情,考虑到doc2vec本身是一个降维工具,找出我的模型<e