我试着用python学习pca(使用虹膜数据集),我得到了一些结果,所以我想测试一下结果,以确保它是从零开始的。我检查了结果,它给了我一个python的镜像图(在y轴上),以及一些值中的负号(python: 140,1=0.1826089,r141,2=-0.1826089python计数为零)。 python代码: import numpy as np
import matplotlib.pyplot as plt
import sklearn.decomposition as p
data=np.loadtxt("sample_data/iris.txt",delimit
如何在PCA之后从Python中的第一个分量重建图像?
我的尝试是:
from sklearn.datasets import load_sample_image
from sklearn.feature_extraction import image
from sklearn.decomposition import PCA
# Create patches of size 25 by 25 and create a matrix from all patches
patches = image.extract_patches_2d(grayscale_image, (25, 25), ra
我已经用python做了PCA相关代码,它是从Matlab代码转换成python代码,但最后一行代码不工作。 我该怎么纠正它呢? MatLAB代码: [coeff,score,~,~,explained] = pca(train);
sm = 0;
no_components = 0;
for k = 1:size(explained,1)
sm = sm+explained(k);
if sm <= 99.4029
no_components= no_components+1
我正在用sklearn.decomposition.PCA进行主成分分析,我发现如果输入矩阵X很大,两个不同的PCA.transform实例的结果就不一样了。例如,当X是一个100x200矩阵时,就没有问题了。当X是1000x200或100x2000矩阵时,两个不同的PCA实例的结果将不同。我不知道这是什么原因:我想在sklearn的PCA求解器中没有随机元素?我使用的是滑雪版0.18.1。使用python 2.7
下面的脚本说明了这个问题。
import numpy as np
import sklearn.linear_model as sklin
from sklearn.decomp
如何在Python上的PCA中创建相关矩阵?下面,我通过pca.components_创建了特征向量加载的DataFrame,但我不知道如何创建实际的相关矩阵(即这些加载与主成分的相关性如何)。有什么线索吗?
此外,我已经意识到,在Python中,许多这些特征向量加载都是负的。我正在尝试复制在Stata中进行的一项研究,奇怪的是,当Stata相关性为正时,Python负载似乎为负(请参阅附件中的相关矩阵图像,我正尝试用Python复制该图像)。这只是我注意到的一些事情-这里发生了什么?
提前谢谢。
import pandas as pd
import numpy as np
import d
我试图在MNIST数据上运行PCA (只是在尝试学习一些ML的东西),但是得到一个内存分配错误,对于我的机器来说似乎太小了。我尝试了两个略有不同的代码,下面是从这个网站复制的: (我在Iris数据集上成功地运行了PCA )。
但是,当我运行以下命令时:
from sklearn.datasets import fetch_openml
mnist = fetch_openml('mnist_784')
from sklearn.model_selection import train_test_split
# test_size: what proportion of ori
为了对这些图像进行分类,我想运行一些机器学习算法,比如PCA和KNN,它们有一个相对较大的图像数据集(>2000 rgb图像)。
我的源代码如下:
import cv2
import numpy as np
import os
from glob import glob
from sklearn.decomposition import PCA
from sklearn import neighbors
from sklearn import preprocessing
data = []
# Read images from file
for filename in glob(&
我正在使用python中的sklearn对基因表达数据执行主成分分析(PCA)。我的数据作为pandas dataframe加载,为此我可以调用df.head(),df看起来很好。我正在使用sklearn生成一个加载矩阵,但是该矩阵只显示一个通用索引,并且不接受索引的列名。我有1722个基因,所以通过计算获得每个基因的加载分数是很重要的。
下面是我的PCA代码:
import pandas as pd
from sklearn.decomposition import PCA
from sklearn import preprocessing
# Load the data as pand
我有点困惑,我想使用texthero库进行一些pca分析。但是当我尝试运行我的代码时: import texthero as hero
import pandas as pd
df['pca']=(df['clean_tweet'].pipe(hero.clean).pipe(hero.do_tfidf).pipe(hero.do_pca))
hero.scatterplot(df, col='pca', color='topic', title="PCA BBC Sport news") 我得到了错误: M
我试图使用PCA进行维数约简,其中outputs是张量的列表,每个张量的形状为(1,3,32,32)。以下是代码:
from sklearn.decomposition import PCA
pca = PCA(10)
pca_result = pca.fit_transform(output)
但不管我做了什么,我都会犯这个错误:
ValueError: only one element tensors can be converted to Python scalars
我知道具有大小(1,3,32,32)的张量正在产生这个问题,因为它寻找一个元素,就像错误所指出的那样,但是不知道如何解决
我用python做了这个PCA图,我想知道每个点的名称或索引,我怎么才能找到方法呢?
def pca_arrows_2d(df, pca) :
feature_vectors = pca.components_.T
# échelle des flèches
arrow_size, text_pos = 7.0, 8.0,
# projections des vecteurs de caractéristiques
for i, v in enumerate(feature_vectors):
plt.arrow(0, 0, arr
作为练习,我对虹膜数据进行了PCA。下面是我的代码:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import numpy as np
import matplotlib.pyplot as plt
from matplotlib import style
style.use("ggplot")
from sklearn.cluster import KMeans
from sklearn.preprocessing import StandardScaler
from sklearn.decomposition import P