enter image description here我在一个文件夹中有3000个用于训练和测试的图像,我还有label.csv文件中的图像标签,其中包含五个类别。谁能帮我把这个数据集分成训练数据和测试数据,这样我就可以使用卷积神经网络对图像进行分类了。将csv和图像链接后,我的数据集看起来如下图所示。
我试图用文本数据进行多类分类。我面临的问题是我有非结构化的文本数据。我将用一个例子来解释这个问题。例如,考虑一下这个图像:
我想提取和分类图像中的文本信息。问题是,当我提取信息时,OCR引擎会给出如下的输出:
18
EURO 46
KEEP AWAY
FROM FIRE
MADE IN CHINA
2226249917581
7412501
DOROTHY
PERKINS
现在,目标类如下:
18 -> size
EURO 46 -> price
KEEP AWAY FROM FIRE -> usage_instructions
MADE IN CHINA ->
我目前正在与PRtools合作。我非常执着于我正在做的事情。
有人能指导我如何从训练数据集到分类器吗?我在训练和测试数据中查看的所有示例都是从相同的数据集生成的,在本例中为A,随机如下:
A=datafile(2:end,1:end-1);
labs=datafile(2:end,end);
A=dataset(A,labs);
A=setprior(A,[0.5 0.5]);
[B,C] = gendat(A,0.2);
W = pca(B,2); % compute PCA on training set only
A2 = A*W; % maps all data to 2D