腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(6243)
视频
沙龙
1
回答
如
何在
RapidMiner
中
降低
文本
维度
、
、
我在使用Rapid Miner来
降低
文本
挖掘的特征
维度
方面遇到了挑战。在这一点上,我正在通过单词标记来处理
文本
,这导致了一个非常大的
维度
集,这对于建模和预测并不理想。
浏览 12
提问于2017-06-27
得票数 0
回答已采纳
1
回答
创建过滤器示例java
中
的
rapidminer
运算符
、
我需要一些帮助创建连接到
rapidminer
的java项目。我需要创建一个新的过程和一个过滤示例操作符,以便过滤一些包含随机单词的
文本
,这是我不能只使用
Rapidminer
完成的。我找不到如
何在
java
中
创建特定的运算符,以及如何添加
文本
和随机单词。有人能帮上忙吗?有没有一段特定的代码来解决这个问题? 谢谢
浏览 1
提问于2015-08-26
得票数 0
2
回答
从java程序访问Rapid Miner API时出错
、
、
、
;import com.
rapidminer
.
RapidMiner
.ExecutionMode;警告:缺少ODBC桥(
如
Access)的数据库驱动程序类名称2013年10月25日6:29:10 PM com.
rapidminer
.tools.jdbc.JDBCProperties线程"m
浏览 10
提问于2013-10-25
得票数 1
1
回答
在处理数据之前,如何从示例集中删除
文本
?
、
、
我使用的是
RapidMiner
5.3.013。我正在读取一个包含来自Remedy的数千行工作日志的excel文件。我想删除基于正则表达式^[A-Z][\w\d/?(# ]+[\w0-9#)]{2}:的
文本
,然后使用数据
中
的流程文档。到目前为止还没有想出如何做到这一点。我可能只是写VBA,但想知道如
何在
Rapidminer
中
做到这一点。
浏览 4
提问于2013-09-25
得票数 1
1
回答
EigenValue和EigenVector Java实现
、
、
我正在实现度量学习算法,我想要
降低
数据的
维度
。我使用Java和库(Jama)来实现,并使用PCA来
降低
维度
。当我使用Jama库
中
的eig来获取特征值时,即使对于大小为300 x 20的矩阵,也需要花费大量时间。我需要获取特征值和特征向量的java实现。作为参考,我还尝试了其他库,
如
Jblas,它具有PCA,但在特征值和特征向量方面的性能非常差。
浏览 3
提问于2014-06-17
得票数 0
2
回答
缩小图像的尺寸
、
如
何在
C#
中
降低
图像的尺寸?我在.NET 1.1
中
工作。 示例:将
维度
800x600降至400x400
浏览 1
提问于2009-08-27
得票数 0
2
回答
适用于极小聚类的聚类算法
、
、
、
、
我正在尝试在一个大约有5000条记录的列表
中
查找重复项。每条记录都是一个人的姓名和地址,但都不一致地键入到一个字段
中
,所以我尝试了一种模糊匹配方法。我的方法(使用
rapidminer
)是对
文本
进行一些预处理(即标记化,删除常见和不相关的单词,
如
"Mr“等),生成TF-IDF,并使用DBSCAN对匹配记录进行聚类。
浏览 1
提问于2012-11-26
得票数 4
回答已采纳
2
回答
帮助确定我的数据的最佳统计工具
我不是数据科学领域的人,我需要对我的数据进行一些统计分析,但我不知道我应该使用哪种分析工具。📷
浏览 0
提问于2020-08-22
得票数 0
1
回答
在使用RNN的神经机器翻译的上下文中,投影层是什么?
、
、
、
、
投影层的解释如下:“附加投影旨在
降低
编码器输出表示的
维度
,以匹配解码器堆栈
维度
。”论文链接:
浏览 5
提问于2020-02-07
得票数 2
2
回答
在
Rapidminer
中进行计数
如何对word文档
中
的列表进行行数统计??如果相同的列表在excel
中
,我可以使用聚合运算符进行计数,但在word文档
中
不会发生这种情况。
浏览 3
提问于2016-01-06
得票数 0
1
回答
如何将InformationGain应用于具有独立测试集的
rapidminer
中
?
、
、
我正在处理
rapidminer
中
的
文本
分类。我有分别的测试和训练分裂。我使用n倍交叉验证将信息增益应用于数据集,但我对如何将其应用于单独的测试集感到困惑?以下是附呈的图片 在图中,我已经将用于培训的第一个“处理文档”的单词列表输出连接到用于测试的第二个“文件处理文档”,但我希望将简化的特性应用到第二个“文件处理文档”
中
,它可能应该是从“按权重选择”(缩减
维度
)操作符返回的,但它返回的权重是我无法提供给第二个“文件处理文档”的权重。
Rapidminer
真的有可能有独立的测试/
浏览 2
提问于2014-02-18
得票数 0
回答已采纳
1
回答
有没有像matlab的Weka.jar (java)这样的库来索引
文本
文档?
、
、
我正在与Weka合作,需要添加另一个分类器Rocchio,这在Weka
中
目前不受支持。我想知道有没有办法用java为Rocchio编码,并使用weka的文档预处理功能?我已经在matlab
中
编写了Rocchio,那么有没有像weka.jar (java)这样的库可以简化我的文档预处理和从
文本
文档创建矢量的工作呢?我最初的想法是使用
RapidMiner
或Weka将
文本
文档转换为word向量,然后对这些向量进行编码和操作来对它们进行分类,但这些工具生成的训练数据向量和测试数据向量具有不同的词汇量
维度<
浏览 0
提问于2013-12-14
得票数 0
1
回答
同时包含分类变量和数值变量的数据集的聚类算法的确定
、
、
、
然而,由于我的数据集既有类别变量(
如
性别、婚姻状况、首选社交媒体平台等),也有数字变量(平均支出、年龄、收入等),我无法决定哪些算法值得关注。或者我应该在任何情况下使用PCA或K-PCA来
降低
维度
?此外,如果数据集具有3个以上的
维度
,我如
何在
没有可视化的情况下理解和解释结果?
浏览 0
提问于2018-04-26
得票数 0
2
回答
如
何在
Android
中
设置
RapidMiner
库
、
、
、
我想在Android
中
的一组提取的特征上应用这个模型,这样我就可以得到一个预测(例如:该对象是水果/蔬菜/坚果吗?)然而,我无法集成Android
中
的Rapid库。我从下载了“
rapidminer
-extension”。应该下载的文件正确吗? 在过去的4天里,我一直在寻找一个可行的解决方案,但我似乎找不到一个。
浏览 1
提问于2018-02-04
得票数 0
回答已采纳
2
回答
从主组件恢复数据
、
11.7954>> Covariance=cov(X);>> principal=X*V; 如何从这个方程式
中
恢复
浏览 1
提问于2014-06-18
得票数 0
2
回答
如何通过创建新列来
降低
数据集的维数
我正在寻找一种方法,通过创建一个新列来
降低
数据集的
维度
。Gene ID1 ID2 ID3 ...但是,
如
您所知,数据集的维数太高,我无法将该表导入SQL数据库。基本上,我正在尝试创建一个名为ID的新列,这样我就可以减少列数,尽管这会增加行数……很抱歉格式错误,我不知道如
何在
这里正确插入表格...
浏览 1
提问于2021-02-23
得票数 0
1
回答
特征提取的设计模式
我正在寻找一个设计模式,是相关的模块,提取功能。我想在我的数据点上定义一定数量的特性,然后根据性能和特性选择,我可能想要删除其中的一些并添加其他特性,而且我还想考虑测试它们的任何子集。谢谢你的帮助,
浏览 0
提问于2015-02-09
得票数 1
1
回答
Keras构造句子列表的GRU模型
、
是批次大小,批次
中
的每个样本都是一个段落,由第二个?个句子组成。每个句子都有40个单词,最后300是嵌入的大小。所以我不知道下一步如何处理titles_embed。
浏览 22
提问于2020-05-20
得票数 0
1
回答
collective.googleanalytics报表
中
的自定义
维度
、
、
、
、
如
何在
新的google分析报告中使用自定义
维度
(
如
ga:量纲1或ga:量纲2)?在“查询
维度
”字段
中
,我看不到任何相关选项。
浏览 3
提问于2015-06-04
得票数 3
回答已采纳
1
回答
DOORS数据库
中
的动态数组值得使用吗?
、
、
如
您所知,dxl中有一维数组。我想使用多个
维度
,所以我决定使用动态数组,但这大大
降低
了我的脚本速度,当我们每个模块有大约14,000个对象时,脚本将需要一天左右的时间才能运行。我想知道在这些脚本中使用动态数组是否合理,或者是否有人有在数据库
中
处理动态数组的经验? 只是好奇,谢谢!
浏览 1
提问于2009-06-06
得票数 8
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何在 Google Docs 中旋转文本
如何在Excel中让文本公式计算的方法
如何在14层PCB中通过盲孔技术降低电磁干扰和串扰
如何在Spark中处理结构化流式数据,如日志文件或传感器数据?
如何在文本中插入页码?
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券