腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
hadoop
数据
挖掘
库
、
、
我在
hadoop
中使用Mahout进行
数据
挖掘
算法。但是它在一些cases.Is中有bug,还有其他使用
hadoop
的
数据
挖掘
库吗?谢谢。
浏览 0
提问于2013-08-01
得票数 0
2
回答
使用Solr和
Hadoop
进行文本
挖掘
、
、
、
我有一个包含大约1亿个文档的Solr
数据
库。我想对这些文档进行文本
挖掘
。任何关于这种情况的想法都会对我有很大的帮助。
浏览 1
提问于2013-10-18
得票数 1
2
回答
在学习Mahout之前,我需要掌握
Hadoop
吗?
在学习Mahout之前,我需要掌握
Hadoop
吗?在不学习
Hadoop
的情况下(为了使用
数据
挖掘
功能),我可以走多远?
浏览 0
提问于2012-10-03
得票数 2
回答已采纳
9
回答
数据
挖掘
引擎和框架?
、
、
、
、
你知道和使用哪些开源/免费的
数据
挖掘
引擎和框架来处理文本
数据
? 谢谢你的建议!
浏览 3
提问于2010-11-18
得票数 5
回答已采纳
2
回答
Oracle11g对MySQL和
Hadoop
:- 10^6至10^9记录的基准测试
、
、
、
、
会有大量的
数据
挖掘
查询,每天24小时都有实时
数据
.我想知道哪个
数据
库会更好,特别是在一些真实的统计
数据
方面。在未来几个月里,
数据
肯定会超出这一范围。提前谢谢。
Hadoop
不是DB。它是一个分布式文件系统。让我更详细地解释我的要求。这就是我现在拥有的,我在mysql中有我所有的
数据
,我计划把它导出到
hadoop
,并运行我的
数据
<em
浏览 1
提问于2013-06-24
得票数 1
3
回答
我应该使用什么平台/工具/软件/语言进行文本
挖掘
?
、
、
、
、
我是文本
挖掘
领域的初学者。我需要执行文档相似性.I的工作,目的是比较两个文档,然后以数字的形式提供它们之间的相似性。我读过很多关于这方面的理论。(windows/
linux
) 2.什么工具(人们谈论weka / mahout /
hadoop
)-我不知道该用什么工具3.什么语言?有些问题可能听起来很荒谬,但我必须从头开始,我需要一些帮助。
浏览 1
提问于2012-01-05
得票数 0
回答已采纳
2
回答
一个易于安装的现成的实时推荐引擎。
、
我想存储大量的用户操作
数据
,比如喜欢、标签等(我有电子商务和文档管理的计划)。
数据
挖掘
库主要是面向学术的,适用于大型批处理操作,不适用于大型实时查询。
Hadoop
/Mahout已经做好了生产准备,支持实时更新和查询,但是有一个陡峭
浏览 3
提问于2011-12-14
得票数 0
回答已采纳
3
回答
用于MPI的
数据
挖掘
库
、
、
、
、
是否有任何
数据
挖掘
库,正在使用(或可以使用) MPI (消息传递接口)?我正在寻找类似于Apache Mahout的东西,但它可以很容易地集成在MPI环境中。我之所以想使用MPI,是因为它的配置(与
Hadoop
相比)很简单。或者,在
数据
挖掘
场景中使用MPI没有意义吗?
浏览 0
提问于2012-10-03
得票数 3
回答已采纳
1
回答
VM上的火花独立集群
、
、
、
我们正在考虑为我们的研发分析和
数据
挖掘
项目建立一个独立的星火集群(无需
Hadoop
)。为此,我们将保留一小部分个人电脑(4-8)。出于“政治”原因,这些机器都运行Windows。我的问题是,是否有可能在这些pc上设置一个Spark集群,其中每个节点运行在
Linux
VM上--也就是说,在单个pc上没有多个VM,而是每个节点/pc上都有自己的VM运行。请注意,在操作上,我对星火很陌生,我的背景是
数据
库。我读过关于使用Vagrant/Salt (也是新的)来提供VM的文章,但是在大多数例子
浏览 4
提问于2016-10-06
得票数 2
2
回答
Hadoop
生态系统-在我的场景中使用什么技术工具组合?(内部详情)
、
、
、
、
对于一些人来说,这可能是一个有趣的问题: see :存储在 Server(RDBMS)中的
数据
的 2-3兆字节,认为它类似于亚马逊的
数据
,即用户查看他们所看到/单击的东西以查看他们购买的东西。任务:制作了一个推荐引擎(比如亚马逊),它会显示给用户,如果你喜欢的话,购买它的客户也会购买->,然后你可能会喜欢这个-> (也)类型的
数据
挖掘
来预测未来的购买习惯(
数据
挖掘
)。问题:由于
数据
量巨大(用户习惯
数据
5-6年),我认为
H
浏览 0
提问于2012-05-09
得票数 2
回答已采纳
10
回答
Hadoop
初学者
、
我正在尝试使用
hadoop
来练习一些
数据
挖掘
算法。我可以单独使用HDFS来做这件事吗,或者我需要使用hive/hbase/pig这样的子项目吗?
浏览 0
提问于2010-07-19
得票数 7
回答已采纳
7
回答
Hadoop
Vs
数据
湖
、
、
我听说了
数据
湖这个新名词。我在谷歌上查到了
数据
湖是一个大规模的存储库和处理引擎.
数据
池提供“任何类型的
数据
的大量存储、巨大的处理能力和处理几乎无限并发任务或作业的能力”。术语
数据
湖通常与面向
Hadoop
的对象存储相关联。在这种情况下,组织的
数据
首先加载到
Hadoop
平台,然后将业务分析和
数据
挖掘
工具应用于其驻留在
Hadoop
的商品计算机集群节点上的
数据
。
Hadoop</
浏览 8
提问于2016-03-14
得票数 16
3
回答
Hadoop
1.x端口列表-4个更多未知端口
、
、
、
我配置并安装了
Hadoop
1.2.1单个节点。我配置了namenode和jobtracker地址,端口分别为"hdfs://localhost:9000“和"localhost:9001”。启动集群(start-all.sh).之后之后我运行了netstat -nltp,其中列出了
hadoop
端口。Any unused local port is chosen by
hadoop
itself) 但是,其他几个端口也被占用,这表明它是java进程(我停止了
hadoop
并确认这些端口只
浏览 6
提问于2015-11-24
得票数 5
回答已采纳
2
回答
hadoop
和spark有什么区别?
、
随着see在市场上的增长,我可以看到spark在
Hadoop
上的主要用例如下: 而且处理得很快。 火花会在未来几天取代
Hadoop
吗?当火花并行运行时,
Hadoop
同时工作?(这是真的吗?)
浏览 0
提问于2015-07-08
得票数 3
回答已采纳
1
回答
只是对双引导操作系统使用的一个澄清
我打算在我的系统上安装
hadoop
框架,我在安装
Hadoop
时遇到了麻烦。 32位和64位的混合版本是否会影响
hadoop
的安装?
浏览 0
提问于2014-02-25
得票数 2
1
回答
基于
Hadoop
的知识
挖掘
、
、
我想做一个项目,,
Hadoop
,和地图,减少,并把它作为我的毕业设计。对此,我做了一些思考,在互联网上搜索,并想出了在Facebook这样的社交网站上实现一些基本的知识
挖掘
算法的想法,或者在Facebook或可能stckoverflow、Quora等社交网站上使用,并绘制一些统计图表在哪里可以了解到易于使用java和映射约简技术实现的知识
挖掘
算法? 谢谢
浏览 3
提问于2011-01-09
得票数 1
2
回答
Java中的好
数据
挖掘
工具有参考吗?
、
、
项目本身包括
数据
挖掘
。比方说,我们必须工作的
数据
库结构是巨大的(千兆字节)。//查询查找带有重复
数据
的时间戳。此外,
数据
库中还有大约10个表。在发现多个因素的不一致值后,我们必须在下一阶段进行
数据
清理、噪声去除、
浏览 6
提问于2011-03-26
得票数 0
1
回答
Hadoop
是为解决需要对相同
数据
进行多次并行计算但参数不同的问题而设计的吗?
从我读到的少量内容中,我了解到
Hadoop
非常适合于解决以下类型的问题--通过将计算分布在多个潜在节点上来回答一个庞大的问题。
Hadoop
是否旨在解决涉及同一
数据
集上的多个计算,但每个计算都具有不同参数的问题?例如,基于相同的主
数据
集模拟不同的场景,但使用不同的参数(例如,在相同的
数据
集上测试
数据
挖掘
模型,但产生多次模拟迭代,每次迭代都具有不同的参数集并找到最佳模型)。例如,对于预测天气的模型,具有一组具有不同权重的规则,
Hadoop
是否支持运行相同的
浏览 2
提问于2012-09-20
得票数 3
回答已采纳
1
回答
Azure HDInsight的SparkRunner上的Apache光束管道
、
、
、
、
我首先尝试了基于Spark 2.3.0/
Hadoop
2.7 (HDI 3.6)的集群,然后又尝试了2.3.1/
Hadoop
3.0 (HDI 4.0 Preview)。", "org.apache.
hadoop
.fs.azure.Wasbs"); config.set("fs.azure", "org.apache.
hadoop
.fs.azure.NativeAzureFileSystem/3.0.2.0-50/<
浏览 6
提问于2018-12-10
得票数 1
1
回答
在
Hadoop
中实现采样和
数据
挖掘
算法
、
、
、
、
目前的实现涉及到对大输入事务文件的采样,最后将“FP增长算法”应用到这个采样
数据
中进行
数据
挖掘
。然而,它有其局限性,我想在更大的范围内加以实施。目标是在
Hadoop
中实现它,用于并行处理和支持大输入
数据
文件。在
Hadoop
或任何其他开源分布式处理框架中,我如何实现这一点呢?
浏览 5
提问于2012-06-25
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
基于Hadoop架构的可视化大数据挖掘建模平台
大数据之Hadoop
大数据框架Hadoop科普
数据挖掘
Linux恶意软件 可隐蔽挖掘加密货币
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券