腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
hadoop
数据
挖掘
库
、
、
我在
hadoop
中使用Mahout进行
数据
挖掘
算法。但是它在一些cases.Is中有bug,还有其他使用
hadoop
的
数据
挖掘
库吗?谢谢。
浏览 0
提问于2013-08-01
得票数 0
2
回答
使用Solr和
Hadoop
进行文本
挖掘
、
、
、
我有一个包含大约1亿个文档的Solr
数据
库。我想对这些文档进行文本
挖掘
。任何关于这种情况的想法都会对我有很大的帮助。
浏览 1
提问于2013-10-18
得票数 1
2
回答
在学习Mahout之前,我需要掌握
Hadoop
吗?
在学习Mahout之前,我需要掌握
Hadoop
吗?在不学习
Hadoop
的情况下(为了使用
数据
挖掘
功能),我可以走多远?
浏览 0
提问于2012-10-03
得票数 2
回答已采纳
2
回答
Oracle11g对MySQL和
Hadoop
:- 10^6至10^9记录的基准测试
、
、
、
、
会有大量的
数据
挖掘
查询,每天24小时都有实时
数据
.我想知道哪个
数据
库会更好,特别是在一些真实的统计
数据
方面。在未来几个月里,
数据
肯定会超出这一范围。提前谢谢。
Hadoop
不是DB。它是一个分布式文件系统。让我更详细地解释我的要求。这就是我现在拥有的,我在mysql中有我所有的
数据
,我计划把它导出到
hadoop
,并运行我的
数据
<em
浏览 1
提问于2013-06-24
得票数 1
3
回答
用于MPI的
数据
挖掘
库
、
、
、
、
是否有任何
数据
挖掘
库,正在使用(或可以使用) MPI (消息传递接口)?我正在寻找类似于Apache Mahout的东西,但它可以很容易地集成在MPI环境中。我之所以想使用MPI,是因为它的配置(与
Hadoop
相比)很简单。或者,在
数据
挖掘
场景中使用MPI没有意义吗?
浏览 0
提问于2012-10-03
得票数 3
回答已采纳
2
回答
Hadoop
生态系统-在我的场景中使用什么技术工具组合?(内部详情)
、
、
、
、
对于一些人来说,这可能是一个有趣的问题: see :存储在 Server(RDBMS)中的
数据
的 2-3兆字节,认为它类似于亚马逊的
数据
,即用户查看他们所看到/单击的东西以查看他们购买的东西。任务:制作了一个推荐引擎(比如亚马逊),它会显示给用户,如果你喜欢的话,购买它的客户也会购买->,然后你可能会喜欢这个-> (也)类型的
数据
挖掘
来预测未来的购买习惯(
数据
挖掘
)。问题:由于
数据
量巨大(用户习惯
数据
5-6年),我认为
H
浏览 0
提问于2012-05-09
得票数 2
回答已采纳
10
回答
Hadoop
初学者
、
我正在尝试使用
hadoop
来练习一些
数据
挖掘
算法。我可以单独使用HDFS来做这件事吗,或者我需要使用hive/hbase/pig这样的子项目吗?
浏览 0
提问于2010-07-19
得票数 7
回答已采纳
7
回答
Hadoop
Vs
数据
湖
、
、
我听说了
数据
湖这个新名词。我在谷歌上查到了
数据
湖是一个大规模的存储库和处理引擎.
数据
池提供“任何类型的
数据
的大量存储、巨大的处理能力和处理几乎无限并发任务或作业的能力”。术语
数据
湖通常与面向
Hadoop
的对象存储相关联。在这种情况下,组织的
数据
首先加载到
Hadoop
平台,然后将业务分析和
数据
挖掘
工具应用于其驻留在
Hadoop
的商品计算机集群节点上的
数据
。
Hadoop</
浏览 8
提问于2016-03-14
得票数 16
2
回答
hadoop
和spark有什么区别?
、
随着see在市场上的增长,我可以看到spark在
Hadoop
上的主要用例如下: 而且处理得很快。 火花会在未来几天取代
Hadoop
吗?当火花并行运行时,
Hadoop
同时工作?(这是真的吗?)
浏览 0
提问于2015-07-08
得票数 3
回答已采纳
1
回答
基于
Hadoop
的知识
挖掘
、
、
我想做一个项目,,
Hadoop
,和地图,减少,并把它作为我的毕业设计。对此,我做了一些思考,在互联网上搜索,并想出了在Facebook这样的社交网站上实现一些基本的知识
挖掘
算法的想法,或者在Facebook或可能stckoverflow、Quora等社交网站上使用,并绘制一些统计图表在哪里可以了解到易于使用java和映射约简技术实现的知识
挖掘
算法? 谢谢
浏览 3
提问于2011-01-09
得票数 1
2
回答
Java中的好
数据
挖掘
工具有参考吗?
、
、
项目本身包括
数据
挖掘
。比方说,我们必须工作的
数据
库结构是巨大的(千兆字节)。//查询查找带有重复
数据
的时间戳。此外,
数据
库中还有大约10个表。在发现多个因素的不一致值后,我们必须在下一阶段进行
数据
清理、噪声去除、
浏览 6
提问于2011-03-26
得票数 0
1
回答
Hadoop
是为解决需要对相同
数据
进行多次并行计算但参数不同的问题而设计的吗?
从我读到的少量内容中,我了解到
Hadoop
非常适合于解决以下类型的问题--通过将计算分布在多个潜在节点上来回答一个庞大的问题。
Hadoop
是否旨在解决涉及同一
数据
集上的多个计算,但每个计算都具有不同参数的问题?例如,基于相同的主
数据
集模拟不同的场景,但使用不同的参数(例如,在相同的
数据
集上测试
数据
挖掘
模型,但产生多次模拟迭代,每次迭代都具有不同的参数集并找到最佳模型)。例如,对于预测天气的模型,具有一组具有不同权重的规则,
Hadoop
是否支持运行相同的
浏览 2
提问于2012-09-20
得票数 3
回答已采纳
9
回答
数据
挖掘
引擎和框架?
、
、
、
、
你知道和使用哪些开源/免费的
数据
挖掘
引擎和框架来处理文本
数据
? 谢谢你的建议!
浏览 3
提问于2010-11-18
得票数 5
回答已采纳
1
回答
Azure HDInsight的SparkRunner上的Apache光束管道
、
、
、
、
我首先尝试了基于Spark 2.3.0/
Hadoop
2.7 (HDI 3.6)的集群,然后又尝试了2.3.1/
Hadoop
3.0 (HDI 4.0 Preview)。", "org.apache.
hadoop
.fs.azure.Wasbs"); config.set("fs.azure", "org.apache.
hadoop
.fs.azure.NativeAzureFileSystem/3.0.2.0-50/<
浏览 6
提问于2018-12-10
得票数 1
1
回答
在
Hadoop
中实现采样和
数据
挖掘
算法
、
、
、
、
目前的实现涉及到对大输入事务文件的采样,最后将“FP增长算法”应用到这个采样
数据
中进行
数据
挖掘
。然而,它有其局限性,我想在更大的范围内加以实施。目标是在
Hadoop
中实现它,用于并行处理和支持大输入
数据
文件。在
Hadoop
或任何其他开源分布式处理框架中,我如何实现这一点呢?
浏览 5
提问于2012-06-25
得票数 1
1
回答
在Scala的
数据
科学上有明显的赢家吗?
我在Scala中找到了一些用于
数据
科学的库和工具,我想知道哪个库和工具被采用得更快,以及在多大程度上是这样的。基本上,我应该赌哪一个(如果在这一点上有)。我发现的一些工具(不按特定顺序排列)如下:微风马鞍尖顶
Hadoop
如果我需要更具体地回答这个问题:我现在对集群和大
数据
并不特别感兴趣,但我感兴趣的是用于信息集成和预测分析的大量
数据
浏览 0
提问于2014-08-08
得票数 1
1
回答
用于从日志信息中收集自定义
数据
的正确ETL工具
、
、
我需要从不同种类的日志文件中收集和存储大量
数据
,但在此之前需要过滤某些字段,以便只提取必要的信息。因此,我在考虑使用ETL工具为我提供服务的可能性。我的想法是构建一个基于文件连接器的解决方案,编程或定制转换过程,最后将该解决方案部署在linux机器上,以便能够实时查看文件,提取所需信息并将其存储在
数据
库中,例如。谢谢!
浏览 0
提问于2010-11-11
得票数 0
回答已采纳
1
回答
使用HIVE进行Twitter
数据
分析
、
我是Hive和
Hadoop
的新手,我想创建一个非常简单的演示来分析示例twitts,如下所示: T 2009-06-08 21:49:37 U W我认为
数据
挖掘
太棒了!我不喜欢
数据
挖掘
...一般来说,这样做是可能的吗?但我不知道确切地说,我应该从哪一点strat.Do,你知道任何简单和明确的参考来做这项工作?或者你能告诉我(不是详细的)我该怎么做吗?
浏览 1
提问于2012-06-05
得票数 0
回答已采纳
2
回答
Hadoop
/ Hive升级性能
、
、
我们正在测试Hive和
Hadoop
来
挖掘
我们的
数据
,我安装了一段时间前
Hadoop
1.2.1和Hive0.11(是稳定的版本) 测试服务器是4核和16 of的ram。现在,我想知道切换到Hive0.12和
Hadoop
2.2是否值得在查询性能方面升级服务器?
浏览 7
提问于2014-01-31
得票数 0
回答已采纳
2
回答
基于
数据
挖掘
的MapReduce项目
、
、
、
我计划做一个MapReduce项目,其中包括
Hadoop
库,并在AWS上传的大
数据
上进行测试。我还没有最后确定一个想法。但我确信它将涉及到某种
数据
处理、MapReduce设计模式以及可能的图算法、Hive和PigLatin。如果有人能给我一些想法,我会非常感激的。我的脑子里很少有。最后,我必须研究一些大型
数据
集,得到一些信息并得出一些结论。为此,我以前使用过Weka进行
数据
挖掘
(使用树)。 但我不确定这是否是我现在唯一可以使用的东西(使用Weka)。我还有其他方法可以处理大
数据<
浏览 4
提问于2012-11-13
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
基于Hadoop架构的可视化大数据挖掘建模平台
大数据之Hadoop
大数据框架Hadoop科普
数据挖掘
尚学堂,你了解数据挖掘吗?什么是数据挖掘?数据挖掘有什么魅力
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券