腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
视频
沙龙
1
回答
用SSAS数据挖掘获得测试和训练集的评分结果
、
、
我们有一个相当大的表,我们正在用SSAS数据挖掘对其进行预测。 我们正在努力获得得分的测试&以有效的方式培训验证的案例。是否有一种不调用(预测联接)算法的方法()? 例如,如果输入数据集有以下列: (顾客,国家,年龄,性别,BuyAmount)我想要. (顾客、国家、年龄、性别、BuyAmount、BuyAmountPredicted、概率) 这必须是可能的,因为这是在模型处理期间完成的,而且ir可能用于生成验证图表,例如SystemGetClassificationMatrix。 如果我们谈论的是数十亿行,这将是一个很大的性能改进。 避免重复计算(预测联接将对每一行执行模型)
浏览 3
提问于2016-05-24
得票数 1
2
回答
在使用NoSQL时,设计模式有一个很好的资源吗?
、
这是否一个合理的问题呢?我知道大多数NoSQL数据库都有不同的本体,这使得它们更适合您的设计堆栈的某些部分。 我知道有四大类型的NoSQL: Graph-oriented 键值列Document 目前,我很难理解用例和它们之间的比较优势。
浏览 8
提问于2011-07-13
得票数 3
回答已采纳
1
回答
映射大型数据库
、
我的任务是映射一个相当大的数据库模式(大约250个表)。我可以让Visio反向工程数据库,但是有太多的表让它映射整个数据库。我知道Server有映射的能力,但是它能映射整个东西吗?还有其他软件可以处理更大的数据库吗?
浏览 0
提问于2017-01-13
得票数 -1
1
回答
是否有一种方法可以手动设置事务在块中的位置?
、
、
、
、
我在BSC上看到了一些关于比特币的动作(类似于灵巧工具,但对于bsc,它显示买卖)。只要这枚硬币有大买卖,就会有(套利)??)bot在这一大交易之后将其交易准确地定位于一个位置(例如,一个正常人在该区块的索引43处卖出了大量,这个bot的索引将位于同一区块的44个,总是在大卖出之后的一个位置,并从中获利)。 我想知道的是,这个bot (使用最低限度的气体)是如何在一次大的卖出之后始终准确地定位他们的交易的?我知道这不是一个更高的情况,因为机器人使用的是正常的汽油费。我也曾在ethereum上看到过这样的机器人,它们的事务总是直接发生在uniswap上的大交易之前/之后(例如)。 谢谢。
浏览 0
提问于2021-07-22
得票数 1
1
回答
百合花ASIC耐吗?
、
、
我听说Ethereum挖掘是抗ASIC的,因为它需要内存硬散列算法。然而,为什么矿工不能购买大的DRAM,并将内存专用于ASIC挖掘?是什么阻止矿工制造一个与大DRAM配套的专用集成电路? 提前谢谢。
浏览 0
提问于2017-05-29
得票数 21
回答已采纳
2
回答
Weka替代-使用非常大的数据集进行可视化数据探索
、
我喜欢Weka的视觉数据探测功能(它能快速给您提供一英里高的空中视图来查看所有变量的分布)。 我有一个0.5gb的数据集,而Weka无法加载它(在64位Windows PC上有16 on的RAM)。 对于Weka的粉丝们来说,对于非常大的数据集,最接近的“视觉数据探索”选择是什么? (FWIW -当Weka在加载一个非常大的数据集时失败时,我做了所有建议的事情,例如增加Java堆大小等。) 更新:我尝试了RapidMiner Basic (它是开放源码的,免费的),这起作用了。
浏览 0
提问于2016-04-13
得票数 1
1
回答
在2021年,eth代理仍然是一件事吗?
、
、
我在https://ethermine.org上使用我的几个GPU进行了挖掘,在研究如何提高挖掘效率的同时,我在GitHub (https://github.com/Atrides/eth-proxy)上发现了一个民族代理项目,该项目的哈希率增加了20%。请有人解释一下民族代理是什么/做什么,如果它仍然是一件事情,因为项目自2016年以来就被放弃了。它的功能是否被Stratum V2所取代?据我所知,在池中挖掘时,我的GPU彼此独立地挖掘,而代理允许它们在一大块计算中协同工作?不好意思,我还在学习诀窍,显然对采矿有基本的了解。
浏览 0
提问于2021-03-31
得票数 0
1
回答
大-小的价值呢?
、
、
因此,当n(输入大小)足够大时,大O将告诉您一些关于最坏情况下的性能的信息,如 。但是,n不是那么大的部分呢?难道我们不关心这个吗?
浏览 0
提问于2018-04-10
得票数 2
1
回答
在交易中大赚一笔却什么也不回?
、
当我们在交易选项中放置一个较低的现值时,我们得到了“现在太低”,但是当一个放置大的值(大于事务数)时,我们得到了什么原因?
浏览 0
提问于2019-10-14
得票数 0
4
回答
掌握可视化/分析大型数据集的基本技能
、
、
、
我正在寻找一种学习适应大型数据集的方法。我是一名大学生,所以我做的每一件事都是“不错”的规模和复杂性。本学期我和一位教授一起做了一个研究项目,我不得不可视化一个有点大(根据我的经验)的数据集之间的关系。这是一个15 MB的CSV文件。 我的大部分数据处理都是用Python语言编写的,使用GNUPlot进行可视化。 有没有任何关于这个主题的可访问的书籍或网站?使用Python的加分,比依赖gnuplot的更“基本”的可视化系统更多的加分。我想是开罗之类的地方吧。 从数据挖掘,到处理,再到可视化,我正在寻找一些东西。 编辑:我更多的是在寻找一些能教会我“大创意”的东西。我可以自己写代码,但是寻找人
浏览 2
提问于2011-05-05
得票数 11
回答已采纳
2
回答
加载大型表时Select2崩溃
、
、
、
、
我目前正在尝试加载一个大的表(8800行/ 2.5 MiB),但是它崩溃了。在Chrome F12中,我得到一个错误: POST http://localhost/web/app_dev.php/_entity_find 500 (Internal Server Error) main.js:3 k.cors.a.crossDomain.send main.js:3 n.extend.ajax main.js:3 (anonymous function) (main.js是包含select2的已编译JS ) 我有其他的'select2自动补全‘字段在同一页上搜索较小的表,它们工作得很好
浏览 0
提问于2014-07-15
得票数 0
1
回答
字段名“名称”无效。字段必须只包含字母、数字和下划线,以字母或下划线开头,最多为128个字符。
、
、
我试图将Firebase实时数据库的备份从导入到BigQuery中,并获得以下错误: 字段名“名称”无效。字段必须只包含字母、数字和下划线,以字母或下划线开头,最长为128个字符。表:表 我尝试了一个第二个数据集,它返回以下错误 字段名"-Kq4_0dsRwKfOGGxGoQv“无效。字段必须只包含字母、数字和下划线,以字母或下划线开头,最长为128个字符。表:表 这是第二个数据集 {"users":{"someUserID_abc":{"tests":{"-Kq4_0dsRwKfOGGxGoQv":
浏览 0
提问于2019-07-04
得票数 2
1
回答
MariaDB/MySQL临时表会占用整个磁盘空间
、
我们有一个大小约为4 4GB的数据库和一个过于复杂的视图(使用GROUP_BY、GROUP_CONCAT等),目前无法更改。 有时,当我们查询该视图时,MariaDB 10会在磁盘上创建临时文件(在/tmp中)。文件大小超过40 it这似乎是无穷无尽的。我理解为什么创建这些文件,但我不能理解为什么这些文件比我们拥有的所有数据都大。 有没有可能是递归连接导致的呢?为什么它不是每次都会发生,而只是偶尔发生?(缓存大小、缓冲区?) 有没有办法通过配置来防止这种情况?这种表可以增长到多大?
浏览 12
提问于2017-01-19
得票数 0
2
回答
Weka属性选择输出
、
、
我想在Weka中执行属性选择,但我的数据集相当大,并且程序运行了相当长的时间。这就是为什么我想看到当前找到的最佳属性集的原因。我该怎么做呢?例如,基因搜索有“报告频率”参数,但所有结果都是在整个搜索完成后显示的,这不是我所需要的。 没有进度条,所以我甚至不知道我要等多久……
浏览 2
提问于2013-07-25
得票数 0
2
回答
在推特上表演SVD。记忆问题
、
、
编辑:我的单词列表的大小比我写的大10-20倍。我只是忘了一个零。 EDIT2:我将查看SVDLIBC,并了解如何将矩阵缩减到其密集版本,这样也会有所帮助。 我已经生成了一个巨大的csv文件,作为我的pos标记和词干的输出。看起来是这样的: word1, word2, word3, ..., word 150.000 person1 1 2 0 1 person2 0 0 1 0 ... person650 它包含每个人的单词计数。就这样,我得到了每个人的特征向量。 我想在这头野兽上运行
浏览 3
提问于2010-05-12
得票数 2
1
回答
游标不包含存在的列。
、
、
我有一个数据库和我正在修改的android应用程序(Open ),它跟踪一组.xml文档的状态和其他相关信息,这些文档以表单的形式表示。 为了方便ListView向用户显示有关这些表单的信息,我使用游标保存从查询到数据库的信息(是的,我知道不再推荐managedquery ): String selection = InstanceColumns.RANDOM_ID + " = ? AND " + InstanceColumns.STATUS + " = ? AND " + InstanceColumns.JR_FORM_ID + "
浏览 6
提问于2017-03-17
得票数 1
回答已采纳
1
回答
我的测试网络值多少钱?
、
、
我开始在testnet上进行挖掘,我的主要帐户(Etherbase)正在迅速获得乙醚。它开始于20分钟前,已经有了将近300个以太和计数,我认为这是一大笔钱。 就因为我上了测试网就假的吗?不是真的乙醚,而是一些不值钱的东西吗?
浏览 0
提问于2017-09-06
得票数 0
1
回答
无法将sf对象转换为sp对象,因为存在未使用的参数错误(SRS_string = from$wkt)
、
、
、
、
我目前正在处理R中的点的sf数据集,我想将该数据集转换为SpatialPointsDataFrame,以便进行一些下游分析。这看起来很简单,所以我使用了as_Spatial()函数,但它抛出了一个我以前从未见过的错误: Error in sp::CRS(SRS_string = from$wkt) : unused argument (SRS_string = from$wkt) 我尝试转换的对象对于我添加到问题中来说有点大,但基本对象信息如下: Simple feature collection with 1357 features and 10 fields geometry type:
浏览 24
提问于2020-10-06
得票数 1
回答已采纳
1
回答
用于公众评论的情绪分析API
请帮助为公众评论和挖掘相同的情绪分析API。如何最好地使用文本分析来处理如此大的评论?
浏览 8
提问于2020-08-18
得票数 0
2
回答
扩展算法所需的概念和工具
、
、
、
、
我想开始思考如何扩展我为数据分析编写的算法,以便它们可以应用于任意大的数据集。我想知道实现这一点的相关概念(线程、并发、不可变数据结构、递归)和工具(Hadoop/MapReduce、Terracota和Eucalyptus)是什么,以及这些概念和工具是如何相互关联的。我对R、Python和bash脚本以及C和Fortran编程有基本的了解,尽管我也熟悉一些基本的函数式编程概念。我是否需要改变我的编程方式,使用不同的语言(Clojure、Haskell等),或者只是(或者不是那么简单!)采用像R/Hadoop (HRIPE)这样的东西...或者为Python编写包装器以启用多线程或Hadoop
浏览 2
提问于2010-03-10
得票数 5
回答已采纳
1
回答
如何在python中将大的CSV文件导入Sqlite3?
、
、
我有一个非常大的CSV文件,需要加载到sqlite3中的表中。我不能将整个CSV内容作为一个变量加载到RAM中,因为数据太大了,为每个列定义类型的事件不能容纳64 GB的RAM。 我试着用numpy和熊猫来加载和转换数据,但仍然超出了RAM的限制。 我想以某种方式一次读CSV 1行(或小批),并将它们逐步保存到数据库中,以保持较低的RAM使用率。如果它可以使用多个CPU核来完成,那将是完美的。
浏览 1
提问于2017-12-05
得票数 3
回答已采纳
1
回答
什么是地雷?交易还是阻止?
、
、
、
直到今天,我还以为交易只是聚集在一起,直到大到足以建造一个街区。一旦它被建造,ethereum将竞相寻找一个秘密的nonce,并且这个块将在主网络上可用。 但是今天,当我读安德烈亚斯和加文的“掌握以太”一书时,我想到了下面的一句话。“再过几秒钟,新的交易将被Ropsten矿商开采”。 现在的问题是,什么是地雷?是每个交易,还是每一个区块? 一旦我将乙醚发送到帐户x,该事务是否会转到未经验证的块?这个过程到底是如何工作的?那聪明的合同呢?在出现在区块链上之前,是否也需要进行验证?
浏览 0
提问于2020-11-02
得票数 1
回答已采纳
2
回答
一个电子钱包能使用多少互联网带宽?
我有有限的互联网(每月250 GB ),我与多个人分享,所以我必须确保我没有消耗太多。我下载了Ethereum钱包客户端,似乎需要很长时间才能同步。Ethereum会占用我相当大的网络带宽吗?
浏览 0
提问于2016-05-20
得票数 6
2
回答
文档标记
、
、
、
我有非常大的solr索引。我想用更好地代表文档的术语来标记所有文档,比如。这种类型的聚类结果也属于文档标记吗? 像carrot2这样的索引时文档标记和查询时文档标记,哪种方法更好?
浏览 0
提问于2012-11-19
得票数 0
回答已采纳
2
回答
块菌错误:遇到错误,保龄球。网络状态未知。手动审核成功的交易
、
、
、
、
每次我尝试部署truffle migrate --reset我的Organization.sol合约时,我都会得到以下错误 Error encountered, bailing. Network state unknown. Review successful transactions manually. 我在谷歌上搜索了这个错误,很明显这是由于合同大小的原因。我的Organization.sol甚至没有那么大;我以前见过更大的合同。 这是我的合同: 有什么线索吗?
浏览 1
提问于2017-11-01
得票数 6
5
回答
数据挖掘书籍
、
、
我对数据挖掘很有热情,我读过一些像编程集体智能这样的书,我想知道更多的好书,特别是实用的,关于数据挖掘和人工智能的。任何提示都将不胜感激。谢谢。
浏览 0
提问于2011-08-23
得票数 5
回答已采纳
1
回答
为什么在4.0.1.12097版本中从WebServerClient:RequestUserAuthorization中删除状态参数
、
我已经使用DotNetOpenAuth v3.5.0.10357大约一年了,并最终决定升级到4.0.1.12097。在这样做时,我注意到RequestUserAuthorization方法不再接受状态参数。 //v3.5.0.10357 WebServerClient:RequestUserAuthorization(IEnumerable<string> scope = null, string state = null, Uri returnTo = null); //v4.0.1.12097 WebServerClient:RequestUserAuthorization(
浏览 2
提问于2012-06-30
得票数 0
回答已采纳
1
回答
在Mahout中序列化RandomAccessSparseVector
、
、
、
我正在将数据加载到Mahout0.7中的RandomAccessSparseVector中,但我不知道如何序列化它。如果我使用的是VectorWritable,我就可以这样使用SequenceFile.Writer了: writer = new SequenceFile.Writer( fs, conf, new Path("filename"), LongWritable.class, VectorWritable.class); 不幸的是,没有RandomAccessSparseVectorWritable。 一种选择是完全忘记稀疏向量,将数据加载到Vect
浏览 2
提问于2012-07-01
得票数 2
1
回答
防止Visual中的Web要点返回基础列验证错误
、
、
、
使用Visual 2013和Web基本要素2013进行更新2。 我从VS错误列表中的基金会验证中获得了许多错误,这是相当恼人的。 在使用“列”时,还必须指定类“小-#”、“中-#”或“大-#”。 在使用“列”时,还必须在父元素上指定类"row“。 由于我没有使用基金会网格系统,我想知道是否有一种方法可以防止Web基本元素返回这些基础验证错误?
浏览 0
提问于2014-08-04
得票数 24
回答已采纳
1
回答
SQL Server 2022中的数据挖掘软件
、
、
我的任务是为Adventure演示数据库创建一些数据挖掘模型。我应该在SQL Server中使用SSDT和Visual,但是最新版本的SSDT (2022)已经完全删除了数据挖掘。 为什么他们一开始就停止了对这个特性的支持? 我现在该用什么工具来代替它呢?我需要一个可以与SSDT项目集成的工具,但是文档并没有给出其他的选择,我很困惑。
浏览 0
提问于2023-03-06
得票数 1
1
回答
先验vs关联挖掘
、
这不是一个代码问题,而更多的是一个“我需要考虑这个”的问题。 据我所知,Apriori挖掘算法属于关联挖掘的范畴,这意味着它使用基于数据中的关系的规则来提取信息。 当我对它们进行研究时,它们看起来都惊人地相似,那么有什么区别呢?它们是不同的东西吗?如果是这样,是什么让Apriori独一无二的?
浏览 1
提问于2015-11-30
得票数 0
7
回答
开源数据挖掘软件
、
、
我想知道,我可以用来生成非二进制关联规则的最好的开源软件是什么。我需要一个非二进制实现,因为将我当前的非二进制数据转换成二进制数据不会得到想要的结果。 谢谢,迫不及待地想在这里看到你的评论!
浏览 3
提问于2009-07-28
得票数 1
回答已采纳
1
回答
MongoDB:涉及集合查找的批量操作?
、
、
我的项目是使用MongoDB和NodeJS (与猫鼬一起)。 我有一个名为places的大型且不断增长的集合,其中每个place都有一个包含其lat/lon坐标的GeoJSON属性;另一个是静态的zones集合,每个集合都包含一个指定zone轮廓的GeoJSON多边形。我需要向每个新的matching_zones添加一个属性place,它列出了与其位置相交的zone文档。 我目前正在通过执行以下自动化任务来完成这一任务: 从places检索流中还没有zones属性的所有文档(我使用的是StreamWorker NodeJS模块,它允许我调整并发级别)。对于每个文档,在zones集合中查找zon
浏览 2
提问于2020-03-18
得票数 0
1
回答
actionscript 3安全类导入
、
、
、
所以在得到一个(我的第一个)正常工作的服务器之后,(还没有什么大的或令人印象深刻的,没有客户端的情况下是不是无用的?)并用一个拼装的C++客户端对其进行测试,下一步是建立与其长期伙伴的连接(完成后,仍然是在制品)。 服务器端在C++中,客户端在AS3中,长话短说,我找不到什么是重要的。*我需要安全调用来从服务器获取策略文件。我在FlashDevelop工作,仅供参考。 我需要这个函数: Security.loadPolicyFile(); 任何帮助都是非常感谢的! 干杯;-Tyler
浏览 2
提问于2012-07-02
得票数 1
1
回答
过程挖掘算法
、
、
、
如果我有windows使用数据表,如 StartTime _ EndTime _窗口_ 这记录了windows使用的历史--我们如何挖掘这些数据以获得一些重复的模式,例如wnd2 1->wnd2 2->wnd2 3(记录集一致运行,不同模式的记录集可能有所不同。)? 有什么算法能更好地解决这个问题呢?Excel、Python和Delphi有什么实现吗?
浏览 9
提问于2021-12-12
得票数 0
1
回答
c#中易趣的大型商户服务
我在试着把文件发到eBays手机上。 我已经下载了一大堆的例子,但它们都缺少一些东西。要么他们没有所有的参考资料,要么他们不告诉我要包含哪些包。 大多数情况下,它们需要一种叫做JobID的东西,而我当然没有,因为这是这个过程的第一步。 所以我想知道是否有人见过或知道在哪里可以找到包含所有比特的C#样本。
浏览 0
提问于2011-04-20
得票数 1
1
回答
优化Python MySQL/连接器速度
、
、
、
我有一个MySQL格式的表,其中包含以下列: id int(11) contract_id int(11) datetime datetime open decimal(18, 10) high decimal(18, 10) low decimal(18, 10) close decimal(18, 10) 该表相当大(> 3亿行),但是在数据库中进行的查询即使返回300,000行,也会在半秒内执行。然而,当我从Python中检索数据时,速度非常慢(同样的请求从MySQL工作台的0.5秒到Python的34秒): import pandas as pd import mysql.con
浏览 1
提问于2015-10-17
得票数 5
1
回答
将一个文本文件聚为python中的组和主题
、
、
、
、
我在文本挖掘方面是新手,我有一个非常大的文本文件,其中每一行都代表对一个项目(一个句子)的评论。 我想找到审查中存在的小组和议题。那么,我的问题是,我的数据的特征、组和主题是什么?每个词的出现频率能作为特征吗?我们是否必须把每一行(评审)都当作文档本身来考虑,然后我们就必须对评论进行聚类?我也在想,是否应该事先知道组或主题的数目,因为在任何无监督的算法中,簇的数目都应该是已知的参数。 我的第二个问题是如何编辑这个以找到组,以及如何编辑以使用我的reviews.txt文件查找主题。
浏览 2
提问于2014-04-25
得票数 1
回答已采纳
3
回答
"sys/mman.h:没有这样的文件或目录“
、
我正在使用Code::Block 8.02,我有一个问题..每次我尝试编译minimad.c (Libmad附带的示例)时,都会收到一条错误消息: sys/mman.h: No such file or directory,当然还有一大堆错误:( 我已经知道它是内存管理库...问题是:我可以在哪里下载<sys/mman.h>?或者如果有另一个编译器支持比Code::Blocks8.02更多的库? 另外,我已经把mad.h链接到编译器上了,并且测试结果很好,所以我知道那里没有问题……
浏览 293
提问于2009-11-28
得票数 9
1
回答
电子传播延迟
、
、
我有一个非常初级的问题。假设我有一个包含不同机器的IP地址的列表,并且我想通过take块链来共享它们,并且假设随着时间的推移,这个列表非常大,那么与其他节点共享并添加到块中需要多长时间?它是否需要14秒钟,而不考虑列表大小或什么?如果有任何参考资料,那就太好了。请帮帮忙。
浏览 0
提问于2018-10-12
得票数 1
回答已采纳
2
回答
统计分析与数据挖掘
、
为什么A/B检验、相关性和回归被认为是统计分析的方法,而“关联规则”则属于数据挖掘领域? 统计分析与数据挖掘的不同之处
浏览 0
提问于2019-01-18
得票数 1
1
回答
我应该避免使用相同的数据dir的CLI geth和Ethereum Wallet吗?
、
、
我已经在OSX上把作为我的钱包使用了一段时间,这很好。它使用的是/Users/myname/Library/Ethereum,因为它是数据dir。 我刚刚通过自制安装了geth,目的是尝试一些CPU挖掘(在真正的网络上,而不是在testnet上)。 它似乎也在使用/Users/myname/Library/Ethereum作为其数据dir,但仍然需要在第一次使用时下载区块链。 我正计划使用一个新的帐户我的,而不是我的进入我的主要以太帐户。 更新:似乎geth找到了和相同的帐户,如果它是相同的数据dir,这是有意义的.所以,如果我为采矿做一个新的解释,那应该是可行的--我想。 我会杀了我的钱包吗
浏览 0
提问于2016-04-12
得票数 5
回答已采纳
4
回答
什么是Java数据挖掘,JDM?
、
、
我在看JDM。这仅仅是一个与其他执行实际数据挖掘的工具进行交互的API吗?或者这是一组包含实际数据挖掘算法的包?
浏览 2
提问于2009-07-21
得票数 11
回答已采纳
1
回答
在Oracle 12c上创建用户(可插拔)
、
、
我需要在可插拔的Oracle数据库上使用Oracle进行数据挖掘。用户是用c#前缀创建的。如果我想要通过SQL Developer安装数据挖掘存储库,安装时会出现一个名为"ODMRSYS“且没有前缀的用户,并给出一个错误。对解决这个问题有什么建议吗?
浏览 1
提问于2017-07-31
得票数 0
2
回答
用于频繁模式的Python、web日志数据挖掘
、
我需要开发一个工具,用于web日志数据挖掘。 在一个特定的用户会话中(从web应用程序日志中检索),有许多urls序列,我需要找出网站用户的使用模式和组(集群)。 我是数据挖掘的新手,现在对Google进行了大量的研究。发现了一些有用的信息,比如查询似乎指向了几乎完全相同的研究。 所以我的问题是: 是否有任何基于python的工具可以满足我的需要,或者至少有类似的功能? 有什么帮助吗? 读这本书有什么帮助吗? 谷歌要做什么,读什么,哪个比较简单的算法用得最好? 我的时间非常有限(大约一周),所以任何帮助都是非常宝贵的。我需要的是指出正确的方向和如何在最短的时间内完成任务
浏览 2
提问于2010-05-27
得票数 4
回答已采纳
2
回答
xgboost (或任何其他算法)会对一些不好的特性产生不好的结果吗?
、
、
、
到目前为止,我的印象是机器学习算法(gbm,随机森林,xgboost等)可以处理数据中存在的不良特征(变量)。 在我的一个问题中,大约有150个特征,如果我使用所有的特征,使用xgboost我会得到大约1的对数损失。但是如果我删除大约10个不好的特性(使用一些技术发现),我观察到.45的对数损失。这是一个巨大的进步。 我的问题是,糟糕的特性真的能造成如此大的差异吗?
浏览 2
提问于2016-02-27
得票数 2
9
回答
数据挖掘引擎和框架?
、
、
、
、
你知道和使用哪些开源/免费的数据挖掘引擎和框架来处理文本数据? 谢谢你的建议!
浏览 3
提问于2010-11-18
得票数 5
回答已采纳
1
回答
如何获取和终止进程Mac终端
、
查找具有名称和内存的特定客户端获取客户端pIdKill pId 我能在终点站内杀死那个过程吗。 我试过的 ps aux | grep leagueClientUxHelper | awk '{print $2}' 但我无法得到大的记忆过程。 处于激活状态的相同进程名称:
浏览 1
提问于2020-04-20
得票数 0
1
回答
AS3工作者和大型数据文件不可能吗?
、
、
因此,我从服务加载了大量数据。我刚刚用Flex 4.9 SDK和AIR 3.4将我们的项目更新到了最新的4.7FB。已实现的工作进程。它们似乎对一次性任务很有效,但在互联网数据加载方面除外。我还没有找到神奇的限制,但似乎如果你加载一个互联网请求(Loader,URLLoader,HttpService...无论如何),正在接收一个大的重放,工人只是锁定并退出。主线程在所有情况下都可以很好地做到这一点(但UI在加载完成之前不会响应)。这就是为什么我对工作人员如此兴奋的原因是将有时很大的数据负载卸载到后台工作人员。 有没有其他人遇到过这种情况?我在网上看到了Worker类文档上的评论,其他一些人也
浏览 0
提问于2013-01-23
得票数 4
1
回答
以太如何处理网络分裂?或者说是海底电缆被切断的一次大停电,使1/3或更多节点离线。
以太如何处理网络分裂?或者说,海底电缆被切断的一次大停电使1/3或更多的节点离线。 发送的事务是否继续由现有的完整节点/矿工处理,还是网络工作会停止?
浏览 0
提问于2018-07-31
得票数 0
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
数据挖掘十大算法
10大数据挖掘算法及其简介
大数据:数据挖掘十大经典算法概述
数据挖掘的十大经典算法-Smartbi
数据挖掘
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券