腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
2
回答
特征
工程
我有一个大约37,000行和54列的数据框架。在这54个列中,有两个列,即“user_id”和“mail_id”,格式非常怪异,如下所示:AR+tMy3H/E+Re8Id20zUIz+amJkv6KU12o+BrgIDin0= DQ/4I+GIOz2ZoIiK0Lg0AkwnI35XotghgUK/MYc101I= 1P4AOvdzJzhDSHi7jJ3udWv4ajpKxOn4T/rCLv4PrXU= BL3z4RtiyfIDydaRYWX2
浏览 0
修改于2020-12-25
得票数 2
2
回答
盲
特征
工程
基于SVM的分类算法具有较好的分类精度(> 95%),但由于对列没有直觉,除了标准标度、零值替换等外,我无法在
特征
工程
或
特征
生成方面做更多的工作。或者只有当一个人拥有基于列名的直觉时,功能
工程
才真正有意义.
浏览 0
修改于2020-06-30
得票数 3
6
回答
自动
特征
工程
我遇到了一个机器学习软件,我不会命名它,它声称在没有领域知识的情况下,功能
工程
过程从任何来源完全自动化,这意味着数据科学家在这一步中几乎没有必要。现在,我发现这个说法有点可疑,因为它违背了我所学到的功能
工程
所包含的常识。 但考虑到这可能是缺乏知识,从我的部分到什么点,我们可以自动化的特色
工程
过程?
浏览 0
修改于2016-05-24
得票数 6
1
回答
PHP SVM -
特征
工程
我们有上学人数的数据。就像以前的教育水平一样。兴趣。性别。军人身份。附注,PHP SVM模块是否适合只做一些简单的建模?或者它不值得使用?
浏览 5
提问于2015-02-04
得票数 0
1
回答
LSTM
特征
工程
说明?
、
、
找了一下,这方面的材料比较稀缺,开题的时候这个问题
特征
选择没说服答辩老师
浏览 573
提问于2018-06-05
1
回答
需要
特征
工程
建议
我在功能
工程
中遇到了一个问题。想找点建议。问题陈述:我有多个客户3天的使用数据。有的只使用1天,大约2天和3天。数据与每天发送的电子邮件/联系人的数量有关,等等。
浏览 0
修改于2019-04-11
得票数 4
1
回答
数据预处理和
特征
工程
我一直在读一些关于数据预处理和
特征
工程
的文章,包括
特征
选择,
特征
重要性和
特征
构造。我的理解是在数据预处理阶段应用了
特征
工程
。此外,在应用机器学习模型时,有时会检查
特征
重要性,有时会在模式内部进行检查。 我的问题是:
特征
工程
是否总是在预处理阶段实现,或者有时可以在以后的阶段执行? 谢谢你Shosho
浏览 45
提问于2021-04-28
得票数 0
1
回答
特征
工程
与
特征
学习的区别
如果我有一个原始的时间序列数据,功能
工程
是否意味着提取我的原始数据的属性或
特征
并将其作为输入?或者,算法会从时间序列本身学习这些信息吗?
特征
工程
仅仅是对自变量的处理吗?还是提取依赖于其他原始数据的特性?
浏览 0
修改于2017-08-09
得票数 0
回答已采纳
2
回答
特定算法的
特征
工程
几天前,一家人工智能金融服务提供商给我们上了一课,并提到你应该根据具体的算法(你是using.For的例子)来进行具体的
特征
工程
。当使用物流回归时,将更多的
特征
(不相关)(如将连续变量结合成离散变量)拟合成离散的
特征
往往是suggested.Because物流回归的一个简单算法,我们试图以更好地分离样本的方式来提高维数。我搜索了很多(也许还没有),大多数材料是“为什么/什么特性
工程
重要”,“缩放/标准化/连续变量”,“处理空值”或一些没有离散操作的理论评论。
浏览 0
修改于2018-03-01
得票数 0
1
回答
分裂前的
特征
工程
这是一个对原来封闭的帖子(这里)的姐妹贴子。由于数据转换部分是在数据分割后完成的,我想知道这种转换是否与我们如何对数据进行子采样有依赖关系呢?当我们选择不同部分的训练数据时,我们可以得到不同的转换结果。此外,作为测试部分的数据也代表了真实世界的数据。难道我们不应该在分裂之前就对数据进行转换吗?我们能更多地了解“真实世界”中的数据是什么样子吗?我们不浪费数据吗?虽然我同意我们只对训练集进行转换,并在模型评估/训练阶段的预测过程中重新应用相同的训练集,但如果在实际部署过程中,我们对整个数据集进行转换,并
浏览 0
修改于2022-04-12
得票数 1
1
回答
R中的
特征
工程
我正在处理一个数据集,在那里我正在进行
特征
工程
dataset $ variable1 [dataset $ variable2 == "A"] = "B" 当我尝试将variable1转换为B时,无论
浏览 10
修改于2019-04-07
得票数 1
回答已采纳
1
回答
DateTime列的
特征
工程
我正在尝试训练一个模型来预测我屋顶的太阳能发电。这是我当前的数据集:https://pastebin.com/gtZcGi2m。它是利用一些气象api和实际产生的电力建造的。 我在ML.NET中使用了这个,让它自动找到最好的模型。问题是,如果太阳辐射是0,但是时间大约是下午2点,它仍然可以预测2000-3000年的产生。基本上,它的表现很差。我认为分裂datetime列可能是有意义的。时间是最重要的组成部分,但也对月/日有影响。我怎样才能为自己的价值观做好准备,才能得到更好的榜样?
浏览 0
提问于2022-07-03
得票数 0
1
回答
关于
特征
工程
的建议
我在功能
工程
过程中遇到了一个问题。寻求一些建议。问题陈述:我有多个客户3天的使用数据。有些只使用1天,有些使用2天,有些使用3天。数据与每天发送的电子邮件/添加的联系人数量等相关。但是问题出现在第3列和第4列,因为在这两种情况下,新的
特征
值都将是"0“。有没有人能建议一种方法来处理这个问题
浏览 5
提问于2019-04-11
得票数 2
1
回答
基于XGBoost的
特征
工程
有人能解释一下如何使用XGBoost完成功能
工程
吗? 举一个解释的例子会有很大帮助。
浏览 0
提问于2016-12-11
得票数 -2
回答已采纳
1
回答
范畴变量的
特征
工程
对于回归问题,我的数据集中有一些分类变量。2)年龄范围:(18-35岁,35-50岁等)我将其分解为age_min和age_max的两列。有什么更好的方法来使用这样的功能在范围内的值吗? 3)百分比范围:它只能取5个值(0,1,1-5,5-10,10)。我应该如何使用这个变量来训练我的模型?在这里,由于"1“和"10”的固定值,我不能将其分解为2列(如年
浏览 0
提问于2019-06-20
得票数 1
回答已采纳
1
回答
如何进行实时数据的
特征
工程
?
我用以下步骤建立了一个很好的线性回归模型: 我的问题是,如果我们在生产环境中使用这个模型,那么我们如何进行实时数据的
特征
工程
,因为这个模型是用
特征
归一化和缩放的来建立的,那么如何对实时数据进行规范化和缩放以得到一个很好的预测呢?对于交叉验证和测试步骤,我们不需要显式的
特征
工程
,因为在建立模型之前,这可以在数据预处理步骤中完成。实时数据<e
浏览 2
提问于2017-03-01
得票数 0
1
回答
布尔型的Tensorflow
特征
工程
我的数据集(CSV格式)包含布尔类型(0或1),当我在Tensorflow中定义我的特性时,我一直将float64定义为tf.contrib.layers.real_valued_column。使用real_valued_column对于布尔类型,我有什么选择? nationBestSeller
浏览 3
修改于2017-06-28
得票数 0
回答已采纳
2
回答
预处理、EDA和
特征
工程
EDA、
特征
工程
和预处理有什么区别? 主要目的是使原始数据适合于建模。在EDA中,我们正在清理数据,预处理也是如此。在有限元中,我们正在进行缩放和估算。
浏览 0
修改于2021-08-17
得票数 0
回答已采纳
1
回答
用于欺诈检测的
特征
工程
我想具体了解有关从事务性数据集中进行
特征
选择\生成的技术。更详细地说,给定交易的数据集(例如信用卡),选择在模型上使用哪些类型的功能,以及它们是如何设计的?
浏览 3
提问于2018-05-14
得票数 1
2
回答
基于输出的手工
特征
工程
我的预测将基于这些
特征
来预测签名的价值。 我已经根据看不见的数据做了预测。对预测结果与实际数据进行验证后,我的准确率为25%。而交叉验证给我65%的准确性。具有旧
特征
的第一个模型(部门的ID )提供了25%的准确率,而具有新特性的第二个模型class_department提供了71%的精度(同样是在未见数据上)。
浏览 0
修改于2019-03-20
得票数 3
回答已采纳
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券