腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
通过
r
中
另一个
变量
的
类别
计算
平均值
、
我有一个这样
的
数据集
的
例子:item.id <- c(1,1,2, 1,1,1sequence用于尝试更改响应,score是项目的分数,category是每个学生所属
的
类别
。我想要做
的
是获取每个id每个item.id
的
最大序列号,然后
计算
每个category
的
最大序列值
的
平均得分。我能够完成第一步
浏览 10
提问于2019-10-23
得票数 0
回答已采纳
3
回答
用似然估计编码分类
变量
我正试图理解如何使用似然估计来编码分类
变量
,但到目前为止还没有取得什么成功。 如有任何建议,将不胜感激。
浏览 0
提问于2016-04-04
得票数 27
1
回答
如何在测试集中应用均值编码?
、
、
、
如果我有一个数据集,则
通过
使用目标
变量
'B‘
计算
每个
类别
的
平均值
,将均值编码应用于训练数据集
的
分类特征'A’,但是测试数据如何?测试数据不包含任何目标
变量
。是否应使用培训数据
中
的
计算
值?
浏览 5
提问于2020-05-12
得票数 0
1
回答
比较词云查询
、
我在
R
中
的
wordcloud包中使用了comparison.cloud函数。'good‘一词在Cat1 (27次)和Cat2(33次)两个
类别
中都出现了,但在wordcloud
中
,由于某些原因,它只出现在Cat1下(可能因为它是第一列)。你能建议如何调整它以获得所有单词(即使它在多个
类别
中
是相同
的
单词)。这对我
的
数据集来说是一个重要
的
发现,当它从Cat2
中
删除最重要
的
单词
浏览 4
提问于2015-06-18
得票数 1
1
回答
创建子集数组
一个
变量
基于个人来自(位置)
的
位置,大约有10个不同
的
类别
。
另一个
是满足感,满分为1比10。 然而,所有
类别
都包含“农村”一词或“城市”一词。我想做
的
是比较所有在位置
变量
中
包含“农村”这个词
的
所有案例
的
总体
平均值
,以及在位置
变量
中
包含“城市”这个词
的
所有案例
的
总体
平均值
。我使用了一种方法,即在
浏览 5
提问于2015-04-29
得票数 1
回答已采纳
1
回答
使用测试集
的
非目标值来为火车组设计新功能是正确
的
吗?
、
、
、
假设我有一个具有feature_1值和目标值
的
数据集。现在,我想
通过
从每个值
中
减去
平均值
来创建相对值来设计一个新
的
特性。如果(1)是正确
的
,我可以
通过
计算
所有数据集
的
feature_1
平均值
来对测试集和训练集使用相同
的
平均值
。我不确定这是否合法,因为这里我们使用
的
信息来自火车组
的
测试集。另一方面,我们不使用目标值,所以它可能是可以
的</e
浏览 0
提问于2018-10-30
得票数 0
回答已采纳
1
回答
如何根据Python
中
的
另一个
表填充Nan值?
、
我有一张桌子,上面有很多“评级”
中
的
南值:A 3.4B4.0A 3.5C4.0...然后
计算
Python
中
每个
类别
的
平均值
,并创建
另一个
表:A 4.3C 3.2 如何根据“
类别
”将此
平均值
填充到第一个表
中
?
浏览 4
提问于2020-07-20
得票数 4
3
回答
排序数据帧
这是我
的
数据: Q=c(13,12,12,14,19,15,12,11), T=c(15,12,12,14,12,11,19,15)) 我想
计算
每个
类别
中
浏览 2
提问于2015-04-21
得票数 1
2
回答
如何使用目标编码:扩展测试集上
的
平均值
、
、
、
、
expanding mean是一种在执行target encoding时防止过度匹配
的
方法。但我不明白
的
是,如何使用这种技术对火车组进行拟合,并对测试集进行转换以对我
的
特征进行编码,因为这种编码技术动态地对特征进行编码;给定特征级
的
编码值随输入后
的
输入而变化,因为它取决于累加和。
浏览 1
提问于2020-02-17
得票数 2
回答已采纳
1
回答
对于
另一个
分类
变量
的
每个值,我应该如何在熊猫
中
执行滚动均值?
下面的for循环运行得非常慢,但是它有我想要做
的
事情
的
要点。对于
变量
“
类别
”
的
每个值,我想要
计算
当前行之前所有行(不包括当前行)
的
列'y_all_reg‘
的
移动
平均值
。在下面复制
的
代码
中
,
计算
值被命名为“编码”。 我应该如何在潘达斯
的
矢量化操作
中
做到这一点?df['encoded'] = 0 # df is alre
浏览 1
提问于2019-11-04
得票数 0
回答已采纳
2
回答
如何使用javascript对数组
中
的
嵌套对象数组执行操作?
、
、
我试图
计算
嵌套数组对象字段
的
平均值
,该字段位于
另一个
数组
中
。下面是我定义
的
数组:[{"category":"behavioural", "rating":3}, {"category":"technical", "rating""rating":2.5}], [{"category":"
浏览 6
提问于2022-02-04
得票数 -1
3
回答
使用条件删除
R
中
组
类别
中
的
观测值
当我研究
R
时,我有了一个新
的
问题。你能告诉我,我有商品
类别
吗?每个
类别
的商品都有price.Is,可以将字符串写在
R
中
,这样,如果观察值超过该商品
类别
中
该组
的
平均值
超过500000,则该obs。会从分析
中
删除。也就是说,我需要从所有商品
类别
(分组
变量
)
中
删除观测值,这些观测值超过该组
平均值
的
500000。
浏览 2
提问于2017-04-17
得票数 2
1
回答
在使用group by和summarize后,如何获取tibble
的
标题?
、
、
我必须
计算
按月分组
的
两个
变量
的
平均值
,但当我看到
R
markdown
中
的
输出时,顶部没有标题或标题,因此无法
通过
查看tibble来判断它向我显示
的
是哪个
变量
的
平均值
!有没有什么包/函数可以用来为我
的
tibble创建标题头? 谢谢
浏览 7
提问于2019-04-28
得票数 1
1
回答
knn,不能用灵活
的
类型执行约简。
、
、
如果我使用ordinalEncoder并对模型进行预测,它是可行
的
,但问题是,当我想得到确切
的
类别
时,我得到
的
结果有时不是一个整数(例如6.3333)。因此,每当我用原始
的
分类值string来拟合模型时,我就会看到这样
的
错误消息:TypeError:无法使用灵活类型
的
来执行。当我检查错误消息时,我假设发生错误
的
原因是238次尝试获取y_pred = np.mean(_yneigh_ind,axis=1),而此时应该是中间值,因为y是字符串
的</
浏览 5
提问于2022-04-25
得票数 0
回答已采纳
1
回答
python
中
的
Kmeans聚类--将原始标记赋予预测
的
簇
、
、
、
、
我在目标
变量
中有一个带有7个标签
的
数据集。init="k-means++", random_state=300)np.unique(km.labels_)在对多个聚类为7
的
聚类算法进行KMean聚类后,得到
的
聚类被标记为0,1,2,3,4,5,5,6。但是如何知道哪一个真正
的
标记与预测
的
标签匹配。 换句话说,我想知道如何给新
的
预测标签赋予原始标签名称,这样就可以像正确地聚类多
浏览 0
提问于2022-04-27
得票数 2
3
回答
用滤波数据
计算
分类
平均值
我有以下数据集:A 10D -1A 4C 6A -1 4,6B 8 5,0A我
计算
了每个分类字母
变量
的
平均值
,但忽略了负数,并将其作为新列值。在SQL
中
,这应该是
通过
过滤组funcion和join来完成
的
。在excel
浏览 3
提问于2017-06-09
得票数 3
2
回答
计算
Nympy 2D -数组
的
平均值
(),在单独
的
列表
中
按值分组,其中字符串对应于2D数组
中
的
每一行。
、
、
我正在参加Python (Numpy,Pandas等)
的
数据分析课程。列表--值对应于数组中行
的
类别
,我们被要求
计算
按A和B分组
的
每一列
的
平均值
,我想这可以
通过
将数据转换为Pandas数据来完成--但是赋值属于Numpy,所以我想我们应该在没有Pandas<em
浏览 6
提问于2021-01-29
得票数 0
回答已采纳
1
回答
如何绘制一个列子集与
另一个
列子集
的
平均值
?
首先我要说
的
是,我是一个完全
的
R
新手,并且被要求做一些我无法理解
的
计算
,所以如果这不是问这个问题
的
正确方式,请提前原谅我!!我有一个
R
数据框,它有两列:一列是年龄(18-80),另一列是因
变量
,有三种可能
的
结果(0,1,2)。我想画一张图,x=年龄,y=年龄
的
因
变量
的
平均值
。我知道如何绘制一个简单
的
图表,也知道如何按年龄逐个
计算
浏览 15
提问于2021-03-06
得票数 0
1
回答
函数返回在
另一个
变量
中
具有最大值
的
类别
。
📷mean(filter(data, grepl('Chow', diet))$Ileibacterium)mean(filter(data, grepl('HSD', diet))$Ileibacterium) 然后从读取输出<em
浏览 0
提问于2022-05-25
得票数 2
1
回答
目标编码
中
均值相同
的
类别
、
、
、
在进行目标编码时,可能会发生两类具有相同目标均值
的
情况。此外,这可能对模型有害,在特性中选择这种分割可能会产生一些不一致
的
情况。
浏览 0
提问于2020-04-05
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
R中的向量化计算
Hypercubes项目——通过AR中的实体空间编程学习计算思维
Python机器学习随笔之K-Means聚类的实现
一文教你如何计算变量之间的相关性
《社会研究方法》 第八讲 定量分析——相关分析、回归分析
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券