首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >如何计算数据框每行特定值的平均值?

如何计算数据框每行特定值的平均值?
EN

Stack Overflow用户
提问于 2020-05-08 04:52:34
回答 2查看 158关注 0票数 0

我有一个大小为19000x31的数据帧。我正在尝试计算每一行的平均值。每行中的值范围从0到255。但是,我只想为每一行计算0到100之间的值的平均值,也就是说,平均值的计算不应考虑大于100的值。我用过DataFrame.Replace和DataFrame。我的意思是这样做。但是不能得到我需要的东西。有没有什么函数可以直接用来做这件事,或者有没有可能用NaN替换这些值并计算平均值。当我尝试替换时,我没有得到正确的替换。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2020-05-08 07:12:18

由于您标记了numpy:

代码语言:javascript
运行
AI代码解释
复制
import numpy as np

# convert from dataframe to numpy array
a = df.to_numpy()

# create mask of "interest"
mask = np.logical_and(a>=0, a<=100)

# Compute row mean
(a*mask).sum(axis=1)/mask.sum(axis=1)

让我们来比较numpy和pandas的表现:

代码语言:javascript
运行
AI代码解释
复制
import pandas as pd
import numpy as np

# create fake dataframe
df = pd.DataFrame(np.random.randint(0, 255, (19000, 31)))

def np_masked_row_mean(df, lower, upper):

    # convert from dataframe to numpy array
    a = df.to_numpy()

    # create mask of "interest"
    mask = np.logical_and(a>=lower, a<=upper)

    # Compute row mean
    return (a*mask).sum(axis=1)/mask.sum(axis=1)

%timeit df[(df >= 0) & (df < 100)].mean(axis=1)
131 ms ± 38.2 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)

%timeit np_masked_row_mean(df, 0, 100)
8.06 ms ± 385 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

这使得numpy实现速度提高了15-16倍。

票数 0
EN

Stack Overflow用户

发布于 2020-05-08 06:12:41

代码语言:javascript
运行
AI代码解释
复制
df[(df >= 0) & (df < 100)].mean(axis=1)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/61672275

复制
相关文章
displaytag如何实现获取到每行的id字段的值。
  使用封装好的框架,有时候,对于一个知识点不熟悉,可能会浪费你大把的时间,我使用displaytag主要是使用它的分页技术,但是客户提出的需求,是获取到每行的id,然后选择一个用户名称(用户id),将他们关联操作,其实业务很简单,但是获取到你想要的这一行,一开始确实难为着我了,后来才发现,很简单。
别先生
2019/06/03
4.8K0
如何根据特定值找到IDOC
IDOC的官方名称叫Intermediate Document,用于两个模块,或者两个系统间交换信息。
用户5495712
2020/10/22
1.8K0
如何根据特定值找到IDOC
你的每行代码值多少钱?
我知道,“line of code”(LoC)是一种非常愚蠢的计量方式。不要急着喷我,请大家先听我讲讲我最近参与的两个项目,看一下一些非常有意思的数字。
哲洛不闹
2018/09/18
1.6K0
你的每行代码值多少钱?
01:查找特定的值
01:查找特定的值 查看 提交 统计 1 #include<iostream> 2 using namespace std; 3 int a[10001]; 4 int main() 5 { 6 int n; 7 int ans; 8 cin>>n; 9 for(int i=1;i<=n;i++) 10 { 11 cin>>a[i]; 12 } 13 cin>>ans; 14 for(int j=1;j<
attack
2018/04/03
1.8K0
python提升篇(十四)--- 数据之最值 平均值
矢量(vector)是一种既有大小又有方向的量,又称为向量。一般来说,在物理学中称作矢量,例如速度、加速度、力等等就是这样的量。舍弃实际含义,就抽象为数学中的概念──向量。 [1] 在计算机中,矢量图可以无限放大永不变形。
用户5410712
2022/06/01
4580
python提升篇(十四)--- 数据之最值 平均值
如何使特定的数据高亮显示?
当表格里数据比较多时,很多时候我们为了便于观察数据,会特意把符合某些特征的数据行高亮显示出来。这不,公司的HR小姐姐就有这个需求,说她手头上有一份招聘数据,她想把“薪水”超过20000的行突出显示出来,应该怎么操作呢?
猴子聊数据分析
2020/02/26
5.7K0
python 平均值/MAX/MIN值 计算从入门到精通「建议收藏」
1、最大值、最小值 max:获取一个数组中最大元素 min:获取一个数组中最小元素
全栈程序员站长
2022/09/08
1.9K0
多年多年数据如何计算BLUE值
一年多点或者多年多点的植物数据中,一个基因型(品种)往往有多个表型数据,但只有一个基因型,在GWAS关联分析中,就需要一个基因型对应一个表型数据。
邓飞
2019/12/05
2.7K0
练习4—寻求特定值
题目 编写程序,从键盘上输入N个学生的考试成绩存入一维数组中,求该数组中成绩的最高分、最低分及平均分并输出到屏幕。 解题步骤 (1)定义常量N值; (2)建立用于存放数据的一维数组; (3)接收用户输入; (4)查询 / 计算特定值; (5)输出结果; Java import java.util.Scanner; public class Demo { public static void main(String[] args) { Scanner input = ne
攻城狮杰森
2022/06/03
3700
学徒讨论-在数据框里面使用每列的平均值替换NA
他认为替换不干净,应该是循环有问题。希望我们帮忙检查,我通常是懒得看其他人写的代码,所以让群里的小伙伴们有空的都尝试写一下。
生信技能树
2019/12/24
3.6K0
Spark如何读取Hbase特定查询的数据
最近工作需要使用到Spark操作Hbase,上篇文章已经写了如何使用Spark读写Hbase全量表的数据做处理,但这次有所不同,这次的需求是Scan特定的Hbase的数据然后转换成RDD做后续处理,简单的使用Google查询了一下,发现实现方式还是比较简单的,用的还是Hbase的TableInputFormat相关的API。 基础软件版本如下: 直接上代码如下: 上面的少量代码,已经完整实现了使用spark查询hbase特定的数据,然后统计出数量最后输出,当然上面只是一个简单的例子,重要的是能把hbase数
我是攻城师
2018/05/14
2.8K0
SAP HANA取表中每行最小值
正文部分 比如有一个表结构+数据如下: ​ ID | COL_1 | COL_2 | COL_3 ---|-------|-------|------ 1 | 5 | 3 | 2 2 | 7 | 9 | 8 3 | 5 | 4 | 6 ​ 想要得到每一行最小的数据值 即得到如下结果: ​ ID | MIN ---|------- 1 | 2 2 | 7 3 | 4 ​ 很多人可能第一个想法就
matinal
2020/11/27
9320
015— 删除每行中的最大值【LeetCode2500】
吃猫的鱼Code
2023/08/09
2180
015— 删除每行中的最大值【LeetCode2500】
mysql学习—查询数据库中特定的值对应的表
遇到一个问题,我将问题抽象简单描述如下: 循环查询数据库所有表,查出字段中包含tes值的表,并且将test修改为hello? 因为自己不才找了很久也没有找到很好的方法,又对mysql的游标等用法不是很了解,在时间有限的情况下,发现了下面的方法,分享给大家: 1:查找 (1)使用工具 我使用的mysql的Navicat for MySQL的工具
全栈程序员站长
2022/07/19
7.6K0
mysql学习—查询数据库中特定的值对应的表
python计算平均值的代码(python3求平均值)
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/128850.html原文链接:https://javaforall.cn
全栈程序员站长
2022/07/31
4K0
【猫狗数据集】计算数据集的平均值和方差
链接:https://pan.baidu.com/s/1l1AnBgkAAEhh0vI5_loWKw 提取码:2xq4
西西嘛呦
2020/08/26
1.8K0
【猫狗数据集】计算数据集的平均值和方差
js中如何判断数组中包含某个特定的值_js数组是否包含某个值
array.includes(searchElement[, fromIndex])
全栈程序员站长
2022/09/27
18.7K0
GDAL计算平均值的图(tif)
假如你手上有100000张v26h8的ndvi,modis数据,这时候你想知道他们平均的结果。。。改使用如下代码。。。。废话不多说:
一个有趣的灵魂W
2020/09/15
2K0
GDAL计算平均值的图(tif)
读取文档数据的各列的每行中
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/117322.html原文链接:https://javaforall.cn
全栈程序员站长
2022/07/06
2K0
jQuery判断input框的值
$("#date").change(function (e) { var time = $(this).val().match('满员'); if (time) { $(this).val('') } }); 这里用.match查询“满员”,凡是带这个字的都不用传给后台
明知山
2020/09/03
2.8K0

相似问题

如何计算每行提供的ID的特定值?

44

每行只计算三个值的平均值

33

计算特定值的平均值

31

python数组:计算每行的平均值

10

使用apache计算每行的平均值

12
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文