腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
在Python
中
添加
平均值
、
中位数
和
标准差
值作为
新
数组
列
python
、
pandas
我尝试找出
平均值
、
中位数
和
标准差
,并将它们作为
新
列
添加到以下数组
中
的
每个索引值: import pandas as pdsalesDictsales.drop(['Samsung Galaxy S10', 'iPhone X', 'Google Pixel 4'], axis=1, inplace=True
浏览 63
提问于2021-02-25
得票数 0
回答已采纳
1
回答
如
何在
pyspark
中
创建
中位数
、
平均值
和
标准差
的
新
列
?
python
、
apache-spark
、
pyspark
、
statistics
我有一个
pyspark
数据帧,如下所示: +-----------+------------++-----------+------------19| 4|| 2017-12-20| 1| +-----------+------------+ 我想为
列
count
的
中位数
、
平均值
和
标准差
创建
新</
浏览 15
提问于2021-05-05
得票数 1
回答已采纳
1
回答
如何从大量数据中提取特定行集以查找统计操作。每一组在两边都加1?
python
、
python-3.x
、
pandas
、
statistics
我想从大型数据集(.mat)中找到一些统计操作,
如
平均值
、
中位数
、
标准差
和
方差。假设它包含1000*1。 在这里,我想找出每10行
的
平均值
和
中位数
等,并将其保存在
新
的
列
中
。同样,
中位数
、
标准差
等这些值保存在col1(均值)、col2(
中位数
)、col3(方差)
和
col4(
标准差</em
浏览 40
提问于2018-06-11
得票数 -1
回答已采纳
1
回答
绘制R
中
的
偏态正态分布
r
、
math
、
plot
如
何在
给定病例数、
平均值
、
标准差
、
中位数
和
的
情况下绘制R
中
的
偏态正态分布。对于这个问题,我能找到
的
最好
的
答案是来自,并推荐使用包。然而,我不
浏览 1
提问于2014-11-07
得票数 0
2
回答
在多个列上使用函数
r
、
function
、
measure
我
创建
了这个函数来计算
平均值
、
中位数
和
标准偏差: f1<- function(x) c(mean= round(mean(x),2), median= round(median(x),2), sd=round(sd(x),2)) 我想将它用于多个
列
(列名: domain 1,domain2,domain3,total) 我想知道如何使用函数,您能推荐一种比使用函数更好
的
方法来表示均值、
中位数
和
标准差
吗
浏览 46
提问于2021-03-28
得票数 0
回答已采纳
4
回答
如
何在
星火DataFrame中计算逐行中值
apache-spark
、
pyspark
、
apache-spark-sql
我有以下格式
的
星火数据帧。spark.createDataFrame([(1, 2, 3), (1, 4, 100), (20, 30, 50)],['a', 'b', 'c'])输入:我想添加一个
新
列
“
中位数
”作为'a','b','c‘
列
的
中位数
。如
何在
PySpark
中
做到
浏览 1
提问于2019-01-15
得票数 3
回答已采纳
2
回答
循环
和
创建
新
列
r
、
loops
、
mean
假设我
的
数据框架中有一些
列
,这些
列
来自一组类似的因素:我想要
的
是使用这些数据
创建
额外
的
列
所以: B1_Mean --这应该是以B1开头
的
列
浏览 1
提问于2018-03-26
得票数 0
2
回答
Pyspark
-使用dataframe
中
其他两个
列
的
RMSE
创建
新
列
python
、
pyspark
我对
Pyspark
还是个新手。我有一个数据框架,我想用col1
和
col2之间
的
均方根计算
创建
第三
列
。我使用了一个用户定义
的
lambda函数来计算均方根值,但是一直收到这个错误AttributeError: 'int' object has no attribute 'mean' from
pyspark
.sql.functionsimport udf,col from
pyspark
.sql.types impo
浏览 39
提问于2020-04-11
得票数 0
回答已采纳
2
回答
如何将大熊猫
的
均值
和
标准差
列
合并成一个单栏
python
、
python-3.x
、
pandas
、
dataframe
我有一个熊猫数据框架,一
列
数据帧是
平均值
,第二
列
数据帧是
标准差
。数据帧
的
每一行表示一个sample_Case,我们对其有一个均值
和
标准差
。我想要
创建
一个
新
的
列
,在该
列
中
,我可以以以下格式将
平均值
和
标准差
保存在一起:然后我想将它导出为csv文件。所以这个文件就像 Sam
浏览 16
提问于2022-04-20
得票数 0
3
回答
合并两个统计结果集
math
、
statistics
处理过程
中
的
数据可以是大量
的
结果,所以我不希望存储所有的数据来重新计算额外
的
数据。Statistics : { mean, median, standard deviation, runs on process} 我如何合并两者
的
中位数
和
标准差
,以获得两个描述统计集
的
组合摘要请记住,我不能同时保留统计数据所描述
的
两组
浏览 3
提问于2009-09-26
得票数 9
回答已采纳
1
回答
如果你没有数据,但你知道斜率
和
50%
的
点,如何构建CDF?
r
、
cdf
我有一个关于CDF函数
的
问题。在一项研究
中
,研究人员在他们
的
数据上拟合了正态分布
的
CDF,并给出了
中位数
(= -8.4 dB)
和
斜率(=18.7)。如何重新
创建
此函数(在R
中
),以便找出x轴上期望
的
百分比(y轴),例如9 dB?当我查看CDF
的
公式时,我不确定在哪里插入斜率
和
中位数
统计... 首先要感谢大家!
浏览 5
提问于2020-09-03
得票数 0
1
回答
异常检测阈值问题
machine-learning
、
python
、
time-series
、
unsupervised-learning
、
anomaly-detection
我正在研究Python
中
的
异常检测开发。 上限等于
平均值
+ (5 *
标准差
)。 如果错误超过阈值,则标记为异常。这种方法不起作用
的
是,如果我一天
浏览 0
提问于2019-10-28
得票数 2
回答已采纳
4
回答
计算一组数字
的
平均值
,同时忽略异常值
c++
、
math
我正在试图找出一种算法来计算一组数字
的
平均值
。然而,我需要忽略任何与大多数结果不太接近
的
数字。下面是我想要做
的
一个例子:{ 90, 91, 92, 95, 2, 3, 99, 92, 92, 91, 300, 91, 92, 99, 400 } 很明显,对于上面的集合,大多数数字位于90
和
99之间,但是我有一些像{ 300, 400, 2, 3 }这样
的
异常值。我需要计算这些数字
的
平均值
,同时忽略
浏览 2
提问于2011-06-01
得票数 7
回答已采纳
1
回答
Spark Scala -如何迭代dataframe
中
的
行,并将计算值添加为数据框
的
新
列
scala
、
apache-spark
、
apache-spark-sql
、
spark-dataframe
我有一个包含两
列
"date“
和
"value”
的
dataframe,如
何在
dataframe
中
添加两个
新
列
"value_mean“
和
"value_sd”,其中"value_mean“是过去10天(包括”date“中指定的当天)
的
平均值
,"value_sd”是过去10天内"value“
的
标准差
?
浏览 0
提问于2016-02-12
得票数 4
1
回答
Pycharm问题集(从步骤3开始)
python
、
pandas
、
pycharm
使用ff_monthly.csv数据集,使用第一
列
作为索引(,它以字符串形式包含数据
的
年份
和
月份。
创建
一个
新
列
“Mkt”为“Mkt-RF”+“RF” 在加载
的
DataFrame
中
创建
两个
新
的
列
(),即“月份”
和
“年份”,以包含从索引
列
提取
的
数据集
的
年份
和
月份。
创建
一个<e
浏览 5
提问于2022-10-23
得票数 -1
1
回答
在pandas dataframe python
中
创建
子
列
python
、
pandas
、
dataframe
我有一个包含多
列
的
数据帧 df = pd.DataFrame({"cylinders":[2,2,1,1],1 2 100 6200 3 1 70 1200 我想
创建
一个
新
的
数据帧,并用
中位数
和
平均值
<em
浏览 21
提问于2019-01-13
得票数 1
回答已采纳
1
回答
dplyr将
新
列
中
的
NAs替换为good值
的
函数
r
、
dplyr
、
na
最小
的
例子:一个小
的
数据帧,有6行两
列
的
问题回答
和
一
列
ID df <- data.frame(ID = c(rep("A", 3), rep("B", 2), "C"),
和
Q2
的
标准差
创建
一个
新
的
数据帧,然后写下 questions <- c("Q1", "Q2") df
浏览 17
提问于2021-04-26
得票数 1
回答已采纳
4
回答
如何计算给定
PySpark
DataFrame
的
均值
和
标准差
?
python
、
apache-spark
、
pyspark
、
apache-spark-sql
我有一种叫
PySpark
DataFrame (而非大熊猫)
的
名字叫df,它很大,可以使用collect()。因此,下面给出
的
代码是无效
的
。它处理
的
数据量较小,但现在却失败了。total.append(score)std = np.std(total) 是否有任何方法可以通过使用mean或类似的方法将std
和
pyspark
.sql.functionsfrom
pyspark
.sql.functions im
浏览 20
提问于2017-12-27
得票数 27
回答已采纳
1
回答
如何使用不同
的
技术在填充熊猫或蟒蛇
的
缺失值后添加“填充数据”
的
列
?
python-3.x
、
pandas
、
matplotlib
、
jupyter-notebook
、
seaborn
如
何在
填充熊猫或蟒蛇
的
缺失值后,使用不同或几种技术,
如
各种统计技术或机器学习技术,添加“填充数据”
列
。我想做
的
是,在用
平均值
、
中位数
或
标准差
值或其他机器学习算法(
如
KNN或XGBoost或其他一些技术)填充数据之后,我想在csv或excel文件
的
末尾添加或追加这些或那个
列
,但不低于实际数据,我指的是文件
的
右侧例如,我已经使用统计技术
和
其他ML技术填充了某一
浏览 2
提问于2019-09-26
得票数 0
1
回答
Pandas聚合修改索引
python
、
pandas
、
aggregate
我使用这个函数在我
的
数据框中计算'value‘
列
的
每个id
和
每个小时
的
平均值
、
中位数
和
方差: df = df.groupby(['PatientID', 'var']
浏览 20
提问于2019-09-08
得票数 0
点击加载更多
相关
资讯
一个Python大数据处理利器:PySpark入门指南
70个NumPy分级练习:用Python一举搞定机器学习矩阵运算
70个NumPy练习:在Python下一举搞定机器学习矩阵运算
数据信息汇总的7种基本技术总结
Python Pandas模块数据统计与分析常用方法
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券