首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >列表的标准差

列表的标准差
EN

Stack Overflow用户
提问于 2013-03-13 23:38:21
回答 8查看 378.4K关注 0票数 128

我想找出第一,第二,…的均值和标准差。多个(Z)列表的位数。例如,我有

代码语言:javascript
复制
A_rank=[0.8,0.4,1.2,3.7,2.6,5.8]
B_rank=[0.1,2.8,3.7,2.6,5,3.4]
C_Rank=[1.2,3.4,0.5,0.1,2.5,6.1]
# etc (up to Z_rank )...

现在我想取*_Rank[0]的平均值和标准差,*_Rank[1]的平均值和标准差,等等。

(即:所有(A…Z)_rank列表中第一位数字的平均值和标准差;

所有(A..Z)_rank列表中第二位数字的平均值和标准差;

第三个数字的平均值和标准差...;等等)。

EN

回答 8

Stack Overflow用户

发布于 2014-02-02 08:27:11

因为Python3.4/ PEP450在标准库中有一个statistics module,它有一个用于计算像您这样的迭代器的标准偏差的method stdev

代码语言:javascript
复制
>>> A_rank = [0.8, 0.4, 1.2, 3.7, 2.6, 5.8]
>>> import statistics
>>> statistics.stdev(A_rank)
2.0634114147853952
票数 180
EN

Stack Overflow用户

发布于 2013-03-13 23:42:17

我会将A_Rank等人放入一个2D NumPy数组中,然后使用numpy.mean()numpy.std()计算平均值和标准差:

代码语言:javascript
复制
In [17]: import numpy

In [18]: arr = numpy.array([A_rank, B_rank, C_rank])

In [20]: numpy.mean(arr, axis=0)
Out[20]: 
array([ 0.7       ,  2.2       ,  1.8       ,  2.13333333,  3.36666667,
        5.1       ])

In [21]: numpy.std(arr, axis=0)
Out[21]: 
array([ 0.45460606,  1.29614814,  1.37355985,  1.50628314,  1.15566239,
        1.2083046 ])
票数 113
EN

Stack Overflow用户

发布于 2015-01-04 02:48:25

下面是一些纯Python代码,可以用来计算平均值和标准差。

下面的所有代码都基于Python 3.4+中的statistics模块。

代码语言:javascript
复制
def mean(data):
    """Return the sample arithmetic mean of data."""
    n = len(data)
    if n < 1:
        raise ValueError('mean requires at least one data point')
    return sum(data)/n # in Python 2 use sum(data)/float(n)

def _ss(data):
    """Return sum of square deviations of sequence data."""
    c = mean(data)
    ss = sum((x-c)**2 for x in data)
    return ss

def stddev(data, ddof=0):
    """Calculates the population standard deviation
    by default; specify ddof=1 to compute the sample
    standard deviation."""
    n = len(data)
    if n < 2:
        raise ValueError('variance requires at least two data points')
    ss = _ss(data)
    pvar = ss/(n-ddof)
    return pvar**0.5

注意:为了提高浮点数求和的准确性,statistics模块使用了一个自定义函数_sum,而不是我用来代替它的内置sum

现在我们有了这样的例子:

代码语言:javascript
复制
>>> mean([1, 2, 3])
2.0
>>> stddev([1, 2, 3]) # population standard deviation
0.816496580927726
>>> stddev([1, 2, 3], ddof=1) # sample standard deviation
0.1
票数 54
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/15389768

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档