文章字数1239,干货满满~
1.目标
在我们上一篇教程中,我们研究了Python图表。今天,我们将学习Python描述性统计。在这个Python统计学教程中,我们将讨论什么是数据分析,Python中的中心趋势:均值,中位数和模式。此外,我们将讨论Python Dispersion和Python Pandas Descriptive Statistics。除此之外,我们将介绍Python中的方差以及如何计算一组值的可变性。
那么,让我们开始Python Descriptive Statistics Tutorial。
Python描述性统计 - 衡量中心趋势和可变性
2.数据分析
通过数据分析,我们使用两种主要的统计方法 -描述性和推理性。
描述性统计使用样本的均值和标准差等工具来汇总数据。
另一方面,推论统计可以查看可随机变化的数据,然后从中得出结论。
一些这样的变化包括观察误差和采样变化。
3. Python描述性统计
Python描述性统计过程描述了研究中数据的基本特征。它提供有关样本和度量的摘要,不会使用数据来了解它所代表的人口。
在描述性统计下,下降两组属性 -集中趋势和分散趋势。Python包括均值,中位数和模式。Python Dispersion是一种实践术语,表示分布成员与中心彼此之间的距离。方差/标准差是衡量变异性的一种方法。
4. Python描述性统计 - 中心趋势
我们已经看到了集中趋势或中心位置。现在让我们来看看Python为我们提供的所有函数来计算分布的集中趋势。为此,让我们导入Python统计模块。
Python描述性统计 - 中心趋势
a. mean()
此函数返回其操作的数据的算术平均值。如果在空容器上调用数据,则会引发StatisticsError。
4.5
Fraction(97, 84)
2
b. mode()
此函数返回一组数据中众数。让我们对中心的位置有了一个很好的了解。
7
‘B’
c. median()
此函数返回中位数
5.5
d. harmonic_mean()
此函数返回数据的调和平均值又称倒数平均数 。对于三个值a,b和c,调和平均值是 -
3 /(1 / a + 1 / b + 1 / c)
它是衡量中心的标准; 一个这样的例子就是速度。
e. median_low()
当数据具有偶数长度时,这为我们提供了较低的数据中值。否则,它返回中间值。
2
2
f. median_high()
与median_low类似,当数据为偶数长度时,返回高中位数。否则,它返回中间值。
2
3
G。median_grouped()
此函数使用插值返回分组连续数据的中值。这是50 个百分位数。
3
3.25
3.5
5. Python描述性统计 - 分散
Python描述性统计 - 分散
a. variance()
返回样本的方差
b. pvariance()
返回数据的总体方差。用它来计算整个总体的方差。
6.69
c. stdev()
这将返回样本的标准偏差。这等于样本方差的平方根。
d. pstdev()
这将返回总体标准差。
所述统计模块定义一个exception-
exception statistics.StatisticsError
这是ValueError的子类。
6.使用pandas的Python描述性统计
我们也可以用pandas做同样的事情 -
0 4.9
dtype:float64
0 7
0 2.726414
dtype:float64
0 -0.115956#分布是对称的
dtype:float64
小于-1的值向左倾斜; 大于1的人向右倾斜。介于-1和1之间的值是对称的。
这就是Python Descriptive Statistics Tutorial。
7.结论
我们研究了Python Descriptive Statistics,其中我们学习了Python Statistics Module中使用的Central Tendency&Dispersion。另外,我们使用了统计数据和pandas模块,在下面留言。
我是极客
崇尚科学、自由与创新,追求极客装备、热爱数据技术、算法思路、产品研发 “如果你对世界充满好奇心和探索精神,并愿意自己去创造哪怕一些改变——这其实就够了”
更多干货文章,更多新鲜事物,等你来发现,马上关注公众号!
领取专属 10元无门槛券
私享最新 技术干货