我正在研究“Python for Data-Analysis”(Python for Data-Analysis)一书中的一些熊猫,我偶然发现了一段我无法理解的代码:
by_tz_os = cframe.groupby(['tz', op_system])
其中,cframe
是一个具有多列的数据from,而op_system
是一个从以下位置生成的数组:
op_system = np.where(cframe['a'].str.contains('Windows'), 'Windows', 'Not Windows')
意思是,对应于给定的cframe
数据帧的长度。
这个组是如何与另一个数组一起工作的,它只是将数组添加为一个列,然后按tz
和op_system
列分组吗?
发布于 2020-06-24 07:37:40
这里有一个2级分组:
第一个级别的分组是tz。第二个级别是上述每个组的“分割”为2部分,rows.
您可以认为op_system类似于cframe中的“附加列”(实际上它是Numpy (1-D)数组,但充当列)。
https://stackoverflow.com/questions/62557685
复制相似问题