在pandas中,可以使用groupby
和sum
函数来创建一个新列,该列的值基于另一列上的分组求和。
首先,我们需要导入pandas库:
import pandas as pd
然后,我们可以创建一个包含数据的DataFrame对象。假设我们有一个名为data
的DataFrame,其中包含两列column1
和column2
:
data = pd.DataFrame({'column1': [1, 2, 3, 4, 5],
'column2': [10, 20, 30, 40, 50]})
接下来,我们可以使用groupby
函数按照column1
列进行分组,并使用sum
函数对column2
列进行求和。将结果赋值给一个新列new_column
:
data['new_column'] = data.groupby('column1')['column2'].transform('sum')
这样,我们就创建了一个新列new_column
,其值基于column1
列上的分组求和。
关于pandas DataFrame的更多信息,你可以参考腾讯云的产品介绍链接:腾讯云·Pandas DataFrame
领取专属 10元无门槛券
手把手带您无忧上云