在pandas中,可以使用pd.cut()
函数对列进行分类,并通过df['新列名']
的方式添加新列。
具体步骤如下:
import pandas as pd
df
。pd.cut()
函数对需要分类的列进行分类,并将结果赋值给新的列名。例如,假设要对名为column_name
的列进行分类,可以使用以下代码:pd.cut()
函数对需要分类的列进行分类,并将结果赋值给新的列名。例如,假设要对名为column_name
的列进行分类,可以使用以下代码:bins
是分类的边界值,可以是一个列表或整数;labels
是对应分类的标签,可以是一个列表或整数。df
中将会新增一个名为新列名
的列,其中每个元素表示对应行的分类结果。以下是一个示例代码:
import pandas as pd
# 创建一个DataFrame对象
df = pd.DataFrame({'column_name': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]})
# 对列进行分类并添加新列
df['category'] = pd.cut(df['column_name'], bins=[0, 5, 10], labels=['low', 'high'])
# 打印结果
print(df)
输出结果如下:
column_name category
0 1 low
1 2 low
2 3 low
3 4 low
4 5 low
5 6 high
6 7 high
7 8 high
8 9 high
9 10 high
在这个示例中,我们将column_name
列的值分为两个分类:低(0-5)和高(6-10),并将分类结果存储在名为category
的新列中。
腾讯云相关产品和产品介绍链接地址:
领取专属 10元无门槛券
手把手带您无忧上云